№ 7 (2020)

Опубликован: 2021-02-25

Весь выпуск

РАЗДЕЛ I. ПРИНЦИПЫ ПОСТРОЕНИЯ И АРХИТЕКТУРА СУПЕРКОМПЬЮТЕРОВ

  • ПЕРСПЕКТИВНЫЕ ВЫСОКОПРОИЗВОДИТЕЛЬНЫЕ РЕКОНФИГУРИРУЕМЫЕ ВЫЧИСЛИТЕЛИ С ИММЕРСИОННЫМ ОХЛАЖДЕНИЕМ

    И.И. Левин, А. М. Федоров, Ю. И. Доронченко, М. К. Раскладкин
    Аннотация

    Рассматриваются перспективны создания высокопроизводительных реконфигурируемых
    вычислительных устройств на основе современных ПЛИС фирмы Xilinx семейства UltraScale+.
    Целью работы является достижение в одном изделии с конструктивом 3U 19’ вычислительной
    плотности до 128 ПЛИС высокой степени интеграции при обеспечении соответствующих
    электропитания и охлаждения вычислительных элементов системы для решения вычислитель-
    но трудоемких задач. Обеспечение требуемых характеристик изделия в заданном конструкти-
    ве потребовало усложнения топологии печатных плат и технологии изготовления его состав-
    ных частей. Для охлаждения компонентов вычислительной системы используется иммерсион-
    ная (погружная) технология. Особенностью разрабатываемых вычислительных систем явля-
    ется широкие возможности информационного обмена внутри блока и между блоками для ре-
    шения сильносвязанных задач, в которых количество пересылок данных между функциональ-
    ными устройствами больше, чем количество таких устройств. В качестве основных связей
    между ПЛИС используются дифференциальные линии с подключенными к ним мульти-
    гигабитными трансиверами (MGT). Разработанная на основе оптических каналов система
    информационного обмена между блоками обеспечивает пропускную способность более
    2 Тбит/с. Разработан и изготовлен опытный образец вычислительного модуля на основе ПЛИС
    UltraScale+. На его основе изготовлен прототип реконфигурируемого вычислительного блока.
    Вычислительный блок содержит в своем составе универсальный процессор и необходимые ин-
    терфейсы ввода-вывода, являясь функционально законченным устройством. На вычислитель-
    ном модуле нового поколения был реализован ряд алгоритмов различных научно-технических
    задач, что подтвердило возможность широкого применения вычислителей. Разработана мо-
    дернизированная иммерсионная подсистема охлаждения, которая обеспечивает отвод выде-
    ляемой суммарной тепловой мощности до 20 кВт. Для достижения такого уровня теплоотво-
    да реализованы технические решения по всем компонентам системы охлаждения: хладагенту,
    радиаторам, насосу, теплообменнику. Объединение множества блоков в единый вычислитель-
    ный контур позволит создавать вычислительные комплексы с производительностью до не-
    скольких десятков петафлопс. Такие комплексы требуют наличия соответствующей инже-
    нерной инфраструктуры.

  • КОММУТАЦИОННАЯ МОДЕЛЬ ПАРАЛЛЕЛЬНЫХ СРАВНЕНИЙ ЭЛЕМЕНТОВ ДЛЯ ПРОДУКЦИОННЫХ СИСТЕМ, УПРАВЛЯЕМЫХ ПОТОКОМ ДАННЫХ

    E.A. Титенко, E.В. Талдыкин
    Аннотация

    В статье достигается цель - сокращение временных затрат на генерацию сочетаний
    элементов множества. Элементы множества формируются из образцов (левых частей) про-
    дукционных правил. Основная задача заключается в построении эффективных по времени схем
    (алгоритмов) параллельной генерации сочетаний элементов массива. Применительно к продук-
    ционным системам такие схемы необходимы для активации подмножества продукций, приме-
    нимых к символьным данным на текущем шаге. За основу взят и развит известный алгоритм
    параллельного пузырька. Схема коммутации «параллельный пузырек» состоит из двух чере-
    дующихся вариантов коммутации элементов в пары. Эти коммутации основаны на локальном
    объединении в пары элементов массива, имеющих смежные индексы. Такое локальное объеди-
    нение элементов в пары приводит к «малым» перемещениям элементов по длине массива и ре-
    гулярному характеру генерации пар. В каждой паре выполняется операция сравнения-обмена
    операндов. Для продукционных систем операция сравнения сводится к поиску пересечений об-
    разцов и формированию списка конфликтных слов. Сокращение времени генерации сочетаний
    основывается на построении вариантов коммутации с распределенным объединением элемен-
    тов в пары с шагом, равным 4. Разработанная схема коммутации содержит на нечетных ша-
    гах коммутации с локальным объединением элементов в пары. На четных шагах выполняется
    коммутация-ускоритель с распределенным объединением элементов в пары. Моделирование
    работы разработанной схемы коммутации осуществлялось на типовых задачах сортировки и
    полного перебора пар элементов. Установлено сокращение временных затрат по сравнению с
    четно-нечетной сортиовкой на 15-18%. В работе определена линейная зависимость времени
    сортировки с углом наклона меньше 1. Это позволяет использовать схему коммутации для
    продукционных систем большого размера. Локальные и распределенные связи в схеме коммута-
    ции сохраняют свойство регулярности. Эта особенность определяет аппаратную реализацию
    схемы в виде параллельного коммутатора с естественным масштабированием. Данная схема
    может использоваться в специализированном продукционном устройстве для декомпозиции
    продукционной системы на независимые подмножества продукций.

РАЗДЕЛ II. МАТЕМАТИЧЕСКОЕ И СИСТЕМНОЕ ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ СУПЕРКОМПЬЮТЕРОВ

  • МНОГОЭТАПНЫЙ МЕТОД АВТОМАТИЧЕСКОЙ КОРРЕКЦИИ ИСКАЖЕННЫХ ТЕКСТОВ

    Д. В. Вахлаков, В.А. Пересыпкин, С. Ю. Мельников
    Аннотация

    Одним из основных факторов, существенно затрудняющих понимание, перевод и
    анализ текстов, полученных при автоматическом распознавании речи или оптическом
    распознавании изображений текстов, являются содержащиеся в них искажения в виде
    ошибочных символов, слов и словосочетаний. Наиболее характерными ошибками систем
    распознавания являются: – замена слова на похожее по звучанию или графическому напи-
    санию; – замена нескольких слов на одно; – замена одного слова несколькими; – пропуск
    слов; – вставка или удаление коротких слов (в т.ч. предлогов и союзов). В результате рас-
    познавания получается текст, имеющий искажения и состоящий, в основном, из словарных
    слов, в том числе и в местах искажений. При большом количестве искажений тексты
    становятся практически нечитаемыми. Автоматическая обработка таких текстов весь-
    ма затруднительна, хотя эта задача является актуальной как для русского, так и для дру-
    гих распространенных языков. Программные средства коррекции, хорошо работающие при
    малых искажениях в тексте, в случае текстов с высоким уровнем искажений, вне зависи-
    мости от их происхождения, показывают неудовлетворительные результаты. Это дела-
    ет необходимым разработку самостоятельных подходов к коррекции искаженных тек-
    стов. Предложен новый многоэтапный метод коррекции искаженных текстов, основан-
    ный на последовательном определении ошибок и исправлении искаженных текстов. Иска-
    женными считаются несловарные словоформы и словоформы, вероятность появления
    которых в тексте в соответствии с выбранной вероятностной моделью меньше заданно-
    го порога. После установки признака искаженности для отдельных слов происходит рас-
    пространение этого признака на их сочетания, т.е. выделяются искаженные фрагменты
    текста. Для них строится список возможных вариантов слов, в который попадают толь-
    ко те словоформы из словаря, которые находятся от исследуемого слова на определенном
    расстоянии Левенштейна. Скорректированный текст из вариантов слов получается в
    результате поиска наиболее вероятной цепочки словоформ. Метод коррекции состоит из
    нескольких этапов, на каждом этапе корректируются лишь те фрагменты текста, кото-
    рые остались искаженными после предыдущего этапа коррекции. Метод позволяет за-
    метно повысить качество (точность) коррекции. В проведенных экспериментах качество
    коррекции в терминах F1-меры для средне искаженных текстов повысилось на 9 %, а для
    сильно искаженных текстов – на 7.7 %.

  • АППАРАТУРНО-ОРИЕНТИРОВАННЫЙ АЛГОРИТМ ДЛЯ БЫСТРОГО УМНОЖЕНИЯ КРОНЕКЕРОВА ПРОИЗВЕДЕНИЯ МАТРИЦ НА ВЕКТОР

    Е. И. Духнич, А. Г. Чефранов
    Аннотация

    В статье на основе использования свойств произведения Кронекера (КП) матриц
    предлагается новый алгоритм для повышения эффективности выполнения операции ум-
    ножения КП на вектор. Указанная операция широко применяется при решении задач обра-
    ботки сигналов, изображений, криптографии и т.п., где выполняется формирование мат-
    риц большого размера с заданными свойствами с помощью КП матриц малого размера.
    При этом используются матрицы со следующими свойствами: ортогональные (унитар-
    ные), обращаемые, инволютивные. Умножение квадратной матрицы размера на
    вектор имеет вычислительную сложность O(n2). Поэтому при росте количества элемен-
    тарных матриц-сомножителей размер результирующей матрицы КП и сложность умно-
    жения ее на вектор растут экспоненциально. Это обстоятельство существенно повыша-
    ет время решения прикладных задач. Целью предлагаемой работы является построение
    алгоритма, ориентированного на аппаратную реализацию и ускоряющего процессы фор-
    мирования КП и умножения вектора на него. Предлагается совместить во времени эти
    процедуры. Таким образом матрица КП в явном виде фактически не рассчитывается. Вме-
    сто этого матрицы-сомножители КП итеративно умножаются на компоненты вектора
    за время O(nlog2n) и требуют линейной сложности памяти. Приведена схема вычислений с
    топологией гиперкуба для возможной аппаратной реализации предлагаемого алгоритма,
    которая легко поддается конвейеризации. В разделе 1 приведены определения и свойства
    КП, используемые при синтезе предлагаемого алгоритма. В разделе 2 рассмотрен иллюст-
    рирующий предлагаемый алгоритм пример с , на основе которого в разделе 3 пред-
    ложена аппаратурно-ориентированная структура его реализации для произвольного n.

  • АЛГОРИТМИЧЕСКАЯ СЛОЖНОСТЬ РАСЧЕТА ТОЧНЫХ ПРИБЛИЖЕНИЙ РАСПРЕДЕЛЕНИЙ ВЕРОЯТНОСТЕЙ ЗНАЧЕНИЙ СТАТИСТИК МЕТОДОМ РЕШЕНИЯ УРАВНЕНИЯ ПЕРВОЙ КРАТНОСТИ ТИПОВ

    A.K. Мельников
    Аннотация

    Рассматривается алгоритмическая сложность расчета точных распределений ве-
    роятностей значений статистик и их точных приближений методом решения уравнения
    первой кратности. В качестве точных приближений распределений вероятностей значе-
    ний статистик рассматриваются их Δточные распределения, отличающиеся от точных
    распределений не более чем на заранее заданную, сколь угодно малую величину Δ. Показыва-
    ется, что основой метода расчета точных распределений вероятностей значений стати-
    стик является перечисление элементов области поиска решений линейного уравнения
    кратности типов, составленной из векторов кратности типов, каждый элемент которо-
    го представляет собой число вхождений элементов определенного типа (какого-либо знака
    алфавита) в рассматриваемую выборку. Одновременно показывается, что для расчета
    точных приближений распределения вероятностей значений статистик применяется ме-
    тод ограничения области поиска решений. Приводится выражение определяющее алго-
    ритмическую сложность вычисления точных распределений методом решения уравнения
    первой кратности. Приведенное выражение является конечным и позволяет для каждого
    значения мощности алфавита определить максимальный объем выборки, для которой при
    использовании ограниченного вычислительного ресурса методом решения уравнения первой
    кратности могут быть рассчитаны точные распределения. Определена область пара-
    метров, представляемых объемом выборок и мощностью алфавита, для которых при ог-
    раниченном вычислительном ресурсе могут быть рассчитаны точные распределения. Для
    оценки алгоритмической сложности расчета точных приближений распределений приво-
    дится, впервые полученное, выражение для числа решений уравнения первой кратности с
    ограничением на значения координат векторов решений. Приводится выражение определяющее алгоритмическую сложность вычисления точных приближений методом решения
    уравнения первой кратности с ограничением на значения координат векторов решений. В
    качестве параметра ограничения координат векторов решений используется значение
    статистики максимальной частоты, вероятность превышения которого меньше заранее
    заданной, сколь угодно малой величины Δ, что позволяет рассчитывать точные прибли-
    жения распределений, отличающиеся от их точных распределений не более чем на выбран-
    ную величину Δ. Приведенное выражение является конечным и позволяет для каждого зна-
    чения алфавита определить максимальный объем выборки, для которой при использовании
    ограниченного вычислительного ресурса методом решения уравнения первой кратности
    при ограничениях задаваемых с помощью величины Δ могут быть рассчитаны точные
    приближения. Приводятся результаты вычислений максимальных объемов выборок для
    которых могут быть рассчитаны точные приближения. Показывается, что алгоритми-
    ческая сложность расчета точных распределений на много порядков превосходит слож-
    ность расчета их точных приближений. Показано, что применение метода первой крат-
    ности для расчета точных приближений позволяет при одинаковых значениях мощности
    алфавита увеличить, по сравнению с расчетом точных распределений, объём выборок в
    два и более раз.

  • РАСЧЕТ КОЛИЧЕСТВА РЕШЕНИЙ УРАВНЕНИЯ ПЕРВОЙ КРАТНОСТИ ТИПОВ В УСЛОВИЯХ ОГРАНИЧЕНИЙ НА ЧАСТОТУ ВСТРЕЧАЕМОСТИ ЗНАКОВ АЛФАВИТА

    A.K. Мельников
    Аннотация

    Рассматривается количество решений уравнения первой кратности типов, состав-
    ленного из векторов кратности типов, каждый элемент которого представляет собой
    число вхождений элементов определенного типа (какого-либо знака алфавита) в рассмат-
    риваемую выборку. Уравнение первой кратности типов связывает между собой число
    вхождений элементов всех типов в рассматриваемую выборку и объём этой выборки. Ос-
    новное внимание в статье уделено выводу и доказательству правильности выражения,
    определяющего количество неотрицательных целочисленных решений уравнения первой
    кратности типов в условиях ограничений на частоту встречаемости знаков алфавита.
    Решение уравнения первой кратности типов является основой расчета точных приближе-
    ний вероятностей значений статистик методом первой кратности, где в качестве точ-
    ных приближений выступают Δточные распределения, отличающиеся от точных рас-
    пределений не более чем на заранее заданную, сколь угодно малую величину Δ. Величина,
    выражающая количество решений уравнения первой кратности типов, является одной из
    величин определяющих алгоритмическую сложность метода первой кратности, без знания
    значения которой нельзя определить параметры выборок, для которых при ограничениях
    на вычислительный ресурс могут быть рассчитаны точные приближения распределений.
    Также величина выражающая количества решений уравнения первой кратности типов
    используется в методе первой кратности для ограничения области поиска решений урав-
    нения. Количество решений уравнения первой кратности рассматривается в условиях ог-
    раничения на максимальное значение элементов вектора кратности, при этом рассматри-
    вается случай, когда один или несколько элементов алфавита могут в выборке отсутст-
    вовать. Впервые получено выражение, определяющее количество неотрицательных цело-
    численных решений уравнения первой кратности типов в условиях ограничений сверху на
    значения частот встречаемости знаков и возможности отсутствия одного или несколь-
    ких знаков алфавита в рассматриваемой выборке. Получены аналитические выражения,
    позволяющие для любых значений мощности алфавита, объёма выборки и ограничения на
    значение максимальной частоты встречаемости знаков алфавита вычислять количество
    целочисленных неотрицательных решений уравнения первой кратности типов. Вид полу-
    ченного выражения позволяет использовать его при изучении алгоритмической сложности
    расчетов точных приближений распределений вероятностей значений статистик с зара-
    нее указанной точностью Δ.

  • ПРЕОБРАЗОВАНИЕ НЕКОТОРЫХ ВИДОВ ПОСЛЕДОВАТЕЛЬНЫХ ИНФОРМАЦИОННЫХ ГРАФОВ В ПАРАЛЛЕЛЬНО-КОНВЕЙЕРНУЮ ФОРМУ

    Д. В. Михайлов
    Аннотация

    Многие задачи цифровой обработки сигналов могут быть представлены в виде информа-
    ционных графов. Реконфигурируемые вычислительные системы, построенные на основе ПЛИС,
    могут иметь структуру, непосредственно соответствующую информационному графу ре-
    шаемой задачи. Построение графа задачи и последующее создание вычислительной структуры
    может занимать значительное время при выполнении их вручную. В связи с этим возникает
    необходимость создания алгоритмов преобразования информационных графов, которые могут
    выполняться автоматически. В статье предложены алгоритмы преобразования однородных
    графов, содержащих ассоциативные операции, и смешанных графов, содержащих два типа
    операций, один из которых является дистрибутивным по отношению к другому. Преобразова-
    ния графов первого типа (состоящих из операций одного типа) сводятся к переходу от после-
    довательной формы графа к пирамидальной для ускорения выполнения всех операций графа.
    В случае если имеющегося количества оборудования недостаточно для реализации всех опера-
    ций графа, применяется преобразование, разбивающее исходный граф на изоморфные подгра-
    фы. Размер подграфа зависит от имеющегося вычислительного ресурса. В этом случае вычис-
    лительная структура будет соответствовать такому подграфу. Преобразования графов вто-
    рого типа (состоящих из операций двух типов, одни из которых являются дистрибутивными
    по отношению к другим) сводятся к разделению графа на подграфы, содержащие операции
    одного типа, соединённые особым образом. После этого эти подграфы могут быть преобра-
    зованы в пирамидальную форму для ускорения выполнения всех операций графа. При этом
    количество вершин с дистрибутивными операциями может значительно возрасти, в связи с
    чем может потребоваться сокращение их числа. Отсюда следует, что при преобразовании
    графов второго типа не обходимо выбирать конкретную форму, к которой будет приведён
    граф, исходя из соотношения его размера и имеющегося вычислительного ресурса. Таким
    образом, предложенные алгоритмы преобразования информационных графов различных типов
    могут быть эффективно использованы при разработке вычислительных структур, основанных
    на ПЛИС.

РАЗДЕЛ III. РЕКОНФИГУРИРУЕМЫЕ ВЫЧИСЛИТЕЛЬНЫЕ СИСТЕМЫ

  • КОМПЛЕКС СРЕДСТВ ТРАНСЛЯЦИИ ПРОГРАММ НА ЯЗЫКЕ C В ПРОГРАММЫ НА ЯЗЫКЕ ПОТОКА ДАННЫХ COLAMO

    А. И. Дордопуло, A.A. Гуленок, А.В. Бовкун, И.И. Левин, В. А. Гудков, С.А. Дудко
    Аннотация

    Рассматриваются программные средства трансляции последовательных программ
    на языке C в масштабируемые параллельно-конвейерные программы на языке программи-
    рования реконфигурируемых вычислительных систем COLAMO. В отличие от существую-
    щих средств высокоуровневого синтеза, результатом трансляции является не IP-ядро
    фрагмента задачи, а комплексное решение задачи для многокристальных реконфигурируе-
    мых вычислительных систем с автоматической синхронизацией информационных и управ-
    ляющих сигналов. Рассмотрены основные этапы трансляции последовательной программы
    на языке C: преобразование в информационный граф, анализ информационных зависимо-
    стей и выделение функциональных подграфов, преобразование в масштабируемую ресурсо-
    независимую параллельно-конвейерную форму и масштабирование программы на языке
    COLAMO для заданной многокристальной реконфигурируемой вычислительной системы.
    Масштабирование программы осуществляется с помощью методов редукции производи-
    тельности абсолютно-параллельной формы задачи – информационного графа, который
    адаптируется под архитектуру реконфигурируемой вычислительной системы. Разрабо-
    тан ряд правил, позволяющих существенно сократить число шагов преобразований при
    масштабировании задачи и обеспечить плотный поток обработки данных в функциональ-
    ных подграфах задачи. Созданный комплекс средств трансляции программ на языке C в
    конфигурационные файлы ПЛИС позволяет существенно сократить время синтеза вычис-
    лительной структуры задачи для многокристальных РВС и обеспечить сокращение общего
    времени решения задачи.

  • ЭКВИВАЛЕНТНЫЕ ПРЕОБРАЗОВАНИЯ НЕКОТОРЫХ ВИДОВ РЕКУРСИВНЫХ НЕЛИНЕЙНЫХ ВЫЧИСЛИТЕЛЬНЫХ СТРУКТУР ДЛЯ ЭФФЕКТИВНОЙ РЕАЛИЗАЦИИ НА РЕКОНФИГУРИРУЕМЫХ ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМАХ

    С. А. Дудко
    Аннотация

    Рассматриваются методы информационно-эквивалентных преобразований некото-
    рых видов нелинейных вычислительных структур с обратными связями: квадратичных,
    дробных и условных. Наличие обратных связей в конвейерной вычислительной структуре,
    решаемых на реконфигурируемых вычислительных системах прикладных задач, приводит к
    замедлению скорости формирования данных, так как для вычисления очередного значения
    требуется дождаться результата по обратной связи. При этом замедление происходит
    не только на участке с обратной связью, но и во всей вычислительной структуре, что
    приводит к увеличению времени, за которое данная задача может быть решена. Преды-
    дущие фрагменты вынуждены задерживать свои данные перед подачей в обратную связь,
    а последующие вынуждены простаивать, ожидая данные на выходе обратной связи. На
    сегодняшний день не существует средств автоматического проектирования прикладных
    задач для реконфигурируемых вычислительных систем, которые оптимизировали бы та-
    кие вычислительные структуры в автоматическом режиме. Поэтому пользователь вы-
    нужден самостоятельно изучать текст исходной программы и искать в нем выражения,
    содержащие обратные связи, а затем оптимизировать их. Это приводит к увеличению
    времени, требующегося для создания эффективных прикладных программ. Предложенные
    методы преобразований позволяют сократить интервал обработки данных (в лучшем
    случае до единицы) при решении прикладных задач на реконфигурируемых вычислительных
    системах. Для реализации информационно-эквивалентных преобразований необходимо,
    чтобы в вычислительной системе имелся дополнительный аппаратный ресурс. Реализация
    данных преобразований в оптимизирующем синтезаторе схемотехнических решений по-
    зволяет проводить оптимизацию вычислительной структуры с обратными связями авто-
    матически. Это позволяет сократить время разработки эффективных прикладных про-
    грамм, содержащих обратные связи, с нескольких дней до нескольких минут.

  • МЕТОД РЕШЕНИЯ ГРАФОВЫХ NP-ПОЛНЫХ ЗАДАЧ НА РЕКОНФИГУРИРУЕМЫХ ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМАХ НА ОСНОВЕ ПРИНЦИПА РАСПАРАЛЛЕЛИВАНИЯ ПО ИТЕРАЦИЯМ

    А. В. Касаркин
    Аннотация

    При решении графовых NP-полных задач на многопроцессорных системах рост обо-
    рудования не приводит к пропорциональному росту производительности системы, поэто-
    му не всегда удается решить задачу за приемлемое время. Целью работы, описанной в
    статье, является минимизация времени решения задачи поиска максимальных клик графа с
    использованием реконфигурируемых вычислительных систем (РВС). При решении задачи
    на РВС методом распараллеливания по слоям рост производительности также замедля-
    ется, несмотря на лучшую степень масштабируемости по сравнению с многопроцессор-
    ными реализациями. В статье предложен метод создания параллельно-конвейерных про-
    грамм для реконфигурируемых вычислительных систем на основе распараллеливания по
    итерациям для решения графовых NP-полных задач. Рассмотрено, что использовать би-
    товый способ представления множеств (как в методе распараллеливания по слоям) для
    метода распараллеливания по итерациям не является эффективным. Новый метод отли-
    чается организацией вычислений, а именно – обработкой неупорядоченных множеств,
    доступ к элементам которых осуществляется не по адресам (как в массивах), а по значе-
    ниям (именам вершин и именам дуг графа). Показано, что новый метод на основе распа-
    раллеливания по итерациям, несмотря на более низкую удельную производительность, свя-
    занную с тем, что вычислительным подструктурам из-за символьного представления
    множеств необходимо обработать большее число промежуточных данных, обеспечивает
    практически линейный рост реальной производительности РВС при значительно большем
    количестве вычислительного ресурса по сравнению с методом распараллеливания по слоям.

  • РЕАЛИЗАЦИЯ ФРАКТАЛЬНОГО СЖАТИЯ И ДЕКОМПРЕССИИ ИЗОБРАЖЕНИЙ ПАРАЛЛЕЛЬНО-КОВЕЙЕРНЫМ СПОСОБОМ НА РЕКОНФИГУРИРУЕМЫХ ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМАХ

    М.Д. Чекина
    Аннотация

    Фрактальные алгоритмы находят все большее количество областей применения –
    от компьютерной графики до моделирования сложных физических процессов, но для их
    программной реализации требуются значительные вычислительные мощности. Фрак-
    тальное сжатие изображений отличается высокой степенью компрессии данных при хо-
    рошем качестве восстановленного изображения. Целью данной работы является повыше-
    ние производительности реконфигурируемых вычислительных систем (РВС) при реализа-
    ции фрактального сжатия и декомпрессии изображений. В работе описаны разработан-
    ные методы фрактального сжатия и последующей декомпрессии изображений, реализо-
    ванные параллельно-конвейерным способом для РВС. Основная идея параллельной реализа-
    ции фрактального сжатия изображений сводится к параллельному выполнению попарного
    сравнения доменных и ранговых блоков. Для достижения наилучшей производительности
    необходимо одновременно сравнивать максимальное количество пар. При практической
    реализации фрактального сжатия изображений на РВС учитываются такие критические
    ресурсы, как количество входных каналов и количество логических ячеек ПЛИС. Для задачи
    фрактального сжатия изображения критическим ресурсом являются каналы данных, по-
    этому параллельная организация вычислений заменяется параллельно-конвейерной после
    выполнения редукцию производительности параллельной вычислительной структуры. По-
    дача каждого операнда в вычислительную структуру осуществляется последовательно
    (побитово), что экономит вычислительный ресурс и уменьшает простой оборудования.
    Для хранения коэффициентов системы итерируемых функций, кодирующих изображение,
    введена структура данных, задающая отношения между номерами ранговых и доменных
    блоков и соответствующими параметрами. Для удобства последующей декомпрессии
    элементы массива, кодирующего сжатое изображение, упорядочены по номерам ранговых
    блоков, что позволяет избежать двойной косвенной адресации в вычислительной структу-
    ре. Представленный подход позволяет масштабировать параллельно-конвейерную про-
    грамму на любое количество программируемых логических интегральных схем (ПЛИС).
    Практическая реализация фрактального сжатия изображений, выполненная на реконфи-
    гурируемом компьютере Терциус-2, содержащем восемь ПЛИС, обеспечивает ускорение в
    15000 раз по сравнению с универсальным многоядерным процессором и в 18–25 раз по срав-
    нению с существующими решениями для ПЛИС. Реализация декомпрессии изображения на
    реконфигурируемом компьютере показывает ускорение в 380 раз по сравнению с аналогич-
    ной реализацией для многоядерного универсального процессора.

РАЗДЕЛ IV. ПРОБЛЕМНО-ОРИЕНТИРОВАННЫЕ И ВСТРАИВАЕМЫЕ ВЫЧИСЛИТЕЛЬНЫЕ СИСТЕМЫ

  • МАСШТАБИРОВАНИЕ ЦЕЛОЧИСЛЕННЫХ ДАННЫХ В РВС ПРИ ВЫЧИСЛЕНИИ РАДИОЛОКАЦИОННОГО ДАЛЬНОСТНО-СКОРОСТНОГО ПОРТРЕТА

    О.В. Ершова, Е. В. Кириченко, М.С. Кочерга, E.A. Семерников
    Аннотация

    Данная статья посвящена вопросу предотвращения переполнений разрядной сетки в
    высокопроизводительных реконфигурируемых вычислительных системах (РВС) на основе
    ПЛИС, приводящих к фатальным ошибкам обработки данных в процессе получения
    радиолокационного дальностно-скоростного портрета (ДСП) цели. Кратко рассмотрены
    существующие способы решения данной проблемы, и предложена методика априорного оп-
    ределения количества точек масштабирования в конвейерно-параллельных вычислительных
    структурах, формирующих радиолокационный ДСП цели. Данная методика позволяет зара-
    нее определить необходимое количество масштабирований на всех этапах обработки цело-
    численных данных и предотвратить переполнения при вычислении БПФ (ОБПФ) во всех
    возможных ситуациях. Рассмотрен алгоритм получения ДСП из исходной сигнальной мат-
    рицы (ИСМ) на примере радиолокационной системы (РЛС) непрерывного излучения с
    линейной частотной модуляцией (ЛЧМ). Приведены формулы, позволяющие рассчитать
    максимально допустимое значение (в используемой разрядной сетке) амплитуды
    преобразумых сигналов на всех этапах получения ДСП и количество итераций с
    масштабированием в процедурах БПФ (ОБПФ). Представлен численный пример расчета
    количества масштабирований для всех этапов алгоритма формирования ДСП, в котором
    определено необходимое число итераций с масштабированием при вычислении быстрой
    свертки и доплеровской скорости (с учетом умножения на оконную функцию), позволяющее
    предотвратить возможный выход значений сигнала за пределы разрядной сетки. В резуль-
    тате установлено, что предлагаемый способ расчета количества масштабирований
    позволяет избежать чрезмерного падения уровня сигнала на выходе обработки и снизить
    отношение ошибок цифровой обработки к уровню сигнала дальностно-скоростной матрицы

  • ПОВЫШЕНИЕ РЕАЛЬНОЙ ПРОИЗВОДИТЕЛЬНОСТИ РВС ПРИ РЕШЕНИИ ЗАДАЧ ЦИФРОВОЙ ОБРАБОТКИ ИЗОБРАЖЕНИЙ С ИСПОЛЬЗОВАНИЕМ БЫСТРОГО ПРЕОБРАЗОВАНИЯ ФУРЬЕ

    А.В. Чкан
    Аннотация

    Рассматриваются вопросы цифровой обработки изображений больших размерно-
    стей в реальном масштабе времени с помощью реконфигурируемых вычислительных сис-
    тем (РВС) на базе ПЛИС. РВС относятся к классу высокопроизводительных многопроцес-
    сорных вычислительных систем, но при этом обладают программируемой архитектурой,
    позволяющей конфигурировать структуру вычислительной системы, оптимально под-
    страивая её под алгоритмы решаемой задачи. В то же время оптимизация вычислитель-
    ной структуры задачи сводится к разработке и реализации параллельных алгоритмов,
    соответствующих специфике используемой архитектуры РВС. Всё это позволяет эффек-
    тивно использовать РВС для решения широкого класса задач цифровой обработки сигна-
    лов. Предложены способы повышения удельной и реальной производительности РВС при
    решении задач цифровой обработки изображений с использованием быстрого преобразо-
    вания Фурье (БПФ). На примере процедуры фильтрации изображений в частотной облас-
    ти рассмотрены основные вычислительные этапы и способы их оптимизации, основанные
    на свойствах алгоритма БПФ. Применение оптимизации позволяет существенно сокра-
    тить как объем вычислений, так и объем задействованных аппаратных ресурсов ПЛИС, и
    повысить производительность РВС для задач обработки изображений. Освобожденные в
    результате оптимизации вычислительной структуры ресурсы ПЛИС могут быть исполь-
    зованы для дополнительного распараллеливания вычислений и ускорения обработки посту-
    пающих данных. Показаны преимущества представления данных в формате с фиксирован-
    ной запятой при выполнении расчётов на РВС. Использование фиксированной запятой по-
    зволяет не только повысить удельную и реальную производительность вычислительной
    системы по сравнению с плавающей запятой в силу свойств формата, но и использовать
    произвольную разрядность данных, что является актуальным для большинства задач циф-
    ровой обработки сигналов. Рассмотрено решение проблемы переполнения разрядной сетки
    при использовании формата с фиксированной запятой с помощью масштабирования раз-
    рядности данных.

  • ОПТИМИЗАЦИЯ ПРОЕКТИРОВАНИЯ МНОГОКАНАЛЬНОЙ СИСТЕМЫ С ИСПОЛЬЗОВАНИЕМ ЛОГИЧЕСКОГО СИНТЕЗА ДЛЯ ПОВЫШЕНИЯ КАЧЕСТВА ОБЪЕМНОЙ ВИЗУАЛИЗАЦИИ

    Н.И. Витиска, Н.А. Гуляев, В. В. Селянкин
    Аннотация

    Рассматривается задача оптимизации проектирования многоканальных систем,
    используемых для прямой объемной визуализациис целью повышения качества её р е-
    зультата. Объемная визуализация широко используется в современных системах ко м-
    пьютерной визуализации, моделирования, симуляции, технического зрения, при этом
    отличается необходимостью обработки больших объемов данных для возможности
    получения высокого качества результата. Задача оптимизации проектирования мно-
    гоканальных систем для объемной визуализации рассматривается с точки зрения дос-
    тижения необходимого качества синтезируемого изображения при минимальных з а-
    тратах. В работе предлагается метод логического синтеза таких систем, позволя ю-
    щего получить оптимальные соотношения качества-затрат в зависимости от тре-
    буемых параметров постановки задачи. Предлагаемый метод позволяет достигать
    качества, близкого к результатам полного перебора, но требующего значительно
    меньший объем вычислений. Для каждого канала системы определяется набор пер е-
    менных, оптимизация которых обеспечит качество результата визуализации. На о с-
    нове параметров оптимизации строится переключательная функция с помощью ди а-
    граммы Вейча. Данный подход осуществляется программным путём в каждом канале
    распределённой системы в реальном масштабе времени, что задаёт общую схему та-
    кой методики. В процессе выполнения работы проводились экспериментальные иссл е-
    дования зависимости точности решения и объема вычислений для прямой объемной
    визуализации в каждом канале распределённой системы. Разработана методика о п-
    тимального синтеза изображений при условии выравнивания качества воспроизведения
    в небольшой группе каналов распределённой системы.

РАЗДЕЛ V. ИНТЕГРАЦИЯ ПАРАЛЛЕЛЬНЫХ И ГИБРИДНЫХ РАСПРЕДЕЛЕННЫХ ВЫЧИСЛЕНИЙ

  • ПРОЕКТИРОВАНИЕ БАЗЫ ДАННЫХ СОСТОЯНИЙ ДЛЯ ОНЛАЙН И ОФЛАЙН ОБРАБОТКИ ДАННЫХ ЭКСПЕРИМЕНТАЛЬНЫХ УСТАНОВОК КОМПЛЕКСА NICA

    К. В. Герценбергер, А.И. Чеботов, И.Н. Александров, И. А. Филозова, Е.И. Александров
    Аннотация

    Хранение, обработка и анализ экспериментальных и смоделированных данных являются
    неотъемлемой частью всех современных экспериментов физики высоких энергий. Эти задачи
    имеют важное значение в экспериментах комплекса NICA, строящегося в Объединенном ин-
    ституте ядерных исследований (ОИЯИ), из-за большой частоты взаимодействия и множест-
    венности частиц в событиях столкновения ионов, в связи с этим особенно актуальна автома-
    тизация рассматриваемых процессов для комплекса NICA. Для решения поставленной задачи
    современные физические эксперименты используют информационные системы различной на-
    правленности, которые позволяют управлять потоками данных и обслуживать большое коли-
    чество одновременных запросов на требуемую информацию от различных систем эксперимен-
    та и их пользователей. В статье описывается проектирование новой информационной систе-
    мы на основе базы данных состояний, а также сопутствующие информационные сервисы для
    автоматизации хранения и обработки данных и информации об экспериментах проекта NICA.
    Разрабатываемая база данных состояний предназначена для хранения, поиска и использования
    различных параметров и информации о режимах работы систем эксперимента. База данных,
    реализуемая при помощи СУБД (системы управления базами данных) PostgreSQL, будет отве-
    чать за предоставление хранимой информации для обработки данных событий и их физическо-
    го анализа, а также за организацию прозрачного единого доступа и управление данными на
    протяжении всего жизненного цикла проводимых научных исследований. В статье показаны
    схема и цели создаваемой базы данных состояний, представлены её атрибуты, а также выде-
    лены ключевые аспекты разработки. Показано место базы данных состояний в архитектуре
    обработки потока данных эксперимента. Также в статье описана интеграция данной инфор-
    мационной системы с используемым программным обеспечением экспериментов. Начата раз-
    работка интерфейсов базы данных состояний для использования хранимых параметров и ин-
    формации об эксперименте в задачах моделирования событий, обработки “сырых” данных,
    реконструкции и физического анализа