Аннотации:
В данной работе рассматривается высокоскоростная вычислительная сеть с топологией многомерный
тор. Работа посвящена оптимизации фрагментации, возникающей в результате последовательного
выделения вычислительных узлов в многоузловой системе при заданном требовании о том, что сетевой
трафик разных пользовательских заданий не должен пересекаться. В данной работе на основе идей из
задачи о многомерной упаковке контейнера предложен метод поиска узлов с оценкой фрагментированности
системы. Для такой оценки введено понятие прямоугольников максимального размера, которые возможно
вписать в систему после размещения очередного пользовательского задания. Каждое множество узлов,
подходящее для размещения задания, оценивается предложенной функцией, учитывающей размер и
количество найденных прямоугольников максимального размера. Исследование разработанного метода
проводилось с помощью симулятора работы вычислительной системы. Рассмотрен набор различных
вычислительных систем с трехмерными и четырехмерными топологиями, размер минимальной системы
— 32 вычислительных узла, максимальной — 144 узла. Для каждой системы задана синтетическая
очередь заданий, параметры которой приближены к реально возможной. В качестве критерия качества
метода выбора узлов рассматривается средняя утилизация ресурсов вычислительной системы и среднее
время ожидания заданий в очереди. Исследование показало, что увеличение утилизации ресурсов для
предложенного метода выбора узлов составило в среднем 11 % по сравнению с базовым методом, а среднее
значение времени нахождения задания в очереди сокращенно на 45, 3 %. This paper considers a high-speed interconnect with a multidimensional topology. The paper is devoted to the
optimization of fragmentation resulting from sequential allocation of compute nodes in a supercomputer provided
that network traffic from different user’s tasks should not overlap. This paper proposes a method for searching
nodes with an evaluation of the fragmentation of the system based on ideas from multidimensional container
loading problem. For such an evaluation, the concept of rectangles is introduced, which can be inscribed into the
system after placing the next user task. Each set of nodes that is suitable for placing the task is evaluated by the
proposed function taking into account the size and the number of found rectangles of maximum size. The proposed
method was evaluated using computer system model. A set of different computer systems with three-dimensional
and four-dimensional topologies was considered. The minimum system size is 32 compute nodes and the maximum
is 144. A synthetic queue of tasks is set for each system. The parameters of the synthetic queues are close to a
real ones. The average utilization of the resources of the computer system and the average waiting time for the
tasks in the queue is chosen as a method quality criterion. The study showed that the increase of the resources
utilization for the proposed method averaged 11% compared to the base method, and the average time spent in
queue is reduced by 45, 3 %.
Описание:
Мукосей Анатолий Викторович, научный сотрудник, сектор управления разработки
вычислительной техники, акционерное общество «Научно исследовательский центр
электронной вычислительной техники» (Москва, Российская Федерация).
Семенов Александр Сергеевич, к.т.н, зам. начальника отдела архитектуры
и программного обеспечения суперкомпьютеров, акционерное общество «Научно
исследовательский центр электронной вычислительной техники» (Москва, Российская
Федерация). A.V. Mukosey, A.S. Semenov
JSC «NICEVT»
(Varshavskoye shosse 125, building 15, Moscow, 117587 Russia)
E-mail: mukosey@nicevt.ru, semenov@nicevt.ru