Resumen:
Вычисление матрицы Евклидовых расстояний требуется в широком спектре задач, связанных с
интеллектуальным анализом данных. В настоящее время большое количество параллельных алгоритмов
решения этой задачи реализовано для графических процессоров. Однако данные разработки не могут
быть просто перенесены на многоядерные системы архитектуры Intel Many Integrated Core. В статье
предлагается параллельный алгоритм вычисления матрицы Евклидовых расстояний на многоядерном
процессоре Intel Xeon Phi поколения Knights Landing для случая, когда входные данные могут
быть размещены в оперативной памяти. Данный алгоритм использует блочно-ориентированную схему
организации вычислений, которая позволяет эффективно использовать возможности векторизации
вычислений Intel Xeon Phi. В алгоритме применена нетривиальная компоновка данных в оперативной
памяти для уменьшения количества кэш-промахов процессора во время вычислений. Эксперименты на
реальных и синтетических наборах данных показали, что предложенный алгоритм хорошо масштабируется
и опережает аналоги в случае прямоугольных матриц с данными малой размерности. Computation of a Euclidean distance matrix (EDM) is a typical task in a wide spectrum of problems connected
with data mining. Currently, many parallel algorithms for this task have been developed for graphical processors.
These developments, however, cannot be directly applied to the Intel Many Integrated Core systems. In this paper,
we suggest a parallel algorithm for EDM computation on Intel Xeon Phi Knights Landing processor in the case
when the input data fit into the main memory. The algorithm exploits block-oriented scheme of computations that
allows for the efficient utilization of Intel Xeon Phi vectorization abilities. In the algorithm, we also apply apply
a sophisticated data layout to store data points in main memory so as to reduce the number of processor cache
misses during EDM computations. Experimental evaluation of the algorithm on real-world and synthetic datasets
shows that it is highly scalable and outruns analogues in the case of rectangular matrices with low-dimensional
data points.
Descripción:
Речкалов Тимофей Валерьевич, аспирант, кафедра системного программирования,
Южно-Уральский государственный университет (национальный исследовательский
университет) (Челябинск, Российская Федерация).
Цымблер Михаил Леонидович, к.ф.-м.н., доцент, кафедра системного
программирования, Южно-Уральский государственный университет (национальный
исследовательский университет) (Челябинск, Российская Федерация). T.V. Rechkalov, M.L. Zymbler
South Ural State University (pr. Lenina 76, Chelyabinsk, 454080 Russia)
E-mail: trechkalov@yandex.ru, mzym@susu.ru