DSpace Repository

Моделирование влияния системы мониторинга производительности на выполнение коллективных MPI операций

Show simple item record

dc.contributor.author Худолеева, А.А.
dc.contributor.author Стефанов, К.С.
dc.contributor.author Khudoleeva, A.A.
dc.contributor.author Stefanov, K.S.
dc.date.accessioned 2022-12-07T08:19:39Z
dc.date.available 2022-12-07T08:19:39Z
dc.date.issued 2021
dc.identifier.citation Худолеева, А.А. Моделирование влияния системы мониторинга производительности на выполнение коллективных MPI операций / А.А. Худолеева, К.С. Стефанов // Вестник ЮУрГУ. Серия: Вычислительная математика и информатика. 2021. Т. 10, № 1. С. 62–74. DOI: 10.14529/cmse210105. Khudoleeva A.A., Stefanov K.S. Modeling Influence of Monitoring System on Performance of MPI Collective Operations. Bulletin of the South Ural State University. Series: Computational Mathematics and Software Engineering. 2021. Vol. 10, no. 1. P. 62–74. (in Russian) DOI: 10.14529/cmse210105. ru_RU
dc.identifier.issn 2410-7034
dc.identifier.uri http://dspace.susu.ru/xmlui/handle/00001.74/45480
dc.description Худолеева Анна Александровна, студентка, кафедра суперкомпьютеров и квантовой информатики, Московский государственный университет имени М.В. Ломоносова (Москва, Российская Федерация). Стефанов Константин Сергеевич, к.ф.-м.н., старший научный сотрудник, научно-исследовательский вычислительный центр Московского государственного университета имени М.В. Ломоносова (Москва, Российская Федерация). A.A. Khudoleeva, K.S. Stefanov Lomonosov Moscow State University (GSP-1, Leninskie Gory 1, Moscow, 119991 Russia) E-mail: khudoleeva.anna98@gmail.com, cstef@parallel.ru ru_RU
dc.description.abstract Изучение параллельных программ с помощью средств мониторинга производительности — распространенная практика. Агент системы мониторинга для сбора данных о работе приложения периодически активируется во время счета этого приложения, внося помехи и занимая ресурсы. Однако вопрос об уровне влияния этих помех является слабо изученным, разработчики систем мониторинга зачастую не проводят исследования в этом направлении. В данной статье рассматриваются подходы к изучению влияния системы мониторинга производительности суперкомпьютера на пользовательские приложения. В качестве инструмента для измерения влияния агента системы мониторинга предлагается использовать коллективные MPI операции. Так, кроме обнаружения шума системы мониторинга, можно исследовать влияние системы мониторинга на сильно синхронизированные приложения. Время выполнения коллективных MPI операций изучается в присутствии программного средства, моделирующего работу агента системы мониторинга производительности. Оценивается уровень шума, который каждая из рассматриваемых коллективных операций в выбранной конфигурации запуска способна зафиксировать. В работе приводятся данные запусков инструмента с коллективными MPI операциями All-to-All, All-Reduce, Barrier. Найдено, что хорошей стабильностью и чувствительностью обладают операции All-to-All и Barrier. Studying parallel program with the means of monitoring systems is a common practice. To collect data about application, monitoring system agent activates periodically during the run of application, occupying resources and causing perturbation. Monitoring system developers often ignore studying the problem of monitoring tools interference into application performance, this problem remains poorly examined. This article discusses ways to study influence of supercomputer monitoring system on users’ applications. We suggest to use MPI collective operations as a tool to measure this influence. This method also allows to estimate influence of monitoring system noise on a synchronized application. MPI collective operations are measured in presence of injected noise generated by the program that imitates interference of monitoring tool. We estimate the noise level that each of the used collective operations is capable to sense in chosen configuration. All-to-All, All-Reduce and Barrier are used in the noise detection tool. We find parameters for All-to-All and Barrier operations to perform stably and detect low noise level. ru_RU
dc.description.sponsorship Исследование выполнено при финансовой поддержке РФФИ в рамках научного проекта № 19-07-00940. Работа выполнена с использованием оборудования Центра коллективного пользования сверхвысокопроизводительными вычислительными ресурсами МГУ имени М.В. Ломоносова. ru_RU
dc.publisher Издательский центр ЮУрГУ ru_RU
dc.relation.ispartof Вестник ЮУрГУ. Серия Вычислительная математика и информатика ru
dc.relation.ispartof Bulletin of South Ural State University. Series Computational mathematics and software engineering en
dc.relation.ispartofseries Вычислительная математика и информатика;Том 10
dc.subject УДК 519.6 ru_RU
dc.subject суперкомпьютер ru_RU
dc.subject мониторинг производительности ru_RU
dc.subject шум системы мониторинга ru_RU
dc.subject замедление параллельных задач ru_RU
dc.subject моделирование влияния системы мониторинга ru_RU
dc.subject supercomputer ru_RU
dc.subject performance monitoring ru_RU
dc.subject monitoring system noise ru_RU
dc.subject parallel job slowdown ru_RU
dc.subject modeling influence of monitoring system ru_RU
dc.title Моделирование влияния системы мониторинга производительности на выполнение коллективных MPI операций ru_RU
dc.title.alternative Modeling Influence of Monitoring System on Performance of MPI Collective Operations ru_RU
dc.type Article ru_RU
dc.identifier.doi DOI: 10.14529/cmse210105


Files in this item

This item appears in the following Collection(s)

Show simple item record

Search DSpace


Advanced Search

Browse

My Account