DSpace Repository

Методы и средства организации глобальной очереди заданий в территориально распределенной вычислительной системе

Show simple item record

dc.contributor.author Баранов, А.В.
dc.contributor.author Тихомиров, А.И.
dc.contributor.author Baranov, A.V.
dc.contributor.author Tikhomirov, A.I.
dc.date.accessioned 2019-11-26T10:47:18Z
dc.date.available 2019-11-26T10:47:18Z
dc.date.issued 2017
dc.identifier.citation Баранов А.В., Тихомиров А.И. Методы и средства организации глобальной очереди заданий в территориально распределенной вычислительной системе // Вестник ЮУрГУ. Серия: Вычислительная математика и информатика. 2017. Т. 6, № 4. С. 28–42. DOI: 10.14529/cmse170403. Baranov A.V., Tikhomirov A.I. Methods and Tools for Organizing the Global Job Queue in the Geographically Distributed Computing System. Bulletin of the South Ural State University. Series: Computational Mathematics and Software Engineering. 2017. vol. 6, no. 4. pp. 28–42. DOI: 10.14529/cmse170403. ru_RU
dc.identifier.issn 2305-9052
dc.identifier.issn 2410-7034
dc.identifier.uri http://dspace.susu.ru/xmlui/handle/0001.74/26549
dc.description Баранов Антон Викторович, к.т.н., доц., в.н.с., Межведомственный суперкомпьютерный центр Российской академии наук – филиал Федерального государственного учреждения «Федеральный научный центр Научно-исследовательский институт системных исследований Российской академии наук» (Москва, Российская Федерация). Тихомиров Артем Игоревич, стажер-исследователь, Межведомственный суперкомпьютерный центр Российской академии наук – филиал Федерального государственного учреждения «Федеральный научный центр Научно-исследовательский институт системных исследований Российской академии наук» (Москва, Российская Федерация). A.V. Baranov, A.I. Tikhomirov Joint Supercomputer Center of the Russian Academy of Sciences - Branch of Federal State Institution «Scientific Research Institute for System Analysis of the Russian Academy of Sciences», (pr. Leninsky 32a, Moscow, 119334 Russia) E-mail: tema4277@rambler.ru ru_RU
dc.description.abstract В статье рассмотрена модель территориально распределенной вычислительной системы (ТРС), состоящей из объединенных каналами связи высокопроизводительных вычислительных установок. Вычислительные установки из состава ТРС представляют собой высокопроизводительные кластеры, различающиеся по архитектуре и производительности. Объединяющие их каналы связи имеют разные надежность и пропускную способность. Особенностью рассматриваемой модели является децентрализованная схема управления заданиями. Подобная схема подразумевает, что любая вычислительная установка в любой момент времени может выйти из состава ТРС по причине своей неисправности или неисправности канала связи. Устранение неисправности означает динамическое подключение вычислительной установки к ТРС. В этих условиях в ТРС организуется глобальная очередь заданий с абсолютными приоритетами, из которой задания распределяются по свободным ресурсам вычислительных установок. Абсолютные приоритеты предполагают вытеснение с выполнения низкоприоритетного задания поступившим в очередь высокоприоритетным заданием. Для формирования и хранения глобальной очереди заданий в условиях динамически изменяющегося состава ТРС необходима надежная распределенная информационная система (РИС). В качестве основы для ее построения авторами рассмотрен ряд известных распределенных СУБД. В статье сформулированы требования к РИС, проведен сравнительный анализ и сделан выбор решения, удовлетворяющего требованиям, рассмотрен разработанный авторами макет ТРС с децентрализованной схемой диспетчеризации заданий. The geographically distributed computing infrastructure (DCI) considered in the paper includes high performance computing systems united by communication channels. Computing systems from the DCI are high-performance clusters differing in architecture and performance. Communication channels uniting clusters have different reliability and bandwidth. The considered model of DCI has a decentralized jobs management and dispatching scheme. This scheme implies that at any time malfunction of any computing cluster or a failure in the communication channel can cause cluster’s leaving the DCI. Cluster’s or channel’s troubleshooting means dynamically connecting the cluster to the DCI. The global job queue is organized in this computing infrastructure. Computing jobs have absolute priorities, and high priority job can interrupt low priority running jobs. Jobs from the global queue allocate on idle resources of computing systems. Forming and storing global job queue in conditions of dynamically changing DCI composition needs the reliable information system. The authors reviewed some distributed DBMSs as the basis of this information system. The article outlines the requirements for a distributed information system. The authors conducted a comparative analysis and selected a solution that satisfies the requirements, and designed prototype of the geographically distributed computing infrastructure with the decentralized scheme of jobs dispatching. ru_RU
dc.description.sponsorship Работа выполнена в рамках государственного задания с использованием вычислительных ресурсов Межведомственного суперкомпьютерного центра РАН (МСЦ РАН). ru_RU
dc.language.iso other ru_RU
dc.publisher Издательский центр ЮУрГУ ru_RU
dc.relation.ispartof Вестник ЮУрГу. Серия Вычислительная математика и информатика ru
dc.relation.ispartof Bulletin of South Ural State University. Series 'Computational mathematics and software engineering" en
dc.relation.ispartofseries Вычислительная математика и информатика;Том 6
dc.subject УДК 004.75 ru_RU
dc.subject УДК 004.382.2 ru_RU
dc.subject территориально распределенная система ru_RU
dc.subject распределенная информационная система ru_RU
dc.subject абсолютные приоритеты вычислительных заданий ru_RU
dc.subject grid ru_RU
dc.subject information system ru_RU
dc.subject absolute priorities ru_RU
dc.title Методы и средства организации глобальной очереди заданий в территориально распределенной вычислительной системе ru_RU
dc.title.alternative Methods and Tools for Organizing the Global Job Queue in the Geographically Distributed Computing System ru_RU
dc.type Article ru_RU
dc.identifier.doi DOI: 10.14529/cmse170403


Files in this item

This item appears in the following Collection(s)

Show simple item record

Search DSpace


Advanced Search

Browse

My Account