Показать сокращенную информацию
dc.contributor.author | Поляков, А. Ю. | |
dc.contributor.author | Polyakov, A. Y. | |
dc.creator | Южно-Уральский государственный университет | ru_RU |
dc.creator | South Ural State University | en |
dc.date.accessioned | 2011-12-12T08:35:21Z | |
dc.date.available | 2011-12-12T08:35:21Z | |
dc.date.issued | 2010 | |
dc.identifier.citation | Поляков, А. Ю. О восстановлении программ из контрольных точек / А. Ю. Поляков // Вестник ЮУрГУ. Серия Математическое моделирование и программирование.- 2010.- Вып. 6. № 35 (211).- C. 91-103 | ru_RU |
dc.identifier.uri | http://dspace.susu.ac.ru/handle/0001.74/954 | |
dc.description | Поляков Артем Юрьевич, лаборатория вычислительных систем, институт физики полупроводников им. А.В. Ржанова СО РАН, artpol84@gmail.com. | ru_RU |
dc.description.abstract | В работе описаны два подхода к проблеме восстановления распределенных программ из контрольных точек. Предложен алгоритм восстановления взаимосвязей типа «родитель-потомок» и алгоритм принадлежности к группам и сеансам для набора процессов в рамках элементарной машины распределенной вычислительной системы. Предложен алгоритм координированного восстановления набора связанных процессов, перезапускаемых раздельно (на различных элементарных машинах или терминалах). Описанные подходы реализованы в системе создания контрольных точек DMTCP (Distributed MultiThreaded Checkpointing). In paper two approaches to distributed programs restore problem from checkpoints set are described. Computation node wide algorithm of parent-child relationships and group/session assignement recreation at restore time is proposed. Also coordinated algorithm for process set restoration from several nodes/terminals is designed. Described algorightms are implemented in checkpointing package called DMTCP (Distributed MultiThreaded Checkpointing). | ru_RU |
dc.description.sponsorship | Лаборатория вычислительных систем, институт физики полупроводников им. А. В. Ржанова СО РАН | ru_RU |
dc.language | ru | en |
dc.publisher | Издательский центр ЮУрГУ | ru_RU |
dc.relation.ispartof | Вестник ЮУрГУ. Серия Математическое моделирование и программирование | ru_RU |
dc.relation.ispartof | Vestnik Yuzhno-Ural'skogo Gosudarstvennogo Universiteta. Seriya Matematicheskoe modelirovanie i programmirovanie | ru_RU |
dc.relation.ispartof | Bulletin of SUSU | en |
dc.relation.ispartofseries | Математическое моделирование и программирование;Вып. 6 | |
dc.subject | распределенные вычислительные системы | ru_RU |
dc.subject | контрольные точки восстановления | ru_RU |
dc.subject | отказоустойчивость | ru_RU |
dc.subject | УДК 004.451 | ru_RU |
dc.subject | вычислительная техника | ru_RU |
dc.subject | НРС | ru_RU |
dc.subject | rollback-recovery | ru_RU |
dc.subject | checkpointing | ru_RU |
dc.subject | fault tolerance | ru_RU |
dc.subject | программные средства | ru_RU |
dc.title | О восстановлении программ из контрольных точек | ru_RU |
dc.title.alternative | On program restoration from checkpoints set | ru_RU |
dc.type | Article | ru_RU |