Обзор методов обучения глубоких нейронных сетей

Созыкин, А.В.; Sozykin, A.V.

Главная
→
Научные журналы ЮУрГУ
→
Вестник ЮУрГУ. Серия Вычислительная математика и информатика
→
Просмотр элемента

dc.contributor.author	Созыкин, А.В.
dc.contributor.author	Sozykin, A.V.
dc.date.accessioned	2019-11-26T08:02:12Z
dc.date.available	2019-11-26T08:02:12Z
dc.date.issued	2017
dc.identifier.citation	Созыкин А.В. Обзор методов обучения глубоких нейронных сетей // Вестник ЮУрГУ. Серия: Вычислительная математика и информатика. 2017. Т. 6, № 3. С. 28–59. DOI: 10.14529/cmse170303. Sozykin A.V. An Overview of Methods for Deep Learning in Neural Networks.. Bulletin of the South Ural State University. Series: Computational Mathematics and Software Engineering. 2017. vol. 6, no. 3. pp. 28–59. (in Russian) DOI: 10.14529/cmse170303.	ru_RU
dc.identifier.issn	2305-9052
dc.identifier.issn	2410-7034
dc.identifier.uri	http://dspace.susu.ru/xmlui/handle/0001.74/26543
dc.description	Созыкин Андрей Владимирович, к.т.н., зав. отделом вычислительной техники, Институт математики и механики им. Н.Н.Красовского УрО РАН, зав. кафедрой, высокопроизводительных компьютерных технологий, Уральский федеральный университет (Екатеринбург, Российская Федерация). A.V. Sozykin N.N. Krasovskii Institute of Mathematics and Mechanics (S.Kovalevskaya str. 16, Yekaterinburg, 620990 Russia), Ural Federal University (Mira str. 19, Yekaterinburg, 620002 Russia) E-mail: avs@imm.uran.ru	ru_RU
dc.description.abstract	Глубокие нейронные сети в настоящее время становятся одним из самых популярных подходов к созданию систем искусственного интеллекта, таких как распознавание речи, обработка естественного языка, компьютерное зрение и т.п. В статье представлен обзор истории развития и современного состояния методов обучению глубоких нейронных сетей. Рассматривается модель искусственной нейронной сети, алгоритмы обучения нейронных сетей, в том числе алгоритм обратного распространения ошибки, применяемый для обучения глубоких нейронных сетей. Описывается развитие архитектур нейронных сетей: неокогнитрон, автокодировщики, сверточные нейронные сети, ограниченная машина Больцмана, глубокие сети доверия, сети долго-краткосрочной памяти, управляемые рекуррентные нейронные сети и сети остаточного обучения. Глубокие нейронные сети с большим количеством скрытых слоев трудно обучать из-за проблемы исчезающего градиента. В статье рассматриваются методы решения этой проблемы, которые позволяют успешно обучать глубокие нейронные сети с более чем ста слоями. Приводится обзор популярных библиотек глубокого обучения нейронных сетей, которые сделали возможным широкое практическое применение данной технологии. В настоящее время для задач компьютерного зрения используются сверточные нейронные сети, а для обработки последовательностей, в том числе естественного языка, — рекуррентные нейронные сети, прежде всего сети долго-краткосрочной памяти и управляемые рекуррентные нейронные сети. At present, deep learning is becoming one of the most popular approach to creation of the artificial intelligences systems such as speech recognition, natural language processing, computer vision and so on. The paper presents a historical overview of deep learning in neural networks. The model of the artificial neural network is described as well as the learning algorithms for neural networks including the error backpropagation algorithm, Обзор методов обучения глубоких нейронных сетей 50 Вестник ЮУрГУ. Серия «Вычислительная математика и информатика» which is used to train deep neural networks. The development of neural networks architectures is presented including neocognitron, autoencoders, convolutional neural networks, restricted Boltzmann machine, deep belief networks, long short-term memory, gated recurrent neural networks, and residual networks. Training deep neural networks with many hidden layers is impeded by the vanishing gradient problem. The paper describes the approaches to solve this problem that provide the ability to train neural networks with more than hundred layers. An overview of popular deep learning libraries is presented. Nowadays, for computer vision tasks convolutional neural networks are utilized, while for sequence processing, including natural language processing, recurrent networks are preferred solution, primarily long short-term memory networks and gated recurrent neural networks.	ru_RU
dc.description.sponsorship	Работа поддержана проектом УрО РАН № 15-7-1-8.	ru_RU
dc.language.iso	other	ru_RU
dc.publisher	Издательский центр ЮУрГУ	ru_RU
dc.relation.ispartof	Вестник ЮУрГу. Серия Вычислительная математика и информатика	ru
dc.relation.ispartof	Bulletin of South Ural State University. Series 'Computational mathematics and software engineering"	en
dc.relation.ispartofseries	Вычислительная математика и информатика;Том 6
dc.subject	УДК 004.85	ru_RU
dc.subject	глубокое обучение	ru_RU
dc.subject	нейронные сети	ru_RU
dc.subject	машинное обучение	ru_RU
dc.subject	deep learning	ru_RU
dc.subject	neural networks	ru_RU
dc.subject	machine learning	ru_RU
dc.title	Обзор методов обучения глубоких нейронных сетей	ru_RU
dc.title.alternative	An Overview of Methods for Deep Learning in Neural Networks	ru_RU
dc.type	Article	ru_RU
dc.identifier.doi	DOI: 10.14529/cmse170303