Репозиторий Dspace

Обзор методов обучения глубоких нейронных сетей

Показать сокращенную информацию

dc.contributor.author Созыкин, А.В.
dc.contributor.author Sozykin, A.V.
dc.date.accessioned 2019-11-26T08:02:12Z
dc.date.available 2019-11-26T08:02:12Z
dc.date.issued 2017
dc.identifier.citation Созыкин А.В. Обзор методов обучения глубоких нейронных сетей // Вестник ЮУрГУ. Серия: Вычислительная математика и информатика. 2017. Т. 6, № 3. С. 28–59. DOI: 10.14529/cmse170303. Sozykin A.V. An Overview of Methods for Deep Learning in Neural Networks.. Bulletin of the South Ural State University. Series: Computational Mathematics and Software Engineering. 2017. vol. 6, no. 3. pp. 28–59. (in Russian) DOI: 10.14529/cmse170303. ru_RU
dc.identifier.issn 2305-9052
dc.identifier.issn 2410-7034
dc.identifier.uri http://dspace.susu.ru/xmlui/handle/0001.74/26543
dc.description Созыкин Андрей Владимирович, к.т.н., зав. отделом вычислительной техники, Институт математики и механики им. Н.Н.Красовского УрО РАН, зав. кафедрой, высокопроизводительных компьютерных технологий, Уральский федеральный университет (Екатеринбург, Российская Федерация). A.V. Sozykin N.N. Krasovskii Institute of Mathematics and Mechanics (S.Kovalevskaya str. 16, Yekaterinburg, 620990 Russia), Ural Federal University (Mira str. 19, Yekaterinburg, 620002 Russia) E-mail: avs@imm.uran.ru ru_RU
dc.description.abstract Глубокие нейронные сети в настоящее время становятся одним из самых популярных подходов к созданию систем искусственного интеллекта, таких как распознавание речи, обработка естественного языка, компьютерное зрение и т.п. В статье представлен обзор истории развития и современного состояния методов обучению глубоких нейронных сетей. Рассматривается модель искусственной нейронной сети, алгоритмы обучения нейронных сетей, в том числе алгоритм обратного распространения ошибки, применяемый для обучения глубоких нейронных сетей. Описывается развитие архитектур нейронных сетей: неокогнитрон, автокодировщики, сверточные нейронные сети, ограниченная машина Больцмана, глубокие сети доверия, сети долго-краткосрочной памяти, управляемые рекуррентные нейронные сети и сети остаточного обучения. Глубокие нейронные сети с большим количеством скрытых слоев трудно обучать из-за проблемы исчезающего градиента. В статье рассматриваются методы решения этой проблемы, которые позволяют успешно обучать глубокие нейронные сети с более чем ста слоями. Приводится обзор популярных библиотек глубокого обучения нейронных сетей, которые сделали возможным широкое практическое применение данной технологии. В настоящее время для задач компьютерного зрения используются сверточные нейронные сети, а для обработки последовательностей, в том числе естественного языка, — рекуррентные нейронные сети, прежде всего сети долго-краткосрочной памяти и управляемые рекуррентные нейронные сети. At present, deep learning is becoming one of the most popular approach to creation of the artificial intelligences systems such as speech recognition, natural language processing, computer vision and so on. The paper presents a historical overview of deep learning in neural networks. The model of the artificial neural network is described as well as the learning algorithms for neural networks including the error backpropagation algorithm, Обзор методов обучения глубоких нейронных сетей 50 Вестник ЮУрГУ. Серия «Вычислительная математика и информатика» which is used to train deep neural networks. The development of neural networks architectures is presented including neocognitron, autoencoders, convolutional neural networks, restricted Boltzmann machine, deep belief networks, long short-term memory, gated recurrent neural networks, and residual networks. Training deep neural networks with many hidden layers is impeded by the vanishing gradient problem. The paper describes the approaches to solve this problem that provide the ability to train neural networks with more than hundred layers. An overview of popular deep learning libraries is presented. Nowadays, for computer vision tasks convolutional neural networks are utilized, while for sequence processing, including natural language processing, recurrent networks are preferred solution, primarily long short-term memory networks and gated recurrent neural networks. ru_RU
dc.description.sponsorship Работа поддержана проектом УрО РАН № 15-7-1-8. ru_RU
dc.language.iso other ru_RU
dc.publisher Издательский центр ЮУрГУ ru_RU
dc.relation.ispartof Вестник ЮУрГу. Серия Вычислительная математика и информатика ru
dc.relation.ispartof Bulletin of South Ural State University. Series 'Computational mathematics and software engineering" en
dc.relation.ispartofseries Вычислительная математика и информатика;Том 6
dc.subject УДК 004.85 ru_RU
dc.subject глубокое обучение ru_RU
dc.subject нейронные сети ru_RU
dc.subject машинное обучение ru_RU
dc.subject deep learning ru_RU
dc.subject neural networks ru_RU
dc.subject machine learning ru_RU
dc.title Обзор методов обучения глубоких нейронных сетей ru_RU
dc.title.alternative An Overview of Methods for Deep Learning in Neural Networks ru_RU
dc.type Article ru_RU
dc.identifier.doi DOI: 10.14529/cmse170303


Файлы в этом документе

Данный элемент включен в следующие коллекции

Показать сокращенную информацию

Поиск в DSpace


Расширенный поиск

Просмотр

Моя учетная запись