Репозиторий Dspace

Проблемы формирования обучающей выборки в задачах машинного обучения

Показать сокращенную информацию

dc.contributor.author Кафтанников, И.Л.
dc.contributor.author Парасич, А.В.
dc.contributor.author Kaftannikov, I.L.
dc.contributor.author Parasich, A.V.
dc.date.accessioned 2019-12-03T08:50:32Z
dc.date.available 2019-12-03T08:50:32Z
dc.date.issued 2016
dc.identifier.citation Кафтанников, И.Л. Проблемы формирования обучающей выборки в задачах машинного обучения / И.Л. Кафтанников, А.В. Парасич // Вестник ЮУрГУ. Серия «Компьютерные технологии, управление, радиоэлектроника». – 2016. – Т. 16, № 3. – С. 15–24. DOI: 10.14529/ctcr160302. Kaftannikov I.L., Parasich A.V. Problems of Training Set’s Formation in Machine Learning Tasks. Bulletin of the South Ural State University. Ser. Computer Technologies, Automatic Control, Radio Electronics, 2016, vol. 16, no. 3, pp. 15–24. (in Russ.) DOI: 10.14529/ctcr160302 ru_RU
dc.identifier.issn 1991-976X
dc.identifier.issn 2409-6571
dc.identifier.uri http://dspace.susu.ru/xmlui/handle/0001.74/26613
dc.description Кафтанников Игорь Леопольдович, канд. техн. наук, доцент кафедры электронных вычислительных машин, Южно-Уральский государственный университет, г. Челябинск; kil7491@mail.ru. Парасич Андрей Викторович, аспирант кафедры электронных вычислительных машин, Южно-Уральский государственный университет, г. Челябинск; parasichav@yandex.ru. I.L. Kaftannikov, kil7491@mail.ru, A.V. Parasich, parasichav@yandex.ru South Ural State University, Chelyabinsk, Russian Federation ru_RU
dc.description.abstract Правильное формирование обучающей выборки часто имеет решающее значение в задачах машинного обучения, что признаётся большинством специалистов в данной области. Зачастую решение задач машинного обучения сводится к грамотному формированию обучающей выборки. Несмотря на это, в современной литературе по машинному обучению вопросам формирования обучающей выборки почти не уделяется внимание, теоретическая база практически отсутствует. В настоящей статье постараемся исправить данный недостаток. В статье исследуются возможные проблемы и ошибки при формировании обучающей выборки, обобщается опыт авторов в решении задач машинного обучения, предлагаются теоретические модели для описания явлений, связанных с формированием множества обучающих данных, приводятся методы улучшения обучающей выборки. Даются практические рекомендации на основе разработанных теоретических моделей. В конце статьи представлены результаты экспериментов, демонстрирующие некоторые из проблем формирования обучающей выборки и методы их решения на примере задачи обучения деревьев решений. Proper formation of the training set is often crucial in the problems of machine learning, that is recognized by most experts in machine learning, often solving machine learning problems is reduced to the competent formation of the training set. Despite this, in the modern literature on machine learning these issues given undeservedly little attention, although often it is the correct formation of the training set is crucial for solving practical problems, theoretical basis practically absent. This article is intended to correct this shortcoming. The article examines the potential problems and errors in the formation of a training set, summarizes the author’s experience in solving machine learning tasks, offers a models for describing the phenomena, associated with the formation of a training set, methods for improving the training set are given. Practical recommendations, based on these theoretical models, are given. At the end of the article shows the experimental results demonstrating some of the problems of training set formation and methods for their solution by the example of learning a decision trees. ru_RU
dc.language.iso other ru_RU
dc.publisher Издательский центр ЮУрГУ ru_RU
dc.relation.ispartof Вестник ЮУрГУ. Серия Компьютерные технологии, управление, радиоэлектроника ru
dc.relation.ispartof Vestnik Yuzhno-Ural'skogo Gosudarstvennogo Universiteta. Seriya Kompjuternye tekhnologii, upravlenie, radioelektronika en
dc.relation.ispartof Bulletin of SUSU en
dc.relation.ispartofseries Компьютерные технологии, управление, радиоэлектроника;Том 16
dc.subject УДК 004.855.5 ru_RU
dc.subject машинное обучение ru_RU
dc.subject глубокие нейронные сети ru_RU
dc.subject деревья решений ru_RU
dc.subject обучающая выборка ru_RU
dc.subject machine learning ru_RU
dc.subject deep neural networks ru_RU
dc.subject decision trees ru_RU
dc.subject training set ru_RU
dc.title Проблемы формирования обучающей выборки в задачах машинного обучения ru_RU
dc.title.alternative Problems of Training Set’s Formation in Machine Learning Tasks ru_RU
dc.type Article ru_RU
dc.identifier.doi DOI: 10.14529/ctcr160302


Файлы в этом документе

Данный элемент включен в следующие коллекции

Показать сокращенную информацию

Поиск в DSpace


Расширенный поиск

Просмотр

Моя учетная запись