Репозиторий Dspace

Модификация алгоритма случайного леса для классификации нестационарных потоковых данных

Показать сокращенную информацию

dc.contributor.author Жуков, А.В.
dc.contributor.author Сидоров, Д.Н.
dc.contributor.author Zhukov, A.V.
dc.contributor.author Sidorov, D.N.
dc.date.accessioned 2021-05-13T08:27:44Z
dc.date.available 2021-05-13T08:27:44Z
dc.date.issued 2016
dc.identifier.citation Жуков, А.В. Модификация алгоритма случайного леса для классификации нестационарных потоковых данных / А.В. Жуков, Д.Н. Сидоров // Вестник ЮУрГУ. Серия «Математическое моделирование и программирование». – 2016. – Т. 9, № 4. – С. 86–95. DOI: 10.14529/mmр160408 ru_RU
dc.identifier.issn 2308-0256
dc.identifier.uri http://dspace.susu.ru/xmlui/handle/0001.74/34872
dc.description Алексей Витальевич Жуков, аспирант кафедры «Информационные технологии:», Институт математики, экономики и информатики, Иркутский национальный исследовательский технический университет (г. Иркутск, Российская Федерация), zhukovalexl3@gmail.com. Денис Николаевич Сидоров, доктор физико-математических наук, ведущий научный сотрудник, Институт систем энергетики им. Л.А. Мелентьева СО РАН; профессор, кафедра «Информационные технологии», Институт математики, экономики и информатики Иркутского государственного университета; Иркутский национальный исследовательский технический университет (г. Иркутск, Российская Федерация), contact.dns@gmail.com. A.V. Zhukov, Institute of Mathematisc, Economics and Computer Science, Irkutsk State University, Irkutsk, Russian Federation, zhukovalexl3@gmail.com, D.N. Sidorov, Melentiev Energy Systems Institute, Siberian Branch of Russian Academy of Sciences, Irkutsk State University, Irkutsk National Research Technical University, Irkutsk, Russian Federation, dsidorov@isem.irk.ru ru_RU
dc.description.abstract Предложен метод классификации нестационарных потоковых данных. К таким данным относятся характеристики поведения сложных систем, процессы, обладающие высокой степенью стохастичности, такие как скорость ветра. В данной работе предложена эффективная модификация алгоритма случайного леса, позволяющая повысить точность классификации состояния путем взвешивания ответов отдельных классификаторов композиции. Опираясь на метод Accuracy Weighted Ensemble (AWE), взвешивание производится в соответствии с оценкой ошибки каждого классификатора на новых данных. Такая оценка производится с использованием метода к ближайших соседей и внутренней структуры случайного леса. В качестве стратегии обновления композиции используется замена классификаторов с низкой точностью на новых данных. Приводятся результаты тестирования предложенного метода и сравнение с другими современными методами. In this paper concept drift classification method was presented. Concept drift methods have potential in complex systems analysis and other processes which have stochastic nature like wind power. We present decision tree ensemble classification method based on the Random Forest algorithm for concept drift. Inspired by Accuracy Weighted Ensemble (AWE) method the weighted majority voting ensemble aggregation rule is employed. Base learner weight in our case is computed for each sample evaluation using base learners accuracy and intrinsic proximity measure of Random Forest. Our algorithm exploits ensemble pruning as a forgetting strategy. We present results of empirical comparison of our method and other state-of-the-art concept drift classifiers. ru_RU
dc.description.sponsorship Данная работа поддержана грантом, Российского научного фонда 14-19-00054 ru_RU
dc.language.iso other ru_RU
dc.publisher Издательский центр ЮУрГУ ru_RU
dc.relation.isformatof Вестник ЮУрГУ. Серия Математическое моделирование и программирование ru_RU
dc.relation.isformatof Vestnik Yuzhno-Ural'skogo Gosudarstvennogo Universiteta. Seriya Matematicheskoe modelirovanie i programmirovanie ru_RU
dc.relation.isformatof Bulletin of SUSU ru_RU
dc.relation.isformatof Ser. Mathematical Modelling, Programming & Computer Software
dc.relation.ispartofseries Математическое моделирование и программирование;Т. 9
dc.subject УДК 004.855.5 ru_RU
dc.subject классификация ru_RU
dc.subject смещение концепта ru_RU
dc.subject случайный лес ru_RU
dc.subject решающие деревья ru_RU
dc.subject композиции ru_RU
dc.subject decision tree ru_RU
dc.subject concept drift ru_RU
dc.subject ensemble learning ru_RU
dc.subject classification ru_RU
dc.subject random ru_RU
dc.subject forest ru_RU
dc.title Модификация алгоритма случайного леса для классификации нестационарных потоковых данных ru_RU
dc.title.alternative Modification of random forest based approach for streaming data with concept drift ru_RU
dc.type Article ru_RU
dc.identifier.doi DOI: 10.14529/mmр160408


Файлы в этом документе

Данный элемент включен в следующие коллекции

Показать сокращенную информацию

Поиск в DSpace


Расширенный поиск

Просмотр

Моя учетная запись