Аннотации:
Предложен метод классификации нестационарных потоковых данных. К таким данным относятся характеристики поведения сложных систем, процессы, обладающие высокой степенью стохастичности, такие как скорость ветра. В данной работе предложена эффективная модификация алгоритма случайного леса, позволяющая повысить точность классификации состояния путем взвешивания ответов отдельных классификаторов композиции. Опираясь на метод Accuracy Weighted Ensemble (AWE), взвешивание производится в соответствии с оценкой ошибки каждого классификатора на новых данных. Такая оценка производится с использованием метода к ближайших соседей и внутренней структуры случайного леса. В качестве стратегии обновления композиции используется замена классификаторов с низкой точностью на новых данных. Приводятся результаты тестирования предложенного метода и сравнение с другими современными методами. In this paper concept drift classification method was presented. Concept drift methods have potential in complex systems analysis and other processes which have stochastic nature like wind power. We present decision tree ensemble classification method based on the Random Forest algorithm for concept drift. Inspired by Accuracy Weighted Ensemble (AWE) method the weighted majority voting ensemble aggregation rule is employed. Base learner weight in our case is computed for each sample evaluation using base learners accuracy and intrinsic proximity measure of Random Forest. Our algorithm exploits ensemble pruning as a forgetting strategy. We present results of empirical comparison of our method and other state-of-the-art concept drift classifiers.
Описание:
Алексей Витальевич Жуков, аспирант кафедры «Информационные технологии:», Институт математики, экономики и информатики, Иркутский национальный исследовательский технический университет (г. Иркутск, Российская Федерация), zhukovalexl3@gmail.com.
Денис Николаевич Сидоров, доктор физико-математических наук, ведущий научный сотрудник, Институт систем энергетики им. Л.А. Мелентьева СО РАН; профессор, кафедра «Информационные технологии», Институт математики, экономики и информатики Иркутского государственного университета; Иркутский национальный исследовательский технический университет (г. Иркутск, Российская Федерация), contact.dns@gmail.com.
A.V. Zhukov, Institute of Mathematisc, Economics and Computer Science, Irkutsk State University, Irkutsk, Russian Federation, zhukovalexl3@gmail.com,
D.N. Sidorov, Melentiev Energy Systems Institute, Siberian Branch of Russian Academy of Sciences, Irkutsk State University, Irkutsk National Research Technical University, Irkutsk, Russian Federation, dsidorov@isem.irk.ru