Репозиторий Dspace

Optimization of Classifiers Ensemble Construction: Case Study of Educational Data Mining

Показать сокращенную информацию

dc.contributor.author Salal, Y.K.
dc.contributor.author Abdullaev, S.M.
dc.contributor.author Салал, Я.К.
dc.contributor.author Абдуллаев, С.М.
dc.date.accessioned 2021-08-20T06:41:25Z
dc.date.available 2021-08-20T06:41:25Z
dc.date.issued 2019
dc.identifier.citation Salal Y.K., Abdullaev S.M. Optimization of Classifiers Ensemble Construction: Case Study of Educational Data Mining. Bulletin of the South Ural State University. Ser. Computer Technologies, Automatic Control, Radio Electronics, 2019, vol. 19, no. 4, pp. 139-143. DOI: 10.14529/ctcr190414. Salal, Y.K. Optimization of Classifiers Ensemble Construction: Case Study of Educational Data Mining / Y.K. Salal, S.M. Abdullaev // Вестник ЮУрГУ. Серия «Компьютерные технологии, управление, радиоэлектроника ». - 2019. - Т. 19, № 4. - С. 139-143. DOI: 10.14529/ctcrl 90414 ru_RU
dc.identifier.issn 2409-6571
dc.identifier.uri http://dspace.susu.ru/xmlui/handle/0001.74/40611
dc.description Y.K. Salal, Yasskhudheirsalal@gmail.com, S.M. Abdullaev, abdullaevsm@susu.ru South Ural State University, Chelyabinsk, Russian Federation. Салал Ясс Кхудейр, аспирант кафедры системного программирования, Южно-Уральский государственный университет, г. Челябинск; Yasskhudheirsalal@gmail.com. Абдуллаев Санжар Муталович, д-р геогр. наук, профессор кафедры системного программирования, Южно-Уральский государственный университет, г. Челябинск; abdullaevsm@susu.ru. ru_RU
dc.description.abstract The choosing the best prediction method of education results is major challenge of Educational Data Mining (EDM). This EDM paper compares the results of student's performance forecast produced by the individual binary classifiers (Naive Bayes, Decision Tree, Multi-Layer Perceptron, Nearest Neighbors, Support Vector Machine algorithms) and their ensembles, which are trained (tested) on dataset containing up to 38 input attributes (weekly attendance in mathematics, the intensity of study, interim assessment) of 84 (36) secondary school students from Nasiriyah, Iraq. The two-class school performance was predicted - passing or not passing on final exam. Three following stages of comparison were completed. At the first stage of the experiment, the dependence of classifiers from the input attributes was investigated. It was shown that the forecast accuracy rises from 61.1-77.7% when all 38 attributes were used, to 75.0-80.5%, if base classifier trained with five attributes pre-selected by Ranker Search method. Then, in second stage, to each of the base classifier the AdaBoost Ml procedure has been applied and five homogenous ensembles were created. And only two of these ensembles demonstrated small rise of 3% in accuracy comparing to corresponding stand-alone classifier, but the overall maximal prediction accuracy of 80.5% stayed the same. Finally, comparing the accuracies of 77.7% and 83.3% achieved by the heterogeneous ensemble consisted of five simple voting base classifiers and by the heterogeneous meta-ensemble of five simple voting AdaBoost homogenous ensembles correspondingly, we conclude that improvement of the quality of the individual classifier or homogeneous ensembles allows to construct more powerful EDM prediction methods. Сравниваются результаты прогнозирования итогов обучения бинарных классификаторов и их ансамблей с использованием пяти алгоритмов машинного обучения: Naive Bayes, Decision Tree, Multi-Layer Perceptron, Nearest Neighbors, Support Vector Machine. Все классификаторы обучались (тестировались) на наборе данных, содержащих до 38 входных атрибутов, отражавших посещаемость уроков по математике, интенсивность обучения и промежуточные оценки 84 (36) учащихся средних школ из города Эн-Насирии, Ирак; прогнозировалось два класса их оценок на экзамене по математике. Эксперимент проводился в три этапа. Сначала было показано, что точность прогнозов классификаторов поднимается с 61,1-77,7 %, при использовании всего набора атрибутов, до 75,0-80,5 %, когда классификаторы обучались на данных из пяти атрибутов, выбранных методом ранжирования Ranker Search. Затем на втором этапе к каждому из этих слабых классификаторов была применена процедура бустинга AdaBoost M1 и были созданы пять однородных ансамблей. Некоторые из этих ансамблей демонстрировали 3%-ный рост точности, но их максимальная точность не превышала точности лучшего автономного классификатора (80,5 %). Тем не менее сравнение точности гетерогенного ансамбля, состоявшего из базовых классификаторов, обученных на ранжированных атрибутах (77,7 %), и мета-ансамбля, состоявшего из пяти однородных ансамблей AdaBoost (83,3 %), позволяет сделать вывод, что улучшение качества отдельных классификаторов и составление из них гетерогенных ансамблей позволяет построить более мощные методы анализа образовательных данных. ru_RU
dc.language.iso en ru_RU
dc.publisher Издательский центр ЮУрГУ ru_RU
dc.relation.ispartof Вестник ЮУрГУ. Серия Компьютерные технологии, управление, радиоэлектроника ru
dc.relation.ispartof Vestnik Yuzhno-Ural'skogo Gosudarstvennogo Universiteta. Seriya Kompjuternye tekhnologii, upravlenie, radioelektronika en
dc.relation.ispartof Bulletin of SUSU. Ser. Computer Technologies, Automatic Control, Radio Electronics en
dc.relation.ispartofseries Компьютерные технологии, управление, радиоэлектроника;Том 19
dc.subject УДК 004.8 ru_RU
dc.subject УДК 004.9 ru_RU
dc.subject base classifiers ru_RU
dc.subject educational data mining ru_RU
dc.subject ranker search method ru_RU
dc.subject adaptive boosting ru_RU
dc.subject heterogeneous ensembles ru_RU
dc.subject базовый классификатор ru_RU
dc.subject интеллектуальный анализ образовательных данных ru_RU
dc.subject метод селекции атрибутов Ranker Search ru_RU
dc.subject AdaBoost ru_RU
dc.subject гетерогенные ансамбли ru_RU
dc.title Optimization of Classifiers Ensemble Construction: Case Study of Educational Data Mining ru_RU
dc.title.alternative Оптимизация конструкции ансамбля классификаторов: пример интеллектуального анализа образовательных данных ru_RU
dc.type Article ru_RU
dc.identifier.doi DOI: 10.14529/ctcr190414


Файлы в этом документе

Данный элемент включен в следующие коллекции

Показать сокращенную информацию

Поиск в DSpace


Расширенный поиск

Просмотр

Моя учетная запись