Аннотации:
В условиях роста объема открытого образовательного контента, повышения требований к профессиональному образованию со стороны рынка труда, развития концепции обучения в течение всей жизни (Lifelong Learning) сегодня крайне актуальной является задача регулярного
обновления содержания образовательных программ и отдельных дисциплин. В статье рассматривается
метод семантического поиска образовательного контента под заданные требования
рынка труда, определяемые профессиональными стандартами. В отличие от традиционных
подходов сопоставления и анализа содержания образовательных программ, основанных
на онтологических моделях и правилах, предлагается использовать подход к распределенному
представлению слов (word embeddings) с помощью известных нейросетевых моделей языка word2vec и fastText. В качестве исходных запросов выступают фрагменты профессиональных
стандартов - конкретные требования к знаниям, умениям и описания трудовых действий
и трудовых функций, а в качестве искомых документов - описания учебных дисциплин и онлайн-курсов, включающие аннотацию, результаты обучения, структуру и содержание основных
тем. Приводятся данные экспертной оценки качества ранжирования по метрике NDCG (Normalized Discounted Cumulative Gain) и точности семантического поиска по метрике MAP (Mean Average Precision) на представительном корпусе программ учебных дисциплин вузов
по ИТ-направлениям и массовых открытых онлайн-курсов. Лучшие результаты для поиска показывают модели word2vec и fastText, обучаемые без учителя на больших специально подготовленных
корпусах текстов программ учебных дисциплин и описаний онлайн-курсов. Для перехода
от векторов слов к векторам текстов исследуются разные способы усреднения векторов слов, полученных от нейросетевых моделей, в сочетании с векторной моделью TF-IDF. With the growth of open educational content, growing demand for professional education from the labor market, and the development of the concept of lifelong learning, the task of updating the content of educational programs today is extremely important. The article discusses the semantic search method to retrieval and ranking of educational content for the specified requirements of the labor market, determined by professional standards. In contrast to traditional approaches of matching and analyzing the content of educational programs based on ontological models and rules, we propose the usage of word embedding and well-known neural network language models word2vec and fastText. The initial requests are specific requirements for knowledge, skills and descriptions
of labor activities and labor functions extracted from professional standards. The search results are the descriptions of academic disciplines and online courses, including goals and objectives,
learning outcomes, the structure and content of the main topics. We include the results of the expert evaluation of the ranking quality for the semantic search by metrics NDCG (Normalized Discounted Cumulative Gain) and MAP (Mean Average Precision) on the representative corpus of IT disciplines programmes of universities and massive open online courses (MOOC). The best results
for the search are shown by the word2vec and fastText models, which are trained without supervision
on large specially prepared corpuses of curriculum programs and descriptions of online courses. To move from word vectors to document vectors various combinations of neural network models with the TF-IDF weighting scheme are investigated.
Описание:
Ботов Дмитрий Сергеевич, старший преподаватель кафедры информационных технологий
и экономической информатики, Челябинский государственный университет, г. Челябинск; dmbotov@gmail .com.
Дмитрин Юрий Владиславович, аспирант кафедры информационных технологий и экономической
информатики, Челябинский государственный университет, г. Челябинск; dmitrinyuri@ gmail.com.
Кленин Юлий Дмитриевич, аспирант кафедры информационных технологий и экономической
информатики, Челябинский государственный университет, г. Челябинск; jklen@yandex.ru. D.S. Botov, dmbotov@gmail.com,
Yu.V. Dmitrin, dmitrinyun@gmail.com,
Yu.D. Klenin, jklen@yandex.ru
Chelyabinsk State University, Chelyabinsk, Russian Federation