Аннотации:
Интеллектуальный тренд-майнинг (автоматизированое выявление тенденций) из неструктурированных текстовых информационных потоков, имеет важное значение для прогнозирования и стратегического планирования. К настоящему времени исследования в области интеллектуального тренд-майнинга в связи со сложностью глубокого автоматического анализа текстов представляют собой набор узкоспециализированных методов и инструментов, не обеспечивая методологической базы и информационно-технологического ресурса для их экстраполяции на новые предметные области и языки. В настоящей статье дается обзор наиболее представительных в области исследований и делается попытка систематизировать основные направления и методы решения конкретных задач, возникающих при разработке технологий, связанных с интеллектуальной экстракцией тенденций, конечной целью которой является обработка изменений в коллекциях текстов, содержательная интерпретация выявленных изменений и представление их пользователю в «читабельной» форме. Приводятся основные этапы обработки текстов при интеллектуальной экстракции тенденций, подчеркивается связь тренд-майнинга с контентанализом и необходимость разработки не зависящих от конкретного языка методов интеллектуального тренмайнинга, рассматривается роль специализированных онтологий как основного ресурса для достижения этой цели. Рассматриваются наиболее релевантные методики автоматической генерации текстов, представляющих результаты тренд-майнинга. Intelligent trend-mining (automated trend detection) from unstructured textual information flows is essential for forecasting and strategic planning. To date, research in the field, due to the complexity of deep automated text analysis, is represented by a set of highly specialized methods and tools. Currently there is no methodological basis or software for them to be ported to new domains and languages. This article provides an overview of the most representative works in the field of intellectual trend-mining and attempts to systematize the main approaches and methods to solve particular problems arising in the development of intellectual trend-mining technologies, the ultimate goal of which is processing changes in text collections, meaningful interpretation of the detected changes and generation of “readable” reports. Summarized are the main stages of intellectual text analysis when extracting trends. Interrelation between trend-mining and content analysis is underlined. Special emphasis is made on the need to develop language-independent trend-mining techniques, specialized ontologies being recognized as a valuable resource to achieve this goal. The most relevant techniques for trend-mining report generation are considered.
Описание:
Шереметьева Светлана Олеговна, доктор филологических наук, профессор кафедры лингвистики и перевода, Институт лингвистики и международных коммуникаций, Южно-Уральский государственный университет (Челябинск), sheremetevaso@susu.ru
Svetlana O. Sheremetyeva, Doc. of sc., professor of the Linguistics and translation department, Institute of Linguistics and Intercultural Communication, South Ural State University (Chelyabinsk), sheremetevaso@susu.ru