Аннотации:
В настоящей статье представлен опыт разработки программного инструмента ПАнТ – многофункциональной платформы для создания концептуально аннотированных корпусов текстов, необходимого ресурса компьютерных технологий обработки неструктурированной информации. Платформа ПАнТ разработана на основе лингвистической базы знаний, что допускает различные уровни аннотирования. Инструмент многофункционален и имеет гибкие настройки, которые
обеспечивают ее адаптацию к многоязычным текстам различных предметных областей и возможность использования как для процесса аннотирования, так и для совершенствования базы знаний. В настоящей статье методология разработки платформы представлена на примере ее версии, ориентированной на концептуальное аннотирование текстов предметной области «Терроризм» на русском, английском и французском языках. Обсуждается применение альфа-версии ПАнТ в рамках реального проекта по созданию аннотационных ресурсов указанной предметной области; при этом демонстрируется сокращение общего времени на создание качественно аннотированных корпусов текстов («золотого стандарта»). This paper presents an experience of creating the PAnT software tool, a platform for conceptual annotation of multilingual texts, a prerequisite for automated processing of unstructured information. The PAnT platform is supported by linguistic knowledge, which allows various levels of annotation. The tool is multifunctional and has flexible settings that ensure its adaptation to multilingual texts of various domains. PAnT can be used both for the automation of the annotation process as such and for linguistic knowledge acquisition and administration. In this paper, the platform and the methodology of its development are presented on the example of its version, tuned for the conceptual annotation of the “Terrorism” domain corpora in Russian, English and French. The use of PAnT as part of a real annotation project is discussed demonstrating a reduction in the total time and human effort necessary for annotating texts up to the gold standard.
Описание:
Шереметьева Светлана Олеговна, доктор филологических наук, доцент, профессор кафедры лингвистики и перевода, Южно-Уральский государственный университет (Челябинск), sheremetevaso@susu.ru
Бабина Ольга Ивановна, кандидат филологических наук, доцент, доцент кафедры лингвистики и перевода, Южно-Уральский государственный университет (Челябинск), babinaoi@susu.ru
Svetlana O. Sheremetyeva, PhD (Habilitation), professor of the Department of Linguistics and Translation Studies, South Ural State University (Chelyabinsk), sheremetevaso@susu.ru
Olga I. Babina, PhD, associate professor of the Department of Linguistics and Translation Studies, South Ural State University (Chelyabinsk), babinaoi@susu.ru