Репозиторий Dspace

Использование лингвистически ориентированных модулей на языке Python для обработки больших текстовых массивов на восточных языках в целях эффективного сбора и обработки данных по отраслям востоковедческой тематики (на примере NLTK)

Показать сокращенную информацию

dc.contributor.author Фаткулин, Б. Г.
dc.contributor.author Fatkulin, B. G.
dc.date.accessioned 2016-07-01T06:19:52Z
dc.date.available 2016-07-01T06:19:52Z
dc.date.issued 2015
dc.identifier.citation Фаткулин, Б. Г. Использование лингвистически ориентированных модулей на языке Python для обработки больших текстовых массивов на восточных языках в целях эффективного сбора и обработки данных по отраслям востоковедческой тематики (на примере NLTK) / Б. Г. Фаткулин // Вестник ЮУрГУ. Серия Лингвистика.- 2015.- Т. 12. № 1.- С. 72-75.- Библиогр.: с. 74 (6 назв.) ru_RU
dc.identifier.issn 1991-9751
dc.identifier.uri http://dspace.susu.ac.ru/xmlui/handle/0001.74/6864
dc.description Фаткулин Булат Гилимдарович, кандидат филологических наук, доцент кафедры общей лингвистики, Южно-Уральский государственный университет (Челябинск), bfatkulin@gmail.com. B.G. Fatkulin, South Ural State University, Chelyabinsk, Russian Federation, bfatkulin@gmail.com ru_RU
dc.description.abstract Проведен анализ современного лингвистически ориентированного программного обеспечения, созданного в рамках языка программирования Python. В качестве примера выбран комплекс программных модулей Natural Language Toolkit (NLTK). В статье также рассматриваются не только общие принципы работы NLTK, но и их особенности в применении к восточным языкам: фарси, арабскому и китайскому. Показано решение для работы с текстами на восточных языках в кодировке utf-8. This article analyzes the contemporary linguistically oriented software created on the basis of the programming language Python. The Natural Language Toolkit (NLTK) is selected as an example. The research considers not only the general principles of the NLTK but also the principles especially applied to the eastern languages: Farsi, Arabic and Chinese. The author shows certain solutions for work with texts in Unicode as input-output for Python text processing modules. ru_RU
dc.language.iso other ru_RU
dc.publisher Издательский центр ЮУрГУ ru_RU
dc.relation.ispartofseries Лингвистика;Том 12
dc.subject УДК 81’33 ru_RU
dc.subject NLTK ru_RU
dc.subject восточные языки ru_RU
dc.subject модули Python ru_RU
dc.subject обработка естественных языков ru_RU
dc.subject код ru_RU
dc.subject кодировка utf-8 ru_RU
dc.subject большие данные ru_RU
dc.subject UNIX ru_RU
dc.subject eastern language ru_RU
dc.subject modules Python ru_RU
dc.subject natural language processing ru_RU
dc.subject code ru_RU
dc.subject encoding utf-8 ru_RU
dc.subject big data ru_RU
dc.subject УДК 811.58'33 ru_RU
dc.subject УДК 81’322.2 ru_RU
dc.subject ГРНТИ 16.21 ru_RU
dc.title Использование лингвистически ориентированных модулей на языке Python для обработки больших текстовых массивов на восточных языках в целях эффективного сбора и обработки данных по отраслям востоковедческой тематики (на примере NLTK) ru_RU
dc.title.alternative Use of the linguistically oriented Python language modules for handling large texts in the eastern languages in order to mine the orientalistics data (with NLTK module taken as an example) ru_RU
dc.type Article ru_RU


Файлы в этом документе

Данный элемент включен в следующие коллекции

Показать сокращенную информацию

Поиск в DSpace


Расширенный поиск

Просмотр

Моя учетная запись