Использование лингвистически ориентированных модулей на языке Python для обработки больших текстовых массивов на восточных языках в целях эффективного сбора и обработки данных по отраслям востоковедческой тематики (на примере NLTK)

Фаткулин, Б. Г.; Fatkulin, B. G.

Использование лингвистически ориентированных модулей на языке Python для обработки больших текстовых массивов на восточных языках в целях эффективного сбора и обработки данных по отраслям востоковедческой тематики (на примере NLTK)

dc.contributor.author	Фаткулин, Б. Г.
dc.contributor.author	Fatkulin, B. G.
dc.date.accessioned	2016-07-01T06:19:52Z
dc.date.available	2016-07-01T06:19:52Z
dc.date.issued	2015
dc.identifier.citation	Фаткулин, Б. Г. Использование лингвистически ориентированных модулей на языке Python для обработки больших текстовых массивов на восточных языках в целях эффективного сбора и обработки данных по отраслям востоковедческой тематики (на примере NLTK) / Б. Г. Фаткулин // Вестник ЮУрГУ. Серия Лингвистика.- 2015.- Т. 12. № 1.- С. 72-75.- Библиогр.: с. 74 (6 назв.)	ru_RU
dc.identifier.issn	1991-9751
dc.identifier.uri	http://dspace.susu.ac.ru/xmlui/handle/0001.74/6864
dc.description	Фаткулин Булат Гилимдарович, кандидат филологических наук, доцент кафедры общей лингвистики, Южно-Уральский государственный университет (Челябинск), bfatkulin@gmail.com. B.G. Fatkulin, South Ural State University, Chelyabinsk, Russian Federation, bfatkulin@gmail.com	ru_RU
dc.description.abstract	Проведен анализ современного лингвистически ориентированного программного обеспечения, созданного в рамках языка программирования Python. В качестве примера выбран комплекс программных модулей Natural Language Toolkit (NLTK). В статье также рассматриваются не только общие принципы работы NLTK, но и их особенности в применении к восточным языкам: фарси, арабскому и китайскому. Показано решение для работы с текстами на восточных языках в кодировке utf-8. This article analyzes the contemporary linguistically oriented software created on the basis of the programming language Python. The Natural Language Toolkit (NLTK) is selected as an example. The research considers not only the general principles of the NLTK but also the principles especially applied to the eastern languages: Farsi, Arabic and Chinese. The author shows certain solutions for work with texts in Unicode as input-output for Python text processing modules.	ru_RU
dc.language.iso	other	ru_RU
dc.publisher	Издательский центр ЮУрГУ	ru_RU
dc.relation.ispartofseries	Лингвистика;Том 12
dc.subject	УДК 81’33	ru_RU
dc.subject	NLTK	ru_RU
dc.subject	восточные языки	ru_RU
dc.subject	модули Python	ru_RU
dc.subject	обработка естественных языков	ru_RU
dc.subject	код	ru_RU
dc.subject	кодировка utf-8	ru_RU
dc.subject	большие данные	ru_RU
dc.subject	UNIX	ru_RU
dc.subject	eastern language	ru_RU
dc.subject	modules Python	ru_RU
dc.subject	natural language processing	ru_RU
dc.subject	code	ru_RU
dc.subject	encoding utf-8	ru_RU
dc.subject	big data	ru_RU
dc.subject	УДК 811.58'33	ru_RU
dc.subject	УДК 81’322.2	ru_RU
dc.subject	ГРНТИ 16.21	ru_RU
dc.title	Использование лингвистически ориентированных модулей на языке Python для обработки больших текстовых массивов на восточных языках в целях эффективного сбора и обработки данных по отраслям востоковедческой тематики (на примере NLTK)	ru_RU
dc.title.alternative	Use of the linguistically oriented Python language modules for handling large texts in the eastern languages in order to mine the orientalistics data (with NLTK module taken as an example)	ru_RU
dc.type	Article	ru_RU