Показать сокращенную информацию
dc.contributor.author | Фаткулин, Б. Г. | |
dc.contributor.author | Fatkulin, B. G. | |
dc.date.accessioned | 2016-07-01T06:19:52Z | |
dc.date.available | 2016-07-01T06:19:52Z | |
dc.date.issued | 2015 | |
dc.identifier.citation | Фаткулин, Б. Г. Использование лингвистически ориентированных модулей на языке Python для обработки больших текстовых массивов на восточных языках в целях эффективного сбора и обработки данных по отраслям востоковедческой тематики (на примере NLTK) / Б. Г. Фаткулин // Вестник ЮУрГУ. Серия Лингвистика.- 2015.- Т. 12. № 1.- С. 72-75.- Библиогр.: с. 74 (6 назв.) | ru_RU |
dc.identifier.issn | 1991-9751 | |
dc.identifier.uri | http://dspace.susu.ac.ru/xmlui/handle/0001.74/6864 | |
dc.description | Фаткулин Булат Гилимдарович, кандидат филологических наук, доцент кафедры общей лингвистики, Южно-Уральский государственный университет (Челябинск), bfatkulin@gmail.com. B.G. Fatkulin, South Ural State University, Chelyabinsk, Russian Federation, bfatkulin@gmail.com | ru_RU |
dc.description.abstract | Проведен анализ современного лингвистически ориентированного программного обеспечения, созданного в рамках языка программирования Python. В качестве примера выбран комплекс программных модулей Natural Language Toolkit (NLTK). В статье также рассматриваются не только общие принципы работы NLTK, но и их особенности в применении к восточным языкам: фарси, арабскому и китайскому. Показано решение для работы с текстами на восточных языках в кодировке utf-8. This article analyzes the contemporary linguistically oriented software created on the basis of the programming language Python. The Natural Language Toolkit (NLTK) is selected as an example. The research considers not only the general principles of the NLTK but also the principles especially applied to the eastern languages: Farsi, Arabic and Chinese. The author shows certain solutions for work with texts in Unicode as input-output for Python text processing modules. | ru_RU |
dc.language.iso | other | ru_RU |
dc.publisher | Издательский центр ЮУрГУ | ru_RU |
dc.relation.ispartofseries | Лингвистика;Том 12 | |
dc.subject | УДК 81’33 | ru_RU |
dc.subject | NLTK | ru_RU |
dc.subject | восточные языки | ru_RU |
dc.subject | модули Python | ru_RU |
dc.subject | обработка естественных языков | ru_RU |
dc.subject | код | ru_RU |
dc.subject | кодировка utf-8 | ru_RU |
dc.subject | большие данные | ru_RU |
dc.subject | UNIX | ru_RU |
dc.subject | eastern language | ru_RU |
dc.subject | modules Python | ru_RU |
dc.subject | natural language processing | ru_RU |
dc.subject | code | ru_RU |
dc.subject | encoding utf-8 | ru_RU |
dc.subject | big data | ru_RU |
dc.subject | УДК 811.58'33 | ru_RU |
dc.subject | УДК 81’322.2 | ru_RU |
dc.subject | ГРНТИ 16.21 | ru_RU |
dc.title | Использование лингвистически ориентированных модулей на языке Python для обработки больших текстовых массивов на восточных языках в целях эффективного сбора и обработки данных по отраслям востоковедческой тематики (на примере NLTK) | ru_RU |
dc.title.alternative | Use of the linguistically oriented Python language modules for handling large texts in the eastern languages in order to mine the orientalistics data (with NLTK module taken as an example) | ru_RU |
dc.type | Article | ru_RU |