Repositorio Dspace

Разработка модифицированного метода Winnowing для агрегирования данных библиографической информации из систем цитирования в условиях неполной информации

Mostrar el registro sencillo del ítem

dc.contributor.author Болодурина, И.П.
dc.contributor.author Иванова (Луговскова), Ю.П.
dc.contributor.author Анциферова, Л.М.
dc.contributor.author Блинов, В.Д.
dc.contributor.author Bolodurina, I.P.
dc.contributor.author Ivanova (Lugovskova), Yu.P.
dc.contributor.author Antsiferova, L.M.
dc.contributor.author Blinov, V.D.
dc.date.accessioned 2022-04-19T10:00:59Z
dc.date.available 2022-04-19T10:00:59Z
dc.date.issued 2020
dc.identifier.citation Разработка модифицированного метода Winnowing для агрегирования данных библиографической информации из систем цитирования в условиях неполной информации / И.П. Болодурина, Ю.П. Иванова (Луговскова), Л.М. Анциферова, В.Д. Блинов // Вестник ЮУрГУ. Серия «Компьютерные технологии, управление, радиоэлектроника». – 2020. – Т. 20, № 4. – С. 126–134. DOI: 10.14529/ctcr200413. Bolodurina I.P., Ivanova (Lugovskova) Yu.P., Antsiferova L.M., Blinov V.D. Development of a Modified Winnowing Method for Aggregating Bibliographic Information Data from Citation Systems under the Conditions of Incomplete Information. Bulletin of the South Ural State University. Ser. Computer Technologies, Automatic Control, Radio Electronics, 2020, vol. 20, no. 4, pp. 126–134. (in Russ.) DOI: 10.14529/ctcr200413 ru_RU
dc.identifier.issn 2409-6571
dc.identifier.uri http://dspace.susu.ru/xmlui/handle/0001.74/44279
dc.description Болодурина Ирина Павловна, д-р техн. наук, профессор, заведующий кафедрой прикладной математики, Оренбургский государственный университет, г. Оренбург; prmat@mail.osu.ru. Иванова (Луговскова) Юлия Петровна, канд. физ.-мат. наук, доцент кафедры прикладной математики, Оренбургский государственный университет, г. Оренбург; ulia_lugovskova@inbox.ru. Анциферова Лариса Михайловна, канд. пед. наук, доцент кафедры прикладной математики, Оренбургский государственный университет, г. Оренбург; antsiferova_68@mail.ru. Блинов Владислав Дмитриевич, студент, Оренбургский государственный университет, г. Оренбург; blnvvldslv@gmail.com. I.P. Bolodurina, prmat@mail.osu.ru, Yu.P. Ivanova (Lugovskova), ulia_lugovskova@inbox.ru, L.M. Antsiferova, antsiferova_68@mail.ru, V.D. Blinov, blnvvldslv@gmail.com Orenburg State University, Orenburg, Russian Federation ru_RU
dc.description.abstract В настоящее время переход к представлению библиографической информации о научных работах к электронному виду послужил причиной повышенного интереса к наукометрическим исследованиям. При этом существующие наукометрические методы подвергаются критике со стороны ученых, так как неполная библиографическая база и инструменты ее оценивания не позволяют наиболее точно оценить вклад научного труда. Проблема качества наукометрических оценок, как правило, основывается на исследовании данных некоторой системы цитирования, которая не включает полные сведения обо всех публикациях авторов, содержащихся в других системах цитирования. Цель исследования. Данное исследование направлено на разработку адаптивного подхода для формирования агрегированных данных библиографической информации научной организации в условиях неполной информации из систем цитирования РИНЦ, «Академия Google» и Scopus. Методы. Определение агрегированного списка публикаций для анализа наукометрических показателей проведено методом Winnowing, алгоритмом Левенштейна, методом шинглов и Джаро – Винклера. В рамках экспериментального исследования проведена оценка эффективности применения рассмотренных методов для агрегирования информации систем цитировния на основе анализа точности, полноты и F-меры. Результаты. Эксперименты на тестовых данных списка публикаций авторов Оренбургского государственного университета из систем цитирования РИНЦ, «Академия Google» и Scopus показали, что наиболее точные списки публикаций по критерию F-меры сформировал метод Winnowing. Для повышения производительности данного алгоритма проведена двухэтапная оптимизация процесса агрегирования, которая позволила улучшить время работы алгоритма при формировании списка библиографических описаний. Заключение. Предложенный подход для формирования агрегированных данных библиографической информации научной организации в условиях неполной информации из систем цитирования РИНЦ, «Академия Google» и Scopus позволяет повысить производительность при формировании списка публикаций авторов и показывает хорошую эффективность при определении наукометрических характеристик авторов. Currently, transition to the electronic presentation of bibliographic information about scientific works has caused an increased interest in scientometric research. At the same time, the existing scientometric methods are criticized by scientists, since the incomplete bibliographic base and tools for its assessment do not allow the most accurate assessment of the contribution of scientific work. The problem of the quality of scientometric assessments, as a rule, is based on the study of the data of a certain citation system, which does not include complete information about all publications of the authors contained in other citation systems. Aim. This study is aimed at developing an adaptive approach for the formation of aggregated data of bibliographic information of a scientific organization in conditions of incomplete information from the citation systems of the RSCI, “Google Academy” and Scopus. Methods. The definition of the aggregated list of publications for the analysis of scientometric indicators was carried out by the Winnowing method, the Levenshtein algorithm, the shingle method and the Jaro–Winkler method. In the framework of the experimental study, the effectiveness of the application of the considered methods for aggregating information from citation systems was assessed based on the analysis of accuracy, completeness and F-measure. Results. Experiments on test data from the list of publications by authors of the Orenburg State University from the citation systems RSCI, Google Academy and Scopus showed that the Winnowing method formed the most accurate lists of publications by the F-measure criterion. To improve the performance of this algorithm, a two-stage optimization of the aggregation process was carried out, which made it possible to improve the running time of the algorithm when generating a list of bibliographic descriptions. Conclusion. The proposed approach for the formation of aggregated data of bibliographic information of a scientific organization in conditions of incomplete information from the citation systems of the Russian Science Citation Index, Google Academy and Scopus allows increasing productivity in the formation of a list of authors' publications and shows good efficiency in determining the scientometric characteristics of authors. ru_RU
dc.description.sponsorship Исследование выполнено при финансовой поддержке РФФИ в рамках научного проекта № 20-07-01065, а также гранта Президента Российской Федерации для государственной поддержки ведущих научных школ Российской Федерации (НШ-2502.2020.9). ru_RU
dc.publisher Издательский центр ЮУрГУ ru_RU
dc.relation.ispartof Вестник ЮУрГУ. Серия Компьютерные технологии, управление, радиоэлектроника ru
dc.relation.ispartof Vestnik Yuzhno-Ural'skogo Gosudarstvennogo Universiteta. Seriya Kompjuternye tekhnologii, upravlenie, radioelektronika en
dc.relation.ispartof Bulletin of SUSU. Ser. Computer Technologies, Automatic Control, Radio Electronics en
dc.relation.ispartofseries Компьютерные технологии, управление, радиоэлектроника;Том 20
dc.subject УДК 519.673 ru_RU
dc.subject система цитирования ru_RU
dc.subject наукометрические методы ru_RU
dc.subject агрегирование библиографической информации ru_RU
dc.subject модификация метода Winnowing ru_RU
dc.subject метод Левенштейна ru_RU
dc.subject метод шинглов ru_RU
dc.subject citation system ru_RU
dc.subject scientometric methods ru_RU
dc.subject aggregation of bibliographic information ru_RU
dc.subject modification of the Winnowing method ru_RU
dc.subject Levenshtein method ru_RU
dc.subject shingle method ru_RU
dc.title Разработка модифицированного метода Winnowing для агрегирования данных библиографической информации из систем цитирования в условиях неполной информации ru_RU
dc.title.alternative Development of a Modified Winnowing Method for Aggregating Bibliographic Information Data from Citation Systems under the Conditions of Incomplete Information ru_RU
dc.type Article ru_RU
dc.identifier.doi DOI: 10.14529/ctcr200413


Ficheros en el ítem

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem

Buscar en DSpace


Búsqueda avanzada

Listar

Mi cuenta