Репозиторий Dspace

Внедрение концепции матричного профиля в реляционную СУБД для интеллектуального анализа временных рядов

Показать сокращенную информацию

dc.contributor.author Иванова, Е.В.
dc.contributor.author Цымблер, М.Л.
dc.contributor.author Ivanova, E.V.
dc.contributor.author Zymbler, M.L.
dc.date.accessioned 2023-01-24T11:26:26Z
dc.date.available 2023-01-24T11:26:26Z
dc.date.issued 2021
dc.identifier.citation Иванова Е.В., Цымблер М.Л. Внедрение концепции матричного профиля в реляционную СУБД для интеллектуального анализа временных рядов / Е.В. Иванова, М.Л. Цымблер // Вестник ЮУрГУ. Серия: Вычислительная математика и информатика. 2021. Т. 10, № 3. С. 72–87. DOI: 10.14529/cmse210305. Ivanova E.V., Zymbler M.L. Embedding of the Matrix Profile Concept Into a Relational DBMS for Time Series Mining. Bulletin of the South Ural State University. Series: Computational Mathematics and Software Engineering. 2021. Vol. 10, no. 3. P. 72–87. (in Russian) DOI: 10.14529/cmse210305. ru_RU
dc.identifier.issn 2410-7034
dc.identifier.uri http://dspace.susu.ru/xmlui/handle/00001.74/45784
dc.description Иванова Елена Владимировна, к.ф.-м.н., кафедра системного программирования, Южно-Уральский государственный университет (национальный исследовательский университет) (Челябинск, Российская Федерация). Цымблер Михаил Леонидович, д.ф.-м.н., доцент, кафедра системного программирования, Южно-Уральский государственный университет (национальный исследовательский университет) (Челябинск, Российская Федерация). E.V. Ivanova, M.L. Zymbler South Ural State University (pr. Lenina 76, Chelyabinsk, 454080 Russia) E-mail: elena.ivanova@susu.ru, mzym@susu.ru ru_RU
dc.description.abstract В настоящее время большие временные ряды используются в широком спектре предметных областей. Современные системы управления базами данных временных рядов (СУБД-ВР) предлагают, однако, скромный набор встроенных инструментов и средств для интеллектуального анализа данных. Использование сторонних систем интеллектуального анализа временных рядов приводит в связи с этим к нежелательным накладным расходам на экспорт данных вне СУБД-ВР, преобразование данных и импорт результатов анализа. В то же время актуальной научной задачей является внедрение методов интеллектуального анализа данных в реляционные СУБД (РСУБД), которые доминируют на рынке средств управления данными. Однако пока отсутствуют разработки по внедрению методов интеллектуального анализа временных рядов в РСУБД. В статье предлагается подход к управлению и интеллектуальному анализу временных рядов внутри РСУБД на основе концепции матричного профиля. Матричный профиль представляет собой структуру данных, которая для каждой подпоследовательности временного ряда сохраняет индекс и расстояние до ее ближайшего соседа (подпоследовательности ряда, наиболее похожей на данную). Матричный профиль служит основой для обнаружения лейтмотивов (шаблонов), аномалий и других примитивов интеллектуального анализа временных рядов. Описанный подход реализован в РСУБД PostgreSQL. Представлены результаты вычислительных экспериментов, показавшие более высокую эффективность предложенного подхода по сравнению с СУБД-ВР InfluxDB и OpenTSDB. Currently, large time series are used in a wide range of subject areas. Modern time series DBMSs (TSDBMS) offer, however, a modest set of built-in tools for data mining. The use of third-party time series mining systems to undesirable overhead costs for exporting data outside the TSDBMS, converting data and importing analysis results. At the same time, there is a topical issue of the embedding of data mining methods into relational DBMSs (RDBMS), which dominate the market of data management tools. However, there are still no developments of time series mining methods in RDBMS. The article proposes an approach to the management and mining of time series data within the RDBMS based on the matrix profile concept. A matrix profile is a data structure that, for each subsequence of a time series, stores the index of and the distance to its nearest neighbor. The matrix profile serves as the basis for detecting motifs, anomalies and other primitives of time series mining. The proposed approach is implemented in the PostgreSQL RDBMS. The experimental results showed a higher efficiency of the proposed approach compared to the TSDBMS InfluxDB and OpenTSDB. ru_RU
dc.description.sponsorship Работа выполнена при финансовой поддержке Российского фонда фундаментальных исследований (грант № 20-07-00140) и Министерства науки и высшего образования РФ (государственное задание FENU-2020-0022). ru_RU
dc.publisher Издательский центр ЮУрГУ ru_RU
dc.relation.ispartof Вестник ЮУрГУ. Серия Вычислительная математика и информатика ru
dc.relation.ispartof Bulletin of South Ural State University. Series Computational mathematics and software engineering en
dc.relation.ispartofseries Вычислительная математика и информатика;Том 10
dc.subject УДК 004.62 ru_RU
dc.subject УДК 004.65 ru_RU
dc.subject временные ряды ru_RU
dc.subject матричный профиль ru_RU
dc.subject PostgreSQL ru_RU
dc.subject InfluxDB ru_RU
dc.subject OpenTSDB ru_RU
dc.subject time series ru_RU
dc.subject matrix profile ru_RU
dc.subject PostgreSQL ru_RU
dc.subject InfluxDB ru_RU
dc.subject OpenTSDB ru_RU
dc.title Внедрение концепции матричного профиля в реляционную СУБД для интеллектуального анализа временных рядов ru_RU
dc.title.alternative Embedding of the Matrix Profile Concept Into a Relational DBMS for Time Series Mining ru_RU
dc.type Article ru_RU
dc.identifier.doi DOI: 10.14529/cmse210305


Файлы в этом документе

Данный элемент включен в следующие коллекции

Показать сокращенную информацию

Поиск в DSpace


Расширенный поиск

Просмотр

Моя учетная запись