Репозиторий Dspace

Maximal coordinate discrepancy as accuracy criterion of image projective normalization for optical recognition of documents

Показать сокращенную информацию

dc.contributor.author Konovalenko, I.A.
dc.contributor.author Kokhan, V.V.
dc.contributor.author Nikolaev, D.P.
dc.contributor.author Коноваленко, И.А.
dc.contributor.author Кохан, В.В.
dc.contributor.author Николаев, Д.П.
dc.date.accessioned 2022-05-18T09:55:59Z
dc.date.available 2022-05-18T09:55:59Z
dc.date.issued 2020
dc.identifier.citation Konovalenko, I.A. Maximal coordinate discrepancy as accuracy criterion of image projective normalization for optical recognition of documents / I.A. Konovalenko, V.V. Kokhan, D.P. Nikolaev // Вестник ЮУрГУ. Серия «Математическое моделирование и программирование». - 2020. - Т. 13, № 3. - С.43-58. DOI: 10.14529/mmp200304 ru_RU
dc.identifier.issn 2308-0256
dc.identifier.uri http://dspace.susu.ru/xmlui/handle/0001.74/44438
dc.description I.A. Konovalenko1,2, V.V. Kokhan1,2, D.P. Nikolaev1,2 1Institute for Information Transmission Problems of the RAS, Moscow, Russian Federation 2Smart Engines Service LLC, Moscow, Russian Federation E-mails: konovalenko@smartengines.com, v.kokhan@smartengines.com, dimonstr@iitp.ru. Иван Андреевич Коноваленко, младший научный сотрудник, лаборатория ≪Зрительные системы≫, Институт проблем передачи информации им. А.А. Харкевича РАН; научный сотрудник, программист, ООО Смарт Энджинс Сервис (г. Москва, Российская Федерация), konovalenko@smartengines.com. Владислав Владимирович Кохан, младший научный сотрудник, лаборатория ≪Зрительные системы≫, Институт проблем передачи информации им. А.А. Харкевича РАН; научный сотрудник, программист, ООО Смарт Энджинс Сервис (г. Москва, Российская Федерация), v.kokhan@smartengines.com. Дмитрий Петрович Николаев, кандидат физико-математических наук, заместитель директора по научной работе, заведующий лабораторией, лаборатория ≪Зрительные системы≫, Институт проблем передачи информации им. А.А. Харкевича РАН; технический директор, ООО Смарт Энджинс Сервис (г. Москва, Российская Федерация), dimonstr@iitp.ru ru_RU
dc.description.abstract Application of projective normalization (a special case of orthocorrection and perspective correction) to photographs of documents for their further optical recognition is generally accepted. In this case, inaccuracies of normalization can lead to recognition errors. To date, a number of normalization accuracy criteria are presented in the literature, but their conformity with recognition quality was not investigated. In this paper, for the case of a fixed structured document, we justify a uniform probabilistic model of recognition errors, according to which the probability of correct recognition of a character abruptly falls to zero with an increase in the coordinate discrepancy of this character. For this model, we prove that the image normalization accuracy criterion, which is equal to the maximal coordinate discrepancy in the text fields of a document, monotonously depends on the probability of correct recognition of the entire document. Also, we show that the problem on computing the maximal coordinate discrepancy is not reduced to the nearest known one, i.e. the linearfractional programming problem. Finally, for the first time, we obtain an analytical solution to the problem on computing the maximal coordinate discrepancy on a union of polygons. Общепринято применение проективной нормализации (частный случай ортокоррекции и коррекции перспективы) к фотографиям документов для их последующего оптического распознавания. При этом неточности нормализации могут приводить к ошибкам распознавания. На сегодняшний день в литературе предложен ряд критериев точности нормализации, однако их соответствие качеству распознавания не исследуется. В данной работе для случая документа фиксированной структуры обосновывается равномерная вероятностная модель ошибок распознавания, в соответствии с которой вероятность верного распознавания символа скачком падает до нуля с ростом невязки координат этого символа. Для этой модели доказано, что критерий точности нормализации изображения, равный максимальной по текстовым полям документа невязке координат, монотонно связан с вероятностью верного распознавания всего документа. Показано, что задача вычисления максимальной невязки координат не сводится к ближайшей известной, т.е. задаче дробно-линейного программирования. Наконец, впервые получено аналитическое решение задачи вычисления максимальной невязки координат на объединении многоугольников. ru_RU
dc.description.sponsorship The study was carried out with the partial financial support of RFBR within scientific projects no. 17-29-03370 and no. 17-29-03514. ru_RU
dc.language.iso en ru_RU
dc.publisher Издательский центр ЮУрГУ ru_RU
dc.relation.isformatof Вестник ЮУрГУ. Серия Математическое моделирование и программирование ru_RU
dc.relation.isformatof Vestnik Yuzhno-Ural'skogo Gosudarstvennogo Universiteta. Seriya Matematicheskoe modelirovanie i programmirovanie ru_RU
dc.relation.isformatof Bulletin of SUSU. Ser. Mathematical Modelling, Programming & Computer Software ru_RU
dc.relation.ispartofseries Математическое моделирование и программирование;Том 13
dc.subject УДК 004.932.2 ru_RU
dc.subject orthocorrection ru_RU
dc.subject perspective correction ru_RU
dc.subject image projective normalization ru_RU
dc.subject optical character recognition ru_RU
dc.subject accuracy criteria ru_RU
dc.subject coordinate discrepancy ru_RU
dc.subject nonlinear programming ru_RU
dc.subject ортокоррекция ru_RU
dc.subject коррекция перспективы ru_RU
dc.subject проективная нормализация изображений ru_RU
dc.subject оптическое распознавание символов ru_RU
dc.subject критерии точности ru_RU
dc.subject невязка координат ru_RU
dc.subject нелинейное программирование ru_RU
dc.title Maximal coordinate discrepancy as accuracy criterion of image projective normalization for optical recognition of documents ru_RU
dc.title.alternative Максимальная невязка координат как критерий точности проективной нормализации изображения при оптическом распознавании документов ru_RU
dc.type Article ru_RU
dc.identifier.doi DOI: 10.14529/mmp200304


Файлы в этом документе

Данный элемент включен в следующие коллекции

Показать сокращенную информацию

Поиск в DSpace


Расширенный поиск

Просмотр

Моя учетная запись