Показать сокращенную информацию
dc.contributor.author | Konovalenko, I.A. | |
dc.contributor.author | Kokhan, V.V. | |
dc.contributor.author | Nikolaev, D.P. | |
dc.contributor.author | Коноваленко, И.А. | |
dc.contributor.author | Кохан, В.В. | |
dc.contributor.author | Николаев, Д.П. | |
dc.date.accessioned | 2022-05-18T09:55:59Z | |
dc.date.available | 2022-05-18T09:55:59Z | |
dc.date.issued | 2020 | |
dc.identifier.citation | Konovalenko, I.A. Maximal coordinate discrepancy as accuracy criterion of image projective normalization for optical recognition of documents / I.A. Konovalenko, V.V. Kokhan, D.P. Nikolaev // Вестник ЮУрГУ. Серия «Математическое моделирование и программирование». - 2020. - Т. 13, № 3. - С.43-58. DOI: 10.14529/mmp200304 | ru_RU |
dc.identifier.issn | 2308-0256 | |
dc.identifier.uri | http://dspace.susu.ru/xmlui/handle/0001.74/44438 | |
dc.description | I.A. Konovalenko1,2, V.V. Kokhan1,2, D.P. Nikolaev1,2 1Institute for Information Transmission Problems of the RAS, Moscow, Russian Federation 2Smart Engines Service LLC, Moscow, Russian Federation E-mails: konovalenko@smartengines.com, v.kokhan@smartengines.com, dimonstr@iitp.ru. Иван Андреевич Коноваленко, младший научный сотрудник, лаборатория ≪Зрительные системы≫, Институт проблем передачи информации им. А.А. Харкевича РАН; научный сотрудник, программист, ООО Смарт Энджинс Сервис (г. Москва, Российская Федерация), konovalenko@smartengines.com. Владислав Владимирович Кохан, младший научный сотрудник, лаборатория ≪Зрительные системы≫, Институт проблем передачи информации им. А.А. Харкевича РАН; научный сотрудник, программист, ООО Смарт Энджинс Сервис (г. Москва, Российская Федерация), v.kokhan@smartengines.com. Дмитрий Петрович Николаев, кандидат физико-математических наук, заместитель директора по научной работе, заведующий лабораторией, лаборатория ≪Зрительные системы≫, Институт проблем передачи информации им. А.А. Харкевича РАН; технический директор, ООО Смарт Энджинс Сервис (г. Москва, Российская Федерация), dimonstr@iitp.ru | ru_RU |
dc.description.abstract | Application of projective normalization (a special case of orthocorrection and perspective correction) to photographs of documents for their further optical recognition is generally accepted. In this case, inaccuracies of normalization can lead to recognition errors. To date, a number of normalization accuracy criteria are presented in the literature, but their conformity with recognition quality was not investigated. In this paper, for the case of a fixed structured document, we justify a uniform probabilistic model of recognition errors, according to which the probability of correct recognition of a character abruptly falls to zero with an increase in the coordinate discrepancy of this character. For this model, we prove that the image normalization accuracy criterion, which is equal to the maximal coordinate discrepancy in the text fields of a document, monotonously depends on the probability of correct recognition of the entire document. Also, we show that the problem on computing the maximal coordinate discrepancy is not reduced to the nearest known one, i.e. the linearfractional programming problem. Finally, for the first time, we obtain an analytical solution to the problem on computing the maximal coordinate discrepancy on a union of polygons. Общепринято применение проективной нормализации (частный случай ортокоррекции и коррекции перспективы) к фотографиям документов для их последующего оптического распознавания. При этом неточности нормализации могут приводить к ошибкам распознавания. На сегодняшний день в литературе предложен ряд критериев точности нормализации, однако их соответствие качеству распознавания не исследуется. В данной работе для случая документа фиксированной структуры обосновывается равномерная вероятностная модель ошибок распознавания, в соответствии с которой вероятность верного распознавания символа скачком падает до нуля с ростом невязки координат этого символа. Для этой модели доказано, что критерий точности нормализации изображения, равный максимальной по текстовым полям документа невязке координат, монотонно связан с вероятностью верного распознавания всего документа. Показано, что задача вычисления максимальной невязки координат не сводится к ближайшей известной, т.е. задаче дробно-линейного программирования. Наконец, впервые получено аналитическое решение задачи вычисления максимальной невязки координат на объединении многоугольников. | ru_RU |
dc.description.sponsorship | The study was carried out with the partial financial support of RFBR within scientific projects no. 17-29-03370 and no. 17-29-03514. | ru_RU |
dc.language.iso | en | ru_RU |
dc.publisher | Издательский центр ЮУрГУ | ru_RU |
dc.relation.isformatof | Вестник ЮУрГУ. Серия Математическое моделирование и программирование | ru_RU |
dc.relation.isformatof | Vestnik Yuzhno-Ural'skogo Gosudarstvennogo Universiteta. Seriya Matematicheskoe modelirovanie i programmirovanie | ru_RU |
dc.relation.isformatof | Bulletin of SUSU. Ser. Mathematical Modelling, Programming & Computer Software | ru_RU |
dc.relation.ispartofseries | Математическое моделирование и программирование;Том 13 | |
dc.subject | УДК 004.932.2 | ru_RU |
dc.subject | orthocorrection | ru_RU |
dc.subject | perspective correction | ru_RU |
dc.subject | image projective normalization | ru_RU |
dc.subject | optical character recognition | ru_RU |
dc.subject | accuracy criteria | ru_RU |
dc.subject | coordinate discrepancy | ru_RU |
dc.subject | nonlinear programming | ru_RU |
dc.subject | ортокоррекция | ru_RU |
dc.subject | коррекция перспективы | ru_RU |
dc.subject | проективная нормализация изображений | ru_RU |
dc.subject | оптическое распознавание символов | ru_RU |
dc.subject | критерии точности | ru_RU |
dc.subject | невязка координат | ru_RU |
dc.subject | нелинейное программирование | ru_RU |
dc.title | Maximal coordinate discrepancy as accuracy criterion of image projective normalization for optical recognition of documents | ru_RU |
dc.title.alternative | Максимальная невязка координат как критерий точности проективной нормализации изображения при оптическом распознавании документов | ru_RU |
dc.type | Article | ru_RU |
dc.identifier.doi | DOI: 10.14529/mmp200304 |