 |
А.В. Шер, Д.П. Маталов, В.В. Арлазаров"Фильтрация локальных особенностей в задаче построения шаблонов документов" |
 |
|
Аннотация.
В работе рассматривается задача повышения качества метода локализации и идентификации документов, удостоверяющих личность, основанного на сопоставлении локальных особенностей. В рамках метода тип документа описывается шаблоном – набором локальных особенностей изображения документа, что накладывает ограничения на размер шаблона при масштабировании до десятков тысяч типов и требует отбора наиболее информативных признаков. Существующие алгоритмы отбора не в полной мере учитывают вклад признаков в устойчивость сопоставления и дискриминативную способность представления документа. Предлагается модификация алгоритма отбора локальных особенностей шаблона направленная на формирование более информативного и устойчивого описания без увеличения его размера. Экспериментальные результаты подтверждают эффективность предложенного метода: в большинстве тестовых сценариев он демонстрирует лучшее качество идентификации документов, обеспечивая среднее сокращение ошибки идентификации на 10% на публичном наборе данных MIDV-500 и на 5% на MIDV-2019.
Ключевые слова:
компьютерное зрение, распознавание документов, сопоставление локальных особенностей, особые точки, дескрипторы.
DOI 10.14357/20718632260101
EDN AQLLDZ
Стр. 3-15.
Литература
1. Bulatov K., Arlazarov V. V., Chernov T., Slavin O., Nikolaev D. Smart IDReader: Document Recognition in Video Stream // 14th IAPR International Conference on Document Analysis and Recognition (ICDAR). 2017. С. 39-44. https://doi.org/10.1109/ICDAR.2017.347 2. Арлазаров В. В. Ключевые этапы обработки шаблона документа современных систем распознавания ID-карт // Труды ИСА РАН. 2022. Т. 72. № 3. С. 19–25. https://doi.org/10.14357/20790279220303 3. Zhu A., Zhang C., Li Z., Xiong S. Coarse-to-fine document localization in natural scene image with regional attention and recursive corner refinement // International Journal on Document Analysis and Recognition (IJDAR). 2019. № 3. С. 351-360. https://doi.org/10.1007/s10032-019-00341-0 4. Awal A. M., Ghanmi N., Sicre R., Furon T. Complex Document Classification and Localization Application on Identity Document Images // 14th IAPR International Conference on Document Analysis and Recognition (ICDAR). 2017. С. 426-431. https://doi.org/10.1109/ICDAR.2017.77 5. Skoryukina N. S., Shalnova E. A., Arlazarov V. V. Method for Detecting False Responses of Localization and Identification Algorithms Using Global Features // Информационные технологии и вычислительные системы. 2023. № 4. С. 28-36. https://doi.org/10.14357/20718632230403 6. Valishina N. Z., Gayer A. V., Skoryukina N. S., Arlazarov V. V. Fast Keypoint Filtering for Feature-Based Identity Documents Classifcation on Complex Background // The 16th International Conference on Machine Vision (ICMV 2023). 2024. Т. 13072. С. 1307205-1-1307205-9. https://doi.org/10.1117/12.3023194 7. Skoryukina N., Arlazarov V. V., Nikolaev D. P. Fast method of ID documents location and type identification for mobile and server application // 2019 International Conference on Document Analysis and Recognition (ICDAR). 2020. С. 850-857. https://doi.org/10.1109/ICDAR.2019.00141 8. Regula Document Reader SDK, URL: https://regulaforensics.com/products/document-reader-sdk/#specification. (Дата обращения: 23.01.2026). 9. Skoryukina N. S., Arlazarov V. V., Milovzorov A. N. Memory Consumption Reduction for Identity Document Classification with Local and Global Features Combination // Thirteenth International Conference on Machine Vision ICMV 2020. 2021. Т. 11605. С. 116051G1-116051G8. https://doi.org/10.1117/12.2587033 10. Matalov D. P., Limonova E. E., Skoryukina N. S., Arlazarov V. V. Memory effcient local features descriptor for identity document detection on mobile and embedded devices // IEEE Access. 2022. Т. 11. С. 1104-1114. https://doi.org/10.1109/ACCESS.2022.3233463 11. Bay H., Ess A., T. Tuytelaars, Van Gool L. Speeded-Up Robust Features (SURF) // Computer Vision and Image Understanding. 2008. № 3. С. 346-359. https://doi.org/10.1016/j.cviu.2007.09.014 12. Trzcinski T., Christoudias M., Lepetit V. Learning Image Descriptors with Boosting // IEEE Transactions on Pattern Analysis and Machine Intelligence. 2015. № 37. С. 597-610. https://doi.org/10.1109/TPAMI.2014.2343961 13. Arlazarov V. V., Bulatov K., Chernov T., Arlazarov V. L. MIDV-500: A Dataset for Identity Document Analysis and Recognition on Mobile Devices in Video Stream // Компьютерная оптика. 2019. Т. 43. № 5. С. 818-824. https://doi.org/10.18287/2412-6179-2019-43-5-818-824 14. Bulatov K., Matalov D., Arlazarov V. V. MIDV-2019: Challenges of the Modern Mobile-Based Document OCR // ICMV 2019. 2020. Т. 11433. С. 114332N1-114332N6. https://doi.org/10.1117/12.2558438 15. Lerouge J., Betmont G., Bres T., Stepankevich E., Bergès A. DocXPand-25k: a large and diverse benchmark dataset for identity documents analysis // arXiv. 2024. №2407.20662. https://doi.org/10.48550/arXiv.2407.20662 16. Xie, L. IDNet: A Novel Identity Document Dataset via FewShot and Quality-Driven Synthetic Data Generation / L. Xie. // 2024 IEEE International Conference on Big Data (BigData). 2024. С. 2244-2253. https://doi.org/10.1109/BigData62323.2024.10825017 17. Matalov D. P., Arlazarov V. V. Model-driven approach to creating ID document templates for localization and classification based on a single image // Computer Optics. 2025. Т. 49. № 6. С. 1148-1155. https://doi.org/10.18287/2412-6179-CO-1762
|