Marior去除边距和迭代内容矫正用于自然文档矫正

一、简要介绍

二、研究背景

借助移动设备中先进的内置摄像头,将日常生活中无处不在的文档数字化已经为人们变得方便。但是,由于相机的角度和位置不合适,所捕获的文档图像通常包含透视变形。此外,文档本身也可能因弯曲、折叠或折痕而发生几何变形。这些类型的变形导致了光学字符识别(OCR)系统的性能下降,并导致读者的可读性较差。

三、方法介绍

3.1边缘去除模块(MRM)

3.2迭代内容校正模块(ICRM)

使用MRM进行初步去变形的结果并不完美。原因有两方面。第一个原因是在每条边上选择等距点不考虑深度信息;因此,这种等距划分与在物理纸上进行的划分不一致。第二个原因是,有时,当预测的掩膜遇到不清楚的边缘或非常复杂的边缘时,它并不够准确。此外,没有边缘区域的文档图像跳过了初步的去变形,因此仍然没有被触及。

式中 d ^ i {hat{d}_i} d^i、 d i { {d}_i} di和 m c i {m_{c_i}} mci分别表示预测位移流 D ^ {hat{D}} D^、ground truth位移流和文档内容掩膜 M c { {M}_c} Mc中的第i个元素。 α {alpha} α和 β {eta} β是恒定的权重。

四、实验

4.1数据集

4.3在公共基准上的比较

五、总结与讨论

经验分享 程序员 微信小程序 职场和发展