Marior去除边距和迭代内容矫正用于自然文档矫正
一、简要介绍
二、研究背景
借助移动设备中先进的内置摄像头,将日常生活中无处不在的文档数字化已经为人们变得方便。但是,由于相机的角度和位置不合适,所捕获的文档图像通常包含透视变形。此外,文档本身也可能因弯曲、折叠或折痕而发生几何变形。这些类型的变形导致了光学字符识别(OCR)系统的性能下降,并导致读者的可读性较差。
三、方法介绍
3.1边缘去除模块(MRM)
3.2迭代内容校正模块(ICRM)
使用MRM进行初步去变形的结果并不完美。原因有两方面。第一个原因是在每条边上选择等距点不考虑深度信息;因此,这种等距划分与在物理纸上进行的划分不一致。第二个原因是,有时,当预测的掩膜遇到不清楚的边缘或非常复杂的边缘时,它并不够准确。此外,没有边缘区域的文档图像跳过了初步的去变形,因此仍然没有被触及。
式中 d ^ i {hat{d}_i} d^i、 d i { {d}_i} di和 m c i {m_{c_i}} mci分别表示预测位移流 D ^ {hat{D}} D^、ground truth位移流和文档内容掩膜 M c { {M}_c} Mc中的第i个元素。 α {alpha} α和 β {eta} β是恒定的权重。
四、实验
4.1数据集
4.3在公共基准上的比较