一、论文部分
基于傅里叶文档恢复的鲁棒文档去锐化与识别https://www.semanticscholar.org/paper/Fourier-Document-Restoration-for-Robust-Document-Xue-Tian/64dcd0cac46b936eb413f36b462be3b5b298c75b
1. 由于这篇论文没有给代码,所以去参考文献查找:
connected papers 上查找相关的论文。
2. Hao Feng 这个作者有一系列工作:
其中2022年的文章发表在ECCV
准备调研一下这篇论文。
3. 论文思想
论文提出了 DocGeoNet 扭曲文档图片矫正算法。思路是3D形状为矫正扭曲的文档图像提供了全局的不扭曲线索,同时忽略了局部结构。文本线补充地为局部提供显式几何约束。
DocGeoNet 利用了变形文档图片的两个属性:
1)3D形状(提供全局细节);
2)文本线(提供局部细节)。
DocGeoNet 主要由三个部分组成:
1)预处理模块将前台文档从集群背景中分离出来;
2)结构编码器和文本线提取器,分别对变形文档的三维形状进行建模和提取弯曲的文本线;
3)校正解码器,用于估计失真校正的翘曲流量。
4. 论文中的效果展示图片:
二、代码部分
1. 论文代码地址:代码地址
2. 代码中预置图片矫正效果(左:原图,右:矫正):
3. 自己测试的结果(左:原图,右:矫正):
测试的效果没有想象的好。