一种基于文本边界的中文文档图像畸变校正方法

文档序号：6559440阅读：316来源：国知局

专利名称：一种基于文本边界的中文文档图像畸变校正方法
技术领域：
本发明属于文档图像处理技术，尤其涉及基于文本边界的文档图像畸变校正方法，具体涉及到了经扫描获取的中文文档图像的线性畸变和非线性畸变的校正方法。
背景技术：
随着信息技术的发展和办公自动化的普及，越来越多的文档需要转成电子形式，扫描是一种基本的方式。在这个过程中，由于装订的影响，难以避免地会造成图像存在一定程度上的畸变，这种畸变往往是线性畸变和非线性畸变的叠加。加之，现在的文档经常是包含大量表格、图像等非文本内容的复杂结构文档，使得文档图像的畸变校正变得十分困难。现有的文档图像畸变校正方法主要分为两类，一类是依赖于3D的扫描设备，通过三维扫描仪获取的图像带有深度信息，可以建立原始文本的畸变模型，通过几何变换来校正图像。由于三维扫描仪价格昂贵，目前还没有被广泛使用，限制了此类方法的应用。另外一类是基于文本的方法，单纯从扫描获取的2D图像获取信息进行畸变校正。这类方法通常是针对特定文字设计的，如英文等。校正过程大致分为两步，首先得到各个字母的重心，然后同一单词的各个字母的重心相连得到中心线。然后，校正的过程就是改变各个字母的位置使得同一单词的字母重心处于同一水平线上。由于中文是由字而非单词组成，每个字由交错的笔画组成而非孤立的字母组成；另外，由于很多中文字由左右或上下两个不相连的部分组成，不同于英文字母，主体部分都是连通的，可以找到每个字母的重心，并且根据字母之间的距离可以准确划分出单词。对于中文来讲，并不能通过连通性来获得单个字的重心。因此，这类方法对中文文档图像的校正得不到较好的效果，甚至失效。在这种背景下，为适应现代化文档图像处理系统的需要，研究和开发适合中文复杂结构文档图像特点的畸变校正方法就成了一项意义重大并富有挑战性的工作。

发明内容
针对现有技术存在的缺点以及中文文档的特点，我们提出了一种基于文本边界线的中文文档图像畸变校正方法，克服了现有技术中的缺点，不依赖于三维的扫描设备且能处理复杂结构文档图像，并取得了良好的效果。我们首先对文档图像进行预处理，然后提取文档图像的上下两条文本边界线，最后根据提取的文本边界线进行畸变的校正。具体步骤包括1.对扫描获取的文档图像进行预处理，去除页面边界及边界以外区域(即当被扫描文档小于扫描仪器平面时，获取的非文档之外的信息)的干扰，即删除非文档之外的信肩、ο2.判断图像的畸变方向，确定畸变区域。3.对文档图像进行二值化。4.提取二值化后的文档图像的上下文本边界线。5.根据上下文本边界线，采用线性插值方法对文档图像中畸变区域进行变换，得到校正的图像。所述判断图像畸变方向的方法为A、对文档图像中灰度值小于阈值Tl的像素点p(i，j)进行垂直方向的统计
权利要求
1.一种基于文本边界的中文文档图像畸变校正方法，包括如下步骤1)对扫描获取的文档图像进行预处理，去除页面边界及边界以外区域的干扰；2)判断文档图像的畸变方向，确定畸变区域；3)对文档图像进行二值化；4)提取经二值化处理的文档图像的上下文本边界线；5)根据上下文本边界线，采用线性插值方法对文档图像中畸变区域进行变换，得到校正的图像。
2.根据权利要求1所述的中文文档图像畸变校正方法，其特征在于，所述判断图像畸变方向的方法为A、对文档图像中灰度值小于阈值Tl的像素点p(i，j)进行垂直方向的统计眷她二 n，V(i，j)为像素点p(i，j)的灰度值，i，j分别为横纵坐标，Length为图像的高度，V(i) 为第i列像素的灰度值之和；B、根据V(i)判断畸变方向，V(i)最大值所在的一侧即为发生畸变的一侧。
3.根据权利要求1所述的中文文档图像畸变校正方法，其特征在于，所述对文档图像进行二值化的方法为A、计算出每个像素点p(i，j)的N*N邻域窗口的局部阈值T(i，j)T{iJ) = m{iJ).[\ + k{\-S-^-)}其中，m(i，j)和s(i，j)分别是像素点p(i，j)的N*N邻域窗口的灰度均值和方差，i， j分别为横纵坐标，N, K，R是常数；il v(ij) > T(iJ)为B、设定每个像素点ρ (i，j)，其灰度值v(/,_/)= nτ ，得到二值化后的文[O v(ij)< T(Ij)本图像。
4.根据权利要求3所述的中文文档图像畸变校正方法，其特征在于，Tl为文档图像中灰度最大值的1/3。
5.根据权利要求1所述的中文文档图像畸变校正方法，其特征在于，所述文本边界线的提取方法为A、对二值化后的文档图像进行水平方向的膨胀，使得同一行中的内容产生粘连，形成一个连通区域，所述连通区域为文档图像的主文本区域；B、对主文本区域中首行的上线和最后一行的下线采用线段拟合方法，获得文本上下边界线；C、对文本上下边界线进行平滑修正，得到修正后的文本上下边界线。
6.根据权利要求5所述的中文文档图像畸变校正方法，其特征在于，线段拟合方法为a、采用长度为L= K*h的水平线段初始描述上下线，其中，h为文本行的高度，K为系数；b、连接各线段中点，连接线构成文本上下边界线当线段Ii与其左右线段Ih和li+1的高度存在如下关系=H(Ii^1)彡H(Ii)彡H(li+1)或者HD彡H(Ii)彡H(li+1)时，连接H1和li+1的中点；当Ii与其左右线段Ip1和li+1的高度不符合所述关系时，采用下述公式调整线段Ii的高度H(Ii) = Η(1η)+0/2，其中，D = H(Iw)-H(Ii)，连接调整后的 1” Ii^1 和 li+1 的中点。
7.根据权利要求6所述的中文文档图像畸变校正方法，其特征在于，所述对文本上下边界线进行平滑修正的方法为a)对边界线局部修正在线段拟合获得的文本上下边界线中，若上边界线的两条边界段顺时针夹角小于180 度；或者下边界线两条边界段间顺时针夹角大于180度，分别在两条边界段加入一标记点，连接标记点，标记点连接线为局部修正后的文本边界线；b)对局部修正后的文本上下边界线进行基于曲率的全局约束，获得修正后的文本上下边界线。
8.根据权利要求5所述的中文文档图像畸变校正方法，其特征在于，所述当前主文本区域的首行或最后一行不是文字时，首先提取相邻页N±2的文本区域的文本上下边界线， N为当前文本区域所在的页面的页码；然后根据相邻页的文本上下边界线和畸变相似性确定当前主文本区域的文本上下边界线。
9.根据权利要求1所述的中文文档图像畸变校正方法，其特征在于，所述文档图像是书脊方向垂直于扫描仪的扫描线方向获得的文档图像。
10.根据权利要求1所述的中文文档图像畸变校正方法，其特征在于，所述对畸变区域进行变换的方法为a)计算每一列像素的成像畸变系数Iii = disybase其中，diSi为上下文本边界线的距离，base是文档图像中未畸变区域上下文本边界线的距离；b)根据成像畸变系数ki;将上下文本边界线畸变区域上的点p(i，j)进行变换得q
全文摘要
本发明公开了一种基于文本边界的中文文档图像畸变校正方法，包括1)对扫描获取的文档图像进行预处理，去除页面边界及边界以外区域的干扰；2)判断文档图像的畸变方向，确定畸变区域；3)对文档图像进行二值化；4)提取经二值化的文档图像的上下文本边界线；5)根据上下文本边界线，采用线性插值方法对文档图像中畸变区域进行变换，得到校正的图像；本发明解决了扫描获取的中文文档图像的畸变校正问题，根据中文特征提取文本边界线进行校正的方法，降低了计算复杂度的同时，有效解决了复杂结构文档图像的校正。同时本方法与采集设备无关，不依赖于设备参数，具有广泛的应用价值。
文档编号G06K9/32GK102254171SQ201110196399
公开日2011年11月23日申请日期2011年7月13日优先权日2011年7月13日
发明者丁润伟, 刘宏申请人:北京大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘宏;丁润伟
技术所有人：北京大学
我是此专利的发明人

上一篇：一种协同认证的商品防伪方法
上一篇：基于模糊k近邻的三维模型半自动标注方法及系统的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。