一种扫描文档图像的倾斜校正方法与流程

文档序号:12273000阅读:4984来源:国知局

本发明涉及文档图像自动处理技术领域,特别涉及一种扫描文档图像的倾斜校正方法。



背景技术:

文档图像自动处理的目的是在数字图像中识别文字,图形和图片,并按照需要提取信息。其中,文字处理包括:版面分析,切分出段落,行和单字,然后进行OCR中的识别。在OCR识别中,文本图像经常会出现一定角度的倾斜。因为图像的倾斜使OCR中字符分割发生困难,3度以上的倾斜会引起字符明显变形,使大部分OCR方法难以适应。为了将倾斜的文本图像校正,以便于字符识别中的后续处理,快速准确的检测倾斜文本图像的倾角成为一项重要的预处理技术。

目前对文档图像倾角检测的方法主要有基于Hough变换的方法,基于交叉相关性的方法,基于投影特征的方法,基于Fourier变换的方法和基于K-最近邻簇的方法。

其中,Hough变换是最常用的倾斜角检测的方法,但基于Hough算法的计算量非常大,导致该方法应用难度大。交叉相关算法是一种基于等距离的水平平行线上的像素点的相关性的方法,虽然计算得到的准确率很高,但是同样的存在计算量过大的问题。

使用文本行投影进行变换,只根据文本行就可以计算文档图像的倾斜角度。对图像中的直线可使用链码方法进行标记,对有效点进行标记和标记合并,根据直线的边缘点进行直线拟合是比较稳定可靠的方法,基于投影方法的改进,提出了两级边缘投影直方图差的算法。基于此,本发明设计了一种扫描文档图像的倾斜校正方法。旨在提出一种快速的准确的图像倾斜校正方法,解决现有数字图像字符识别业务中图像的分割识别问题,提高文档信息采集,录入准确性、减少拒识率,提高产品的易操作性和可靠性。



技术实现要素:

本发明为了弥补现有技术的缺陷,提供了一种简单高效的扫描文档图像的倾斜校正方法。

本发明是通过如下技术方案实现的:

一种扫描文档图像的倾斜校正方法,其特征在于包括以下步骤:

(1)扫描图像,寻找图像边缘标记点;

(2)首先在预定的角度范围内以一定角度步长对选定的图像边缘标记点做多方向投影,其次获取投影直方图;然后计算各角度投影直方图的均方差,求出所有投影直方图方差的最大差分,将对应的投影角度作为倾角的粗略估值;最后以粗略估值为中心,以第1次投影步长为半径的角度范围内,再次以给定的检测精度为步长进行投影;重复第1次投影的工作,求出投影直方图方差的最大值,以对应的角度作为图像倾角的检测值;

(3)如果倾斜角度的绝对值小于设定值,不进行图像旋转;

(4)选取水平和垂直边缘标记点投影计算出的较小的角度作为倾斜角,对图像照倾斜角度进行旋转变换。

所述步骤(1)中,首先根据图像尺寸设置检测步长,对图像上、下、左、右四个区域进行检测;然后根据检测步长从水平方向和垂直方向分别检测图像,找出边缘标记点,对边缘标记点进行投影。

所述步骤(2)中,选取次级步长θ,且取值比允许的倾斜误差稍大,按公式计算初级角度步长θ1,计算公式为其中,θ1为初级步长,θ为次级步长,θmax为最大校正倾斜角度。

本发明的有益效果是:该扫描文档图像的倾斜校正方法,采用边缘标记点两级投影,提高了倾斜角的检测速度,同时采用投影直方图方差技术,投影面积方差最大的角度就是要检测的角度,只对边缘点进行投影,计算快速,在满足检测的精度的同时又能减少总的投影次数;校正速度快且准确率较高,满足了字符识别预处理的要求。

具体实施方式

为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚明白,以下结合实施例,对本发明进行详细的说明。应当说明的是,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。

该扫描文档图像的倾斜校正方法,包括以下步骤:

(1)扫描图像,寻找图像边缘标记点;

(2)首先在预定的角度范围内以一定角度步长对选定的图像边缘标记点做多方向投影,其次获取投影直方图;然后计算各角度投影直方图的均方差,求出所有投影直方图方 差的最大差分,将对应的投影角度作为倾角的粗略估值;最后以粗略估值为中心,以第1次投影步长为半径的角度范围内,再次以给定的检测精度为步长进行投影;重复第1次投影的工作,求出投影直方图方差的最大值,以对应的角度作为图像倾角的检测值;

(3)如果倾斜角度的绝对值小于设定值,不进行图像旋转;

(4)选取水平和垂直边缘标记点投影计算出的较小的角度作为倾斜角,对图像照倾斜角度进行旋转变换。

所述步骤(1)中,首先根据图像尺寸设置检测步长,对图像上、下、左、右四个区域进行检测;然后根据检测步长从水平方向和垂直方向分别检测图像,找出边缘标记点,对边缘标记点进行投影。

所述步骤(2)中,选取次级步长θ,且取值比允许的倾斜误差稍大,按公式计算初级角度步长θ1,计算公式为其中,θ1为初级步长,θ为次级步长,θmax为最大校正倾斜角度。

该扫描文档图像的倾斜校正方法,采用边缘标记点两级投影,提高了倾斜角的检测速度,同时采用投影直方图方差技术,投影面积方差最大的角度就是要检测的角度,只对边缘点进行投影,计算快速,在满足检测的精度的同时又能减少总的投影次数;校正速度快且准确率较高,满足了字符识别预处理的要求。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1