一种扫描文档图像的倾斜角自动检测方法

文档序号:6638595阅读:385来源:国知局
一种扫描文档图像的倾斜角自动检测方法
【专利摘要】本发明涉及一种扫描文档的倾斜角自动检测方法,属于图像处理【技术领域】。现有自动检测技术的适应性和抗噪声干扰能力差。本发明所述的方法通过对扫描文档图像的初始化处理、迭代行程处理、前景区域边缘提取、区域增长、区域特征提取及倾斜角提取等方法,计算扫描文档图像的倾斜角。采用本发明所述的方法,能通过图像处理技术,自动检测文档图像的倾斜角。本发明方法的特征有:1)有很强的抗噪声干扰能力;2)与文本纹理无关,适应各种图文混排、多种书写方向并存等复杂情形;3)适应于中文、英文文档情形。
【专利说明】-种扫描文档图像的倾斜角自动检测方法

【技术领域】
[0001] 本发明属于图像处理【技术领域】,具体涉及一种扫描文档图像的倾斜角自动检测方 法。

【背景技术】
[0002] 随着数字图像处理技术的快速发展,文字识别、图像识别、图像复原等处理已成为 非常重要的技术手段,而他们的处理对象大多数是通过扫描文档得到的数字图像。但是纸 质文档通过图像获取设备(如数码相机、扫描仪等)转化为数字文档图像过程中,由于人为 因素或扫描仪误差的影响,通过扫描得到的图像通常都会有一定的倾斜度。这种倾斜对后 期图像处理带来不同程度的困难,如影响版面分析与理解,使对文字区、图形区和图像区的 分割产生误差;使字符分割发生困难;引起字符明显变形,使得文字识别率降低。因此,倾 斜角自动检测是一项重要的文档图像预处理技术。
[0003] 目前常用的检测文档倾斜角方法有:霍夫变换、投影法、平行四边形法、交叉相关 法、无最近邻法等。用霍夫变换变换来发现直线的过程是将图像上的一个点映射为参数空间 上的一条直线,然后统计参数空间上直线相交次数最多的点坐标,即为原图像上直线参数, 是"一对多"的过程。因此,存在计算量大的问题,且参数空间的量化间隔影响直线角度的 检测精度。量化间隔越小,计算量越大,需要内存越多,不适用于批量处理。且不适合于文 本中存在横、纵、斜等多种书写方向(比如报纸)。投影法利用投影图在不同方向的某些特性 来提取角度,只适合于纯文本图像的倾斜角检测。平行四边形法利用在不同方向上具有不 同的平行四边形数量的特性来提取角度,对噪声敏感,不适合于文档中存在图表和噪声的 情形。交叉相关法利用平行线上的像素点建立相关矩阵,然后对相关矩阵在坚直方向上进 行投影,并使投影图的全局最大值对应于所检测的倾角。该方法计算量非常大,且不适合文 档中含噪声或图片情形。无最近邻法先找出所有连通区中心点的々个最近邻点,然后计算每 对近邻点的矢量方向,并统计生成直方图,直方图的峰值就对应于整个页面的倾角。该方法 计算量大、容易受到噪声和文本特性的干扰。因此,必须寻找一种能抵抗噪声干扰和适应各 种图文混排的倾斜角自动检测方法,满足实际的需要。


【发明内容】

[0004] 针对现有技术中存在的缺陷,本发明的目的是提出一种扫描文档图像的自动检测 倾斜角方法。该方法通过对扫描文档图像的初始处理、区域分割及区域特征提取等手段,能 在有噪声干扰的情况下,自动检测到扫描文档图像的倾斜度。
[0005] 为了达到以上目的,本发明采用的技术方案是:一种扫描文档图像的倾斜角自动 检测方法,包括以下步骤: (1)通过扫描仪获取数字化扫描图像,对扫描图像进行二值化及截边处理。
[0006] (2)对二值图像进行迭代行程处理、区域边缘提取、判断文档书写方向及区域边缘 图像的选择。
[0007] (3)对(2)获得的图像进行区域增长、直线拟合、直线特征提取及直线的有效性判 断。
[0008] (4)分析各条直线特征,提取扫描文档的倾斜度。
[0009] 为了使本发明获得更好的发明效果,步骤(1)中,采用二值化阈值为130。采用扫 描行或列的方法,计算行或列的像素均值和方差,通过设定阈值来找出文档图像中具有图 像或文字的前景区域。
[0010] 为了使本发明获得更好的发明效果,步骤(2)中,迭代行程处理由水平行程处理和 垂直行程处理两个步骤组成,通过循环迭代,使得经处理后的图像不再发生变化为止。
[0011] 为了使本发明获得更好的发明效果,步骤(2)中,区域边缘提取采用水平提取和垂 直提取相结合的策略,通过判断边缘累积量来区分文档中文字排版方向及选择恰当的区域 边缘图像。
[0012] 为了使本发明获得更好的发明效果,步骤(3)中,从边缘图像上端的像素开始进行 区域增长,邻域大小为2*2。对获得足够大的区域进行最小二乘法的直线拟合,提取其特征: 区域中心,长度,倾斜度及直线拟合度。直线拟合度的计算方法为区域中前景像素到直线的 平均垂直距离。通过对直线拟合度的判断来去除无效直线。
[0013] 为了使本发明获得更好的发明效果,步骤(4)中采用融合两种策略的倾斜度自动 提取方法。一种是采用直方图方法。第二种是采用中值方法。当检测到的直线数量达到一 定数量时,采用直方图方法,否则采用中值方法。
[0014] 本发明的效果在于:采用本发明所述方法,通过对区域边缘提取、区域增长方法 等,就可以自动计算出文档的倾斜度。同时,通过对文字排版方向的判断、对区域大小的判 断、对拟合直线的有效性判断及融合特征的倾斜度提取等,可以抵御扫描文档图像的噪声 干扰,适应图文混排及不同书写方向混合的情形。

【专利附图】

【附图说明】
[0015] 图1文档倾斜检测流程图; 图2水平行程处理示例; 图3扫描文档图像; 图4迭代行程处理后的文档图像; 图5垂直方向区域边缘提取示例; 图6垂直方向提取的前景区域边缘; 图7水平方向提取的前景区域边缘; 图8获得有效直线(深色)。

【具体实施方式】
[0016] 下面结合附图对本发明作进一步的描述。
[0017] 如图1所示,本发明包括图像截边、图像二值化、图像行程处理、区域边缘提取、图 像区域增长、区域特征提取及文档倾斜度提取七个步骤。
[0018] (1)图像二值化 一般扫描文档有背景底色,通过图像二值化后,去除背景色,仅保留文档或图像的前景 像素。假设文档图像为/,则二值化方法为:

【权利要求】
1. 一种扫描文档图像的倾斜角自动检测方法,其特征在于包括w下步骤: (1) .通过扫描仪获取纸质文档的数字化扫描图像,对扫描图像进行二值化及截边处 理; (2) .对二值图像进行迭代行程处理、区域边缘提取及文档书写方向判断,获取恰当的 区域边缘图像; (3) .对步骤(2)获得的区域边缘进行区域增长、区域特征提取及直线有效性判断,获 取有效直线; (4) .对步骤(3)获取的各条直线特征进行分析,提取扫描文档的倾斜度。
2. 如权利要求1所述的倾斜角自动检测方法,其特征是;步骤(1)中,采用二值化阔值 为130,采用扫描行或列的方法,计算每行或每列的像素均值和方差,通过设定阔值来找出 文档图像中具有图像或文字的前景区域。
3. 如权利要求1或2所述的倾斜角自动检测方法,其特征是;步骤(2)中,迭代行程处 理由水平行程处理和垂直行程处理两个步骤组成,通过循环迭代,使得经处理后的图像不 再发生变化为止。
4. 如权利要求3所述的倾斜角自动检测方法,其特征是;步骤(2)中,区域边缘提取采 用水平提取和垂直提取相结合,通过判断边缘累积来区分文档中文字书写方向,选择合适 的前景区域边缘图像。
5. 如权利要求4所述的倾斜角自动检测方法,其特征是;步骤(3)中,从边缘图像上端 的像素开始进行区域增长,邻域大小为2*2,对获得足够大的边缘区域进行最小二乘法的直 线拟合,提取直线宽度、直线中也、直线长度、直线倾斜角及直线拟合度的直线特征,直线拟 合度计算方法是累加区域中每个前景像素位置到拟合直线的垂直距离,并计算平均值,通 过对直线拟合度的判断来去除无效直线。
6. 如权利要求5所述的倾斜角自动检测方法,其特征是;步骤(4)中,采用融合两种策 略的倾斜度自动提取方法,一种策略是采用直方图方法;第二种策略是采用中值方法,当检 测到的直线数量达到一定数量时,采用直方图方法,否则采用中值方法。
【文档编号】G06K9/46GK104463126SQ201410769531
【公开日】2015年3月25日 申请日期:2014年12月15日 优先权日:2014年12月15日
【发明者】文志强, 曾志高, 朱文球 申请人:湖南工业大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1