名片图像倾斜角度的测量方法和装置的制作方法

文档序号:6472075阅读:177来源:国知局
专利名称:名片图像倾斜角度的测量方法和装置的制作方法
技术领域
本发明属于数字图像处理技术及0CR(光学字符识别)技术领域,特别涉及一种名 片图像倾斜角度的测量方法和装置。
背景技术
在当今的商务活动中,名片已经是商业合作伙伴、客户等的重要信息载体,面对大 量的名片,公司和个人都需要有一种方法进行自动、准确地信息采集和处理,目前一般采用 0CR(0ptical Character Recognition)系统完成此功能。在名片OCR系统中,输入的名片 图像可能存在一定角度倾斜(一般小于5。),这种倾斜会对名片的版面分析、字符切分及 字符识别产生不良影响,需要进行倾斜角度检测,然后根据角度进行图像校正。
现有的针对文档图像的倾斜检测方法,基本上都是基于二值图像的,主要可分为4 类基于投影的方法、基于HOUGH变换的方法、K-最近邻簇方法和基于交叉相关性的方法。
对于名片图像,其特点是文字行(列)较少,通常只有几行(列)或十几行(列), 文字个数较少,排版样式多变。K-最近邻簇方法需要较多的文字连通域才能计算出可靠的 结果,不适合名片图像;基于交叉相关性的方法的前提是文本具有一致的排版格式,也不适 合名片图像;基于HOUGH变换的方法计算量较大。所以上述四类用于文档图像倾斜检测的 方法中,基于投影的方法比较适合名片图像的倾斜检测。 申请号为200410080505. X的专利公开了一种图像处理方法,通过在图像中搜索 直线并根据直线的倾斜情况计算图像倾斜角度,在图像处理的过程中需要依赖于图像中的 直线。申请号为200710176208. 9的专利针对复杂文档图像,通过文本区域及非文本区域提 取连通区域的边界段作为倾斜特征计算倾斜角度,需要图像中存在较多的连通区域。这两 种方法对于名片图像,这两种方法适用性较差,而且都是直接计算图像的倾斜角度,而没有 预先自动判断图像是否需要计算倾斜角度。对于不存在倾斜的图像而言,倾斜角度为零,则 不需要进行倾斜角度计算。 文献《灰度名片图像快速倾斜检测和校正方法》(《中文信息学报》2004年01期, 63-70页)提出一种根据扫描名片图像中名片的四条边框直线进行倾斜角度检测的方法, 该方法简单快速,但是对于名片图像不存在边缘直线的情况则无能为力,而且仅仅根据边 缘直线计算出的角度精度不是很高。 利用投影方法计算名片图像的倾斜角度,计算结果准确,但是对于不存在倾斜的 名片图像进行计算,是一种浪费;利用图像中名片边框直线计算倾斜角度的方法,简单快 速,但是对于边框直线缺失的情况,其失去作用,对于边框直线受噪声污染的情况,其计算 结果不够准确。

发明内容
本发明提出了一种名片图像倾斜角度的测量方法和装置,本方法首先提取名片图 像的边缘图像,然后在边缘图像中搜索名片的四周边框直线,根据边框直线的倾斜程度判
4断图像是否存在倾斜,对于存在倾斜的图片,判断其文字的编辑方向,并沿着文字编辑方向 投影,利用投影特征计算图像的倾斜角度,既能自动区分名片图像倾斜与非倾斜,又能计算 出精确的倾斜角度。 名片图像倾斜角度的测量方法,包括如下步骤 步骤1 :输入并提取输入的名片图像的边缘。输入名片图像,提取灰度图像边缘作 为处理的基本内容。 步骤2:搜索名片图像四周的边框直线。自外向内在四个方向上对图像依次按行 列逐像素搜索,如果相邻行列记录到的第一个黑像素点的坐标在搜索方向上的位置差不大 于2个像素,则这两个黑像素点位于同一线段上,否则,新建线段。如果其中最长的线段长 度超过既定阈值,则该线段所在直线为此方向上的边框直线,否则,此方向上不存在边框直 线。 步骤3 :根据搜索到的边框直线判断图像是否倾斜。如果边框直线数大于等于2, 并且标定为倾斜的边框直线数大于搜索到的边框直线数的0. 7倍,则该图像倾斜;否则,图 像不存在倾斜,本方法结束。 步骤4 :对标记倾斜的图像,判断图像中文字的编辑方向。分别在图像的竖直和水 平投影直方图内,以相同投影值区间和投影值间隔划定直线,分别计算直线穿过的既定宽 度的投影数目之和;将投影数目较大的方向作为文字的编辑方向。
步骤5 :利用投影方法计算图像的倾斜角度。在图像的文字编辑方向上,在_5度
到+5度之间,按相等的角度间隔分别对图像进行投影,计算所得的每个投影直方图投影值
的平方和,图像的倾斜角度为投影平方和值最大的投影直方图的对应的投影角度。 所述步骤2中按行列逐像素搜索时,搜索范围为该方向上图像的边缘至该图像的 所述步骤2的既定阈值的取值范围为整个图像对应宽度的;~ ;。 所述步骤3中进行倾斜判定,分别取最长线段起止端的相同数目的坐标点的平均 坐标值,如果计算所得倾斜角度大于倾斜阈值,则将该线段所在的边框直线标记为倾斜;否 则标记为非倾斜;没有搜索到边框直线的边,直接标记该边为倾斜。 所述步骤4中的既定宽度范围根据图像中字符的行高进行调整;投影区间以水平 和竖直投影直方图的最大投影值中较小者和其1/3为上下限。 所述步骤4中判定文字编辑方向时,如果竖直和水平两个方向上的投影数目相 等,则文字编辑方向为两投影直方图的投影值平方和大的方向。 所述步骤5中对图像进行投影时,如果图像的文字编辑方向为水平方向,将图像 等分成一系列竖条图像,并对各竖条图像按照0°投影,将得到的各投影直方图合成一个该 投影方向上的整体投影直方图;如果图像的文字编辑方向为竖直方向,则将图像旋转90° 再进行上述处理。 所述步骤5中将图像划分时,竖条图像的宽度w为
其中,L为图像的宽度,a为投影的角度。 名片图像倾斜角度的测量装置,由以下模块组成 图像输入模块,输入并提取输入的名片图像的边缘。输入名片图像,提取灰度图像 边缘作为处理的基本内容。 边框搜索模块,搜索名片图像四周的边框直线;自外向内在四个方向上对图像依 次按行列逐像素搜索,如果相邻行列记录到的第一个黑像素点的坐标在搜索方向上的位置 差不大于2个像素,则这两个黑像素点位于同一线段上,否则,新建线段。如果其中最长的 线段长度超过既定阈值,则该线段所在直线为此方向上的边框直线,否则,此方向上不存在 边框直线。 倾斜判定模块,根据搜索到的边框直线判断图像是否倾斜。如果边框直线数大于 等于2,并且标定为倾斜的边框直线数大于搜索到的边框直线数的0. 7倍,则该图像倾斜; 否则,图像不存在倾斜,本装置处理过程结束。 文字方向判定模块,对标记倾斜的图像,判断图像中文字的编辑方向。分别在图像
的竖直和水平投影直方图内,以相同投影值区间和投影值间隔划定直线,分别计算直线穿
过的既定宽度的投影数目之和;将投影数目较大的方向作为文字的编辑方向。 角度计算模块,利用投影方法计算图像的倾斜角度。在图像的文字编辑方向上,
在_5度到+5度之间,按相等的角度间隔分别对图像进行投影,计算所得的每个投影直方图
投影值的平方和,图像的倾斜角度为投影平方和值最大的投影直方图的对应的投影角度。 本发明名片图像倾斜角度的测量方法和装置,与现有技术相比优点在于 1、本发明通过采集图像的边框直线的方式对图像进行倾斜判定,可快速将图像分
为倾斜和无倾斜两类,对于无倾斜的图像,不再进行倾斜角度的计算步骤,对于倾斜图像,
再利用其他方法计算精确的倾斜角度; 2、本发明通过比较图像水平和竖直两个方向上投影直方图的特征来快速判断文 字的编辑方向,确定文字编辑方向对于投影计算倾斜角度和名片图像的版面分析都具有很 大的指导作用; 3、本发明对判断为倾斜的图像利用投影方法计算精确的图像倾斜角度,其中投影 直方图的计算采用图像"错切"模拟图像旋转,加速了投影直方图的计算过程。


图1为本发明名片图像倾斜角度的测量方法的方法流程图; 图2为本发明名片图像倾斜角度的测量方法的实施例的名片样张的二值边缘图 像; 图3为本发明名片图像倾斜角度的测量方法的倾斜数字图像中的直线的示意图;
图4a为本发明名片图像倾斜角度的测量方法的标准的水平无倾斜模板单栏文字 版面示意图; 图4b为本发明名片图像倾斜角度的测量方法的图4a的竖直投影直方图;
图4c为本发明名片图像倾斜角度的测量方法的图4a的水平投影直方6
图5a为本发明名片图像倾斜角度的测量方法的实施例二值边缘图像的竖直投影 直方图; 图5b为本发明名片图像倾斜角度的测量方法的实施例二值边缘图像的水平投影 直方图; 图6a为本发明名片图像倾斜角度的测量方法的投影方向为1°时名片图像划分 成一系列竖条图像的示意图; 图6b为本发明名片图像倾斜角度的测量方法的在投影方向为1°时名片图像的 整体投影直方图; 图7为本发明名片图像倾斜角度的测量方法的实施例各投影方向的直方图投影 值平方和曲线。
具体实施例方式
为了能更清楚地理解本发明的技术内容,特举以下过程详细说明。 本发明提出的技术方案适用于名片扫描或拍摄的灰度图像,由于背景噪声会影响
边框直线的检测,所以本发明中的图片扫描或拍摄时的背景比较干净,没有明显纹理,如果
图像为彩色,可先转换为灰度图像,再采用本发明技术方案进行处理。 为了说明倾斜角度的定义,将名片图像中的文字行(或文字列)抽象成一条直线, 当该直线水平或竖直时,名片图像的倾斜角度都为O(即无倾斜),当该直线由倾斜角度为 O的位置发生旋转时,旋转角度即为图像的倾斜角度,规定顺时针旋转时,倾斜角度为负,逆 时针旋转时,倾斜角度为正,由于在倾斜角度较大时,边框直线的检测会不准确,本发明的 技术方案适用于倾斜角度在-5°到+5°之间的情况。实际的名片图像是在人的干预下扫 描或拍摄得到的,其倾斜角度一般在-5° +5°之间,本发明的技术方案满足一般的名片 图像需求。 名片图像倾斜角度的测量方法,如图1所示,包括如下步骤 步骤一输入并提取输入的名片图像的边缘。输入名片图像,提取灰度图像边缘 为数字图像处理的基本内容。本实施例采用Ca皿y边缘算子完成边缘提取,其算法不赘述。 边缘图像为二值图像,每个像素点采用一个bit位存储,这样每个像素点的取值非0即1 ,在 本实施例中,前景用1表示,背景用0表示,如果对应黑白两种颜色,则前景用黑色表示,背 景用白色表示。得到图2,为是本实施例的边缘二值图像。 步骤二 在边缘二值图像中搜索名片的四边框直线。名片在扫描或拍摄成图像时, 名片的四条边会在与背景相交的地方形成明显的边缘,这些边缘会在边缘二值图像中反映 出来,为方便描述,称为名片的边框直线。 以名片的上边框直线为例,说明直线的搜索过程。名片的上边框直线,一般位于整 个名片图像的上三分之一区域内,故在名片二值图像每一列的上三分之一像素点中,自上 到下按像素搜索遇到的第一个黑像素点(简称上端第一黑像素点),如果存在这样的黑像 素点,则记录下该点的坐标值,否则不记录,直至所有列搜素完毕。 得到所有列的上端第一黑像素点后,可以采用最小二乘法拟合边框直线,但是其 计算量较大,故本方法采用一种简单快速的检测方法 如图3所示,在倾斜图像中,原来的一条水平直线变成一系列上下相邻的线段,这样就可以通过检测连续线段来确定上边框直线。从左到右对所有列的第一黑像素点进行扫 描,如果当前列中的上端第一黑像素点与前一列中的上端第一黑像素点在竖直方向的距离 差不超过2个像素点,则判定当前像素点与前一像素点在同一线段上,否则,以当前像素点 为左端点新起一个线段,依次按列搜索,直到最右一列。通过上述方法,找到一系列线段,如 果其中最长的超过既定阈值,则该线段所在直线即为上边框直线,否则,图像不存在上边框 直线。 所述既定阈值的取值范围为整个图像高度的l l。本实施例中的四条边框直线, 既定阈值设为图像宽度的i,则在图像的上l区域中逐列按像素搜索上边框直线,检测到上 边框直线后,同理,在图像的下l区域中逐列按像素搜索下边框直线;在图像的左l区域中
逐列按像素搜索左边框直线,在图像的右l区域中逐列按像素搜索右边框直线。 在本实施例中,图像宽度为400,图像高度为300,上边框直线中搜到的最长线段 长度为362,下边框直线中搜到的最长线段长度为359,左边框直线中搜到的最长线段长度 为204,右边框直线中搜到的最长线段长度为202,故四条边框直线全部存在。
步骤三判断图像是否倾斜。先判断步骤二中搜索到的每一条边框直线是否倾斜, 然后根据边框直线倾斜情况判断图像是否倾斜。对于没有搜索到边框直线的边,直接标记 为倾斜。在没有明确信息表明图像无倾斜的情况下将图像标记为倾斜,以最大程度的保证 将所有倾斜图像都计算出倾斜角度。对于已经搜索到边框直线的边,如果其倾斜角度大于 倾斜阈值,则标记为倾斜,倾斜阈值为判定直线是否倾斜的依据,大于该倾斜阈值,则图像 倾斜,反之图像不倾斜。本实施例中倾斜阈值设置为0. 5° 计算倾斜角度时,分别取最长线段的起止端的相同数目的坐标点的平均坐标值来 计算所得倾斜角度。本实施例中,边框直线的倾斜角度计算如下计算其最长线段起始端 第6至第10个像素点的平均坐标值和终止端倒数第10至倒数第6个像素点的平均坐标值 (起始端前几个像素点和终止端的最后几个像素点可能不准确,计算中避开这些像素点), 利用这两个平均坐标值计算直线的倾斜角度。这里只是利用倾斜角度判断图像是否倾斜, 所以倾斜角度不分正负,都按正角度计算。 如果已经搜索到的边框直线数目和其中的倾斜边框直线数目满足下面两个条 件 (1)搜索到的边框直线数目大于等于2 ; (2)倾斜边框直线数目大于搜索到的边框直线数目的0. 7倍;则判断图像为倾斜, 否则,图像不存在倾斜,本方法结束。 在本实施例中,以图像的左上点为坐标原点,水平向右为x轴正方向,竖直向下为 y轴正方向。上边框直线中的最长线段两端的两个平均值坐标分别为(35,40)、 (382,63), 其对应倾斜角度的余切值为(382-35)/(63-40) " 15,arcctg15 " 3.8° ,即上边框直线的 倾斜角度大于0.5。,上边框直线是倾斜的。 同理,可判断下边框直线、左边框直线、右边框直线都是倾斜的。本实施例中共检 测到边框直线4条,4 > 2,且其中倾斜边框直线4》4X0. 7,满足上面的判断图像倾斜的两个条件,所以判断该图像倾斜。 步骤四判定图像文字的编辑方向。在投影中,需要知道是沿水平方向投影还是沿 竖直方向投影,所以需要提前知道图像中文字的编辑方向,即判定图像中文字是水平方向 排列还是竖直方向排列。 如图4a所示,对于这种不存在倾斜且字符排列规则的图像,分别做竖直方向投影 直方图(如图4b所示),水平方向投影直方图(如图4c所示)。在水平投影直方图中,文 字行形成一个柱状投影,行与行之间的间隔则是空白,而竖直投影直方图则不会存在这种 特征,所以只要在投影直方图中沿某个固定投影值做一条水平直线,通过计算这条直线穿 越的满足既定宽度范围的柱状投影的个数,就可以判断图像中文字的编辑方向。投影直方 图中,投影值代表图像在该水平行(或竖直行)的文字像素的多少,在沿文字编辑方向的 投影直方图中,文字行的投影呈明显的柱状,文字行之间则没有投影值,在一定投影值处的 水平直线穿过的满足既定宽度范围的柱状投影较多,而在垂直文字编辑方向的投影直方图 中,没有明显的文字行及行间距,同样的水平直线穿过的满足既定宽度范围的柱状投影较 少。所以,在图像的水平和竖直投影直方图中,在一定投影值处的水平直线穿过的满足既定 宽度范围的柱状投影数目较多的方向为文字的编辑方向。 上述方法对于不存在倾斜且单栏排列的文本图像效果很好,但是对于排版格式多 变且存在倾斜的名片图像并不适用。 对于名片图像,由于排版或倾斜的影响,上述方法中的固定投影值T不易确定,所 以本发明取多个投影值I\, T2, . . . , i;划定直线,通过把每个投影值处获得的宽度在既定宽 度范围L内的柱状投影数相加来判断文字编辑方向。投影直方图中的柱状投影对应着名片 中的文本行(列),设定投影值区间是为了使在投影值上划定的直线穿过尽可能多的柱状 投影,如果投影值区间下限太小,则由于图像倾斜,所有的柱状投影可能都连在一起,无法 区分;如果投影值区间的上限太大,则只能找到最长的文字行(列)。所以,投影值区间的 大小和名片图像中文字行(列)的像素长度相关。在划定投影值区间后,再对整个区间进 行分割,大概分成8 10个等分小区间,每个小区间的像素宽度就是投影值间隔。
多个投影值区间的具体确定方法如下各取水平和竖直投影直方图中的最大投影 值,然后取这两个值中较小的一个,以这个较小值的1/3和较小值的本身作为投影值区间 的下限和上限,即投影值区间[L,TJ,并以5个像素为间隔将该区间等分,如果不能正好等 分,则将最后一个小区间向外扩充,形成n个投影值1\, T2,. . . , Tn。既定宽度范围L与图像 中字符的大小相关,在300X400的图像中,选取L为[6,30]。在该图像对应的竖直投影直 方图中的投影值1\,12,. . . ,Tn处划定直线,分别水平截取对应投影值的柱状投影,并计算穿 过在既定宽度范围L内的柱状投影的数目之和。同理,计算得到水平投影直方图中投影值 1\, T2, . . . , Tn处水平截取的在既定宽度范围L内的柱状投影的数目之和。
比较水平方向和竖直方向上所得的满足既定宽度范围L的柱状投影数目的大小, 文字编辑方向为数目较大的方向。如果两个数值相等,则计算水平投影直方图和竖直投影 直方图中投影方向上各像素的投影值平方和,文字编辑方向为平方和大的方向。
图5a和图5b分别为本实施例的竖直投影直方图和水平投影直方图,其中,各水 平直线为对应各投影值1\, T2, ..., Tn的穿过柱状投影的直线。本实施例中,图像大小为 300X400,水平和竖直投影直方图中各自最大投影值的较小值为58,投影值1\, T2, ..., Tn
9取19 58之间,每隔5取一个值,则n = 8,对应的水平直线共有9条,由于最后一个小区 间不足5个像素,向外扩一下,取Tn = 59。柱状投影的既定宽度范围L取为6 30,这个 值是以图像中文字大小为参照取的。在竖直投影直方图和水平投影直方图中,这9条水平 直线在竖直投影直方图中截取的宽度在6 30之间的柱状投影之和为8,在水平投影直方 图中截取的宽度在6 30之间的柱状投影之和为24, 24 > 8,所以本实施例中图像的文字 编辑方向为水平方向。 步骤五计算图像倾斜角度。步骤四中,已经得出倾斜图像中文字的编辑方向。利
用投影计算图像倾斜角度的方法如下图像倾斜角度为-5° +5°范围内,每隔一微小角
度取一个角度值,然后分别沿这些角度方向对名片二值边缘图像进行投影,得到对应的投
影直方图;计算每个投影直方图的投影值的均方差。均方差越大,则图像各行(列)的投影
值波动越大,即图像各行(列)与行(列)间的空白区域对比越明显,就说明对应的投影方
向更趋近与图像的倾斜角度,即投影值的均方差最大的投影直方图对应的角度就是图像的
倾斜角度。在实际计算中,各方向投影直方图的投影值的均值基本相等,所以用投影值的平
方和代替均方差,投影直方图的投影平方和最大时对应的角度为图像的倾斜角度。 由于二值边缘图像按行存储,且一个像素点对应一个bit位,8个bit形成一个计
算机的基本运算单位——字节(byte),所以其0。的水平投影可以通过按字节查表的方式
进行快速计算;对其他投影方向,可以通过按照投影角度将图像旋转,然后计算旋转后图像
的水平投影直方图的方式完成,但是用于处理图像旋转的计算量很大,增加了硬件的负担。 如图3所示,数字图像中的水平直线经旋转后以上下相邻的连续线段的形式呈
现。由此可知,将数字图像按照某个角度旋转,其结果相当于将原图像划分成一系列竖条图
像,竖条图像的宽度由投影角度和图像的宽度决定,这些相邻的竖条图像在竖直方向依次
相差一个像素的高度。 本方法采用近似模拟图像旋转的方式来完成此步计算,根据投影方向把原图像错
切成一系列竖条图像,然后对每个竖条图像按照0°的方法投影,再把得到的各竖条图像的
投影直方图合成一个整体的投影直方图,得到该投影方向上的图像投影直方图。 选定竖条图像宽度时,每个竖条图像的宽度w为
丄 其中,L为图像的宽度,a为投影的角度,求得的角度余切都用正值表示。用图像
的宽度L除以投影角度a的余切值,并对结果进行上取整,即得到了划分的竖条图像的个
数。在用图像的宽度L除以竖条图像的个数,得到等分后的竖条图像的宽度w。 本实施例中,倾斜角度范围为-5° +5°之间,每隔0.25。取一个角度值,则共
有41个候选的投影方向。以1°投影角度为例,ctgl"57,图像的宽度为400,则竖直图像
的宽度w为
400 柳
陽400-闷
8
=50
10
如图6a所示,即为在r投影方向上对图像进行错切的示意图。然后,对每个竖
条图像按照0。投影的方法计算投影直方图;根据相邻竖条图像在竖直方向上相差一个像
素,将这8个投影直方图合成一个完整的投影直方图。如图6b所示,即为将所有错切图像
条的直方图合成的最终的完整直方图。该直方图的投影值的平方和为265850。 在计算出41个投影方向的投影直方图的投影值平方和之后,对这41个数据做一
个均值滤波,然后取最大值对应的角度即为图像的倾斜角度。本实施例中,41个投影值平方
和均值滤波后的值如图7所示,其中"*"处所标识位置的平方和值最大,对应于-3. 5° ,故
投影直方图的投影值平方和的最大值对应的角度为-3.5° ,即图像的倾斜角度为-3.5° 。 本方法对应了一种名片图像倾斜角度的测量装置,由以下模块组成 图像输入模块,输入并提取输入的名片图像的边缘输入名片图像,提取灰度图像
边缘作为处理的基本内容,将提取后的结果传输至边框搜索模块。 边框搜索模块,自图像外向内在四个方向上对图像依次按行列逐像素搜索,记录 遇到的第一个黑像素点的坐标;如果相邻列的第一个黑像素点在搜索方向上的差不大于2 个像素,则这两个黑像素点同一线段上,否则,以该像素点为端点新建线段;如果其中最长 的线段长度超过既定阈值,则该线段所在直线为此方向上的边框直线,否则,图像此方向上 不存在边框直线,最后将边框直线输出到倾斜判定模块。 倾斜判定模块,对搜索到的边框直线进行倾斜判定,如果边框直线数大于等于2, 并且标定倾斜的边数大于搜索到的边框直线数的0. 7倍,则该图像倾斜,将倾斜的图像发 送到文字方向判定模块;否则本装置处理过程结束。 文字编辑方向判定模块,对标记倾斜的图像,分别在图像的竖直和水平投影直方 图内,以相同投影值区间和投影值间隔划定直线,分别计算直线穿过的满足既定宽度范围 的柱状投影数目;将柱状投影数目较大的方向作为文字的编辑方向发送到角度计算模块计 算倾斜角度。 角度计算模块,按相等的角度间隔分别对图像进行投影,计算所得的每个投影直 方图投影值的平方和,图像的倾斜角度为投影平方和值最大的投影直方图的对应的投影角 度。 本实施例中,图像文字的编辑方向为水平方向,对于编辑方向为竖直方向的图像, 可以先把其进行90°旋转,然后再采用上述投影方法计算其倾斜角度。
权利要求
一种名片图像倾斜角度的测量方法,其特征在于,包括如下步骤步骤一输入并提取输入的名片图像的边缘;输入名片图像,提取灰度图像边缘作为处理的基本内容;步骤二搜索名片图像四周的边框直线;自外向内在四个方向上对图像依次按行列逐像素搜索,如果相邻行列记录到的第一个黑像素点的坐标在搜索方向上的位置差不大于2个像素,则这两个黑像素点位于同一线段上,否则,新建线段;如果其中最长的线段长度超过既定阈值,则该线段所在直线为此方向上的边框直线,否则,此方向上不存在边框直线;步骤三根据搜索到的边框直线判断图像是否倾斜;如果边框直线数大于等于2,并且标定为倾斜的边框直线数大于搜索到的边框直线数的0.7倍,则该图像倾斜;否则,图像不存在倾斜,本方法结束;步骤四对标记倾斜的图像,判断图像中文字的编辑方向;分别在图像的竖直和水平投影直方图内,以相同投影值区间和投影值间隔划定直线,分别计算直线穿过的既定宽度的投影数目之和;将投影数目较大的方向作为文字的编辑方向;步骤五利用投影方法计算图像的倾斜角度;在图像的文字编辑方向上,在-5度到+5度之间,按相等的角度间隔分别对图像进行投影,计算所得的每个投影直方图投影值的平方和,图像的倾斜角度为投影平方和值最大的投影直方图的对应的投影角度。
2. 根据权利要求1所述一种名片图像倾斜角度的测量方法,其特征在于所述步骤二中按行列逐像素搜索时,搜索范围为该方向上图像的边缘至该图像的l处。
3. 根据权利要求1所述一种名片图像倾斜角度的测量方法,其特征在于所述步骤二 的既定阈值的取值范围为整个图像对应宽度的l~I。
4. 根据权利要求1所述一种名片图像倾斜角度的测量方法,其特征在于所述步骤三 中进行倾斜判定,分别取最长线段起止端的相同数目的坐标点的平均坐标值,如果计算所 得倾斜角度大于倾斜阈值,则将该线段所在的边框直线标记为倾斜;否则标记为非倾斜; 没有搜索到边框直线的边,直接标记该边为倾斜。
5. 根据权利要求1所述一种名片图像倾斜角度的测量方法,其特征在于所述步骤四 中的既定宽度范围根据图像中字符的行高进行调整;投影区间以水平和竖直投影直方图的 最大投影值中较小者和其1/3为上下限。
6. 根据权利要求1所述一种名片图像倾斜角度的测量方法,其特征在于所述步骤四 中判定文字编辑方向时,如果竖直和水平两个方向上的投影数目相等,则文字编辑方向为 两投影直方图的投影值平方和大的方向。
7. 根据权利要求1所述一种名片图像倾斜角度的测量方法,其特征在于所述步骤五 中对图像进行投影时,如果图像的文字编辑方向为水平方向,将图像等分成一系列竖条图 像,并对各竖条图像按照0°投影,将得到的各投影直方图合成一个该投影方向上的整体投 影直方图;如果图像的文字编辑方向为竖直方向,则将图像旋转90。再进行上述处理。
8. 根据权利要求1所述一种名片图像倾斜角度的测量方法,其特征在于所述步骤五 中将图像划分时,竖条图像的宽度W为其中,L为图像的宽度,a为投影的角度。
9. 一种名片图像倾斜角度的测量装置,其特征在于,由以下模块组成 图像输入模块,输入并提取输入的名片图像的边缘;输入名片图像,提取灰度图像边缘 作为处理的基本内容;边框搜索模块,搜索名片图像四周的边框直线;自外向内在四个方向上对图像依次按 行列逐像素搜索,如果相邻行列记录到的第一个黑像素点的坐标在搜索方向上的位置差不 大于2个像素,则这两个黑像素点位于同一线段上,否则,新建线段;如果其中最长的线段 长度超过既定阈值,则该线段所在直线为此方向上的边框直线,否则,此方向上不存在边框 直线;倾斜判定模块,根据搜索到的边框直线判断图像是否倾斜;如果边框直线数大于等于 2,并且标定为倾斜的边框直线数大于搜索到的边框直线数的0. 7倍,则该图像倾斜;否则, 图像不存在倾斜,本装置处理过程结束;文字方向判定模块,对标记倾斜的图像,判断图像中文字的编辑方向;分别在图像的竖 直和水平投影直方图内,以相同投影值区间和投影值间隔划定直线,分别计算直线穿过的 既定宽度的投影数目之和;将投影数目较大的方向作为文字的编辑方向;角度计算模块,利用投影方法计算图像的倾斜角度;在图像的文字编辑方向上,在-5 度到+5度之间,按相等的角度间隔分别对图像进行投影,计算所得的每个投影直方图投影 值的平方和,图像的倾斜角度为投影平方和值最大的投影直方图的对应的投影角度。
全文摘要
本发明名片图像倾斜角度的测量方法和装置,属于OCR技术领域。本方法首先提取名片图像的边缘图像,然后在边缘图像中搜索名片的四周边框直线,根据边框直线的倾斜程度判断图像是否存在倾斜,对于存在倾斜的图片,判断其文字的编辑方向,并沿着文字编辑方向投影,利用投影特征计算图像的倾斜角度。通过采集图像的边框直线的方式对图像进行倾斜判定,可快速将图像分为倾斜和无倾斜两类,并分别处理。通过比较图像水平和竖直两个方向上投影直方图的特征来快速判断文字的编辑方向,确定文字编辑方向对于投影计算倾斜角度和名片图像的版面分析都具有很大的指导作用。
文档编号G06K9/32GK101770575SQ200810246629
公开日2010年7月7日 申请日期2008年12月31日 优先权日2008年12月31日
发明者朱军民, 李永彬 申请人:汉王科技股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1