用于全景二值图像的反白处理方法和装置的制作方法

文档序号:6338532阅读:263来源:国知局
专利名称:用于全景二值图像的反白处理方法和装置的制作方法
技术领域
本发明属于图像处理领域,涉及一种图像处理的方法和装置,具体涉及一种用于 全景二值图像的反白处理方法和装置。
背景技术
电子扫描笔(简称扫描笔)是OCR的重要应用之一。扫描笔的技术原理大致为首 先,光学摄像头按照一定频率对被扫描资料进行连续拍照,获取被扫资料的图像序列,然后 将图像序列拼接成一幅全景二值图像并进行OCR处理。在获取的全景二值图像中,大多数 情况下,是白底黑字,这样的二值图像可以直接送到OCR模块进行识别,但是还存在黑底白 字的情况,OCR模块无法处理,需要先进行颜色翻转。扫描笔获取的全景二值图像内容单一,一般就是待识别文字,而且受扫描笔图像 采集区域大小的限制,图像中包含的文字行数目较少。全景二值图像中黑底白字区域有一 个显著的特点,就是黑色像素将整个区域连通在一起形成一个连通域。对于全景二值图像, 需要首先判断其中是否存在反白区域,在存在反白区域的情况下,需要准确获取反白区域 的范围,以便执行颜色翻转。二值图像反白判断一般是通过计算图像区域内的黑白像素比 值来进行的,如果白像素数目多于黑像素数目,则认为图像是正常的白底黑字,如果黑像素 数目多于白像素数目,则认为是黑底白字。这种判断方法准确性较差,尤其当文字笔画比 较粗时,更容易发生误判。

发明内容
本发明所要解决的技术问题为提出一种用于全景二值图像的反白处理方法,该方 法以全景二值图像中的连通域为处理单位,通过连通域上下边线的光滑性判断是否存在反 白连通域,并能准确计算反白连通域的边界范围以进行颜色翻转。本发明公开了一种用于全景二值图像的反白处理方法,包括以下步骤 步骤(1),对全景二值图像进行连通域标记;
步骤(2),根据标记后的连通域统计全景二值图像中的字符高度; 步骤(3),根据字符高度求取候选反白连通域;
步骤(4),根据候选反白连通域的上下边线进行筛选,筛选得到反白连通域后进行像素 反色。进一步,所述步骤(1)进行连通域标记时,记录构成连通域的所有黑像素点。进一步,所述步骤(2)中统计全景二值图像中的字符高度时,根据所述黑像素点计 算全景二值图像的边缘图像,标记边缘图像的边缘连通域,去掉其中异常的边缘连通域,统计剩余边缘连通域的高度得到全景二值图像中的字符高度。进一步,所述统计剩余边缘连通域的高度时,如果剩余的边缘连通域为0,则全景 二值图像中的字符高度为O ;如果剩余边缘连通域大于0且小于5,则取剩余边缘连通域的 最大高度作为全景二值图像中的字符高度;如果剩余边缘连通域大于等于5,则将剩余边 缘连通域的高度从大到小排序,从大到小依次累加各个高度值对应的边缘连通域个数,当 累加和大于等于剩余边缘连通域总个数的五分之一时停止累加,此时所对应的高度值即为 全景二值图像中的字符高度。进一步,所述异常的边缘连通域为宽度大于高度的两倍的边缘连通域。进一步,所述步骤(3)中候选反白连通域为宽度大于字符高度4倍的连通域。进一步,所述步骤(4)中根据候选反白连通域的上下边线进行筛选时,利用全景二 值图像的上下边缘调整候选反白连通域的上下边线,根据调整后的上下边线之间的白像素 点数目排除由黑像素构成的直线或曲线区域,根据得到的各候选反白连通域中最长的平滑 线段进行筛选,得到反白连通域。进一步,所述上下边线分别为由各候选反白连通域的每一列中最上一个和最下一 个黑像素点构成的连线。进一步,所述根据得到的各候选反白连通域中最长的平滑线段进行筛选时,如果 每个候选反白连通域中最长的平滑线段的长度大于该候选反白连通域宽度的三分之二,则 该候选反白连通域为反白连通域。进一步,所述平滑线段为由依次紧邻的纵坐标相差不超过2的像素点构成的线 段。进一步,所述像素反色为将黑像素置为白像素,将白像素置为黑像素。本发明还公开了一种用于全景二值图像的反白处理装置,包括以下模块 标记模块,对全景二值图像进行连通域标记;
统计模块,根据标记后的连通域统计全景二值图像中的字符高度; 求取模块,根据字符高度求取候选反白连通域;
反色模块,根据候选反白连通域的上下边线进行筛选,筛选得到反白连通域后进行像 素反色。本发明用于全景二值图像的反白处理方法和装置,以全景二值图像中的连通域为 处理单位,通过连通域上下边线的光滑性筛选得到反白连通域,并能准确计算反白连通域 的边界范围以进行颜色翻转,本发明不受图像中文字的笔画粗细的影响,反白连通域定位 的准确性大大提高,图像反白的效果更好。


图1为本发明用于全景二值图像的反白处理方法的流程图。图2为本发明用于全景二值图像的反白处理方法实施例中的全景二值图像。图3为本发明用于全景二值图像的反白处理方法实施例中的全景二值图像的连 通域示意图。图4为本发明用于全景二值图像的反白处理方法实施例中的全景二值图像的边缘图像。图5为本发明用于全景二值图像的反白处理方法实施例中的全景二值图像的边 缘图像的边缘连通域示意图。图6为本发明用于全景二值图像的反白处理方法实施例中去掉异常边缘连通域 后的剩余边缘连通域的示意图。图7至图10为本发明用于全景二值图像的反白处理方法实施例中的四个候选反 白连通域。图11为本发明用于全景二值图像的反白处理方法实施例中图10所示候选反白连 通域的上下边线示意图。图12为本发明用于全景二值图像的反白处理方法实施例中的全景二值图像的上 下边缘示意图。图13为本发明用于全景二值图像的反白处理方法实施例中的候选反白连通域之 四的下边线调整示意图。图14为本发明用于全景二值图像的反白处理方法实施例中的图10所示候选反白 连通域的下边线调整后的示意图。图15为本发明用于全景二值图像的反白处理方法实施例中的全景二值图像经本 发明方法处理后的结果图像。
具体实施例方式为了能更清楚地理解本发明的技术内容,特举以下实施例详细说明。如图2所示为本实施例中的全景二值图像,为了清楚表明图像的大小范围,特将 图像四边的像素表示成灰色,后续图像也做了同样的处理。本发明公开了一种用于全景二值图像的反白处理方法,如图1所示,针对图2所示 的全景二值图像,包括以下步骤
步骤101,对全景二值图像进行连通域标记。在本实施例中,采用8连通标记,同时将组 成连通域的黑像素点记录下来,连通域标记的结果如图3所示,其中连通域用灰色方框示意。步骤102,根据标记后的连通域统计全景二值图像中的字符高度。由于全景二值图 像中可能包含白底黑字部分,也可能包含黑底白字部分,为了统计字符高度,首先对全景二 值图像取边缘图像,在全景二值图像中,如果某个黑像素点的左邻像素点或右邻像素点或 上邻像素点或下邻像素点为白像素点,则该黑像素点为边缘像素点,各边缘像素点构成边 缘图像。本实施例中得到的边缘图像如图4所示。然后对边缘图像进行8连通域标记,标 记结果如图5所示,其中的每个灰色方框表示一个标记所得的边缘连通域,本实施例中共 有137个边缘连通域。在得到的各个边缘连通域中去掉其中异常的边缘连通域,所谓异常 的边缘连通域是指边缘连通域的宽度大于高度的两倍的边缘连通域,去掉异常的边缘连通 域后的结果如图6所示,还剩108个边缘连通域。统计剩余边缘连通域的情况,如果剩余边 缘连通域个数为0,则全景二值图像中的字符高度为0 ;如果剩余连通域大于0且小于5,则 取剩余边缘连通域的最大高度来为全景二值图像中的字符高度;如果剩余边缘连通域大于等于5,则将剩余边缘连通域的高度从大到小排序,从大到小依次累加各个高度值对应的边 缘连通域个数,当累加和大于等于剩余边缘连通域总个数的五分之一时停止累加,此时所 对应的高度值即为全景二值图像中的字符高度。本实施例中,字符高度为61。步骤103,根据字符高度求取候选反白连通域。全景二值图像中黑底白字区域有 一个显著的特点,就是黑色像素将整个区域连通在一起形成一个连通域,这样,黑底白字反 色区域的连通域的宽度将大大超过字符高度,以此作为选择候选反白连通域的条件。本实 施例中,选择候选反白连通域的条件具体为连通域的宽度大于全景二值图像中字符高度的 4倍,即大于M4,满足此条件的候选反白连通域有四个,分别如图7、图8、图9、图10所示。步骤104,根据候选反白连通域的上下边线进行筛选,筛选得到反白连通域后进行 像素反色。候选反白连通域根据连通域的宽高比值选择,如果白底黑字情况下字符发生粘 连,连通域的宽高比值也会满足候选反白连通域的条件,所以,候选反白连通域还需要进一 步处理以找出真正的反白连通域。反白连通域的上边线及下边线一般比较光滑,而非反白 连通域一般不具有此性质,所以可以据此判断反白连通域。本实施例中,以图10所示的第 四个候选反白连通域为例来说明本步骤,具体如下
1)计算候选反白连通域的上下边线。上边线是由当前连通域每一列中最上一个黑像素 点构成的线,下边线是由当前连通域每一列中最下一个黑像素点构成的线。图10所示的候 选反白连通域的上下边线如图11所示。2)利用全景二值图像的上下边缘调整候选反白连通域的上下边线。全景二值图像 由图像帧序列拼接而成,在拼接过程中,可以准确获取每帧图像在全景二值图像中的位置, 这样就可以获取全景二值图像中由各帧图像数据构成的区域,将这个区域的上边缘作为全 景二值图像的上边缘,这个区域的下边缘作为全景二值图像的下边缘,本实施例中的全景 二值图像的上下边缘如图12所示。如果当前的候选反白连通域的上边线与全景二值图像的上边缘有重合像素,则利 用全景二值图像的上边缘对当前的候选反白连通域的上边线进行调整搜索当前的候选反 白连通域的上边线与全景二值图像的上边缘中重合的像素点,如果相邻的两个重合的像素 点之间的距离小于全景二值图像中字符高度的1. 5倍,即91,则将上边线中该相邻的两个 重合的像素点之间的点换为全景二值图像的上边缘所对应的像素点。如果当前的候选反白 连通域的下边线与全景二值图像的下边缘有重合像素,则利用全景二值图像的下边缘对当 前的候选反白连通域的下边线进行调整搜索当前的候选反白连通域下边线与全景二值图 像下边缘中重合的像素点,如果相邻的两个重合的像素点之间的距离小于全景二值图像中 字符高度的1. 5倍,即91,则将下边线中该相邻的两个重合的像素点之间的点换为全景二 值图像的下边缘所对应的像素点。如果当前的候选反白连通域的上下边线与全景二值图像 的上下边缘均无重合像素,则不调整当前的候选反白连通域的上下边线。本实施例中,图10所示的候选反白连通域的下边线与全景二值图像的下边缘存 在重合像素点,如图13所示为其中的两个片段的示意图,图中a指向如图10所示的候选反 白连通域的下边线中与全景二值图像下边缘的两个重合的像素点,图中b为对应于a的在 全景二值图像下边缘上的两个重合像素点,图中a指向的两个重合像素点之间的距离小于 91,故在下边线中a指向的部分用b指向的部分代替,以实现对a指向的部分的调整。如图10所示的候选反白连通域的下边线调整完后的示意图如图14所示。3)根据调整后的候选反白连通域上下边线之间的白像素点数目排除直线或曲线 构成的区域。全景二值图像中如果存在黑像素构成的直线或曲线区域,且这些区域的宽高 比值满足判断候选反白连通域的条件,则这些区域可能会被误判为候选反白连通域。本实 施例中,通过这些区域中的白像素点数目判断其中的非反白连通域,判断的具体条件为如 果白像素点数目为0,则判为非反白连通域。本实施例中不存在黑像素构成的直线或曲线区 域。4)计算调整后得到的各候选反白连通域中上下边线中的最长平滑线段的长度,平 滑线段是指由依次紧邻的纵坐标相差不超过2的像素点构成的线段。在本实施例中,当前 的候选反白连通域的上边线的最长平滑线段长度为对63,下边线的最长平滑线段长度为 2465。5)根据各候选反白连通域上下边线的最长平滑线段的长度选择反白连通域。如果 候选反白连通域上边线的最长平滑线段的长度和下边线的最长平滑线段的长度都大于当 前的候选反白连通域宽度的三分之二,则该候选反白连通域为反白连通域,否则该候选反 白连通域为非反白连通域。本实施例中,候选反白连通域之四的宽度为M66,上边线的最长 平滑线段长度为M63,下边线的最长平滑线段长度为M65,都超过了候选反白连通域宽度 的三分之二,故该候选反白连通域为反白连通域。在本实施例中,经过处理,图7、图8、图9、图10所示的四个候选反白连通域都为反 白连通域。对反白连通域,将其调整后的上下边线范围内的像素点进行像素反色,即将原来 的黑像素置为白像素,将原来的白像素置为黑像素。如图2所示的全景二值图像经过本方法处理后的结果如图15所示。本发明还公开了一种用于全景二值图像的反白处理装置,包括以下模块 标记模块,对全景二值图像进行连通域标记;
统计模块,根据标记后的连通域统计全景二值图像中的字符高度; 求取模块,根据字符高度求取候选反白连通域;
反色模块,根据候选反白连通域的上下边线进行筛选,筛选得到反白连通域后进行像 素反色。本发明以全景二值图像中的连通域为处理单位,通过连通域上下边线的光滑性筛 选得到反白连通域,并能准确计算反白连通域的边界范围以进行颜色翻转,本发明不受图 像中文字的笔画粗细的影响,反白连通域定位的准确性大大提高,图像反白的效果更好。以上所述,仅为本发明的具体实施方式
,但本发明的保护范围并不局限于此,任何 熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵 盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
权利要求
1.一种用于全景二值图像的反白处理方法,其特征在于,包括以下步骤步骤(1),对全景二值图像进行连通域标记;步骤(2),根据标记后的连通域统计全景二值图像中的字符高度;步骤(3),根据字符高度求取候选反白连通域;步骤(4),根据候选反白连通域的上下边线进行筛选,筛选得到反白连通域后进行像素 反色。
2.根据权利要求1所述的方法,其特征在于所述步骤(1)进行连通域标记时,记录构 成连通域的所有黑像素点。
3.根据权利要求2所述的方法,其特征在于所述步骤(2)中统计全景二值图像中的 字符高度时,根据所述黑像素点计算全景二值图像的边缘图像,标记边缘图像的边缘连通 域,去掉其中异常的边缘连通域,统计剩余边缘连通域的高度得到全景二值图像中的字符 尚度。
4.根据权利要求3所述的方法,其特征在于所述统计剩余边缘连通域的高度时,如果 剩余的边缘连通域为0,则全景二值图像中的字符高度为0 ;如果剩余边缘连通域大于0且 小于5,则取剩余边缘连通域的最大高度作为全景二值图像中的字符高度;如果剩余边缘 连通域大于等于5,则将剩余边缘连通域的高度从大到小排序,从大到小依次累加各个高度 值对应的边缘连通域个数,当累加和大于等于剩余边缘连通域总个数的五分之一时停止累 加,此时所对应的高度值即为全景二值图像中的字符高度。
5.根据权利要求3所述的方法,其特征在于所述异常的边缘连通域为宽度大于高度 的两倍的边缘连通域。
6.根据权利要求1所述的方法,其特征在于所述步骤(3)中候选反白连通域为宽度大 于字符高度四倍的连通域。
7.根据权利要求1所述的方法,其特征在于所述步骤(4)中根据候选反白连通域的上 下边线进行筛选时,利用全景二值图像的上下边缘调整候选反白连通域的上下边线,根据 调整后的上下边线之间的白像素点数目排除由黑像素构成的直线或曲线区域,根据得到的 各候选反白连通域中最长的平滑线段进行筛选,得到反白连通域。
8.根据权利要求7所述的方法,其特征在于所述上下边线分别为由各候选反白连通 域的每一列中最上一个和最下一个黑像素点构成的连线。
9.根据权利要求7所述的方法,其特征在于所述根据得到的各候选反白连通域中最 长的平滑线段进行筛选时,如果每个候选反白连通域中最长的平滑线段的长度大于该候选 反白连通域宽度的三分之二,则该候选反白连通域为反白连通域。
10.根据权利要求7或9所述的方法,其特征在于所述平滑线段为由依次紧邻的纵坐 标相差不超过2的像素点构成的线段。
11.根据权利要求1所述的方法,其特征在于所述像素反色为将黑像素置为白像素, 将白像素置为黑像素。
12.一种用于全景二值图像的反白处理装置,其特征在于,包括以下模块标记模块,对全景二值图像进行连通域标记;统计模块,根据标记后的连通域统计全景二值图像中的字符高度;求取模块,根据字符高度求取候选反白连通域;反色模块,根据候选反白连通域的上下边线进行筛选,筛选得到反白连通域后进行像 素反色。
全文摘要
本发明公开了一种用于全景二值图像的反白处理方法和装置,属于图像处理领域,方法包括对全景二值图像进行连通域标记;根据标记后的连通域统计全景二值图像中的字符高度;根据字符高度求取候选反白连通域;根据候选反白连通域的上下边线进行筛选,筛选得到反白连通域后进行像素反色。本发明以全景二值图像中的连通域为处理单位,通过连通域上下边线的光滑性筛选得到反白连通域,并能准确计算反白连通域的边界范围以进行颜色翻转,本发明不受图像中文字的笔画粗细的影响,反白连通域定位的准确性大大提高,图像反白的效果更好。
文档编号G06T5/00GK102096906SQ201010586130
公开日2011年6月15日 申请日期2010年12月13日 优先权日2010年12月13日
发明者李永彬 申请人:汉王科技股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1