一种文字区域识别方法和装置制造方法

文档序号：6505592阅读：118来源：国知局

一种文字区域识别方法和装置制造方法
【专利摘要】本发明提供了一种文字区域识别方法和装置，该方法包括：对图像进行边缘检测，使用检测到的图像边缘将图像划分为多个图像区域；提取每个图像区域的文字区域特征信息，根据该图像区域的文字区域特征信息确定特征值，根据该特征值以及预设规则确定该图像区域是否为文字区域。该方法不需要提取图像特征，处理较为简单。
【专利说明】一种文字区域识别方法和装置

【技术领域】
[0001]本申请涉及图像处理【技术领域】，特别涉及一种文字区域识别方法和装置。

【背景技术】
[0002]从图像中识别文字区域一般有以下两种方式:基于特征的文字区域识别方式、基于连通区域的文字区域识别方式。其中，
[0003]基于特征的文字区域识别方式中，根据文字特征，例如文字丰富的边缘信息，以及文字与背景区域的纹理区别等，对图像进行特征提取，根据提取的特征信息定位文字区域。
[0004]基于连通区域的文字区域识别方式中，根据文字固有的几何特点，构造规则对连通区域进行几何分析，一步步去除非文字区域，最终定位文字区域。
[0005]以上两种文字区域识别方式均需要提取图像特征，批量处理较为复杂。

【发明内容】

[0006]有鉴于此，本发明的目的在于提供一种文字区域识别方法，该方法不需要提取图像特征，处理较为简单。
[0007]为实现上述目的，本发明提供的技术方案为:
[0008]一种文字区域识别方法，包括:
[0009]对图像进行边缘检测，使用检测到的图像边缘将图像划分为多个图像区域；
[0010]提取每个图像区域的文字区域特征信息，根据该图像区域的文字区域特征信息确定特征值，根据该特征值以及预设规则确定该图像区域是否为文字区域。
[0011]一种文字区域识别装置，包括:边缘检测单元、区域划分单元、特征提取单元、文字区域识别单元；
[0012]所述边缘检测单元，用于对图像进行边缘检测；
[0013]所述区域划分单元，用于使用边缘检测单元检测到的图像边缘将图像划分为多个图像区域；
[0014]所述特征提取单元，用于提取区域划分单元划分的每个图像区域的文字区域特征信息；
[0015]所述文字区域识别单元，用于根据特征提取单元提取的每个图像区域的文字区域特征信息确定特征值，根据该特征值以及预设规则确定该图像区域是否为文字区域。
[0016]综上所述，本发明通过对图像进行边缘检测，根据检测出的图像边缘划分图像区域，提取出各图像区域的文字区域特征信息并计算对应的特征值，从而根据该特征值和预先设定的规则进行文字区域判断。本发明不需要提取图像特征，只提取图像区域中的文字区域特征信息进行文字区域判断，因而处理较为简单。

【专利附图】

【附图说明】
[0017]图1是本发明实施例文字区域识别方法流程图；
[0018]图2是本发明实施例图像区域划分结果示意图；
[0019]图3是本发明实施例文字区域识别装置的结构示意图。

【具体实施方式】
[0020]为使本发明的目的、技术方案及优点更加清楚明白，以下参照附图并举实施例，对本发明所述方案作进一步地详细说明。
[0021]参见图1，图1是本发明实施例文字区域识别方法流程图，主要包括以下几个步骤:
[0022]步骤101、对图像进行边缘检测，使用检测到的图像边缘将图像划分为多个图像区域。
[0023]在实际应用中，彩色图像中每个像素点的颜色值是用R、G、B三个分量表示，灰度图像中每个像素点的颜色值是用灰度值一个分量表示。采用某种算法将彩色图像中每个像素点的由R、G、B三个分量表示的颜色值转变为由灰度值一个分量表示的颜色值，使得彩色图像转变为灰度图像，称为图像灰度化。
[0024]由于灰度图像中每个像素点的颜色值只用一个灰度值表示，在对图像进行边缘检测时，相对于彩色图像可以简化计算。因此，本步骤中，在对图像进行边缘检测前，还可以先对图像进行灰度化处理，使图像成为灰度图像，然后对灰度化后的图像进行边缘检测。
[0025]本实施例中，对图像进行边缘检测的方法为:对图像中每行中所有像素点的颜色值进行分析，如果该行中所有像素点的颜色值均相同，则若该行的上一行中所有像素点的颜色值不完全相同或该行的下一行中所有像素点的颜色值不完全相同，则确定该行是图像边缘，否则，确定该行不是图像边缘。
[0026]具体的边缘检测过程如下:
[0027]用以下公式表示将图像的第i行中所有像素点的颜色值集合P (i):
[0028]P (i) = {f (i, I)，f (i, 2)，...，f (i, j)，...，f (i, w)},其中,f (i, j)是图像第 i 行，第j列像素点的颜色值，w是图像的宽度。
[0029]对图像边缘作如下约定:当f (i, l)=f (i, 2)=..=f (i, w)时，认为p(i)是一个可能的图像边缘，否则，认为P (i)不是图像边缘。
[0030]采用如下方法进行图像边缘判定:当符合规则:p(1-l)不是图像边缘且P(i)是可能的图像边缘，或者P(i+1)不是图像边缘且p(i)是可能的图像边缘时，确定p(i)是图像边缘，否则，确定P (i)不是图像边缘。
[0031]可以对图像中的每一行采用以上的边缘检测过程，确定该行是否是图像边缘，这样，在确定出图像区域中的所有图像边缘后，可以利用确定的图像边缘将图像划分为多个图像区域，例如图2所示的图像区域划分结果示意图，在进行边缘检测后将图像划分为三个图像区域，其中，图像区域I和图像区域2不是文字区域(内容未具体给出)，图像区域3为图像区域(内容未具体给出)。
[0032]在实际实现中，除了上述给出的边缘检测方法为，也可以采用现有技术中已有的边缘检测方法对图像进行边缘检测，不再赘述。
[0033]步骤102、提取每个图像区域的文字区域特征信息，根据该图像区域的文字区域特征信息确定特征值，根据该特征值以及预设规则确定该图像区域是否为文字区域。
[0034]在实际应用中，如果图像区域为文字区域，则其文字区域的背景色通常为相同的颜色且会占用相对较多的图像区域。
[0035]根据文字区域的上述特点，可以将图像区域中每种颜色值对应的像素点个数作为该图像区域的文字区域特征信息。通过提取图像区域中的文字区域特征信息，根据该图像区域的文字区域特征信息计算出图像区域中文字区域背景色所占比例，将该比例作为该图像区域的一个特征值。当该特征值位于某个取值范围内时，该图像区域为文字区域的可能性较大，这里所述的某个取值范围可以由开发人员根据经验总结或实际统计结果确定。
[0036]所述根据该图像区域的文字区域特征信息确定特征值的方法具体可以如下:确定该图像区域的文字区域特征信息中具有最多像素点个数的颜色值，将该颜色值对应的像素点个数与该图像区域中的像素点总数的比值确定为该特征值。
[0037]根据该图像区域的文字区域特征信息确定特征值的具体实现过程如下:
[0038]用如下公式表示划分的第k个图像区域中所有像素点的颜色值集合L(k):
[0039]L(k) = {f (1)，f(2),...，f(i),...，f (η)},其中,η 表示划分的第 k 个图像区域中的像素点总数，f (i)表示第k个图像区域中的第i个像素点的颜色值。
[0040]对L (k)中的各像素点的颜色值进行统计，确定每种颜色值对应的像素点个数(该颜色值出现的次数)，将统计结果作为划分的第k个图像区域的文字区域特征信息。
[0041]假设Nk为具有最多像素点的颜色值对应的像素点个数(也即出现次数最多的颜色值个数)，则Nk与η的比值即为要计算得到的特征值。
[0042]计算得到上述特征值之后，就可以该特征值以及预设规则确定该图像区域是否为文字区域，具体地，当该特征值(Nk与η的比值)符合如下预设规则:Nk小于预设第一阈值(例如，0.5)且大于预设第二阈值(例如，0.2)时，则确定该图像区域为文字区域，否则，确定该图像区域不是文字区域。
[0043]本实施例中，给出了将图像区域中每种颜色值对应的像素点个数作为该图像区域的文字区域特征信息情况下，根据该图像区域的文字区域特征信息确定特征值以及根据该特征值以及预设规则确定该图像区域是否为文字区域的具体实现过程。在实际应用中，也可以根据文字区域的特点将图像区域中的其它信息作为该图像区域的文字区域特征信息，例如，文字区域中颜色比较单一，通常只会包括背景色和文字颜色等较少集中颜色值，而非文字区域中，图片通常会有丰富的颜色，可以基于文字区域和非文字区域的上述区别特征，将图片区域中的颜色值总数以及各颜色值占用比例座位该图像区域的文字区域特征信息，并利用加权的方法计算特征值，利用该特征值及相应的预设规则确定该图像区域是否为文字区域。
[0044]图1所示本发明实施例中，还可以进一步包括:将图像中确定为文字区域的所有图像区域染色，并输出染色后的图像，以便于进一步进行人工审查染色图像区域是否为文字区域，以确定文字区域识别结果的正确性。
[0045]以上对本发明实施例文字区域识别方法进行了详细说明，本发明还提供了一种文字区域识别装置，下面结合图3进行说明。
[0046]参见图3，图3是本发明实施例文字区域识别装置的结构示意图，具体包括:边缘检测单元301、区域划分单元302、特征提取单元303、文字区域识别单元304 ;其中，
[0047]边缘检测单元301，用于对图像进行边缘检测；
[0048]区域划分单元302，用于使用边缘检测单元301检测到的图像边缘将图像划分为多个图像区域；
[0049]特征提取单元303，用于提取区域划分单元302划分的每个图像区域的文字区域特征信息；
[0050]文字区域识别单元304，用于根据特征提取单元303提取的每个图像区域的文字区域特征信息确定特征值，根据该特征值以及预设规则确定该图像区域是否为文字区域。
[0051]上述装置还包括图像处理单元305 ;
[0052]所述图像处理单元305，用于在边缘检测单元301对图像进行边缘检测之前，对图像进行灰度化处理，以使图像成为灰度图像。
[0053]上述装置还包括输出单元306 ;
[0054]所述输出单元306，用于将图像中被文字区域识别单元304确定为文字区域的所有图像区域染色，并输出染色后的图像。
[0055]上述装置中，所述边缘检测单元301在对图像进行边缘检测时，用于:对图像中每行中所有像素点的颜色值进行分析，如果该行中所有像素点的颜色值均相同，则若该行的上一行中所有像素点的颜色值不完全相同或该行的下一行中所有像素点的颜色值不完全相同，则确定该行是图像边缘，否则，确定该行不是图像边缘。
[0056]上述装置中，所述图像区域的文字区域特征信息是指该图像区域中每种颜色值对应的像素点个数；
[0057]所述文字区域识别单元304在根据特征提取单元提取的每个图像区域的文字区域特征信息确定特征值时，用于:确定该图像区域的文字区域特征信息中具有最多像素点个数的颜色值，将该颜色值对应的像素点个数与该图像区域中的像素点总数的比值确定为该特征值；
[0058]所述文字区域识别单元304在根据该特征值以及预设规则确定该图像区域是否为文字区域时，用于:判断该特征值是否小于预设第一阈值且大于预设第二阈值，如果是，则确定该图像区域是文字区域，否则，确定该图像区域不是文字区域。
[0059]以上所述，仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。
【权利要求】
1.一种文字区域识别方法，其特征在于，该方法包括: 对图像进行边缘检测，使用检测到的图像边缘将图像划分为多个图像区域；提取每个图像区域的文字区域特征信息，根据该图像区域的文字区域特征信息确定特征值，根据该特征值以及预设规则确定该图像区域是否为文字区域。
2.根据权利要求1所述的文字区域识别方法，其特征在于，对图像进行边缘检测之前，进一步包括:对图像进行灰度化处理，以使图像成为灰度图像。
3.根据权利要求1所述的文字区域识别方法，其特征在于，该方法进一步包括: 将图像中确定为文字区域的所有图像区域染色，并输出染色后的图像。
4.根据权利要求1、2、或3所述的文字区域识别方法，其特征在于，对图像进行边缘识别的方法为:对图像中每行中所有像素点的颜色值进行分析，如果该行中所有像素点的颜色值均相同，则若该行的上一行中所有像素点的颜色值不完全相同或该行的下一行中所有像素点的颜色值不完全相同，则确定该行是图像边缘，否则，确定该行不是图像边缘。
5.根据权利要求1、2、或3所述的文字区域识别方法，其特征在于，所述图像区域的文字区域特征信息是指该图像区域中每种颜色值对应的像素点个数；根据该图像区域的文字区域特征信息确定特征值的方法为:确定该图像区域的文字区域特征信息中具有最多像素点个数的颜色值，将该颜色值对应的像素点个数与该图像区域中的像素点总数的比值确定为该特征值；根据该特征值以及预设规则确定该图像区域是否为文字区域的方法为:判断该特征值是否小于预设第一阈值且大于预设第二阈值，如果是，则确定该图像区域是文字区域，否贝U，确定该图像区域不是文字区域。
6.一种文字区域识别装置，其特征在于，该装置包括:边缘检测单元、区域划分单元、特征提取单元、文字区域识别单元；所述边缘检测单元，用于对图像进行边缘检测；所述区域划分单元，用于使用边缘检测单元检测到的图像边缘将图像划分为多个图像区域；所述特征提取单元，用于提取区域划分单元划分的每个图像区域的文字区域特征信息；所述文字区域识别单元，用于根据特征提取单元提取的每个图像区域的文字区域特征信息确定特征值，根据该特征值以及预设规则确定该图像区域是否为文字区域。
7.根据权利要求6所述的文字区域识别装置，其特征在于，该装置还包括图像处理单元; 所述图像处理单元，用于在边缘检测单元对图像进行边缘检测之前，对图像进行灰度化处理，以使图像成为灰度图像。
8.根据权利要求6所述的文字区域识别装置，其特征在于，该装置还包括输出单元；所述输出单元，用于将图像中所有确定为文字区域的图像区域染色，并输出染色后的图像。
9.根据权利要求6、7、或8所述的文字区域识别装置，其特征在于，所述边缘设备单元在对图像进行边缘识别时，用于:对图像中每行中所有像素点的颜色值进行分析，如果该行中所有像素点的颜色值均相同，则若该行的上一行中所有像素点的颜色值不完全相同或该行的下一行中所有像素点的颜色值不完全相同，则确定该行是图像边缘，否则，确定该行不是图像边缘。
10.根据权利要求6、7、或8所述的文字区域识别装置，其特征在于，所述图像区域的文字区域特征信息是指该图像区域中每种颜色值对应的像素点个数；所述文字区域识别单元在根据特征提取单元提取的每个图像区域的文字区域特征信息确定特征值时，用于:确定该图像区域的文字区域特征信息中具有最多像素点个数的颜色值，将该颜色值对应的像素点个数与该图像区域中的像素点总数的比值确定为该特征值；所述文字区域识别单元在根据该特征值以及预设规则确定该图像区域是否为文字区域时，用于:判断该特征值是否小于预设第一阈值且大于预设第二阈值，如果是，则确定该图像区域是文字区域，否则，确定该图像区域不是文字区域。
【文档编号】G06K9/46GK104281850SQ201310286487
【公开日】2015年1月14日申请日期:2013年7月9日优先权日:2013年7月9日
【发明者】张佳, 丁如敏申请人:腾讯科技（深圳）有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张佳;丁如敏
技术所有人：腾讯科技（深圳）有限公司
我是此专利的发明人

上一篇：目标越过绊线的检测方法及装置、视频监控系统的制作方法
上一篇：电气规范设置系统及方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。