一种普适性的图像文字提取方法_2

文档序号:9261582阅读:来源:国知局
步骤S525通过W下步骤实现:
[0077]S5251、对每个二值化图像中的连通区域进行标记与查找,删除那些高或宽大于图 像1/2的连通区域,剩下的区域进行保留。
[007引 S5252、对每个二值化图像中剩下的连通区域进行合并,得到最终的二值化结果。
[0079] 采用上述技术方案后,本发明与【背景技术】相比,具有如下优点:
[0080] 本发明能够对图像中的背景复杂度进行评估,进而自动选择对应的二值化算法, 适合对不同背景复杂度的图像进行文字提取。
【附图说明】
[0081] 图1为本发明的工作流程示意图。
[0082] 图2为一幅色彩丰富的图像原图。
[0083] 图3示出了对图2降维后得到的结果。
[0084] 图4示出了图像的颜色直方图结果。
[0085] 图5示出了一幅色彩复杂的含有文本的图像。
[0086] 图6示出了针对每个颜色聚类中屯、对图像进行二值化的结果。
[0087] 图7示出了对多个二值化结果进行组合后的结果。
【具体实施方式】
[008引为了使本发明的目的、技术方案及优点更加清楚明白,W下结合附图及实施例,对 本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用W解释本发明,并 不用于限定本发明。
[0089] 实施例
[0090] 请参阅图1,本发明公开了一种普适性的图像文字提取方法,其包括W下步骤:
[0091] S1、对图像进行颜色空间转化
[0092] 颜色空间是一系列颜色的数学表现形式。S种最流行的颜色模型是RGB、YIQ(YUV 或YCb化)W及CMYK,但是该=种颜色和我们直觉概念上的色调,饱和度,亮度没有直接联 系,而我们人眼区分颜色的种类往往是区分颜色之间色调、饱和度、亮度的差异。L油颜色空 间是基于人对颜色的感觉,它致力于感知均匀性,它的L分量密切匹配人类亮度感知,a和b 分量进行颜色平衡。所W本实施例在分析图像颜色复杂度时,把图像由RGB颜色空间转换 成L油颜色空间。
[0093] 步骤S1具体通过W下步骤实现:
[0094] S11、遍历图像中的每个像素点,将每个像素点的化G、B)颜色矢量转换为(X、Y、 幻颜色矢量,其转换公式如下:
[0095] X= 0. 412R+0. 358G+0. 180B
[0096] Y= 0. 213R+0. 715G+0. 072B
[0097] Z = 0. 019R+0. 119G+0. 950B
[009引 X = X/(255X0. 95)
[0099] Y =Y/255
[0100] Z = 2/(255X1. 089)
[0101] S12、将每个像素点的狂、Y、幻颜色矢量转换为(L、a、b)颜色矢量,
[010引若Y>0. 008856,则:
[0103] fY=yi/3
[0104] Tk二t's
[0105] fZ=Zi/3
[0106] L=116XfY-16
[0107]若Y<0. 008856,则:
[010引fY= 7. 787Y+16/116
[0109] fX= 7. 787X+16/116
[0110] fZ= 7. 787Z+16/116
[0111]L=903. 3Y
[0112] a和b的计算公式如下;
[0113] a = 500(fX-fY)+128
[0114] b = 200(fY-f幻+128
[0115] S13、经过颜色空间转换后,原图像中的每个点的颜色用(L、a、b)矢量表示,其中L 的取值范围为[0, 100],a和b的取值范围为[-128, 127]。
[0116] S2、对图像进行颜色降维
[0117] 由于一幅彩色图像中的每个像素点都是由L、a、bS通道组成的一个颜色矢量,该 样一幅较大的图像中可能存在着100X255X255种颜色类型,该样的数量对于我们进行图 像颜色分析是极困难的,所W我们需要对图像的颜色进行降维,在保证图像基本内容不变 的前提下,希望用尽可能少的颜色来表达整幅图像。
[0118] 由于分析图像颜色复杂度只需要粗略了解图像颜色组成,所W在本实施例中将原 来每个通道的灰度降至8级灰度,该样整个图像出现的颜色种类最多为8X8X8(即512) 种。
[0119] 设图像坐标为(x",y。)处的颜色矢量为(IwJaoJb。),通过下式计算颜色矢量 (Il,la,Ib):
[0120]
[0123] 遍历图像中的每个像素点,得到降维后的图像。
[0124] 为了更直观的理解,结合图2和图3所示,图2为一幅色彩丰富的图像原图,经步 骤S2进行降维处理后,得到图3所示的结果。
[01巧]S3、对降维后的图像进行颜色直方图统计
[01%] 经过S2步骤后,图像中包含的颜色种类大大减少,该时,我们可W对图像中所有 出现的颜色进行统计,计算一共出现了多少种颜色,W及每种颜色出现的频率。
[0127] 步骤S3具体通过W下步骤实现:
[0128] S31、建立一个长度为512的数组H,用来统计每一种可能颜色出现的次数,若为0, 则表示该类颜色没有出现过;
[0129]S32、遍历降维后的图像中的每个像素点,对于该像素点的L油颜色矢量(L、a、b), 通过下式计算其在直方图中水平坐标的位置P:
[0130] P= 64L+8a+b
[0131] S33、对于降维后的图像中的每个像素点,根据其颜色计算得到其在直方图中对应 位置后,将数组H中对应该序号的值加1 ;
[0132] S34、步骤S33完成后,得到一个512维的数组,数组中的元素值为0的,代表该种 颜色没有在图像中出现过,将该些位置从直方图中删除,然后得到的数组即为最终求得的 颜色直方图(如图4所示)。
[0133] S4、根据颜色直方图计算图像的颜色复杂度,并根据颜色复杂度对图像划定分类
[0134] 从步骤S3得到的颜色直方图中可W分析到,越是复杂的图像,得到的直方图越分 散而平均,越是简单的图像,得到的直方图越集中。我们根据颜色直方图计算其滴值,作为 图像颜色复杂性的度量。
[01巧]步骤S4具体通过W下步骤实现:
[0136] S41、计算每种颜色像素点在图像中出现的比例,对于每种颜色,设其在图像中出 现的频率大小为F,F通过下式计算得出:
[0137]
[013引其中,M、N分别为图像的宽和高,H(c)为该种颜色像素点的个数;
[0139] S42、对于所有颜色来说,图像的颜色分布的信息滴为:
[0140]
[0141] 利用求得的颜色分布的信息滴来表示图像的复杂程度,图像越复杂,信息滴越大, 图像越简单,信息滴越小。
[01创S43、计算阔值,对于一幅MXN的图像,可能出现最多的颜色种类为K=min{MXN,512}种,所W它的信息滴的最大可能取值为:
[0143]
[0144] 544、若£>A.Em。,,则认定图像为复杂背景类别的图像,若E<A.Em。,,则认定 图像为简单背景类别的图像。
[0145] S5、根据图像的颜色复杂度类别对原图像进行二值化处理。
[0146] 步骤S5通过W步骤实现:
[0147] S51、对于简单背景类别的图像,采用单一的阔值进行二值化处理,进而进行文字 提取。该步骤具体包括W下子步骤:
[014引 S511、将原图像由彩色图像转换为灰度图像;
[0149] S512、采用大津法计算图像的二值化阔值;
[0150] S513、遍历灰度图像,对图像中的所有像素点进行判断,若某个像素点的灰度值大 于或等于二值化阔值,则认为该像素点为文本像素点,如果某个像素点的灰度值小于二值 化阔值,则认为该像素点为背景像素点。
[0151] S52、对于复杂背景类别的图像,先对图像颜色进行聚类,提取几种主要的颜色,再 对每一种颜色计算一种阔值,从而相当于对图像进行多次二值化,进而在不同的二值化结 果上分别查找文本区域,进行文字提取。该步骤具体包括W下子步骤:
[0152] S521、根据步骤S41中求得的每种颜
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1