一种文字图像特征差异的快速计算方法

文档序号:6506833阅读:437来源:国知局
一种文字图像特征差异的快速计算方法
【专利摘要】本发明公开了一种文字图像特征差异的快速计算方法,首先基于几何形状特征的多样性,采用前景像素个数、文字大小、长宽比和占空比四个特征对差异较大的文字对进行初步筛选,这样从整体上对各种文字进行有效描述,同时减少图像失真带来的负面影响;在初步筛选之后,对剩下的配对进行精细特征描述,并采用修正的模板匹配方法,该方法通过在图像中滑动给定模板获取与模板相匹配的目标。经过粗特征筛选进入到精细模板匹配的文字块,彼此的大小差异受到粗特征中文字大小的制约,从而大大降低了匹配过程中的比较次数。进一步,提出了一种查找表联合位存储的加速方法,该方法根据相似性度量特点,通过预先建立文字块与数据的对应关系实现了性能提升。
【专利说明】 一种文字图像特征差异的快速计算方法
【技术领域】
[0001]本发明属于计算机视觉和图像处理领域,涉及一种文字图像特征差异的快速计算方法。
【背景技术】
[0002]现有技术中针对大数据量特征的相似性度量方法,主要有以下几个方面:
[0003]I)基于小波变换和相似性度量的视频文字识别,计算机工程与设计,2008,杨强,程玉昆,马森。
[0004]该方法的处理对象为视频中的字幕,主要研究视频中字幕的提取与识别,用相似性度量的方法来识别视频字幕。首先对待匹配的字符图像和模板库中的字符图像分别作N级分解,并保留各级分解后的低频部分,接着用误差累加式粗略查找可能匹配的视频字符,重复上面的步骤直到找到误差最小的前10个字符,最后分别计算这10个字符的相关度,求得相关度最大的字符为所要匹配字符。
[0005]2)基于二叉树相似性检测的变形文字识别研究.计算机工程与应用,2005,叶庆卫,汪同庆。
[0006]该方法处理对象为艺术字,主要研究文字的变形处理不会改变文字内在的框架情况下的识别。首先利用最小生成树获得文字图像所对应的树型结构,然后约简非分叉节点,应用无序无标签二叉树之间的相似测度计算方法,与原文字图像所对应的约简树进行相关度分析,得到相似性度量结果。
[0007]3)Text image matching without language model using a Hausdorffdistance.1nformation Processing&Management.Toni M.Rath and R.Manmatha
[0008]该方法主要用于文字图像的检索,模板图像为目标图像的一个部分。首先对目标图像和模板图像进行归一化,然后分别提取它们的特征,得到特征向量,最后运用Hausdorff的距离度量方法从目标图像中检索到模板图像。
[0009]4)Word image matching using dynamic time warping.CVPR2003.Hwa-JeongSon,Soo-Hyung Kimj J1-Soo Kim
[0010]该方法主要是处理手写的扫描历史原稿,运用Dynamic Time Warping(DTW)算法进行模板匹配,得到需要查找的文字。
[0011]虽然现有方法提出了许多相似性度量的方法,但没有针对大量扫描文字图像之间的相似性度量。

【发明内容】

[0012]本发明解决的问题在于提供一种文字图像特征差异的快速计算方法,大量扫描文字图像之间相似性,并通过查找表联合位存储的加速算法来进行快速计算。
[0013]本发明是通过以下技术方案来实现:
[0014]一种文字图像特征差异的快速计算方法,包括以下操作:[0015]I)对于待比较的指定文字图像块和候选文字图像块,分别提取其前景像素个数、文字大小、长宽比和占空比四个特征,比较提取的四个特征后进行初步筛选,剔除一部分差异显著的文字配对;
[0016]2)对剩下的部分采用模板匹配方法得到归一化匹配值,所述的模板匹配方法包括以下步骤:
[0017]首先从待比较的指定文字图像块和候选文字图像块中选择大小参数较小的部分作为模板的组成部分;
[0018]在获取模板后,按照匹配过程在模板移动中寻找最优匹配位置,并对判定为非模板的文字图像块在边界处加入一个像素的扩展;
[0019]模板在文字图像块中的每个位置都会得到一个匹配结果;对文字图像对中匹配的前景像素总数进行统计,在文字图像块比较中,如果模板与文字图像块对应前景像素匹配总数最大,则认为该位置为最优匹配位置,将不同文字图像块间的匹配结果直接归一化;两个文字图像块越相似,则匹配数目就会越多,对应未匹配数目就会越少;
[0020]3)完成文字图像块的特征提取后,通过这些特征度量文字图像块的相似性,构建相似性矩阵。
[0021]所述的四个特征的提取方法为:
[0022]前景像素个数,前景像素反映文字图像文字块的点阵分布,对于不同字号以及不同字形,前景像素的个数不同;
[0023]文字大小,文字的长度和宽度是对文字大小最直接的刻画,如果两个文字在长度或者宽度上差异明显,则直接将其滤除;
[0024]长宽比,长宽比从整体上对文字形状进行刻画;
[0025]占空比,占空比描述文字内部形状,为在二维图像中定义为前景像素在文字块中所占的比例,基于前景像素总数及文字大小,占空比通过下式得到:
[0026]Drat=S/ (WXH)
[0027]其中,S为前景像素总数,W为文字图像块的宽度,H为文字图像块的高度。
[0028]所述通过占空比对相同语种下占空比差异较大的文字对进行剔除,同时也保证了对多语种文字对的可区分性。
[0029]所述剔除一部分差异显著的文字配对的方法为:
[0030]对于待比较的两个文字图像块,分别提取二者的前景像素个数、文字大小、长宽比以及占空比四个特征,选取数值较小的描述子作为1,较大的描述子作为2,并通过式(3)中的判断条件决定两个文字图像块是否存在较大差异;如果条件满足,则认为差异较大,将该文字图像对的相似性值赋为0,反之,将其采用模板匹配方法进行处理;
[0031]W1-W2≥ 5 U H1-H2 ≥ 5
[0032]U (S1ZSthr)
[0033]U (Aratl/Arat2<thr)
[0034]U (Dratl/Drat2<thr)(3)
[0035]其中,H1和W1' H2和W2, S1和S2, Aratl和Arat2、Dratl和Drat2分别为指定文字图像块和候选文字图像块高度、宽度、前景像素总数、长宽比、及占空比,thr为设定的阈值。
[0036]所述的阈值thr设定为0.5。[0037]所述的模板的选择为:
[0038]设定H1和WpH2和W2分别为文字图像Partl和文字图像Part2的高度和宽度,则
比较模板选择判定如下:
[0039]
【权利要求】
1.一种文字图像特征差异的快速计算方法,其特征在于,包括以下操作: 1)对于待比较的指定文字图像块和候选文字图像块,分别提取其前景像素个数、文字大小、长宽比和占空比四个特征,比较提取的四个特征后进行初步筛选,剔除一部分差异显著的文字配对; 2)对剩下的部分采用模板匹配方法得到归一化匹配值,所述的模板匹配方法包括以下步骤: 首先从待比较的指定文字图像块和候选文字图像块中选择大小参数较小的部分作为模板的组成部分; 在获取模板后,按照匹配过程在模板移动中寻找最优匹配位置,并对判定为非模板的文字图像块在边界处加入一个像素的扩展; 模板在文字图像块中的每个位置都会得到一个匹配结果;对文字图像对中匹配的前景像素总数进行统计,在文字图像块比较中,如果模板与文字图像块对应前景像素匹配总数最大,则认为该位置为最优匹配位置,将不同文字图像块间的匹配结果直接归一化;两个文字图像块越相似,则匹配数目就会越多,对应未匹配数目就会越少; 3)完成文字图像块的特征提取后,通过这些特征度量文字图像块的相似性,构建相似性矩阵。
2.如权利要求1所述的文字图像特征差异的快速计算方法,其特征在于,所述的四个特征的提取方法为: 前景像素个数,前景像素反映文字图像文字块的点阵分布,对于不同字号以及不同字形,前景像素的个数不同; 文字大小,文字的长度和宽度是对文字大小最直接的刻画,如果两个文字在长度或者宽度上差异明显,则直接将其滤除; 长宽比,长宽比从整体上对文字形状进行刻画; 占空比,占空比描述文字内部形状,为在二维图像中定义为前景像素在文字块中所占的比例,基于前景像素总数及文字大小,占空比通过下式得到:
Drat=S/(WX H) 其中,S为前景像素总数,W为文字图像块的宽度,H为文字图像块的高度。
3.如权利要求1或2所述的文字图像特征差异的快速计算方法,其特征在于,通过占空比对相同语种下占空比差异较大的文字对进行剔除,同时也保证了对多语种文字对的可区分性。
4.如权利要求1所述的文字图像特征差异的快速计算方法,其特征在于,所述剔除一部分差异显著的文字配对的方法为: 对于待比较的两个文字图像块,分别提取二者的前景像素个数、文字大小、长宽比以及占空比四个特征,选取数值较小的描述子作为1,较大的描述子作为2,并通过式(3)中的判断条件决定两个文字图像块是否存在较大差异;如果条件满足,则认为差异较大,将该文字图像对的相似性值赋为O,反之,将其采用模板匹配方法进行处理;
5.如权利要求4所述的文字图像特征差异的快速计算方法,其特征在于,所述的阈值thr设定为0.5。
6.如权利要求1所述的文字图像特征差异的快速计算方法,其特征在于,所述的模板的选择为: 设定H1和WpH2和W2分别为文字图像Partl和文字图像Part2的高度和宽度,则比较模板选择判定如下:
7.如权利要求1所述的文字图像特征差异的快速计算方法,其特征在于,对文字图像对中匹配的前景像素总数进行统计的方法为: 首先将待比较的文字图像块采用文字图像块每行像素按位存储的方式处理,将对应位置的像素值用二进制数值显示,存入到整型数据类型中; 然后选取不同位置下的文字图像块同模板进行比较,通过移位和按位与操作得到每个像素行的匹配结果,统计二进制结果中对应为I的个数;通查找表建立十进制数和二进制数的对应关系; 对于64位长的数据,首先建立从O?(216-1)范围内各个十进制数对应二进制数包含I的总数的查找表;然后对文字图像块进行判断,如果宽度均小于16个像素,则直接将每个像素行按位与的结果输入查找表,得到对应的I的总数;如果宽度均小于32个像素,则分别输出按位与之后低16位和向右移动16位的查表结果之和;如果宽度均小于48个像素,则还在前者基础上加入向右移动32位的查表结果;如果宽度均小于64为像素,则再加入向右移动48位的查表结果;反之,对于宽度大于64个像素的文字块则按照像素级比较来计算前景像素总数; 通过以上操作,不同大小的文字图像对按照对应的方式得到匹配的前景像素点数。
8.如权利要求7所述的文字图像特征差异的快速计算方法,其特征在于,采用64位的Long Long型作为像素行的存储数据类型。
【文档编号】G06K9/20GK103440472SQ201310331596
【公开日】2013年12月11日 申请日期:2013年8月1日 优先权日:2013年8月1日
【发明者】宋永红, 张元林, 雍旭东, 孟泉, 刘跃虎, 陈晓 申请人:西安交通大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1