一种笔画宽度提取方法、装置及一种文字识别方法、系统的制作方法

文档序号:6485582阅读:112来源:国知局
一种笔画宽度提取方法、装置及一种文字识别方法、系统的制作方法
【专利摘要】本申请提供了一种笔画宽度提取方法、装置及一种文字识别方法、系统,以解决笔画提取准确性的问题。所述方法包括:提取笔画的原始连通分量并对应一候选笔画宽度;对所述原始连通分量进行腐蚀计算,并计算每次腐蚀前的连通分量的轮廓周长,组成周长直方图;每次腐蚀计算后得到的连通分量对应一候选笔画宽度,对所述周长直方图进行差分计算,得到各候选笔画宽度对应的笔画长度;将各候选笔画宽度对应的笔画长度组成笔画宽度直方图;依据所述笔画宽度直方图中的极大值确定所述原始连通分量是否为文字区域,如果是文字区域,则依据极大值确定该文字区域的笔画宽度。本申请提高了笔画宽度提取的准确性,而且还提高了计算速度。
【专利说明】一种笔画宽度提取方法、装置及一种文字识别方法、系统
【技术领域】
[0001]本申请涉及文字识别【技术领域】,特别是涉及一种笔画宽度提取方法及提取装置,以及,一种文字识别方法及识别系统。
【背景技术】
[0002]图像中的文字识别技术有着广泛的应用,如扫描文档的内容识别、自动邮政编码识别等。随着数码相机的推广和互联网技术的发展,自然场景下的拍摄图像和人工编辑生成的图像越来越多。这些图像有复杂的背景图片,多变的前景颜色和纹理,其中的文字也有多语种、多字体、非线性排列等干扰。为了识别这些复杂图像中的文字,首先需要进行文字区域定位和切割。
[0003]笔画是文字的重要特征,笔画宽度是区分文字区域和非文字区域的重要特征,笔画宽度提取的准确度对于最终文字区域定位的准确度有着很大的影响。
[0004]目前较常使用的一种笔画宽度的提取方法是基于边缘扫描的方法。该方法首先对图像进行边缘提取,保留那些封闭的边缘。然后对边缘上的每一个点,沿着边缘的法向进行扫描,直到抵达另一条边缘,如果这两条边缘的法向方向相反,则扫描线的长度即为笔画的可能宽度。最后统计可能宽度的分布,占比最高的宽度就是笔画宽度。
[0005]上述基于边缘扫描的方法依赖于边缘提取的准确度,如果提取的边缘出现了断裂、过分割等情况,就无法被保留。同时,微小的边缘变化会极大地改变边缘的法向方向,从而影响笔画宽度的提取。实验结果显示在复杂背景、强噪声、低分辨率等情况下,该类方法无法准确提取笔画宽度信息。

【发明内容】

[0006]本申请提供了一种笔画宽度提取方法、装置,以解决笔画提取准确性的问题。
[0007]相应的,本申请还提供了 一种文字识别方法、系统,以解决文字识别准确性的问题。
[0008]为了解决上述问题,本申请公开了一种笔画宽度提取方法,包括:
[0009]提取笔画的原始连通分量并对应一候选笔画宽度;
[0010]对所述原始连通分量进行腐蚀计算,并计算每次腐蚀前的连通分量的轮廓周长,组成周长直方图;
[0011]每次腐蚀计算后得到的连通分量对应一候选笔画宽度,对所述周长直方图进行差分计算,得到各候选笔画宽度对应的笔画长度;
[0012]将各候选笔画宽度对应的笔画长度组成笔画宽度直方图;
[0013]依据所述笔画宽度直方图中的极大值确定所述原始连通分量是否为文字区域,如果是文字区域,则依据极大值确定该文字区域的笔画宽度。
[0014]优选地,所述对所述周长直方图进行差分计算,得到各候选笔画宽度对应的笔画长度,包括:将所述周长直方图中第η次腐蚀前的连通分量的轮廓周长减去第n+1次腐蚀前的连通分量的轮廓周长,得到第η个候选笔画宽度对应的笔画长度;其中,η为正整数。
[0015]优选地,所述依据所述笔画宽度直方图中的极大值确定所述原始连通分量是否为文字区域,包括:寻找笔画宽度直方图中纵坐标表示的笔画长度的极大值,所述笔画宽度直方图中的横坐标表示笔画宽度,所述极大值对应的笔画宽度为峰值宽度;从所述极大值中选出最大值和次大值;如果所述最大值和次大值之和占笔画宽度直方图中笔画长度总长度的比例小于第一阈值,或者,最大峰值宽度与最大宽度之差超过第二阈值,则所述原始连通分量为非文字区域;否则,为文字区域。
[0016]优选地,如果极大值为一个,或者次大值小于最大值的X则舍弃次大值;其中,X为预设值。
[0017]优选地,所述依据极大值确定该文字区域的笔画宽度,包括:确定笔画宽度直方图中极大值对应的峰值宽度为m,m为正整数;计算2m或2m-l并作为该文字区域的笔画宽度;其中,如果极大值为一个,则该文字区域得到一个笔画宽度;如果极大值有两个,则该文字区域得到两个笔画宽度。
[0018]优选地,所述依据所述笔画宽度直方图中的极大值确定所述原始连通分量是否为文字区域之前,还包括:对所述笔画宽度直方图按照以下公式进行平滑操作:
[0019]
【权利要求】
1.一种笔画宽度提取方法,其特征在于,包括: 提取笔画的原始连通分量并对应一候选笔画宽度; 对所述原始连通分量进行腐蚀计算,并计算每次腐蚀前的连通分量的轮廓周长,组成周长直方图; 每次腐蚀计算后得到的连通分量对应一候选笔画宽度,对所述周长直方图进行差分计算,得到各候选笔画宽度对应的笔画长度; 将各候选笔画宽度对应的笔画长度组成笔画宽度直方图; 依据所述笔画宽度直方图中的极大值确定所述原始连通分量是否为文字区域,如果是文字区域,则依据极大值确定该文字区域的笔画宽度。
2.根据权利要求1所述的方法,其特征在于,所述对所述周长直方图进行差分计算,得到各候选笔画宽度对应的笔画长度,包括: 将所述周长直方图中第η次腐蚀前的连通分量的轮廓周长减去第n+1次腐蚀前的连通分量的轮廓周长,得到第η个候选笔画宽度对应的笔画长度;其中,η为正整数。
3.根据权利要求1或2所述的方法,其特征在于,所述依据所述笔画宽度直方图中的极大值确定所述原始连通分量是否为文字区域,包括: 寻找笔画宽度直方图中纵坐标表示的笔画长度的极大值,所述笔画宽度直方图中的横坐标表示笔画宽度,所述极大值对应的笔画宽度为峰值宽度; 从所述极大值中选出最大值和次大值; 如果所述最大值和次大值之和占笔画宽度直方图中笔画长度总长度的比例小于第一阈值,或者,最大峰值宽度与最大宽度之差超过第二阈值,则所述原始连通分量为非文字区域;否则,为文字区域。
4.根据权利要求3所述的方法,其特征在于: 如果极大值为一个,或者次大值小于最大值的x%,则舍弃次大值;其中,X为预设值。
5.根据权利要求3所述的方法,其特征在于,所述依据极大值确定该文字区域的笔画览度,包括: 确定笔画宽度直方图中极大值对应的峰值宽度为m,m为正整数; 计算2m或2m-l并作为该文字区域的笔画宽度; 其中,如果极大值为一个,则该文字区域得到一个笔画宽度;如果极大值有两个,则该文字区域得到两个笔画宽度。
6.根据权利要求1所述的方法,其特征在于,所述依据所述笔画宽度直方图中的极大值确定所述原始连通分量是否为文字区域之前,还包括: 对所述笔画宽度直方图按照以下公式进行平滑操作:
I ' n = W1 1n-l+W(1ln+Wlln+1 其中,r n表示平滑后的笔画长度,、+、、丨^均表示平滑前的笔画长度’^和^表示平滑权值。
7.根据权利要求1所述的方法,其特征在于,所述对所述原始连通分量进行腐蚀计算,并计算每次腐蚀前的连通分量的轮廓周长,包括: 选取原始连通分量的轮廓上的点作为初始点集; 从初始点集开始,对原始连通分量中的每个点进行广度遍历,获得每个点距离所述初始点集的最短路径长度,并将所述最短路径长度作为该点的腐蚀次数; 统计具有相同腐蚀次数η的点的个数,作为第η次腐蚀前的连通分量的轮廓周长,η为正整数。
8.根据权利要求7所述的方法,其特征在于: 对原始连通分量中的每个点进行4邻接的广度遍历。
9.一种笔画宽度提取装置,其特征在于,包括: 连通分量提取模块,用于提取笔画的原始连通分量并对应一候选笔画宽度; 腐蚀和轮廓周长提取模块,用于对所述原始连通分量进行腐蚀计算,并计算每次腐蚀前的连通分量的轮廓周长,组成周长直方图; 差分计算模块,用于每次腐蚀计算后得到的连通分量对应一候选笔画宽度,对所述周长直方图进行差分计算,得到各候选笔画宽度对应的笔画长度; 直方图生成模块 ,用于将各候选笔画宽度对应的笔画长度组成笔画宽度直方图; 笔画宽度提取模块,用于依据所述笔画宽度直方图中的极大值确定所述原始连通分量是否为文字区域,如果是文字区域,则依据极大值确定该文字区域的笔画宽度。
10.一种文字识别方法,其特征在于,根据权利要求1至8任一权利要求所述的笔画宽度提取方法提取笔画宽度,得到笔画,然后进行文字识别。
11.一种文字识别系统,其特征在于,包括权利要求9所述的笔画宽度提取装置,用于提取笔画宽度,还包括: 文字识别装置,用于根据提取的笔画宽度,得到笔画,然后进行文字识别。
【文档编号】G06K9/20GK103455816SQ201210169811
【公开日】2013年12月18日 申请日期:2012年5月28日 优先权日:2012年5月28日
【发明者】郑琪, 王永攀 申请人:阿里巴巴集团控股有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1