图像文字识别系统的制作方法

文档序号:11920766阅读:来源:国知局

技术特征:

1.图像文字识别系统,其特征在于,所述系统实现图像文字识别包含以下实现步骤:

(1)将待识别图像文字切分成仅包含单个字符的子图片;将其中的数字、字母和标点符号,文字子图分别标记出来;

(2)在每个数字、字母和标点对应的子图片中选择一张子图片,将子图中的字符,分别向上、下、左、右、左上、左下、右上和右下移动设定距离l,制成对应的特征图片,并对制成的特征图片进行对应的标注;

根据待识别图像选择对应字体,生成样本图片,对样本图片中的字符分别向上、下、左、右、左上、左下、右上和右下移动设定距离l,制成对应的特征图片,并对制成的特征图片进行对应的标注;

(3)将特征图片和待识别图片进行归一化处理,并将各图片的像素对应值,按位存储于存储模块中;

(4)将待识别子图片与对应类型的特征图片进行对比,同一像素位置的值执行异或处理,统计1出现的次数,记为误差频次;将误差频次最小的特征图片对应的标注作为识别结果进行输出。

2.如权利要求1所述的系统,其特征在于,n*h<l<N*h。

3.如权利要求2所述的系统,其特征在于,n≤1/4。

4.如权利要求1所述的系统,其特征在于,所述系统,中的归一化处理过程包括:将特征图片和待识别子图片的图片尺寸调整成相同大小;

对各图片中的各个像素灰度值根据设置的阈值分别转化成0或者1,将转化后的像素值按位置存储于存储模块中。

5.如权利要求1至4之一所述的系统,其特征在于,文字字符图片的切分包含以下实现过程:

A、将图片序列中的数字、字母和标点符号标记出来;

B、对未标记的子图片进行判断:是否满足L≤M*h,L为子图片字符投影的宽度,M为系数,h为行高;

对于不满足条件的子图片进行切分,切分位置根据以下公式进行确定:

f(x)=g(x)t(x)

<mrow> <mi>g</mi> <mrow> <mo>(</mo> <mi>x</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mn>1</mn> <mrow> <mn>1</mn> <mo>+</mo> <msup> <mi>e</mi> <mrow> <mo>-</mo> <mn>0.01</mn> <mo>|</mo> <mi>x</mi> <mo>-</mo> <mi>h</mi> <mo>|</mo> </mrow> </msup> </mrow> </mfrac> </mrow>

重复执行步骤B,直到序列中未标记的子图片均满足条件:L≤M*h;

C、对于序列中数字、字母和标点字图片以外的相邻两子图片的总宽度进行判断:是否满足L≤M*h;

如果满足,依序对满足条件的相邻子图片进行合并;

重复执行步骤C直到除数字、字母和标点以外的相邻子图片总宽度均不满足L≤M*h;

D、对序列中未标记的子图片进行判断:如果序列中存在三个相邻的子图片,且三个子图片满足:第一子图片和第三子图片的宽度L≤0.5h,且中间子图片的宽度L≥h,则将中间子图片根据公式:

f(x)=g(x)t(x)

<mrow> <mi>g</mi> <mrow> <mo>(</mo> <mi>x</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mn>1</mn> <mrow> <mn>1</mn> <mo>+</mo> <msup> <mi>e</mi> <mrow> <mo>-</mo> <mn>0.01</mn> <mo>|</mo> <mi>x</mi> <mo>-</mo> <mn>0.5</mn> <mi>h</mi> <mo>|</mo> </mrow> </msup> </mrow> </mfrac> </mrow>

所确定的切分点进行切分;根据确定的切分点,将中间子图片切分成第一中间子图片和第二中间子图片;

将第一子图片和第一中间子图片合并;

将第二中间子图片和第三子图片合并。

6.如权利要求5所述的系统,其特征在于,0.9≤M≤1.3。

7.如权利要求6所述的系统,其特征在于,M=1.2。

8.如权利要求7所述的系统,其特征在于,所述系统为加载有上述图像文字识别功能程序的计算机或服务器。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1