图像文字识别系统的制作方法

文档序号：11920766阅读：来源：国知局

技术特征：

1.图像文字识别系统，其特征在于，所述系统实现图像文字识别包含以下实现步骤：

(1)将待识别图像文字切分成仅包含单个字符的子图片；将其中的数字、字母和标点符号，文字子图分别标记出来；

(2)在每个数字、字母和标点对应的子图片中选择一张子图片，将子图中的字符，分别向上、下、左、右、左上、左下、右上和右下移动设定距离l，制成对应的特征图片，并对制成的特征图片进行对应的标注；

根据待识别图像选择对应字体，生成样本图片，对样本图片中的字符分别向上、下、左、右、左上、左下、右上和右下移动设定距离l，制成对应的特征图片，并对制成的特征图片进行对应的标注；

(3)将特征图片和待识别图片进行归一化处理，并将各图片的像素对应值，按位存储于存储模块中；

(4)将待识别子图片与对应类型的特征图片进行对比，同一像素位置的值执行异或处理，统计1出现的次数，记为误差频次；将误差频次最小的特征图片对应的标注作为识别结果进行输出。

2.如权利要求1所述的系统，其特征在于，n*h＜l＜N*h。

3.如权利要求2所述的系统，其特征在于，n≤1/4。

4.如权利要求1所述的系统，其特征在于，所述系统，中的归一化处理过程包括：将特征图片和待识别子图片的图片尺寸调整成相同大小；

对各图片中的各个像素灰度值根据设置的阈值分别转化成0或者1，将转化后的像素值按位置存储于存储模块中。

5.如权利要求1至4之一所述的系统，其特征在于，文字字符图片的切分包含以下实现过程：

A、将图片序列中的数字、字母和标点符号标记出来；

B、对未标记的子图片进行判断：是否满足L≤M*h，L为子图片字符投影的宽度，M为系数，h为行高；

对于不满足条件的子图片进行切分，切分位置根据以下公式进行确定：

f(x)＝g(x)t(x)

$<mrow> <mi>g</mi> <mrow> <mo>(</mo> <mi>x</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mn>1</mn> <mrow> <mn>1</mn> <mo>+</mo> <msup> <mi>e</mi> <mrow> <mo>-</mo> <mn>0.01</mn> <mo>|</mo> <mi>x</mi> <mo>-</mo> <mi>h</mi> <mo>|</mo> </mrow> </msup> </mrow> </mfrac> </mrow>$

重复执行步骤B，直到序列中未标记的子图片均满足条件：L≤M*h；

C、对于序列中数字、字母和标点字图片以外的相邻两子图片的总宽度进行判断：是否满足L_合≤M*h；

如果满足，依序对满足条件的相邻子图片进行合并；

重复执行步骤C直到除数字、字母和标点以外的相邻子图片总宽度均不满足L_合≤M*h；

D、对序列中未标记的子图片进行判断：如果序列中存在三个相邻的子图片，且三个子图片满足：第一子图片和第三子图片的宽度L≤0.5h，且中间子图片的宽度L≥h，则将中间子图片根据公式：

f(x)＝g(x)t(x)

$<mrow> <mi>g</mi> <mrow> <mo>(</mo> <mi>x</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mn>1</mn> <mrow> <mn>1</mn> <mo>+</mo> <msup> <mi>e</mi> <mrow> <mo>-</mo> <mn>0.01</mn> <mo>|</mo> <mi>x</mi> <mo>-</mo> <mn>0.5</mn> <mi>h</mi> <mo>|</mo> </mrow> </msup> </mrow> </mfrac> </mrow>$

所确定的切分点进行切分；根据确定的切分点，将中间子图片切分成第一中间子图片和第二中间子图片；

将第一子图片和第一中间子图片合并；

将第二中间子图片和第三子图片合并。

6.如权利要求5所述的系统，其特征在于，0.9≤M≤1.3。

7.如权利要求6所述的系统，其特征在于，M＝1.2。

8.如权利要求7所述的系统，其特征在于，所述系统为加载有上述图像文字识别功能程序的计算机或服务器。

完整全部详细技术资料下载

当前第2页1 2 3