1.图像文字识别系统,其特征在于,所述系统实现图像文字识别包含以下实现步骤:
(1)将待识别图像文字切分成仅包含单个字符的子图片;将其中的数字、字母和标点符号,文字子图分别标记出来;
(2)在每个数字、字母和标点对应的子图片中选择一张子图片,将子图中的字符,分别向上、下、左、右、左上、左下、右上和右下移动设定距离l,制成对应的特征图片,并对制成的特征图片进行对应的标注;
根据待识别图像选择对应字体,生成样本图片,对样本图片中的字符分别向上、下、左、右、左上、左下、右上和右下移动设定距离l,制成对应的特征图片,并对制成的特征图片进行对应的标注;
(3)将特征图片和待识别图片进行归一化处理,并将各图片的像素对应值,按位存储于存储模块中;
(4)将待识别子图片与对应类型的特征图片进行对比,同一像素位置的值执行异或处理,统计1出现的次数,记为误差频次;将误差频次最小的特征图片对应的标注作为识别结果进行输出。
2.如权利要求1所述的系统,其特征在于,n*h<l<N*h。
3.如权利要求2所述的系统,其特征在于,n≤1/4。
4.如权利要求1所述的系统,其特征在于,所述系统,中的归一化处理过程包括:将特征图片和待识别子图片的图片尺寸调整成相同大小;
对各图片中的各个像素灰度值根据设置的阈值分别转化成0或者1,将转化后的像素值按位置存储于存储模块中。
5.如权利要求1至4之一所述的系统,其特征在于,文字字符图片的切分包含以下实现过程:
A、将图片序列中的数字、字母和标点符号标记出来;
B、对未标记的子图片进行判断:是否满足L≤M*h,L为子图片字符投影的宽度,M为系数,h为行高;
对于不满足条件的子图片进行切分,切分位置根据以下公式进行确定:
f(x)=g(x)t(x)
重复执行步骤B,直到序列中未标记的子图片均满足条件:L≤M*h;
C、对于序列中数字、字母和标点字图片以外的相邻两子图片的总宽度进行判断:是否满足L合≤M*h;
如果满足,依序对满足条件的相邻子图片进行合并;
重复执行步骤C直到除数字、字母和标点以外的相邻子图片总宽度均不满足L合≤M*h;
D、对序列中未标记的子图片进行判断:如果序列中存在三个相邻的子图片,且三个子图片满足:第一子图片和第三子图片的宽度L≤0.5h,且中间子图片的宽度L≥h,则将中间子图片根据公式:
f(x)=g(x)t(x)
所确定的切分点进行切分;根据确定的切分点,将中间子图片切分成第一中间子图片和第二中间子图片;
将第一子图片和第一中间子图片合并;
将第二中间子图片和第三子图片合并。
6.如权利要求5所述的系统,其特征在于,0.9≤M≤1.3。
7.如权利要求6所述的系统,其特征在于,M=1.2。
8.如权利要求7所述的系统,其特征在于,所述系统为加载有上述图像文字识别功能程序的计算机或服务器。