一种图像数字字符识别方法

文档序号：9579647阅读：568来源：国知局

一种图像数字字符识别方法
【技术领域】
[0001]本发明涉及一种图像数字字符识别方法，属于图像处理技术领域。
【背景技术】
[0002]字符识别技术综合了数字图像处理和模式识别技术，是一个重要的研究方向，有巨大的经济价值和现实意义，可以提高管理部门工作效率，节省大量的人力和资金。早在二十年代，德国科学家Taushek提出光学字符识别OCR概念；五十年代，开始对印刷体字符识别的研究；八十年代后期，字符快速识别成为可能；九十年代初，大量的OCR方面的论文和系统出现；今天字符识别技术随着计算机技术和人工智能研究的发展而逐步趋向成熟并取得了广泛应用。
[0003]目前，常用的识别算法有模板匹配，特征匹配，神经网络和子空间法。
[0004]模板匹配法是将提取出的字符图像缩放到模板一致的大小，与每个模板一一匹配，计算重叠度。其优点是算法简单，计算量较小。但是缺点明显，即识别的正确率不高，且容易混淆字符。
[0005]神经网络法是一种模拟生物神经网络的算法，能处理一些环境信息复杂、推理规则不明确的问题，在字符识别上也取得了重要应用。算法的优点是抗干扰能力强，识别正确率高。但其缺点也存在，即事先需要对算法进行大量的推理训练，在没有合理的训练下算法的效率优势并不明显。同时，算法也较为复杂，计算量也较大。
[0006]特征匹配中的SIFT (尺度不变特征变换)算法是一种提取局部特征的算法，可在图像的尺度空间中寻找位置、尺度、旋转等特征不变的特征点。正是由于它可检测这种具有位置、尺度、旋转不变特性的特征点，无需对算法进行训练，使得该算法一致被沿用至今。它的缺点在于计算速度慢，不适合运算能力较弱的平台如智能手机等使用，同时检测出的特征点的维数较高，当特征点数量较多时，占用内存空间会非常大。
[0007]通常，图像的维度较高，字符在这样的高维上分布是稀疏的，即使得基于统计分析的方法会遇到小样本问题，计算量也随之增加。子空间法是一种能够根据一定的性能目标来寻找线性或非线性的空间变换，将原始数据压缩到一个低维的子空间中，使在该子空间中数据分布更为紧凑，使得数据描述能力更强，算法的运算量也大大降低。

【发明内容】

[0008]针对上述技术问题，本发明所要解决的技术问题是提供一种图像数字字符识别方法，优化了图像识别算法，使得针对数字字符的识别准确度得到了有效的提高，并且加快了识别速度，保证了图像识别的工作效率。
[0009]本发明为了解决上述技术问题采用以下技术方案:本发明设计了一种图像数字字符识别方法，包括如下步骤:
[0010]步骤001.获取含有数字字符的样本图像，并进入步骤002 ；
[0011]步骤002.针对样本图像进行灰度化处理，获得样本灰度图像，并进入步骤003 ;
[0012]步骤003.采用多尺度Retinex算法针对样本灰度图像进行光照预处理操作，获得光照预处理样本图像，并进入步骤004 ;
[0013]步骤004.针对光照预处理样本图像进行二值化处理，获得二值化样本图像，并进入步骤005 ；
[0014]步骤005.分别针对二值化样本图像中各个数字字符的角度进行矫正，使得各个数字字符位于预设角度位置，进而获得矫正样本图像，并进入步骤006 ;
[0015]步骤006.针对矫正样本图像，分别获取其中各个数字字符所在的数字字符区域图像，并进入步骤007;
[0016]步骤007.采用预先针对0-9各个数字字符分别训练好的各个分类器，针对各个数字字符区域图像中的数字字符进行识别，分别获取各个数字字符区域图像中的各个数字字符；并根据各个数字字符区域图像所在样本图像中的位置，针对所获各个数字字符进行组合，获得对应样本图像的数字字符。
[0017]作为本发明的一种优选技术方案，所述步骤003具体包括:采用多尺度Retinex算法，根据如下公式，基于图像像素点，针对样本灰度图像进行光照预处理操作；
[0018]f(x,y) = l(x,y) Xr(x,y)
[0019]针对样本灰度图像中的各个像素点，通过不同角度的高斯核卷积图像算法获得样本灰度图像中各个像素点的反射分量r(x，y)，并针对样本灰度图像中各个像素点的反射分量r(x，y)，通过加权算法获得光照预处理样本图像；其中，f(x，y)表示样本灰度图像中各个像素点的实际灰度值分量，l(x，y)表示样本灰度图像中各个像素点的光照分量。
[0020]作为本发明的一种优选技术方案:所述步骤004中，针对光照预处理样本图像中的各个像素点进行二值化处理，获得二值化样本图像。
[0021]作为本发明的一种优选技术方案，所述步骤005具体包括:分别针对二值化样本图像中的各个数字字符，获得数字字符上下两边的斜率，并获得上下两边斜率的平均值，作为该数字字符的斜率，然后根据该数字字符的斜率，针对该数字字符进行矫正旋转，进而获得矫正样本图像。
[0022]作为本发明的一种优选技术方案:所述步骤005中，分别针对二值化样本图像中的各个数字字符，采用拟合直线法分别拟合数字字符上下两边的像素，用以获得该数字字符上下两边的斜率。
[0023]作为本发明的一种优选技术方案:所述步骤005中，分别针对二值化样本图像中的各个数字字符，根据数字字符的斜率，采用双线性差值旋转方法，针对该数字字符进行矫正旋转。
[0024]作为本发明的一种优选技术方案，所述步骤007中，所述预先针对0-9各个数字字符分别训练好的各个分类器分别通过如下步骤获得:
[0025]步骤a.针对分别包含指定数字的预设数量的样本图像，提取各幅图像的特征矩阵，进而获得该数字所对应的样本特征矩阵，并进入步骤b ;
[0026]步骤b.将该数字所对应的样本特征矩阵按预设规则分为训练样本和测试样本，并送入预设分类器中进行训练，获得针对该数字训练好的分类器。
[0027]作为本发明的一种优选技术方案:所述步骤a中，针对分别包含指定数字的预设数量的样本图像，采用二维PCA算法提取各幅图像的特征矩阵。
[0028]作为本发明的一种优选技术方案:所述步骤b中，采用九一分法，将该数字所对应的样本特征矩阵按预设规则分为九份训练样本和一份测试样本。
[0029]作为本发明的一种优选技术方案:所述步骤b中，所述预设分类器为决策树加Adaboost算法所实现的强分类器。
[0030]本发明所述一种图像数字字符识别方法采用以上技术方案与现有技术相比，具有以下技术效果:本发明设计的图像数字字符识别方法，优化了算法结构，将光照和倾斜的影响放在图像预处理阶段，保证在字符识别前获得较好的二值化字符图像；随后，采用二维PCA算法提取图像中的主要特征，降低图像的维度和运算复杂度；而由决策树和Adaboost算法相结合，优化了分类算法，既保证了识别的效率又降低了出现过拟合的风险；最后使用九一分法验证分类模型的泛化能力，确保了分类器的稳定性；通过对以上的算法优化，使得数字字符识别的准确率和速度均有了明显提高。
【附图说明】
[0031]图1是本发明设计图像数字字符识别方法的流程示意图。
【具体实施方式】
[0032]下面结合说明书附图针对本发明的【具体实施方式】作进一步详细的说明。
[0033]如图1所示，本发明设计的一种图像数字字符识别方法在实际应用过程当中，诸如应用在Android系统的移动终端上，具体包括如下步骤:
[0034]步骤001.Android 系统提供了 Camera，SurfaceView 和 ImageView 组件，结构为三者叠加而成，其中，Camera负责预览图像，拍照和截取指定区域图像，处于最底层；SurfaceView负责加载预览图像和初始化相机参数，处于中间层！ImageView负责绘制取景框，处于最上层。通过Android系统所提供的Camera，SurfaceView和ImageView组件获取含有数字字符的样本图像，并进入步骤002。
[0035]步骤002.针对样本图像进行灰度化处理，获得样本灰度图像，并进入步骤003。
[0036]步骤003.在算法实现中，光照对于图片拍摄的影响主要来自于不同光照环境下，如烈日、阴天、夜晚等，造成所拍摄图像存在区域光照不均匀的情况，光照不均匀会导致所拍摄图像在进行二值化处理操作时可能抹去图像内重要的字符信息，因此有必要在二值化处理前进行光照预处理操作，则在这里，设计采用多尺度Retinex算法(MSR)针对样本灰度图像进行光照预处理操作，获得光照预处理样本图像，这里具体包括:采用多尺度Retinex算法(MSR)，根据如下公式，基于图像像素点，针对样本灰度图像进行光照预处理操作；
[0037]f(x,y) = l(x,y) Xr(x,y)
[0038]针对样本灰度图像中的各个像素

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：程艳云;吕建飞;
技术所有人：南京邮电大学;
我是此专利的发明人

上一篇：一种基于最近邻的遥感影像单类信息提取方法
上一篇：一种基于生成概率模型的变压器故障检测方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。