文字识别方法及装置的制造方法

文档序号:9579641阅读:559来源:国知局
文字识别方法及装置的制造方法
【技术领域】
[0001]本公开涉及模式识别技术领域,尤其涉及一种文字识别方法及装置。
【背景技术】
[0002]模式识别技术的研究目的是根据人的大脑的识别机理,通过计算机模拟,构造出能代替人完成分类和辨识的任务,进而进行自动信息处理的机器系统。汉字识别在模式识别中的发展有一定的历史,对于传统的汉字识别,如果噪声干扰不大,识别率能达到95%以上。最典型的应用就是身份证识别以及名片识别。
[0003]传统的汉字识别方法基于传统的特征抽取,然后再采用改进的二次分类函数(Modified Quadratic Discriminant Funct1n, MQDF)分类器来进行汉字识别。
[0004]但是,传统的汉字识别通常基于人工经验提取特征,不具备一定的噪声抗干扰能力。因此,当噪声干扰较大时,会导致汉字的识别率较低。

【发明内容】

[0005]为克服相关技术中存在的问题,本公开提供一种文字识别方法及装置。
[0006]根据本公开实施例的第一方面,提供一种文字识别方法,包括:
[0007]采用卷积神经网络对待识别文字图像提取特征,得到文字特征值;
[0008]采用MQDF分类器对所述文字特征值进行分类处理,得到所述待识别文字图像对应的文字。
[0009]在一实施例中,所述方法还包括:
[0010]对所述卷积神经网络进行模型训练。
[0011]在一实施例中,所述对所述卷积神经网络进行模型训练,包括:
[0012]将待识别文字图像样本和标签输入到所述卷积神经网络的卷积层进行处理,得到卷积特征值;
[0013]将所述卷积特征值输入到所述卷积神经网络的全连接层进行处理,得到全连接特征值;
[0014]将所述全连接特征值输入到所述卷积神经网络的损失函数层进行反向传播处理,来调整卷积层中卷积核的参数,直至所述损失函数层中的损失函数收敛到收敛阈值,否则重复对所述卷积神经网络进行模型训练。
[0015]在一实施例中,所述将所述待识别文字图像样本和标签输入到所述卷积神经网络的卷积层进行处理,得到卷积特征值,包括:
[0016]将所述待识别文字图像样本和所述标签作为第零卷积特征值输入到所述卷积神经网络的第一卷积层中进行处理,得到第一卷积特征值;
[0017]将所述第η-1卷积特征值输入到所述卷积神经网络的第η卷积层中进行处理,得到第η卷积特征值,η为大于或者等于2的整数,所述第η卷积特征值为所述卷积神经网络的卷积层输出的所述卷积特征值。
[0018]在一实施例中,所述将所述第η-1卷积特征值输入到所述卷积神经网络的第η卷积层中进行处理,得到第η卷积特征值,包括:
[0019]将所述第η-1卷积特征值输入到所述第η卷积层的第η真实卷积层,所述第η真实卷积层中的多个卷积核对所述第η-1卷积特征值进行卷积,得到第η-1真实卷积特征值;
[0020]将所述第η-1真实卷积特征值输入到第η池化层中进行池化处理,得到第η卷积特征值。
[0021 ] 在一实施例中,所述将所述全连接特征值输入到所述卷积神经网络的损失函数层进行反向传播处理,来调整卷积层中卷积核的参数,直至所述损失函数层中的损失函数收敛到收敛阈值,否则重复对所述卷积神经网络进行模型训练,包括:
[0022]将所述全连接特征值输入到所述卷积神经网络的损失函数层进行损失函数计算,得到损失函数值,所述损失函数为分类值与标签的差值函数;
[0023]当所述损失函数值小于上一次训练得到的所述损失函数值时,对所述卷积神经网络进行反向传播来调整所述卷积层中卷积核的参数,并且重复对所述卷积神经网络进行模型训练,直到得到的所述损失函数值小于损失函数阈值并且收敛。
[0024]在一实施例中,所述采用卷积神经网络对待识别文字图像提取特征,得到文字特征值,包括:
[0025]将所述待识别文字图像输入到所述卷积神经网络的卷积层进行处理,得到卷积特征值;
[0026]将所述卷积特征值输入到所述卷积神经网络的全连接层进行处理,得到全连接特征值;
[0027]将所述全连接特征值输入到所述卷积神经网络的函数层进行函数处理,得到所述文字特征值。
[0028]在一实施例中,所述将所述待识别文字图像输入到所述卷积神经网络的卷积层进行处理,得到卷积特征值,包括:
[0029]将所述待识别文字图像作为第零卷积特征值输入到所述卷积神经网络的第一卷积层中进行处理,得到第一卷积特征值;
[0030]将所述第η-1卷积特征值输入到所述卷积神经网络的第η卷积层中进行处理,得到第η卷积特征值,η为大于或者等于2的整数,所述第η卷积特征值为所述卷积神经网络的卷积层输出的所述卷积特征值。
[0031 ] 在一实施例中,所述方法还包括:
[0032]对所述待识别文字图像进行归一化的操作,或者对所述待识别文字图像样本进行归一化的操作。
[0033]根据本公开实施例的第二方面,提供一种文字识别装置,包括:
[0034]提取模块,被配置为采用卷积神经网络对待识别文字图像提取特征,得到文字特征值;
[0035]分类模块,被配置为采用MQDF分类器对所述提取模块得到的所述文字特征值进行分类处理,得到所述待识别文字图像对应的文字。
[0036]在一实施例中,所述装置还包括:
[0037]训练模块,被配置为对所述卷积神经网络进行模型训练。
[0038]在一实施例中,所述训练模块包括:
[0039]第一处理子模块,被配置为将待识别文字图像样本和标签输入到所述卷积神经网络的卷积层进行处理,得到卷积特征值;
[0040]第二处理子模块,被配置为将所述第一处理子模块得到的所述卷积特征值输入到所述卷积神经网络的全连接层进行处理,得到全连接特征值;
[0041]第三处理子模块,被配置为将所述第二处理子模块得到的所述全连接特征值输入到所述卷积神经网络的损失函数层进行反向传播处理,来调整卷积层中卷积核的参数,直至所述损失函数层中的损失函数收敛到收敛阈值,否则重复对所述卷积神经网络进行模型训练。
[0042]在一实施例中,所述第一处理子模块包括:
[0043]第一处理单元,被配置为将所述待识别文字图像样本和所述标签作为第零卷积特征值输入到所述卷积神经网络的第一卷积层中进行处理,得到第一卷积特征值;
[0044]第η处理单元,被配置为将所述第η-1卷积特征值输入到所述卷积神经网络的第η卷积层中进行处理,得到第η卷积特征值,η为大于或者等于2的整数,所述第η卷积特征值为所述卷积神经网络的卷积层输出的所述卷积特征值。
[0045]在一实施例中,所述第η处理单元包括:
[0046]卷积处理子单元,被配置为将所述第η-1卷积特征值输入到所述第η卷积层的第η真实卷积层,所述第η真实卷积层中的多个卷积核对所述第η-1卷积特征值进行卷积,得到第η-1真实卷积特征值;
[0047]池化处理子单元,被配置为将所述卷积处理子单元得到的所述第η-1真实卷积特征值输入到第η池化层中进行池化处理,得到第η卷积特征值。
[0048]在一实施例中,所述第三处理子模块包括:
[0049]计算单元,被配置为将所述全连接特征值输入到所述卷积神经网络的损失函数层进行损失函数计算,得到损失函数值,所述损失函数为分类值与标签的差值函数;
[0050]调整单元,被配置为当所述计算单元计算的所述损失函数值小于上一次训练得到的所述损失函数值时,对所述卷积神经网络进行反向传播来调整所述卷积层中卷积核的参数,并且重复对所述卷积神经网络进行模型训练,直到得到的所述损失函数值小于损失函数阈值并且收敛。
[0051 ] 在一实施例中,所述提取模块包括:
[0052]卷积处理子模块,被配置为将所述待识别文字图像输入到所述卷积神经网络的卷积层进行处理,得到卷积特征值;
[0053]全连接处理子模块,被配置为将所述卷积处理子模块得到的所述卷积特征值输入到所述卷积神经网络的全连接层进行处理,得到全连接特征值;
[0054]函数处理子模块,被配置为将所述全连接处理子模块得到的所述全连接特征值输入到所述卷积神经网络的函数层进行函数处理,得到所述文字特征值。
[0055]在一实施例中,所述卷积处理子模块包括:
[0056]第一处理单元,被配置为将所述待识别文字图像作为第零卷积特征值输入到所述卷积神经网络的第一卷积层中进行处理,得到第一卷积特征值;
[0057]第η处理单元,被配置为将所述第η-1卷积特征值输入到所述卷积神经网络的第η卷积层中进行处理,得到第η卷积特征值,η为大于或者等于2的整数,所述第η卷积特征值为所述卷积神经网络的卷积层输出的所述卷积特征值。
[0058]在一实施例中,所述装置还包括:
[0059]归一化模块,被配置为对所述待识别文字图像进行归一化的操作,或者对所述待识别文字图像样本进行归一化的操作。
[0060]根据本公开实施例的第三方面,提供一种文字识别装置,包括:
[0061]处理器;
[0062]用于存储处理器可执行指令的存储器;
[0063]其中,处理器被配置为:
[0064]采用卷积神经网络对待识别文字图像提取特征,得到文字特征值;
[0065]采用MQDF分类器对所述文字特征值进行分类处理,得到所述待识别文字图像对应的文字。
[0066]本公开的实施例提供的技术方案可以包括以下有益效果:采用卷积神经网络对待识别文字图像提取特征,使得得到的文字特征值更精确,具有较好的噪声抗干扰能力,从而使得采用MQDF分类器根据该文字特征值识别出的文字准确率较高。
[0067]通过对卷积神经网络进行模型训练,使得该卷积神经网络具有合适的模型参数,从而为后续得到丰富的文字特征值提供条件。
[0068]通过对卷积神经网络进行模型训练,可以获得较好的模型参数,从而为后续采用该卷积神经网络获得文字特征值提供条件。
[0069]通过多个卷积层得到第η卷积特征值,
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1