字符识别方法和设备的制造方法_5

文档序号:9751307阅读:来源:国知局
明的 范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任 意之一都可以以任意的组合方式来使用。
[0099] 本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行 的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用 微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的字符识别设备中的一些模 块的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全 部的装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储 在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网 网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
[0100] 应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领 域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中, 不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词"包含"不排除存在未 列在权利要求中的元件或步骤。位于元件之前的单词"一"或"一个"不排除存在多个这样的 元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实 现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项 来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名 称。
【主权项】
1. 一种字符识别方法,包括: 利用回归模型确定待识别图像J的待识别字符区域;以及 在所述待识别字符区域中进行字符识别; 其中,所述回归模型根据第一样本图像的字符区域获得,所述第一样本图像包括与所 述待识别图像J相同类型的图像。2. 如权利要求1所述的字符识别方法,其中,所述回归模型经训练而获得,所述回归模 型的训练包括以下步骤: 将所述第一样本图像的字符区域的绝对顶点坐标归一化; 将所述第一样本图像缩放,以获得具有标准尺寸的第一样本图像; 根据预设的特征计算方法计算所述具有标准尺寸的第一样本图像的特征;以及 利用回归算法,根据所述第一样本图像的字符区域的、归一化的顶点坐标以及所述具 有标准尺寸的第一样本图像的特征计算所述回归模型。3. 如权利要求2所述的字符识别方法,其中,所述确定待识别图像J的待识别字符区域 包括: 将所述待识别图像J缩放,以获得具有所述标准尺寸的待识别图像J' ; 根据所述预设的特征计算方法计算所述具有所述标准尺寸的待识别图像J'的特征f (J,); 将所述特征f σ')输入所述回归模型,以获得所述待识别字符区域的、归一化的顶点坐 标P(J');以及 基于所述归一化的顶点坐标p(j')计算所述待识别字符区域的绝对顶点坐标P(J)。4. 如权利要求2所述的字符识别方法,其中,所述预设的特征计算方法包括梯度特征计 算方法和/或纹理特征计算方法。5. 如权利要求1至4任一项所述的字符识别方法,其中,所述在所述待识别字符区域中 进行字符识别包括: 对所述待识别字符区域进行二值化操作;以及 基于所述二值化操作的结果,利用字符模板来进行字符识别。6. 如权利要求1至4任一项所述的字符识别方法,其中,所述在所述待识别字符区域中 进行字符识别是利用多类分类器进行,所述多类分类器经训练而获得,所述多类分类器的 训练包括以下步骤: 计算第二样本图像中的字符子图像的特征,所述第二样本图像包括与所述待识别图像 J相同类型的图像;以及 根据所述字符子图像的特征和对应的字符训练所述多类分类器。7. 如权利要求6所述的字符识别方法,其中,所述在所述待识别字符区域中进行字符识 别包括: 提取所述待识别字符区域中的相同宽度的子图像直至遍历整个待识别字符区域; 计算所述子图像的特征;以及 利用多类分类器,基于所述子图像的特征进行字符识别; 其中两个相邻子图像之间具有重叠部分,并且其中所述子图像的宽度大于或等于最大 字符宽度并且小于或等于最小字符宽度与字符间隔之和。8. 如权利要求7所述的字符识别方法,其中, 在所述计算第二样本图像中的字符子图像的特征之前,所述多类分类器的训练还包 括:将所述字符子图像缩放为具有标准高度,并保持所述字符子图像的宽高比不变;并且 在所述提取所述待识别字符区域中的相同宽度的子图像之前,所述在所述待识别字符 区域中进行字符识别还包括:将所述待识别字符区域缩放为具有所述标准高度,并保持所 述待识别字符区域的宽高比不变。9. 如权利要求1至4任一项所述的字符识别方法,其中,在在所述待识别字符区域中进 行字符识别之前,所述字符识别方法进一步包括: 对所述待识别字符区域进行水平校正。10. -种字符识别设备,包括: 区域确定装置,用于利用回归模型确定待识别图像J的待识别字符区域;以及 字符识别装置,用于在所述待识别字符区域中进行字符识别; 其中,所述回归模型根据第一样本图像的字符区域获得,所述第一样本图像包括与所 述待识别图像J相同类型的图像。11. 如权利要求10所述的字符识别设备,其中,所述字符识别设备进一步包括第一训练 装置,用于训练所述回归模型, 所述第一训练装置包括: 归一化模块,用于将所述第一样本图像的字符区域的绝对顶点坐标归一化; 第一缩放模块,用于将所述第一样本图像缩放,以获得具有标准尺寸的第一样本图像; 第一特征计算模块,用于根据预设的特征计算方法计算所述具有标准尺寸的第一样本 图像的特征;以及 回归模块,用于利用回归算法,根据所述第一样本图像的字符区域的、归一化的顶点坐 标以及所述具有标准尺寸的第一样本图像的特征计算所述回归模型。12. 如权利要求11所述的字符识别设备,其中,所述区域确定装置包括: 第二缩放模块,用于将所述待识别图像J缩放,以获得具有所述标准尺寸的待识别图像 J,; 第二特征计算模块,用于根据所述预设的特征计算方法计算所述具有所述标准尺寸的 待识别图像J'的特征f 0-); 坐标计算模块,用于将所述特征f(J')输入所述回归模型,以获得所述待识别字符区域 的、归一化的顶点坐标P(J');以及 反归一化模块,用于基于所述归一化的顶点坐标P(J')计算所述待识别字符区域的绝 对顶点坐标P(J)。13. 如权利要求10至12任一项所述的字符识别设备,其中,所述字符识别装置在所述待 识别字符区域中进行字符识别是利用多类分类器,所述银行字符识别设备进一步包括第二 训练装置,用于训练所述多类分类器, 所述第二训练装置包括: 第三特征计算模块,用于计算第二样本图像中的字符子图像的特征,所述第二样本图 像包括与所述待识别图像J相同类型的图像;以及 训练模块,用于根据所述字符子图像的特征和对应的字符训练所述多类分类器。14. 如权利要求13所述的字符识别设备,其中,所述字符识别装置包括: 提取模块,用于提取所述待识别字符区域中的相同宽度的子图像直至遍历整个待识别 字符区域; 第四特征计算模块,用于计算所述子图像的特征;以及 字符识别模块,用于利用多类分类器,基于所述子图像的特征进行字符识别; 其中两个相邻子图像之间具有重叠部分,并且其中所述子图像的宽度大于或等于最大 字符宽度并且小于或等于最小字符宽度与字符间隔之和。15. 如权利要求14所述的字符识别设备,其中, 所述第二训练装置还包括第三缩放模块,用于将所述字符子图像缩放为具有标准高 度,并保持所述字符子图像的宽高比不变;并且 所述字符识别装置还包括第四缩放模块,用于将所述待识别字符区域缩放为具有所述 标准高度,并保持所述待识别字符区域的宽高比不变。16. 如权利要求10至12任一项所述的字符识别设备,其中,所述字符识别设备进一步包 括: 校正装置,用于对所述待识别字符区域进行水平校正。
【专利摘要】本发明公开了一种字符识别方法和设备。该字符识别方法包括:利用回归模型确定待识别图像的待识别字符区域;以及在待识别字符区域中进行字符识别。回归模型根据第一样本图像的字符区域获得。第一样本图像包括与待识别图像J相同类型的图像。根据本发明提供的字符识别方法和设备,由于利用根据样本图像获得的回归模型来确定待识别字符区域,因此对字符的定位具有精确度高、适应性强的特点,可以极大提高字符识别的精度和可靠性。
【IPC分类】G06K9/20
【公开号】CN105512657
【申请号】CN201510516216
【发明人】姚聪, 周舒畅, 周昕宇, 吴育昕, 印奇
【申请人】北京旷视科技有限公司, 北京小孔科技有限公司
【公开日】2016年4月20日
【申请日】2015年8月20日
当前第5页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1