图像变换方法及其装置以及图像识别方法及其装置的制造方法_4

文档序号:9376777阅读:来源:国知局
[0090]本领域那些技术人员可以理解,可以对实施例中的装置中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个装置中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者装置的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
[0091]此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
[0092]本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的图像变换装置和图像识别装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
[0093]应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
【主权项】
1.一种图像变换方法,其特征在于,包括: 步骤SlOO:对包含文字的待变换图像进行文字预识别; 步骤S200:基于所述待变换图像的文字预识别结果以及模板图像的文本区域,生成所述待变换图像与所述模板图像之间的候选匹配对; 步骤S300:在所述候选匹配对中选择自洽的候选匹配对并且根据所述自洽的候选匹配对生成所述待变换图像到所述模板图像的几何变换;以及 步骤S400:根据所述几何变换变换所述待变换图像,使得在所述待变换图像中的文字与在所述模板图像中的对应文字大小和方向相同。2.如权利要求1所述的图像变换方法,其特征在于,所述步骤SlOO包括:对所述待变换图像进行文字样式识别。3.如权利要求2所述的图像变换方法,其特征在于,所述文字样式包括以下项中的一项或多项:文字字体、文字颜色、文字长宽比、文字大小和文字特殊效果。4.如权利要求1至3任一项所述的图像变换方法,其特征在于,所述步骤SlOO进一步包括:针对所预识别的文字,确定文字识别的识别置信度,其中所述识别置信度作为所述文字预识别结果的一部分。5.如权利要求1所述的图像变换方法,其特征在于,所述步骤S200包括: 识别所述文字预识别结果中的预定字;以及 针对所述文字预识别结果中的、所述预定字以外的字生成所述候选匹配对。6.如权利要求1所述的图像变换方法,其特征在于,所述步骤S300是利用随机抽样一致性算法。7.如权利要求1所述的图像变换方法,其特征在于,所述待变换图像是证件图像。8.如权利要求1所述的图像变换方法,其特征在于,所述步骤S200之前还包括:步骤S100’:对所述模板图像进行文字预识别,以确定所述文本区域。9.一种图像识别方法,其特征在于,包括: 步骤a:按照如权利要求1至8任一项所述的图像变换方法对包含文字的待识别图像进行变换;以及 步骤b:对经变换的图像进行模式识别。10.如权利要求9所述的图像识别方法,其特征在于,所述模式识别是字符识别。11.如权利要求10所述的图像识别方法,其特征在于,所述步骤b包括: 根据所述经变换的图像与所述模板图像的文字对应关系,提取所述经变换的图像的结构化信息;以及 根据所述结构化信息确定所述经变换的图像中的文字内容。12.一种图像变换装置,其特征在于,包括: 预识别模块,用于对包含文字的待变换图像进行文字预识别; 粗匹配模块,用于基于所述待变换图像的文字预识别结果以及模板图像的文本区域,生成所述待变换图像与所述模板图像之间的候选匹配对; 细匹配模块,用于在所述候选匹配对中选择自洽的候选匹配对并且根据所述自洽的候选匹配对生成所述待变换图像到所述模板图像的几何变换;以及 变换模块,用于根据所述几何变换变换所述待变换图像,使得在所述待变换图像中的文字与在所述模板图像中的对应文字大小和方向相同。13.如权利要求12所述的图像变换装置,其特征在于,所述预识别模块包括: 样式识别模块,用于对所述待变换图像进行文字样式识别。14.如权利要求13所述的图像变换装置,其特征在于,所述文字样式包括以下项中的一项或多项:文字字体、文字颜色、文字长宽比、文字大小和文字特殊效果。15.如权利要求12至14任一项所述的图像变换装置,其特征在于,所述预识别模块进一步包括: 置信度确定模块,用于针对所预识别的文字,确定文字识别的识别置信度,其中所述识别置信度作为所述文字预识别结果的一部分。16.如权利要求12所述的图像变换装置,其特征在于,所述粗匹配模块包括: 预定字识别模块,用于识别所述文字预识别结果中的预定字;以及 匹配对生成模块,用于针对所述文字预识别结果中的、所述预定字以外的字生成所述候选匹配对。17.一种图像识别装置,其特征在于,包括: 如权利要求12至16任一项所述的图像变换装置,用于对包含文字的待识别图像进行变换;以及 模式识别模块,用于对经变换的图像进行模式识别。18.如权利要求17所述的图像识别装置,其特征在于,所述模式识别模块具体用于对所述经变换的图像进行字符识别。19.如权利要求18所述的图像识别装置,其特征在于,所述模式识别模块包括: 信息提取模块,用于根据所述经变换的图像与所述模板图像的文字对应关系,提取所述经变换的图像的结构化信息;以及 内容确定模块,用于根据所述结构化信息确定所述经变换的图像中的文字内容。
【专利摘要】本发明公开了图像变换方法、图像变换装置、图像识别方法和图像识别装置。该图像变换方法包括:步骤S100:对包含文字的待变换图像进行文字预识别;步骤S200:基于待变换图像的文字预识别结果以及模板图像的文本区域,生成待变换图像与模板图像之间的候选匹配对;步骤S300:在候选匹配对中选择自洽的候选匹配对并且根据自洽的候选匹配对生成待变换图像到模板图像的几何变换;以及步骤S400:根据几何变换变换待变换图像,使得在待变换图像中的文字与在模板图像中的对应文字大小和方向相同。上述图像变换方法和其对应装置计算量小、正确率高。上述图像识别方法和其对应装置也在较小计算量的前提下,能够由于文字变正而取得较好识别效果。
【IPC分类】G06K9/00, G06T3/20
【公开号】CN105096244
【申请号】CN201510381884
【发明人】周舒畅, 姚聪, 巩运青
【申请人】北京旷视科技有限公司, 北京小孔科技有限公司
【公开日】2015年11月25日
【申请日】2015年7月2日
当前第4页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1