图像变换方法及其装置以及图像识别方法及其装置的制造方法_3

文档序号：9376777阅读：来源：国知局

根据自洽的候选匹配对生成待变换图像到模板图像的几何变换。其中，自洽的候选匹配对是指这些候选匹配对内在逻辑一致，不含悖论。几何变换可以包含大小变换和平面外旋转等。可选地，该步骤S330利用随机抽样一致性(Random Sample Consensus, RANSAC)算法。RANSAC算法能鲁棒地估计模型参数。例如，它能从包括大量候选匹配对的数据集中估计出高精度的自洽的候选匹配对。此外，该步骤S330还可以用最小二乘法。
[0063]图4示出了根据本发明一个实施例的待变换图像到模板图像的几何变换示意图。图4中，左边为模板图像，右边为待变换图像。图4所示不同灰度直线连接的是两图的候选匹配对。这些候选匹配对经过选择后获得自洽的候选匹配对，根据自洽的候选匹配对可以生成待变换图像周围白色四边形框所代表的几何变换。
[0064]步骤S340:根据步骤S330所生成的几何变换变换待变换图像，使得在待变换图像中的文字与在模板图像中的对应文字大小和方向相同。根据所生成的几何变换，可以获知待旋转图像需要旋转的角度等几何变换信息。通过变换待变换图像，待变换图像的大小、形状和方向变得与模板图像的大小、形状和方向相同。可以理解，在变换后，图4所示的白色四边形框将变换为矩形。本领域普通技术人员可以理解该步骤的具体实现，为了简洁，在此不再详述。
[0065]本领域普通技术人员可以理解，上述图像变换方法300中的待变换图像可以是证件图像、图纸图像或任意其他适合的图像。证件图像在日常中应用较多。将上述变换方法应用于证件图像不仅可以保证变换的正确率，而且计算量小，节约了技术操作人员的时间和精力。
[0066]可以理解，上述图像变换方法可以作为多种图像操作的预处理，例如:模板匹配、图像识别等等。
[0067]根据本发明另一方面，还提供了一种图像识别方法。图5示出了根据本发明一个实施例的图像识别方法500的流程图。如图5所示，图像识别方法600包括步骤S510和步骤 S520。
[0068]步骤S510:按照上述图像变换方法对包含文字的待识别图像进行变换。
[0069]步骤S520:对经变换的图像进行模式识别。
[0070]图像变换后，特别是转正后，待识别图像的识别精度和识别速度能得到显著提高。
[0071]该模式识别可以是字符识别等。可选地，上述步骤S520具体包括:步骤S521:根据经变换的图像与模板图像的文字对应关系，提取经变换的图像的结构化信息；步骤S522:根据结构化信息确定经变换的图像中的文字内容。结构化信息指图像中各文本区域的信息，如身份证图像中的文本区域“姓名”、“身份证号码”等。
[0072]例如，图6示出了根据本发明一个实施例的、经文字识别的图像的示意图。对于图6所示的图像，已知模板图像最上面方框为姓名框，则可以确定待识别图像中“姓名”为“奥巴马”。
[0073]此外对于存在结构化信息的图像，例如证件照片，由于图像变换后，能将待识别图像各文本区域与模板图像中各文本区域直接建立联系，因此使图像的结构化信息提取变得非常简单，识别容易。
[0074]根据本发明又一方面，还提供了一种图像变换装置。该图像变换装置可以应用于证件图像等任意合适的图像。图7示出了根据本发明一个实施例的图像变换装置700的示意性框图。如图7所示，图像变换装置700包括预识别模块710、粗匹配模块720、细匹配模块730和变换模块740。
[0075]预识别模块710用于对包含文字的待变换图像进行文字预识别。文字预识别可以通过OCR的方式。通过文字预识别，可以获得诸如文字内容、文字位置等的文字预识别结果O
[0076]可选地，预识别模块710可包括样式识别模块，其用于对待变换图像进行文字样式识别。文字样式可以包括以下项中的一项或多项:文字字体、文字颜色、文字长宽比、文字大小和文字特殊效果。
[0077]可选地，预识别模块710还可包括置信度确定模块，其用于针对所预识别的文字，确定文字识别的识别置信度。
[0078]可以理解，上述文字样式和识别置信度均可以作为文字预识别结果的一部分。
[0079]粗匹配模块720用于待变换图像的文字预识别结果以及模板图像的文本区域，生成待变换图像与模板图像之间的候选匹配对。具体地，粗匹配模块720可以利用打分公式来对文字预识别结果中的各个文本区域打分，进而根据打分结果生成候选匹配对。打分公式可以是多个项的加和。打分公式的项例如是待变换图像和模板图像的文本区域的文字内容差异度等。可选地，打分公式还可以考虑文字样式和/或识别置信度等因素，例如增加表达例如文字字体差异度、文字颜色差异度、文字大小差异度、文字识别置信度差异度的项。
[0080]可选地，粗匹配模块720包括预定字识别模块和匹配对生成模块。预定字识别模块用于识别文字预识别结果中的预定字；匹配对生成模块用于针对该文字预识别结果中的、该预定字以外的字生成候选匹配对。通过仅针对非预定字生成候选匹配对，而有选择性地忽略预定字，可以避免预定字的混淆作用，并且减小了计算量。
[0081]细匹配模块730用于在粗匹配模块720所生成的候选匹配对中选择自洽的候选匹配对并且根据该自洽的候选匹配对生成待变换图像到模板图像的几何变换，例如通过RANSAC 算法。
[0082]变换模块740用于根据细匹配模块730所生成的几何变换变换待变换图像，使得在待变换图像中的文字与在模板图像中的对应文字大小和方向相同。
[0083]根据本发明再一方面，还提供了一种图像识别装置。图8示出了根据本发明一个实施例的图像识别装置800的示意性框图。如图8所示，图像识别装置800包括图像变换装置810以及模式识别模块820。该图像变换装置810采用上述的图像变换装置700，用于对包含文字的待识别图像进行变换。模式识别模块820用于对经变换的图像进行模式识别。
[0084]可选地，上述模式识别模块820具体用于对经变换的图像进行字符识别。
[0085]可选地，上述模式识别模块820包括信息提取模块和内容确定模块。信息提取模块用于根据经变换的图像与模板图像的文字对应关系，提取经变换的图像的结构化信息。内容确定模块用于根据结构化信息确定经变换的图像中的文字内容。
[0086]本领域普通技术人员通过阅读上文关于图像变换方法的详细描述，能够理解上述图像识别方法、图像变换装置和图像识别装置的构成、实现以及优点，因此这里不再赘述。
[0087]在此提供的方法和装置不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述，构造这类系统所要求的结构是显而易见的。此外，本发明也不针对任何特定编程语言。应当明白，可以利用各种编程语言实现在此描述的本发明的内容，并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
[0088]在此处所提供的说明书中，说明了大量具体细节。然而，能够理解，本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。
[0089]类似地，应当理解，为了精简本公开并帮助理解各个发明方面中的一个或多个，在上面对本发明的示例性实施例的描述中，本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说，如下面的权利要求书所反映的那样，发明方面在于少于前面公开的单个实施例的所有特征。因此，遵循【具体实施方式】的权利要求书由此明确地并入该【具体实施方式】，其中每个权利要求本身都作为本发明的单独实施例。

完整全部详细技术资料下载

当前第3页1 2 3 4