图像配准方法及其装置以及图像拼接方法及其装置的制造方法_3

文档序号：9376772阅读：来源：国知局

实施例的第二图像到第一图像的几何变换示意图。图3中，左边为第一图像，右边为第二图像。图3所示不同灰度直线连接的是两图中经文字识别后的候选匹配对。这些候选匹配对经过选择后获得自洽的候选匹配对，根据自洽的候选匹配对可以生成第二图像周围白色四边形框的几何变换。
[0054]步骤S140:根据步骤S130所生成的几何变换，将第二图像映射到第一图像的坐标系中。可以理解，在映射后，图3所示的右侧的白色四边形框的内容将被映射成左侧的矩形框中的内容。本领域普通技术人员可以理解该步骤的具体实现，为了简洁，在此不再详述。
[0055]本领域普通技术人员可以理解，上述图像配准方法100中的第一图像和第二图像可以是证件图像、图纸图像或任意其他适合的图像。证件图像在日常中应用较多。图纸图像通常幅面较大。将上述配准方法应用于证件图像和图纸图像不仅可以保证配准的准确性，而且计算量小，节约了技术操作人员的时间和精力。
[0056]可以理解，上述图像配准方法可以应用于多种图像处理操作，例如:图像转正、模板匹配、图像拼接等等。假设第一图像为正的，那么将第二图像映射到第一图像的坐标系中，即实现了第二图像的转正。此外，可以以第一图像为模板，进行第二图像与模板的匹配。
[0057]根据本发明另一方面，还提供了一种图像拼接方法，其包括按照上述图像配准方法对待拼接图像中的、包含文字的第一图像和第二图像进行配准。待拼接图像可以是两个或更多。本领域技术人员可以理解，待拼接图像至少包括两个包含文字的图像，其可以分别作为第一图像和第二图像。待拼接图像可以全部是包含文字的图像，也可以部分是包含文字的图像。对于后一种情况，可以仅针对包含文字的图像进行上述图像配准，而对于另外不包含文字的图像，采用现有的图像配准方法进行配准。
[0058]对于待拼接图像包括三个以上包含文字的图像的情况，则包含文字的图像可以顺次分别作为第一图像和第二图像而组成不同的图像对，按照上述图像配准方法进行配准。例如，对于连续拍摄的三个图像:图像a、图像b和图像C，则首先可以将图像a和图像b分别作为第一图像和第二图像，进行图像配准；然后，可以将图像b和图像c分别作为第一图像和第二图像，进行图像配准；最后根据上述两次图像配准结果，进行图像拼接。
[0059]图4示出了根据本发明一个实施例的图像拼接方法400的流程图，根据该图像拼接方法400，可以将两个或更多图像进行拼接。如图4所示，图像拼接方法400包括步骤S410、步骤S420、步骤S430和步骤S440。
[0060]步骤S410:选择待拼接图像中的新图像对。图像对由包含文字的第一图像和第二图像构成。
[0061]步骤S420:对所选图像对按照上述图像配准方法进行配准。
[0062]步骤S430:判断是否已经遍历待拼接图像的所有可能匹配的图像对。对于否的情况，转至步骤S410，重新选择新图像对。对于是的情况，转至步骤S440。
[0063]步骤S440:按照配准结果进行图像融合以获得拼接图像。在步骤S430的图像配准过程中，已经将第二图像映射到第一图像的坐标系中，完成了统一坐标变换。在此步骤，可以对第一图像和第二图像的互相重叠部分进行图像融合。
[0064]可选地，上述图像融合是通过对图像的互相重叠部分进行均值平滑处理来完成。如此，所获得的拼接图像将无明显拼接痕迹，具有无缝效果。可选地，可以将该互相重叠部分的像素值设置为第一图像或者第二图像的对应的像素值。
[0065]本领域普通技术人员可以理解，上述步骤S410中选择待拼接图像中的新图像对，可以是随机选择。如果待拼接图像为连续拍摄的图像，那么在上述步骤S410中可以每次选择两个相邻图像作为图像对。这里的连续是指图像中的内容是连续的。因为图像为连续拍摄，非相邻图像之间可能没有重叠区域，那么由非相邻图像构成的图像对则不可能匹配。因此，每次选择相邻图像来进行配准有效避免了无谓计算。
[0066]根据本发明又一方面，还提供了一种图像配准装置。该图像配准装置可以应用于证件图像或图纸图像等合适的图像。图5示出了根据本发明一个实施例的图像配准装置500的示意性框图。如图5所示，图像配准装置500包括识别模块510、粗匹配模块520、细匹配模块530和映射模块540。
[0067]识别模块510用于对第一图像和第二图像进行文字识别，其中该第一图像和该第二图像包含文字。文字识别可以通过OCR的方式。通过文字识别，可以获得诸如文字内容、文字位置等的文字识别结果。
[0068]可选地，识别模块510可包括样式识别模块，其用于对第一图像和第二图像进行文字样式识别。文字样式可以包括以下项中的一项或多项:文字字体、文字颜色、文字长宽比、文字大小和文字特殊效果。
[0069]可选地，识别模块510可包括置信度确定模块，其用于针对所识别的文字，确定文字识别的识别置信度。
[0070]可以理解，上述文字样式和识别置信度均可以作为文字识别结果的一部分。
[0071]粗匹配模块520用于基于识别模块510所获得的文字识别结果生成候选匹配对。具体地，粗匹配模块520可以利用打分公式来对文字识别结果中的各个文本区域打分，进而根据打分结果生成候选匹配对。打分公式可以是多个项的加和。打分公式的项例如是两个文本区域的文字内容差异度等。可选地，打分公式还可以考虑文字样式和/或识别置信度等因素，例如增加表达例如文字字体差异度、文字颜色差异度、文字大小差异度、文字识别置信度差异度的项。
[0072]可选地，粗匹配模块520包括预定字识别模块和匹配对生成模块。预定字识别模块用于识别文字识别结果中的预定字；匹配对生成模块用于针对该文字识别结果中的、该预定字以外的字生成候选匹配对。通过仅针对非预定字生成候选匹配对，而有选择性地忽略预定字，可以避免预定字的混淆作用，并且减小了计算量。
[0073]细匹配模块530用于在粗匹配模块520所生成的候选匹配对中选择自洽的候选匹配对并且根据该自洽的候选匹配对生成第二图像到第一图像的几何变换，例如通过RANSAC算法。
[0074]映射模块540用于根据细匹配模块530所生成的几何变换将第二图像映射到第一图像的坐标系中。
[0075]根据本发明再一方面，还提供了一种图像拼接装置。该图像拼接装置包括上述图像配准装置。该图像配准装置用于对待拼接图像中的、包含文字的第一图像和第二图像进行配准。
[0076]图6示出了根据本发明一个实施例的图像拼接装置600的示意性框图。如图6所示，图像拼接装置600包括选择模块610、图像配准装置620和融合模块630。选择模块610用于选择待拼接图像中的新图像对，直至遍历该待拼接图像的所有可能匹配的图像对。其中，图像对由包含文字的第一图像和第二图像构成。图像配准装置620用于对选择模块610每次所选的图像对进行配准。融合模块630用于按照配准结果进行图像融合以获得拼接图像。
[0077]本领域普通技术人员通过阅读上文关于图像配准方法和图像拼接方法的详细描述，能够理解上述图像配准装置和图像拼接装置的构成、实现以及优点，因此这里不再赘述。
[0078]在此提供的方法和装置不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述，构造这类系统所要求的结构是显而易见的。此外，本发明也不针对任何特定编程语言。应当明白，可以利用各种编程语言实

完整全部详细技术资料下载

当前第3页1 2 3 4