卡片信息识别方法及装置与流程

文档序号：12471208阅读：685来源：国知局

本公开涉及图像处理技术领域，尤其涉及卡片信息识别方法及装置。

背景技术：

在日常生活中，出现了各种各样的卡片，其中，对于一些卡片，卡片信息在该卡片中的位置是固定的，例如，该卡片为身份证，该身份证中通常包括公民的姓名、性别、民族、出生日期、家庭住址、身份证号以及头像等身份信息，该身份信息在该身份证中的位置均是固定。该类卡片在日常生活中通常被广泛使用，以身份证为例，身份证是用于证明公民身份的证件，在日常生活中，身份证是公民参加各种政治活动、社会活动等必要的证件，例如，乘坐火车飞机、入住酒店等。在日常使用过程中，为了能够获取到卡片中的卡片信息，通常需要终端对该卡片进行识别。

在相关技术中，卡片信息识别过程通常包括：对卡片进行拍照，之后，终端利用相关技术确定该卡片中的指定区域，例如，在身份证中，该指定区域可以为头像区域，相应地，该相关技术可以为人脸检测技术，之后，由于该类卡片具有很强的结构信息特征，也即是，固定区域对应固定卡片信息，因此，在标准的卡片图像中，以所确定的指定区域作为参照物，终端即可确定该卡片中其它卡片信息的区域，从而确定该区域对应的卡片信息，如此，即可实现对该卡片进行识别。

技术实现要素：

为克服相关技术中存在的问题，本公开提供一种卡片信息识别方法及装置。

第一方面，提供一种卡片信息识别方法，所述方法包括：

从第一图像中确定指定区域，所述第一图像为对待识别的卡片进行拍摄得到，所述卡片为四边形卡片，且所述卡片中的卡片信息位于所述卡片中的指定位置；

确定所述第一图像中包括的至少一个四边形轮廓；

对于所述至少一个四边形轮廓中的每个四边形轮廓，基于所述四边形轮廓和所述卡片的宽度和长度，对所述四边形轮廓在所述第一图像中所包围的四边形图像进行校正，且校正后的所述四边形图像的四条边分别与所述第一图像的对应方向上的边平行；

基于所述指定区域，从校正后的至少一个四边形图像中选择目标图像；

将所述目标图像确定为卡片图像，并基于所述卡片图像和所述卡片信息在所述卡片中的指定位置，对所述卡片中的卡片信息进行识别。

可选地，所述确定所述第一图像中包括的至少一个四边形轮廓，包括：

确定所述第一图像中的所有直线段；

在所述所有直线段中，将方向相同且相邻两端点之间距离小于或等于预设距离的直线段进行连接，得到多条预处理直线段；

从所述多条预处理直线段中，按照预设规则，选择至少一组预处理直线段进行组合，得到所述至少一个四边形轮廓；

其中，对于所述至少一个四边形轮廓中的每个四边形轮廓，所述预设规则包括所述四边形轮廓的四个内角与90度之间的差值均处于预设范围内，所述四边形轮廓的四条边按照顺时针或逆时针方向依次连接，所述四边形轮廓所围成的区域面积大于或等于预设面积，且组成所述四边形轮廓的每条预处理直线段的长度与所述预处理直线段在所述四边形轮廓中所在边的长度之间的差值小于或等于预设长度。

可选地，所述基于所述四边形轮廓和所述卡片的宽度和长度，对所述四边形轮廓在所述第一图像中所包围的四边形图像进行校正，包括：

确定所述四边形轮廓的四个顶点在指定坐标系中的顶点坐标；

基于所述卡片的宽度和长度，确定四个目标顶点坐标；

基于所述四边形轮廓的四个顶点坐标和所述四个目标顶点坐标，确定所述四边形轮廓对应的单应性矩阵；

基于所述四边形轮廓对应的单应性矩阵，将所述四边形轮廓在所述第一图像中所包围的四边形图像中的每个像素点进行映射变换，以实现对所述四边形图像进行校正。

可选地，所述基于所述指定区域，从校正后的至少一个四边形图像中选择目标图像，包括：

基于所述四边形轮廓对应的单应性矩阵，将所述指定区域中的指定点映射到校正后的所述四边形图像中；

确定所述四边形图像对应的第一距离和第二距离，所述第一距离为所述指定点与校正后的所述四边形图像中第一边界之间的距离，所述第二距离为所述指定点与校正后的所述四边形图像中第二边界之间的距离，所述第一边界与所述第二边界相交；

基于第一指定比例、第二指定比例、所述至少一个四边形图像对应的第一距离和第二距离，从校正后的所述至少一个四边形图像中选择目标图像，所述第一指定比例为所述指定点与所述卡片的第一边界之间的距离在所述卡片的第二边界中所占的比例，所述第二指定比例为所述指定点与所述卡片的第二边界之间的距离在所述卡片的第一边界中所占的比例。

可选地，所述基于第一指定比例、第二指定比例、所述至少一个四边形图像对应的第一距离和第二距离，从校正后的所述至少一个四边形图像中选择目标图像，包括：

对于所述至少一个四边形图像中的每个四边形图像，基于所述第一指定比例、所述第二指定比例、所述四边形图像的第一距离和第二距离，通过距离差公式确定所述四边形图像对应的距离差；

将所述至少一个四边形图像中距离差最小的四边形图像确定为所述目标图像。

可选地，所述基于所述卡片图像和所述卡片信息在所述卡片中的指定位置，对所述卡片中的卡片信息进行识别，包括：

基于所述指定位置，从所述卡片图像中切割出所述卡片信息，得到初步切割图像；

对所述初步切割图像进行二值化处理，得到二值化处理图像；

对所述二值化处理图像进行去燥处理，得到去燥处理图像；

从所述去燥处理图像中切割出多个单字符图像，并通过光学字符识别OCR模块对所述多个单字符图像中的每个单字符图像进行识别。

第二方面，提供一种卡片信息识别装置，所述装置包括：

第一确定模块，用于从第一图像中确定指定区域，所述第一图像为对待识别的卡片进行拍摄得到，所述卡片为四边形卡片，且所述卡片中的卡片信息位于所述卡片中的指定位置；

第二确定模块，用于确定所述第一图像中包括的至少一个四边形轮廓；

校正模块，用于对于所述第二确定模块确定的所述至少一个四边形轮廓中的每个四边形轮廓，基于所述四边形轮廓和所述卡片的宽度和长度，对所述四边形轮廓在所述第一图像中所包围的四边形图像进行校正，且校正后的所述四边形图像的四条边分别与所述第一图像的对应方向上的边平行；

选择模块，用于基于所述指定区域，从所述校正模块校正后的至少一个四边形图像中选择目标图像；

识别模块，用于将所述选择模块选择的所述目标图像确定为卡片图像，并基于所述卡片图像和所述卡片信息在所述卡片中的指定位置，对所述卡片中的卡片信息进行识别。

可选地，所述第二确定模块用于：

确定所述第一图像中的所有直线段；

在所述所有直线段中，将方向相同且相邻两端点之间距离小于或等于预设距离的直线段进行连接，得到多条预处理直线段；

从所述多条预处理直线段中，按照预设规则，选择至少一组预处理直线段进行组合，得到所述至少一个四边形轮廓；

可选地，所述校正模块用于：

确定所述四边形轮廓的四个顶点在指定坐标系中的顶点坐标；

基于所述卡片的宽度和长度，确定四个目标顶点坐标；

基于所述四边形轮廓的四个顶点坐标和所述四个目标顶点坐标，确定所述四边形轮廓对应的单应性矩阵；

可选地，所述选择模块用于：

基于所述四边形轮廓对应的单应性矩阵，将所述指定区域中的指定点映射到校正后的所述四边形图像中；

可选地，所述选择模块用于：

将所述至少一个四边形图像中距离差最小的四边形图像确定为所述目标图像。

可选地，所述识别模块用于：

基于所述指定位置，从所述卡片图像中切割出所述卡片信息，得到初步切割图像；

对所述初步切割图像进行二值化处理，得到二值化处理图像；

对所述二值化处理图像进行去燥处理，得到去燥处理图像；

从所述去燥处理图像中切割出多个单字符图像，并通过光学字符识别OCR模块对所述多个单字符图像中的每个单字符图像进行识别。

第三方面，提供了一种卡片信息识别装置，所述装置包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为：

确定所述第一图像中包括的至少一个四边形轮廓；

基于所述指定区域，从校正后的至少一个四边形图像中选择目标图像；

将所述目标图像确定为卡片图像，并基于所述卡片图像和所述卡片信息在所述卡片中的指定位置，对所述卡片中的卡片信息进行识别。

本公开的实施例提供的技术方案可以包括以下有益效果：

在本公开实施例中，对于卡片信息位于卡片中指定位置的一类四边形卡片，在对该类卡片中的卡片信息进行识别的过程中，对该卡片进行拍摄，得到第一图像，终端从该第一图像中确定指定区域，之后，该终端确定该第一图像中包括的至少一个四边形轮廓，并对该至少一个四边形轮廓中的每个四边形轮廓在该第一图像中所包围的四边形图像进行校正，使得校正后的每个四边形图像的四条边与该第一图像的对应方向上的边平行，也即是，使得校正后的四边形图像为矩形图像，之后，该终端基于所确定的指定区域，从校正后的至少一个四边形图像中确定卡片图像，其中，由于校正后的四边形图像均为标准的矩形图像，因此，终端即可基于该卡片图像和卡片信息在该卡片中的指定位置，对该卡片信息进行识别，如此，即提高了识别的准确性。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。

图1是根据一示例性实施例示出的一种卡片信息识别方法的流程图。

图2A是根据另一示例性实施例示出的一种卡片信息识别方法的流程图。

图2B是图2A实施例所涉及的一种第一图像的示意图。

图2C是图2A实施例所涉及的一种卡片图像的示意图。

图2D是图2A实施例所涉及的一种初步切割图像的示意图。

图3是根据一示例性实施例示出的一种卡片信息识别装置的框图。

图4是根据一示例性实施例示出的一种卡片信息识别装置400的框图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

图1是根据一示例性实施例示出的一种卡片信息识别方法的流程图，如图1所示，该卡片信息识别方法应用于终端中，包括以下步骤。

在步骤101中，从第一图像中确定指定区域，该第一图像为对待识别的卡片进行拍摄得到，该卡片为四边形卡片，且该卡片中的卡片信息位于该卡片中的指定位置。

在步骤102中，确定该第一图像中包括的至少一个四边形轮廓。

在步骤103中，对于该至少一个四边形轮廓中的每个四边形轮廓，基于该四边形轮廓和该卡片的宽度和长度，对该四边形轮廓在该第一图像中所包围的四边形图像进行校正，且校正后的该四边形图像的四条边分别与该第一图像的对应方向上的边平行。

在步骤104中，基于该指定区域，从校正后的至少一个四边形图像中选择目标图像。

在步骤105中，将该目标图像确定为卡片图像，并基于该卡片图像和该卡片信息在该卡片中的指定位置，对该卡片中的卡片信息进行识别。

可选地，确定该第一图像中包括的至少一个四边形轮廓，包括：

确定该第一图像中的所有直线段；

在该所有直线段中，将方向相同且相邻两端点之间距离小于或等于预设距离的直线段进行连接，得到多条预处理直线段；

从该多条预处理直线段中，按照预设规则，选择至少一组预处理直线段进行组合，得到该至少一个四边形轮廓；

其中，对于该至少一个四边形轮廓中的每个四边形轮廓，该预设规则包括该四边形轮廓的四个内角与90度之间的差值均处于预设范围内，该四边形轮廓的四条边按照顺时针或逆时针方向依次连接，该四边形轮廓所围成的区域面积大于或等于预设面积，且组成该四边形轮廓的每条预处理直线段的长度与该预处理直线段在该四边形轮廓中所在边的长度之间的差值小于或等于预设长度。

在本公开实施例中，在确定该第一图像中包括的至少一个四边形轮廓的过程中，通过对该第一图像中的所有直线段进行检测，之后，按照一定的策略将检测出的直线段进行连接，并利用连接后所得到的预处理直线段，组成该至少一个四边形轮廓，如此，通过直线段检测方法确定该第一图像中包括的至少一个四边形轮廓，增加了实用性。

可选地，基于该四边形轮廓和该卡片的宽度和长度，对该四边形轮廓在该第一图像中所包围的四边形图像进行校正，包括：

确定该四边形轮廓的四个顶点在指定坐标系中的顶点坐标；

基于该卡片的宽度和长度，确定四个目标顶点坐标；

基于该四边形轮廓的四个顶点坐标和该四个目标顶点坐标，确定该四边形轮廓对应的单应性矩阵；

基于该四边形轮廓对应的单应性矩阵，将该四边形轮廓在该第一图像中所包围的四边形图像中的每个像素点进行映射变换，以实现对该四边形图像进行校正。

在本公开实施例中，基于上述确定的至少一个四边形轮廓，将该至少一个四边形轮廓中每个四边形轮廓所围成的区域进行校正，在校正过程中，通过确定每个四边形轮廓的四个顶点在指定坐标系中的顶点坐标，以及四个目标顶点坐标，确定每个四边形轮廓对应的单应性矩阵，以利用该单应性矩阵，将该四边形图像中的每个像素点进行映射变换，从而实现对每个四边形图像进行校正。

可选地，基于该指定区域，从校正后的至少一个四边形图像中选择目标图像，包括：

基于该四边形轮廓对应的单应性矩阵，将该指定区域中的指定点映射到校正后的该四边形图像中；

确定该四边形图像对应的第一距离和第二距离，该第一距离为该指定点与校正后的该四边形图像中第一边界之间的距离，该第二距离为该指定点与校正后的该四边形图像中第二边界之间的距离，该第一边界与该第二边界相交；

基于第一指定比例、第二指定比例、该至少一个四边形图像对应的第一距离和第二距离，从校正后的该至少一个四边形图像中选择目标图像，该第一指定比例为该指定点与该卡片的第一边界之间的距离在该卡片的第二边界中所占的比例，该第二指定比例为该指定点与该卡片的第二边界之间的距离在该卡片的第一边界中所占的比例。

在本公开实施例中，利用所确定的至少一个单应性矩阵，分别将指定区域中的指定点映射到该校正后的每个四边形图像中，并通过确定该指定点在每个四边形图像中的比例关系，从该至少一个四边形图像中选择出目标图像，也即是，通过确定该指定点在每个四边形图像中的位置比例关系，实现了从该至少一个四边形图像中确定该卡片图像的目的。

可选地，基于第一指定比例、第二指定比例、该至少一个四边形图像对应的第一距离和第二距离，从校正后的该至少一个四边形图像中选择目标图像，包括：

对于该至少一个四边形图像中的每个四边形图像，基于该第一指定比例、该第二指定比例、该四边形图像的第一距离和第二距离，通过距离差公式确定该四边形图像对应的距离差；

将该至少一个四边形图像中距离差最小的四边形图像确定为该目标图像。

在本公开实施例中，通过距离差公式，确定实际检测出来的比例与标准卡片中的比例之间的距离差，从而确定该至少一个四边形图像中哪个四边形图像为该卡片图像，提高了确定卡片图像的准确性。

可选地，基于该卡片图像和该卡片信息在该卡片中的指定位置，对该卡片中的卡片信息进行识别，包括：

基于该指定位置，从该卡片图像中切割出该卡片信息，得到初步切割图像；

对该初步切割图像进行二值化处理，得到二值化处理图像；

对该二值化处理图像进行去燥处理，得到去燥处理图像；

从该去燥处理图像中切割出多个单字符图像，并通过光学字符识别OCR模块对该多个单字符图像中的每个单字符图像进行识别。

在本公开实施例中，对该卡片校正后，根据卡片中的卡片信息在该卡片中的指定位置，将该卡片信息切割出来，并通过一系列处理，将该卡片信息切割成多个单个字符图像，通过OCR模块对该多个单字符图像中的每个单字符图像进行识别，从而实现对该卡片信息的识别。

上述所有可选技术方案，均可按照任意结合形成本公开的可选实施例，本公开实施例对此不再一一赘述。

图2A是根据一示例性实施例示出的一种卡片信息识别方法的流程图，如图2A所示，该卡片信息识别方法应用于终端中，该卡片信息识别方法包括以下步骤：

在步骤201中，从第一图像中确定指定区域，该第一图像为对待识别的卡片进行拍摄得到，该卡片为四边形卡片，且该卡片中的卡片信息位于该卡片中的指定位置。

目前，对于卡片信息位于该卡片的指定位置的一类四边形卡片，在对该类卡片中的卡片信息进行识别的过程中，可以通过拍摄的方式来进行识别，也即是，可以对该卡片进行拍摄，得到第一图像，如图2B中23所示，之后，由终端按照该卡片信息在该卡片中的指定位置，对该第一图像中的卡片进行识别。但是，由于在对该卡片进行拍摄时，可能不是在该卡片的正上方拍摄，在这种情况下，容易导致该卡片在该第一图像中不是正规的矩形图像，如图2B中的22所示，在该种情况下，若终端仍按照该指定位置对该卡片信息进行识别，容易导致识别出现误差，为此，本公开实施例提供了一种卡片信息识别方法。

其中，在本公开实施例中，可以通过该终端自身配置的摄像头对该卡片进行拍摄以得到该第一图像，也可以通过其它摄像设备对该卡片进行拍摄以得到该第一图像，本公开实施例对获取该第一图像的方式不做具体限定。

其中，该第一图像中的指定区域可以为该卡片中的图标、头像等区域，例如，在身份证的正面照中，该指定区域为该身份证中的头像区域，再如，在身份证的背面照中，该指定区域可以为该身份证中的国徽区域，等等。

其中，当该指定区域为该头像区域时，可以通过人脸检测方法来确定该身份证中的头像区域，具体可以通过相关技术中的Haar特征和Adaboost分类器来实现，另外，通过该Haar特征和Adaboost分类器，还可以确定该指定区域的任一点在该第一图像中的坐标，以及该指定区域的宽度和长度。其中，通过相关技术中的Haar特征和Adaboost分类器来确定头像区域的具体实现过程可以参见相关技术，这里不详细介绍。由于身份证上的人脸照片均是标准的正面照，因此，上述通过Haar特征和Adaboost分类器技术进行人脸检测，以确定该指定区域，可以提高检测率，并保证了检测速度。

当然，需要说明的是，上述仅是以该卡片为身份证为例进行说明，在另一实施例中，当该卡片为其它证件时，可以通过其它相关的技术来确定该指定区域，本公开实施例对此不做限定。

在步骤202中，确定该第一图像中包括的至少一个四边形轮廓。

也即是，为了能够准确地识别该卡片中的卡片信息，终端还需要确定该卡片在该第一图像中的位置，在这里，终端通过确定该第一图像中包括的四边形轮廓，来确定该卡片在该第一图像中的位置。

其中，在确定该第一图像包括的四边形轮廓过程中，由于卡片的边缘信息比较强，因此，在一种可能的实现方式中，终端可能只确定出一个四边形轮廓，在该种情况下，该四边形轮廓所包围的区域可能即为该卡片的区域，此时，在后续执行过程中，只需要对该四边形轮廓进行校正即可。而在另一种可能的实现方式中，终端也可能会确定出多个四边形轮廓，这里可以用来Rⁱ表示确定的第i个四边形轮廓，在该种情况下，每个四边形轮廓所包围的区域均可能为该卡片的区域，因此，这里需要分别确定该多个四边形轮廓中的每个四边形轮廓。

其中，确定该第一图像中包括的至少一个四边形轮廓的实现过程可以包括：确定该第一图像中的所有直线段，在该所有直线段中，将方向相同且相邻两端点之间距离小于或等于预设距离的直线段进行连接，得到多条预处理直线段，从该多条预处理直线段中，按照预设规则，选择至少一组预处理直线段进行组合，得到该至少一个四边形轮廓。

其中，该预设距离可以由用户根据实际需求自定义设置，也可以由该终端默认设置，本公开实施例对此不做限定。

也即是，在该第一图像中，终端检测出所有直线段后，将该所有直线段中距离较近，且方向相同的直线段连接起来，之后，利用连接所得到的预处理直线段进行组合，如此，即可组合成至少一个四边形轮廓。其中，由于组合所得到的四边形轮廓中可能有一些四边形轮廓不符合卡片区域对应的四边形轮廓要求，例如，一些四边形轮廓所围成的面积可能远远小于该卡片的实际面积，因此，为了减少后续的运算量，在组合该四边形轮廓时，需要按照预设规则进行组合。

其中，该预设范围可以由用户根据实际需求自定义设置，也可以由该终端默认设置，本公开实施例对不做限定。

其中，该预设面积可以由用户根据实际需求自定义设置，也可以由该终端默认设置，本公开实施例对此不做限定。

在一种可能的实现方式中，该预设面积可以与卡片的实际面积相同，或者，该预设面积与该卡片的实际面积之间的差值小于或等于预设阈值。其中，该预设阈值可以由用户根据实际需求自定义设置，也可以由该终端默认设置，本公开实施例对此不做限定。

其中，该预设长度可以由用户根据实际需求自定义设置，也可以由该终端默认设置，本公开实施例对此不做限定。

其中，这里可以通过LSD(Line Segment Detector，直线段检测器)确定该第一图像中的所有直线段，具体实现过程可以参见相关技术，本公开实施例对此不做详细介绍。

在步骤203中，对于该至少一个四边形轮廓中的每个四边形轮廓，基于该四边形轮廓和该卡片的宽度和长度，对该四边形轮廓在该第一图像中所包围的四边形图像进行校正，且校正后的该四边形图像的四条边分别与该第一图像的对应方向上的边平行。

如前文所述，该四边形轮廓在该第一图像中所包围的四边形图像有可能即为该卡片在该第一图像中所在的区域，因此，在本公开实施例中，确定该第一图像中包括的至少一个四边形轮廓之后，终端基于该至少一个四边形轮廓中的每个四边形轮廓和该卡片的宽度和长度，对至少一个四边形图像中的每个四边形图像进行校正。

其中，该卡片的宽度和长度可以由用户事先设置，也即是，由于在标准的卡片中，卡片的宽度和长度的比值是固定的，例如，对于身份证而言，身份证的宽度和长度的比值通常均为1.585，因此，用户可以根据该比值，对该身份证的宽度和长度进行事先设置，例如，可以将该身份证的宽度设置为800个像素所指示的宽度，该身份证的长度设置为505个像素所指示的长度。

当然，需要说明的是，这里仅是以将该身份证的宽度设置为800个像素所指示的宽度，该身份证的长度设置为505个像素所指示的长度为例进行说明，在另一实施例中，还可以将该身份证的宽度和长度设置为其它值，本公开实施例对此不做限定。

其中，基于该四边形轮廓和该卡片的宽度和长度，对该四边形轮廓在该第一图像中所包围的四边形图像进行校正的实现过程可以包括：确定该四边形轮廓的四个顶点在指定坐标系中的顶点坐标，基于该卡片的宽度和长度，确定四个目标顶点坐标，基于该四边形轮廓的四个顶点坐标和该四个目标顶点坐标，确定该四边形轮廓对应的单应性矩阵，基于该四边形轮廓对应的单应性矩阵，将该四边形轮廓在该第一图像中所包围的四边形图像中的每个像素点进行映射变换，以实现对该四边形图像进行校正。

也即是，针对该至少一个四边形轮廓中的每个四边形轮廓，终端确定该四边形轮廓的四个顶点在指定坐标系中的顶点坐标，其中，该指定坐标系可以由用户根据实际需求进行设置，例如，该指定坐标系可以为如图2B所示，在该平面中，水平向右方向为该指定坐标系的x轴正方向，垂直向下方向为该指定坐标系的y轴正方向。

其中，如上文所述，本公开实施例是通过LSD技术来确定该第一图像中的所有直线段，其中，由于该LSD技术可以确定该所有直线段中每条直线段的直线方程，因此，不难理解，利用组成该四边形轮廓的四条边的直线段对应的直线方程，可以确定该四边形轮廓的各条边对应的直线方程，之后，利用每相交的两条边所对应的两个直线方程，即可以确定该两条边的交点坐标，该交点坐标也即是该四边形轮廓的其中一个顶点的顶点坐标，按照同样的方法，终端可以确定该四边形轮廓的四个顶点的顶点坐标。

其中，该四个目标顶点坐标实际上是校正后的四边形图像的四个顶点的目标位置，也即是，在校正过程中，需要将该四边形图像的四个顶点对应映射到该四个位置上。该四个目标顶点坐标可以由用户根据该卡片的宽度和长度进行自定义设置，以上述举例为例，对于身份证来说，若用户将该身份证的宽度设置为800个像素所指示的宽度，该身份证的长度设置为505个像素所指示的长度，则该四个目标顶点坐标可以对应设置为P₁′(1，1)，P₂′(800，1)，P₃′(1，505)，P₄′(800，505)。

其中，基于该四边形轮廓的四个顶点坐标和该四个目标顶点坐标，确定该四边形轮廓对应的单应性矩阵的实现过程包括：基于该四边形轮廓的四个顶点坐标和该四个目标顶点坐标，通过单应性变化公式(1)，确定该四边形轮廓对应的单应性矩阵：

σ.p′＝H.p (1)

其中，σ为一未知量，P′代表该四个目标顶点坐标，P代表该四边形轮廓的四个顶点坐标，H为该单应性矩阵，该单应性矩阵为一个3*3的矩阵，由于该P′和P为已知量，因此，不难理解，通过解方程，可以确定该单应性矩阵H。

终端确定该单应性矩阵后，即可以利用该单应性矩阵，将该四边形轮廓在该第一图像中所包围的四边形图像中的每个像素点进行映射变换，如此，即可将该各个四边形图像进行校正。

这里需要说明的是，在校正过程中，实际上还包括将校正后的四边形图像从该第一图像中切割出来，也即是，在将四边形图像校正后，终端根据该校正后的四边形图像的四个顶点坐标，将该四边形图像切割出来，即校正后所得到的四边形图像实际上如图2C所示。

在步骤204中，基于该指定区域，从校正后的至少一个四边形图像中选择目标图像。

由于校正后的四边形图像可能包括一个四边形图像，也可能包括多个四边形图像，当校正后的四边形图像仅包括一个四边形图像时，终端直接将该四边形图像确定目标图像，若校正后的四边形图像中包括多个四边形图像，则该终端需要从该多个四边形图像中选择最能代表该卡片图像的四边形图像。

其中，基于该指定区域，从校正后的至少一个四边形图像中选择目标图像的实现过程可以包括：基于该四边形轮廓对应的单应性矩阵，将该指定区域中的指定点映射到校正后的该四边形图像中，确定该四边形图像对应的第一距离和第二距离，该第一距离为该指定点与校正后的该四边形图像中第一边界之间的距离，该第二距离为该指定点与校正后的该四边形图像中第二边界之间的距离，该第一边界与该第二边界相交，基于第一指定比例、第二指定比例、该至少一个四边形图像对应的第一距离和第二距离，从校正后的该至少一个四边形图像中选择目标图像，该第一指定比例为该指定点与该卡片的第一边界之间的距离在该卡片的第二边界中所占的比例，该第二指定比例为该指定点与该卡片的第二边界之间的距离在该卡片的第一边界中所占的比例。

也即是，在本公开实施例中，终端基于该指定区域中的指定点，从校正后的至少一个四边形图像中确定目标图像。其中，该指定点可以为该指定区域的中心点，或者，该指定点也可以为该指定区域所在的四边形轮廓的任一个顶点，本公开实施例对此不做限定。

其中，以该卡片为身份证为例，如前文所述，通过人脸检测技术，可以确定该指定区域，同时可以确定该指定区域的任一顶点的坐标以及该指定区域在该第一图像中的宽度和长度，例如，这里以该指定点为该指定区域的中心点为例，当终端确定该指定区域的左上顶点时，将该左上顶点的横坐标加上宽度的一半，则得到该中心点的横坐标x，同理，将该左上顶点的纵坐标加上该长度的一半，可以得到该中心点的纵坐标y。

终端确定该中心点的坐标之后，利用上述单应变换公式(1)，基于上述所确定的各个单应变换矩阵，将该中心点映射到校正后的每个四边形图像中，并确定该中心点在该四边形图像中的位置，也即是，确定该四边形图像对应的第一距离和第二距离。

请继续参见图2B，若该卡片为身份证，以该第一边界为该四边形图像的左边界，第二边界为该四边形图像的上边界为例，则在标准的身份证中，上述第一指定比例是指在标准的身份证图像中，该头像区域的中心点21到该左边界的距离与该身份证的宽度的比值，该第二指定比例是指在标准的身份证图像中，该头像区域的中心点21到该上边界的距离与该身份证的长度的比值，其中，该第一指定比例和该第二指定比例通常是固定的。

其中，基于第一指定比例、第二指定比例、该至少一个四边形图像对应的第一距离和第二距离，从校正后的该至少一个四边形图像中选择目标图像的实现过程包括：对于该至少一个四边形图像中的每个四边形图像，基于该第一指定比例、该第二指定比例、该四边形图像的第一距离和第二距离，通过距离差公式确定该四边形图像对应的距离差，将该至少一个四边形图像中距离差最小的四边形图像确定为该目标图像。

例如，若在某个四边形图像中，该第一距离为指定点到该四边形图像左边界的距离，该第二距离为该指定点到该四边形图像右边界的距离，则可以进一步确定在该四边形图像中，该指定点到该四边形图像左边界的距离占该四边形图像的宽度的第一比例，以及该指定点到该指定该四边形图像上边界的距离占该四边形图像的长度的第二比例。

例如，若该第一指定比例和该第二指定比例分别为(a，b)，该第一比例和该第二比例分别为(m，n)，则通过距离差公式(2)，可以确定该四边形图像对应的距离差为：

其中，为该四边形图像对应的距离差。

按照同样的方式，可以确定校正后的每个四边形图像对应的距离差，根据上述公式可知，该距离差越小，说明校正后的四边形图像越近似于该卡片图像，因此，在本公开实施例中，将该至少一个四边形图像对应的距离差最小的四边形图像确定为该目标图像。

在步骤205中，将该目标图像确定为卡片图像，并基于该卡片图像和该卡片信息在该卡片中的指定位置，对该卡片中的卡片信息进行识别。

如上文所述，由于该卡片中的卡片信息位于该卡片中的指定位置，也即是，该卡片信息在该类卡片中的位置是固定的，因此，该终端从校正后的四边形图像中确定该卡片图像后，即可基于该卡片图像和该指定位置，对该卡片信息进行识别。

其中，基于该卡片图像和该卡片信息在该卡片中的指定位置，对该卡片中的卡片信息进行识别的实现过程可以包括：基于该指定位置，从该卡片图像中切割出该卡片信息，得到初步切割图像，对该初步切割图像进行二值化处理，得到二值化处理图像，对该二值化处理图像进行去燥处理，得到去燥处理图像，从该去燥处理图像中切割出多个单字符图像，并通过光学字符识别OCR模块对该多个单字符图像中的每个单字符图像进行识别。

也即是，该终端可以根据该卡片信息的指定位置，对该卡片图像中的卡片信息进行初步切割，以该卡片为身份证为例，初步切割后的图像如图2D所示，需要说明的是，这里仅是示例性的示出了部分身份信息，并未将该身份证中的所有身份信息均示出。之后，该终端对初步切割得到的初步切割图像进行精确的单字符切割，也即是，该终端对切割得到的该初步切割图像进行二值化处理，其中，这里可以对该初步切割图像进行自适应二值化处理，具体实现过程可以参见相关技术，这里不做详细描述。

该终端对该初步切割图像进行二值化处理后，得到二值化处理图像，然后该终端运用形态学开运算滤除该二值化处理图像中的噪声，其目的是去除该二值化处理图像中除卡片信息之外的其它噪点，也即是，该终端对该二值化处理图像进行去燥处理，得到去燥处理图像。其中，上述运用形态学开运算滤除该二值化处理图像中的噪声的实现过程可以参见相关技术，本公开实施例对此不做限定。

之后，针对所得到的每个去燥处理图像，该终端将该去燥处理图像中的每一行像素点的像素值进行水平投影，以及将每一列像素点的像素值进行垂直投影，以水平投影为例，在该水平方向，由于该去燥处理图像是二值化处理后的图像，因此，若某一行有文字，则将该行像素值相加后，即可得到该行对应的总像素值，相反，若某一行没有文字，则该行对应的总像素值可能为零。如此，终端对该去燥处理图像进行投影后，根据每一行以及每一列的总像素值的大小，可以确定该去燥处理图像中的空白位置和文字所在位置，终端在该空白位置处进行切割，即可得到多个单字符图像。

需要说明的是，上述从该去燥处理图像中切割出多个单字符图像的实现方式仅是示例性，在另一实施例中，还可能通过其它方式从该去燥处理图像中切割出多个单字符图像，本公开实施例对此不做限定。

从该去燥处理图像中切割出多个单字符图像后，该终端即可通过OCR(Optical Character Recognition，光学字符识别)模块对该多个单字符图像中的每个单字符图像进行识别，其中，在该OCR模块中，本公开实施例可以通过CNN(Convolutional Neural Networks，卷积神经网络)技术对该单字符图像进行分类识别。如此，即实现了对该卡片中的卡片信息进行识别。

当然，需要说明的是，在本公开实施例中，仅是以在OCR模块中，通过CNN技术对该单字符图像进行分类识别为例进行说明，在另一实施例中，还可以通过其它技术对该单字符图像进行识别，本公开实施例对此不做限定。

图3是根据一示例性实施例示出的一种卡片信息识别装置框图。参照图3，该卡片信息识别装置可以由软件、硬件或者两者的结合实现，该装置包括：

第一确定模块310，用于从第一图像中确定指定区域，该第一图像为对待识别的卡片进行拍摄得到，该卡片为四边形卡片，且该卡片中的卡片信息位于该卡片中的指定位置；

第二确定模块320，用于确定该第一图像中包括的至少一个四边形轮廓；

校正模块330，用于对于该第二确定模块320确定的该至少一个四边形轮廓中的每个四边形轮廓，基于该四边形轮廓和该卡片的宽度和长度，对该四边形轮廓在该第一图像中所包围的四边形图像进行校正，且校正后的该四边形图像的四条边分别与该第一图像的对应方向上的边平行；

选择模块340，用于基于该指定区域，从该校正模块330校正后的至少一个四边形图像中选择目标图像；

识别模块350，用于将该选择模块340选择的该目标图像确定为卡片图像，并基于该卡片图像和该卡片信息在该卡片中的指定位置，对该卡片中的卡片信息进行识别。

可选地，该第二确定模块320用于：

确定该第一图像中的所有直线段；

在该所有直线段中，将方向相同且相邻两端点之间距离小于或等于预设距离的直线段进行连接，得到多条预处理直线段；

从该多条预处理直线段中，按照预设规则，选择至少一组预处理直线段进行组合，得到该至少一个四边形轮廓；

可选地，该校正模块330用于：

确定该四边形轮廓的四个顶点在指定坐标系中的顶点坐标；

基于该卡片的宽度和长度，确定四个目标顶点坐标；

基于该四边形轮廓的四个顶点坐标和该四个目标顶点坐标，确定该四边形轮廓对应的单应性矩阵；

可选地，该选择模块340用于：

基于该四边形轮廓对应的单应性矩阵，将该指定区域中的指定点映射到校正后的该四边形图像中；

可选地，该选择模块340用于：

将该至少一个四边形图像中距离差最小的四边形图像确定为该目标图像。

可选地，该识别模块350用于：

基于该指定位置，从该卡片图像中切割出该卡片信息，得到初步切割图像；

对该初步切割图像进行二值化处理，得到二值化处理图像；

对该二值化处理图像进行去燥处理，得到去燥处理图像；

从该去燥处理图像中切割出多个单字符图像，并通过光学字符识别OCR模块对该多个单字符图像中的每个单字符图像进行识别。

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

图4是根据一示例性实施例示出的一种卡片信息识别装置400的框图。例如，装置400可以是智能手机，计算机，数字广播终端，游戏控制台，平板设备，医疗设备，健身设备，个人数字助理等。

参照图4，装置400可以包括以下一个或多个组件：处理组件402，存储器404，电源组件406，多媒体组件408，音频组件410，输入/输出(I/O)的接口412，传感器组件414，以及通信组件416。

处理组件402通常控制装置400的整体操作，诸如与显示，电话呼叫，数据通信，相机操作和记录操作相关联的操作。处理组件402可以包括一个或多个处理器420来执行指令，以完成上述的方法的全部或部分步骤。此外，处理组件402可以包括一个或多个模块，便于处理组件402和其他组件之间的交互。例如，处理组件402可以包括多媒体模块，以方便多媒体组件408和处理组件402之间的交互。

存储器404被配置为存储各种类型的数据以支持在装置400的操作。这些数据的示例包括用于在装置400上操作的任何应用程序或方法的指令，联系人数据，电话簿数据，消息，图片，视频等。存储器404可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。

电源组件406为装置400的各种组件提供电源。电源组件406可以包括电源管理系统，一个或多个电源，及其他与为装置400生成、管理和分配电源相关联的组件。

多媒体组件408包括在所述装置400和用户之间的提供一个输出接口的屏幕。在一些实施例中，屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板，屏幕可以被实现为触摸屏，以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界，而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中，多媒体组件408包括一个前置摄像头和/或后置摄像头。当装置400处于操作模式，如拍摄模式或视频模式时，前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件410被配置为输出和/或输入音频信号。例如，音频组件410包括一个麦克风(MIC)，当装置400处于操作模式，如呼叫模式、记录模式和语音识别模式时，麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器404或经由通信组件416发送。在一些实施例中，音频组件410还包括一个扬声器，用于输出音频信号。

I/O接口412为处理组件402和外围接口模块之间提供接口，上述外围接口模块可以是键盘，点击轮，按钮等。这些按钮可包括但不限于：主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件414包括一个或多个传感器，用于为装置400提供各个方面的状态评估。例如，传感器组件414可以检测到装置400的打开/关闭状态，组件的相对定位，例如所述组件为装置400的显示器和小键盘，传感器组件414还可以检测装置400或装置400一个组件的位置改变，用户与装置400接触的存在或不存在，装置400方位或加速/减速和装置400的温度变化。传感器组件414可以包括接近传感器，被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件414还可以包括光传感器，如CMOS或CCD图像传感器，用于在成像应用中使用。在一些实施例中，该传感器组件414还可以包括加速度传感器，陀螺仪传感器，磁传感器，压力传感器或温度传感器。

通信组件416被配置为便于装置400和其他设备之间有线或无线方式的通信。装置400可以接入基于通信标准的无线网络，如WiFi，2G或3G，或它们的组合。在一个示例性实施例中，通信组件416经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中，所述通信组件416还包括近场通信(NFC)模块，以促进短程通信。例如，在NFC模块可基于射频识别(RFID)技术，红外数据协会(IrDA)技术，超宽带(UWB)技术，蓝牙(BT)技术和其他技术来实现。

在示例性实施例中，装置400可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述方法。

在示例性实施例中，还提供了一种包括指令的非临时性计算机可读存储介质，例如包括指令的存储器404，上述指令可由装置400的处理器420执行以完成上述方法。例如，所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

一种非临时性计算机可读存储介质，当所述存储介质中的指令由移动终端的处理器执行时，使得移动终端能够执行一种卡片信息识别方法，该方法包括：

从第一图像中确定指定区域，该第一图像为对待识别的卡片进行拍摄得到，该卡片为四边形卡片，且该卡片中的卡片信息位于该卡片中的指定位置；

确定该第一图像中包括的至少一个四边形轮廓；

对于该至少一个四边形轮廓中的每个四边形轮廓，基于该四边形轮廓和该卡片的宽度和长度，对该四边形轮廓在该第一图像中所包围的四边形图像进行校正，且校正后的该四边形图像的四条边分别与该第一图像的对应方向上的边平行；

基于该指定区域，从校正后的至少一个四边形图像中选择目标图像；

将该目标图像确定为卡片图像，并基于该卡片图像和该卡片信息在该卡片中的指定位置，对该卡片中的卡片信息进行识别。

可选地，确定该第一图像中包括的至少一个四边形轮廓，包括：

确定该第一图像中的所有直线段；

在该所有直线段中，将方向相同且相邻两端点之间距离小于或等于预设距离的直线段进行连接，得到多条预处理直线段；

从该多条预处理直线段中，按照预设规则，选择至少一组预处理直线段进行组合，得到该至少一个四边形轮廓；

可选地，基于该四边形轮廓和该卡片的宽度和长度，对该四边形轮廓在该第一图像中所包围的四边形图像进行校正，包括：

确定该四边形轮廓的四个顶点在指定坐标系中的顶点坐标；

基于该卡片的宽度和长度，确定四个目标顶点坐标；

基于该四边形轮廓的四个顶点坐标和该四个目标顶点坐标，确定该四边形轮廓对应的单应性矩阵；

可选地，基于该指定区域，从校正后的至少一个四边形图像中选择目标图像，包括：

基于该四边形轮廓对应的单应性矩阵，将该指定区域中的指定点映射到校正后的该四边形图像中；

将该至少一个四边形图像中距离差最小的四边形图像确定为该目标图像。

可选地，基于该卡片图像和该卡片信息在该卡片中的指定位置，对该卡片中的卡片信息进行识别，包括：

基于该指定位置，从该卡片图像中切割出该卡片信息，得到初步切割图像；

对该初步切割图像进行二值化处理，得到二值化处理图像；

对该二值化处理图像进行去燥处理，得到去燥处理图像；

从该去燥处理图像中切割出多个单字符图像，并通过光学字符识别OCR模块对该多个单字符图像中的每个单字符图像进行识别。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：杨松;陈志军;王百超;
技术所有人：北京小米移动软件有限公司;
我是此专利的发明人

上一篇：一种知识产权评估系统的制作方法与工艺
上一篇：一种基于后视单目相机的多列车铰接角测量方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。