信息识别方法及装置与流程

文档序号：11251411阅读：1150来源：国知局

本公开涉及图像处理技术领域，尤其涉及一种信息识别方法及装置。

背景技术：

随着互联网金融的发展，为了确保用户的资金安全，各大银行的网上银行或者金融自助服务系统均需要用户上传身份证图像进行用户身份的验证。例如，用户可以通过终端自行拍摄身份证图像，然后将身份证图像上传至服务器，服务器可以识别身份证图像上的用户身份信息，若该用户身份信息与预存的身份信息匹配，则用户身份验证通过；若该用户身份信息与预存的身份信息不匹配，则用户身份验证失败。

技术实现要素：

为克服相关技术中存在的问题，本公开实施例提供一种信息识别方法及装置。所述技术方案如下：

根据本公开实施例的第一方面，提供一种信息识别方法，包括：

获取待识别图片中身份证图像上多个定位点的位置；

根据所述多个定位点的位置和预设比例，校正所述待识别图片，获取校正图片，所述校正图片中身份证图像的长和宽满足所述预设比例；

识别所述校正图片中的用户身份信息。

本公开的实施例提供的技术方案可以包括以下有益效果：在识别身份证上的用户信息时，可以首先校正待识别图片上的身份证图像，克服由于拍照角度导致的身份证图像的透视变换现象，进而避免了由于透视变换导致的信息识别不准确的情况，提高了身份证信息识别的精确度，进而提高了用户体验。

在一个实施例中，所述获取待识别图片中身份证图像上多个定位点的位置包括：

在所述待识别图片上建立坐标系；

获取所述待识别图片中身份证图像的四个顶点的坐标；

所述根据所述多个定位点的位置和预设比例，校正所述待识别图片，获取校正图片包括：

根据所述四个顶点的坐标和所述预设比例，校正所述待识别图片，获取校正图片。

本公开的实施例提供的技术方案可以包括以下有益效果：在识别身份证上的用户信息时，可以首先通过身份证图像的四个顶点校正待识别图片中的身份证图像，提高了身份证校正的效率和准确性，进而提高了识别身份证包括的用户身份信息的准确性。

在一个实施例中，所述获取所述待识别图片中身份证图像的四个顶点的坐标包括：

将所述待识别图片的灰度图输入第一卷积神经网络cnn网络，通过所述第一cnn网络获取所述身份证图像的四个顶点的坐标。

本公开的实施例提供的技术方案可以包括以下有益效果：通过第一cnn网络获取身份证图像的四个顶点，进而获取该四个顶点的坐标，提高了获取身份证图像顶点坐标的效率和准确率。

在一个实施例中，所述获取所述待识别图片中身份证图像的四个顶点的坐标包括：

将所述待识别图片的灰度图输入第二cnn网络，通过所述第二cnn网络获取所述身份证图像的四个顶点的待定坐标；

根据所述四个顶点的待定坐标和第三cnn网络，获取所述待定坐标的更新量；

根据所述待定坐标和所述待定坐标的更新量，获取所述四个顶点的更新坐标；

将所述四个顶点的更新坐标设置为所述四个顶点的待定坐标；

重复执行“根据所述四个顶点的待定坐标和第三cnn网络，获取所述待定坐标的更新量”至“将所述四个顶点的更新坐标设置为所述四个顶点的坐标”的步骤n次，所述n为大于或者等于1的整数；

将第n次获取的四个顶点的待定坐标确认为所述四个顶点的坐标。

本公开的实施例提供的技术方案可以包括以下有益效果：通过第二cnn网络以及第三cnn网络获取身份证图像的四个顶点，进而获取该四个顶点的坐标，提高了获取身份证图像顶点坐标的效率和准确率。

在一个实施例中，所述根据所述四个顶点的待定坐标和第三cnn网络，获取所述待定坐标的更新量包括：

以所述四个顶点中每个顶点的待定坐标为中心从所述待识别图片的灰度图中截取预设大小的图像块；

将截取到的四个图像块按照预设通道串联后输入所述第三cnn网络，通过所述第三cnn网络获取所述待定坐标的更新量。

本公开的实施例提供的技术方案可以包括以下有益效果：通过每个顶点对应的图像块在第三cnn网络之间的多次迭代过程，获取身份证图像的四个顶点，进而获取该四个顶点的坐标，提高了获取身份证图像顶点坐标的效率和准确率。

在一个实施例中，所述方法还包括：

获取目标图片的灰度图；

按照预设标准缩放所述灰度图，获取标准灰度图；

对所述标准灰度图进行归一化，获取所述待识别图片。

本公开的实施例提供的技术方案可以包括以下有益效果：在获取到用于识别的目标图片之后，可以首先对该目标图片进行预处理，获取预处理后的图片作为待识别图片，提高了身份证信息识别的精确度，进而提高了用户体验。

在一个实施例中，所述根据所述多个定位点的位置和预设比例，校正所述待识别图片，获取校正图片包括：

根据所述多个定位点的位置和预设比例，获取多个目标定位点的位置；

按照所述多个目标定位点的位置，校正所述待识别图片，获取校正图片，所述校正图片中身份证图像上多个定位点的位置与所述多个目标定位点的位置重合。

本公开的实施例提供的技术方案可以包括以下有益效果：在校正待识别图片时，首先确定目标定位点，然后采用映射的方法校正待识别图片，使得待识别图片的多个定位点的位置与多个目标定位点的位置重合，简化了校正待识别图片的过程，提高了校正待识别图片的效率。

根据本公开实施例的第二方面，提供一种信息识别装置，包括：

第一获取模块，用于获取待识别图片中身份证图像上多个定位点的位置；

校正模块，用于根据所述多个定位点的位置和预设比例，校正所述待识别图片，获取校正图片，所述校正图片中身份证图像的长和宽满足所述预设比例；

识别模块，用于识别所述校正图片中的用户身份信息。

在一个实施例中，所述第一获取模块包括：

建立子模块，用于在所述待识别图片上建立坐标系；

第一获取子模块，用于获取所述待识别图片中身份证图像的四个顶点的坐标；

所述校正模块用于根据所述四个顶点的坐标和所述预设比例，校正所述待识别图片，获取校正图片。

在一个实施例中，所述第一获取子模块包括：

第一获取单元，用于将所述待识别图片的灰度图输入第一卷积神经网络cnn网络，通过所述第一cnn网络获取所述身份证图像的四个顶点的坐标。

在一个实施例中，所述第一获取子模块包括：

第二获取单元，用于将所述待识别图片的灰度图输入第二cnn网络，通过所述第二cnn网络获取所述身份证图像的四个顶点的待定坐标；

第三获取单元，用于根据所述四个顶点的待定坐标和第三cnn网络，获取所述待定坐标的更新量；

第四获取单元，用于根据所述待定坐标和所述待定坐标的更新量，获取所述四个顶点的更新坐标；

第一设置单元，用于将所述四个顶点的更新坐标设置为所述四个顶点的待定坐标；

重复单元，用于控制所述第三获取单元，所述第四获取单元和所述第一设置单元重复执行对应步骤n次，所述n为大于或者等于1的整数；

第二设置单元，用于将第n次获取的四个顶点的待定坐标确认为所述四个顶点的坐标。

在一个实施例中，所述第三获取单元用于以所述四个顶点中每个顶点的待定坐标为中心从所述待识别图片的灰度图中截取预设大小的图像块；将截取到的四个图像块按照预设通道串联后输入所述第三cnn网络，通过所述第三cnn网络获取所述待定坐标的更新量。

在一个实施例中，所述装置还包括：

第二获取模块，用于获取目标图片的灰度图；

第三获取模块，用于按照预设标准缩放所述灰度图，获取标准灰度图；

第四获取模块，用于对所述标准灰度图进行归一化，获取所述待识别图片。

在一个实施例中，所述校正模块包括：

第二获取子模块，用于根据所述多个定位点的位置和预设比例，获取多个目标定位点的位置；

校正子模块，用于按照所述多个目标定位点的位置，校正所述待识别图片，获取校正图片，所述校正图片中身份证图像上多个定位点的位置与所述多个目标定位点的位置重合。

根据本公开实施例的第三方面，提供一种信息识别装置，包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为：

获取待识别图片中身份证图像上多个定位点的位置；

根据所述多个定位点的位置和预设比例，校正所述待识别图片，获取校正图片，所述校正图片中身份证图像的长和宽满足所述预设比例；

识别所述校正图片中的用户身份信息。

根据本公开实施例的第四方面，提供一种计算机可读存储介质，其上存储有计算机指令，该指令被处理器执行时实现第一方面任一实施例所述的方法的步骤。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。

图1a是根据一示例性实施例示出的信息识别方法的流程图。

图1b是根据一示例性实施例示出的信息识别方法的流程图。

图1c是根据一示例性实施例示出的待识别图片的示意图。

图1d是根据一示例性实施例示出的信息识别方法的流程图。

图1e是根据一示例性实施例示出的信息识别方法的流程图。

图1f是根据一示例性实施例示出的信息识别方法的流程图。

图1g是根据一示例性实施例示出的校正图片的示意图。

图2是根据一示例性实施例示出的信息识别方法的流程图。

图3是根据一示例性实施例示出的信息识别方法的流程图。

图4a是根据一示例性实施例示出的信息识别装置的结构示意图。

图4b是根据一示例性实施例示出的信息识别装置的结构示意图。

图4c是根据一示例性实施例示出的信息识别装置的结构示意图。

图4d是根据一示例性实施例示出的信息识别装置的结构示意图。

图4e是根据一示例性实施例示出的信息识别装置的结构示意图。

图4f是根据一示例性实施例示出的信息识别装置的结构示意图。

图5是根据一示例性实施例示出的信息识别装置的结构框图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

本公开实施例提供的技术方案涉及终端，该终端可以为手机、平板电脑以及其他能够进行身份证验证的设备，本公开实施例对此不作限定。相关技术中，用户在拍摄身份证照片时，很难采用正对角度进行拍摄，如果用户拍摄身份证时的角度有偏差，则拍摄到的身份证图像会产生透视变换现象，容易对身份证的识别造成影响，导致用户身份信息获取有误，用户体验不佳。本公开的实施例提供的技术方案中，在识别身份证上的用户信息时，可以首先校正待识别图片上的身份证图像，克服由于拍照角度导致的身份证图像的透视变换现象，进而避免了由于透视变换导致的信息识别不准确的情况，提高了身份证信息识别的精确度，进而提高了用户体验。

图1a是根据一示例性实施例示出的一种信息识别方法的流程图，该方法应用于终端中，该终端可以为手机、平板电脑以及其他能够进行身份证验证的设备。如图1a所示，该信息识别方法包括以下步骤101至步骤103：

在步骤101中，获取待识别图片中身份证图像上多个定位点的位置。

示例的，初始化时，可以预设该多个定位点的确定准则，例如，将身份证上第一个字的中心以及最后一个字的中心分别确定为定位点；或者，以身份证的中心为基准，确定与该中心的距离为预设距离的多个点为定位点；或者沿身份证中心分别做两条垂直的线，确定该两条线与四条边的交点为定位点；或者将身份证的四个顶点分别确定为定位点。实际应用中，可以根据具体情况设置定位点的确定准则，本公开实施例对此不作限定。

终端在获取到待识别图片之后，可以首先按照预设的定位点的确定准则，获取包括在该待识别图片中的身份证图像上多个定位点的位置。以四个顶点为定位点为例，终端在获取到待识别图片之后，可以通过图像识别技术，首先确定待识别图片中身份证图像上的四个顶点，然后记录显示该四个顶点的像素的位置，该像素的位置即为四个顶点的位置。

在步骤102中，根据多个定位点的位置和预设比例，校正待识别图片，获取校正图片，该校正图片中身份证图像的长和宽满足预设比例。

示例的，身份证的尺寸均为固定尺寸，初始化时可以按照身份证的固定尺寸设置预设比例。例如，可以将身份证的长宽比例确定为预设比例。以身份证上第一个字的中心以及最后一个字的中心为定位点为例，由于身份证为制式证件，因此其第一个字和最后一个字的位置也是固定的，终端在获取到待识别图片中身份证图像的两个定位点的位置之后，可以按照该两个定位点的位置确定两个定位点之间的距离，然后按照两个定位点之间的距离确定待识别图片中身份证图像的长和宽，并按照预设比例校正待识别图片中身份证图像的长和宽，使得校正后的校正图片的长和宽满足预设比例。

或者，以身份证的四个顶点为定位点为例。由于身份证为制式证件，因此四个顶点的之间的距离也是固定的。终端在获取到待识别图片中身份证图像的四个顶点的位置之后，可以按照该四个顶点的位置确定待识别图片中身份证图像的长和宽，并按照预设比例校正待识别图片中身份证图像的长和宽，使得校正后的校正图片的长和宽满足预设比例。

在步骤103中，识别校正图片中的用户身份信息。

示例的，当终端获取到校正图片之后，由于校正图片克服了透视变换的情况，因此校正图片中的身份证图像中的各项信息的位置均与制式身份证的各项信息的位置匹配，因此终端可以按照预设的识别制式身份证信息的方法识别校正图片中身份证图像包括的用户身份信息。

本公开的实施例提供的技术方案中，在识别身份证上的用户信息时，可以首先校正待识别图片上的身份证图像，克服由于拍照角度导致的身份证图像的透视变换现象，进而避免了由于透视变换导致的信息识别不准确的情况，提高了身份证信息识别的精确度，进而提高了用户体验。

在一个实施例中，如图1b所示，在步骤101中，获取待识别图片中身份证图像上多个定位点的位置，可以通过步骤1011和步骤1012实现：

在步骤1011中，在待识别图片上建立坐标系。

在步骤1012中，获取待识别图片中身份证图像的四个顶点的坐标。

在步骤102中，根据多个定位点的位置和预设比例，校正待识别图片，获取校正图片，可以通过步骤1021实现：

在步骤1021中，根据四个顶点的坐标和预设比例，校正待识别图片，获取校正图片。

示例的，可以按照待识别图片的像素建立坐标系。假设待识别图片的长边包括679个像素，宽边包括357个像素，根据该像素数量建立坐标系，该坐标系的x轴包括679个刻度，y轴包括357个刻度，根据该坐标系即可确定待识别图片中身份证图像的每个定位点的位置。

以四个顶点为定位点为例，终端在获取待识别图片之后，根据图像识别技术分别确定显示有四个顶点的多个像素，然后确定每个像素在该坐标系中的位置。如图1c所示，图1c中y轴代表第几行像素，x轴代表第几个像素。假设待识别图片10中显示有第一顶点a的像素为第60行第100个像素，则第一顶点a的坐标为(100,60)；显示有第二顶点b的像素为第300行第100个像素，则第二顶点b的坐标为(100,300)；显示有第三顶点c的像素为第320行第528个像素，则第三顶点c的坐标为(528,320)；显示有第四顶点d的像素为第50行第528个像素，则第四顶点d的坐标为(528,50)。

假设预设比例为856:540，终端在获取到四个顶点的坐标之后，即可确定待识别图片中身份证图像的长占用428个像素，宽占用240个像素。按照预设比例可以计算出，当身份证的长如图1c所示占用428个像素时，其宽应该占用270个像素，因此终端可以按照预设比例将身份证图像的宽边校正至270个像素，使得获取到的校正图片的身份证图像的长和宽满足预设比例。

本公开的实施例提供的技术方案中，在识别身份证上的用户信息时，可以首先通过身份证图像的四个顶点校正待识别图片中的身份证图像，提高了身份证校正的效率和准确性，进而提高了识别身份证包括的用户身份信息的准确性。

在一个实施例中，如图1d所示，在步骤1012中，获取待识别图片中身份证图像的四个顶点的坐标，可以通过步骤1012a实现：

在步骤1012a中，将待识别图片的灰度图输入第一cnn(convolutionalneuralnetwork，卷积神经网络)网络，通过第一cnn网络获取身份证图像的四个顶点的坐标。

示例的，初始化时，可以搭建第一cnn网络，然后向该第一cnn网络输入多个顶点坐标已知的包括身份证图像的图片的灰度图，然后不断调整第一cnn网络的参数，使得第一cnn网络识别出的身份证的顶点坐标与已知的身份证的顶点坐标匹配，当第一cnn网络识别的正确率大于或等于预设阈值时，确定第一cnn网络建立完成。

终端在获取到待识别图片之后，可以获取待识别图片的灰度图，然后将该灰度图输入第一cnn网络，该第一cnn网络即可识别出该灰度图中身份证图像四个顶点的坐标。具体的，第一cnn网络可以输出长度为8的向量，假设该向量为p＝(x1，y1，x2，y2，x3，y3，x4，y4)，则第一顶点的坐标即为(x1，y1)，第二顶点的坐标即为(x2，y2)，第三顶点的坐标即为(x3，y3)，第四顶点的坐标即为(x4，y4)。

本公开的实施例提供的技术方案中，通过第一cnn网络获取身份证图像的四个顶点，进而获取该四个顶点的坐标，提高了获取身份证图像顶点坐标的效率和准确率。

或者，示例的，在获取待识别图片中身份证图像的四个顶点的坐标时，还可以首先将待识别图片的灰度图输入第二cnn网络，通过第二cnn网络获取身份证图像的四个顶点的待定坐标，根据四个顶点的待定坐标和第三cnn网络，获取待定坐标的更新量，并根据待定坐标和待定坐标的更新量，获取四个顶点的更新坐标，接着将四个顶点的更新坐标设置为四个顶点的待定坐标。然后重复执行“根据四个顶点的待定坐标和第三cnn网络，获取待定坐标的更新量”至“将四个顶点的更新坐标设置为四个顶点的坐标”的步骤n次，n为大于或者等于1的整数，将第n次获取的四个顶点的待定坐标确认为四个顶点的坐标。

示例的，建立第二cnn网络和第三cnn网络的过程与建立第一cnn网络的过程类似，本公开实施例在此不做赘述。

为了保证获取到的身份证图像的四个顶点的坐标的精确性，终端可以首先将待识别图片的灰度图输入第二cnn网络，通过第二cnn网络获取身份证图像的四个顶点的待定坐标，然后根据该待定坐标和第三cnn网络，获取四个顶点的待定坐标的更新量，并根据该更新量，获取四个顶点的更新坐标，重复上述过程，直到最终获取的四个顶点的坐标收敛。具体的，终端可以首先以四个顶点中每个顶点的待定坐标为中心从待识别图片的灰度图中截取预设大小的图像块，然后将截取到的四个图像块按照预设通道串联后输入第三cnn网络，通过第三cnn网络获取待定坐标的更新量。

例如，假设终端将待识别图片的灰度图输入第二cnn网络之后，第二cnn网络输出长度为8的向量p，该p＝(100,60，100,300，528,320，528,50)，由此可知通过第二cnn网络获取到的四个顶点的待定坐标分别为第一顶点a的坐标(100,60)，第二顶点b的坐标(100,300)，第三顶点c的坐标(528,320)，第四顶点d的坐标(528,50)。以每个顶点的待定坐标为中心在待识别图片的灰度图中截取15*15的图像块，即截取长15个像素，宽15个像素的图像块，然后将截取的四个图像块按照每个顶点对应的通道输入第三cnn网络，通过该第三cnn网络即可获取四个顶点待定坐标的更新量q，该q同样为长度为8的向量，q＝(2,3,4,-2,4,3,-1,4)，根据p＝(100,60，100,300，528,320,528,50)和q＝(2,3,4,-2,4,3,-1,4)的和即可获取每个顶点的更新坐标o，经过计算可知，该o＝(102,63,104,298,532,323,527,54)，然后将该向量o的值赋予向量p，重复执行上述步骤n次，第n次获取到的o即为最终确定的四个顶点的坐标。实际应用中可以根据具体情况调整n的值，本公开在此不做限定。通过每个顶点对应的图像块在第三cnn网络之间的多次迭代过程，获取四个顶点的坐标，提高了获取身份证图像顶点坐标的效率和准确率。

本公开的实施例提供的技术方案中，通过第二cnn网络以及第三cnn网络获取身份证图像的四个顶点，进而获取该四个顶点的坐标，提高了获取身份证图像顶点坐标的效率和准确率。

在一个实施例中，如图1e所示，该方法还包括：

在步骤104中，获取目标图片的灰度图。

在步骤105中，按照预设标准缩放灰度图，获取标准灰度图。

在步骤106中，对标准灰度图进行归一化，获取待识别图片。

示例的，终端还可以为需要进行信息识别的图片进行预处理，该预处理包括提取灰度图，缩放和归一化。具体的，假设终端获取到的需要进行信息识别的图片为目标图片，终端可以首先获取该目标图片的灰度图，然后按照预设标准缩放该灰度图，例如，将该灰度图缩放至64*64，即将该灰度图缩放至长64个像素，宽64个像素的标准灰度图，接着对该标准灰度图进行归一化，即获取标准灰度图中各个像素的灰度，然后计算标准灰度图中灰度的平均值和方差，然后对标准灰度图中每个像素的灰度进行减均值除方差的运算，避免亮度不均对信息识别的影响，最后将归一化后的图片设置为待识别图片。终端在获取到待识别图片之后，可以对该待识别图片中身份证图像的定位点进行确定，进而校正该待识别图片，并提取该待识别图片的身份证图像包括的用户身份信息，提高了身份证信息识别的准确度。

本公开的实施例提供的技术方案中，在获取到用于识别的目标图片之后，可以首先对该目标图片进行预处理，获取预处理后的图片作为待识别图片，提高了身份证信息识别的精确度，进而提高了用户体验。

在一个实施例中，如图1f所示，在步骤102中，根据多个定位点的位置和预设比例，校正待识别图片，获取校正图片，可以通过步骤1022和步骤1023实现：

在步骤1022中，根据多个定位点的位置和预设比例，获取多个目标定位点的位置。

在步骤1023中，按照多个目标定位点的位置，校正待识别图片，获取校正图片，该校正图片中身份证图像上多个定位点的位置与多个目标定位点的位置重合。

示例的，二代身份证的长为85.6mm，宽为54.0mm，可以将该二代身份证的长宽比例确认为预设比例，即该预设比例可以为85.6:54.0。假设终端获取到待识别图片中身份证图像的四个顶点的坐标分别为第一顶点a的坐标(100,60)，第二顶点b的坐标(100,300)，第三顶点c的坐标(528,320)，第四顶点d的坐标(528,50)，根据四个顶点的坐标以及预设比例，为了使得校正图片包括的身份证图像的长宽比例满足预设比例，可以确定其四个目标顶点的坐标应该为第一目标顶点a1的坐标(100,60)，第二目标顶点b1的坐标(100,320)，第三目标顶点c1的坐标(528,320)，第四目标顶点d1的坐标(528,50)。

确定了四个目标顶点的坐标之后，可以建立一个映射表，该映射表中待识别图片中第一顶点a与校正图片中第一目标顶点a1对应，待识别图片中第二顶点b与校正图片中第二目标顶点b1对应，待识别图片中第三顶点c与校正图片中第三目标顶点c1对应，待识别图片中第四顶点d与校正图片中第四目标顶点d1对应，其余待识别图片中身份证图像占用的像素的坐标按照比例分别与对应的校正图片中的像素的位置匹配，然后按照该映射表将待识别图片中身份证图像占用的各个像素的位置校正至映射表中对应的位置，即可完成对待识别图片的校正。参考图1c，将图1c所示的待识别图片10校正之后，可以获取如图1g所示的校正图片10a，该校正图片10a包括的身份证图像的四个顶点的坐标与目标顶点的坐标相同。

或者，按照四个顶点的坐标与四个目标顶点的坐标，计算待识别图片与校正图片的单应变换(homography)h，然后通过该单应变换h校正该待识别图片。

本公开的实施例提供的技术方案中，在校正待识别图片时，首先确定目标定位点，然后采用映射的方法校正待识别图片，使得待识别图片的多个定位点的位置与多个目标定位点的位置重合，简化了校正待识别图片的过程，提高了校正待识别图片的效率。

下面通过几个实施例详细介绍实现过程。

图2是根据一示例性实施例示出的一种信息识别方法的流程图，执行主体为终端，如图2所示，包括以下步骤201至步骤213：

在步骤201中，建立待识别图片对应的坐标系。

在步骤202中，获取待识别图片的灰度图。

在步骤203中，将待识别图片的灰度图输入第二cnn网络，通过所述第二cnn网络获取待识别图片中身份证图像的四个顶点的待定坐标。

在步骤204中，预设i等于0。

在步骤205中，以该四个顶点中每个顶点的待定坐标为中心从待识别图片的灰度图中截取预设大小的图像块。

在步骤206中，将截取到的四个图像块按照预设通道串联后输入第三cnn网络，通过第三cnn网络获取该待定坐标的更新量。

在步骤207中，根据该待定坐标和待定坐标的更新量，获取四个顶点的更新坐标。

在步骤208中，将该四个顶点的更新坐标设置为该四个顶点的待定坐标。

在步骤209中，将i+1的值赋予i。

在步骤210中，确定i是否大于或等于n，若i大于或等于n，执行步骤211；若i小于n，执行步骤205。

在步骤211中，将该四个顶点当前的待定坐标确认为该四个顶点的坐标。

在步骤212中，根据四个顶点的坐标和预设比例，获取四个目标顶点的坐标。

在步骤213中，按照四个目标顶点的坐标校正待识别图片，获取校正图片，该校正图片中身份证图像上四个顶点的位置与四个目标顶点的位置重合。

本公开的实施例提供一种信息识别方法，在识别身份证上的用户信息时，可以首先校正待识别图片上的身份证图像，克服由于拍照角度导致的身份证图像的透视变换现象，进而避免了由于透视变换导致的信息识别不准确的情况，提高了身份证信息识别的精确度，进而提高了用户体验。

图3是根据一示例性实施例示出的一种信息识别方法的流程图，执行主体为终端，如图3所示，包括以下步骤301至步骤316：

在步骤301中，获取目标图片的灰度图。

在步骤302中，按照预设标准缩放该灰度图，获取标准灰度图。

在步骤303中，对该标准灰度图进行归一化，获取待识别图片。

在步骤304中，建立待识别图片对应的坐标系。

在步骤305中，将待识别图片的灰度图输入第二cnn网络，通过所述第二cnn网络获取待识别图片中身份证图像的四个顶点的待定坐标。

在步骤306中，预设i等于0。

在步骤307中，以该四个顶点中每个顶点的待定坐标为中心从待识别图片的灰度图中截取预设大小的图像块。

在步骤308中，将截取到的四个图像块按照预设通道串联后输入第三cnn网络，通过第三cnn网络获取该待定坐标的更新量。

在步骤309中，根据该待定坐标和待定坐标的更新量，获取四个顶点的更新坐标。

在步骤310中，将该四个顶点的更新坐标设置为该四个顶点的待定坐标。

在步骤311中，将i+1的值赋予i。

在步骤312中，确定i是否大于或等于n，若i大于或等于n，执行步骤313；若i小于n，执行步骤307。

在步骤313中，将该四个顶点当前的待定坐标确认为该四个顶点的坐标。

在步骤314中，根据四个顶点的坐标和预设比例，获取四个目标顶点的坐标。

在步骤315中，按照四个目标顶点的坐标校正待识别图片，获取校正图片，该校正图片中身份证图像上四个顶点的位置与四个目标顶点的位置重合。

下述为本公开装置实施例，可以用于执行本公开方法实施例。

图4a是根据一示例性实施例示出的一种信息识别装置40的结构示意图，该装置40可以通过软件、硬件或者两者的结合实现成为电子设备的部分或者全部。如图4a所示，该信息识别装置40包括第一获取模块401，校正模块402和识别模块403。

其中，第一获取模块401，用于获取待识别图片中身份证图像上多个定位点的位置。

校正模块402，用于根据所述多个定位点的位置和预设比例，校正所述待识别图片，获取校正图片，所述校正图片中身份证图像的长和宽满足所述预设比例。

识别模块403，用于识别所述校正图片中的用户身份信息。

在一个实施例中，如图4b所示，所述第一获取模块401包括建立子模块4011和第一获取子模块4012。

其中，建立子模块4011，用于在所述待识别图片上建立坐标系。

第一获取子模块4012，用于获取所述待识别图片中身份证图像的四个顶点的坐标。

所述校正模块402用于根据所述四个顶点的坐标和所述预设比例，校正所述待识别图片，获取校正图片。

在一个实施例中，如图4c所示，所述第一获取子模块4012包括第一获取单元4012a。

所述第一获取单元4012a，用于将所述待识别图片的灰度图输入第一卷积神经网络cnn网络，通过所述第一cnn网络获取所述身份证图像的四个顶点的坐标。

在一个实施例中，如图4d所示，所述第一获取子模块4012包括第二获取单元4012b，第三获取单元4012c，第四获取单元4012d，第一设置单元4012e，重复单元4012f和第二设置单元4012g。

其中，第二获取单元4012b，用于将所述待识别图片的灰度图输入第二cnn网络，通过所述第二cnn网络获取所述身份证图像的四个顶点的待定坐标。

第三获取单元4012c，用于根据所述四个顶点的待定坐标和第三cnn网络，获取所述待定坐标的更新量。

第四获取单元4012d，用于根据所述待定坐标和所述待定坐标的更新量，获取所述四个顶点的更新坐标。

第一设置单元4012e，用于将所述四个顶点的更新坐标设置为所述四个顶点的待定坐标。

重复单元4012f，用于控制所述第三获取单元4012c，所述第四获取单元4012d和所述第一设置单元4012e重复执行对应步骤n次，所述n为大于或者等于1的整数。

第二设置单元4012g，用于将第n次获取的四个顶点的待定坐标确认为所述四个顶点的坐标。

在一个实施例中，所述第三获取单元4012c用于以所述四个顶点中每个顶点的待定坐标为中心从所述待识别图片的灰度图中截取预设大小的图像块；将截取到的四个图像块按照预设通道串联后输入所述第三cnn网络，通过所述第三cnn网络获取所述待定坐标的更新量。

在一个实施例中，如图4e所示，所述装置40还包括第二获取模块404，第三获取模块405和第四获取模块406。

其中，第二获取模块404，用于获取目标图片的灰度图。

第三获取模块405，用于按照预设标准缩放所述灰度图，获取标准灰度图。

第四获取模块406，用于对所述标准灰度图进行归一化，获取所述待识别图片。

在一个实施例中，如图4f所示，所述校正模块402包括第二获取子模块4022和校正子模块4023。

其中，第二获取子模块4022，用于根据所述多个定位点的位置和预设比例，获取多个目标定位点的位置。

校正子模块4023，用于按照所述多个目标定位点的位置，校正所述待识别图片，获取校正图片，所述校正图片中身份证图像上多个定位点的位置与所述多个目标定位点的位置重合。

本公开的实施例提供一种信息识别装置，在识别身份证上的用户信息时，该装置可以首先校正待识别图片上的身份证图像，克服由于拍照角度导致的身份证图像的透视变换现象，进而避免了由于透视变换导致的信息识别不准确的情况，提高了身份证信息识别的精确度，进而提高了用户体验。

本公开实施例提供一种信息识别装置，该信息识别装置包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，处理器被配置为：

获取待识别图片中身份证图像上多个定位点的位置；

根据所述多个定位点的位置和预设比例，校正所述待识别图片，获取校正图片，所述校正图片中身份证图像的长和宽满足所述预设比例；

识别所述校正图片中的用户身份信息。

在一个实施例中，上述处理器还可被配置为：在所述待识别图片上建立坐标系；获取所述待识别图片中身份证图像的四个顶点的坐标；根据所述四个顶点的坐标和所述预设比例，校正所述待识别图片，获取校正图片。

在一个实施例中，上述处理器还可被配置为：将所述待识别图片的灰度图输入第一卷积神经网络cnn网络，通过所述第一cnn网络获取所述身份证图像的四个顶点的坐标。

在一个实施例中，上述处理器还可被配置为：将所述待识别图片的灰度图输入第二cnn网络，通过所述第二cnn网络获取所述身份证图像的四个顶点的待定坐标；根据所述四个顶点的待定坐标和第三cnn网络，获取所述待定坐标的更新量；根据所述待定坐标和所述待定坐标的更新量，获取所述四个顶点的更新坐标；将所述四个顶点的更新坐标设置为所述四个顶点的待定坐标；重复执行“根据所述四个顶点的待定坐标和第三cnn网络，获取所述待定坐标的更新量”至“将所述四个顶点的更新坐标设置为所述四个顶点的坐标”的步骤n次，所述n为大于或者等于1的整数；将第n次获取的四个顶点的待定坐标确认为所述四个顶点的坐标。

在一个实施例中，上述处理器还可被配置为：以所述四个顶点中每个顶点的待定坐标为中心从所述待识别图片的灰度图中截取预设大小的图像块；将截取到的四个图像块按照预设通道串联后输入所述第三cnn网络，通过所述第三cnn网络获取所述待定坐标的更新量。

在一个实施例中，上述处理器还可被配置为：获取目标图片的灰度图；按照预设标准缩放所述灰度图，获取标准灰度图；对所述标准灰度图进行归一化，获取所述待识别图片。

在一个实施例中，上述处理器还可被配置为：根据所述多个定位点的位置和预设比例，获取多个目标定位点的位置；按照所述多个目标定位点的位置，校正所述待识别图片，获取校正图片，所述校正图片中身份证图像上多个定位点的位置与所述多个目标定位点的位置重合。

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

图5是根据一示例性实施例示出的一种用于信息识别装置50的结构框图，该装置适用于终端设备。例如，装置50可以是移动电话，计算机，数字广播终端，消息收发设备，游戏控制台，平板设备，医疗设备，健身设备，个人数字助理等。

装置50可以包括以下一个或多个组件：处理组件502，存储器504，电源组件506，多媒体组件508，音频组件510，输入/输出(i/o)的接口512，传感器组件514，以及通信组件516。

处理组件502通常控制装置50的整体操作，诸如与显示，电话呼叫，数据通信，相机操作和记录操作相关联的操作。处理组件502可以包括一个或多个处理器520来执行指令，以完成上述的方法的全部或部分步骤。此外，处理组件502可以包括一个或多个模块，便于处理组件502和其他组件之间的交互。例如，处理组件502可以包括多媒体模块，以方便多媒体组件508和处理组件502之间的交互。

存储器504被配置为存储各种类型的数据以支持在装置50的操作。这些数据的示例包括用于在装置50上操作的任何应用程序或方法的指令，联系人数据，电话簿数据，消息，图片，视频等。存储器504可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(sram)，电可擦除可编程只读存储器(eeprom)，可擦除可编程只读存储器(eprom)，可编程只读存储器(prom)，只读存储器(rom)，磁存储器，快闪存储器，磁盘或光盘。

电源组件506为装置50的各种组件提供电力。电源组件506可以包括电源管理系统，一个或多个电源，及其他与为装置50生成、管理和分配电力相关联的组件。

多媒体组件508包括在所述装置50和用户之间的提供一个输出接口的屏幕。在一些实施例中，屏幕可以包括液晶显示器(lcd)和触摸面板(tp)。如果屏幕包括触摸面板，屏幕可以被实现为触摸屏，以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界，而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中，多媒体组件508包括一个前置摄像头和/或后置摄像头。当装置50处于操作模式，如拍摄模式或视频模式时，前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件510被配置为输出和/或输入音频信号。例如，音频组件510包括一个麦克风(mic)，当装置50处于操作模式，如呼叫模式、记录模式和语音识别模式时，麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器504或经由通信组件516发送。在一些实施例中，音频组件510还包括一个扬声器，用于输出音频信号。

i/o接口512为处理组件502和外围接口模块之间提供接口，上述外围接口模块可以是键盘，点击轮，按钮等。这些按钮可包括但不限于：主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件514包括一个或多个传感器，用于为装置50提供各个方面的状态评估。例如，传感器组件514可以检测到装置50的打开/关闭状态，组件的相对定位，例如所述组件为装置50的显示器和小键盘，传感器组件514还可以检测装置50或装置50一个组件的位置改变，用户与装置50接触的存在或不存在，装置50方位或加速/减速和装置50的温度变化。传感器组件514可以包括接近传感器，被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件514还可以包括光传感器，如cmos或ccd图像传感器，用于在成像应用中使用。在一些实施例中，该传感器组件514还可以包括加速度传感器，陀螺仪传感器，磁传感器，压力传感器或温度传感器。

通信组件516被配置为便于装置50和其他设备之间有线或无线方式的通信。装置50可以接入基于通信标准的无线网络，如wifi，2g或3g，或它们的组合。在一个示例性实施例中，通信组件516经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中，所述通信组件516还包括近场通信(nfc)模块，以促进短程通信。例如，在nfc模块可基于射频识别(rfid)技术，红外数据协会(irda)技术，超宽带(uwb)技术，蓝牙(bt)技术和其他技术来实现。

在示例性实施例中，装置50可以被一个或多个应用专用集成电路(asic)、数字信号处理器(dsp)、数字信号处理设备(dspd)、可编程逻辑器件(pld)、现场可编程门阵列(fpga)、控制器、微控制器、微处理器或其他电子组件实现，用于执行上述方法。

在示例性实施例中，还提供了一种包括指令的非临时性计算机可读存储介质，例如包括指令的存储器504，上述指令可由装置50的处理器520执行以完成上述方法。例如，所述非临时性计算机可读存储介质可以是rom、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等。

本公开实施例提供一种非临时性计算机可读存储介质，当所述存储介质中的指令由装置50的处理器执行时，使得装置50能够执行上述信息识别方法，所述方法包括：

获取待识别图片中身份证图像上多个定位点的位置；

根据所述多个定位点的位置和预设比例，校正所述待识别图片，获取校正图片，所述校正图片中身份证图像的长和宽满足所述预设比例；

识别所述校正图片中的用户身份信息。

在一个实施例中，所述获取待识别图片中身份证图像上多个定位点的位置包括：在所述待识别图片上建立坐标系；获取所述待识别图片中身份证图像的四个顶点的坐标；所述根据所述多个定位点的位置和预设比例，校正所述待识别图片，获取校正图片包括：根据所述四个顶点的坐标和所述预设比例，校正所述待识别图片，获取校正图片。

在一个实施例中，所述获取所述待识别图片中身份证图像的四个顶点的坐标包括：将所述待识别图片的灰度图输入第一卷积神经网络cnn网络，通过所述第一cnn网络获取所述身份证图像的四个顶点的坐标。

在一个实施例中，所述获取所述待识别图片中身份证图像的四个顶点的坐标包括：将所述待识别图片的灰度图输入第二cnn网络，通过所述第二cnn网络获取所述身份证图像的四个顶点的待定坐标；根据所述四个顶点的待定坐标和第三cnn网络，获取所述待定坐标的更新量；根据所述待定坐标和所述待定坐标的更新量，获取所述四个顶点的更新坐标；将所述四个顶点的更新坐标设置为所述四个顶点的待定坐标；重复执行“根据所述四个顶点的待定坐标和第三cnn网络，获取所述待定坐标的更新量”至“将所述四个顶点的更新坐标设置为所述四个顶点的坐标”的步骤n次，所述n为大于或者等于1的整数；将第n次获取的四个顶点的待定坐标确认为所述四个顶点的坐标。

在一个实施例中，所述根据所述四个顶点的待定坐标和第三cnn网络，获取所述待定坐标的更新量包括：以所述四个顶点中每个顶点的待定坐标为中心从所述待识别图片的灰度图中截取预设大小的图像块；将截取到的四个图像块按照预设通道串联后输入所述第三cnn网络，通过所述第三cnn网络获取所述待定坐标的更新量。

在一个实施例中，所述方法还包括：获取目标图片的灰度图；按照预设标准缩放所述灰度图，获取标准灰度图；对所述标准灰度图进行归一化，获取所述待识别图片。

在一个实施例中，所述根据所述多个定位点的位置和预设比例，校正所述待识别图片，获取校正图片包括：根据所述多个定位点的位置和预设比例，获取多个目标定位点的位置；按照所述多个目标定位点的位置，校正所述待识别图片，获取校正图片，所述校正图片中身份证图像上多个定位点的位置与所述多个目标定位点的位置重合。

本领域技术人员在考虑说明书及实践这里公开的公开后，将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：杨松
技术所有人：北京小米移动软件有限公司
我是此专利的发明人

上一篇：基于手持终端的车牌图像分割校正方法与流程
上一篇：基于FCN‑CRF主从网络的极化SAR目标检测方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。