目标识别方法、装置、系统及存储介质与流程

文档序号：16036754发布日期：2018-11-24 10:08阅读：152来源：国知局

本发明涉及模式识别技术领域，更具体地涉及一种目标识别方法、装置、系统及存储介质。

背景技术

随着图像处理技术的不断发展和计算设备计算能力的不断增强，越来越多的应用场景需要对图像中目标进行识别。

例如，在金融、交友和通信等行业的业务中，身份验证作为重要的一个模块，承担了验证用户身份的任务，以满足实名制等需求。居民身份证作为代表个人身份的有效证件，通常可以对图像中的居民身份证进行识别，以获得用于居民身份验证的信息。现有一些业务中，利用人工来进行身份证识别。然而人工识别和输入的过程十分费时，且容易出错。在另一些业务中，出现了一些可对图像中身份证进行自动识别的系统。这些系统通过智能手机、平板电脑和一些专用设备上的摄像头等图像采集设备获取其中包括身份证的待识别图像，并自动定位和识别身份证中的姓名、身份证号码和有效期等身份证信息。

但是，上述现有目标识别系统在识别精度和适应性两方面存在不足之处。特别是对于低质量的待识别图像，如身份证关键区域包含强反光部分的图像或身份证的有效期被遮挡的图像等，现有系统的识别结果将是不可信的，这对识别结果的进一步处理造成了很大困难。

技术实现要素：

考虑到上述问题而提出了本发明。本发明提供了一种目标识别方法、装置、系统及存储介质。

根据本发明一方面，提供了一种目标识别方法，包括：

获取待识别图像；

检测所述待识别图像的质量，以输出质量评价图，其中所述质量评价图中的像素的像素值表示所述像素的对应内容的识别准确度；

识别所述待识别图像中的感兴趣区域，其中所述感兴趣区域是目标在所述待识别图像中的区域的子区域；以及

根据所述质量评价图，确定所述感兴趣区域的识别准确度。

示例性地，所述获取待识别图像包括：

获取原始图像；

对所述原始图像进行目标识别，以确定所述目标在所述原始图像中的目标区域；以及

基于所述目标区域的图像获取所述待识别图像。

示例性地，所述基于所述目标区域的图像获取所述待识别图像包括：

根据所述目标区域的定位信息确定变换矩阵；以及

基于所述变换矩阵，将所述目标区域的图像变换为具有标准形状和第一标准尺寸的所述待识别图像。

示例性地，所述对所述原始图像进行目标识别，以确定所述目标在所述原始图像中的目标区域，包括：利用第二卷积神经网络(cnn)对所述原始图像进行目标识别，以确定所述目标在所述原始图像中的目标区域。

示例性地，所述第二cnn是利用第二训练图像的集合训练得到的，其中所述第二训练图像上标注有目标的位置。

示例性地，在所述对所述原始图像进行目标识别之前，所述方法还包括：将所述原始图像缩放为第二标准尺寸。

示例性地，所述检测所述待识别图像的质量，以输出质量评价图，包括：利用第一cnn检测所述待识别图像的质量，以输出所述质量评价图。

示例性地，所述第一cnn是利用第一训练图像的集合训练得到的，其中所述第一训练图像上标注有失真区域，其中所述失真区域是所述第一训练图像中像素的对应内容的识别准确度低于预设阈值的区域。

示例性地，所述根据所述质量评价图，确定所述感兴趣区域的识别准确度，包括：

根据所述质量评价图和所述待识别图像之间的位置对应关系，确定所述感兴趣区域在所述质量评价图中的对应区域；以及

根据所述对应区域中的像素值确定所述感兴趣区域的识别准确度。

示例性地，所述目标是身份证，所述感兴趣区域是文字区域。

根据本发明另一方面，还提供了一种目标识别装置，包括：

获取模块，用于获取待识别图像；

检测模块，用于检测所述待识别图像的质量，以输出质量评价图，其中所述质量评价图中的像素的像素值表示所述像素的对应内容的识别准确度；

识别模块，用于识别所述待识别图像中的感兴趣区域，其中所述感兴趣区域是目标在所述待识别图像中的区域的子区域；以及

确定模块，用于根据所述质量评价图，确定所述感兴趣区域的识别准确度。

根据本发明又一方面，还提供了一种目标识别系统，包括处理器和存储器，其中，所述存储器中存储有计算机程序指令，所述计算机程序指令被所述处理器运行时用于执行上述目标识别方法。

根据本发明再一方面，还提供了一种存储介质，在所述存储介质上存储了程序指令，所述程序指令在运行时用于执行上述目标识别方法。

根据本发明实施例的目标识别方法、装置、系统及存储介质，通过待识别图像的质量检测来辅助目标识别，能够提供目标的感兴趣区域的识别准确度。让用户更清楚地了解因待识别图像的质量问题可能导致的目标误识情况，从而极大提高目标识别系统的可靠性和适应性。显著提高了用户体验。

上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的具体实施方式。

附图说明

通过结合附图对本发明实施例进行更详细的描述，本发明的上述以及其它目的、特征和优势将变得更加明显。附图用来提供对本发明实施例的进一步理解，并且构成说明书的一部分，与本发明实施例一起用于解释本发明，并不构成对本发明的限制。在附图中，相同的参考标号通常代表相同部件或步骤。

图1示出了用于实现根据本发明实施例的目标识别方法和装置的示例电子设备的示意性框图；

图2示出根据本发明一个实施例的目标识别方法的示意性流程图；

图3示出根据本发明一个实施例的获取待识别图像的示意性流程图；

图4示出根据本发明一个实施例的基于目标区域的图像获取待识别图像的示意性流程图；

图5示出了根据本发明一个实施例的目标识别装置的示意性框图；以及

图6示出了根据本发明一个实施例的目标识别系统的示意性框图。

具体实施方式

为了使得本发明的目的、技术方案和优点更为明显，下面将参照附图详细描述根据本发明的示例实施例。显然，所描述的实施例仅仅是本发明的一部分实施例，而不是本发明的全部实施例，应理解，本发明不受这里描述的示例实施例的限制。基于本发明中描述的本发明实施例，本领域技术人员在没有付出创造性劳动的情况下所得到的所有其它实施例都应落入本发明的保护范围之内。

首先，参照图1来描述用于实现根据本发明实施例的目标识别方法和装置的示例电子设备100。

如图1所示，电子设备100包括一个或多个处理器102、一个或多个存储装置104。可选地，电子设备100还可以包括输入装置106、输出装置108和图像采集装置110，这些组件通过总线系统112和/或其它形式的连接机构(未示出)互连。应当注意，图1所示的电子设备100的组件和结构只是示例性的，而非限制性的，根据需要，所述电子设备也可以具有其他组件和结构。

所述处理器102可以是中央处理单元(cpu)、图形处理器(gpu)或者具有数据处理能力和/或指令执行能力的其它形式的处理单元，并且可以控制所述电子设备100中的其它组件以执行期望的功能。

所述存储装置104可以包括一个或多个计算机程序产品，所述计算机程序产品可以包括各种形式的计算机可读存储介质，例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(ram)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(rom)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令，处理器102可以运行所述程序指令，以实现下文所述的本发明实施例中(由处理器实现)的客户端功能以及/或者其它期望的功能。在所述计算机可读存储介质中还可以存储各种应用程序和各种数据，例如所述应用程序使用和/或产生的各种数据等。

所述输入装置106可以是用户用来输入指令的装置，并且可以包括键盘、鼠标、麦克风和触摸屏等中的一个或多个。

所述输出装置108可以向外部(例如用户)输出各种信息(例如图像和/或声音)，并且可以包括显示器、扬声器等中的一个或多个。

所述图像采集装置110可以采集图像，并且将所采集的图像存储在所述存储装置104中以供其它组件使用。图像采集装置110可以是摄像头。应当理解，图像采集装置110仅是示例，电子设备100可以不包括图像采集装置110。在这种情况下，可以利用其他图像采集装置采集待识别图像，并将采集的图像发送给电子设备100。

示例性地，用于实现根据本发明实施例的目标识别方法和装置的示例电子设备可以在诸如个人计算机或远程服务器等的设备上实现。

根据本发明实施例的目标识别方法、装置、系统及存储介质可以应用于各种目标识别领域。目标可以例如是银行卡、身份证、工作证、护照、户口页、营业执照、行人等任何期望识别的对象。作为示例，下文以身份证识别为例对本发明提供的目标识别方法、装置、系统及存储介质进行描述，这不应构成对本发明的限制。

下面，将参考图2描述根据本发明实施例的目标识别方法。图2示出根据本发明一个实施例的目标识别方法200的示意性流程图。如图2所示，该方法200包括以下步骤。

步骤s210，获取待识别图像。

待识别图像可以是任何合适的、需要进行目标识别的图像。如前所述，目标可以是用户期望识别的任何对象，例如银行卡、身份证等。待识别图像可以是摄像头等图像采集装置采集到的原始图像，也可以是对原始图像进行预处理之后获得的图像。该预处理操作可以包括为了更清楚的识别目标的所有操作。例如，预处理操作可以包括滤波等去噪操作。

待识别图像可以由电子设备100包括的图像采集装置110(例如摄像头)采集并传送到处理器102进行处理。待识别图像也可以由客户端设备(诸如包括摄像头的图像采集设备)采集最后发送到电子设备100以由电子设备100的处理器102进行处理。

此外，可以由电子设备100包括的图像采集装置110(例如摄像头)或由客户端设备(诸如包括摄像头的图像采集设备)采集原始图像并传送到处理器102进行预处理，以获取待识别图像，并且接下来仍由处理器102进行后续处理。

步骤s220，检测步骤s210所获取的待识别图像的质量，以输出质量评价图。该质量评价图中的像素的像素值表示该像素的对应内容的识别准确度。

在本申请的实施例中，待识别图像的质量与待识别图像中的内容的识别准确度相关。待识别图像中的内容越容易准确识别，待识别图像的质量越高；否则，反之。例如，在待识别图像中，目标被人有意或无意遮挡，这无疑将影响目标的识别准确度。具体地，例如身份证的持有者有意遮挡了身份证中的身份证号码，这严重影响身份证的识别准确度。因此，可以称该待识别图像的质量低下。又例如，在待识别图像的目标所在区域中，有强光照射所导致的反光现象出现，由此，该区域中出现了大量的接近白色的像素，这无法反映所拍摄物品本来面目。这也必然使得该区域中内容难以准确识别，因此，也称该待识别图像的质量低下。

在检测结果——质量评价图中，其像素值表示像素的对应内容的识别准确度。该识别准确度是根据待识别图像的质量来预估的。可选地，质量评价图可以是灰度图像。示例性地，该灰度图像中，像素值越大，则该像素的对应内容的识别准确度越低；像素值越小，该像素的对应内容的识别准确度越高。质量评价图中的像素/区域与待识别图像中的像素/区域一一对应。示例性地，质量评价图的尺寸与待识别图像的尺寸相同。

可选地，上述步骤s220可以利用神经网络来检测待识别图像的质量，例如cnn。具体地，cnn可以是全卷积神经网络，其包括多个卷积层。将待识别图像输入到cnn中，该cnn输出上述质量评价图。cnn是一种能够自主学习的网络，利用cnn来检测待识别图像的质量，可以极大提高质量检测的精度和可靠性。进而提高目标识别的精度和可靠性。

步骤s230，识别步骤s210中所获取的待识别图像中的感兴趣区域。可以理解，在待识别图像中，目标占有一定区域。例如，目标在待识别图像中占有部分或全部区域。感兴趣区域是目标在待识别图像中所占有区域的子区域。在感兴趣区域中，包括用户期望识别的具体内容。例如，对于目标是身份证的示例而言，用户期望识别的具体内容可能是身份证中的身份证号码等文字内容。在此步骤中，确定了感兴趣区域在待识别图像中的位置。

具体地，对于身份证识别来说，用户可能对于身份证中的文字更感兴趣，例如身份证号码或身份证有效期，对其背景图案没有兴趣或兴趣不大。可以称身份证中的文字是身份证识别中用户期望识别的具体内容。因此，感兴趣区域可以是待识别图像中的文字区域，例如身份证号码或身份证有效期所位于的区域。又例如，对于行人识别来说，用户可能对于行人的人脸更感兴趣。此种情况中，感兴趣区域就是待识别图像中人脸所位于的区域。

步骤s230可以采用绝对坐标的方法来确定感兴趣区域的位置。在一个示例中，可以采用各种识别模型来实现。该识别模型可以是利用大量的训练图像训练得到的。训练图像中标注了目标的感兴趣区域。在另一个示例中，可以根据目标中的其他特征物的位置以及感兴趣区域与该特征物的相对位置关系，确定感兴趣区域的位置。

步骤s240，根据步骤s220所获得的质量评价图，确定步骤s230所识别的感兴趣区域的识别准确度。感兴趣区域的识别准确度可以更精确地表示目标的识别准确度。可以根据感兴趣区域在质量评价图中的对应区域的像素值来预测感兴趣区域的识别准确度。

根据本发明一个实施例，首先，根据质量评价图和待识别图像之间的位置对应关系，确定该感兴趣区域在质量评价图中的对应区域。然后，根据该对应区域中的像素值确定该感兴趣区域的识别准确度。在一个示例中，质量评价图中的像素值越大，则该像素的对应内容的识别准确度越低。可以根据感兴趣区域在质量评价图中的对应区域中的最大像素值确定该感兴趣区域的识别准确度。在另一个示例中，可以根据该对应区域中的平均像素值确定该感兴趣区域的识别准确度。

通过步骤s240，有效避免了根据图像整体质量预判目标识别准确度的误差。例如，在一个身份证图像中，可能在身份证以外的图像区域或者身份证中的背景区域(无文字内容的区域)中出现了遮挡物或强光反射，但这对于身份证识别的准确度是没有影响的。如果根据图像整体质量预判，将会获得不准确的预判结果。换言之，在步骤s240中，仅考虑了感兴趣区域所在的部分的图像质量，从而可以提供更精确的目标识别准确度。

在完成上述目标识别过程后，可以基于所获得结果，进一步识别感兴趣区域中的具体内容。例如，对于身份证识别来说，可以进一步识别该身份证的身份证号码。本领域普通技术人员可以理解该过程，为了简洁，在此不再赘述。

在上述目标识别方法中，提供了目标的感兴趣区域的识别准确度供用户参考。这有效避免了基于整张图像的质量来预判识别准确度的误差。让用户更清楚地了解因待识别图像的局部或全部质量问题可能导致的目标误识情况，从而极大提高目标识别系统的可靠性和适应性。显著提高了用户体验。

本领域普通技术人员可以理解，上述目标识别方法仅为示例，可对其进行各种改变，仍能获得上述技术效果。例如，步骤s230可以先于步骤s220执行。

示例性地，根据本发明实施例的目标识别方法可以在具有存储器和处理器的设备、装置或者系统中实现。根据本发明实施例的目标识别方法可以部署在图像采集端处。例如，其可以部署在银行系统内的图像采集端，用以实时对客户的身份证进行识别。替代地，根据本发明实施例的目标识别方法还可以分布地部署在服务器端(或云端)和客户端处。例如，可以在客户端采集图像，客户端将采集到的图像传送给服务器端(或云端)，由服务器端(或云端)进行目标识别。

在一个实施例中，图2所示方法200中的待识别图像是对原始图像进行处理之后获得的图像。图3示出了根据本发明一个实施例的获取待识别图像的示意性流程图。如图3所示，前述步骤s210可以包括以下步骤。

步骤s211，获取原始图像。

原始图像可以是摄像头等图像采集装置采集到的原始图像。例如原始图像可以由电子设备100包括的图像采集装置110(例如摄像头)采集并传送到处理器102进行处理。原始图像也可以由客户端设备(诸如包括摄像头的图像采集设备)采集最后发送到电子设备100以由电子设备100的处理器102进行处理。

可选地，该原始图像还可以是经缩放处理后的图像。例如，该原始图像的尺寸被缩放处理为标准尺寸。该标准尺寸例如宽度为256像素，高度为160像素。

步骤s212，对步骤s211所获取的原始图像(可以是未经缩放的或者经缩放的)进行目标识别，以确定目标在该原始图像中的目标区域。即确定目标在该原始图像中的位置。

以身份证识别为例，在步骤s212中，确定了身份证在原始图像中的位置，即目标区域。在一个示例中，身份证在原始图像中的位置可以用其在原始图像中的中心坐标、其宽度和高度来限定。可以理解，在该示例中，需要身份证在原始图像中的位置比较端正。在一个银行系统的应用场景中，可以在图像采集端，设置有一个用于容纳身份证的浅槽，以限制客户将身份证置于该特定位置。由此，该图像采集端所采集的原始图像中，身份证将是比较端正的。这将给后续目标识别带来便利，提高目标识别的速度和准确度。在另一个示例中，身份证在原始图像中的位置可以用原始图像中的四个点来限定，这四个点分别对应于身份证四个边的四个交点。在该示例中，对于身份证在图像中的位置没有任何限定，由此身份证所在的区域可能是任意四边形，例如矩形、梯形以及不规则的四边形等。由此，可以适用于各种各样的原始图像，显著提高了目标识别系统的适应性和鲁棒性。

可选地，上述步骤s212可以利用神经网络来进行目标识别，例如cnn，以确定目标在原始图像中的目标区域。该cnn可以包括多个卷积层和位于最后一层的全连接层。将原始图像输入到cnn中，该cnn输出上述关于目标区域的信息，例如采用回归(regression)的方式输出该信息。在上述身份证识别的示例中，该cnn可以输出身份证在原始图像中的中心坐标、宽度和高度或者四个顶点的坐标等。利用cnn来在原始图像中识别目标，可以极大提高质量检测的精度和可靠性。进而提高目标识别的精度和可靠性。

对于利用cnn对原始图像进行目标识别的情况，如果原始图像是经缩放为标准尺寸的，那么更便于cnn进行处理，进一步提高了cnn进行目标识别的速度和精度。

步骤s213，基于步骤s212所确定的目标区域中的图像获取前述待识别图像。

在一个示例中，可以从原始图像中提取目标区域中的图像，将所提取的图像作为待识别图像。

在另一个示例中，可以从原始图像中提取目标区域中的图像，将所提取出的图像进行校正处理，然后将校正处理后的图像作为待识别图像。经校正处理得到的待识别图像具有标准形状和标准尺寸，由于不同图像中目标所在位置以及所在区域的形状可能不同，通过对提取出的图像进行校正处理，能够提高对待识别图像中感兴趣区域的识别准确率。可选地，可以根据目标区域的定位信息校正提取出的图像。图4示出了根据本发明另一个示例的基于目标区域的图像获取待识别图像的示意性流程图。如图4所示，首先，根据目标区域的定位信息确定变换矩阵。然后，基于该变换矩阵，将目标区域的图像变换为具有标准形状和标准尺寸的待识别图像。如步骤s212所描述的，目标区域可以是任意四边形。该变换矩阵用于将目标区域的图像变换为标准形状的图像，例如特定尺寸的矩形。具体地，经变换的待识别图像可以是宽度为540像素、高度为384像素的矩形图像。可以理解，通过该变换操作，目标区域中的诸如感兴趣区域等也进行了相应的形状变换。这里的变换可以采用投影变换来实现。

如上变换将任意形状的目标区域的图像统一为标准形状和标准尺寸，有利于后续的感兴趣区域的识别以及根据质量评价图确定感兴趣区域的识别准确度，提高了后续步骤的处理速度和精度，进而保证了整个目标识别过程的速度和精度。例如，身份证中的感兴趣区域，例如身份证号码所在的区域是固定位置的，将身份证区域统一为标准形状和标准尺寸后，可以直接根据各个感兴趣区域在身份证中的实际位置，识别待识别图像中的感兴趣区域。具体地，身份证的尺寸为85.6mm*54mm，而身份证号码在身份证中的位置是固定的。根据该实际位置，能够识别待识别图像中的感兴趣区域。在保证识别精度的同时，简化了识别计算。

根据图3所示的流程图所确定的待识别图像的内容中，可以仅包括目标本身，从而在后续的目标识别中避免了无用背景的干扰，不仅显著提升了目标识别的准确性，而且减少了待处理的数据，提高了目标识别速度。

根据本发明一个实施例，前述的用于对原始图像进行目标识别的cnn和/或用于检测待识别图像的质量以输出质量评价图的cnn是利用训练图像的集合训练得到的。为了描述方便，将用于对原始图像进行目标识别的cnn简称为识别cnn，将用于检测待识别图像的质量以输出质量评价图的cnn简称检测cnn。

用于训练识别cnn的训练图像上标注有目标的位置。例如，在身份证识别的示例中，用于训练身份证识别的cnn的训练图像上标注了其中的身份证的位置，例如身份证的四条边或四条边的交点。可选地，训练图像是经缩放到标准尺寸的图像。例如宽度为256像素，高度为160像素。

用于训练检测cnn的训练图像上标注了失真区域。该失真区域是该训练图像中像素的对应内容的识别准确度低于预设阈值的区域。这里所说的识别准确度可以是技术人员根据经验预估的。一般而言，失真区域是图像的质量较低的区域，例如，高曝光度的区域、低清晰度的区域以及被遮挡的区域等等。因为这些区域的图像质量较低，将会对目标的识别造成不利影响，因此，该区域对应内容的识别准确度也相应较低。

可选地，用于训练检测cnn的训练图像是通过以下方式获取的。首先，获取原始图像。然后，对所述原始图像进行目标识别，以确定目标在所述原始图像中的目标区域。该步骤可以利用识别cnn实现。最后，基于所述目标区域的图像获取所述训练图像。在一个示例中，可以直接提取所述目标区域的图像，并在其中标注失真区域，则由此获得所述训练图像。在另一个示例中，根据所述目标区域的定位信息确定变换矩阵；基于所述变换矩阵，将所述目标区域的图像变换为具有标准形状和标准尺寸的图像；在经变换的图像上标注失真区域，以由此获得所述训练图像。上述训练图像的获取过程的部分步骤与前述待识别图像的获取过程的步骤类似，为了简洁，在此不再赘述。

首先将cnn的参数随机初始化或利用已经训练好的其他网络进行初始化。其中，对于利用已经训练好的其他网络进行初始化的情况，可以选取其中的一部分作为上述cnn的一部分。然后利用经标注的训练图像，对cnn进行训练。该训练过程中，可以固定cnn中的一部分参数，使其不参与训练。cnn中的每个卷积单元的参数可以在训练过程中通过反向传播算法优化得到。

经训练获得的cnn的性能更好，进而，可以提高目标识别系统的性能。

根据本发明另一个实施例，前述的用于对原始图像进行目标识别的cnn和/或用于检测待识别图像的质量以输出质量评价图的cnn是预存在目标识别系统中的。

根据本发明另一方面，还提供了一种目标识别装置。图5示出了根据本发明一个实施例的目标识别装置500的示意性框图。

如图5所示，装置500包括获取模块510、检测模块520、识别模块530和确定模块540。所述各个模块可分别执行上文中所述的目标识别方法的各个步骤/功能。以下仅对该装置500的各部件的主要功能进行描述，而省略以上已经描述过的细节内容。可以理解，目标可以是身份证、银行卡、行人等各种对象。

获取模块510用于获取待识别图像。图像获取模块510可以由图1所示的电子设备中的处理器102运行存储装置104中存储的程序指令来实现。

检测模块520用于检测所述待识别图像的质量，以输出质量评价图，其中所述质量评价图中的像素的像素值表示所述像素的对应内容的识别准确度。检测模块520可以由图1所示的电子设备中的处理器102运行存储装置104中存储的程序指令来实现。

识别模块530用于识别所述待识别图像中的感兴趣区域，其中所述感兴趣区域是目标在所述待识别图像中的区域的子区域。识别模块530可以由图1所示的电子设备中的处理器102运行存储装置104中存储的程序指令来实现。

对于目标是身份证的情况，这里的感兴趣区域可以是文字区域。

确定模块540用于根据所述质量评价图，确定所述感兴趣区域的识别准确度。确定模块540也可以由图1所示的电子设备中的处理器102运行存储装置104中存储的程序指令来实现。

示例性地，所述获取模块510进一步用于：

获取原始图像；

对所述原始图像进行目标识别，以确定所述目标在所述原始图像中的目标区域；以及

基于所述目标区域的图像获取所述待识别图像。

示例性地，所述获取模块510基于所述目标区域的图像获取所述待识别图像通过以下方式实现：

根据所述目标区域的定位信息确定变换矩阵；以及

基于所述变换矩阵，将所述目标区域的图像变换为具有标准形状和第一标准尺寸的所述待识别图像。

示例性地，所述获取模块510对所述原始图像进行目标识别，以确定所述目标在所述原始图像中的目标区域具体通过以下方式实现：利用第二cnn对所述原始图像进行目标识别，以确定所述目标在所述原始图像中的目标区域。

示例性地，所述第二cnn是利用第二训练图像的集合训练得到的，其中所述第二训练图像上标注有目标的位置。

示例性地，所述获取模块510在所述对所述原始图像进行目标识别之前，还用于：将所述原始图像缩放为第二标准尺寸。

示例性地，所述检测模块520检测所述待识别图像的质量，以输出质量评价图具体通过以下方式实现：利用第一cnn检测所述待识别图像的质量，以输出所述质量评价图。

示例性地，所述确定模块540具体用于：

根据所述质量评价图和所述待识别图像之间的位置对应关系，确定所述感兴趣区域在所述质量评价图中的对应区域；以及

根据所述对应区域中的像素值确定所述感兴趣区域的识别准确度。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的模块及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

图6示出了根据本发明一个实施例的目标识别系统600的示意性框图。如图6所示，系统600包括输入装置610、存储装置620、处理器630以及输出装置640。可以理解，这里的目标可以是身份证、银行卡以及行人等各种期望识别的对象。

所述输入装置610用于接收用户所输入的操作指令以及采集数据。输入装置610可以包括键盘、鼠标、麦克风、触摸屏和图像采集装置等中的一个或多个。

所述存储装置620存储用于实现根据本发明实施例的目标识别方法中的相应步骤的计算机程序指令。

所述处理器630用于运行所述存储装置620中存储的计算机程序指令，以执行根据本发明实施例的目标识别方法的相应步骤，并且用于实现根据本发明实施例的目标识别装置中的获取模块510、检测模块520、识别模块530和确定模块540。

在本发明的一个实施例中，在所述计算机程序指令被所述处理器630运行时使所述系统600执行以下步骤：

获取待识别图像；

检测所述待识别图像的质量，以输出质量评价图，其中所述质量评价图中的像素的像素值表示所述像素的对应内容的识别准确度；

识别所述待识别图像中的感兴趣区域，其中所述感兴趣区域是目标在所述待识别图像中的区域的子区域；以及

根据所述质量评价图，确定所述感兴趣区域的识别准确度。

对于目标是身份证的情况，这里的感兴趣区域可以是文字区域。

示例性地，在所述计算机程序指令被所述处理器630运行时使所述系统600执行的所述获取待识别图像的步骤包括：

获取原始图像；

对所述原始图像进行目标识别，以确定所述目标在所述原始图像中的目标区域；以及

基于所述目标区域的图像获取所述待识别图像。

示例性地，在所述计算机程序指令被所述处理器630运行时使所述系统600执行的所述基于所述目标区域的图像获取所述待识别图像的步骤包括：

根据所述目标区域的定位信息确定变换矩阵；以及

基于所述变换矩阵，将所述目标区域的图像变换为具有标准形状和第一标准尺寸的所述待识别图像。

示例性地，在所述计算机程序指令被所述处理器630运行时使所述系统600执行的所述对所述原始图像进行目标识别以确定所述目标在所述原始图像中的目标区域的步骤包括：利用第二cnn对所述原始图像进行目标识别，以确定所述目标在所述原始图像中的目标区域。

示例性地，所述第二cnn是利用第二训练图像的集合训练得到的，其中所述第二训练图像上标注有目标的位置。

示例性地，在所述计算机程序指令被所述处理器630运行时使所述系统600执行的所述对所述原始图像进行目标识别的步骤之前，还使所述系统600执行以下步骤：将所述原始图像缩放为第二标准尺寸。

示例性地，在所述计算机程序指令被所述处理器630运行时使所述系统600执行的所述检测所述待识别图像的质量以输出质量评价图的步骤包括：利用第一cnn检测所述待识别图像的质量，以输出所述质量评价图。

示例性地，在所述计算机程序指令被所述处理器630运行时使所述系统600执行的所述根据所述质量评价图确定所述感兴趣区域的识别准确度的步骤包括：

根据所述质量评价图和所述待识别图像之间的位置对应关系，确定所述感兴趣区域在所述质量评价图中的对应区域；以及

根据所述对应区域中的像素值确定所述感兴趣区域的识别准确度。

此外，根据本发明再一方面，还提供了一种存储介质，在所述存储介质上存储了程序指令，在所述程序指令被计算机或处理器运行时使得所述计算机或处理器执行本发明实施例的目标识别方法的相应步骤，并且用于实现根据本发明实施例的目标识别装置中的相应模块。所述存储介质例如可以包括智能电话的存储卡、平板电脑的存储部件、个人计算机的硬盘、只读存储器(rom)、可擦除可编程只读存储器(eprom)、便携式紧致盘只读存储器(cd-rom)、usb存储器、或者上述存储介质的任意组合。所述计算机可读存储介质可以是一个或多个计算机可读存储介质的任意组合。

在本发明的一个实施例中，所述计算机程序指令被计算机或处理器运行时，使得所述计算机或处理器执行以下步骤：

获取待识别图像；

检测所述待识别图像的质量，以输出质量评价图，其中所述质量评价图中的像素的像素值表示所述像素的对应内容的识别准确度；

识别所述待识别图像中的感兴趣区域，其中所述感兴趣区域是目标在所述待识别图像中的区域的子区域；以及

根据所述质量评价图，确定所述感兴趣区域的识别准确度。

对于目标是身份证的情况，这里的感兴趣区域可以是文字区域。

在本发明的一个实施例中，所述计算机程序指令被计算机或处理器运行时，使得所述计算机或处理器执行的所述获取待识别图像的步骤包括：

获取原始图像；

对所述原始图像进行目标识别，以确定所述目标在所述原始图像中的目标区域；以及

基于所述目标区域的图像获取所述待识别图像。

示例性地，所述计算机程序指令被计算机或处理器运行时，使得所述计算机或处理器执行的所述基于所述目标区域的图像获取所述待识别图像的步骤包括：

根据所述目标区域的定位信息确定变换矩阵；

基于所述变换矩阵，将所述目标区域的图像变换为具有标准形状和第一标准尺寸的所述待识别图像；以及

确定经变换的图像是所述待识别图像。

示例性地，所述计算机程序指令被计算机或处理器运行时，使得所述计算机或处理器执行的所述对所述原始图像进行目标识别以确定所述目标在所述原始图像中的目标区域的步骤包括：利用第二cnn对所述原始图像进行目标识别，以确定所述目标在所述原始图像中的目标区域。

示例性地，所述第二cnn是利用第二训练图像的集合训练得到的，其中所述第二训练图像上标注有目标的位置。

示例性地，所述计算机程序指令被计算机或处理器运行时，使得所述计算机或处理器执行的所述对所述原始图像进行目标识别的步骤之前，还使得所述计算机或处理器执行以下步骤：将所述原始图像缩放为第二标准尺寸。

示例性地，所述计算机程序指令被计算机或处理器运行时，使得所述计算机或处理器执行的所述检测所述待识别图像的质量以输出质量评价图的步骤包括：利用第一cnn检测所述待识别图像的质量，以输出所述质量评价图。

示例性地，所述计算机程序指令被计算机或处理器运行时，使得所述计算机或处理器执行的所述根据所述质量评价图确定所述感兴趣区域的识别准确度的步骤包括：

根据所述质量评价图和所述待识别图像之间的位置对应关系，确定所述感兴趣区域在所述质量评价图中的对应区域；以及

根据所述对应区域中的像素值确定所述感兴趣区域的识别准确度。

根据本发明实施例的目标识别系统中的各模块可以通过根据本发明实施例实施目标识别的电子设备的处理器运行在存储器中存储的计算机程序指令来实现，或者可以在根据本发明实施例的计算机程序产品的计算机可读存储介质中存储的计算机指令被计算机运行时实现。

根据本发明实施例的目标识别方法、装置、系统和存储介质，通过待识别图像的质量检测来辅助目标识别，能够提供目标的感兴趣区域的识别准确度。让用户更清楚地了解因待识别图像的质量问题可能导致的目标误识情况，从而极大提高目标识别系统的可靠性和适应性。显著提高了用户体验。

尽管这里已经参考附图描述了示例实施例，应理解上述示例实施例仅仅是示例性的，并且不意图将本发明的范围限制于此。本领域普通技术人员可以在其中进行各种改变和修改，而不偏离本发明的范围和精神。所有这些改变和修改意在被包括在所附权利要求所要求的本发明的范围之内。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

在本申请所提供的几个实施例中，应该理解到，所揭露的设备和方法，可以通过其它的方式实现。例如，以上所描述的设备实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个设备，或一些特征可以忽略，或不执行。

在此处所提供的说明书中，说明了大量具体细节。然而，能够理解，本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。

类似地，应当理解，为了精简本发明并帮助理解各个发明方面中的一个或多个，在对本发明的示例性实施例的描述中，本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该本发明的方法解释成反映如下意图：即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说，如相应的权利要求书所反映的那样，其发明点在于可以用少于某个公开的单个实施例的所有特征的特征来解决相应的技术问题。因此，遵循具体实施方式的权利要求书由此明确地并入该具体实施方式，其中每个权利要求本身都作为本发明的单独实施例。

本领域的技术人员可以理解，除了特征之间相互排斥之外，可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述，本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外，本领域的技术人员能够理解，尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征，但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如，在权利要求书中，所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

本发明的各个部件实施例可以以硬件实现，或者以在一个或者多个处理器上运行的软件模块实现，或者以它们的组合实现。本领域的技术人员应当理解，可以在实践中使用微处理器或者数字信号处理器(dsp)来实现根据本发明实施例的目标识别装置中的一些模块的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的装置程序(例如，计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上，或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到，或者在载体信号上提供，或者以任何其他形式提供。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制，并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中，不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中，这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

以上所述，仅为本发明的具体实施方式或对具体实施方式的说明，本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。本发明的保护范围应以权利要求的保护范围为准。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘毅博;李一杰
技术所有人：北京旷视科技有限公司
我是此专利的发明人

上一篇：一种农田水利用灌溉沟渠除淤泥设备的制作方法
上一篇：舌清洁器的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。