辅助物品的图像合规的方法、装置和电子设备与流程

文档序号：14653871发布日期：2018-06-08 22:38阅读：166来源：国知局

本申请涉及电子信息处理领域，更具体地涉及辅助物品的图像合规的方法、装置和电子设备。

背景技术：

目前使用光学字符识别(Optical Character Recognition，OCR)技术对用户提供的证件照片进行处理，从而提取并识别证件照片上的用户信息的方法，在互联网金融等身份认证场景得到了普遍应用。

在现实场景中，用户使用终端设备的操作系统的摄像头功能拍摄证件照片，整个证件照片的采集过程完全交给用户来完成，但由于用户拍摄证件照片的环境复杂多样(例如，不同的光照角度与强度)及用户拍照水平的高低不同(例如，能够对焦到目标物体，拍照时手是否有抖动)，导致用户拍摄到的证件照片的质量也参差不齐，而不符合质量要求(或者说不合规)的证件照片会导致后续的OCR算法识别准确率降低甚至失效，降低用户身份认证的成功率、影响用户体验。

因此，需求一种辅助物品的图像合规的方法，来克服上述技术问题。

技术实现要素：

本申请的目的在于提供一种辅助物品的图像合规的方法、装置和电子设备，能够在物品的图像不合规时，辅助用户使物品的图像合规，避免不合规的图像导致的图像的识别准确率低、用户身份认证成功率低和用户体验差的问题。

为解决上述技术问题，本申请实施例是这样实现的：

第一方面，提供了一种辅助物品的图像合规的方法，包括：

检测物品的图像的合规性；

若检测到物品的图像不合规，辅助用户使所述物品的图像合规。

第二方面，提供一种辅助物品的图像合规的装置，包括：

第一处理单元，检测物品的图像的合规性；

第二处理单元，若检测到物品的图像不合规，辅助用户使所述物品的图像合规。

第三方面，提供一种电子设备，包括：

处理器；以及

被安排成存储计算机可执行指令的存储器，所述可执行指令在被执行时使用所述处理器执行以下操作：

检测物品的图像的合规性；

若检测到物品的图像不合规，辅助用户使所述物品的图像合规。

第四方面，提供一种计算机可读介质，所述计算机可读介质存储一个或多个程序，所述一个或多个程序当被包括多个应用程序的电子设备执行时，使得所述电子设备执行以下操作：

检测物品的图像的合规性；

若检测到物品的图像不合规，辅助用户使所述物品的图像合规。

由以上本申请实施例提供的技术方案可见，本申请实施例检测物品的图像的合规性，并在检测到物品的图像不合规时，辅助用户使物品的图像合规。本申请实施例的方法，能够避免不合规的图像导致的识别准确率低、用户身份认证成功率低和用户体验差的问题。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是根据本申请的一个实施例的辅助物品的图像合规的方法的示意图流程图。

图2是根据本申请的一个实施例的图像模板的示意图。

图3是根据本申请的一个实施例的矫正物品的图像的姿态的示意图。

图4是根据本申请一具体实施例的辅助物品的图像合规的方法的示意性流程图。

图5是根据本申请实施例的电子设备的结构框图。

图6是根据本申请实施例的辅助物品的图像合规的装置的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请中的技术方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都应当属于本申请保护的范围。

在本申请实施例中，电子设备可以是终端设备，终端设备既包括无线信号接收器的设备，其仅具备无发射能力的无线信号接收器的设备，又包括接收和发射硬件的设备，其具有能够在双向通信链路上，执行双向通信的接收和发射硬件的设备。这种设备可以包括：蜂窝或其他通信设备，其具有单线路显示器或多线路显示器或没有多线路显示器的蜂窝或其他通信设备；个人通信系统(Personal Communicat1ns Service，PCS)，其可以组合语音、数据处理、传真和/或数据通信能力；个人数字助理(Personal Digital Assistant，PDA)，其可以包括射频接收器、寻呼机、互联网/内联网访问、网络浏览器、记事本、日历和/或全球定位系统(Global Posit1ning System，GPS)接收器；常规膝上型和/或掌上型计算机或其他设备，其具有和/或包括射频接收器的常规膝上型和/或掌上型计算机或其他设备。这里所使用的终端设备可以是便携式、可运输、安装在交通工具(航空、海运和/或陆地)中的，或者适合于和/或配置为在本地运行，和/或以分布形式，运行在地球和/或空间的任何其他位置运行。这里所使用的终端设备还可以是通信终端、上网终端、音乐/视频播放终端，例如可以是PDA、移动互联网设备(Mobile Internet Device，MID)和/或具有音乐/视频播放功能的移动电话。

在本申请实施例中，物品可以为证件，证件是指用来证明身份、经历等的证书和文件，证件包括但不限于身份证件类证件、财产证明类证件、证书类证件、法律文书类证件、票据类证件、保修单类证件。其中，身份证件类证件包括但不限于居民身份证、居民户口本、护照、港澳通行证、结婚证、社保卡和医保卡，财产证明类证件包括但不限于银行卡、存折、存单和借款协议。证书类证件包括但不限于毕业证、学位证和荣誉证书。法律文书类证件包括但不限于劳动合同、租房合同和保险单。票据类证件包括但不限于发票。保修单类证件包括但不限于保修卡。

图1是根据本申请的一个实施例的辅助物品的图像合规的方法的流程图。图1的方法100由辅助物品的图像合规的装置执行。如图1所示出的，在S102处，检测物品的图像的合规性。

可以理解的是，在S102处检测物品的图像的合规性，实质上是检测物品的图像是否合规。

在S104处，若检测到物品的图像不合规，辅助用户使所述物品的图像合规。

需要说明的是，在S104中，辅助用户使物品的图像合规可以是辅助物品的图像合规的装置自动调整物品的图像的拍摄参数(例如，补光强度)来使得物品的图像合规，或者辅助用户使物品的图像合规还可以是向用户提供反馈信息，通过反馈信息指导用户执行相应的操作使得物品的图像合规。

可选地，若S102处检测到物品的图像合规，在S104处，获取物品的图像上承载的信息，将物品的图像上承载的信息与目标数据源中的信息进行比对，根据对比的结果，确定物品的真实性。

举例来说，假设物品是身份证，则若在S102处检测到物品的图像合规，则在S104处采用光学识别符识别(Optical Character Recognition，OCR)算法获取身份证上承载的信息，例如：姓名、身份证号、家庭住址和有效期等信息，然后将提取到的信息与权威数据源(例如，公安网上的留底信息)进行比对，如果信息比对成功，则说明身份证是真实的，否则说明该身份证是不真实的。

可以看出，方法100的方案，对物品的图像是否合规进行检测，并在检测到物品的图像不合规时，能够辅助用户使物品的图像合规，从而能够保证后续对物品的图像上承载的信息的识别成功率。以及在检测到物品的图像合规时，能够直接获取物品的图像上承载的信息，不需要用户点击按键进行拍照，降低了用户操作的复杂度，提高用户的使用体验。

可选地，作为一个实施例，在S102中检测物品的图像的合规性，包括：检测物品是否完整的呈现在拍摄视野中。

具体地，在一些实施例中，如图2所示出的，以物品为身份证为例，在身份证的图像采集过程中提供图像模板或者称为引导界面，引导用户把身份证放入图像模板对应的区域来进行拍照，从而保证拍摄的证件的姿态(包括大小和倾斜角度)基本正确，例如图2中左图所示出的，在拍摄身份证正面时，提示用户“将头像放到框内，并调整好光线”，在拍摄身份证的背面时，提示用户“将国徽放到框内，并调整好光线”，用户可以根据图像模板的提示放置身份证，保证身份证的姿态正确。在这种情况下，检测物品的图像是否在图像模板对应的区域内，若检测到物品的图像在图像模板对应的区域内，则确定物品完成的呈现在拍摄视野中。由于图像模板的使用，可以使得用户清楚的了解物品需要放置到什么样的位置才能得到合规的图像，提高用户的体验。

具体地，在另一些实施例中，检测物品是否完整的呈现在拍摄视野中可以具体通过以下方式来实现：确定物品的长边与短边的比率；若确定所述比率为预设比率，且物品的角点与目标图像的边缘的距离大于或等于预设距离，则确定物品完整的呈现在拍摄视野中。

可选地，作为一个例子，确定物品的长边与短边的比率包括：确定物品的角点的坐标位置，根据物品的角点的位置坐标，确定物品的长边与短边的比率。在确定物品的角点的坐标位置时可以根据角点定位算法来确定。

需要说明的是，物品的角点也可以理解为物品的关键点，通常对于一般的证件而言，证件的关键点就是证件的四个角点。可以采用基于深度学习回归网络的算法对训练数据进行训练得出训练模型，即角点定位算法。对于证件来说，训练数据的格式为一张带有证件的图像的图片以及证件4个角点在图中的位置(x，y)坐标，在训练过程中采用的损失函数可以为欧式距离损失函数(Eculidean Loss)。在实际使用时，给定一张带有证件的图像的输入图像，训练模型会预测出证件的4个角点的位置坐标。

具体地，在一些实施例中，在预测出证件的4个角点坐标之后，可以计算出证件长边与短边的比率，如果该比率与实际比率接近，且4个角点的坐标不靠近输入图像的边缘，则可认为证件是完整的，即证件完整的呈现在拍摄视野中。

进一步地，在一些实施例中，如果确定物品的图像的姿态不是目标姿态，将物品的图像的姿态矫正为目标姿态。如图3所示出的，在左图中(姿态矫正前)，根据证件的4个角点的坐标确定证件的姿态不是正面横竖垂直状态，则将证件的图像矫正为右图(姿态矫正后)所示的状态。例如，在确定出证件的4个角点的坐标位置之后，通过防射变换(Affine Transform)来将证件姿态矫正为正面横竖垂直状态，这样将更有利于对证件的图像上的文字区域进行定位和进行识别。

可选地，在S102处，检测物品的图像的合规性还包括：检测拍摄视野中是否存在所述物品。当检测到拍摄视野中存在所述物品时，检测物品是否完整的呈现在拍摄视野中。也就是说，在检测物品是否完整的呈现在拍摄视野中之前，需要进行物品存在性检查。

可选地，作为一个例子，采用基于深度学习的2分类算法实现对物品存在性的检查。所谓的2分类指的是有2个类别，这2个类别分别为：存在物品和不存在物品，其中存在物品对应的是物品部分存在或完整存在于拍摄视野中的情况，不存在物品对应的是完全没有物品存在于拍摄视野中的情况。在训练过程中2个类别分别通过一批训练样本来进行训练得到2分类深度学习模型。在实际使用过程中，如果通过2分类深度学习模型预测拍摄视野中存在物品的概率大于一定的阈值，则认为拍摄视野中存在物品，否则认为拍摄视野中不存在物品。如果确定拍摄视野中不存在物品，则可以返回给用户一定的错误或提示信息，例如可以提示用户：没有检测到XX证件，请将相机对准您的XX证件。

可选地，在S102处，检测物品的图像的合规性还包括：检测物品是否为目标类物品。当检测到物品为目标类物品时，检测物品是否完整的呈现在拍摄视野中。也就是说，在S102中，可以直接检测物品是否完整的呈现在拍摄视野中，也可以先检测拍摄视野中是否存在所述物品，当确定拍摄视野中存在所述物品时，检测物品是否完整的呈现在拍摄视野中，还可以是先检测拍摄视野中是否存在所述物品，如果拍摄视野中存在所述物品，检测物品是否为目标类物品，如果检测到物品时目标类物品，则检测物品是否完整的呈现在拍摄视野中。

可选地，作为一个例子，采用基于深度学习的多分类算法来实现物品是否为目标物品的检测。以物品为证件为例，每一个类别即为一种证件，对应有一批以该证件为主体的训练图片样本。使用所有这些证件的图片样本(假设有N类证件)，并辅以一批不带任何证件的图片样本，来训练N+1分类深度学习模型。在实际使用时，通过N+1分类深度学习模型判断证件所属的类别，可以理解的是，在采用N+1分类深度学习模型预测证件所属的类别时，可能预测出一个证件属于每个类别的概率，将概率最大的类别确定为证件所属的类别。如果N+1分类深度学习模型预测证件属于每个类别的概率均低于一阈值，则认为拍摄视野中无证件。

进一步地，如果采用N+1分类深度学习模型预测出证件所属的类别不是目标类别，即证件不是目标类证件时，可以给予用户相应的提示，以目标类证件为身份证为例，如果检测到证件不是身份证，可以提示用户“检测到非身份证的其他证件，只能识别身份证，请将身份证放入拍摄视野中”。如果确定拍摄视野中无证件，则可以提示用户“没有检测到XX证件，请将相机对准您的XX证件”。可以理解的是，基于深度学习的多分类算法对物品的类别进行识别的结果与上述基于深度学习的2分类算法对物品的存在性的检查的结果有互补性，可以通过不同的模型降低对物品的存在性的识别的误识别率，提高用户体验。

可选地，在S102处，检测物品的图像的合规性包括：检测目标图像的质量是否满足预设质量要求，目标图像中包括所述物品的图像。可以理解的是，S102处的方案，在检测物品的图像的合规性时，可以只检测目标图像的质量是否满足预设质量要求，还可以先检测物品是否完整的呈现在拍摄视野中，若物品完整的呈现在拍摄视野中，则进一步检测目标图像的质量是否满足预设质量要求。

可选地，在一些实施例中，在确定目标图像的质量是否满足预设质量要求之前，还包括：确定物品的图像的姿态是否为目标姿态，若确定所述物品的图像的姿态不是所述目标姿态，将所述物品的图像的姿态矫正为所述目标姿态。具体确定物品的图像的姿态的方法以及矫正物品的图像的方法与上文中描述的方法相同，在此不再赘述。

可选地，在一些实施例中，确定目标图像的质量是否满足预设质量要求，包括：确定物品的图像的文字区域的清晰度；根据所述文字区域的清晰度和预设清晰度，确定目标图像的质量是否满足预设质量要求。例如，预设清晰度用预设清晰度分值表征，根据基于回归网络的深度学习模型，确定文字区域的清晰度分值。如果清晰度分值大于或等于预设清晰度分值，则确定目标图像的质量满足预设质量要求。若文字区域的清晰度分值小于预设清晰度分值，则采用光学识别符OCR算法识别文字区域上承载的信息，若不能成功识别文字区域上承载的信息，则确定目标图像的质量不满足预设质量要求。

进一步地，如果不能成功识别文字区域上承载的信息，则在S104处，辅助用户使所述物品的图像合规，包括：向用户展示第一信息，所述第一信息用于提示用户执行提高文字区域的清晰度的操作。相对应的，用户在看到第一信息时，可以调整拍摄时的焦距或者物品的放置位置等，使得物品的图像上的文字区域的清晰度满足要求。

可选地，以物品为证件为例，使用OCR算法定位到证件的图像上的文字区域，可能会产生多个文字区域，使用基于回归网络的深度学习模型来对各个文字区域的清晰度进行打分，如果某个文字区域的打分值低于一定阈值，则再用OCR算法对该区域进行识别，看是否能够获取到合理的结果，如果能够获取到合理的结果，则认为该文字区域的清晰度满足要求，如果不能获取到合理的结果，说明证件的图像不合规，则辅助用户使证件的图像合规，例如，返回给用户响应操作提示信息，该操作提示信息例如可以是“图像过于模糊，请保证图像清晰”。

可选地，在另一些实施例中，确定目标图像的质量是否满足预设质量要求，包括：确定物品的图像上的文字区域的曝光程度属于曝光过度的第一概率，或物品的图像上的文字区域的反光程度属于反光过度的第二概率；根据第一概率或第二概率，确定目标图像的质量是否满足预设质量要求。也就是说，确定目标图像的质量是否满足预设质量要求包括对目标图像进行曝光过度或强反光现象的检测。

具体地，在一些实施例中，根据基于二分类的深度学习模型，确定所述第一概率或所述第二概率。例如，先使用上文中描述的方法将物品的图像进行姿态矫正得到正面形态的物品，然后使用OCR算法定位到物品的图像上的文字区域，可能会产生多个文字区域。之后使用基于二分类的深度学习模型来预测各个文字区域属于曝光过度的第一概率或预测各个文字区域属于反光过度(或者说强反光)的第二概率，如果第一概率或第二概率小于一定的阈值，则说明文字区域的曝光程度不属于曝光过度或者反光程度不属于反光过度，进而说明目标图像的质量满足预设质量要求。如果第一概率或第二概率大于一定的阈值，则采用OCR算法识别文字区域上承载的信息，若不能成功识别文字区域上承载的信息，则确定目标图像的质量不满足预设质量要求。

进一步地，如果不能成功识别文字区域上承载的信息，则在S104处，辅助用户使所述物品的图像合规，包括：向用户展示第二信息，所述第二信息用于提示用户执行降低物品的图像的曝光程度或反光程度的操作。相对应的，用户在看到第二信息时，可以调整物品的放置位置，使得物品的图像上的文字区域的曝光程度或反光程度满足要求。

在上述所有实施例中，对物品的图像上的文字区域进行定位可以采用深度学习单次检测器(Single Shot MultiBox Detector，SSD)框架来实现，对文字区域上承载的信息进行识别可以采用基于长短期记忆网络(Long Short-Term Memory，LSTM)的整行文字识别框架来实现。但本申请实施例并不对文字区域定位方法和文字区域上承载的信息的识别算法进行限定。

图4是根据本申请一个具体实施例的辅助物品的图像合规的方法的示意性流程图，图4的方法200由辅助物品的图像合规的装置执行，图4中以物品为证件为例进行描述，仅仅是一种示例。如图4所示出的，在S202处，证件存在性检查。

可以采用在方法100中描述的2分类算法对证件存在性进行检查。

在S204处，若在S202中确认存在证件，则证件类型识别。

同样地，可以采用在方法100中描述的基于深度学习的多分类算法预测证件的类型。

在S206处，若在S204处识别证件的类型为目标类型，则进行证件完整性检查。

具体地，在进行证件完整性检查时，可以采用方法100中描述的采用图像模板的方法检查证件完整性，或者采用方法100中描述的通过证件角点的坐标位置检查证件的完整性。

在S208处，若在S206处确定证件的类型为目标类型，则进行证件姿态矫正。

可以理解的是，在S208中，所谓的证件姿态矫正实质是对证件的图像的姿态进行矫正，具体矫正的方法可以在确定出证件的4个角点的坐标位置之后，通过防射变换(Affine Transform)来将证件姿态矫正为正面横竖垂直状态。

在S210处，文字清晰度评估。

具体地，采用OCR算法定位到证件的图像上的至少一个文字区域，然后基于回归网络的深度学习模型来对文字区域的清晰度进行评估，具体评估的方法可参照方法100中的相关描述，在此不再赘述。

在S212处，曝光程度或反光程度检测。

具体地，可以给予二分类的深度学习模型来对各个文字区域的曝光程度或反光程度进行检测，具体检测的方法可参照方法100中的相关描述，在此不再赘述。

在S214处，文字行检测。

在S216处，文字行识别。

可选地，采用采用OCR识别算法检测证件的图像上的文字行以及对文字行中承载的信息进行识别。

在S218处，证件信息核验。

可以理解的是，在S218处的证件信息核验是将S216处识别出的信息将权威数据源进行比对，如果比对成功，可以说明证件的真实性。

可选地，在S218处，采用文字模糊匹配算法进行证件信息核验。

进一步地，如果在S218中证件信息核验成功可以提示用户核验成功，如果证件信息核验失败，则提示用户核验失败，证件不是真实的证件。

因此，方法200的方法，能够保证采集到的证件图像真实、完整、具有高的质量，能够为后续的身份认证提供良好的输入，为用户提供好的操作与产品体验。

以上结合图1至图4详细描述了根据本申请实施例的辅助物品的图像合规的方法。下面将结合图5详细描述根据本申请实施例的电子设备。参考图5，在硬件层面，电子设备包括处理器，可选地，包括内部总线、网络接口、存储器。其中，存储器可能包含内存，例如高速随机存取存储器(Random-Access Memory，RAM)，也可能还包括非易失性存储器(non-volatile memory)，例如至少1个磁盘存储器等。当然，该电子设备还可能包括其他业务所需要的硬件。

处理器、网络接口和存储器可以通过内部总线相互连接，该内部总线可以是工业标准体系结构(Industry Standard Architecture，ISA)总线、外设部件互连标准(Peripheral Component Interconnect，PCI)总线或扩展工业标准结构(Extended Industry Standard Architecture，EISA)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示，图5中仅用一个双向箭头表示，但并不表示仅有一根总线或一种类型的总线。

存储器，用于存放程序。具体地，程序可以包括程序代码，所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器，并向处理器提供指令和数据。

处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行，在逻辑层面上形成辅助物品的图像合规的装置。处理器，执行存储器所存放的程序，并具体用于执行以下操作：

检测物品的图像的合规性；

若检测到物品的图像不合规，辅助用户使所述物品的图像合规。

上述如本申请图1和图4所示实施例揭示的辅助物品的图像合规的装置执行的方法可以应用于处理器中，或者由处理器实现。处理器可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器，包括中央处理器(Central Processing Unit，CPU)、网络处理器(Network Processor，NP)等；还可以是数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field－Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器，处理器读取存储器中的信息，结合其硬件完成上述方法的步骤。

该电子设备还可执行图1和图4的方法，并实现辅助物品的图像合规的装置在图1和图4所示实施例的功能，本申请实施例在此不再赘述。

当然，除了软件实现方式之外，本申请的电子设备并不排除其他实现方式，比如逻辑器件抑或软硬件结合的方式等等，也就是说以下处理流程的执行主体并不限定于各个逻辑单元，也可以是硬件或逻辑器件。

本申请实施例还提出了一种计算机可读存储介质，该计算机可读存储介质存储一个或多个程序，该一个或多个程序包括指令，该指令当被包括多个应用程序的电子设备执行时，能够使该电子设备执行图1和图4所示实施例的方法，并具体用于执行以下方法：

检测物品的图像的合规性；

若检测到物品的图像不合规，辅助用户使所述物品的图像合规。

图6是本申请的一个实施例的辅助物品的图像合规的装置的结构示意图。请参考图6，在一种软件实施方式中，辅助物品的图像合规的装置600可包括：第一处理单元601和第二处理单元602，其中，

第一处理单元601，检测物品的图像的合规性；

第二处理单元602，若检测到物品的图像不合规，辅助用户使所述物品的图像合规。

根据本申请实施例的辅助物品的图像合规的装置，检测物品的图像的合规性，并在检测到物品的图像不合规时，辅助用户使物品的图像合规，能够避免不合规的图像导致的识别准确率低、用户身份认证成功率低和用户体验差的问题。

可选地，作为一个实施例，所述第一处理单元601：

检测所述物品是否完整的呈现在拍摄视野中。

可选地，作为一个实施例，所述第一处理单元601：

检测目标图像的质量是否满足预设质量要求，所述目标图像中包括所述物品的图像。

可选地，作为一个实施例，所述第一处理单元601：

检测所述拍摄视野中是否存在所述物品；

若检测到所述拍摄视野中存在所述物品，则检测所述物品是否完整的呈现在拍摄视野中。

可选地，作为一个实施例，所述第一处理单元601：

检测所述物品是否为目标类物品；

若确定所述物品为目标类物品，则检测所述物品是否完整的呈现在所述拍摄视野中。

可选地，作为一个实施例，所述第一处理单元601：

检测所述物品的图像是否在图像模板对应的区域内；

若检测到所述物品的图像在所述图像模板对应的区域内，则确定所述物品完整的呈现在所述拍摄视野中。

可选地，作为一个实施例，所述第一处理单元601：

确定所述物品的长边与短边的比率；

若确定所述比率为预设比率，且所述物品的角点与所述目标图像的边缘的距离大于或等于预设距离，则确定所述物品完整的呈现在所述拍摄视野中。

可选地，作为一个实施例，所述第一处理单元601：

确定所述物品的角点的坐标位置；

根据所述物品的角点的位置坐标，确定所述物品的长边与短边的比率。

可选地，作为一个实施例，在所述确定目标图像的质量是否满足预设质量要求之前，所述第一处理单元601：

确定所述物品的图像的姿态是否为目标姿态；

若确定所述物品的图像的姿态不是所述目标姿态，将所述物品的图像的姿态矫正为所述目标姿态。

可选地，作为一个实施例，所述第一处理单元601：

确定所述物品的图像的文字区域的清晰度；

根据所述文字区域的清晰度和预设清晰度，确定所述目标图像的质量是否满足预设质量要求。

可选地，作为一个实施例，所述预设清晰度用预设清晰度分值表征；

其中，所述第一处理单元601：

根据基于回归网络的深度学习模型，确定所述文字区域的清晰度分值。

可选地，作为一个实施例，所述第一处理单元601：

若所述清晰度分值小于所述预设清晰度分值，则采用光学字符识别OCR算法识别所述文字区域上承载的信息；

若不能成功识别所述文字区域上承载的信息，则确定所述目标图像的质量不满足预设质量要求。

可选地，作为一个实施例，所述第二处理单元602：

向用户展示第一信息，所述第一信息用于提示用户执行提高所述文字区域的清晰度的操作。

可选地，作为一个实施例，所述第一处理单元601：

确定所述物品的图像上的文字区域的曝光程度属于曝光过度的第一概率，或所述物品的图像上的文字区域的反光程度属于反光过度的第二概率；

根据第一概率或所述第二概率，确定所述目标图像的质量是否满足预设质量要求。

可选地，作为一个实施例，所述第一处理单元601：

根据基于二分类的深度学习模型，确定所述第一概率或所述第二概率。

可选地，作为一个实施例，所述第一处理单元601：

若所述第一概率或所述第二概率大于预设概率，则采用OCR算法识别所述文字区域上承载的信息；

若不能成功识别所述文字区域上承载的信息，则确定所述目标图像的质量不满足预设质量要求。

可选地，作为一个实施例，所述第二处理单元602：

向用户展示第二信息，所述第二信息用于提示用户执行降低所述物品的图像的曝光程度或反光程度的操作。

可选地，作为一个实施例，所述第一处理单元601：

采用OCR算法确定所述文字区域。

可选地，作为一个实施例，所述第一处理单元601：

若检测到所述物品的图像合规，则获取所述物品的图像上承载的信息；

将所述物品的图像上承载的信息与目标数据源中的信息进行比对；

根据比对的结果，确定所述物品的真实性。

可选地，作为一个实施例，所述物品为证件。

辅助物品的图像合规的装置600还可执行图1和图4所示实施例的方法，并实现辅助物品的图像合规的装置在图1和图4所示实施例的功能，本申请实施例在此不再赘述。

总之，以上所述仅为本申请的较佳实施例而已，并非用于限定本申请的保护范围。凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

上述实施例阐明的系统、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的，计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：徐崴;郑丹丹;李亮
技术所有人：阿里巴巴集团控股有限公司
我是此专利的发明人

上一篇：一种版面分析中的字符切分方法及其装置与流程
上一篇：静态手势识别方法、装置及可读存储介质与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。