图像处理方法以及装置、设备、存储介质与流程

文档序号：19741475发布日期：2020-01-18 05:17阅读：163来源：国知局

导航： X技术> 最新专利>计算;推算;计数设备的制造及其应用技术

本申请涉及图像处理领域，具体而言，涉及一种图像处理方法以及装置、设备、存储介质。

背景技术：

线上业务审核时，用户提供的身份证照片有效性检测成为业务线上化的一个重要环节。

发明人发现，针对用户上传身份证照片中身份证是否完整的检测缺少对于身份证缺边检测，进一步由于特征位于照片边缘部分，与正常照片并无明显特征，给目标图像处理造成了困难。

针对相关技术中对于身份证信息完整性的图像处理效果不佳的问题，目前尚未提出有效的解决方案。

技术实现要素：

本申请的主要目的在于提供一种图像处理方法以及装置、设备、存储介质，以解决对于身份证信息完整性的图像处理效果不佳的问题。

为了实现上述目的，根据本申请的一个方面，提供了一种图像处理方法，用于检测图像信息是否完整。

根据本申请的图像处理方法包括：输入待处理图片到神经网络模型；根据所述神经网络模型，输出图片信息是否完成的检测结果；在训练所述神经网络模型时还包括用于增加所述神经网络模型的泛化能力的步骤：在处理训练集中的图片时使用加速神经网络训练方式；在图像增强阶段，使用非平移或者非旋转的处理方式。

进一步地，在处理训练集中的图片时使用加速神经网络训练方式包括：

基于预设卷积神经网络，设置所述batchnorm算法模型的超参选择，并采用batchnorm算法模型在已打标的数据集上进行训练。

进一步地，在图像增强阶段，使用非平移或者非旋转的处理方式包括：

在图像增强阶段，使用非左右平移的处理方式进行图片增强处理。

进一步地，在图像增强阶段，使用非平移或者非旋转的处理方式包括：

在图像增强阶段，非旋转的处理方式进行图片增强处理。

进一步地，所述用于检测图像信息是否完整包括：检测身份证的图像信息是否完整，

输入待处理图片到神经网络模型，包括：

输入待处理身份证的图片到神经网络模型，

根据所述神经网络模型，输出图片信息是否完成的检测结果，包括：

根据所述神经网络模型，输出身份证图片是否缺边检测的检测结果。

为了实现上述目的，根据本申请的另一方面，提供了一种图像处理装置，用于检测图像信息是否完整。

根据本申请的图像处理装置包括：输入模块，用于输入待处理图片到神经网络模型；输出模块，用于根据所述神经网络模型，输出图片信息是否完成的检测结果；还包括：优化模块，用于在训练所述神经网络模型时还包括用于增加所述神经网络模型的泛化能力的步骤：在处理训练集中的图片时使用加速神经网络训练方式；在图像增强阶段，使用非平移或者非旋转的处理方式。

进一步地，所述优化模块，用于

基于预设卷积神经网络，设置所述batchnorm算法模型的超参选择，并采用batchnorm算法模型在已打标的数据集上进行训练。

进一步地，所述优化模块，用于

在图像增强阶段，使用非左右平移的处理方式进行图片增强处理。

在图像增强阶段，非旋转的处理方式进行图片增强处理。

为了实现上述目的，根据本申请的又一方面，提供了一种电子设备。

根据本申请的电子设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现所述的图像处理方法的步骤。

为了实现上述目的，根据本申请的再一方面，提供了一种计算机可读存储介质。

根据本申请的计算机可读存储介质包括，其上存储有计算机程序该计算机程序被处理器执行时实现所述的图像处理方法的步骤。

在本申请实施例中图像处理方法以及装置、设备、存储介质，采用输入待处理图片到神经网络模型的方式，根据所述神经网络模型，输出图片信息是否完成的检测结果，通过在处理训练集中的图片时使用加速神经网络训练方式；在图像增强阶段，使用非平移或者非旋转的处理方式，达到了针对身份证进行缺边检测的特殊场景的目的，从而实现了在线上业务审核时更优的识别效果的技术效果，进而解决了对于身份证信息完整性的图像处理效果不佳的技术问题。

附图说明

构成本申请的一部分的附图用来提供对本申请的进一步理解，使得本申请的其它特征、目的和优点变得更明显。本申请的示意性实施例附图及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1是根据本申请实施例的图像处理方法流程示意图；

图2是根据本申请实施例的图像处理装置结构示意图；

图3是根据本申请实施例的电子设备结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分的实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本申请保护的范围。

需要说明的是，本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

在本申请中，术语“上”、“下”、“左”、“右”、“前”、“后”、“顶”、“底”、“内”、“外”、“中”、“竖直”、“水平”、“横向”、“纵向”等指示的方位或位置关系为基于附图所示的方位或位置关系。这些术语主要是为了更好地描述本申请及其实施例，并非用于限定所指示的装置、元件或组成部分必须具有特定方位，或以特定方位进行构造和操作。

并且，上述部分术语除了可以用于表示方位或位置关系以外，还可能用于表示其他含义，例如术语“上”在某些情况下也可能用于表示某种依附关系或连接关系。对于本领域普通技术人员而言，可以根据具体情况理解这些术语在本申请中的具体含义。

此外，术语“安装”、“设置”、“设有”、“连接”、“相连”、“套接”应做广义理解。例如，可以是固定连接，可拆卸连接，或整体式构造；可以是机械连接，或电连接；可以是直接相连，或者是通过中间媒介间接相连，又或者是两个装置、元件或组成部分之间内部的连通。对于本领域普通技术人员而言，可以根据具体情况理解上述术语在本申请中的具体含义。

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

如图1所示，该方法包括如下的步骤s101至步骤s105：

步骤s101，输入待处理图片到神经网络模型；

所述神经网络模型使用了标准的卷积神经网络，针对用户上传身份证照片中身份证是否完整进行检测。

步骤s102，根据所述神经网络模型，输出图片信息是否完成的检测结果；

根据所述神经网络模型，对身份证缺边检测关注于身份证边缘的截断特征，与完整身份证相比，特征位于照片边缘部分。故在训练时需要针对照片特征进行精细调参，能达到更佳的身份证缺边检测效果。

步骤s103，在训练所述神经网络模型时还包括用于增加所述神经网络模型的泛化能力的步骤；

用于增加所述神经网络模型的泛化能力是指机器学习算法对训练样本的适应能力。泛化能力作为评价神经网络模型的指标。

步骤s104，在处理训练集中的图片时使用加速神经网络训练方式；

在处理所述训练集中的图片时使用加速神经网络训练方式，能够较好地适用于针对身份证缺边检测场景。

具体地，如果使用batchnorm技术，而非常用的dropout来达到增加模型泛化能力的效果。

步骤s105，在图像增强阶段，使用非平移或者非旋转的处理方式。

在对待处理图片进行图像增强阶段处理时，使用非平移或者非旋转的处理方式。由于在图像增强阶段常用的左右平移及旋转图片的方法并不适用于身份证缺边检测的场景，因为完整的身份证照片在平移或旋转后，可能会变为缺边样本。故在图像增强阶段使用非平移或者非旋转的处理方式。

从以上的描述中，可以看出，本申请实现了如下技术效果：

在本申请实施例中，采用输入待处理图片到神经网络模型的方式，根据所述神经网络模型，输出图片信息是否完成的检测结果，通过在处理训练集中的图片时使用加速神经网络训练方式；在图像增强阶段，使用非平移或者非旋转的处理方式，达到了针对身份证进行缺边检测的特殊场景的目的，从而实现了在线上业务审核时更优的识别效果的技术效果，进而解决了对于身份证信息完整性的图像处理效果不佳的技术问题。

根据本申请实施例，作为本实施例中的优选，在处理训练集中的图片时使用加速神经网络训练方式包括：

基于预设卷积神经网络，设置所述batchnorm算法模型的超参选择，并采用batchnorm算法模型在已打标的数据集上进行训练。

具体地，在batchnorm的超参选择上，过大的epsilon会引起梯度消失的现象。优选地，batchnorm算法模型使用的epsilon为0.00001。

根据本申请实施例，作为本实施例中的优选，在图像增强阶段，使用非平移或者非旋转的处理方式包括：在图像增强阶段，使用非左右平移的处理方式进行图片增强处理。

在图像增强阶段，使用非左右平移的处理方式进行图片增强处理。

本领域技术人员可以明了，可以使用非左右平移的处理方式进行图片增强处理。

具体地，考虑到图像增强也是比较常用的增加训练数据的方式，但是常用的左右平移及旋转图片的方法并不适用于身份证缺边检测的场景，因为完整的身份证照片在平移或旋转后，可能会变为缺边样本。所以训练时，不使用左右平移及旋转的技术来做图片增强。

根据本申请实施例，作为本实施例中的优选，在图像增强阶段，使用非平移或者非旋转的处理方式包括：在图像增强阶段，非旋转的处理方式进行图片增强处理。

在图像增强阶段，采用非旋转的处理方式进行图片增强处理。

本领域技术人员可以明了，可以使用非左右平移的处理方式进行图片增强处理。

根据本申请实施例，作为本实施例中的优选，所述用于检测图像信息是否完整包括：检测身份证的图像信息是否完整，

输入待处理图片到神经网络模型，包括：

输入待处理身份证的图片到神经网络模型；

根据所述神经网络模型，输出图片信息是否完成的检测结果，包括：

根据所述神经网络模型，输出身份证图片是否缺边检测的检测结果。

使用了标准的神经网络，检测身份证的图像信息是否完整，输入待处理身份证的图片到神经网络模型；根据所述神经网络模型，输出身份证图片是否缺边检测的检测结果。

并且针对身份证缺边检测场景使用batchnorm来处理图片，放弃使用dropout以及在图像增强阶段，放弃使用平移及旋转的优化方式。

需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

根据本申请实施例，还提供了一种用于实施上述方法的图像处理装置，如图2所示，该装置包括：输入模块10，用于输入待处理图片到神经网络模型；输出模块13，用于根据所述神经网络模型，输出图片信息是否完成的检测结果；还包括：优化模块12，用于在训练所述神经网络模型时还包括用于增加所述神经网络模型的泛化能力的步骤：在处理训练集中的图片时使用加速神经网络训练方式；在图像增强阶段，使用非平移或者非旋转的处理方式。

本申请实施例的输入模块10中所述神经网络模型使用了标准的卷积神经网络，针对用户上传身份证照片中身份证是否完整进行检测。

本申请实施例的输出模块13中根据所述神经网络模型，对身份证缺边检测关注于身份证边缘的截断特征，与完整身份证相比，特征位于照片边缘部分。故在训练时需要针对照片特征进行精细调参，能达到更佳的身份证缺边检测效果。

本申请实施例的优化模块12中用于增加所述神经网络模型的泛化能力是指机器学习算法对训练样本的适应能力。泛化能力作为评价神经网络模型的指标。

本申请实施例的优化模块12中在处理所述训练集中的图片时使用加速神经网络训练方式，能够较好地适用于针对身份证缺边检测场景。

具体地，如果使用batchnorm技术，而非常用的dropout来达到增加模型泛化能力的效果。

本申请实施例的优化模块12中在对待处理图片进行图像增强阶段处理时，使用非平移或者非旋转的处理方式。由于在图像增强阶段常用的左右平移及旋转图片的方法并不适用于身份证缺边检测的场景，因为完整的身份证照片在平移或旋转后，可能会变为缺边样本。故在图像增强阶段使用非平移或者非旋转的处理方式。

根据本申请实施例，作为本实施例中的优选，如图2所示，所述优化模块，用于基于预设卷积神经网络，设置所述batchnorm算法模型的超参选择，并采用batchnorm算法模型在已打标的数据集上进行训练。

具体地，在batchnorm的超参选择上，过大的epsilon会引起梯度消失的现象。优选地，batchnorm算法模型使用的epsilon为0.00001。

根据本申请实施例，作为本实施例中的优选，如图2所示，所述优化模块，用于在图像增强阶段，使用非左右平移的处理方式进行图片增强处理。

在图像增强阶段，使用非左右平移的处理方式进行图片增强处理。

本领域技术人员可以明了，可以使用非左右平移的处理方式进行图片增强处理。

根据本申请实施例，作为本实施例中的优选，如图2所示，在图像增强阶段，非旋转的处理方式进行图片增强处理。

在图像增强阶段，采用非旋转的处理方式进行图片增强处理。

本领域技术人员可以明了，可以使用非左右平移的处理方式进行图片增强处理。

本申请实施例还提供了一种计算机设备。如图3所示，计算机设备30可以包括：至少一个处理器301，例如cpu，至少一个网络接口304，用户接口303，存储器305，至少一个通信总线302，可选地，还可以包括显示屏306。其中，通信总线302用于实现这些组件之间的连接通信。其中，用户接口303可以包括触摸屏、键盘或鼠标等等。网络接口304可选的可以包括标准的有线接口、无线接口(如wi-fi接口)，通过网络接口304可以与服务器建立通信连接。存储器305可以是高速ram存储器，也可以是非不稳定的存储器(non-volatilememory)，例如至少一个磁盘存储器，存储器305包括本发明实施例中的flash。存储器305可选的还可以是至少一个位于远离前述处理器301的存储系统。如图3所示，作为一种计算机存储介质的存储器305中可以包括操作系统、网络通信模块、用户接口模块以及程序指令。

需要说明的是，网络接口304可以连接接收器、发射器或其他通信模块，其他通信模块可以包括但不限于wifi模块、蓝牙模块等，可以理解，本发明实施例中计算机设备也可以包括接收器、发射器和其他通信模块等。

处理器301可以用于调用存储器305中存储的程序指令，并使计算机设备30执行以下操作：

输入待处理图片到神经网络模型；

根据所述神经网络模型，输出图片信息是否完成的检测结果；

在训练所述神经网络模型时还包括用于增加所述神经网络模型的泛化能力的步骤：

在处理训练集中的图片时使用加速神经网络训练方式；

在图像增强阶段，使用非平移或者非旋转的处理方式。

显然，本领域的技术人员应该明白，上述的本申请的各模块或各步骤可以用通用的计算装置来实现，它们可以集中在单个的计算装置上，或者分布在多个计算装置所组成的网络上，可选地，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样，本申请不限制于任何特定的硬件和软件结合。

以上所述仅为本申请的优选实施例而已，并不用于限制本申请，对于本领域的技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：不公告发明人
技术所有人：上海数禾信息科技有限公司
我是此专利的发明人

上一篇：基于压缩感知及Renyi熵的水下信息抗干扰方法与流程
上一篇：一种激光振镜偏移的校正方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。