图片自动分类方法、装置及计算机可读存储介质与流程

文档序号：17465960发布日期：2019-04-20 05:30阅读：183来源：国知局

本发明涉及图像识别领域，尤其涉及一种图片自动分类方法、装置及计算机可读存储介质。

背景技术：

目前很多事务办理(例如保险)都可以通过网络处理，客户直接使用输入终端打开操作界面将需要的信息及图片资料(通常的图片包括身份证、户口本、驾照、出生证等)上传，接收终端接收到信息及图片资料后，势必需要对所述图片进行标注分类。目前的操作方式是安排质控员在接收终端前对所述图片资料进行标注分类，这种方式势必影响工作效率。另外由于人工处理耗时，拉长了事务处理进度，这样势必影响客户的体验。

技术实现要素：

本发明提供一种图片自动分类方法、装置及计算机可读存储介质，其主要目的在于提高图片标注的效率。

为实现上述目的，本发明提供一种图片自动分类方法，应用于电子装置中，所述方法包括：

为每一个预设图片类别准备预设数量的标注有对应的图片类别的图片样本；

将每一个预设图片类别对应的图片样本分为第一比例的训练子集和第二比例的验证子集，将各个训练子集中的图片样本进行混合以得到训练集，并将各个验证子集中的图片样本进行混合以得到验证集；

通过所述训练集训练神经网络图片识别模型；

通过所述验证集验证训练的所述神经网络图片识别模型的准确率，当准确率大于或者等于预设阈值时，训练结束；

接收由用户终端输入的当前图片；

利用训练好的神经网络图片识别模型对所述当前图片进行类别识别及标注，并存储识别结果及标注结果至数据库；

接收针对一图片类别的查询指令，根据所述查询指令在所述数据库中查找图片资料并显示找到的图片资料。

可选地，所述方法还包括：当准确率小于所述预设阈值，增加每一个预设图片类别对应的证件图片样本的数量，再重新将每一预设图片类别更新后的图片样本分为新的训练子集及验证子集。

可选地，所述接收由用户终端输入的当前图片的步骤包括：

显示用户输入界面；

接收由用户输入的所述图片信息；及

接收由用户上传的所述图片资料。

可选地，所述通过所述训练集训练神经网络图片识别模型的步骤包括：

构建神经网络图片识别模型，所述神经网络图片识别模型为alexnet神经网络，所述神经网络图片识别模型包括5个卷积层及3个全连接层，最后一个全连接层的输出是具有1000个输出的输出层，在每一个卷积层以及全连接层后紧跟的操作是激活操作，卷积层卷积操作公式为：

其中l表示第l层，j表示卷积层的第j个核，m表示卷积核所在区域，k表示卷积核，b表示偏置，x表示特征图对应位置的值，f表示激活函数，i、j、l为自然数；

将所述训练集代入所述神经网络图片识别模型进行训练。

可选地，所述全连接层表达式为：

y^j＝f(xⁱ)＝b^j+σiw^ij.x^j

其中y^j是一个输出向量中的第j个神经元，xⁱ是输入向量中的第i个神经元，w是一个全连层中的权重参数。

本发明还提供一种电子装置，所述电子装置包括存储器和处理器，所述存储器上存储有可在所述处理器上运行的图片自动分类程序，所述图片自动分类程序被所述处理器执行时实现如下步骤：

为每一个预设图片类别准备预设数量的标注有对应的图片类别的图片样本；

通过所述训练集训练神经网络图片识别模型；

通过所述验证集验证训练的所述神经网络图片识别模型的准确率，当准确率大于或者等于预设阈值时，训练结束；

接收由用户终端输入的当前图片；

利用训练好的神经网络图片识别模型对所述当前图片进行类别识别及标注，并存储识别结果及标注结果至数据库；

接收针对一图片类别的查询指令，根据所述查询指令在所述数据库中查找图片资料并显示找到的图片资料。

可选地，所述图片自动分类程序被所述处理器执行时还实现如下步骤：当准确率小于所述预设阈值，增加每一个预设图片类别对应的证件图片样本的数量，再重新将每一预设图片类别更新后的图片样本分为新的训练子集及验证子集。

可选地，所述接收由用户终端输入的当前图片的步骤包括：

显示用户输入界面；

接收由用户输入的所述图片信息；及

接收由用户上传的所述图片资料。

可选地，所述通过所述训练集训练神经网络图片识别模型的步骤包括：

将所述训练集代入所述神经网络图片识别模型进行训练。

此外，为实现上述目的，本发明还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有图片自动分类程序，所述图片自动分类程序可被一个或者多个处理器执行，以实现上述的图片自动分类方法的步骤。

本发明提供的图片自动分类方法、装置及计算机可读存储介质通过训练神经网络图片识别模型并利用训练好的神经网络图片识别模型来识别及标注图片，从而提升图片标注的效率。

附图说明

图1为本发明一实施例提供的图片自动分类方法的流程示意图；

图2为本发明一实施例提供的电子装置的内部结构示意图；

图3为本发明一实施例提供的图片自动分类方法利用到的alexnet神经网络的结构示意图；

图4为本发明一实施例提供的电子装置中图片自动分类程序的模块示意图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

本发明提供一种图片自动分类方法。参照图1所示，为本发明一实施例提供的图片自动分类方法的流程示意图。该方法可以由一个装置执行，该装置可以由软件和/或硬件实现。

在本实施例中，图片自动分类方法包括：

s101，为每一个预设图片类别准备预设数量的标注有对应的图片类别的图片样本；例如，预设图片类别包括身份证、居住证、户口本、驾照、出生证等，预设数量为1000张；

s102，将每一个预设图片类别对应的图片样本分为第一比例的训练子集和第二比例的验证子集，将各个训练子集中的图片样本进行混合以得到训练集，并将各个验证子集中的图片样本进行混合以得到验证集；例如第一比例为80％，第二比例为20％；

s103，通过所述训练集训练神经网络图片识别模型；

s104，通过所述验证集验证训练的所述神经网络图片识别模型的准确率，当准确率大于或者等于预设阈值时，训练结束；

s105，接收由用户终端输入的当前图片；例如当前图片为身份证的正反面扫描件；

s106，利用训练好的神经网络图片识别模型对所述当前图片进行类别识别及标注，并存储识别结果及标注结果至数据库；

s107，接收针对一图片类别的查询指令，根据所述查询指令在所述数据库中查找图片资料并显示找到的图片资料；例如查询指令针对的是身份证类别的，找到所述身份证类别的资料并显示，以方便质控员审查。

进一步地，所述方法还包括：当准确率小于所述预设阈值，增加每一个预设图片类别对应的证件图片样本的数量，再重新将每一预设图片类别更新后的图片样本分为新的训练子集及验证子集。

进一步地，所述步骤s103包括：

将所述训练集代入所述神经网络图片识别模型进行训练。

所述alexnet神经网络的架构示意图如图3所示，包含5个卷积层及3个全连接层。

进一步地，所述步骤s105包括：

显示用户输入界面；

接收由用户输入的所述图片信息；及

接收由用户上传的所述图片资料。

例如在用户输入界面上，用户输入身份证的信息：身份证号及名字，并上传身份证的正反面扫描件。

进一步地，所述全连接层表达式为：

y^j＝f(xⁱ)＝b^j+σjw^ij.x^j

其中y^j是一个输出向量中的第j个神经元，xⁱ是输入向量中的第i个神经元，w是一个全连层中的权重参数。

本实施例提出的图片自动分类方法通过训练神经网络图片识别模型并利用训练好的神经网络图片识别模型来识别及标注图片，从而提升图片标注的效率。

本发明还提供一种电子装置1。参照图2所示，为本发明一实施例提供的电子装置的内部结构示意图。

在本实施例中，电子装置1可以是电脑或服务器。所述电子装置1至少包括存储器11、处理器13，通信总线15，以及网络接口17。

其中，存储器11至少包括一种类型的可读存储介质，所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如，sd或dx存储器等)、磁性存储器、磁盘、光盘等。存储器11在一些实施例中可以是电子装置的内部存储单元，例如所述电子装置的硬盘。存储器11在另一些实施例中也可以是电子装置的外部存储设备，例如电子装置上配备的插接式硬盘，智能存储卡(smartmediacard,smc)，安全数字(securedigital,sd)卡，闪存卡(flashcard)等。进一步地，存储器11还可以既包括电子装置的内部存储单元也包括外部存储设备。存储器11不仅可以用于存储安装于电子装置1的应用软件及各类数据，例如图片自动分类程序111的代码等，还可以用于暂时地存储已经输出或者将要输出的数据。

处理器13在一些实施例中可以是一中央处理器(centralprocessingunit,cpu)、控制器、微控制器、微处理器或其他数据处理芯片，用于运行存储器11中存储的程序代码或处理数据。

通信总线15用于实现这些组件之间的连接通信。

网络接口17可选的可以包括标准的有线接口、无线接口(如wi-fi接口)，通常用于在电子装置1与其他电子设备之间建立通信连接。

可选地，电子装置1还可以包括用户接口，用户接口可以包括显示器(display)、输入单元比如键盘(keyboard)，可选的用户接口还可以包括标准的有线接口、无线接口。可选地，在一些实施例中，显示器可以是led显示器、液晶显示器、触控式液晶显示器以及oled(organiclight-emittingdiode，有机发光二极管)触摸器等。其中，显示器也可以适当的称为显示屏或显示单元，用于显示在电子装置中处理的信息以及用于显示可视化的用户界面。

图2仅示出了具有组件11～17的电子装置1，本领域技术人员可以理解的是，图2示出的结构并不构成对电子装置的限定，可以包括比图示更少或者更多的部件，或者组合某些部件，或者不同的部件布置。

在图2所示的电子装置1的实施例中，存储器11中存储有图片自动分类程序；处理器13执行存储器11中存储的电子装置时实现如下步骤：

为每一个预设图片类别准备预设数量的标注有对应的图片类别的图片样本；例如，预设图片类别包括身份证、居住证、户口本、驾照、出生证等，预设数量为1000张；

将每一个预设图片类别对应的图片样本分为第一比例的训练子集和第二比例的验证子集，将各个训练子集中的图片样本进行混合以得到训练集，并将各个验证子集中的图片样本进行混合以得到验证集；例如第一比例为80％，第二比例为20％；

通过所述训练集训练神经网络图片识别模型；

通过所述验证集验证训练的所述神经网络图片识别模型的准确率，当准确率大于或者等于预设阈值时，训练结束；

接收由用户终端输入的当前图片；例如当前图片为身份证的正反面扫描件；

利用训练好的神经网络图片识别模型对所述当前图片进行类别识别及标注，并存储识别结果及标注结果至数据库；

接收针对一图片类别的查询指令，根据所述查询指令在所述数据库中查找图片资料并显示找到的图片资料；例如查询指令针对的是身份证类别的，找到所述身份证类别的资料并显示，以方便质控员审查。

进一步地，所述图片自动分类程序被所述处理器执行时还实现如下步骤：当准确率小于所述预设阈值，增加每一个预设图片类别对应的证件图片样本的数量，再重新将每一预设图片类别更新后的图片样本分为新的训练子集及验证子集。

进一步地，所述通过所述训练集训练神经网络图片识别模型的步骤包括：

将所述训练集代入所述神经网络图片识别模型进行训练。

所述alexnet神经网络的架构示意图如图3所示，包含5个卷积层及3个全连接层。

进一步地，所述接收由用户终端输入的当前图片的步骤包括：

显示用户输入界面；

接收由用户输入的所述图片信息；及

接收由用户上传的所述图片资料。

例如在用户输入界面上，用户输入身份证的信息：身份证号及名字，并上传身份证的正反面扫描件。

进一步地，所述图片自动分类程序被所述处理器执行时还实现如下步骤：所述全连接层表达式为：

y^j＝f(xⁱ)＝b^j+σiw^ij.x^j

其中y^j是一个输出向量中的第j个神经元，xⁱ是输入向量中的第i个神经元，w是一个全连层中的权重参数。

本实施例提出的电子装置通过训练神经网络图片识别模型并利用训练好的神经网络图片识别模型来识别及标注图片，从而提升图片标注的效率。

此外，本发明实施例还提出一种计算机可读存储介质，所述计算机可读存储介质上存储有的图片自动分类程序，所述图片自动分类程序可被一个或多个处理器执行，以实现如下操作：

通过所述训练集训练神经网络图片识别模型；

通过所述验证集验证训练的所述神经网络图片识别模型的准确率，当准确率大于或者等于预设阈值时，训练结束；

接收由用户终端输入的当前图片；例如当前图片为身份证的正反面扫描件；

利用训练好的神经网络图片识别模型对所述当前图片进行类别识别及标注，并存储识别结果及标注结果至数据库；

本发明计算机可读存储介质具体实施方式与上述电子装置和方法各实施例基本相同，在此不作累述。

可选地，在其他实施例中，图片自动分类程序还可以被分割为一个或者多个模块，一个或者多个模块被存储于存储器11中，并由一个或多个处理器(本实施例为处理器13)所执行以完成本发明，本发明所称的模块是指能够完成特定功能的一系列计算机程序指令段，用于描述图片自动分类程序在电子装置中的执行过程。

例如，参照图4所示，为本发明电子装置一实施例中的图片自动分类程序的程序模块示意图，该实施例中，图片自动分类程序可以被分割为准备模块10、划分模块20、训练模块30、验证模块40、接收模块50、识别模块60及查找模块70，示例性地：

所述准备模块10用于：为每一个预设图片类别准备预设数量的标注有对应的图片类别的图片样本；例如，预设图片类别包括身份证、居住证、户口本、驾照、出生证等，预设数量为1000张；

所述划分模块20用于：将每一个预设图片类别对应的图片样本分为第一比例的训练子集和第二比例的验证子集，将各个训练子集中的图片样本进行混合以得到训练集，并将各个验证子集中的图片样本进行混合以得到验证集；例如第一比例为80％，第二比例为20％；

所述训练模块30用于：通过所述训练集训练神经网络图片识别模型；

所述验证模块40用于：通过所述验证集验证训练的所述神经网络图片识别模型的准确率，当准确率大于或者等于预设阈值时，训练结束；

所述接收模块50用于：接收由用户终端输入的当前图片；例如当前图片为身份证的正反面扫描件；

所述识别模块60用于：利用训练好的神经网络图片识别模型对所述当前图片进行类别识别及标注，并存储识别结果及标注结果至数据库；

所述查找模块70用于：接收针对一图片类别的查询指令，根据所述查询指令在所述数据库中查找图片资料并显示找到的图片资料；例如查询指令针对的是身份证类别的，找到所述身份证类别的资料并显示，以方便质控员审查。

上述准备模块10、划分模块20、训练模块30、验证模块40、接收模块50、识别模块60及查找模块70等程序模块被执行时所实现的功能或操作步骤与上述实施例大体相同，在此不再赘述。

需要说明的是，上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。并且本文中的术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上所述的一个存储介质(如rom/ram、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：肖玉宾;杨将
技术所有人：平安科技（深圳）有限公司
我是此专利的发明人

上一篇：一种蔬菜嫁接切削装置的制作方法
上一篇：一种手套漏气检测装置及其工作方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。