一种图像分类方法、装置、电子设备及存储介质与流程

文档序号:16136772发布日期:2018-12-01 01:05阅读:144来源:国知局

本发明涉及图像处理技术领域,特别是涉及一种图像分类方法、装置、电子设备及存储介质。

背景技术

随着互联网技术和多媒体技术的不断发展,视频和图像由于具有直观和信息量丰富等优点,不仅在数量上急剧增加,同时在种类上也层出不穷,然而,与此同时,图像内容中可能会夹杂着各种色情敏感内容,严重危害人们(特别是未成年人)的身心健康。

因此,需要对图像进行分类管理,以阻止违规图像的传播。目前,随着卷积神经网络技术的不断发展,其在图像分类过程中也已被广泛使用,基于卷积神经网络的图像分类方法,包括:将图像样本输入经过初步训练得到的卷积神经网络模型中,得到分类结果;然后将该分类结果与图像样本实际的类别进行对比,当两者差别较大时,则调整上述网络模型中的参数,直至分类结果逼近图像样本实际的类别或者分类结果与图像样本实际的类别完全相同,得到最终检测模型;利用最终检测模型对待测的图像进行分类检测。

由于违规图像一旦传播,便会造成非常恶劣的影响,因此,在图像分类管理的实际工作中,评价分类方法性能高低的一个重要指标即为:将实际属于违规图像的待检测图像检测为违规图像(正确分类)的能力。采用上述方法进行图像分类检测,可以保证图像样本中被正确分类的样本数量满足一定要求,但是对于违规的待检测图形的检测正确性则无法保证,例如:对于总数量为100的图像样本集(实际属于违规图像的图像样本为40个;实际属于正常图像的图像样本为60个),通过上述方法,可以保证被正确分类的样本数量满足预设的指标(例如:预设指标为80个,即正确度为80%),但在正确分类的样本中,可能有60个为实际属于正常图像的样本,而只有20个为实际属于违规图像的样本,此时,对实际属于违规图像的样本分类的正确度只有50%,即对违规图像的检出率较低,检测出违规图像的能力较弱。



技术实现要素:

本发明实施例的目的在于提供一种图像分类方法、装置、电子设备及存储介质,以提高对各类别图像的检出率。具体技术方案如下:

第一方面,本发明实施例提供了一种图像分类方法,包括:

获取待分类图像;

将所述待分类图像输入预先训练得到的卷积神经网络模型,得到所述待分类图像为各类别的置信度;

根据各类别的预设置信度阈值与所述待分类图像为该类别的置信度的大小关系,确定所述待分类图像的类别;

其中,所述各类别的预设置信度阈值使得:

针对每一种所述类别,利用所述卷积神经网络模型对预定阈值调节样本集中的样本进行预测得到所述样本为该类别的置信度,当将该类别的置信度大于该类别的预设置信度阈值的样本的类别预测为该类别时,该类别的召回率大于预设召回率和/或精确率大于预设精确率。

进一步的,所述卷积神经网络模型的训练过程,包括:

构建初始卷积神经网络模型;

获取分类图像样本,所述分类图像样本是基于预设标注规则进行类别标注的;

将所述分类图像样本输入所述初始卷积神经网络模型,训练得到所述卷积神经网络模型。

进一步的,所述卷积神经网络模型中包括多个子网络和一个概率输出层,其中,各子网络中包括多个卷积层和一个最大池化层。

进一步的,所述各类别的预设置信度阈值的确定方式,包括:

获取阈值调节样本集,所述阈值调节样本集中包含多个阈值调节样本;

分别将各阈值调节样本输入所述卷积神经网络模型,得到所述各阈值调节样本为各类别的置信度;

针对所述类别中的一种类别:

根据预定的所述类别的初始置信度阈值和所述各阈值调节样本为所述类别的置信度,在所述阈值调节样本中将所述类别的置信度大于所述初始置信度阈值的样本预测为所述类别;

根据所述预测为所述类别的样本的数量,获取所述类别的精确率和/或召回率;

根据所述类别的精确率和召回率,构建第一曲线;

根据所述第一曲线,确定所述类别的所述预设置信度阈值。

进一步的,所述第一曲线为精确率-召回率曲线;

所述根据所述第一曲线,确定所述类别的所述预设置信度阈值包括:

计算所述第一曲线中各点的加权调和平均值;

确定所述第一曲线中的目标点,所述目标点的加权调和平均值大于第一预设加权调和平均值、且所述目标点的的召回率大于预设召回率和/或精确率大于预设精确率;

根据所述第一曲线中的目标点对应的置信度,确定所述类别的所述预设置信度阈值。

进一步的,所述计算所述第一曲线中各点的加权调和平均值,包括:

采用预设加权调和平均值计算公式计算所述第一曲线中各点的加权调和平均值,所述预设加权调和平均值计算公式为:

其中,α为参数常量;p为神经网络模型对该类别图像正确识别的精确率;r为神经网络模型对该类别图像正确识别的召回率;f为所述加权调和平均值。

进一步的,所述类别包括第一类别、第二类别和第三类别;

所述根据各类别的预设置信度阈值与所述待分类图像为该类别的置信度的大小关系,确定所述待分类图像的类别,包括:

判断所述待分类图像为第一类别的置信度是否大于或者等于第一类别的预设置信度阈值的大小关系;

当所述待分类图像为第一类别的置信度大于或者等于所述第一类别的预设置信度阈值时,确定所述待分类图像的类别为第一类别;

当所述待分类图像为第一类别的置信度小于所述第一类别的预设置信度阈值时,判断所述待分类图像为第二类别的置信度是否大于或者等于第二类别的预设置信度阈值;

当所述待分类图像为第二类别的置信度大于或者等于所述第二类别的预设置信度阈值时,确定所述待分类图像的类别为第二类别;

当所述待分类图像为第二类别的置信度小于所述第二类别的预设置信度阈值时,确定所述待分类图像的类别为第三类别。

进一步的,所述获取待分类图像,包括:

获取待分类视频的多个帧图像;

将所述多个帧图像作为所述待分类图像;

所述将所述待分类图像输入预先训练得到的卷积神经网络模型,得到所述待分类图像为各类别的置信度,包括:

分别将各帧图像输入预先训练得到的卷积神经网络模型,得到所述各帧图像为各类别的置信度;

所述根据各类别的预设置信度阈值与所述待分类图像为该类别的置信度的大小关系,确定所述待分类图像的类别,包括:

分别根据各类别的预设置信度阈值与所述各帧图像为该类别的置信度的大小关系,得到所述各帧图像的分类结果;

所述方法还包括:

根据所述各帧图像的分类结果,确定所述待分类视频的类别。

进一步的,所述类别包括第一类别、第二类别和第三类别;

所述根据所述各帧图像的分类结果,确定所述待分类视频的类别,包括:

分别统计所述各帧图像中被确定为第一类别的帧图像和第二类别的帧图像的数量;

判断所述被确定为类别的帧图像的数量是否大于等于第一预设数量;

当所述被确定为第一类别的帧图像的数量大于或者等于所述第一预设数量时,将所述待分类视频确定为第一类别;

当所述被确定为第一类别的帧图像的数量小于所述第一预设数量时,判断所述被确定为第二类别的帧图像的数量是否大于等于第二预设数量;

当所述被确定为第二类别的帧图像的数量大于或者等于所述第二预设数量时,将所述待分类视频确定为第二类别;

当所述被确定为第二类别的帧图像的数量小于所述第二预设数量时,将所述待分类视频确定为第三类别。

进一步的,所述第一类别为色情、所述第二类别为低俗、所述第三类别为正常。

第二方面,本发明实施例提供了一种图像分类装置,包括:

待分类图像获取模块,用于获取待分类图像;

置信度计算模块,用于将所述待分类图像输入预先训练得到的卷积神经网络模型,得到所述待分类图像为各类别的置信度;

图像类别确定模块,用于根据各类别的预设置信度阈值与所述待分类图像为该类别的置信度的大小关系,确定所述待分类图像的类别,其中,所述各类别的预设置信度阈值使得:针对每一种所述类别,利用所述卷积神经网络模型对预定阈值调节样本集中的样本进行预测得到所述样本为该类别的置信度,当将该类别的置信度大于该类别的预设置信度阈值的样本的类别预测为该类别时,该类别的召回率大于预设召回率和/或精确率大于预设精确率。

进一步的,所述装置还包括:

网络模型构建模块,用于构建初始卷积神经网络模型;

分类图像样本获取模块,用于获取分类图像样本,所述分类图像样本是基于预设标注规则进行类别标注的;

网络模型训练模块,用于将所述分类图像样本输入所述初始卷积神经网络模型,训练得到所述卷积神经网络模型。

进一步的,所述卷积神经网络模型中包括多个子网络和一个概率输出层,其中,各子网络中包括多个卷积层和一个最大池化层。

进一步的,所述装置还包括阈值确定模块,所述阈值确定模板包括:

获取模块,用于获取阈值调节样本集,所述阈值调节样本集中包含多个阈值调节样本;

第一预测模块,用于分别将各阈值调节样本输入所述卷积神经网络模型,得到所述各阈值调节样本为各类别的置信度;

第二预测模块,用于:

针对所述类别中的一种类别:

根据预定的所述类别的初始置信度阈值和所述各阈值调节样本为所述类别的置信度,在所述阈值调节样本中将所述类别的置信度大于所述初始置信度阈值的样本预测为所述类别;

第二获取模块,用于根据所述预测为所述类别的样本的数量,获取所述类别的精确率和/或召回率;

构建模块,用于根据所述类别的精确率和召回率,构建第一曲线;

确定模块,用于根据所述第一曲线,确定所述类别的所述预设置信度阈值。

进一步的,所述第一曲线为精确率-召回率曲线;

所述确定模块包括:

计算子模块,用于计算所述第一曲线中各点的加权调和平均值;

确定子模块,用于确定所述第一曲线中的目标点,所述目标点的加权调和平均值大于第一预设加权调和平均值、且所述目标点的的召回率大于预设召回率和/或精确率大于预设精确率;

第二确定子模块,用于根据所述第一曲线中的目标点对应的置信度,确定所述类别的所述预设置信度阈值。

进一步的,所述子模块具体用于:

采用预设加权调和平均值计算公式计算所述第一曲线中各点的加权调和平均值,所述预设加权调和平均值计算公式为:

其中,α为参数常量;p为神经网络模型对该类别图像正确识别的精确率;r为神经网络模型对该类别图像正确识别的召回率;f为所述加权调和平均值。

进一步的,所述类别包括第一类别、第二类别和第三类别;

所述图像类别确定模块,具体用于:

判断所述待分类图像为第一类别的置信度是否大于或者等于第一类别的预设置信度阈值的大小关系;

当所述待分类图像为第一类别的置信度大于或者等于所述第一类别的预设置信度阈值时,确定所述待分类图像的类别为第一类别;

当所述待分类图像为第一类别的置信度小于所述第一类别的预设置信度阈值时,判断所述待分类图像为第二类别的置信度是否大于或者等于第二类别的预设置信度阈值;

当所述待分类图像为第二类别的置信度大于或者等于所述第二类别的预设置信度阈值时,确定所述待分类图像的类别为第二类别;

当所述待分类图像为第二类别的置信度小于所述第二类别的预设置信度阈值时,确定所述待分类图像的类别为第三类别。

进一步的,所述待分类图像获取模块,具体用于:

获取待分类视频的多个帧图像;

将所述多个帧图像作为所述待分类图像;

所述置信度计算模块,具体用于:分别将各帧图像输入预先训练得到的卷积神经网络模型,得到所述各帧图像为各类别的置信度;

所述图像类别确定模块,具体用于:

分别根据各类别的预设置信度阈值与所述各帧图像为该类别的置信度的大小关系,得到所述各帧图像的分类结果;

所述装置还包括:视频类别确定模块,用于根据所述各帧图像的分类结果,确定所述待分类视频的类别。

进一步的,所述类别包括第一类别、第二类别和第三类别;

所述视频类别确定模块,具体用于:

分别统计所述各帧图像中被确定为第一类别的帧图像和第二类别的帧图像的数量;

判断所述被确定为类别的帧图像的数量是否大于等于第一预设数量;

当所述被确定为第一类别的帧图像的数量大于或者等于所述第一预设数量时,将所述待分类视频确定为第一类别;

当所述被确定为第一类别的帧图像的数量小于所述第一预设数量时,判断所述被确定为第二类别的帧图像的数量是否大于等于第二预设数量;

当所述被确定为第二类别的帧图像的数量大于或者等于所述第二预设数量时,将所述待分类视频确定为第二类别;

当所述被确定为第二类别的帧图像的数量小于所述第二预设数量时,将所述待分类视频确定为第三类别。

第三方面,本发明实施例提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;

存储器,用于存放计算机程序;

处理器,用于执行存储器上所存放的程序时,实现上述任一图像分类方法的步骤。

第四方面,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述任一所述的图像分类方法。

第五方面,本发明实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一所述的图像分类方法。

本发明实施例提供的一种图像分类方法、装置、电子设备及存储介质,通过获取待分类图像;将待分类图像输入预先训练得到的卷积神经网络模型,得到待分类图像针对各类别的置信度;根据各类别的预设置信度阈值与所述待分类图像为该类别的置信度的大小关系,确定所述待分类图像的类别,其中,所述预设置信度阈值使得:针对每一种所述类别,利用所述卷积神经网络模型对预定阈值调节样本集中的样本进行预测得到所述样本为该类别的置信度,当将该类别的置信度大于该类别的预设置信度阈值的样本的类别预测为该类别时,该类别的召回率大于预设召回率和/或精确率大于预设精确率。本发明实施例中,在得到待分类图像为各类别的置信度后,进行图像分类时,是根据各类别的预设置信度阈值与所述待分类图像为该类别的置信度的大小关系进行的,而上述各类别的预设置信度阈值为根据利用所述卷积神经网络模型、对阈值调节样本集进行预测得到的针对各类别的预测结果,调节得到使得召回率大于或等于预设召回率和/或精确率大于或等于预设精确率的各类别的置信度,因此,基于各类别的预设置信度阈值与待分类图像为该类别的置信度的大小关系,确定待分类图片的类别,可以在保证准确度的前提下,提高对各类别图像的检出率。

当然,实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明一个实施例提供的图像分类方法的流程示意图;

图2本发明一个实施例提供的子网络架构图;

图3本发明另一个实施例提供的子网络架构图;

图4本发明又一个实施例提供的子网络架构图;

图5为本发明另一个实施例提供的图像分类方法的流程示意图;

图6为本发明一个实施例提供的图像分类装置的结构示意图;

图7为本发明实施例提供的电子设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

在违规图像检测领域,传统检测方法主要包括以下几种:第一种:通过目标图像中皮肤区域的面积及连通域在皮肤区域中的分布规律进行检测;第二种:针对于视频图像,利用肤色模型和非肤色模型,计算视频图像中各个像素点的肤色概率值与非肤色概率值;根据各像素点的肤色概率值与非肤色概率值,为图像建立模版图像;根据模版图像,提取图像特征;将连续视频图像中的图像特征组成观测序列,再将观测序列输入到违规镜头模型中以检测待检测视频是否为违规视频;第三种,基于深度学习框架的检测方法:将图像样本输入经过初步训练得到的卷积神经网络模型中,得到分类结果;然后将该分类结果与图像样本实际的类别进行对比,当两者差别较大时,则调整上述网络模型中的参数,直至分类结果逼近图像样本实际的类别或者分类结果与图像样本实际的类别完全相同,得到最终检测模型;利用最终检测模型对待测的图像进行分类检测。

对于第一种和第二种检测方法而言,其检测过程均是基于人体肤色进行检测识别的,但是由于图像种类的多样性,收光照、分辨率及人体姿态等差异的影响,检测结果的准确率较低。就基于深度学习框架的第三种检测方法而言,采用该方法进行图像分类检测,可以保证图像样本中被正确分类的样本数量满足一定要求,但是对于违规的待检测图形的检测正确性则无法保证,也就是说:该方法对违规图像的检出率较低。

图1为本发明一个实施例提供的图像分类方法的流程示意图,包括:

步骤101,获取待分类图像。

步骤102,将待分类图像输入预先训练得到的卷积神经网络模型,得到待分类图像为各类别的置信度。

在步骤102之前,通过训练预先得到卷积神经网络模型,该卷积神经网络模型用于预测图像为各预定类别的置信度。

其中,本发明实施例中,某个预定类别的置信度是指:图像的真实类别有一定概率为该预定类别的程度,亦可以理解为,图像的真实类别为该预定类别的概率。通过卷积神经网络模型对某图像进行预测时,卷积神经网络模型将输出该图像为各预测类别的置信度。

本发明实施例中,对如何得到卷积神经网络模型不做限定,举例而言,得到卷积神经网络模型的过程可以包括:

构建初始卷积神经网络模型;

获取分类图像样本,分类图像样本是基于预设标注规则进行类别标注的;

将分类图像样本输入初始卷积神经网络模型,训练得到卷积神经网络模型。

其中,构建的初始卷积神经网络模型中,可以包括卷积层、池化层、概率统计层及全连接层等,其中,卷积层用于对输入的图像进行特征提取,池化层用于卷积层提取到的特征进行下采样,概率统计层及全连接层根据下采样后的数据,对输入的图像进行分类,得到分类结果。初始卷积神经网络模型中上述每个网络层的核大小及输出大小都可以是随机设定的初始值,也可以是基于imagenet等大规模数据集训练得到的,且每个层均有一个输入并产生一个输出,每个层的输出作为下一层的输入,在对网络模型进行训练的过程中,可以根据分类图像样本对上述参数进行调节的,在实际应用中,可以根据实际情况,从上述多个层中选择合适的层进行组合,当然也可以根据需要添加除上述网络层之外的其他网络层,从而形成具有特定作用或者能达到某种特定效果的网络模型,再将分类图像样本输入该网络模型,训练得到卷积神经网络模型,在此,对卷积神经网络模型的具体架构不作限定。

为得到该卷积神经模型,需要获取大量的已经进行过分类的样本图像。本发明实施例中图像的类别具体为何种类别不限,类别的数量亦不限。举例来说,对于视频图像而言,可以将视频图像分为色情、低俗、正常三种类别,亦可将视频图像分为违规和正常两种类别。

不失一般性,图像类别可以分为第一类别和第二类别,也可以分为第一类别、第二类别和第三类别,具体的,第一类别、第二类别及第三类别可以分别为色情、低俗和正常,类似的,第一类别和第二类别也可以分别为违规和色情,或者是色情和正常等,对于具体的图像类别,可以根据实际需要进行设定。

可以理解的是,分类图像样本作为卷积神经网络模型的训练样本,因此,样本的分类准确性直接决定了卷积神经网络模型的输出准确性,因此,需要有效保证分类图像样本的分类准确性。由于样本的标注通常有人工完成,由于人的个体差异,样本的分类水平参差不齐,因此,本发明实施例中,预设详细的分类标注规则,分类标注人员按照规则分类而并非按照自己的理解分类,可以有效提高分类标注的准确性。同样,对于不同类别的标注规则也可以根据实际情况进行设定,在此,对于图像类别及各图像类别对应的标注规则均不作限制。

以将图像类别分为色情、低俗和正常这一情况为例,在获取分类图像样本时,可以先对图像样本进行标注,具体的标注规则包括:将裸露生殖器或者裸露乳房的图像标注为色情图像;在没有裸露生殖器或者裸露乳房的情况下,将含有透视装或者接吻动作的图像标注为低俗图像;当图像中既没有裸露生殖器或者裸露乳房,也没有透视装或者接吻动作时,则将其标注为正常图像。本步骤中,在确定了图像类别及各图像类别的标注规则后,对分类图像样本进行类别标注的工作,可以由标注人员完成,也可以由机器完成,对此,不作限定。

在对分类图像样本进行标注时,若没有统一的标注规则,而是由标注人员按照自己的主观判断决定出图像类别,则会由于每个人对不同类别图像的理解存在的偏差,导致标注出的分类图像样本本身特征不明确的问题,进而使得基于上述分类图像样本训练出来的卷积神经网络模型的分类准确性较低。按照预设的标注规则对分类图像样本进行标注,可以避免现有技术中存在的,由标注人员对图像类别理解存在偏差而导致的训练好的卷积神经网络模型的分类准确性较低的问题,也就是说,按照预设标注规则对分类图像样本进行类别标注,然后再基于标注后的分类图像样本对卷积神经网络模型进行训练,可以提高卷积神经网络模型的分类准确性。

进一步的,本步骤中的卷积神经网络模型中可以包括多个子网络和一个概率输出层,其中,各子网络中包括多个卷积层和一个最大池化层。

多个子网络之间进行叠加,即第一个子网络的输出作为第二个子网络的输入;每个子网络中的卷积层间相互并列,卷积层与最大池化层间也互相并列,且每个卷积层之后均有一个批量归一化层,用于将各个通过卷积层的特征图一起融合起来,加上激活函数向下传递。整个网络依靠softmax损失函数层向上传递每层的损失,再通过优化方法(sgd)对于每个子网络的参数进行优化。

在本发明的一个实施例中,采用的子网络的架构可以如图2所示,每个子网络中包含有3个并列的卷积层,这3个卷积层的尺度分别为1×1、3×3及5×5,最大池化层的尺度为3×3。

图2所示的子网络架构中,所有的卷积运算都是基于上一层的输出来进行的,此时,5×5卷积核所进行的运算量则非常大,因此会引起特征图厚度过大的问题。

为了避免图2中出现的运算量过大的问题,在本发明的另一个实施例中,采用的子网络的架构可以如图3所示,该网络构架是在图2的网络构架基础上,分别在3×3和5×5卷积层之前、最大池化层之后添加了卷积核为1×1的卷积层,以起到降低特征图厚度的作用。

在本发明的又一个实施例中,采用的子网络的架构可以如图4所示,该网络架构与图2的网络架构较为相似,只是将图2中的5×5卷积核对应的卷积层替换为两个具有3×3卷积核的卷积层。

步骤103,根据各类别的预设置信度阈值与待分类图像为该类别的置信度的大小关系,确定待分类图像的类别。

本发明实施例中,针对每一种类别均预设一个置信度阈值,在得到卷积神经网络模型针对待分类图像为各类别的置信度后,比较各类别的置信度和各类别的置信度阈值,一般将置信度大于置信度阈值的类别确定为待分类图像的类别。

置信度阈值是通过预先准备好的分类好的图像样本集合获取。本申请中,将该分类好的图像样本集合称为阈值调节样本集。使用前述的卷积申请网络模型对阈值调节样本集中的样本进行预测得到样本为各类别的置信度,针对其中一种类别,在将该类别的置信度大于该类别的预设置信度阈值的样本的类别确定为该类别时,可以计算这种情况下,该类别的召回率和精确率,此时,召回率大于预设召回率,或者,精确率大于预设精确率,或者,召回率大于预设召回率以及同时精确率大于预设精确率。

由于,置信度阈值可以使得阈值调节样本集保证分类的召回率和/或精确率,因此,将该阈值应用于步骤103中,很大程度上也可以有效保证待分类样本的分类结果的召回率和精确率,有效保证分类结果的准确性。

即,各类别的预设置信度阈值使得:

针对每一种类别,利用卷积神经网络模型对预定阈值调节样本集中的样本进行预测得到样本为该类别的置信度,当将该类别的置信度大于该类别的预设置信度阈值的样本的类别预测为该类别时,该类别的召回率大于预设召回率和/或精确率大于预设精确率。

以图像类别包括色情和非色情为例,可以将预设的阈值调节样本集中的样本分别输入已训练完成的卷积神经网络模型,得到各个样本为色情类别的置信度,假设色情类别的置信度阈值为t,则该置信度阈值需要满足以下条件:当将色情类别的置信度大于t的样本的类别预测为色情,将色情类别的置信度小于或者等于t的样本的类别预测为非色情,得到经该神经网络模型分类后的预设的阈值调节样本集针对色情类图像的召回率r,以及得到经该神经网络模型分类后的预设的阈值调节样本集针对色情类图像的精确率p时,该召回率p需要大于预先设定的召回率r0(r>r0),或者该精确率p需要大于预先设定的精确率p0(p>p0)或者召回率p需要大于预先设定的召回率r0(r>r0)且精确率p需要大于预先设定的精确率p0(p>p0)。

具体的,可以采用如下方法,确定上述各类别的预设置信度阈值:

获取阈值调节样本集,阈值调节样本集中包含多个阈值调节样本;

分别将各阈值调节样本输入卷积神经网络模型,得到各阈值调节样本为各类别的置信度;

针对类别中的一种类别:

根据预定的该类别的初始置信度阈值和各阈值调节样本为该类别的置信度,在阈值调节样本中将该类别的置信度大于初始置信度阈值的样本预测为该类别;

根据预测为该类别的样本的数量,获取该类别的精确率和/或召回率;

根据该类别的精确率和召回率,构建第一曲线;

根据第一曲线,确定该类别的预设置信度阈值。

进一步的,第一曲线为精确率-召回率曲线;

根据第一曲线,确定类别的预设置信度阈值包括:

计算第一曲线中各点的加权调和平均值;

确定第一曲线中的目标点,目标点的加权调和平均值大于第一预设加权调和平均值、且目标点的的召回率大于预设召回率和/或精确率大于预设精确率;

根据第一曲线中的目标点对应的置信度,确定该类别的预设置信度阈值。

本步骤中的阈值调节样本集用于确定上述各类别的预设置信度阈值,为了避免对预先训练得到的神经网络模型产生过拟合或者欠拟合问题,阈值调节样本集的样本数量可以与分类图像样本数量具有一定比例关系(k:1),例如,可以将分类图像样本数量与阈值调节样本集的样本数量的比值设定为10:1或者20:1。具体方法可以为:对于每个类别的样本,按照10:1或者20:1的比例随机从样本库中选取图像,分别作为该类型对应的分类图像样本和阈值调节样本,然后再将各个类别的上述两类样本合并,最终形成数量比例为10:1或者20:1的分类图像样本和阈值调节样本集。分类图像样本用于训练得到卷积神经网络模型,而阈值调节样本用于确定置信度阈值。

在将阈值调节样本输入卷积神经网络模型,得到各阈值调节样本针对各类别的置信度后,可以基于各阈值调节样本针对各类别的置信度,确定阈值调节样本集分别针对各类别的第一曲线,上述第一曲线可以为阈值调节样本集分别针对各类别的精确率-召回率曲线(p-r曲线),该曲线是基于精确率和召回率绘制的,以针对某一具体类别的p-r曲线为例,具体说明其构建过程:可以先取该类别的置信度阈值为0.9,基于得到的各阈值调节样本针对该类别的置信度和该类别的置信度阈值(0.9)的大小关系,对整个阈值调节样本集中的所有样本进行分类,得到分类结果(分类结果可以包括两种:该类别和非该类别),然后计算神经网络模型对该类别图像正确识别的精确率和召回率,其中,精确率也称为查准率,表示整个阈值调节样本集中被分类为该类别的图像样本中实际属于该类别的图像样本的比例;召回率也称为查全率,表示整个阈值调节样本集中实际属于该类别的图像样本中被分类为给类别的图像样本的比例;然后再分别取该类别的置信度阈值为0.8、0.7、……、0,计算神经网络模型对该类别图像正确识别的精确率和召回率,共可以得到10组精确率-召回率数据,将上述数据组按照召回率由小到大的顺序排列;基于上述排序好的10组数据,以召回率为横轴,精确率为纵轴,即可构建出阈值调节样本集针对该类别的p-r曲线。

进一步的,在得到阈值调节样本集针对该类别的p-r曲线后,可以采用如下预设加权调和平均值计算公式计算出曲线中各点的加权调和平均值f:

其中,α为参数常量;p为神经网络模型对该类别图像正确识别的精确率;r为神经网络模型对该类别图像正确识别的召回率。

当α=1时,f=f1,f1为曲线中各点的调和平均值。f1是综合了p和r的综合评价指标,当f1较高时,则说明该分类方法的整体性能较好。

在得到阈值调节样本集针对该类别的p-r曲线和曲线中各点的加权调和平均值后,可以将曲线上满足一定预设条件的点(目标点)对应的置信度阈值确定为该类别的预设置信度阈值,其中,预设条件可以是:加权调和平均值大于第一预设加权调和平均值且该类别的召回率大于预设召回率;也可以是:加权调和平均值大于第一预设加权调和平均值且该类别的精确率大于预设精确率;还可以是:加权调和平均值大于第一预设加权调和平均值、该类别的召回率大于预设召回率且精确率大于预设精确率。在计算过程中,由于选择的样本不同,可能存在一定的随机误差,为了提高计算的准确性,可以多次重复上述过程,得到多个预设置信度阈值,然后取其平均值作为最终的该类别的预设置信度阈值。

进一步的,可以将图像的类别具体分为:第一类别、第二类别和第三类别;

具体可以采用如下方法,根据各类别的预设置信度阈值与待分类图像为该类别的置信度的大小关系,确定待分类图像的类别:

判断待分类图像为第一类别的置信度是否大于或者等于第一类别的预设置信度阈值的大小关系;

当待分类图像为第一类别的置信度大于或者等于第一类别的预设置信度阈值时,确定待分类图像的类别为第一类别;

当待分类图像为第一类别的置信度小于第一类别的预设置信度阈值时,判断待分类图像为第二类别的置信度是否大于或者等于第二类别的预设置信度阈值;

当待分类图像为第二类别的置信度大于或者等于第二类别的预设置信度阈值时,确定待分类图像的类别为第二类别;

当待分类图像为第二类别的置信度小于第二类别的预设置信度阈值时,确定待分类图像的类别为第三类别。

可以通过如下例子,详细解释上述分类过程:设定第一类别为色情类别、第二类别为低俗类别、第三类别为正常类别,假设将待分类图像输入预先训练得到的卷积神经网络模型,得到待分类图像为各类别的置信度具体为:色情类别的置信度为0.3,低俗类别的置信度为0.6,正常类别的置信度为0.1,相应的,色情类别的预设置信度为0.2,低俗类别的预设置信度为0.4,正常类别的预设置信度为0.1,由于色情类别的置信度0.3大于色情类别的预设置信度0.2,因此,即使低俗类别的置信度最高,也将该待分类图像确定为色情类别的图像。

在本发明实施例提供的图1所示的图像分类方法中,通过获取待分类图像;将待分类图像输入预先训练得到的卷积神经网络模型,得到待分类图像针对各类别的置信度;根据各类别的预设置信度阈值与待分类图像为该类别的置信度的大小关系,确定待分类图像的类别,其中,预设置信度阈值使得针对每一种类别,利用卷积神经网络模型对预定阈值调节样本集中的样本进行预测得到样本为该类别的置信度,当将该类别的置信度大于该类别的预设置信度阈值的样本的类别预测为该类别时,该类别的召回率大于预设召回率和/或精确率大于预设精确率。本发明实施例中,在得到待分类图像为各类别的置信度后,进行图像分类时,是根据各类别的预设置信度阈值与待分类图像为该类别的置信度的大小关系进行的,而上述各类别的预设置信度阈值为根据利用卷积神经网络模型、对阈值调节样本集进行预测得到的针对各类别的预测结果,调节得到使得召回率大于或等于预设召回率和/或精确率大于或等于预设精确率的各类别的置信度,因此,基于各类别的预设置信度阈值与待分类图像为该类别的置信度的大小关系,确定待分类图片的类别,可以在保证准确度的前提下,提高对各类别图像的检出率。

本发明实施例还提供一种图像分类方法,如图5所示,具体包括如下步骤:

步骤201,获取待分类视频的多个帧图像。

当需要对一个视频中包含的图像内容进行分类时,可以先获取该视频,然后再按照一定的频率对视频进行截帧处理,得到多个帧图像。

步骤202,将多个帧图像作为待分类图像。

步骤203,分别将各帧图像输入预先训练得到的卷积神经网络模型,得到各帧图像为各类别的置信度。

进一步的,本步骤中的卷积神经网络模型的训练过程可以与步骤102中相同,即:构建初始卷积神经网络模型;获取分类图像样本,分类图像样本是基于预设标注规则进行类别标注的;将分类图像样本输入初始卷积神经网络模型,训练得到卷积神经网络模型。

构建的初始卷积神经网络模型中,同样可以包括卷积层、池化层、概率统计层及全连接层等,其中,卷积层用于对输入的图像进行特征提取,池化层用于卷积层提取到的特征进行下采样,概率统计层及全连接层根据下采样后的数据,对输入的图像进行分类,得到分类结果。初始卷积神经网络模型中上述每个网络层的核大小及输出大小都可以是随机设定的初始值,也可以是基于大规模数据集训练得到的,且每个层均有一个输入并产生一个输出,每个层的输出作为下一层的输入,在对网络模型进行训练的过程中,可以根据分类图像样本对上述参数进行调节的,在实际应用中,可以根据实际情况,从上述多个层中选择合适的层进行组合,当然也可以根据需要添加除上述网络层之外的其他网络层,从而形成具有特定作用或者能达到某种特定效果的网络模型,再将分类图像样本输入该网络模型,训练得到卷积神经网络模型,在此,对卷积神经网络模型的具体架构不作限定。

图像类别可以分为第一类别和第二类别,也可以分为第一类别、第二类别和第三类别,具体的,第一类别、第二类别及第三类别可以分别为色情、低俗和正常,类似的,第一类别和第二类别也可以分别为违规和色情,或者是色情和正常等,对于具体的图像类别,可以根据实际需要进行设定,同样,对于不同类别的标注规则也可以根据实际情况进行设定,在此,对于图像类别及各图像类别对应的标注规则均不作限制。

以将图像类别分为色情、低俗和正常这一情况为例,在获取分类图像样本时,可以先对图像样本进行标注,将裸露生殖器或者裸露乳房的图像标注为色情图像;在没有裸露生殖器或者裸露乳房的情况下,将含有透视装或者接吻动作的图像标注为低俗图像;当图像中既没有裸露生殖器或者裸露乳房,也没有透视装或者接吻动作时,则将其标注为正常图像。本步骤中,在确定了图像类别及各图像类别的标注规则后,对分类图像样本进行类别标注的工作,可以由标注人员完成,也可以由机器完成,对此,不作限定。

在对分类图像样本进行标注时,若没有统一的标注规则,而是由标注人员按照自己的主观判断决定出图像类别,则会由于每个人对不同类别图像的理解存在的偏差,导致标注出的分类图像样本本身特征不明确的问题,进而使得基于上述分类图像样本训练出来的卷积神经网络模型的分类准确性较低。按照预设的标注规则对分类图像样本进行标注,可以避免现有技术中存在的,由标注人员对图像类别理解存在偏差而导致的训练好的卷积神经网络模型的分类准确性较低的问题,也就是说,按照预设标注规则对分类图像样本进行类别标注,然后再基于标注后的分类图像样本对卷积神经网络模型进行训练,可以提高卷积神经网络模型的分类准确性。

进一步的,本步骤中的卷积神经网络模型中可以包括多个子网络和一个概率输出层,其中,各子网络中包括多个卷积层和一个最大池化层。多个子网络之间进行叠加,即第一个子网络的输出作为第二个子网络的输入;每个子网络中的卷积层间相互并列,卷积层与最大池化层间也互相并列,且每个卷积层之后均有一个批量归一化层,用于将各个通过卷积层的特征图一起融合起来,加上激活函数向下传递。整个网络依靠softmax损失函数层向上传递每层的损失,再通过优化方法(sgd)对于每个子网络的参数进行优化。

步骤204,分别根据各类别的预设置信度阈值与各帧图像为该类别的置信度的大小关系,得到各帧图像的分类结果。

其中,各类别的预设置信度阈值使得:针对每一种类别,利用卷积神经网络模型对预定阈值调节样本集中的样本进行预测得到样本为该类别的置信度,当将该类别的置信度大于该类别的预设置信度阈值的样本的类别预测为该类别时,该类别的召回率大于预设召回率和/或精确率大于预设精确率。

进一步的,确定上述各类别的预设置信度阈值的方法可以与步骤103中相同,即:获取阈值调节样本集,阈值调节样本集中包含多个阈值调节样本;分别将各阈值调节样本输入卷积神经网络模型,得到各阈值调节样本为各类别的置信度;针对类别中的一种类别:针对类别中的一种类别:根据预定的该类别的初始置信度阈值和各阈值调节样本为该类别的置信度,在阈值调节样本中将该类别的置信度大于初始置信度阈值的样本预测为该类别;根据预测为该类别的样本的数量,获取该类别的精确率和/或召回率;根据该类别的精确率和召回率,构建第一曲线;根据第一曲线,确定该类别的预设置信度阈值。

进一步的,第一曲线为精确率-召回率曲线;

根据第一曲线,确定该类别的预设置信度阈值包括:计算第一曲线中各点的加权调和平均值;确定第一曲线中的目标点,目标点的加权调和平均值大于第一预设加权调和平均值、且目标点的的召回率大于预设召回率和/或精确率大于预设精确率;根据第一曲线中的目标点对应的置信度,确定该类别的预设置信度阈值。

进一步的,也可以将图像的类别具体分为:第一类别、第二类别和第三类别,具体可以采用如下方法,根据各类别的预设置信度阈值与各帧图像为该类别的置信度的大小关系,确定各帧图像的类别:判断待分类图像为第一类别的置信度是否大于或者等于第一类别的预设置信度阈值的大小关系;当待分类图像为第一类别的置信度大于或者等于第一类别的预设置信度阈值时,确定待分类图像的类别为第一类别;当待分类图像为第一类别的置信度小于第一类别的预设置信度阈值时,判断待分类图像为第二类别的置信度是否大于或者等于第二类别的预设置信度阈值;当待分类图像为第二类别的置信度大于或者等于第二类别的预设置信度阈值时,确定待分类图像的类别为第二类别;当待分类图像为第二类别的置信度小于第二类别的预设置信度阈值时,确定待分类图像的类别为第三类别。

步骤205,根据各帧图像的分类结果,确定待分类视频的类别。

在得到待分类视频中各帧图像的分类结果后,可以对各帧图像的分类结果进行统计,进而确定待分类视频的类别。

进一步的,也可以将待分类视频的类别分为:第一类别、第二类别和第三类别,此时,可以具体采用如下方法,确定待分类视频的类别:

分别统计各帧图像中被确定为第一类别的帧图像和第二类别的帧图像的数量;

判断被确定为类别的帧图像的数量是否大于等于第一预设数量;

当被确定为第一类别的帧图像的数量大于或者等于第一预设数量时,将待分类视频确定为第一类别;

当被确定为第一类别的帧图像的数量小于第一预设数量时,判断被确定为第二类别的帧图像的数量是否大于等于第二预设数量;

当被确定为第二类别的帧图像的数量大于或者等于第二预设数量时,将待分类视频确定为第二类别;

当被确定为第二类别的帧图像的数量小于第二预设数量时,将待分类视频确定为第三类别。

进一步的,第一类别可以为色情、第二类别可以为低俗、第三类别可以为正常。

在本发明的又一实施例中,也可以通过判断待分类图像中,各帧图像中,是否存在连续的第三预设数量张第一类别的图像,若存在,则将待分类视频确定为第一类别的视频;如果不存在,再判断各帧图像中,是否存在连续的第四预设数量张第二类别的图像,如果存在连续的第四预设数量张第二类别的图像,则将待分类视频确定为第二类别的视频,如果也不存在连续的第四预设数量张第二类别的图像,再将该待分类视频确定为第三类别的视频。

在本发明实施例提供的图5所示的图像分类方法中,通过获取待分类视频的多个帧图像;将多个帧图像作为待分类图像;分别将各帧图像输入预先训练得到的卷积神经网络模型,得到各帧图像为各类别的置信度;分别根据各类别的预设置信度阈值与各帧图像为该类别的置信度的大小关系,得到各帧图像的分类结果;根据各帧图像的分类结果,确定待分类视频的类别。本发明实施例中,在得到各帧图像为各类别的置信度后,进行图像分类时,是根据各类别的预设置信度阈值与各帧图像为该类别的置信度的大小关系进行的,而上述各类别的预设置信度阈值使得:针对每一种类别,利用卷积神经网络模型对预定阈值调节样本集中的样本进行预测得到样本为该类别的置信度,当将该类别的置信度大于该类别的预设置信度阈值的样本的类别预测为该类别时,该类别的召回率大于预设召回率和/或精确率大于预设精确率,因此,基于各类别的预设置信度阈值与各帧图像为该类别的置信度的大小关系,确定各帧图像的类别,可以在保证准确度的前提下,提高对各类别图像的检出率,进而提高对各类别视频的检出率。

以上实施例中,是以类别的数量为3种为例进行说明的,但本发明实施例不限于此,针对其他类别数量的图像分类,可以进行类似处理,这里不再赘述。

基于同一发明构思,根据本发明上述实施例提供的图像分类方法,相应地,本发明一个实施例还提供了一种图像分类装置,其结构示意图如图6所示,包括:

待分类图像获取模块301,用于获取待分类图像;

置信度计算模块302,用于将待分类图像输入预先训练得到的卷积神经网络模型,得到待分类图像为各类别的置信度;

图像类别确定模块303,用于根据各类别的预设置信度阈值与待分类图像为该类别的置信度的大小关系,确定待分类图像的类别,其中,各类别的预设置信度阈值使得:针对每一种类别,利用卷积神经网络模型对预定阈值调节样本集中的样本进行预测得到样本为该类别的置信度,当将该类别的置信度大于该类别的预设置信度阈值的样本的类别预测为该类别时,该类别的召回率大于预设召回率和/或精确率大于预设精确率。

进一步的,装置还包括:

网络模型构建模块,用于构建初始卷积神经网络模型;

分类图像样本获取模块,用于获取分类图像样本,分类图像样本是基于预设标注规则进行类别标注的;

网络模型训练模块,用于将分类图像样本输入初始卷积神经网络模型,训练得到卷积神经网络模型。

进一步的,卷积神经网络模型中包括多个子网络和一个概率输出层,其中,各子网络中包括多个卷积层和一个最大池化层。

进一步的,装置还包括阈值确定模块,所述阈值确定模板包括:

获取模块,用于获取阈值调节样本集,阈值调节样本集中包含多个阈值调节样本;

第一预测模块,用于分别将各阈值调节样本输入卷积神经网络模型,得到各阈值调节样本为各类别的置信度;

第二预测模块,用于:

针对类别中的一种类别:

根据预定的该类别的初始置信度阈值和各阈值调节样本为该类别的置信度,在阈值调节样本中将该类别的置信度大于初始置信度阈值的样本预测为该类别;

第二获取模块,用于根据预测为该类别的样本的数量,获取该类别的精确率和/或召回率;

构建模块,用于根据该类别的精确率和召回率,构建第一曲线;

确定模块,用于根据第一曲线,确定该类别的预设置信度阈值。

进一步的,第一曲线为精确率-召回率曲线;

确定模块包括:

计算子模块,用于计算第一曲线中各点的加权调和平均值;

确定子模块,用于确定第一曲线中的目标点,目标点的加权调和平均值大于第一预设加权调和平均值、且目标点的的召回率大于预设召回率和/或精确率大于预设精确率;

第二确定子模块,用于根据第一曲线中的目标点对应的置信度,确定该类别的预设置信度阈值。

进一步的,所述计算子模块具体用于:

采用预设加权调和平均值计算公式计算第一曲线中各点的加权调和平均值,预设加权调和平均值计算公式为:

其中,α为参数常量;p为神经网络模型对该类别图像正确识别的精确率;r为神经网络模型对该类别图像正确识别的召回率;f为加权调和平均值。

进一步的,类别包括第一类别、第二类别和第三类别;

图像类别确定模块303,具体用于:

判断待分类图像为第一类别的置信度是否大于或者等于第一类别的预设置信度阈值的大小关系;

当待分类图像为第一类别的置信度大于或者等于第一类别的预设置信度阈值时,确定待分类图像的类别为第一类别;

当待分类图像为第一类别的置信度小于第一类别的预设置信度阈值时,判断待分类图像为第二类别的置信度是否大于或者等于第二类别的预设置信度阈值;

当待分类图像为第二类别的置信度大于或者等于第二类别的预设置信度阈值时,确定待分类图像的类别为第二类别;

当待分类图像为第二类别的置信度小于第二类别的预设置信度阈值时,确定待分类图像的类别为第三类别。

进一步的,待分类图像获取模块301,具体用于:

获取待分类视频的多个帧图像;

将多个帧图像作为待分类图像;

置信度计算模块302,具体用于:分别将各帧图像输入预先训练得到的卷积神经网络模型,得到各帧图像为各类别的置信度;

图像类别确定模块303,具体用于:

分别根据各类别的预设置信度阈值与各帧图像为该类别的置信度的大小关系,得到各帧图像的分类结果;

装置还包括:视频类别确定模块,用于根据各帧图像的分类结果,确定待分类视频的类别。

进一步的,待分类视频的类别包括第一类别、第二类别和第三类别;

视频类别确定模块,具体用于:

分别统计各帧图像中被确定为第一类别的帧图像和第二类别的帧图像的数量;

判断被确定为类别的帧图像的数量是否大于等于第一预设数量;

当被确定为第一类别的帧图像的数量大于或者等于第一预设数量时,将待分类视频确定为第一类别;

当被确定为第一类别的帧图像的数量小于第一预设数量时,判断被确定为第二类别的帧图像的数量是否大于等于第二预设数量;

当被确定为第二类别的帧图像的数量大于或者等于第二预设数量时,将待分类视频确定为第二类别;

当被确定为第二类别的帧图像的数量小于第二预设数量时,将待分类视频确定为第三类别。

进一步的,第一类别为色情、第二类别为低俗、第三类别为正常。

本发明实施例提供的图像分类装置中,待分类图像获取模块301通过获取待分类图像;置信度计算模块302将待分类图像输入预先训练得到的卷积神经网络模型,得到待分类图像针对各类别的置信度;类别确定模块303根据各类别的预设置信度阈值与待分类图像为该类别的置信度的大小关系,确定待分类图像的类别,其中,预设置信度阈值使得针对每一种类别,利用卷积神经网络模型对预定阈值调节样本集中的样本进行预测得到样本为该类别的置信度,当将该类别的置信度大于该类别的预设置信度阈值的样本的类别预测为该类别时,该类别的召回率大于预设召回率和/或精确率大于预设精确率。本发明实施例中,在得到待分类图像为各类别的置信度后,进行图像分类时,是根据各类别的预设置信度阈值与待分类图像为该类别的置信度的大小关系进行的,而上述各类别的预设置信度阈值为根据利用卷积神经网络模型、对阈值调节样本集进行预测得到的针对各类别的预测结果,调节得到使得召回率大于或等于预设召回率和/或精确率大于或等于预设精确率的各类别的置信度,因此,基于各类别的预设置信度阈值与待分类图像为该类别的置信度的大小关系,确定待分类图片的类别,可以在保证准确度的前提下,提高对各类别图像的检出率。

本发明实施例还提供了一种电子设备,如图7所示,包括处理器401、通信接口402、存储器403和通信总线404,其中,处理器401,通信接口402,存储器403通过通信总线404完成相互间的通信,

存储器403,用于存放计算机程序;

处理器401,用于执行存储器403上所存放的程序时,实现如下步骤:

获取待分类图像;

将待分类图像输入预先训练得到的卷积神经网络模型,得到待分类图像为各类别的置信度;

根据各类别的预设置信度阈值与待分类图像为该类别的置信度的大小关系,确定待分类图像的类别,其中,各类别的预设置信度阈值使得针对每一种类别,利用卷积神经网络模型对预定阈值调节样本集中的样本进行预测得到样本为该类别的置信度,当将该类别的置信度大于该类别的预设置信度阈值的样本的类别预测为该类别时,该类别的召回率大于预设召回率和/或精确率大于预设精确率。

上述电子设备提到的通信总线可以是外设部件互连标准(peripheralcomponentinterconnect,简称pci)总线或扩展工业标准结构(extendedindustrystandardarchitecture,简称eisa)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。

通信接口用于上述电子设备与其他设备之间的通信。

存储器可以包括随机存取存储器(randomaccessmemory,简称ram),也可以包括非易失性存储器(non-volatilememory),例如至少一个磁盘存储器。进一步的,存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器,包括中央处理器(centralprocessingunit,简称cpu)、网络处理器(networkprocessor,简称np)等;还可以是数字信号处理器(digitalsignalprocessing,简称dsp)、专用集成电路(applicationspecificintegratedcircuit,简称asic)、现场可编程门阵列(field-programmablegatearray,简称fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

本发明实施例提供的电子设备中,其采用的方法为:通过获取待分类图像;将待分类图像输入预先训练得到的卷积神经网络模型,得到待分类图像针对各类别的置信度;根据各类别的预设置信度阈值与待分类图像为该类别的置信度的大小关系,确定待分类图像的类别,其中,预设置信度阈值使得针对每一种类别,利用卷积神经网络模型对预定阈值调节样本集中的样本进行预测得到样本为该类别的置信度,当将该类别的置信度大于该类别的预设置信度阈值的样本的类别预测为该类别时,该类别的召回率大于预设召回率和/或精确率大于预设精确率。本发明实施例中,在得到待分类图像为各类别的置信度后,进行图像分类时,是根据各类别的预设置信度阈值与待分类图像为该类别的置信度的大小关系进行的,而上述各类别的预设置信度阈值为根据利用卷积神经网络模型、对阈值调节样本集进行预测得到的针对各类别的预测结果,调节得到使得召回率大于或等于预设召回率和/或精确率大于或等于预设精确率的各类别的置信度,因此,基于各类别的预设置信度阈值与待分类图像为该类别的置信度的大小关系,确定待分类图片的类别,可以在保证准确度的前提下,提高对各类别图像的检出率。

在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一上述的图像分类方法。

本发明实施例提供的计算机可读存储介质中,其采用的方法为:通过获取待分类图像;将待分类图像输入预先训练得到的卷积神经网络模型,得到待分类图像针对各类别的置信度;根据各类别的预设置信度阈值与待分类图像为该类别的置信度的大小关系,确定待分类图像的类别,其中,预设置信度阈值使得针对每一种类别,利用卷积神经网络模型对预定阈值调节样本集中的样本进行预测得到样本为该类别的置信度,当将该类别的置信度大于该类别的预设置信度阈值的样本的类别预测为该类别时,该类别的召回率大于预设召回率和/或精确率大于预设精确率。本发明实施例中,在得到待分类图像为各类别的置信度后,进行图像分类时,是根据各类别的预设置信度阈值与待分类图像为该类别的置信度的大小关系进行的,而上述各类别的预设置信度阈值为根据利用卷积神经网络模型、对阈值调节样本集进行预测得到的针对各类别的预测结果,调节得到使得召回率大于或等于预设召回率和/或精确率大于或等于预设精确率的各类别的置信度,因此,基于各类别的预设置信度阈值与待分类图像为该类别的置信度的大小关系,确定待分类图片的类别,可以在保证准确度的前提下,提高对各类别图像的检出率。

在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一上述的图像分类方法。

本发明实施例提供的包含指令的计算机程序产品中,其采用的方法为:通过获取待分类图像;将待分类图像输入预先训练得到的卷积神经网络模型,得到待分类图像针对各类别的置信度;根据各类别的预设置信度阈值与待分类图像为该类别的置信度的大小关系,确定待分类图像的类别,其中,预设置信度阈值使得针对每一种类别,利用卷积神经网络模型对预定阈值调节样本集中的样本进行预测得到样本为该类别的置信度,当将该类别的置信度大于该类别的预设置信度阈值的样本的类别预测为该类别时,该类别的召回率大于预设召回率和/或精确率大于预设精确率。本发明实施例中,在得到待分类图像为各类别的置信度后,进行图像分类时,是根据各类别的预设置信度阈值与待分类图像为该类别的置信度的大小关系进行的,而上述各类别的预设置信度阈值为根据利用卷积神经网络模型、对阈值调节样本集进行预测得到的针对各类别的预测结果,调节得到使得召回率大于或等于预设召回率和/或精确率大于或等于预设精确率的各类别的置信度,因此,基于各类别的预设置信度阈值与待分类图像为该类别的置信度的大小关系,确定待分类图片的类别,可以在保证准确度的前提下,提高对各类别图像的检出率。

本发明所提供的图像分类方法、装置、电子设备、计算机可读存储介质以及包含指令的计算机程序产品实施例不仅可应用于对图像或者传统的视频内容进行分类检测,同时,随着网络技术和智能移动平台的发展,直播作为一种新型的多媒体平台,越来越普及,因此,还可以将本发明的上述实施例运用于直播视频分类检测及管理等领域,以提高直播视频中检测出违规内容的能力。

在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行上述计算机程序指令时,全部或部分地产生按照本发明实施例上述的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(英文:digitalsubscriberline,简称:dsl))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。上述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。上述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,数字视频光盘(英文:digitalvideodisc,简称:dvd))、或者半导体介质(例如固态硬盘(英文:solidstatedisk,简称:ssd))等。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备、存储介质以及计算机程序产品实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1