色情图片鉴定方法、电子装置及可读存储介质与流程

文档序号:15348924发布日期:2018-09-04 23:05阅读:962来源:国知局

本发明涉及计算机技术领域,尤其涉及一种色情图片鉴定方法、电子装置及可读存储介质。



背景技术:

目前,对于大型互联网金融企业,会涉及到大量业务图片,而业务图片中有可能会夹杂色情图片,影响恶劣,必须有效鉴定并剔除。传统的色情图片鉴定方式是由人工对业务图片进行逐一查看以筛选出其中的色情图片,这种人工检测成本高,且比较耗时,效率较低。



技术实现要素:

本发明的目的在于提供一种色情图片鉴定方法、电子装置及可读存储介质,旨在提高鉴定色情图片的效率。

为实现上述目的,本发明提供一种色情图片鉴定方法,所述色情图片鉴定方法包括:

在收到待鉴定图片后,检测所述待鉴定图片的图片格式,并利用预先训练的图片分类模型对所述待鉴定图片进行识别,输出所述待鉴定图片属于一个或多个预设图片类别的概率值;其中,所述图片分类模型为卷积神经网络模型,该卷积神经网络模型是预先利用所述预设图片类别的样本图片进行训练得到的;

根据所述待鉴定图片的图片格式和所述概率值,判断所述待鉴定图片是否属于色情图片。

优选地,所述图片格式包括黑白格式和非黑白格式,所述预设图片类别包括色情图片和非色情图片;

所述输出所述待鉴定图片属于一个或多个预设图片类别的概率值的步骤具体包括:输出所述待鉴定图片属于色情图片的概率值和非色情图片的概率值;

所述根据所述待鉴定图片的图片格式和所述概率值,判断所述待鉴定图片是否属于色情图片的步骤具体包括:

降低图片格式为黑白格式的图片属于色情图片的概率值;

根据降低后的概率值判断所述黑白格式的图片是否属于色情图片,以及根据所述概率值判断非黑白格式的图片是否属于色情图片。

优选地,所述根据降低后的概率值判断所述黑白格式的图片是否属于色情图片的步骤具体包括:

将所述降低后的概率值与第一预设阈值进行比较,若所述调低后的概率值大于所述预设第一阈值,则判断所述待鉴定图片属于色情图片;

若调低后的概率值小于或等于所述预设第一阈值,则判断所述待鉴定图片不属于色情图片。

优选地,所述图片格式包括黑白格式和非黑白格式,所述预设图片类别包括色情图片、性感图片、和正常图片;

所述输出所述待鉴定图片属于一个或多个预设图片类别的概率值的步骤具体包括:输出所述待鉴定图片属于色情图片的概率值、性感图片的概率值、和正常图片的概率值;

所述根据所述待鉴定图片的图片格式和所述概率值,判断所述待鉴定图片是否属于色情图片的步骤具体包括:

降低图片格式为黑白格式的图片属于色情图片的概率值;

根据降低后的概率值判断所述黑白格式的图片是否属于色情图片,以及根据所述概率值判断非黑白格式的图片是否属于色情图片。

优选地,所述根据降低后的概率值判断所述黑白格式的图片是否属于色情图片的步骤具体包括:

将所述降低后的概率值与第二预设阈值进行比较,若所述调低后的概率值大于所述预设第二阈值,则判断所述待鉴定图片属于色情图片;

若调低后的概率值小于或等于所述预设第二阈值,则判断所述待鉴定图片不属于色情图片。

优选地,所述图片分类模型的训练步骤如下:

a、收集预设数量的色情图片、性感图片、和正常图片作为样本图片,并在各个样本图片上标注对应的图片类别;

b、对各个样本图片进行图片预处理;

c、将预处理后的样本图片分为第一比例的训练集和第二比例的验证集;

d、利用所述训练集训练卷积神经网络模型;

e、利用所述验证集验证训练的卷积神经网络模型的准确率,若准确率大于或者等于预设准确率,则训练结束,并将训练好的卷积神经网络模型作为图片分类模型;若准确率小于预设准确率,则重新收集样本图片并重复执行上述步骤b、c、d、e。

优选地,当所述待鉴定图片为动态图片时,还包括以下步骤:

将所述待鉴定图片截帧成多张图片,检测截帧的每一张图片的图片格式,并分别利用预先训练的图片分类模型对截帧的多张图片进行识别,输出截帧的每一张图片属于各个预设图片类别的概率值;

根据所述截帧的每一张图片的图片格式和所述概率值,判断所述待鉴定图片是否属于色情图片。

优选地,所述根据所述截帧的每一张图片的图片格式和所述概率值,判断所述待鉴定图片是否属于色情图片的步骤具体包括:

根据所述截帧的每一张图片的图片格式和所述概率值,判断截帧的图片中是否存在属于色情图片的图片;

若存在,则判定所述待鉴定图片属于色情图片;否则,判断所述待鉴定图片不属于色情图片;或者

根据所述截帧的每一张图片的图片格式和所述概率值,判断截帧的图片中色情图片概率值大于预设值的图片是否超过两张;

若是,则判定所述待鉴定图片属于色情图片;否则,判断所述待鉴定图片不属于色情图片。

此外,为实现上述目的,本发明还提供一种电子装置,所述电子装置包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的色情图片鉴定系统,所述色情图片鉴定系统被所述处理器执行时实现如下步骤:

在收到待鉴定图片后,检测所述待鉴定图片的图片格式,并利用预先训练的图片分类模型对所述待鉴定图片进行识别,输出所述待鉴定图片属于一个或多个预设图片类别的概率值;其中,所述图片分类模型为卷积神经网络模型,该卷积神经网络模型是预先利用所述预设图片类别的样本图片进行训练得到的;

根据所述待鉴定图片的图片格式和所述概率值,判断所述待鉴定图片是否属于色情图片。

进一步地,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有色情图片鉴定系统,所述色情图片鉴定系统可被至少一个处理器执行,以使所述至少一个处理器执行如上述的色情图片鉴定方法的步骤。

本发明提出的色情图片鉴定方法、系统及可读存储介质,通过预先训练的图片分类模型对待鉴定图片进行识别,输出所述待鉴定图片属于各个预设图片类别的概率;并检测所述待鉴定图片的图片格式;根据所述待鉴定图片属于各个预设图片类别的概率以及所述待鉴定图片的图片格式,并基于预设规则判断所述待鉴定图片是否属于色情图片。由于本发明能识别出待鉴定图片属于一个或多个预设图片类别的概率,并结合待鉴定图片的图片格式来进行综合鉴定,能更加准确有效地判断出所述待鉴定图片是否属于色情图片。而且,无需人工进行检测,能自动进行色情图片鉴定,有效提高检测效率。

附图说明

图1为本发明色情图片鉴定系统10较佳实施例的运行环境示意图;

图2为本发明色情图片鉴定方法一实施例的流程示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

需要说明的是,在本发明中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。

本发明提供一种色情图片鉴定系统。请参阅图1,是本发明色情图片鉴定系统10较佳实施例的运行环境示意图。

在本实施例中,所述的色情图片鉴定系统10安装并运行于电子装置1中。该电子装置1可包括,但不仅限于,存储器11、处理器12及显示器13。图1仅示出了具有组件11-13的电子装置1,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。

所述存储器11为至少一种类型的可读计算机存储介质,所述存储器11在一些实施例中可以是所述电子装置1的内部存储单元,例如该电子装置1的硬盘或内存。所述存储器11在另一些实施例中也可以是所述电子装置1的外部存储设备,例如所述电子装置1上配备的插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)等。进一步地,所述存储器11还可以既包括所述电子装置1的内部存储单元也包括外部存储设备。所述存储器11用于存储安装于所述电子装置1的应用软件及各类数据,例如所述色情图片鉴定系统10的程序代码等。所述存储器11还可以用于暂时地存储已经输出或者将要输出的数据。

所述处理器12在一些实施例中可以是一中央处理器(centralprocessingunit,cpu),微处理器或其他数据处理芯片,用于运行所述存储器11中存储的程序代码或处理数据,例如执行所述色情图片鉴定系统10等。

所述显示器13在一些实施例中可以是led显示器、液晶显示器、触控式液晶显示器以及oled(organiclight-emittingdiode,有机发光二极管)触摸器等。所述显示器13用于显示在所述电子装置1中处理的信息以及用于显示可视化的用户界面,例如识别出的待鉴定图片属于各个预设图片类别的概率、所述待鉴定图片的图片格式、鉴定结果等。所述电子装置1的部件11-13通过系统总线相互通信。

色情图片鉴定系统10包括至少一个存储在所述存储器11中的计算机可读指令,该至少一个计算机可读指令可被所述处理器12执行,以实现本申请各实施例。

其中,上述色情图片鉴定系统10被所述处理器12执行时实现如下步骤:

步骤s1,在收到待鉴定图片后,检测所述待鉴定图片的图片格式,并利用预先训练的图片分类模型对所述待鉴定图片进行识别,输出所述待鉴定图片属于一个或多个预设图片类别的概率值;其中,所述图片分类模型为卷积神经网络模型,该卷积神经网络模型是预先利用所述预设图片类别的样本图片进行训练得到的。

本实施例中,色情图片鉴定系统接收用户发出的包含待鉴定图片的色情图片鉴定请求,例如,接收用户通过手机、平板电脑、自助终端设备等终端发送的色情图片鉴定请求,如接收用户在手机、平板电脑、自助终端设备等终端中预先安装的客户端上发送来的色情图片鉴定请求,或接收用户在手机、平板电脑、自助终端设备等终端中的浏览器系统上发送来的色情图片鉴定请求。

色情图片鉴定系统在收到用户发出的色情图片鉴定请求后,利用预先训练好的图片分类模型对收到的待鉴定图片进行识别,输出所述待鉴定图片属于各个预设图片类别(色情图片和非色情图片)的概率。该图片分类模型可预先通过对大量标注有不同预设图片类别(色情图片和非色情图片)的预设数量样本图片进行识别来不断进行训练、学习、验证、优化等,以将其训练成能有效输出所述待鉴定图片属于各个预设图片类别(色情图片和非色情图片)的概率的模型。例如,该图片分类模型可采用深度卷积神经网络模型(convolutionalneuralnetwork,cnn)模型等。

同时,可检测所述待鉴定图片的图片格式,所述图片格式包括黑白照片和彩色照片。例如,通过判断rgb值的算法,判断待鉴定图片是否是黑白照片或是彩色照片,并且对黑白照片或者彩色照片进行标记。具体地,判断待鉴定图片是否是黑白照片或是彩色照片的方式如下:若判断照片中像素的rgb值全为0或1,则判断待鉴定图片是黑白照片,否则为彩色照片。

步骤s2,根据所述待鉴定图片的图片格式和所述概率值,判断所述待鉴定图片是否属于色情图片。例如,由于色情图片一般均为彩色照片,色情图片为黑白照片的概率较低,因此,若判断出待鉴定图片的图片格式为黑白图片,则将所述图片分类模型输出的该待鉴定图片属于色情图片类别的概率调低,若该待鉴定图片属于色情图片类别的概率调低后仍小于预设阈值(如50%),则判定该待鉴定图片不属于色情图片;若该待鉴定图片属于色情图片类别的概率调低后大于预设阈值(如50%),则判定该待鉴定图片属于色情图片。若判断出待鉴定图片的图片格式为彩色照片,则直接将所述图片分类模型输出的该待鉴定图片属于色情图片类别的概率值与预设阈值(如60%)进行比较,若小于预设阈值(如60%),则判定该待鉴定图片不属于色情图片;若大于或等于预设阈值(如60%),则判定该待鉴定图片属于色情图片。

与现有技术相比,本实施例通过预先训练的图片分类模型对待鉴定图片进行识别,输出所述待鉴定图片属于各个预设图片类别如色情图片和非色情图片的概率;并检测所述待鉴定图片的图片格式如黑白照片或彩色照片;根据所述待鉴定图片属于各个预设图片类别的概率以及所述待鉴定图片的图片格式,并基于预设规则判断所述待鉴定图片是否属于色情图片。由于色情图片为黑白照片的概率较低,本发明能识别出待鉴定图片属于色情图片和非色情图片的概率,并结合待鉴定图片的图片格式如黑白照片或彩色照片来进行综合鉴定,能更加准确有效地判断出所述待鉴定图片是否属于色情图片。而且,无需人工进行检测,能自动进行色情图片鉴定,有效提高检测效率。

在一可选的实施例中,在上述图1的实施例的基础上,所述预先训练的图片分类模型的训练步骤如下:

a、为各个预设图片类别设定对应的预设数量的样本图片,为每个样本图片标注对应的预设图片类别;其中,所述预设图片类别包括色情图片、性感图片和正常图片;

b、将各个样本图片进行图片预处理以获得待模型训练的训练图片;

c、将所有训练图片分为第一比例(例如,75%)的训练集和第二比例的验证集(例如,25%);

d、利用所述训练集训练卷积神经网络模型;

e、利用所述验证集验证训练的卷积神经网络模型的准确率,若准确率大于或者等于预设准确率,则训练结束,将训练好的卷积神经网络模型作为图片分类模型,或者,若准确率小于预设准确率,则增加各个预设图片类别对应的样本图片数量并重新执行上述步骤b、c、d、e,直至训练的卷积神经网络模型的准确率大于或者等于预设准确率。

具体地,本实施例中在建立cnn图片分类模型时,首先准备大量不同类别的图片,如各准备10万张分类为色情、性感、正常类别的样本图片,并对每张图片所属的类别进行标记,例如,可按如下方式标记,0:色情;1:性感;2:正常。其中,正常类别的图片可包括自然、艺术、死体等图片;性感类别的图片可包括经界定不属于色情图片但介于色情与正常之间的图片,如写真类图片;色情类别的图片即为经界定属于色情的图片,为本实施例中图片识别的重点。准备好样本图片后,可对样本图片进行各种预处理,如剪裁为大小统一(将图片全部都resize成100x100大小)或像素统一等规格的训练图片。利用预处理后的训练图片及其标注的类别(0:色情;1:性感;2:正常),训练预设模型结构的卷积神经网络(cnn)模型。例如,在一种可选的实施方式中,训练过程如下:

(1)建立卷积核、偏差矩阵;

(2)利用建立的卷积核、偏差矩阵与训练图片进行卷积运算;

(3)通过relu的激活函数矫正卷积运算的结果;

(4)池化即pooling操作,pooling是一种在保留图像大部分重要信息的基础上缩小图像的方法。本实施例中池化方式包括但不限于meanpooling(均值采样)、maxpooling(最大值采样)、overlapping(重叠采样)、l2pooling(均方采样)、localcontrastnormalization(归一化采样)、stochasticpooling(随即采样)、def-pooling(形变约束采样)等等。

(5)重复上述(1)~(4)3次;

(6)直至训练的模型的价值函数梯度下降,结束模型训练。

此外,在模型上线应用过程中,若业务系统发现异常图片如色情图片后,可补充发现的异常图片继续对该卷积神经网络(cnn)模型进行训练,以不断提升该卷积神经网络(cnn)模型的识别精度。

建立cnn图片分类模型后,即可利用cnn图片分类模型进行图片分类。将待鉴定图片输入至训练好的cnn图片分类模型,可通过训练好的cnn图片分类模型输出该待鉴定图片属于各个预设图片类别的概率,即该待鉴定图片属于色情类别的概率p0,该待鉴定图片属于性感类别的概率p1,该待鉴定图片属于正常类别的概率p2。

同时,可对待鉴定图片进行图片格式判断,本实施例中,在判断待鉴定图片是黑白照片或彩色照片的基础上,还可判断待鉴定图片是否为动态图片如gif等类型的图片,如果判断该待鉴定图片是动态图片如gif类型,则将gif动图截帧成多张图片,以备后续使用。具体地,判断待鉴定图片是否为动态图片的方式有两种:一是通过待鉴定图片的文件后缀名来判断,二是通过待鉴定图片的二进制格式的文件头来判断。

在利用cnn图片分类模型输出待鉴定图片属于各个预设图片类别(色情、性感、正常)的概率(p0,p1,p2),并判断出待鉴定图片的格式(黑白照片或彩色照片,或动态照片)后,可综合(p0,p1,p2)及待鉴定图片的格式,以及预设规则最终鉴定出待鉴定图片是否为色情图片。具体地:

由于色情图片一般均为彩色照片,色情图片为黑白照片的概率较低,因此,若判断出待鉴定图片为黑白图片,则将cnn图片分类模型输出的该待鉴定图片属于色情类别的概率p0的值调低,例如,可向下调整10%,并设定若调低后的p0小于第一阈值,则判定该待鉴定图片不属于色情类别,即p0*90%<50%,则不判定该待鉴定图片为色情图片。若调低后的p0大于第一阈值,则判定该待鉴定图片属于色情类别,即p0*90%>50%,则判定该待鉴定图片为色情图片。

同时,可将cnn图片分类模型输出的该待鉴定图片属于性感和正常类别的概率上调10%。获取到调整后待鉴定图片属于各个预设图片类别(色情、性感、正常)的概率(p0’,p1’,p2’)后,max(p0,p1,p2)对应的类型为鉴定的类型,该类型的置信率为max(p0,p1,p2),即(p0’,p1’,p2’)中的最大值对应的图片类别(色情、性感或正常)为最终鉴定出的该待鉴定图片的类别。需要说明的是,在满足上一步骤中调低后的p0大于第一阈值的基础上,无论(p0’,p1’,p2’)中的最大值对应的图片类别为哪种类别,最终鉴定出的该待鉴定图片的类别仍然为色情图片。

若判断出待鉴定图片为动态图片,则将该待鉴定图片如gif动图截帧成多张图片,对截帧的每一帧图片分别利用cnn图片分类模型输出属于各个预设图片类别(色情、性感、正常)的概率(p0,p1,p2),并判断每一帧图片属于黑白照片或是彩色照片,并利用上述规则方法对每一帧图片进行色情鉴定,根据该待鉴定图片如gif动图的每一帧图片的鉴定结果来综合判定该待鉴定图片如gif动图是否属于色情图片。例如,在一种可选的实施方式方式中,若有一帧图片被鉴定为色情类别,则直接判定该待鉴定图片如gif动图属于色情图片。在另一种可选的实施方式中,若有两帧图片的p0’均大于第二阈值(60%或70%),则判定该待鉴定图片如gif动图属于色情图片,等等。

本实施例中最终返回的结果包括:该待鉴定图片是否为色情图片,以及该待鉴定图片属于各个预设图片类别(色情、性感、正常)的概率(p0’,p1’,p2’)。在实际应用中不同的业务场景中,可根据需要人工设定第一阈值、第二阈值,以适用于严格或宽松的色情图片鉴定场景。如在一些要求严格的场景中,可根据概率(p0’,p1’,p2’)鉴定出属于性感类别的图片。

需要说明的是,当所述图片格式包括黑白格式和非黑白格式,所述预设图片类别包括色情图片和非色情图片时,输出所述待鉴定图片属于色情图片的概率值和非色情图片的概率值;降低图片格式为黑白格式的图片属于色情图片的概率值;将所述降低后的概率值与第一预设阈值进行比较,若所述调低后的概率值大于所述预设第一阈值,则判断所述待鉴定图片属于色情图片;若调低后的概率值小于或等于所述预设第一阈值,则判断所述待鉴定图片不属于色情图片。

当所述图片格式包括黑白格式和非黑白格式,所述预设图片类别包括色情图片、性感图片、和正常图片时,输出所述待鉴定图片属于色情图片的概率值、性感图片的概率值、和正常图片的概率值;降低图片格式为黑白格式的图片属于色情图片的概率值;将所述降低后的概率值与第二预设阈值进行比较,若所述调低后的概率值大于所述预设第二阈值,则判断所述待鉴定图片属于色情图片;若调低后的概率值小于或等于所述预设第二阈值,则判断所述待鉴定图片不属于色情图片。

其中,所述预设第一阈值与所述预设第二阈值可以相同也可以不同,例如,可设置所述预设第一阈值为40%,所述预设第二阈值为30%。

如图2所示,图2为本发明色情图片鉴定方法一实施例的流程示意图,该色情图片鉴定方法包括以下步骤:

步骤s10,在收到待鉴定图片后,检测所述待鉴定图片的图片格式,并利用预先训练的图片分类模型对所述待鉴定图片进行识别,输出所述待鉴定图片属于一个或多个预设图片类别的概率值;其中,所述图片分类模型为卷积神经网络模型,该卷积神经网络模型是预先利用所述预设图片类别的样本图片进行训练得到的。

本实施例中,色情图片鉴定系统接收用户发出的包含待鉴定图片的色情图片鉴定请求,例如,接收用户通过手机、平板电脑、自助终端设备等终端发送的色情图片鉴定请求,如接收用户在手机、平板电脑、自助终端设备等终端中预先安装的客户端上发送来的色情图片鉴定请求,或接收用户在手机、平板电脑、自助终端设备等终端中的浏览器系统上发送来的色情图片鉴定请求。

色情图片鉴定系统在收到用户发出的色情图片鉴定请求后,利用预先训练好的图片分类模型对收到的待鉴定图片进行识别,输出所述待鉴定图片属于各个预设图片类别(色情图片和非色情图片)的概率。该图片分类模型可预先通过对大量标注有不同预设图片类别(色情图片和非色情图片)的预设数量样本图片进行识别来不断进行训练、学习、验证、优化等,以将其训练成能有效输出所述待鉴定图片属于各个预设图片类别(色情图片和非色情图片)的概率的模型。例如,该图片分类模型可采用深度卷积神经网络模型(convolutionalneuralnetwork,cnn)模型等。

同时,可检测所述待鉴定图片的图片格式,所述图片格式包括黑白照片和彩色照片。例如,通过判断rgb值的算法,判断待鉴定图片是否是黑白照片或是彩色照片,并且对黑白照片或者彩色照片进行标记。具体地,判断待鉴定图片是否是黑白照片或是彩色照片的方式如下:若判断照片中像素的rgb值全为0或1,则判断待鉴定图片是黑白照片,否则为彩色照片。

步骤s20,根据所述待鉴定图片的图片格式和所述概率值,判断所述待鉴定图片是否属于色情图片。例如,由于色情图片一般均为彩色照片,色情图片为黑白照片的概率较低,因此,若判断出待鉴定图片的图片格式为黑白图片,则将所述图片分类模型输出的该待鉴定图片属于色情图片类别的概率调低,若该待鉴定图片属于色情图片类别的概率调低后仍小于预设阈值(如50%),则判定该待鉴定图片不属于色情图片;若该待鉴定图片属于色情图片类别的概率调低后大于预设阈值(如50%),则判定该待鉴定图片属于色情图片。若判断出待鉴定图片的图片格式为彩色照片,则直接将所述图片分类模型输出的该待鉴定图片属于色情图片类别的概率值与预设阈值(如60%)进行比较,若小于预设阈值(如60%),则判定该待鉴定图片不属于色情图片;若大于或等于预设阈值(如60%),则判定该待鉴定图片属于色情图片。

与现有技术相比,本实施例通过预先训练的图片分类模型对待鉴定图片进行识别,输出所述待鉴定图片属于各个预设图片类别如色情图片和非色情图片的概率;并检测所述待鉴定图片的图片格式如黑白照片或彩色照片;根据所述待鉴定图片属于各个预设图片类别的概率以及所述待鉴定图片的图片格式,并基于预设规则判断所述待鉴定图片是否属于色情图片。由于色情图片为黑白照片的概率较低,本发明能识别出待鉴定图片属于色情图片和非色情图片的概率,并结合待鉴定图片的图片格式如黑白照片或彩色照片来进行综合鉴定,能更加准确有效地判断出所述待鉴定图片是否属于色情图片。而且,无需人工进行检测,能自动进行色情图片鉴定,有效提高检测效率。

在一可选的实施例中,在上述实施例的基础上,所述预先训练的图片分类模型的训练步骤如下:

a、为各个预设图片类别设定对应的预设数量的样本图片,为每个样本图片标注对应的预设图片类别;其中,所述预设图片类别包括色情图片、性感图片和正常图片;

b、将各个样本图片进行图片预处理以获得待模型训练的训练图片;

c、将所有训练图片分为第一比例(例如,75%)的训练集和第二比例的验证集(例如,25%);

d、利用所述训练集训练卷积神经网络模型;

e、利用所述验证集验证训练的卷积神经网络模型的准确率,若准确率大于或者等于预设准确率,则训练结束,将训练好的卷积神经网络模型作为图片分类模型,或者,若准确率小于预设准确率,则增加各个预设图片类别对应的样本图片数量并重新执行上述步骤b、c、d、e,直至训练的卷积神经网络模型的准确率大于或者等于预设准确率。

具体地,本实施例中在建立cnn图片分类模型时,首先准备大量不同类别的图片,如各准备10万张分类为色情、性感、正常类别的样本图片,并对每张图片所属的类别进行标记,例如,可按如下方式标记,0:色情;1:性感;2:正常。其中,正常类别的图片可包括自然、艺术、死体等图片;性感类别的图片可包括经界定不属于色情图片但介于色情与正常之间的图片,如写真类图片;色情类别的图片即为经界定属于色情的图片,为本实施例中图片识别的重点。准备好样本图片后,可对样本图片进行各种预处理,如剪裁为大小统一(将图片全部都resize成100x100大小)或像素统一等规格的训练图片。利用预处理后的训练图片及其标注的类别(0:色情;1:性感;2:正常),训练预设模型结构的卷积神经网络(cnn)模型。例如,在一种可选的实施方式中,训练过程如下:

(1)建立卷积核、偏差矩阵;

(2)利用建立的卷积核、偏差矩阵与训练图片进行卷积运算;

(3)通过relu的激活函数矫正卷积运算的结果;

(4)池化即pooling操作,pooling是一种在保留图像大部分重要信息的基础上缩小图像的方法。本实施例中池化方式包括但不限于meanpooling(均值采样)、maxpooling(最大值采样)、overlapping(重叠采样)、l2pooling(均方采样)、localcontrastnormalization(归一化采样)、stochasticpooling(随即采样)、def-pooling(形变约束采样)等等。

(5)重复上述(1)~(4)3次;

(6)直至训练的模型的价值函数梯度下降,结束模型训练。

此外,在模型上线应用过程中,若业务系统发现异常图片如色情图片后,可补充发现的异常图片继续对该卷积神经网络(cnn)模型进行训练,以不断提升该卷积神经网络(cnn)模型的识别精度。

建立cnn图片分类模型后,即可利用cnn图片分类模型进行图片分类。将待鉴定图片输入至训练好的cnn图片分类模型,可通过训练好的cnn图片分类模型输出该待鉴定图片属于各个预设图片类别的概率,即该待鉴定图片属于色情类别的概率p0,该待鉴定图片属于性感类别的概率p1,该待鉴定图片属于正常类别的概率p2。

同时,可对待鉴定图片进行图片格式判断,本实施例中,在判断待鉴定图片是黑白照片或彩色照片的基础上,还可判断待鉴定图片是否为动态图片如gif等类型的图片,如果判断该待鉴定图片是动态图片如gif类型,则将gif动图截帧成多张图片,以备后续使用。具体地,判断待鉴定图片是否为动态图片的方式有两种:一是通过待鉴定图片的文件后缀名来判断,二是通过待鉴定图片的二进制格式的文件头来判断。

在利用cnn图片分类模型输出待鉴定图片属于各个预设图片类别(色情、性感、正常)的概率(p0,p1,p2),并判断出待鉴定图片的格式(黑白照片或彩色照片,或动态照片)后,可综合(p0,p1,p2)及待鉴定图片的格式,以及预设规则最终鉴定出待鉴定图片是否为色情图片。具体地:

由于色情图片一般均为彩色照片,色情图片为黑白照片的概率较低,因此,若判断出待鉴定图片为黑白图片,则将cnn图片分类模型输出的该待鉴定图片属于色情类别的概率p0的值调低,例如,可向下调整10%,并设定若调低后的p0小于第一阈值,则判定该待鉴定图片不属于色情类别,即p0*90%<50%,则不判定该待鉴定图片为色情图片。若调低后的p0大于第一阈值,则判定该待鉴定图片属于色情类别,即p0*90%>50%,则判定该待鉴定图片为色情图片。

同时,可将cnn图片分类模型输出的该待鉴定图片属于性感和正常类别的概率上调10%。获取到调整后待鉴定图片属于各个预设图片类别(色情、性感、正常)的概率(p0’,p1’,p2’)后,max(p0,p1,p2)对应的类型为鉴定的类型,该类型的置信率为max(p0,p1,p2),即(p0’,p1’,p2’)中的最大值对应的图片类别(色情、性感或正常)为最终鉴定出的该待鉴定图片的类别。需要说明的是,在满足上一步骤中调低后的p0大于第一阈值的基础上,无论(p0’,p1’,p2’)中的最大值对应的图片类别为哪种类别,最终鉴定出的该待鉴定图片的类别仍然为色情图片。

若判断出待鉴定图片为动态图片,则将该待鉴定图片如gif动图截帧成多张图片,对截帧的每一帧图片分别利用cnn图片分类模型输出属于各个预设图片类别(色情、性感、正常)的概率(p0,p1,p2),并判断每一帧图片属于黑白照片或是彩色照片,并利用上述规则方法对每一帧图片进行色情鉴定,根据该待鉴定图片如gif动图的每一帧图片的鉴定结果来综合判定该待鉴定图片如gif动图是否属于色情图片。例如,在一种可选的实施方式方式中,若有一帧图片被鉴定为色情类别,则直接判定该待鉴定图片如gif动图属于色情图片。在另一种可选的实施方式中,若有两帧图片的p0’均大于第二阈值(60%或70%),则判定该待鉴定图片如gif动图属于色情图片,等等。

本实施例中最终返回的结果包括:该待鉴定图片是否为色情图片,以及该待鉴定图片属于各个预设图片类别(色情、性感、正常)的概率(p0’,p1’,p2’)。在实际应用中不同的业务场景中,可根据需要人工设定第一阈值、第二阈值,以适用于严格或宽松的色情图片鉴定场景。如在一些要求严格的场景中,可根据概率(p0’,p1’,p2’)鉴定出属于性感类别的图片。

需要说明的是,当所述图片格式包括黑白格式和非黑白格式,所述预设图片类别包括色情图片和非色情图片时,输出所述待鉴定图片属于色情图片的概率值和非色情图片的概率值;降低图片格式为黑白格式的图片属于色情图片的概率值;将所述降低后的概率值与第一预设阈值进行比较,若所述调低后的概率值大于所述预设第一阈值,则判断所述待鉴定图片属于色情图片;若调低后的概率值小于或等于所述预设第一阈值,则判断所述待鉴定图片不属于色情图片。

当所述图片格式包括黑白格式和非黑白格式,所述预设图片类别包括色情图片、性感图片、和正常图片时,输出所述待鉴定图片属于色情图片的概率值、性感图片的概率值、和正常图片的概率值;降低图片格式为黑白格式的图片属于色情图片的概率值;将所述降低后的概率值与第二预设阈值进行比较,若所述调低后的概率值大于所述预设第二阈值,则判断所述待鉴定图片属于色情图片;若调低后的概率值小于或等于所述预设第二阈值,则判断所述待鉴定图片不属于色情图片。

其中,所述预设第一阈值与所述预设第二阈值可以相同也可以不同,例如,可设置所述预设第一阈值为40%,所述预设第二阈值为30%。

此外,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有色情图片鉴定系统,所述色情图片鉴定系统可被至少一个处理器执行,以使所述至少一个处理器执行如上述实施例中的色情图片鉴定方法的步骤,该色情图片鉴定方法的步骤s10、s20、s30等具体实施过程如上文所述,在此不再赘述。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件来实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。

以上参照附图说明了本发明的优选实施例,并非因此局限本发明的权利范围。上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。另外,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。

本领域技术人员不脱离本发明的范围和实质,可以有多种变型方案实现本发明,比如作为一个实施例的特征可用于另一实施例而得到又一实施例。凡在运用本发明的技术构思之内所作的任何修改、等同替换和改进,均应在本发明的权利范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1