非法图像识别方法、装置、设备和计算机可读存储介质与流程

文档序号：21040603发布日期：2020-06-09 20:39阅读：263来源：国知局

本发明涉及人工智能(artificialintelligence，ai)技术领域，尤其涉及一种非法图像识别方法、装置、设备和计算机可读存储介质。

背景技术：

随着互联网技术的快速发展，我们往往可以通过网络查询和掌握大量信息，然而，大量的非法网站和非法图片(例如为六合彩等非法涉赌图片等等)也会随着网络大肆传播，不仅污染网络环境，甚至造成违法犯罪等严重后果。为净化网络环境，有效扼制非法图片在网络上的传播，现有技术往往会采用图像识别等技术对网络中的图片进行识别分类，并将识别到的非法图片进行拦截或召回等等。

现有的图像识别技术大多基于深度卷积神经网络，然而深度卷积神经网络参数众多，结构复杂，往往需要大量的样本来进行训练。但是，由于非法图片的特殊性，能够获取到的样本数量通常会有所不足且质量较差，因此训练过程将会变得异常困难，训练完成的模型对非法图像的识别准确率也较低，导致无法保质保量的召回或者拦截网络中的非法图片。

技术实现要素：

本发明实施例提供了一种非法图像识别方法、装置、设备及计算机可读存储介质，可以较大程度的丰富训练样本的数量和内容，从而提升模型的训练效率以及模型对图像识别分类的准确率。

一方面，本发明实施例提供了一种非法图像识别方法，该非法图像识别方法包括：

预先通过第一样本集对初始化的神经网络进行训练，得到非法图像识别模型；其中，所述第一样本集包括正样本集和负样本集，所述正样本集包括对非法图像进行数据增强处理得到的扩展样本图像，一所述非法图像对应至少两张扩展样本图像；

基于所述非法图像识别模型，进行非法图像识别。

其中，所述数据增强处理包括图像裁剪处理、图像旋转处理和添加高斯噪声处理中的至少一种。

其中，所述负样本集包括多张正常图像；所述预先通过第一样本集对初始化的神经网络进行训练，得到非法图像识别模型，包括：

对所述第一样本集中的多张图像进行图像特征提取，得到所述多张图像各自对应的卷积特征；所述多张图像包括所述正样本集中的多张扩展样本图像和所述负样本集中的多张正常图像；

基于所述多张图像各自对应的卷积特征，确定所述多张图像各自属于所述非法图像的概率值；

以所述多张图像各自属于所述非法图像或所述正常图像为标签，根据所述多张图像各自属于所述非法图像的概率值与所述多张图像各自的标签之间的差异，修正所述神经网络中的一个或多个参数，得到所述非法图像识别模型。

其中，所述基于所述非法图像识别模型，进行非法图像识别，包括：

获取待识别图像；

通过所述非法图像识别模型，确定所述待识别图像属于所述非法图像的概率值；

根据预设阈值和所述待识别图像属于所述非法图像的概率值，确定所述待识别图像的识别结果。

其中，所述根据预设阈值和所述待识别图像属于所述非法图像的概率值，确定所述待识别图像的识别结果，包括：

若所述待识别图像属于所述非法图像的概率值大于所述预设阈值，则确定所述待识别图像属于所述非法图像，并对所述待识别图像进行召回；

若所述待识别图像属于所述非法图像的概率值小于或等于所述预设阈值，则确定所述待识别图像属于所述正常图像。

另一方面，本发明实施例提供了一种非法图像识别装置，该非法图像识别装置包括：

训练模块，用于预先通过第一样本集对初始化的神经网络进行训练，得到非法图像识别模型；其中，所述第一样本集包括正样本集和负样本集，所述正样本集包括对非法图像进行数据增强处理得到的扩展样本图像，一所述非法图像对应至少两张扩展样本图像；

识别模块，用于基于所述非法图像识别模型，进行非法图像识别。

其中，所述数据增强处理包括图像裁剪处理、图像旋转处理和添加高斯噪声处理中的至少一种。

其中，所述负样本集包括多张正常图像；所述训练模块，包括：

特征提取单元，用于对所述第一样本集中的多张图像进行图像特征提取，得到所述多张图像各自对应的卷积特征；所述多张图像包括所述正样本集中的多张扩展样本图像和所述负样本集中的多张正常图像；

第一确定单元，用于基于所述多张图像各自对应的卷积特征，确定所述多张图像各自属于所述非法图像的概率值；

修正单元，用于以所述多张图像各自属于所述非法图像或所述正常图像为标签，根据所述多张图像各自属于所述非法图像的概率值与所述多张图像各自的标签之间的差异，修正所述神经网络中的一个或多个参数，得到所述非法图像识别模型。

其中，所述识别模块，包括：

获取单元，用于获取待识别图像；

第二确定单元，用于通过所述非法图像识别模型，确定所述待识别图像属于所述非法图像的概率值；

第三确定单元，用于根据预设阈值和所述待识别图像属于所述非法图像的概率值，确定所述待识别图像的识别结果。

其中，所述第三确定单元，包括：

第一确定子单元，用于若所述待识别图像属于所述非法图像的概率值大于所述预设阈值，则确定所述待识别图像属于所述非法图像，并对所述待识别图像进行召回；

第二确定子单元，用于若所述待识别图像属于所述非法图像的概率值小于或等于所述预设阈值，则确定所述待识别图像属于所述正常图像。

再一方面，本发明实施例提供了一种计算设备，其特征在于，包括处理器和存储器，所述处理器和存储器相连，其中，所述存储器用于存储程序代码，所述处理器用于调用所述程序代码，以执行上述一方面中所述的方法。

再一方面，本发明实施例提供了一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，该计算机程序被处理器执行时实现上述一方面中所述的方法。

本发明实施例提供了一种非法图像识别方法，可以通过对原始样本(例如可以包括多张非法图像)进行数据增强处理(例如可以包括图像裁剪处理、图像旋转处理和添加高斯噪声处理等等)，从而得到大量新样本(例如可以包括每一张非法图像各自对应的至少两张扩展样本图像)。实现在数量稀少、内容薄弱的原始样本的基础上，获得数量多且内容丰富的新样本。该大量新样本与原始样本可以均属于非法图像(例如为六合彩等非法涉赌图像等)，可以用于基于卷积神经网络的非法图像识别模型的训练。由此，对比现有技术中，在属于非法图像的训练样本难以获得，数量稀少的情况下，仅仅通过获取到的少量原始样本进行非法图像识别模型的训练而言。本发明实施例可以通过数据增强处理，在少量原始样本的基础上，获得内容丰富且数量充足的训练样本，提升模型训练的效率和该模型对非法图像识别的准确率。例如可以高效的识别出网络中的六合彩等非法图像并对其进行召回或拦截等等，有效扼制非法图像在网络上的传播，维护网络环境，减少违法犯罪事件等等。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种非法图像识别方法的系统架构图；

图2是本发明实施例提供的一种非法图像识别方法的应用场景示意图；

图3是本发明实施例提供的一种模型训练的整体流程示意图；

图4是本发明实施例提供的一种非法图像识别方法的流程示意图；

图5是本发明实施例提供的另一种非法图像识别方法的流程示意图；

图6是本发明实施例提供的一种图像裁剪处理的示意图；

图7是本发明实施例提供的另一种图像裁剪处理的示意图；

图8是本发明实施例提供而一种图像旋转处理的示意图；

图9是本发明实施例提供的一种添加高斯噪声处理的示意图；

图10是本发明实施例提供的一种卷积神经网络的示意图；

图11是本发明实施例提供的一种图像识别的流程示意图；

图12是本发明实施例提供的一种非法图像识别装置的结构示意图；

图13是本发明实施例提供的一种计算设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参见图1，图1是本发明实施例提供的一种非法图像识别方法的系统架构图，本发明实施例的技术方案可以在图1举例所示的系统架构或类似的系统架构中具体实施。如图1所示，该系统架构可以包括服务器100a和多个计算设备，如图1所示，具体可以包括计算设备200a、200b和200c。其中，计算设备200a、200b和200c中的任意一个计算设备均可以通过有线或者无线的方式从服务器100a中获取用于模型训练的训练样本，例如可以包括多张非法图像。可选的，该多张非法图像也可存储于计算设备200a、200b和200c本地，可直接从计算设备200a、200b和200c的存储器中获取。可选的，计算设备200a、200b和200c还可以通过有线或者无线的方式从其他的设备(例如为摄像机、智能手机和平板电脑等等设备)中获取该多张非法图像，等等，本发明实施例对此不作具体限定。然后，计算设备200a、200b和200c可以根据获取到的多张非法图像，通过数据增强技术，对多张非法图像中的全部或者部分非法图像进行数据增强处理(例如可以包括图像裁剪处理、图像旋转处理、图像水平/垂直翻转处理和添加高斯白噪声处理等等)，从而获得该非法图像经数据增强处理后对应的至少两张扩展样本图像(或者一张扩展样本图像，本发明实施例对此不作具体限定)。例如，该一张或多张扩展样本图像可以包括该非法图像按照不同的长宽比经裁剪处理后得到的图像，也可以包括该非法图像按照不同的旋转角度和旋转方向经旋转处理后得到的图像等等，本发明实施例对此不作具体限定。可选的，该多张非法图像中的每一张非法图像和该多张扩展样本图像中的每一张扩展样本图像可以均属于非法图像，该非法图像例如可以为六合彩等等涉赌图像。计算设备可以基于该第多张扩展样本图像，或者也可以同时基于该多张非法图像和该多张扩展样本图像(也即以该多张非法图像和该多张扩展样本图像作为模型训练的训练样本)，对初始化的神经网络进行训练，得到非法图像识别模型。显然，该非法图像识别模型可以用于对网络中的图像进行识别分类，判断该图像是否属于非法图像，等等。例如，该非法图像可以为六合彩等非法图像，则该非法图像识别模型可以识别网络中的六合彩图片，进一步的还可以对识别到的六合彩图片进行拦截或者召回等等，维护网络环境，扼制非法图片在网络上的传播等等。由此，计算设备200a、200b和200c实现了基于获取到的少量原始样本，通过数据增强处理获得大量丰富的新样本，并基于该大量的新样本，对初始化的神经网络(例如为分类卷积神经网络)进行训练，得到用于图像识别和分类的非法图像识别模型。有效提高了模型的训练效率和模型对非法图像识别的准确率，例如可以保证对网络中的六合彩等非法图像进行准确识别并拦截，维护网络环境，等等。

如上所述，其中，计算设备200a、200b和200c可以为具备上述功能的智能手机、智能可穿戴设备、平板电脑、膝上计算机以及台式电脑等。服务器100a可以是具备上述功能的一台服务器，也可以是由多台服务器组成的服务器集群，或者是一个云计算服务中心。服务器100a可以通过无线网络和有线网络与计算设备200a、200b和200c建立通信连接。

结合上述图1实施例对应的系统架构图，在一种可能的实施方式中，本发明实施例还提供了一种非法图像识别方法的应用场景示意图。请参见图2，图2是本发明实施例提供的一种非法图像识别方法的应用场景示意图。如图2所示，该计算设备可以为上述图1系统架构中的计算设备200a，该服务器可以为上述图1系统架构中的服务器100a。除此之外，在一种可能的实施方式中，本发明实施例还针对图1和图2实施例对应的方法和场景提供了一种模型训练的整体流程示意图。在一种可能的实施方式中，请参见图3，图3是本发明实施例提供的一种模型训练的整体流程示意图。下面将结合如图2所示的应用场景以及如图3所示的整体流程对本发明实施例提供的一种非法图像识别方法进行进一步详细阐述。

如图2所示，在一种可能的实施方式中，本次训练任务可以为获得用于对六合彩等非法赌博图片进行分类识别的非法图像识别模型(例如为分类卷积神经网络，或者称之为分类卷积神经网络模型)，从而实现对网络中传播的六合彩等非法赌博图片进行有效拦截、召回等。如图2所示，该计算设备可以从服务器100a获取本次训练用的多张非法图像，例如，该多张非法图像中的每一张非法图像均属于图2所示的六合彩。可选的，该计算设备还可以通过有线或者无线的方式从其他的设备(例如摄像机、智能手机和平板电脑等)中获取该多张非法图像，等等。例如，该多张非法图像可以为在网络中传播的已有图像(例如为各类非法赌博网站中的六合彩图像等)，也可以是工作人员在本次训练任务开始前通过摄像机或者智能手机等设备对实际生活中的六合彩进行拍摄所得的图像，等等，本发明实施例对此不作具体限定。然后，该计算设备可以对获取到的该多张非法图像中的全部或者部分非法图像进行数据增强处理，从而获得每一张进行数据增强处理的非法图像对应的多张扩展样本图像。例如，如图3所示，该数据增强处理可以包括图像裁剪、图像旋转和添加高斯噪声等等处理，可选的，在一些可能的实施方式中，该数据增强处理还可以包括图像翻转处理(例如图像水平翻转、图像垂直翻转和图像随机翻转等)等等，本发明实施例对此不作具体限定。可选的，经数据增强处理得到的多张扩展样本图像可以如图2所示，例如可以包括多张按照不同的裁剪区域、裁剪比例对非法图像进行裁剪处理后得到的扩展样本图像，还可以包括多张按照不同的旋转角度、旋转方向对非法图像进行旋转处理后得到的扩展样本图像，还可以包括多张按照随机像素扰动对非法图像添加高斯噪声处理后的扩展样本图像，等等，此处不再赘述。可以理解的是，该多张扩展样本图像为对非法图像进行数据增强处理后得到的图像，则该多张扩展样本图像中的每一张扩展样本图像与非法图像可以一同属于非法图像(例如图2所示，该多张扩展样本图像中的每一张扩展样本图像均属于六合彩)。如图3所示，该多张扩展样本图像可以作为本次训练的正样本(正样本表示训练中所需类别的样本，例如本次训练中均属于六合彩的扩展样本图像和非法图像)，或者该多张扩展样本图像和该多张非法图像可以一同作为本次训练的正样本。可选的，如图3所示，该计算设备还可以通过有线或者无线的方式从服务器或者其他设备中获取本次训练用的负样本(负样本表示训练中非所需类别的样本，例如本次训练中不属于六合彩的图像，也即正常图像)。可以理解的是，由于六合彩等非法图像的特殊性，其数量稀少，难以获得，而负样本(也即不属于六合彩的图像，例如环境、人像等等正常图像)在实际生活中较为常见，数量多，内容丰富且容易获得，由此导致正负样本的比例非常不一致，影响模型训练效率和模型的准确率。因此，可以通过本发明实施例提供的一种非法图像识别方法增加正样本的数量，丰富正样本的内容，而根据实际情况对负样本一般可以不进行数据增强处理，从而减少计算量，提高模型训练效率。例如，如图3所示，在一种可能的实施方式中，可以基于深度卷积神经网络(convolutionalneuralnetwork，cnn)，对模型进行训练，从而得到用于对例如六合彩等图像进行识别分类的非法图像识别模型。其中，卷积神经网络是一类主要包含卷积计算的前馈神经网络，具有强大的深层表征学习能力，常用于计算机视觉常见任务等等，其中，分类卷积神经网络常使用卷积神经网络学习任务中的表征，用于解决分类任务，例如本发明实施例中涉及的非法图像识别模型，可以用于解决六合彩和非六合彩的图像识别分类任务，等等。如图3所示，可选的，本发明实施例可以基于该正、负样本，并结合柔性最大值(softmax)损失函数和梯度下降算法等等，基于卷积神经网络对模型进行训练，最终得到非法图像识别模型。后续可以通过该非法图像识别模型对网络中的图像进行识别分类，输出识别结果(例如输出属于六合彩或者不属于六合彩的识别结果，等等)，进一步的还可以对识别到的属于六合彩的图像进行拦截、召回或者屏蔽等等，扼制六合彩等非法图片在网络上的传播，维护网络环境。

请参见图4，图4是本发明实施例提供的一种非法图像识别方法的流程示意图。如图4所示，该方法可应用于上述图1所述的系统架构中，其中的服务器可以为上述图1系统架构中的服务器100a，其中的计算设备可以为上述图1系统架构中的计算设备200a、200b和200c中的任意一个计算设备，可用于支持并执行图4中所示的方法流程。下面将结合图4从计算设备侧进行描述，该非法图像识别方法可以包括以下步骤s401-s403：

步骤s401，预先通过第一样本集对初始化的神经网络进行训练，得到非法图像识别模型。

具体的，计算设备预先通过第一样本集对初始化的神经网络进行训练，得到非法图像识别模型。可选的，该第一样本集包括正样本集和负样本集，该正样本集包括该计算设备对非法图像进行数据增强处理得到的扩展样本图像，一张非法图像可以对应至少两张扩展样本图像。可选的，该数据增强处理例如可以包括图像裁剪处理、图像旋转处理和添加高斯噪声处理等等。可选的，该正样本集还可以包括多张非法图像(也即该正样本集可以包括多张非法图像和该多张非法图像经数据增强处理后各自得到的多张扩展样本图像)。可选的，该负样本集可以包括多张正常图像(例如环境、人像等等不属于非法图像的正常图像)。可选的，该计算设备可以通过有线或者无线的方式从服务器获取该多张非法图像和该多张正常图像。该计算设备还可以通过有线或者无线的方式从其他设备(例如摄像机、智能手机和平板电脑等等)中获取该多张非法图像和该多张正常图像，等等，本发明实施例对此不作具体限定。例如，该多张非法图像可以为在网络中传播的已有图像(例如为各类非法赌博网站中的六合彩图像等)，也可以是工作人员在本次训练任务开始前通过摄像机或者智能手机等设备对实际生活中的六合彩进行拍摄所得的图像，还可以是根据用户举报或者反馈，从而收集到的六合彩等非法图像等等，此处不再赘述。该多张非法图像中的每一张非法图像均属于非法图像(例如可以为六合彩等数量稀少、难以获得的非法图像，也可以为涉及暴力、色情等数量稀少、难以获得的非法图像，等等)。通过正样本集和负样本集对初始化的神经网络进行训练所得到非法图像识别模型，可以用于对图像进行识别分类，例如可以用于确定网络中的图像是否为六合彩等非法图像等，并对确定为六合彩的图像进行拦截、召回和屏蔽等等，从而有效扼制六合彩等非法图像在网络上的传播，维护网络环境，减少违法犯罪事件。

步骤s402，基于非法图像识别模型，进行非法图像识别。

具体的，计算设备基于上述训练得到的非法图像识别模型，对待识别图像(例如网络中的图像)进行非法图像识别，确定该待识别图像是否属于非法图像(或者确定该待识别图像属于非法图像或者属于真诚图像)。例如确定该待识别图像是否为六合彩等非法涉赌图像。可选的，若确定该待识别图像为非法图像，还可以对该待识别图像进行拦截、召回和屏蔽等等。例如可以对网络中的六合彩等非法图像进行识别，进而对网络中的六合彩等非法图像进行准确、高效的拦截和召回等等，扼制六合彩等非法图像在网络中的传播，维护网络环境，减少违法犯罪事件等等。从而有效扼制六合彩等非法图像在网络上的传播，维护网络环境，减少违法犯罪事件。

请参见图5，图5是本发明实施例提供的另一种非法图像识别方法的流程示意图。如图5所示，该方法可应用于上述图1所述的系统架构中，其中的服务器可以为上述图1系统架构中的服务器100a，其中的计算设备可以为上述图1系统架构中的计算设备200a、200b和200c中的任意一个计算设备(图5中以计算设备200a为例)，可用于支持并执行图5中所示的方法流程。下面将结合图5从计算设备侧进行描述，该非法图像识别方法可以包括以下步骤s501-s506：

步骤s501，获取多张非法图像。

具体的，计算设备通过有线或者无线的方式从服务器获取本次训练任务所需的多张非法图像(例如图5所示的六合彩)。该计算设备还可以通过有线或者无线的方式从其他设备(例如摄像机、智能手机和平板电脑等等)中获取该多张非法图像和该多张正常图像，等等，本发明实施例对此不作具体限定。可选的，步骤s501可参考上述图4对应实施例中的步骤s401，此处不再进行赘述。

步骤s502，对所述多张非法图像进行数据增强处理，得到所述多张非法图像各自对应的多张扩展样本图像。

具体的，计算设备对获取到的多张非法图像中的每一张非法图像进行数据增强处理，得到该每一张非法图像各自对应的多张扩展样本图像。可选的，该多张扩展样本图像中的每一张扩展样本图像与非法图像可以一同属于非法图像(例如同属于六合彩等等)。可选的，该计算设备也可以对该多张非法图像中的部分非法图像进行数据增强处理，得到该部分非法图像中的每一张非法图像各自对应的一张或者多张扩展样本图像等等，本发明实施例对此不作具体限定。可选的，步骤s502可参考上述图4对应实施例中的步骤s401，此处不再进行赘述。

可选的，该数据增强处理可以包括图像裁剪处理，例如图像居中裁剪和图像随机裁剪等等常见的裁剪技术方案。请参见图6，图6是本发明实施例提供的一种图像裁剪处理的示意图。如图6所示，居中裁剪一般是围绕图像的中心，在一定的裁剪比例范围内，按照不同的裁剪比例在非法图像(也即原始图像)上裁剪出不同的区域，从而得到多张扩展样本图像。其中，裁剪比例的范围一般设定在0.4-0.9较为合适，例如，如图6所示，裁剪比例可以为0.4，表示裁剪出长宽为原图长宽的0.4倍的区域，且裁剪区域的中心(也即扩展样本图像的中心)与非法图像的中心重合。又例如，如图6所示，裁剪比例可以为0.5，表示裁剪出长宽为原图长宽的0.5倍的区域，且裁剪区域的中心(也即扩展样本图像的中心)与非法图像的中心重合。还例如，如图6所示，裁剪比例可以为0.8，表示裁剪出长宽为原图长宽的0.8倍的区域，且裁剪区域的中心(也即扩展样本图像的中心)与非法图像的中心重合。可选的，在一些可能的实施方式中，该裁剪比例可以为除0.4-0.9范围外的其他数值，本发明实施例对此不作具体限定。

可选的，请参见图7，图7是本发明实施例提供的另一种图像裁剪处理的示意图。如图7所示，随机裁剪一般是预先设置一个或多个固定尺寸，在非法图像(也即原始图像)上按照固定尺寸的切割模板进行随机切割，得到随机的切割区域(也即扩展样本图像)，且得到的随机区域的图像尺寸与预先设置的固定尺寸一致。例如，如图7所示，预先设置裁剪尺寸为680*560(也即裁剪长度为680，裁剪宽度为560)，通过随机裁剪可以得到非法图像中不同区域的尺寸为680*560的图像(也即扩展样本图像，例如图6所示的随机区域一、随机区域二和随机区域三)。可选的，可以根据实际情况设置不同尺寸的裁剪模板(也即不同裁剪长度和裁剪宽度的裁剪模板)，例如，具体可以包括680*560、1280*960、640*480、480*320、720*640、560*680、960*1280、480*640、320*480和640*720等等不同尺寸的裁剪模版。进而按照不同尺寸的裁剪模版对非法图像进行随机裁剪，获得多张扩展样本图像，由此大大增加了样本数量，丰富了样本内容。在一些可能的实施方式中，还可以包括除上述例举的尺寸以外，其他尺寸的裁剪模板，本发明实施例对此不作具体限定。可选的，在一些可能的实施方式中，还可以按照一定的裁剪比例(例如为0.3、0.5、0.6、0.8和0.9等等)对非法图像进行随机裁剪，等等。此外，在一些可能的实施方式中，图像裁剪处理还可以包括除上述居中裁剪和随机裁剪外的其他裁剪方法，本发明实施例对此不作具体限定。

可选的，该数据增强处理还可以包括图像旋转处理，请参见图8，图8是本发明实施例提供的一种图像旋转处理的示意图。如图8所示，图像旋转一般包括顺时针旋转和逆时针旋转，且一般是围绕非法图像(也即原始图像)的中心(也即以非法图像的中心为原点)，在一定的旋转角度范围内，按照不同的旋转角度和旋转方向将非法图像进行整体旋转，从而得到多张扩展样本图像。可选的，该旋转角度范围一般为0°-30°较为合适，例如，如图8所示，可以按照逆时针旋转10°、顺时针旋转10°、顺时针旋转5°和逆时针旋转5°的方案对该非法图像进行图像旋转处理，得到如图2所示的多张扩展样本图像(包括黑边填充)，由此大大增加了样本数量，丰富了样本内容。该多张扩展样本图像可以作为正样本用于例如六合彩识别网络的训练、学习，以提高训练效率和六合彩识别的准确率。

可选的，该数据增强处理还可以包括添加高斯噪声处理，请参见图9，图9是本发明实施例提供的一种添加高斯噪声处理的示意图。高斯噪声是一种常见的白噪声，对深度神经网络的训练非常有效。在一种可能的实施方式中，可以采用均值为0，方差为0.1的高斯白噪声按照一定的随机概率对非法图像进行随机扰动。例如，该随机概率可以为0.1(也即10％的概率)，则在该非法图像的每一个位置上产生0到1的随机数字，比如该非法图像为100*100的图像，则可以在该非法图像的共1000个位置上分别产生0到1的随机数字。如果某一位置上产生的随机数字小于该随机概率(也即小于0.1，例如该随机数字为0.05等)，则可以对该位置上的像素添加扰动，在高斯白噪声的方差为0.1的情况下，该扰动大小的范围可以为-13到13。例如，在该-13到13的范围内，随机抽取扰动数字，比如抽到数字8，则该位置上的像素可以在原始像素的基础上增加8像素(比如该位置上的原始像素为120，则添加扰动后，该位置上的像素变为128)。又比如抽到数字-7，则该位置上的像素可以在原始像素的基础上减少7像素(比如该位置上的原始像素为120，则添加扰动后，该位置上的像素变为113)，等等，此处不再赘述。可选的，在对非法图像进行添加高斯噪声处理后，需要保证最终图像(也即获得的扩展样本图像)中所有位置的像素大于或等于0，并且小于或等于255。可选的，如果该非法图像中某一位置上产生的随机数字大于或等于该随机概率(也即大于或等于0.1，例如该随机数字为0.2等)，则该位置上的像素保持不变。例如，如图9所示，在对非法图像进行添加高斯噪声处理后所获得的多张扩展样本图像中，相较于非法图像，扩展样本图像中的部分位置的像素大小发生了不同程度的改变，由此大大增加了样本数量，丰富了样本内容，扩大了像素范围，从而可以有效提高模型的训练效率和对图像识别分类的准确率等等。

可选的，上述各项数值(例如包括均值为0，方差为0.1，随机概率为0.1和扰动范围为-13到13，等等)仅仅为本发明实施例中较为合适的取值，在一些可能的实施方式中，该高斯白噪声的均值可以为除0以外的其他数值，该高斯白噪声的方差可以为除0.1以外的其他数值，该随机概率也可以为除0.1以外的其他数值，该扰动范围也可以为除-13到13以外的其他范围，等等，本发明实施例对此不作具体限定。

可选的，该数据增强处理还可以包括图像翻转处理，其中可以包括水平翻转、垂直翻转和随机翻转等等处理。例如围绕非法图像的垂直中心线进行水平翻转或围绕非法图像的水平中心线进行垂直翻转等等，本发明实施例对此不作具体限定。显然，通过数据增强处理可以在原本少量的非法图像的基础上获得大量丰富的扩展样本图像。其中，该大量的扩展样本图像可以作为模型训练的正样本，由此大大增加了正样本的数量，丰富了正样本的内容，从而提高模型训练的效率和模型的准确率。例如可以保证对网络中六合彩等非法图像的准确识别，进而对网络中的六合彩等非法图像进行准确、高效的拦截和召回等等，扼制六合彩等非法图像在网络中的传播，维护网络环境，减少违法犯罪事件等等。

步骤s503，获取第一样本集，所述第一样本集包括正样本集和负样本集。

具体的，计算设备获取第一样本集，该第一样本集可以包括正样本集和负样本集。其中，该正样本集可以包括上述多张非法图像中的每一张非法图像对应的一张或者多张扩展样本图像，或者多张非法图像中的部分非法图像对应的一张或者多张扩展样本图像，可选的，该正样本集还可以包括该多张非法图像(也即多张原始图像)，等等。可选的，如上所述，计算设备得到的多张非法图像和多张扩展样本图像可以存储于该计算设备本地，该计算设备可以通过访问存储器直接获得该多张非法图像和多张扩展样本图像，并将其制作成正样本集。其中，负样本集可以包括多张正常图像，该多张正常图像中的每一张正常图像属于正常图像(例如为图5所示的环境、城市外景和城市标语等正常图像)，或者说该每一张正常图像均不属于非法图像。例如该正样本集中的每一张非法图像和每一张扩展样本图像均属于六合彩，可以作为本次模型训练的正样本，而负样本集中的每一张正常图像均不属于六合彩，可以作为本次模型训练的负样本，等等。可选的，计算设备可以通过有线或者无线的方式从服务器中获取该负样本集，还可以通过有线或者无线的方式从其他设备(例如摄像机、智能手机、平板电脑、台式电脑等等)中获取该负样本集，本发明实施例对此不作具体限定。

步骤s504，通过第一样本集对初始化的神经网络进行训练，得到非法图像识别模型。

具体的，如上所述，在计算设备获取到第一样本集(例如包括上述的正样本集和负样本集)后，以所述正样本集和所述负样本集作为训练输入，以所述正样本集和所述负样本集中的每一张图像各自属于非法图像或正常图像为标签，对初始化的神经网络进行训练，得到非法图像识别模型。该每一张图像可以包括每一张扩展样本图像、每一张正常图像，还可以包括每一张非法图像。可选的，如上所述，每一张非法图像的标签为属于非法图像(例如为“1”)，每一张扩展样本图像的标签为属于非法图像(例如为“1”)，每一张正常图像的标签为属于正常图像(例如为“0”)。

可选的，在制作好训练样本(也即第一样本集)后，以及开始训练前，本发明实施例还可以基于本次训练任务设计一个深度卷积神经网络(也即可以为初始化的神经网络)。可选的，请参见图10，图10是本发明实施例提供的一种卷积神经网络的示意图。该卷积神经网络的学习和训练过程如图10所示，具体可以包括以下步骤s11-步骤s14：

步骤s11，卷积采样。

具体的，通过多层卷积神经网络对所述第一样本集中的多张图像(例如包括正样本集中的每一张非法图像、每一张扩展样本图像和负样本集中的每一张正常图像，或者正样本集中的部分非法图像、部分扩展样本图像和负样本集中的部分正常图像，等等)进行卷积采样，得到该多张图像各自对应的目标特征。

其中，卷积采样包括对该多张图像各自进行图像特征提取，得到多张图像各自的卷积特征，并通过对该多张图像各自的卷积特征进行特征采样，保留其中的典型特征，而忽略其他大量作用不大的特征，从而得到该多张图像各自的目标特征，使得特征量少而有效，有利于提高训练效率。

可选的，在一种可能的实施方式中，例如针对六合彩等文字特征较为明显的图像，可以仅仅采用三层卷积神经网络对所述第一样本集中的多张图像进行图像特征提取，如此，可以在保证图像特征提取质量的前提下，考虑实际情况设计更加小型轻量的神经网络，以减少计算量和训练成本。例如，该三层卷积神经网络可以包括第一层5*5的卷积神经网络(卷积核数可以为64)、第二层5*5的卷积神经网络(卷积核数可以为128)和第三层5*5的卷积神经网络(卷积核数可以为128)。可选的，在一些可能的实施方式中，还可以采用四层或者更多的卷积神经网络进行图像特征提取，也可以采用两层或者更少的卷积神经网络进行图像特征提取，本发明实施例对此不作具体限定。可选的，在将训练样本输入该神经网络进行训练之前，还可以对其中的每一张图像进行预处理，以保证训练质量。例如将每一张图像的尺寸都缩放为比如224*224的固定尺寸(例如，当预处理的图像固定尺寸为224*224，而某一张图像的原始尺寸为680*560时，则可将该图像进行缩小并用黑边填充至224*224的尺寸，等等)，并将每一张图像的像素均除以255(也即将每一张图像的像素范围由原先的0-255调整至0-1)，等等，本发明实施例对此不作具体限定。

可选的，该特征采样可以包括最大值采样(或者称之为最大值池化)和均值采样(或者称之为均值池化)，在一种可能的实施方式中，可以采用最大值采样对该多张图像各自的卷积特征进行采样。例如，作为训练输入的每一张图像的大小为224*224，经过上述三层卷积神经网络的图像特征提取后，其大小变为28*28，其中包括784个特征值，显然，该特征量较大，影响训练效率。此时，可以采用最大值采样，例如在该28*28的范围内，以2*2为最大值采样的子区域，选取每一个子区域内包含的4个位置上的最大特征作为该子区域的典型特征，然后忽略掉该子区域内其他3个位置的特征。由此，可以得到每一张图像对应的大小为7*7的目标特征(包括49个特征值)，显然，通过最大值采样此类技术方案可以帮助神经网络迅速抓取关键特征，而忽略其余大量不相干的特征。可选的，在一些可能的实施方式中，还可以采用均值采样对该多张图像各自的卷积特征进行采样，例如以该每一个子区域内包含的4个位置上的特征值的平均值作为该子区域的典型特征，等等，本发明实施例对此不作具体限定。

步骤s12，特征拼接。

具体的，将神经网络基于该第一样本集(例如包括多张非法图像、多张扩展样本图像和多张正常图像)学到的所有或者部分目标特征平铺展开，进行特征拼接，并将所有或者部分目标特征进行融合，以用于确定输入该神经网络的图像的类别(例如确定输入图像属于非法图像或者属于正常图像)

步骤s13，计算损失函数。

具体的，根据上述拼接、融合的特征对当前输入的图像(例如为多张非法图像、多张扩展样本图像和多张扩展样本图像中的其中一张图像)进行预测判断，得到该图像属于非法图像的概率值，并计算该概率值与其真实标签之间的损失函数值(也即该概率值与其真实标签之间的差异)。例如，该图像属于非法图像的概率值为0.1，而该图像(例如为多张正常图像中的其中一张正常图像)的标签为0(也即该图像属于正常图像)，则可根据该0.1和0计算当前的损失函数值。可选的，在一些可能的实施方式中，可以通过softmax函数或者其他的函数计算每一张图像属于非法图像的概率值与每一张图像的真实标签之间的差异，本发明实施例对此不作具体限定。

步骤s14，通过梯度下降算法修正该神经网络。

具体的，通过梯度下降算法，根据上述计算得到的概率值与其真实标签之间的损失函数值计算该损失函数值对该神经网络的梯度，利用该梯度修正当前的神经网络(例如对该神经网络包括的一个或多个参数进行修正)，也即更新当前的神经网络。进而使得该神经网络针对下一次输入的图像所得的概率值与该图像的真实标签更加接近甚至一致。可以理解的是，当概率值与其真实标签一致时则可以停止对神经网络的训练，也即最终基于卷积神经网络，训练得到了可用于图像识别分类的准确率较高的非法图像识别模型。其中，梯度下降算法为较为常见的机器学习优化算法，多应用于深度神经网络的优化算法，在一些可能的实施方式中，还可以采用除梯度下降算法以外的其他算法等对该神经网络进行修正，本发明实施例对此不作具体限定。

步骤s505，获取待识别图像，根据所述非法图像识别模型确定所述待识别图像的识别结果。

具体的，计算设备获取待识别图像，然后根据该非法图像识别模型(例如为训练完成的卷积神经网络)确定所述待识别图像的识别结果，例如确定该待识别图像是否属于六合彩等非法图像，等等。可选的，该待识别图像可以为各类网站中的图像，计算设备可以通过网络获取该待识别图像。

可选的，请参见图11，图11是本发明实施例提供的一种图像识别的流程示意图。如图11所示，将待识别图像输入该训练完成的卷积神经网络(也即可以为上述的非法图像识别模型)，通过卷积、采样等等一系列操作后，输出该待识别图像属于非法图像的概率值。然后将该概率值与预设阈值进行对比，若该概率值大于该预设阈值，则可以确定该待识别图像属于非法图像(例如属于六合彩)，例如该概率值为0.8，该预设阈值为0.7，则可以确定该待识别图像属于非法图像。若该概率值小于或等于该预设阈值，则可以确定该待识别图像属于正常图像(例如属于非六合彩)，例如该概率值为0.3，该预设阈值为0.7，则可以确定该待识别图像属于正常图像。进一步的，计算设备还可以对分类得到的属于六合彩的图像进行召回、拦截等，扼制六合彩等非法图像在网络上的传播，维护网络环境等等。可选的，还可以根据实际业务背景和实际需求调整该阈值的大小，一般情况下，阈值过高，该非法图像识别模型的准确率会较高，但是对例如六合彩等非法图像的召回率会较低；阈值过低，则该非法图像识别模型的准确率会较低，但是对例如六合彩等非法图像的召回率会较高。例如，本发明实施例通过收集10万张非六合彩图像和1万张六合彩图像进行测试，其中，该非法图像识别模型在阈值为0.8的情况下，对六合彩图像分类的准确率为65％，而对六合彩图像的召回率为80％；其中，该非法图像识别模型在阈值为0.9的情况下，对六合彩图像分类的准确率为75％，而对六合彩图像的召回率为67％。

需要说明的是，在对该待识别图像识别分类之前，也即将该待识别图像输入该非法图像识别模型(也即卷积神经网络)之前，一般情况下需要将该非法图像识别模型由原先训练时的训练模式设置成预测模式，并将该非法图像识别模型中的参数均调整为预测模式下的参数设置，以用于对该待识别图像进行识别分类。此外，一般情况下，在该待识别图像输入该非法图像识别模型之前，需要对该待识别图像进行预处理，其中可以包括将该待识别图像调整为该非法图像识别模型的给定输入格式(例如将该待识别图像的设置为红绿蓝(red,green,blue，rgb)三通道的图像读取方式，又例如将该待识别图像缩放至比如224*224的固定尺寸，还例如将该待识别图像的所有像素均除以225等)，等等，本发明实施例对此不作具体限定。

需要说明的是，本发明实施例旨在针对原始样本稀少，难以获得的情况，通过数据增强技术，在较少的原始样本的基础上获得大量丰富的新样本，作为模型训练的输入，以提高模型训练的效率和模型的准确率。在一些可能的实施方式中，本发明实施例可以用于六合彩等数量稀少，难以获得的非法赌博图像，也可以用于其他例如涉及暴力、色情等等数量稀少，难以获得的图像等，本发明实施例对此不作具体限定。

基于上述非法图像识别方法实施例的描述，本发明实施例还公开了一种非法图像识别装置，所述非法图像识别装置可以是运行于计算设备中的一个计算机程序(包括程序代码)。请参见图12，图12是本发明实施例提供的一种非法图像识别装置的结构示意图，如图12所示，该非法图像识别装置包括装置1，该装置1可以执行图4或图5所示的方法，所述非法图像识别装置可以包括：训练模块11和识别模块12：

训练模块11，用于预先通过第一样本集对初始化的神经网络进行训练，得到非法图像识别模型；其中，所述第一样本集包括正样本集和负样本集，所述正样本集包括对非法图像进行数据增强处理得到的扩展样本图像，一所述非法图像对应至少两张扩展样本图像；

识别模块12，用于基于所述非法图像识别模型，进行非法图像识别。

其中，所述数据增强处理包括图像裁剪处理、图像旋转处理和添加高斯噪声处理中的至少一种。

其中，训练模块11和识别模块12的具体功能实现方式可以参见上述图4所对应实施例中的步骤s401-步骤s402。训练模块11的具体功能实现方式可以参见上述图5所对应实施例中的步骤s501-步骤s504，识别模块12的具体功能实现方式可以参见上述图5所对应实施例中的步骤s505，此处不再进行赘述。

其中，所述数据增强处理包括图像裁剪处理、图像旋转处理和添加高斯噪声处理中的一种或多种。

请一并参见图12，所述训练模块11可以包括：特征提取单元111、第一确定单元112和修正单元113：

特征提取单元111，用于对所述第一样本集中的多张图像进行图像特征提取，得到所述多张图像各自对应的卷积特征；所述多张图像包括所述正样本集中的多张扩展样本图像和所述负样本集中的多张正常图像；

第一确定单元112，用于基于所述多张图像各自对应的卷积特征，确定所述多张图像各自属于所述非法图像的概率值；

修正单元113，用于以所述多张图像各自属于所述非法图像或所述正常图像为标签，根据所述多张图像各自属于所述非法图像的概率值与所述多张图像各自的标签之间的差异，修正所述神经网络中的一个或多个参数，得到所述非法图像识别模型。

其中，特征提取单元111、第一确定单元112和修正单元113的具体功能实现方式可以参见上述图4所对应实施例中的步骤s401,。特征提取单元111、第一确定单元112和修正单元113的具体功能实现方式还可以参见上述图5所对应实施例中的步骤s504，此处不再进行赘述。

请一并参见图12，所述识别模块12可以包括：获取单元121、第二确定单元122和第三确定单元123：

获取单元121，用于获取待识别图像；

第二确定单元122，用于通过所述非法图像识别模型，确定所述待识别图像属于所述非法图像的概率值；

第三确定单元123，用于根据预设阈值和所述待识别图像属于所述非法图像的概率值，确定所述待识别图像的识别结果。

其中，获取单元121、第二确定单元122和第三确定单元123的具体功能实现方式可以参见上述图4所对应实施例中的步骤s402。获取单元121、第二确定单元122和第三确定单元123的具体功能实现方式还可以参见上述图5所对应实施例中的步骤s505，此处不再进行赘述。

请一并参见图12，所述第三确定单元可以包括：第一确定子单元1231和第二确定子单元1232：

第一确定子单元1231，用于若所述待识别图像属于所述非法图像的概率值大于所述预设阈值，则确定所述待识别图像属于所述非法图像，并对所述待识别图像进行召回；

第二确定子单元1232，用于若所述待识别图像属于所述非法图像的概率值小于或等于所述预设阈值，则确定所述待识别图像属于所述正常图像。

其中，第一确定子单元1231和第二确定子单元1232的具体功能实现方式可以参见上述图4所对应实施例中的步骤s402。第一确定子单元1231和第二确定子单元1232的具体功能实现方式还可以参见上述图5所对应实施例中的步骤s505，此处不再进行赘述。

根据本发明提供的实施例，图12所示的非法图像识别装置中的各个模块可以分别或全部合并为一个或若干个另外的模块来构成，或者其中的某个(些)模块还可以再拆分为功能上更小的多个单元来构成，这可以实现同样的操作，而不影响本发明的实施例的技术效果的实现。上述模块是基于逻辑功能划分的，在实际应用中，一个模块的功能也可以由多个模块来实现，或者多个模块的功能由一个模块实现。在本发明的其它实施例中，基于非法图像识别装置也可以包括其它模块，在实际应用中，这些功能也可以由其它模块协助实现，并且可以由多个模块协作实现。

根据本发明提供的实施例，可以通过在包括中央处理单元(centralprocessingunit,cpu)、随机存取存储介质(randomaccessmemory,ram)、只读存储介质(readonlymemory,rom)等处理元件和存储元件的例如计算机的通用测试服务端上运行能够执行如图4或图5中所示的相应方法所涉及的各步骤的计算机程序(包括程序代码)，来构造如图12中所示的非法图像识别装置，以及来实现本发明实施例的非法图像识别方法。所述计算机程序可以记载于例如计算机可读记录介质上，并通过计算机可读记录介质装载于上述测试服务端中，并在其中运行。

基于上述方法实施例以及装置实施例的描述，本发明实施例还提供一种计算设备。请参见图13，图13是本发明实施例提供的一种计算设备的结构示意图。如图13所示，该计算设备至少包括处理器201、输入设备202、输出设备203以及计算机可读存储介质204。其中，计算设备内的处理器201、输入设备202、输出设备203以及计算机可读存储介质204可通过总线或其他方式连接。

计算机可读存储介质204可以存储在计算设备的存储器中，所述计算机可读存储介质204用于存储计算机程序，所述计算机程序包括程序指令，所述处理器201用于执行所述计算机可读存储介质204存储的程序指令。处理器201(或称cpu(centralprocessingunit，中央处理器))是计算设备的计算核心以及控制核心，其适于实现一条或多条指令，具体适于加载并执行一条或多条指令从而实现相应方法流程或相应功能；在一个实施例中，本发明实施例所述的处理器201可以用于进行一系列的分类模型训练处理，包括：预先通过第一样本集对初始化的神经网络进行训练，得到非法图像识别模型；其中，所述第一样本集包括正样本集和负样本集，所述正样本集包括对非法图像进行数据增强处理得到的扩展样本图像，一所述非法图像对应至少两张扩展样本图像；基于所述非法图像识别模型，进行非法图像识别，等等。

本发明实施例还提供了一种计算机可读存储介质(memory)，所述计算机可读存储介质是计算设备中的记忆设备，用于存放程序和数据。可以理解的是，此处的计算机可读存储介质既可以包括计算设备中的内置存储介质，当然也可以包括计算设备所支持的扩展存储介质。计算机可读存储介质提供存储空间，该存储空间存储了计算设备的操作系统。并且，在该存储空间中还存放了适于被处理器201加载并执行的一条或多条的指令，这些指令可以是一个或一个以上的计算机程序(包括程序代码)。需要说明的是，此处的计算机可读存储介质可以是高速ram存储器，也可以是非不稳定的存储器(non-volatilememory)，例如至少一个磁盘存储器；可选的还可以是至少一个位于远离前述处理器的计算机可读存储介质。

在一种实施方式中，可由处理器201加载并执行计算机可读存储介质中存放的一条或多条指令，以实现上述有关分类模型训练实施例中的方法的相应步骤；具体实现中，计算机可读存储介质中的一条或多条指令由处理器201加载并具体执行：

基于所述非法图像识别模型，进行非法图像识别。

在一种实施方式中，所述数据增强处理包括图像裁剪处理、图像旋转处理和添加高斯噪声处理中的至少一种。

在一种实施方式中，所述负样本集包括多张正常图像；在所述预先通过第一样本集对初始化的神经网络进行训练，得到非法图像识别模型非法图像识别模型中，所述一条或多条指令还可由处理器201加载并具体执行：

基于所述多张图像各自对应的卷积特征，确定所述多张图像各自属于所述非法图像的概率值；

以所述多张图像各自属于所述非法图像或所述正常图像为标签，根据所述多张图像各自属于所述非法图像的概率值与所述多张图像各自的标签之间的差异，修正所述神经网络中的一个或多个参数，得到所述非法图像识别模型非法图像识别模型。

在一种实施方式中，在所述基于所述非法图像识别模型，进行非法图像识别中，所述一条或多条指令还可由处理器201加载并具体执行：

获取待识别图像；

通过所述非法图像识别非法图像识别模型，确定所述待识别图像属于所述非法图像的概率值；

根据预设阈值和所述待识别图像属于所述非法图像的概率值，确定所述待识别图像的识别结果。

在一种实施方式中，在所述根据预设阈值和所述待识别图像属于所述非法图像的概率值，确定所述待识别图像的识别结果中，所述一条或多条指令还可由处理器201加载并具体执行：

若所述待识别图像属于所述非法图像的概率值大于所述预设阈值，则确定所述待识别图像属于所述非法图像，并对所述待识别图像进行召回；

若所述待识别图像属于所述非法图像的概率值小于或等于所述预设阈值，则确定所述待识别图像属于所述正常图像。

以上所揭露的仅为本发明较佳实施例而已，当然不能以此来限定本发明之权利范围，因此依本发明权利要求所作的等同变化，仍属本发明所涵盖的范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：郭梓铿
技术所有人：腾讯科技(深圳)有限公司
我是此专利的发明人

上一篇：一种电子设备的制作方法
上一篇：石材切割污水铁粉磁选装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。