一种敏感图像识别方法及系统的制作方法

文档序号：6505963阅读：302来源：国知局

一种敏感图像识别方法及系统的制作方法
【专利摘要】公开了一种敏感图像识别方法及系统，属于图像识别【技术领域】，其特征在于，包括：步骤1.融合肤色检测的网格划分提取特征，并采用词袋模型得到图像的原始词袋表示向量；步骤2.图像特征优化，利用随机森林得到降维的优化图像向量表示；步骤3.识别模型训练，利用一类支撑向量机，在优化向量空间中训练一类分类器；步骤4.图像识别，图像在步骤1所述的预处理阶段中如果完全不含肤色像素，则直接被判别为正常图像，否则经过处理得到优化特征表示并进入训练得到的一类分类模型，最终得到图像的识别结果。本发明首次利用一类分类算法解决敏感图像识别问题，在处理过程中融合了多种技术，并实施特征优化处理，提高了敏感图像识别的准确率和效率。
【专利说明】一种敏感图像识别方法及系统
【技术领域】
[0001]本发明涉及图像识别方法，尤其涉及一种融合肤色检测与图像词袋表示的基于一类分类算法的敏感图像识别方法与系统。
【背景技术】
[0002]传统的敏感图像检测方法中，肤色检测技术和模式识别方法被广泛采用；其中，第一类流行的方法通过设计肤色检测算法，计算图像中的肤色区域的面积比例，并根据一定的阈值确定该图像是否是敏感图像，显然，由于背景颜色、光照条件、图像质量的影响，此类方法非常容易出现误判和漏判，因此大部分的敏感图像检测算法将肤色检测与模式识别方法结合起来，肤色检测作为辅助手段。在这一类方法中，一般的步骤为:1)提取图像特征；2)训练分类模型；3)图像识别。此前，几乎所有的基于模式识别和机器学习的方法都将敏感图像的识别问题视为一种二类分类问题:将图像分为两类，即敏感图像和正常图像，利用分类算法通过对这两类图像的训练集进行学习，得到一个二类分类模型。然而，在二类分类模型中，敏感图像的类型较为齐全，覆盖了大部分种类的敏感图像，但在真实互联网环境下，正常图像的类型是海量的，任何一种正常图像的训练集都无法涵盖大部分的正常图像类型。因此，在基于模式识别的方法中，将敏感图像视为一种二类分类问题会导致数据不平衡，进而限制了模型的泛化能力。
[0003]在基于模式识别和机器学习的敏感图像识别方法中，图像的特征提取和图像的向量表示是重要的步骤之一，有效的特征能大幅提高训练出的模型的综合性能。图像特征提取的方法有多种，其中广泛采用的方法有颜色特征、纹理特征、轮廓特征、局部区域特征等。在图像的局部特征提取方法中，SIFT算法因其出色的性能，得到了最为广泛的应用，但其缺点在于关键点的计算耗时较多。在机器视觉领域，一种有效的图像向量表示方法是词袋模型(Bag of Words Model, BoW),研究已经表明该模型可以有效地表示图像,且广泛应用于目标识别与图像分类领域，取得了良好的效果。
[0004]此前，已经有基于词袋模型的敏感图像识别方法，但此类方法均基于二类分类算法，同时肤色信息较少考虑，算法的准确率和时间复杂性不理想，且算法的泛化能力有待提闻。

【发明内容】

[0005]有鉴于此，本发明提供了一种融合敏感图像识别方法和系统，旨在实现更有效地检测敏感图像。本发明所述敏感图像识别方法的特征在于:为了实现上述目的，本发明实施例提供了如下方案:
[0006]步骤(I).向所述计算机输入如下图像:
[0007]包含Iii1幅敏感图像的第一敏感图像子集PornSet I,所述敏感图像是指能令人们感兴趣的图像，下同，
[0008]包含m2幅敏感图像的第二敏感图像子集PornSet2,[0009]包含πι3幅正常图像的正常图像子集NormalSet，
[0010]上述叫，m2, m3均为有限正整数；
[0011]步骤(2).把所述第一敏感图像子集PornSetl的每幅敏感图像划分为MXN个网格，其中M, N均为有限正整数，每个网格大小为16X16像素；在每个网格中按以下步骤进行肤色检测操作:
[0012]步骤(2.1).若所述第一敏感图像子集PornSetl中的图像中的像素在RGB颜色空间中的像素值r，g，b满足以下条件，则认为所述网格中的该像素为肤色像素；下述的r，g，b值的取值区间为[0，255]，
[0013]r > 90&g > 38&b > 18&|r-g| > 12,
[0014]{max {r, g, b} -min {r, g, b}} > 12&r > g&r > b,
[0015]步骤(2.2).若在所述各网格中所述肤色像素占全部像素的比例大于或等于阈值sg = 0.3，则确定该网格为疑似敏感子区域；
[0016]步骤(3).对所述第一敏感图像子集PornSetl中的每幅图像中的每个判定为所述疑似敏感子区域，在中心点周围16X16像素的网格中采用尺度不变特征转换SIFT特征描述子生成128维的特征向量，第一敏感图像子集PornSetl的每幅图像的所有疑似敏感子区域经过所述特征提取操作之后，得到包含R个特征向量的集合F=…，FJ;第一敏感图像子集PornSetl中的全部图像所有疑似敏感子区域的特征向量集合PornFeatureSetl,以下简称 PornFeatureSetl ；
[0017]步骤(4).按以下步骤计算所述第一敏感图像子集PornSetl的每幅图像的原始词袋特征向量表示，
[0018]步骤(4.1).对所述第一敏感图像子集PornSetl的特征向量集合PornFeatureSetl,按以下步骤执行K均值聚类算法，得到能反映第一敏感图像子集PornSetl中共同特征的一类视觉词典:
[0019]步骤(4.1.1).设定:
[0020]η,所述第一敏感图像子集PornSetl的特征向量集合PornFeatureSetl中的特征向量总数，
[0021]C，聚类数目，为设定量，C值为200，
[0022]C，聚类类别的序号，c = 1，2，…，C，…，C，
[0023]，为序号为c的聚类S。中的第V。个特征向量，聚类S。中包含V。个特征向量，
Vc 1，2，...，Vcj...，Vc
[0024]μ。，为序号为c的聚类S。的聚类中心，即S。中的所有向量的平均值，
[0025]聚类准则函数为:
【权利要求】
1.一种敏感图像识别方法，其特征在于，是在计算机中依次按以下步骤实现的: 步骤(1).向所述计算机输入如下图像: 包含IH1幅敏感图像的第一敏感图像子集PornSetl,所述敏感图像是指能令人们感兴趣的图像，下同，包含m2幅敏感图像的第二敏感图像子集PornSet2, 包含m3幅正常图像的正常图像子集NormalSet, 上述Hi1, m2, m3均为有限正整数；步骤(2).把所述第一敏感图像子集PornSetl的每幅敏感图像划分为MXN个网格，其中M，N均为有限正整数，每个网格大小为16X 16像素；在每个网格中按以下步骤进行肤色检测操作: 步骤(2.1).若所述第一敏感图像子集PornSetl中的图像中的像素在RGB颜色空间中的像素值r，g，b满足以下条件，则认为所述网格中的该像素为肤色像素；下述的r，g，b值的取值区间为[O, 255],
r > 90&g > 38&b > 18&|r-g > 12,
{max {r, g, b} -min {r, g, b}} > 12&r > g&r > b, 步骤(2.2).若在所述各网格中所述肤色像素占全部像素的比例大于或等于阈值Sg =.0.3，则确定该网格为疑似敏感子区域；步骤(3).对所述第一敏感图像子集PornSetl中的每幅图像中的每个判定为所述疑似敏感子区域，在中心点周围16X16像素的网格中采用尺度不变特征转换SIFT特征描述子生成128维的特征向量，第一敏感图像子集PornSetl的每幅图像的所有疑似敏感子区域经过所述特征提取操作之后，得到包含R个特征向量的集合F = (F1, F2, Fr,..., Fj ;第一敏感图像子集PornSetl中的全部图像所有疑似敏感子区域的特征向量集合PornFeatureSetl,以下简称 PornFeatureSetl ；步骤(4).按以下步骤计算所述第一敏感图像子集PornSetl的每幅图像的原始词袋特征向量表示，步骤(4.1).对所述第一敏感图像子集PornSetl的特征向量集合PornFeatureSetl,按以下步骤执行K均值聚类算法，得到能反映第一敏感图像子集PornSetl中共同特征的一类视觉词典: 步骤(4.1.1).设定: η,所述第一敏感图像子集PornSetl的特征向量集合PornFeatureSetl中的特征向量总数， C，聚类数目，为设定量，C值为200， c，聚类类别的序号，c = I, 2,..., c,...，(:， S'，为序号为c的聚类S。中的第V。个特征向量，聚类S。中包含V。个特征向量，

Vc = I 2.Vc 'V K
μ。，为序号为c的聚类S。的聚类中心，即S。中的所有向量的平均值，聚类准则函数为:
2.根据权利要求1所述的一种敏感图像识别方法而得到的一种基于一类分类方法的敏感图像识别系统，其特征在于，包括:图像肤色检测单元，用于确定图像中的疑似敏感区域；图像特征提取单元，用于提取疑似敏感区域的局部特征；图像表示向量获取单元，用于得到最终的优化向量，供后续训练与识别使用；数据预备单元，用于准备后续分类模型训练阶段及识别阶段的重要已知数据；分类模型训练单元，用于训练一类识别模型，训练样本仅为敏感图像；图像识别单元，通过调用包括特征检测在内的各单元的功能如或已知数据以及训练所得的决策函数，得到完整的图像识别流程。
【文档编号】G06K9/46GK103679132SQ201310301729
【公开日】2014年3月26日申请日期:2013年7月15日优先权日:2013年7月15日
【发明者】刘毅, 肖创柏, 段娟, 卞春晓申请人:北京工业大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘毅;肖创柏;段娟;卞春晓;
技术所有人：北京工业大学;
我是此专利的发明人

上一篇：一种水果形状检测方法及装置制造方法
上一篇：设定机器同步系统及方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。