一种基于光照特征的网络敏感图像识别方法

文档序号:6538759阅读:378来源:国知局
一种基于光照特征的网络敏感图像识别方法
【专利摘要】本发明公开了一种基于光照特征的网络敏感图像识别方法,该方法包括以下步骤:收集网络图像样本集;提取每个网络图像样本的光照特征和敏感特征,得到网络图像光照特征集和网络图像敏感特征集;对每个网络图像样本进行人工标注标签;对网络图像光照特征集进行聚类,并根据网络图像光照特征集与网络图像敏感特征集的一一对应关系,将网络图像敏感特征集分成多个网络图像敏感特征子集;针对每个网络图像敏感特征子集,基于属于该网络图像敏感特征子集的敏感特征和相应网络图像样本的标签,得到对应于该网络图像敏感特征子集的图像分类器;使用图像分类器对待分类网络图像进行分类。本发明可以应用在互联网敏感图像过滤,以维护互联网的内容安全。
【专利说明】一种基于光照特征的网络敏感图像识别方法
【技术领域】
[0001]本发明涉及模式识别【技术领域】,特别涉及一种基于光照特征的网络敏感图像识别方法。
【背景技术】
[0002]图片等敏感(专指色情)信息在互联网上的传播给社会生活的方方面面都带来了严重隐患,尤其严重的是对未成年人的危害。未成年人由于缺乏对事物的辨别能力及自控能力,其生理、心理和思维尚处在发育和发展过程中,不良信息不仅会给他们的学习和生活带来许多困扰,还会严重影响他们的身心健康,而且已经成为近年来未成年人违法犯罪的一个重要诱因。
[0003]对于网络敏感图像的识别,一般都是先提取不同类型的敏感特征,然后根据这些特征来构造分类器。例如美国爱荷华大学的Fleck与伯克利大学的Forsyth等人结合颜色和纹理信息对图像进行肤色分割,分割后寻找所有连通的圆柱形肤色区域。在假定这些肤色区域包含了人体躯干和四肢的基础之上,通过图像匹配从肤色区域提取手臂和四肢以及躯干。如果能够组合出一个具有人体形状的物体,那么就认为图像中有人的裸体存在,该图像被识别为不良图像。中国科学院计算技术研究所段立娟等人通过提取图像中肤色面积的比例以及最大连通肤色区域的面积,并结合原始图像的颜色直方图和颜色一致性向量(直方图的一种扩展)组成特征向量,最后利用RBF (径向基函数)核的支持向量机分类器进行色情图像检测。中国科学院自动化研究所杨金锋等人在肤色检测的基础上综合运用区域划分、区域生长、目标轮廓描述、局部特征分析、结构分析、自适应网格构建、精确轮廓分析等手段来获取图像中目标的特征信息,进而进行色情图像的分类和识别。
[0004]但是目前几乎所有的网络敏感图像识别方法均未考虑到光照对识别性能的影响。光照严重地影响着图像肤色提取的准确度,而肤色提取又是敏感图像识别最为关键的一步。此外,光照也一定程度上反映着图像所在的场景。所以有必要在进行网络敏感图像识别的过程中将光照因素合理地考虑进去,以实现更为合理的识别。

【发明内容】

[0005]有鉴于此,本发明的主要目的是提供一种基于光照特征的网络敏感图像识别方法,该方法根据不同图像的光照特点来将网络图像分为不同类型,对每种类型分别构造分类器,对于新的网络图像,根据其光照特征对应的类型来调用相应的分类器以进行网络敏感图像的识别。
[0006]为达到上述目的,本发明基于光照特征的网络敏感图像识别方法包括以下步骤:
[0007]步骤101:收集网络图像样本集;
[0008]步骤102:依次提取网络图像样本集中每个网络图像样本的光照特征和敏感特征,所有网络图像样本的光照特征构成了网络图像光照特征集,所有网络图像样本的敏感特征构成了网络图像敏感特征集;[0009]步骤103:利用人工来对每个网络图像样本进行判别,给定其标签;
[0010]步骤104:对所述网络图像光照特征集进行聚类,将其分成多个聚类团,记录每个聚类团的中心,并根据网络图像光照特征集与网络图像敏感特征集的一一对应关系,将网络图像敏感特征集分成多个网络图像敏感特征子集;
[0011]步骤105:针对每个网络图像敏感特征子集,基于属于该网络图像敏感特征子集的敏感特征和相应网络图像样本的标签,利用基于聚类的多任务学习算法得到对应于该网络图像敏感特征子集的图像分类器;
[0012]步骤106:使用所述步骤105得到的针对网络图像敏感特征子集的图像分类器对待分类网络图像进行分类。
[0013]从上述技术方案可以看出,本发明具有以下优点:
[0014]1、本发明提供的一种基于光照特征的网络敏感图像识别方法,能够根据网络图像样本对应的光照特点来分为不同的类型,并分别对于不同的类型构造有害图像分类器。光照严重地影响着图像肤色提取的准确度,而肤色提取又是敏感图像识别最为关键的一步,此外光照也在一定程度上反应了图像的场景,例如室内和室外场景下的图像的光照就明显的不同;通过计算机摄像头获得的图像的光照也具有独特的特点。本发明考虑了网络图像的光照条件复杂多变,通过对光照特征进行聚类来将网络图像分成不同的类型,所构造出的分类器相比于现有方法所构造出的分类器,更加符合网络图像的特点。
[0015]2、本发明所采用的基于聚类的多任务学习,既能够学习到不同光照类型对应的有害图像分类器,又能够避免不同光照类型网络图像样本训练子集规模较小的不足。
【专利附图】

【附图说明】
[0016]图1为本发明提供的一种基于光照特征的网络敏感图像识别方法的流程图。【具体实施方式】
[0017]为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
[0018]本发明的执行环境采用一台具有3.0G赫兹中央处理器和2G字节内存的奔腾4计算机,实现了本发明一种基于光照特征的网络敏感图像识别方法,当然也可以采用其他的执行环境,在此不再赘述。
[0019]图1为本发明提供的一种基于光照特征的网络敏感图像识别方法的流程图,如图1所示,所述方法包括以下步骤:
[0020]步骤101:利用计算机收集网络图像样本集;
[0021]步骤102:依次提取网络图像样本集中每个网络图像样本的光照特征和敏感特征,所有网络图像样本的光照特征构成了网络图像光照特征集,所有网络图像样本的敏感特征构成了网络图像敏感特征集;
[0022]在本发明一实施例中,在光照特征的提取上,主要提取能反应光照条件的特征,例如可以通过使用明科夫斯基范式(Minkowsk1-norm)并选取多个不同的范数,来获得多个光照色度以组合成光照特征;
[0023]在敏感特征的提取上,主要提取能体现色情内容的特征。例如最大肤色联通区域面积占总肤色面积的比例、人脸个数等。
[0024]步骤103:利用人工来对每个网络图像样本进行判别,给定其标签,所述标签的内容为敏感或正常;[0025]步骤104:对所述网络图像光照特征集进行聚类,将其分成多个聚类团,记录每个聚类团的中心,并根据网络图像光照特征集与网络图像敏感特征集的一一对应关系,将网络图像敏感特征集分成多个网络图像敏感特征子集;
[0026]根据本发明的一实施例,可以选用常规的聚类方法如K-means、谱聚类等对网络图像光照特征集进行聚类。[0027]根据本发明的一实施例,可以将网络图像敏感特征集表示为X=Ix1,-,Xi,…,xN},其中Xi是第i个网络图像样本的敏感特征,N是网络图像样本集中的网络图像样本总数,第i个网络图像样本的标签用Ji表示,当第i个网络图像样本属于第一类别时,yi=i,否则yi=-l,第i个网络图像样本的光照特征用Ui表示。所有网络图像样本的光照特征构成的网络图像光照特征集表示为U=Iu1,…,Ui,...,%}。
[0028]利用聚类算法对网络图像光照特征集U进行聚类之后,将U分成C个聚类团,其中C为预先设置的聚类团个数。根据本发明的一实施例,C的值选取范围为[5,20],并优选地大于10。根据网络图像敏感特征集X与网络图像光照特征集U之间的对应关系,将X分成C个网络图像敏感特征子集X1,…,X。,…,Xc,I≤C≤C。
[0029]步骤105:针对每个网络图像敏感特征子集,基于属于该网络图像敏感特征子集的敏感特征和相应网络图像样本的标签,利用基于聚类的多任务学习算法得到对应于该网络图像敏感特征子集的图像分类器;
[0030]该步骤中,建立以下目标优化函数:
[0031]
【权利要求】
1.一种基于光照特征的网络敏感图像识别方法,其特征在于,该方法包括以下步骤: 步骤101:收集网络图像样本集; 步骤102:依次提取网络图像样本集中每个网络图像样本的光照特征和敏感特征,所有网络图像样本的光照特征构成了网络图像光照特征集,所有网络图像样本的敏感特征构成了网络图像敏感特征集; 步骤103:利用人工来对每个网络图像样本进行判别,给定其标签; 步骤104:对所述网络图像光照特征集进行聚类,将其分成多个聚类团,记录每个聚类团的中心,并根据网络图像光照特征集与网络图像敏感特征集的一一对应关系,将网络图像敏感特征集分成多个网络图像敏感特征子集; 步骤105:针对每个网络图像敏感特征子集,基于属于该网络图像敏感特征子集的敏感特征和相应网络图像样本的标签,利用基于聚类的多任务学习算法得到对应于该网络图像敏感特征子集的图像分类器; 步骤106:使用所述步骤105得到的针对网络图像敏感特征子集的图像分类器对待分类网络图像进行分类。
2.根据权利要求1所述的方法,其特征在于,所述光照特征为由多个光照色度组合得到的光照特征。
3.根据权利要求2所述的方法,其特征在于,所述光照色度通过使用明科夫斯基范式并选取多个不同的范数来获得。
4.根据权利要求1所述的方法,其特征在于,所述敏感特征为最大肤色联通区域面积占总肤色面积的比例和/或人脸个数。
5.根据权利要求1所述的方法,其特征在于,所述标签的内容为敏感或正常。
6.根据权利要求1所述的方法,其特征在于,所述步骤105中,通过目标优化函数来计算得到每个网络图像敏感特征子集对应的图像分类器的参数。
7.根据权利要求6所述的方法,其特征在于,所述目标函数表示为:

8.根据权利要求1所述的方法,其特征在于,所述步骤106进一步包括以下步骤: 步骤1061:对于待分类网络图像,按照所述步骤102分别提取其光照特征(Ut)和敏感特征(Xt); 步骤1062:计算该光照特征Ut与所述步骤104得到的多个聚类团的聚类中心的距离,利用与第ζ个聚类团相对应的第ζ个网络图像敏感特征子集所对应的分类器来对该待分类网络图像进行分类,所述第ζ个聚类团为与光照特征Ut之间距离最小的聚类中心所属的聚类团。
9.根据权利要求8所述的方法,其特征在于,所述步骤1062中,通过计算下式来对所述待分类网络图像进行分类:f=〈wz, xt>+bz, 其中,wz和\是所述第z个网络图像敏感特征子集所对应的图像分类器的参数,<wz, Xt>表示Wz和的Xt内积; 如果计算结果f>0,则所述待分类网络图像属于敏感图像,否则,所述待分类网络图像属于正常图像。
【文档编号】G06K9/62GK103839076SQ201410064935
【公开日】2014年6月4日 申请日期:2014年2月25日 优先权日:2014年2月25日
【发明者】吴偶, 胡卫明, 景晓军, 陈颖, 赵林, 姜玉垄 申请人:中国科学院自动化研究所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1