一种基于视觉词袋的网络不良图像检测方法

文档序号:6552265阅读:265来源:国知局
一种基于视觉词袋的网络不良图像检测方法
【专利摘要】本发明公开了一种基于视觉词袋的网络不良图像检测方法,具体按照以下步骤实施:图像预处理,获取图像中的肤色区域;特征提取与描述,得到肤色区域关键点的特征向量;构建视觉词袋,将图像关键点中最能代表图像特征的特征向量筛选出来,组成图像的视觉词袋;图像检测,用训练好的分类器对图像的视觉词袋进行分类,从而完成不良图像的检测。本发明方法进行不良图像识别和检测时与其它同类方法相比正检率较高,检测耗时较短,可以作为一种高效的网络不良图像检测方法,具有一定的理论和实用价值。
【专利说明】-种基于视觉词袋的网络不良图像检测方法

【技术领域】
[0001] 本发明属于网络信息安全【技术领域】,涉及一种图像识别和检查方法,具体涉及一 种基于视觉词袋的网络不良图像检测方法。

【背景技术】
[0002] 词袋模型最初应用于文档检测与分类领域,因其具有简单、有效的特点得到广泛 应用,为此计算机视觉领域的研究者们尝试将同样的方法应用到图像处理和识别领域,从 此开始了词袋模型由文本处理领域向图像处理领域的过渡研究。
[0003] 研究结果表明,利用视觉词袋进行图像特征的表示使得图像特征拥有较高的稳定 性和准确性,符合图像分类与检测的要求,可以作为一种有效的图像检测和分类技术;同时 对视觉词袋进行处理的分类方法具有动态可变性,能够有效弥补样本训练不足的缺陷。


【发明内容】

[0004] 本发明提供了一种基于视觉词袋的网络不良图像检测方法,解决了现有不良图像 检测方法正检率低、误检率较高、检测时间成本大的问题。
[0005] 本发明所采用的技术方案是,一种基于视觉词袋的网络不良图像检测方法,具体 按照以下步骤实施:
[0006] 步骤1 :图像预处理,获取图像中的肤色区域;
[0007] 步骤2 :特征提取与描述,得到肤色区域关键点的特征向量;
[0008] 步骤3 :构建视觉词袋,将图像关键点中最能代表图像特征的特征向量筛选出来, 组成图像的视觉词袋;
[0009] 步骤4:图像检测,用训练好的分类器对图像的视觉词袋进行分类,从而完成不良 图像的检测。
[0010] 本发明的特点还在于,
[0011] 其中的步骤1图像预处理,具体按照以下步骤实施:
[0012] 假设要对一个未知的图像样本X进行检测和分类,将其分成非肤色类Wi和肤色类 w2,用Cu表示原本为%类的图像样本X被分类成^类时所产生的成本,其中i,j表示不同 的类别,假设当i = j时,表示图像样本被正确分类,即原本图像样本为肤色区域被分类为 肤色类,或者原本图像样本为非肤色区域被分类为非肤色类,此时Cij表示图像样本分类正 确的成本,而当i尹j时,表示图像样本被错误分类,即原本为非肤色区域被分类为肤色类, 或者原本为肤色区域被分类为非肤色类,此时Cu表示图像样本分类错误时的成本,再假设 Ri(x)表示待检测图像样本X被分类为1类的成本总数,其中X表示图像特征,根据以上变 量的假设,得到公式(1)和公式(2):
[0013] 札=Cn · p % | X) +C12 · p (W21X) (1)
[0014] R2 = C21 · p (ffi IX) +C22 · p (ff21X) (2)
[0015] 其中p(Wi|X)表示未知的图像样本X属于1类的条件概率;
[0016] 假如有公式(3)和公式(4)的成立:
[0017] R,(X)< R2{X)^> X ^W, (3)
[0018] Rt{X)> R2(X)^ X eW 2 (4)
[0019] 那么,得到公式(5)和公式(6):
[0020] (Ct, -C2I) p(Wt μν) < (Cr -Cl2) p{W2 I ^) => ^ e (5)
[0021] (Cn-C2l)-p(Wl\X)>(C 22-C12)-p(W2\X)^X eW2 (6)
[0022] 将公式(5)和公式(6)导入贝叶斯公式(7):
[0023]

【权利要求】
1. 一种基于视觉词袋的网络不良图像检测方法,其特征在于,具体按照以下步骤实 施: 步骤1 :图像预处理,获取图像中的肤色区域; 步骤2 :特征提取与描述,得到肤色区域关键点的特征向量; 步骤3 :构建视觉词袋,将图像关键点中最能代表图像特征的特征向量筛选出来,组成 图像的视觉词袋; 步骤4 :图像检测,用训练好的分类器对图像的视觉词袋进行分类,从而完成不良图像 的检测。
2. 根据权利要求1所述的基于视觉词袋的网络不良图像检测方法,其特征在于,所述 的步骤1图像预处理,具体按照以下步骤实施: 假设要对一个未知的图像样本X进行检测和分类,将其分成非肤色类A和肤色类W2, 用Cu表示原本为%类的图像样本X被分类成Wi类时所产生的成本,其中i,j表示不同的 类别,假设当i = j时,表示图像样本被正确分类,即原本图像样本为肤色区域被分类为肤 色类,或者原本图像样本为非肤色区域被分类为非肤色类,此时表示图像样本分类正确 的成本,而当i尹j时,表示图像样本被错误分类,即原本为非肤色区域被分类为肤色类, 或者原本为肤色区域被分类为非肤色类,此时表示图像样本分类错误时的成本,再假设 Ri(x)表示待检测图像样本X被分类为1类的成本总数,其中X表示图像特征,根据以上变 量的假设,得到公式(1)和公式(2): R! = Cn · p(ff2|X) (1) R2 = C21 -pdJ^+C^ *p(ff2|X) (2) 其中P (Wi IX)表示未知的图像样本X属于1类的条件概率; 假如有公式(3)和公式(4)的成立: Ri(X)<R1(X)^ X ^W\ (3) Rt{X)> R2{X)^X ^W2 (4) 那么,得到公式(5)和公式(6): (ΓΙI - Qi) · ! ^) < (Q: - ^12) · P(w2 (5) (C,, -C2I) I ^) > (C22 -Cl2) p{W2 \ X)^ X ^ W2 (6) 将公式(5)和公式(6)导入贝叶斯公式(7):
(7) 得到公式(8)和公式(9)的结论:
(8) (9) 其中τ表示将未知图像样本X分类成非肤色类和肤色类时的阈值,其计算公式如公式 (10) (10)所示: 最优阈值τ的取值范围为[2, 4]之间。
3. 根据权利要求1所述的基于视觉词袋的网络不良图像检测方法,其特征在于,所述 的步骤2特征提取与描述,具体按照以下步骤实施: 第一步:以图像像素点为单位,对图像进行均匀间隔采样; 第二步:对每一个特征点进行双尺度、均匀加权特征描述,获得双尺度特征向量。
4. 根据权利要求1所述的基于视觉词袋的网络不良图像检测方法,其特征在于,所述 的步骤3构建视觉词袋,具体按照以下步骤实施: 令c表示任意数据点,q和c2表示两个不同类Wp W2的中心,(Η% c2)、d(c, C)和 d(c, c2)分别表示数据点x到两个中心点q和c2的距离,如果dh,c2)彡2d(c, c2),那么 d(c, c2)彡d(c, c),同样成立; 由于上述讨论的不等式对于任意三个数据点都适用,所以利用如下的方式来使用三角 形二边关系定理: 令X表示数据集中任意一点,同时假设该点目前属于中心点为C的类中,C'表示其它 类的中心点,则根据上述推论,如果公式11成立: d(c,c')> 2d (X,c) (11) 则 d (X,c')> d (X,c)。
5. 根据权利要求1所述的基于视觉词袋的网络不良图像检测方法,其特征在于,所述 的步骤4用训练好的分类器对图像的视觉词袋进行分类,从而完成不良图像的检测,具体 按照以下步骤实施: 首先通过样本训练得到SVM分类器的最优超平面,之后根据最优超平面确定正支持向 量平面和负支持向量平面;假设在SVM分类空间中将训练样本的分布用三个超平面进行划 分,那么通过比较测试样本与正支持向量平面和负支持向量平面之间的距离,之后统计测 试样本的视觉词袋中被划分到负支持向量平面所代表的类中的特征向量比例,若比例大于 一定的阈值,其中阈值的取值范围为[2, 4],则测试样本为不良图像,反之则为正常图像,选 用径向基核函数作为SVM分类器的空间转换核函数。
【文档编号】G06K9/00GK104123538SQ201410317098
【公开日】2014年10月29日 申请日期:2014年7月4日 优先权日:2014年7月4日
【发明者】吕林涛, 朱珊, 王锦辉 申请人:西安理工大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1