图片过滤方法和装置的制作方法

文档序号:6440400阅读:167来源:国知局
专利名称:图片过滤方法和装置的制作方法
技术领域
本发明涉及领域图形图像处理技术领域,特别涉及一种图片过滤方法和装置。
技术背景
自从有了网络,黄色图片也开始出现在了网络上,随着网络的发达,已经到了泛滥的程度,黄色图片对于青少年有巨大的毒害,如何准确有效地把黄色图片过滤一直是艰巨的任务。
早期的技术是分析图片中人物的行为通过判断图片上人物的相对位置和动作来获取图像的语义信息,但这种方法有很多缺陷,比如将合照甚至是人形雕塑当作是色情图片处理。
目前的黄色图片过滤主要依赖肤色来检测图片,这种方法虽然和早期的方法相比在过滤准确度有所提高,然而仅依赖肤色进行过滤也很容易误判,如对一些存在较大肤色面积的正常图片,如大头像照片、人脸照片等,极容易被误判为黄色图片而被过滤掉,从而导致图片识别的准确率较低,图片过滤的效果较差。发明内容
本发明提供了一种图片过滤方法和装置,能够快速准确地对黄色图片进行过滤。
为达到上述目的,本发明实施例采用了如下技术方案
本发明实施例提供了一种图片过滤方法,该方法包括
通过图片区域分割,提取出原始图片中的肤色区域;
计算所述肤色区域占原始图片的面积比率;
当所述面积比率小于第一阈值时,允许所述原始图片;
当所述面积比率大于第一阈值且小于第二阈值时,根据所述原始图片得到包含所述肤色区域的剪裁图片,利用所述肤色区域占剪裁图片的面积比率对原始图片进行过滤;
当所述面积比率大于第二阈值时,检测出原始图片中的人脸肤色区域,根据人脸肤色区域占肤色区域的面积比率对原始图片进行过滤。
本发明实施例还提供了一种图片过滤装置,该装置包括
肤色区域提取单元,用于通过图片区域分割,提取出原始图片中的肤色区域;
比率计算单元,用于计算所述肤色区域占原始图片的面积比率;
过滤单元,用于当所述面积比率小于第一阈值时,允许所述原始图片;当所述面积比率大于第一阈值且小于第二阈值时,根据所述原始图片得到包含所述肤色区域的剪裁图片,利用所述肤色区域占剪裁图片的面积比率对原始图片进行过滤;以及,当所述面积比率大于第二阈值时,检测出原始图片中的人脸肤色区域,根据人脸肤色区域占肤色区域的面积比率对原始图片进行过滤。
本发明实施例的有益效果是
本发明实施例对图片过滤的原理进行分析,在大量实验的基础上,通过过滤逻辑的设置以及过滤阈值的选取,提供了一种新型的图片过滤解决方案,能够极大降低过滤过程中的误判率,快速准确地对黄色图片进行过滤。


图1为本发明实施例一提供的图片过滤方法流程示意图2为本发明实施例一提供的HSV颜色空间的圆锥空间模型示意图
图3为本发明实施例一提供的金字塔算法流程处理示意图4为本发明实施例一提供的统计得到的表示肤色的H向量的概率分布图5为本发明实施例二提供的图片过滤方法流程示意图6(a)和(b)为本发明实施例二提供的一种剪裁图片的方法和所得到的剪裁图片的示意图7为本发明实施例二提供的分类器的分类方法的流程示意图8为本发明实施例三提供的一种图片过滤装置结构示意图9本方案提供的实验一中原始图片;
图10为实验一中采用聚类分割后得到的聚类结果图像;
图11为实验一中对图10的聚类结果图像执行H阈值分割后得到的肤色区域图像;
图12中圆圈标示的区域显示了实验一中进行人脸识别后得到的人脸区域
图13为实逢芝一中采用本方案得到的人脸肤色区域结果示意图14为实逢芝二中聚类分割后得到的肤色区域图像;
图15为实逢芝三中的原始图片;
图16为实逢芝三中聚类分割后得到的肤色区域图像;
图17为实逢芝四中原始图片;
图18为实逢芝四中聚类分割后得到的肤色区域图像。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
参见图1,为本发明实施例一提供的图片过滤方法,参见图1,包括如下步骤
11 通过图片区域分割,提取出原始图片中的肤色区域。
进一步的,在本步骤中,本方案采用了一种新型的肤色分割方案,具体如下
111 获取原始图片中各像素点的HSV数据,根据所述HSV数据对各像素点进行聚类,得到聚类结果图像。
根据不同应用的需要,设计了多种颜色空间,如RGB颜色空间、HSV颜色空间。然而本技术方案中采用在HSV颜色空间中进行肤色区域的分割。主要原因在于
人类的肤色在颜色空间分布比较集中,但是受人种和光照的影响比较大。人种的问题可以通过分类解决,但光照问题则不太容易处理,是普通存在的问题。为了解决这个问题,本方案把颜色空间映射到亮度(光照)和色度(颜色)分离的颜色空间,即采用HSV颜色空间,从而避免了光照对区域分割的影响。
并且,RGB模式虽然是一种常用的颜色空间,但这个空间不区分亮度、色度,主要是面向硬件设备,如物理显示器、摄影机等,并不适合人眼系统,不适于直接用于肤色分割。
HSV颜色空间中H是色调,S是饱和度,V是亮度。H值是色彩的基本属性,也就是通常说的颜色,取值0-360。S是色彩的纯度,S越高色彩越纯,S越低则色彩越灰,取值0-100。 V是亮度,取值0-100。HSV颜色空间可以用一个圆锥空间模型来表示,参见图2。
HSV颜色空间的模型对应于圆柱坐标系中的一个圆锥形子集,圆锥的顶面对应于 V=L它对应RGB模型中的R = 1,G = 1,B = 1三个面,所代表的颜色较亮。色彩H由绕 V轴的旋转角给定。红色对应于角度0°,绿色对应于角度120°,蓝色对应于角度。 在HSV颜色模型中,每一种颜色和它的补色相差180°。饱和度S取值从0到1,所以圆锥顶面的半径为1。HSV颜色模型所代表的颜色域是CIE色度图的一个子集。在圆锥的顶点 (即原点)处,V = 0,H和S无定义,代表黑色。圆锥的顶面中心处S = 0,V= 1,H无定义, 代表白色。从该点到原点代表亮度渐暗的灰色,即具有不同灰度的灰色。对于这些点,S = 0,H的值无定义。可以说,HSV模型中的V轴对应于RGB颜色空间中的主对角线。在圆锥顶面的圆周上的颜色,V = 1,S = 1,这种颜色是纯色。
当利用硬件设备读取原始图片时,硬件设备采用是RGB颜色空间,则通过对原始图片中各像素点的RGB值进行转换,得到所述各像素点的HSV数据。RGB数据向HSV数据的转换方式可以具体表示如下
RGB = > HSV,转换公式如下
令MAX为R、G、B三个分量的最大值;MIN为三个分量的最小值
若MAX = MIN,贝丨J
H = O
S = O
V = MAX/255
若MAX 乒 MIN
当G彡B时
H = (Max-R' +G,_Min+B,-Min) / (Max-Min) X 60
S = 1-MIN/MAX
V = MAX/255
当G < B 时
H = 360- (Max-R' +G,_Min+B,-Min) / (Max-Min) X 60
S = 1-MIN/MAX
V = MAX/255
在利用H的阈值范围进行区域分割之前,先通过聚类分割将颜色属性相近的像素点分割在同一区域,从而提高了最终肤色区域分割的准确度。
本方案的聚类分割处理中,将原始图片中各像素点的HSV数据作为聚类分割的输入数据,即对各像素点的HSV数据执行聚类分割操作。
聚类的主要操作就是在原始图片中各像素点的HSV数据中,根据预定的特征阈值范围进行搜索,将满足所述特征阈值范围的像素点划分在同一个类中。例如,将位于特征阈值范围内的像素点或者接近特征阈值范围的像素点集合在一起归为同一类。
进一步的,在聚类操作中,本方案还可以采用金字塔聚类分割方式,从而达到分割速度更快,分割效果更好的效果。
金字塔聚类分割方式具体包括
通过多分辨分析,将HSV数据构成的原始图片迭代分解为多级不同分辨率的金字塔滤波图像;按照分辨率从高到底的顺序,根据预定的特征阈值范围在所述多个金字塔滤波图像中进行搜索,将满足所述特征阈值范围的像素点划分在同一个类中。
例如,若原始的HSV图像表示为g0,对g0分解得到的一阶金字塔滤波图像表示为 gl,go的分辨率和采样率都比gl低,然后再对gl分解得到的二阶金字塔滤波图像表示为 g2,不断迭代处理得到g3、g4等,这一系列的图像{g0,gl,..., gn}构成金子塔结构,用公式描述如下
gk = R(gk_1)
其中,k表示序号,R( ·)表示关系函数。
每阶的滤波图像对应于一个节点,则示例性的,对每个节点可以有如下公式2 2_] gk(ij)= Yj Yj w(m, η) gh_x (2i + m, 2j + n)m=-2 n=-2
其中,上式中的i,j表示节点的编号,(m,n)表示5*5的像素块的位置,w(m,η)表示对应像素块(m,n)的权重,(2i+m,2j+n)表示该节点与高阶中节点的对应关系。
参见图3,对每一级的金字塔滤波图像对应一级的特征矢量,则聚类处理包括在得到多级特征矢量的基础上,进行如下流程操作
a)确定聚类的HSV距离阀值;
b)选择某级特征失量,作为初始聚类中心,按最小距离原则,把距离近的对象分配到各个聚类中心;
c)取每一区域块中已经初步聚类的特征的平均值作为新的聚类中心;
d)如果聚类中心有变化重复执行b)、c)直到聚类中心稳定及达到a)设置的阀值则结束。
进一步的,金字塔级数的选择需要权衡运算速度和分割效果,级数过小,分割效果较差,级数过高建立金字塔耗费的时间过长,运算速度较慢。在本方案中,迭代分解为4级不同分辨率的金字塔滤波图像,实验证明,4级的金字塔在运算速度和分割效果上都能够达到预期的要求。
112 基于统计结果,选取色调H的阈值范围。
本方案利用H的阈值范围,在聚类的结果上继续进行区域分割。该H的阈值范围为一个基于样本数据统计出来的结果,根据统计结果大量的真实肤色会落在该阈值范围内, 而其他的颜色则散布在该阈值范围之外。
相对于现有基于贝叶斯分类方案的样本量,本方案的样本量较小,简化了操作,节省了资源。具体处理如下
Tl 建立肤色图片的样本库;
T2 确定所述样本库中各肤色图片内的肤色区域。
例如,可以通过人工分割出各肤色图片内的肤色区域。
T3 对肤色区域中出现的每一个H向量,通过如下公式,计算该H向量的概率值
P(Skin)(C) = Skin (c)/PixCount
其中,Skin (c)表示各肤色区域中H向量为c的像素点的个数,PixCoimt表示样本库中各肤色图片所包含的像素点的总数;
T4 当H向量所对应的概率值大于概率阈值时,该H向量属于所述H的阈值范围内。
参见图4,显示了统计得到的表示肤色的H向量的概率分布图,横坐标表示H向量的取值,纵坐标为该H向量表示肤色的概率值。将概率分布图中纵坐标上峰值部分所对应的横坐标区域作为H的阈值范围,即当H向量为c的概率值大于概率阈值时,该H向量c的数值才属于上述H的阈值范围。如图4所示,H向量7至12对应于概率分布的峰值,将7至 12作为上述H的阈值范围。
113:根据所述聚类结果图像中各像素点的H分量以及所述H的阈值范围,进行区域分割,得到所述原始图片的肤色区域。
提取所述聚类结果图像中各像素点的H分量;
判断所述像素点的H分量是否满足H的阈值范围,若满足,如该H分量在7至12 的范围内,确认该像素点位于肤色区域中,并保留该像素点,这些保留的像素点构成所分割得到的像素区域;若不满足,如该H分量在7至12的范围之外,确认该像素点位于肤色区域之外,丢弃该像素点。
由上述步骤,完成对原始图片的肤色分割,得到肤色区域。
12 计算所述肤色区域占原始图片的面积比率。
上述面积比率为肤色区域所占的像素点面积与原始图片所占的像素点面积的比率。
13 当所述面积比率小于第一阈值时,允许所述原始图片;
14:当所述面积比率大于第一阈值且小于第二阈值时,根据所述原始图片得到包含所述肤色区域的剪裁图片,利用所述肤色区域占剪裁图片的面积比率对原始图片进行过滤;
13:当所述面积比率大于第二阈值时,检测出原始图片中的人脸肤色区域,根据人脸肤色区域占肤色区域的面积比率对原始图片进行过滤。
另,由于面积比率与本方案所设置的阈值相等的情况出现的概率较小,本发明实施例对这种相等的情况不再详细讨论,当出现这种情况时,可以将其按照大于或者小于的情况处理。
由上所述,本发明实施例对图片过滤的原理进行分析,在大量实验的基础上,通过过滤逻辑的设置以及过滤阈值的选取,提供了一种新型的图片过滤解决方案,能够极大降低过滤过程中的误判率,快速准确地对黄色图片进行过滤。
本发明实施例二提供的图片过滤方法,参见图5,包括如下步骤
1 对原始图片在HSV空间进行聚类,利用H阈值分割,得到肤色区域。
2 计算肤色区域占原始图片总区域的面积比率Rate (skin)。
3 判断面积比率Rate(Skin)是否小于第一阈值,若是,执行步骤4,若否,执行步马聚5 ο
本方案在执行过滤操作时,将原始图片分为如下的四大类
1)多肤色的色情图片
2)少或无肤色的正常图片
3)多肤色无人脸的正常图片
4)多肤色有人脸的正常图片
上述分类中,第一类属于禁止的色情图片,后三类属于允许的正常图片。
4:确认为正常图片。
在大量实验的基础上,优选的,本实施例中第一阈值的取值为0. 09。
当Rate (skin)小于0. 09时,判断原始图片属于后三类的正常图片,允许原始图片。
5 判断面积比率Rate (Skin)是否大于第一阈值小于第二阈值,若是,执行步骤6 以及7a_9a,若否,执行步骤7b至10b。
Rate (Skin) = Askin/AA11Photo
AA11Ph。t。= Wi dth*He i ght
其中,Askin是肤色区域的像素面积,AA11Photo是整个原始图片的像素面积,Width是原始图片的宽度,Height是原始图片的高度。
优选的,本实施例中第二阈值的取值为0. 20。
6 根据所述原始图片得到包含所述肤色区域的剪裁图片。
对原始图片进行背景裁剪处理,突出肤色区域,从而对人物在原始图片中所占比例较小的场景,也能较好地检测出黄色图片,避免因为人体占整个区域过小而造成漏检,提高过滤的准确率。
参见图6,剪裁方法可以具体如下
检测肤色区域(如图6a中部人形区域所示)的像素点中相对于原始图片每一边界距离最小的像素点,如肤色区域中距离上边界最近(距离最小)的像素点为P。
根据检测出的像素点所确定的位置,分别以平行与每一边界的方向(如Ll方向或 L2方向)剪裁原始图片,得到剪裁图片。具体包括在检测出的像素点所处的位置,分别以平行与每一边界的方向剪裁所述原始图片(如Ll方向),得到剪裁图片;或者,在从检测出的像素点起朝向边界方向的预定位置处(如L2方向),分别以平行与每一边界的方向剪裁所述原始图片,得到剪裁图片。
所得到的一种剪裁图片的示例如图6(b)中所示。
7a 计算肤色区域占剪裁图片的面积比率NewRate (Skin)。
8a:判断面积比率NewRate (Skin)是否大于第三阈值,若是执行步骤7b_10b,若否,执行步骤9a。
优选的,本方案中第三阈值取值为0. 20。
9a 确认原始图片为肤色面积较小的正常图片。
7b:检测出原始图片中的人脸肤色区域,计算人脸肤色区域占肤色区域的面积比率 Rate (face)。
Rate (face) = Aface/Askin
其中,Af_为人脸肤色区域。
本实施例采用如下方式计算人脸肤色区域Afare
本方案中采用基于自适应增强(Adaptive Boosting,Adaboosting)的维尔拉-琼斯(Viola-Jones)算法对原始图片中的人脸区域进行判定,识别出所述人脸区域。
本方案中的人脸识别采用机器学习的方法。采用AdaBoosting分类器中的哈尔 (Haar)分类器。Adaboosting对于人脸检测是基于特征的方法,而不再基于像素。在训练和检测时需要从人脸中抽取大量的简单特征,这里的特征是一种由矩形构成的特征向量, 可以称为Haar特征。
具体的,本方案使用了 Viola-Jones分类算法。该算法在每个节点中使用 AdaBoosting方式来学习一个高检测率低拒绝率的多层树分类器。其关键点主要如下
1)使用类Haar输入特征对矩形图像区域的和或者差进行阀值化。
2)使用的积分图像技术加速了矩形图像区域或者矩形区域45度旋转的值的计算,从而加速类Haar输入特征的计算。
3)基于统计boosting来创建两类分类器(人脸与非人脸)的分类器节点(高通过率、低拒绝率)。
4)将弱分类器节点组成筛选式级联。第一组分类器是最优,能通过包含物体(人脸)的图像区域,同时也可以允许一些不包含物体的图像通过;第二组分类器次优分类器, 也是有较低的拒绝率。在这种方式下,在测试模式下,只要图像区域通过了整个级联,则认为里面有物体(人脸)。
进一步的,AdaBoosting分类器能从弱分类器训练出强分类器,
为了更加清楚地说明本方案,对弱分类器和强分类器进行介绍。
弱分类器是一个多数情况下只有一层的决策树。一种示例性的决策算法可以表示如下,判断特征A的值Vi是否大于某个阀值ti;若是,表示图像可能是人脸,若否表示图像不是人脸,其中,i表示标号
权利要求
1.一种图片过滤方法,其特征在于,所述方法包括通过图片区域分割,提取出原始图片中的肤色区域;计算所述肤色区域占原始图片的面积比率;当所述面积比率小于第一阈值时,允许所述原始图片;当所述面积比率大于第一阈值且小于第二阈值时,根据所述原始图片得到包含所述肤色区域的剪裁图片,利用所述肤色区域占剪裁图片的面积比率对原始图片进行过滤;当所述面积比率大于第二阈值时,检测出原始图片中的人脸肤色区域,根据人脸肤色区域占肤色区域的面积比率对原始图片进行过滤。
2.根据权利要求1所述的方法,其特征在于,所述根据所述原始图片得到包含所述肤色区域的剪裁图片包括检测所述肤色区域的像素点中相对于原始图片每一边界距离最小的像素点;根据检测出的像素点所确定的位置,分别以平行与每一边界的方向剪裁所述原始图片,得到剪裁图片。
3.根据权利要求2所述的方法,其特征在于,所述根据检测出的像素点所确定的位置, 分别以平行与每一边界的方向剪裁所述原始图片,得到剪裁图片包括在检测出的像素点所处的位置,分别以平行与每一边界的方向剪裁所述原始图片,得到剪裁图片;或者,在从检测出的像素点起朝向边界方向的预定位置处,分别以平行与每一边界的方向剪裁所述原始图片,得到剪裁图片。
4.根据权利要求2所述的方法,其特征在于,所述利用所述肤色区域占剪裁图片的面积比率对原始图片进行过滤包括当所述肤色区域占剪裁图片的面积比率小于第三阈值时,允许所述原始图片;当所述肤色区域占剪裁图片的面积比率大于第三阈值时,检测出原始图片中的人脸肤色区域,根据人脸肤色区域占肤色区域的面积比率对原始图片进行过滤。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述根据人脸肤色区域占肤色区域的面积比率对原始图片进行过滤包括当人脸肤色区域占肤色区域的面积比率大于第四阈值时,允许所述原始图片;当人脸肤色区域占肤色区域的面积比率小于第四阈值时,禁止所述原始图片。
6.根据权利要求1所述的方法,其特征在于,所述通过图片区域分割,提取出原始图片中的肤色区域包括获取原始图片中各像素点的HSV数据,并在所述HSV数据中,根据预定的特征阈值范围进行搜索,将满足所述特征阈值范围的像素点划分在同一个类中,得到聚类结果图像;基于统计结果,选取色调H的阈值范围;根据所述聚类结果图像中各像素点的H分量以及所述H的阈值范围,进行区域分割,得到所述原始图片的肤色区域。
7.根据权利要求6所述的方法,其特征在于,所述根据所述聚类结果图像中各像素点的H分量以及所述H的阈值范围,进行区域分割,得到所述原始图片的肤色区域包括提取所述聚类结果图像中各像素点的H分量;判断所述像素点的H分量是否满足H的阈值范围,若满足,确认该像素点位于肤色区域中,并保留该像素点;若不满足,确认该像素点位于肤色区域之外,丢弃该像素点。
8.根据权利要求1所述的方法,其特征在于,所述检测出原始图片中的人脸肤色区域包括采用基于自适应增强Adaboosting的维尔拉-琼斯Viola-Jones算法对原始图片中的人脸区域进行判定,识别出人脸区域;对所述人脸区域和肤色区域做交集运算,通过交集区域得到所述人脸肤色区域。
9.一种图片过滤装置,其特征在于,所述装置包括肤色区域提取单元,用于通过图片区域分割,提取出原始图片中的肤色区域;比率计算单元,用于计算所述肤色区域占原始图片的面积比率;过滤单元,用于当所述面积比率小于第一阈值时,允许所述原始图片;当所述面积比率大于第一阈值且小于第二阈值时,根据所述原始图片得到包含所述肤色区域的剪裁图片, 利用所述肤色区域占剪裁图片的面积比率对原始图片进行过滤;以及,当所述面积比率大于第二阈值时,检测出原始图片中的人脸肤色区域,根据人脸肤色区域占肤色区域的面积比率对原始图片进行过滤。
10.根据权利要求9所述的装置,其特征在于,所述过滤单元,还具体用于通过如下方式利用所述肤色区域占剪裁图片的面积比率对原始图片进行过滤当所述肤色区域占剪裁图片的面积比率小于第三阈值时,允许所述原始图片;当所述肤色区域占剪裁图片的面积比率大于第三阈值时,检测出原始图片中的人脸肤色区域,根据人脸肤色区域占肤色区域的面积比率对原始图片进行过滤;所述过滤单元,还具体用于通过如下方式根据人脸肤色区域占肤色区域的面积比率对原始图片进行过滤当人脸肤色区域占肤色区域的面积比率大于第四阈值时,允许所述原始图片,当人脸肤色区域占肤色区域的面积比率小于第四阈值时,禁止所述原始图片。
全文摘要
本发明公开一种图片过滤方法和装置,能够极大降低过滤过程中的误判率,快速准确地对黄色图片进行过滤。本发明实施例提供的一种图片过滤方法包括通过图片区域分割,提取出原始图片中的肤色区域;计算肤色区域占原始图片的面积比率;当面积比率小于第一阈值时,允许原始图片;当面积比率大于第一阈值且小于第二阈值时,根据原始图片得到包含所述肤色区域的剪裁图片,利用肤色区域占剪裁图片的面积比率对原始图片进行过滤;当面积比率大于第二阈值时,检测出原始图片中的人脸肤色区域,根据人脸肤色区域占肤色区域的面积比率对原始图片进行过滤。
文档编号G06K9/62GK102521610SQ20111040552
公开日2012年6月27日 申请日期2011年12月8日 优先权日2011年12月8日
发明者杨志宇 申请人:北京新媒传信科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1