一种图像处理方法、装置和计算设备与流程

文档序号:11951970阅读:222来源:国知局
一种图像处理方法、装置和计算设备与流程

本发明涉及图像处理领域,尤其涉及一种图像处理方法、装置和计算设备。



背景技术:

随着图像处理和计算机视觉技术的发展,智能图像编辑成为了一个越来越受关注的问题。传统的图像编辑往往忽视图像中的高层语义信息,对一幅图像中的不同部分采用同样的处理方法,例如传统的图像色彩调整针对的是整幅图像。与之相反,智能的图像编辑往往会对图像的不同区域,根据其语义不同,而采用不同的处理。比如,如果能准确的知道图像中那些像素是头发的影像,就可以在不改变其他区域颜色的情况下改变头发的颜色,即所谓的“染发”功能,而精确的头发检测却是实现染发功能的重要前提。

另外,头发作为人脸识别的一个重要局部特征,在某些情况下不同的发型即脸部区域的头发都可导致人脸识别出现误检,这时如果把分割的头发去除就可提高人脸检测率。而且,还可以根据提取到的头发特征进行人脸识别从而区分相似人脸,以及应用于年龄和性别估计、图像检索领域。

因此精确的头发检测及分析在图像处理中必不可少,但由于头发本身具有颜色多样性和形状变化性,对头发区域的分割具有很大的困难。



技术实现要素:

鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种图像处理方法和装置。

根据本发明的一个方面,提供一种图像处理方法,包括:通过对待处理图像进行人脸检测和五官定位获得其中的人脸关键点;根据人脸关键点e找到待处理图像中确定的头发区域和确定的非头发区域;将待处理图像分割成多个超像素,其中每个超像素由多个颜色相似的像素构成;计算不同超像素之间的连接力度wn(i,j);分别根据所确定的头发区域和非头发区域构建相应区域的概率模型;根据概率模型计算每个超像素属于头发的概率Phair(i);根据不同超像素之间的连接力度wn(i,j)和每个超像素属于头发的概率Phair(i)构建马尔可夫随机场;计算该马尔可夫随机场的最优解,确定每个超像素是否属于头发类。

可选地,在根据本发明的图像处理方法中,根据人脸关键点找到待处理图像中确定的、的头发区域和确定的非头发区域的步骤包括:根据头发在人脸位置上的先验知识获取人脸颊附近的皮肤部分作为确定的非头发区域;以及以眉心为中心点,将额头外围的关键点向外扩张一定区域作为确定的头发区域。

可选地,在根据本发明的图像处理方法中,计算不同超像素之间的连接力度wn(i,j)的步骤包括根据不同超像素之间的颜色相似性计算连接力度,其中,当超像素i和j不相邻时,连接力度wn(i,j)=0,否则其中c(i)=[Ri,Gi,Bi]表示第i个超像素的颜色特征向量,σ是控制高斯函数形状的参数。

可选地,在根据本发明的图像处理方法中,根据所确定的头发区域和非头发区域构建相应类别的概率模型的步骤包括:分别根据所述头发区域和非头发区域的超像素的特征向量构建“头发类”的混合高斯模型GMMhair和“非头发类”的混合高斯模型GMMnon-hair,其中所述超像素的特征向量为该超像素所包含的像素的特征向量的均值。

可选地,在根据本发明的图像处理方法中,第i个超像素的特征向量t(i)包括颜色特征向量c(i)和纹理特征向量,其中颜色特征为RGB三通道像素值,纹理特征为基于梯度的特征。

可选地,在根据本发明的图像处理方法中,纹理特征为通过Gabor滤波器检测到的特征。

可选地,在根据本发明的图像处理方法中,超像素i属于头发类的概率为Phair(i)=GMMhair(t(i))/(GMMhair(t(i))+GMMnon-hair(t(i)))。

可选地,在根据本发明的图像处理方法中,计算马尔可夫随机场的最优解的步骤包括:为所述马尔可夫随机场的每个超像素赋予两种连接参数:nlink和tlink,其中nlink为不同超像素之间的连接,其连接力度为wn(i,j);tlink表示每个超像素属于不同类别的连接,其中属于“头发类”的tlink连接力度为属于“非头发类”的tlink连接力度为

可选地,在根据本发明的图像处理方法中,还包括:采用maxflow/mincut算法计算向量L=[l1,l2,...,ln],其中lk表示第k个超像素的类别标签,其值为1表示该超像素“属于头发类”,为0则表示“属于非头发类”。

可选地,在根据本发明的图像处理方法中,所述maxflow/mincut算法的最小化能量方程为:其中当表达式li≠lj为真时,T(li≠lj)为1,否则为0;所述马尔可夫随机场的最优解表示每个超像素的类别。

可选地,在根据本发明的图像处理方法中,还包括:

根据所述马尔可夫随机场的最优解所给出的每个超像素的类别得到每个像素的类别,并得到一个与待处理图像一样大小的二值模板图,其中类别值为1的像素所组成的区域即为分割出来的头发区域。

可选地,在根据本发明的图像处理方法中,还包括:对二值模板图进行后处理操作,其中所述后处理操作包括边缘平滑或alpha matting。

可选地,在根据本发明的图像处理方法中,所述超像素分割方法包括:Simple Linear Iterative Clustering算法、NomarlizedCuts算法、graph-based approach算法、Mean-Shift算法、QuickShift算法、TurboPixel算法和分水岭算法中的至少一种。

根据本发明的另一个方面,提供一种图像处理装置,包括:关键点获取模块,适于通过对待处理图像进行人脸检测和五官定位获得其中的人脸关键点;区域确定模块,适于根据人脸关键点找到待处理图像中确定的头发区域和确定的非头发区域;超像素分割模块,适于将待处理图像分割成多个超像素,其中每个超像素由多个颜色相似的像素构成;力度计算模块,适于计算不同超像素之间的连接力度wn(i,j);模型构建模块,适于分别根据所确定的头发区域和非头发区域构建相应区域的概率模型;概率计算模块,适于根据所述概率模型计算每个超像素属于头发的概率Phair(i);MRF构建模块,适于根据不同超像素之间的连接力度wn(i,j)和每个超像素属于头发的概率Phair(i)构建马尔可夫随机场MRF;MRF求解模块,适于计算该马尔可夫随机场的最优解,确定每个超像素是否属于头发类。

可选地,在根据本发明的图像处理装置中,区域确定模块适于根据以下方法找到待处理图像中确定的头发区域和确定非头发区域:根据头发在人脸位置上的先验知识获取人脸颊附近的皮肤部分作为确定的非头发区域;以及以眉心为中心点,将额头外围的关键点向外扩张一定区域作为确定的头发区域。

可选地,在根据本发明的图像处理装置中,力度计算模块适于根据不同超像素之间的颜色相似性计算连接力度,其中,当超像素i和j不相邻时,连接力度wn(i,j)=0,否则其中c(i)=[Ri,Gi,Bi]表示第i个超像素的颜色特征向量,σ是控制高斯函数形状的参数。

可选地,在根据本发明的图像处理装置中,模型构建模块适于根据以下方法构建相应类别的概率模型:分别根据所述头发区域和非头发区域的特征向量构建“头发类”的混合高斯模型GMMhair和“非头发类”的混合高斯模型GMMnon-hair,其中所述超像素的特征向量为该超像素所包含的像素的特征向量的均值。

可选地,在根据本发明的图像处理装置中,特征向量t(i)包括颜色特征向量c(i)和纹理特征向量,其中颜色特征为RGB三通道像素值,纹理特征为基于梯度的特征。

可选地,在根据本发明的图像处理装置中,纹理特征为通过Gabor滤波器检测到的特征。

可选地,在根据本发明的图像处理装置中,超像素i属于头发类的概率为Phair(i)=GMMhair(t(i))/(GMMhair(t(i))+GMMnon-hair(t(i)))。

可选地,在根据本发明的图像处理装置中,MRF求解模块适于根据以下方法计算马尔可夫随机场的最优解:为所述马尔可夫随机场的每个超像素赋予两种连接参数:nlink和tlink,其中nlink表示不同超像素之间的连接,其连接力度wn(i,j);tlink表示每个超像素属于不同类别的连接,其中属于“头发类”的tlink为属于“非头发类”的tlink为

可选地,在根据本发明的图像处理装置中,MRF求解模块还适于采用maxflow算法计算向量L=[l1,l2,...,ln],其中lk表示第k个超像素的类别标签,其值为1表示该超像素“属于头发类”,为0则表示“属于非头发类”。

可选地,在根据本发明的图像处理装置中,所述maxflow算法的最小化能量方程为:其中当表达式li≠lj为真时,T(li≠lj)为1,否则为0;该马尔可夫随机场的最优解表示每个超像素所对应的类别。

可选地,在根据本发明的图像处理装置中,还包括:二值图输出模块,适于根据所述马尔可夫随机场的最优解所给出的每个超像素的类别得到每个像素的类别,并得到一个与待处理图像一样大小的二值模板图;其中类别值为1的像素所组成的区域即为分割出来的头发区域。

可选地,在根据本发明的图像处理装置中,二值图输出模块还适于对二值模板图进行后处理操作,其中所述后处理操作包括边缘平滑或alpha matting。

可选地,在根据本发明的图像处理装置中,超像素分割方法包括:Simple Linear Iterative Clustering算法、NomarlizedCuts算法、graph-based approach算法、Mean-Shift算法、QuickShift算法、TurboPixel算法和分水岭算法中的至少一种。

根据本发明的另一个方面,提供一种计算设备,包括如上所述的图像处理装置。

根据本发明的技术方案,通过人脸检测和五官定位技术确定人脸关键点,根据人脸关键点确定图像中的头发区域和非头发区域,并根据头发颜色建立相应区域的混合高斯模型。而且还将图像分割为多个超像素,并根据计算得到的图像中多个超像素间的连接力度以及每个超像素属于头发的概率构建了马尔可夫随机场。另外,通过maxflow/mincut算法得到了该马尔可夫随机场的最优解,从而确定了图像中每个超像素的属性类别,以及每个超像素中所含单个像素的属性类别。本方案算法简单,运算速度快,通过各项精密计算有效保证了头发分割的准确性,而且最终输出为头发的二值模板图也非常便于用户识别。

附图说明

为了实现上述以及相关目的,本文结合下面的描述和附图来描述某些说明性方面,这些方面指示了可以实践本文所公开的原理的各种方式,并且所有方面及其等效方面旨在落入所要求保护的主题的范围内。通过结合附图阅读下面的详细描述,本公开的上述以及其它目的、特征和优势将变得更加明显。遍及本公开,相同的附图标记通常指代相同的部件或元素。

图1示出了根据本发明一个实施例的计算设备100的结构框图;

图2示出了根据本发明一个实施例的图像处理方法200的流程图;

图3示出了根据本发明一个实施例的图像处理装置300的结构框图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。

本发明提供了一种图像处理装置,可以驻留在移动终端中,如相机、摄像机和具有图像处理功能的移动终端等,也可以驻留在计算设备中,图1布置为实现根据本发明的图像处理装置的示例计算设备100的结构框图。

如图1所示,在基本的配置102中,计算设备100典型地包括系统存储器106和一个或者多个处理器104。存储器总线108可以用于在处理器104和系统存储器106之间的通信。

取决于期望的配置,处理器104可以是任何类型的处理,包括但不限于:微处理器((μP)、微控制器(μC)、数字信息处理器(DSP)或者它们的任何组合。处理器104可以包括诸如一级高速缓存110和二级高速缓存112之类的一个或者多个级别的高速缓存、处理器核心114和寄存器116。示例的处理器核心114可以包括运算逻辑单元(ALU)、浮点数单元(FPU)、数字信号处理核心(DSP核心)或者它们的任何组合。示例的存储器控制器118可以与处理器104一起使用,或者在一些实现中,存储器控制器118可以是处理器104的一个内部部分。

取决于期望的配置,系统存储器106可以是任意类型的存储器,包括但不限于:易失性存储器(诸如RAM)、非易失性存储器(诸如ROM、闪存等)或者它们的任何组合。系统存储器106可以包括操作系统120、一个或者多个应用122以及程序数据124。在一些实施方式中,应用122可以布置为在操作系统上利用程序数据124进行操作。

计算设备100还可以包括有助于从各种接口设备(例如,输出设备142、外设接口144和通信设备146)到基本配置102经由总线/接口控制器130的通信的接口总线140。示例的输出设备142包括图形处理单元148和音频处理单元150。它们可以被配置为有助于经由一个或者多个A/V端口152与诸如显示器或者扬声器之类的各种外部设备进行通信。示例外设接口144可以包括串行接口控制器154和并行接口控制器156,它们可以被配置为有助于经由一个或者多个I/O端口158和诸如输入设备(例如,键盘、鼠标、笔、语音输入设备、触摸输入设备)或者其他外设(例如打印机、扫描仪等)之类的外部设备进行通信。示例的通信设备146可以包括网络控制器160,其可以被布置为便于经由一个或者多个通信端口164与一个或者多个其他计算设备162通过网络通信链路的通信。

网络通信链路可以是通信介质的一个示例。通信介质通常可以体现为在诸如载波或者其他传输机制之类的调制数据信号中的计算机可读指令、数据结构、程序模块,并且可以包括任何信息递送介质。“调制数据信号”可以这样的信号,它的数据集中的一个或者多个或者它的改变可以在信号中编码信息的方式进行。作为非限制性的示例,通信介质可以包括诸如有线网络或者专线网络之类的有线介质,以及诸如声音、射频(RF)、微波、红外(IR)或者其它无线介质在内的各种无线介质。这里使用的术语计算机可读介质可以包括存储介质和通信介质二者。

计算设备100可以实现为小尺寸便携(或者移动)电子设备的一部分。计算设备100还可以实现为包括桌面计算机和笔记本计算机配置的个人计算机。在一些实施例中,计算设备100被配置为执行根据本发明的图像白平衡方法200,其中应用122包括根据本发明的图像处理装置300。

图2示出了根据本发明一个实施例的图像处理方法200,该方法始于步骤S210。

在步骤S210中,通过对待处理图像进行人脸检测和五官定位获得其中的人脸关键点。其中,人脸关键点可以包括鼻子、嘴唇、眼睛、外轮廓点等。人脸检测和五官定位技术可以采用现有技术中的任一种方法,传统的机器学习方法或最新的深度学习方法都可,如采用haar特征+adaboost分类器方法、灰度投影法、主动曲线法或卷积神经网络算法等。另外,在进行人脸检测得到人脸区域时,通常还会对该人脸区域进行适当的裁剪与缩放的预处理,以便进行后续的处理操作。

随后,在步骤S220中,根据所述人脸关键点确定待处理图像中的头发区域和非头发区域,即找到“确定的头发区域”(firm hair region,FHR)和“确定的非头发区域”(firm non-hair region,FNHR)。其中,头发区域FHR主要包括人的额头上方的颜色变化比较均匀的区域(秃头情况会利用后续的皮肤检测做特别处理)。而非头发区域FNHR主要包括人脸内的皮肤区域以及距离人脸外围点距离比较远的区域。

已知头发相对于人脸在位置上有一定的先验知识:环绕在人额头周边一定半径内的像素点,如果其颜色均匀,通常为确定的头发区域,其颜色可以作为头发颜色的初始估计;而人的脸颊附近的区域通常能代表人脸的颜色,此颜色可以作为非头发区域颜色的初始估计。因此,根据人脸关键点的比例计算出来这两部分区域的具体位置。具体来说,根据头发在人脸位置上的先验知识获取人脸颊附近的皮肤部分作为确定的非头发区域;以及以眉心为中心点,将额头外围的关键点向外扩张一定区域作为确定的头发区域。

当然,还可以分别获取该扩张区域内的颜色均匀部分和人脸颊附近的均匀部分,并分别以这两部分的颜色作为头发区域和非头发区域的初始颜色特征进行训练,得到与之相近的颜色区间;分别根据所述头发区域和非头发区域的颜色区间对待处理图像进行识别处理,得到与之相匹配的头发区域和非头发区域。

随后,在步骤S230中,将待处理图像分割成多个超像素(super pixel)。每个超像素是一些颜色相似的局部像素的集合,构成图模型中的节点,其中每个超像素的颜色是其包含的像素颜色的平均值。其中,超像素分割可以采用现有的任意一种方法,如Simple Linear Iterative Clustering算法、NomarlizedCuts算法、graph-based approach算法、Mean-Shift算法、QuickShift算法、TurboPixel算法或分水岭算法等。

随后,在步骤S240中,计算不同超像素之间的连接力度wn(i,j)。具体地,根据不同超像素之间的颜色相似性,即超像素颜色距离的高斯函数来计算连接力度。在其中,当超像素i和j不相邻时,连接力度wn(i,j)=0,否则其中c(i)=[Ri,Gi,Bi]表示第i个超像素的颜色特征向量,σ是控制高斯函数形状的参数。在计算过程中所遵循的基本原理是:颜色越相似的两个超像素的连接程度应该越紧密,即越有可能得到一样的类别标签。

随后,在步骤S250中,分别根据所述确定的头发区域和非头发区域构建相应类别的概率模型。具体地,分别根据所述头发区域和非头发区域的特征向量构建相应类别(0表示头发类,1表示非头发类)的混合高斯模型(Gaussian Mixture Model,GMM),即“头发类”的混合高斯模型GMMhair和“非头发类”的混合高斯模型GMMnon-hair。这里用到的特征向量t(i)包括颜色特征向量c(i)和纹理特征向量。颜色特征通常为RGB三通道像素值,纹理特征通常为基于梯度的特征,如Gabor滤波器检测到的特征。而超像素的特征向量为超像素所包含的像素的特征向量的均值。

利用头发训练混合高斯模型通常包括2个步骤:离线训练素材图像,并根据离线训练的结果在线更新训练参数。以颜色特征为例,因头发颜色易受光照、年龄和性别等条件影响,因此可以采用多维混合高斯模型。在应用该模型前,先使用k-means算法聚类训练头发像素,并获得初始化的参数。每个聚类中心分别代表头发在不同条件(光照、颜色、性别)的特征,如设置k值为5,即得到五维高斯混合模型。在进行模型训练时,可以采用常用的求解最大似然估计和最大后验估计的方法更新模型参数,如期望最大化算法(Expectation Maximization,EM)。实际中,还可以加入纹理和位置信息等特种功能来构建概率模型。

随后,在步骤S260中,根据上述概率模型计算每个超像素属于头发的概率Phair(i)。具体地,通常用t(i)表示超像素i的特征向量,由于混合高斯模型可看做是一个概率函数,因此可定义像素i属于头发类的概率为Phair(i)=GMMhair(t(i))/(GMMhair(t(i))+GMMnon-hair(t(i)))。

随后,在步骤S270中,根据不同超像素之间的连接力度wn(i,j)和每个超像素属于头发的概率Phair(i)构建马尔可夫随机场(Markov Random Field,MRF)。这里所构建的马尔可夫随机场,是一个考虑节点之间相似性和节点与标签之间似然性的概率图模型。该图模型中的每个节点(超像素)都有两种可能的状态:属于头发(标签值为1)和不属于头发(标签值为0);而且节点之间通过连接相互影响,连接强度高的两个节点状态更有可能相同。

随后,在步骤S280中,计算马尔可夫随机场的最优解,确定每个超像素是否属于头发类。具体地,可以为所述马尔可夫随机场的每个超像素赋予两种连接参数:nlink和tlink,其中nlink为不同超像素之间的连接,其连接力度为wn(i,j);tlink表示每个超像素属于不同类别的连接,其中“属于头发类”的tlink连接力度为“属于非头发类”的tlink连接力度为

为nlink和tlink赋值完毕后,可以采用maxflow/mincut算法计算向量L=[l1,l2,...,ln],其中lk表示第k个超像素的类别标签,其值为1表示该超像素属于“头发类”,为0则表示属于“非头发类”。其中,maxflow算法的最小化能量方程为:

<mrow> <msub> <mo>&Sigma;</mo> <mi>k</mi> </msub> <mo>&lsqb;</mo> <msub> <mi>l</mi> <mi>k</mi> </msub> <mo>*</mo> <msubsup> <mi>w</mi> <mi>t</mi> <mrow> <mi>n</mi> <mi>o</mi> <mi>n</mi> <mo>-</mo> <mi>h</mi> <mi>a</mi> <mi>i</mi> <mi>r</mi> </mrow> </msubsup> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <mo>+</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>-</mo> <msub> <mi>l</mi> <mi>k</mi> </msub> <mo>)</mo> </mrow> <mo>*</mo> <msubsup> <mi>w</mi> <mi>t</mi> <mrow> <mi>h</mi> <mi>a</mi> <mi>i</mi> <mi>r</mi> </mrow> </msubsup> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo>&rsqb;</mo> <mo>+</mo> <mi>&lambda;</mi> <msub> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> </msub> <mo>&lsqb;</mo> <mi>T</mi> <mrow> <mo>(</mo> <msub> <mi>l</mi> <mi>i</mi> </msub> <mo>&NotEqual;</mo> <msub> <mi>l</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>*</mo> <msub> <mi>w</mi> <mi>n</mi> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>)</mo> </mrow> <mo>&rsqb;</mo> </mrow>

其中,当表达式li≠lj为真时,T(li≠lj)为1;否则为0。该马尔可夫随机场的最优解表示每个超像素的类别。这个能量方程一方面鼓励输出的类别标签符合最终计算出来的头发概率,另一方面又鼓励相似的超像素拥有相似的类别标签。因此通过maxflow/mincut方法得到的解是分割头发和非头发区域的最优解。

另外,已知每个超像素的类别可得到每个像素的类别,因此还可以将上述马尔可夫随机场的最优解转化为与待处理图像一样大小的二值模板图,该二值模板图表示每个像素的类别,其中类别值为1的像素即为分割出来的头发区域,从而方便用户直接快速的确定人脸中的头发影像。此外,我们还可以对二值模板图进行各种后处理操作,如边缘平滑,alpha matting等。

图3示出了根据本发明一个实施例的图像处理装置200,该装置包括关键点获取模块310、区域确定模块320、超像素分割模块330、力度计算模块340、模型构建模块350、概率计算模块360、MRF构建模块370和MRF求解模块380。

关键点获取模块310可以对待处理图像进行人脸检测和五官定位,获得其中的人脸关键点。区域确定模块320可以根据所述人脸关键点找到待处理图像中确定的头发区域和确定的非头发区域。具体地,根据头发在人脸位置上的先验知识获取人脸颊附近的皮肤部分作为确定的非头发区域;以及以眉心为中心点,将额头外围的关键点向外扩张一定区域为确定的头发区域。

超像素分割模块330可以将待处理图像分割成多个超像素,每个超像素由多个颜色相似的像素构成。其中超像素分割方法包括:Simple Linear Iterative Clustering算法、NomarlizedCuts算法、graph-based approach算法、GraphCuts算法、Mean-Shift算法、QuickShift算法、TurboPixel算法和分水岭算法等常规超像素分割算法中的任意一种。

力度计算模块340计算不同超像素之间的连接力度wn(i,j)。具体地,通过不同超像素之间的颜色相似性计算连接力度,其中,当超像素i和j不相邻时,连接力度wn(i,j)=0,否则其中c(i)=[Ri,Gi,Bi]表示第i个超像素的颜色向量,σ是控制高斯函数形状的参数。

模型构建模块350可以分别根据所述确定的头发区域和非头发区域构建相应类别的概率模型。具体地,根据所述头发区域和非头发区域的特征向量构建“头发类”的混合高斯模型GMMhair和“非头发类”的混合高斯模型GMMnon-hair,其中所述超像素的特征向量为该超像素所包含的像素的特征向量的均值。超像素i的特征向量t(i)包括颜色特征向量c(i)和纹理特征向量,颜色特征为RGB三通道像素值,纹理特征为基于梯度的特征,如通过Gabor滤波器检测到的特征。

概率计算模块360可以根据所述概率模型计算每个超像素属于头发的概率Phair(i)。MRF构建模块370可以根据所述不同超像素之间的连接力度wn(i,j)和每个超像素属于头发的概率Phair(i)构建马尔可夫随机场MRF。

MRF求解模块380可以计算所述马尔可夫随机场的最优解,确定每个超像素是否属于头发类。具体地,为所述马尔可夫随机场的每个超像素赋予两种连接参数:nlink和tlink,其中nlink表示不同超像素之间的连接,其连接力度为wn(i,j);tlink表示每个超像素属于不同类别的连接,其中属于“头发类”的tlink连接力度为属于“非头发类”的tlink连接力度为

另外,MRF求解模块380还可以采用maxflow/mincut算法计算向量L=[l1,l2,...,ln],其中lk表示第k个超像素的类别标签,其值为1表示该超像素“属于头发类”,为0则表示“属于非头发类”。其中,maxflow/mincut算法的最小化能量方程为:当表达式li≠lj为真时,T(li≠lj)为1,否则为0;该马尔可夫随机场的最优解表示每个超像素所对应的类别。

另外,本发明的图像处理装置300还可以包括二值图输出模块,适于根据所述马尔可夫随机场的最优解所给出的每个超像素的类别得到每个像素的类别,并得到一个与待处理图像一样大小的二值模板图,其中类别值为1的像素所组成的区域即为分割出来的头发区域。

另外,该二值图输出模块还可以对所述二值模板图进行后处理操作,如边缘平滑或alpha matting等。根据本发明的图像处理装置300,其具体细节已在基于图1和图2的描述中详细公开,在此不再赘述。

根据本发明的技术方案,巧妙地结合了图像中头发区域的多种信息:头发在位置上相对于人脸的先验知识;头发的颜色多集中在颜色空间中的某个较小的区域;头发区域多是连通的,且和背景像素通常有颜色上的边界。通过利用这些信息确定了人脸图像中的头发区域和非头发区域,并将图像分割为多个超像素后得到了不同超像素间的连接力度,以及构建了不同区域的混合概率模型。最后,根据所述不同超像素之间的连接力度和每个超像素属于头发的概率构建了马尔可夫随机场,并通过maxflow/mincut算法得到最终的头发模板图。本方案不仅算法简单,运算速度快,而且完全不需要用户交互,在实践中达到了令人满意的效果。

A9、如A8所述的方法,还包括:采用maxflow/mincut算法计算类别向量L=[l1,l2,...,ln],其中lk表示第k个超像素的类别标签,其值为1表示该超像素属于“头发类”,为0则表示属于“非头发类”。

A10、如A9所述的方法,其中所述maxflow/mincut算法的最小化能量方程为:其中当表达式li≠lj为真时,T(li≠lj)为1,否则为0;所述马尔可夫随机场的最优解表示每个超像素的类别。

A11、如A9所述的方法,还包括:根据所述马尔可夫随机场的最优解所给出的每个超像素的类别得到每个像素的类别,并得到一个与待处理图像一样大小的二值模板图,其中类别值为1的像素所组成的区域即为分割出来的头发区域。

A12、如A11所述的方法,还包括:对二值模板图进行后处理操作,其中所述后处理操作包括边缘平滑或alpha matting。

A13、如A1所述的方法,其中所述超像素分割方法包括:Simple Linear Iterative Clustering算法、NomarlizedCuts算法、graph-based approach算法、Mean-Shift算法、QuickShift算法、TurboPixel算法和分水岭算法中的至少一种。

B15、如B14所述的装置,其中所述区域确定模块适于根据以下方法找到待处理图像中确定的头发区域和确定的非头发区域:根据头发在人脸位置上的先验知识获取人脸颊附近的皮肤部分作为确定的非头发区域;以及以眉心为中心点,将额头外围的关键点向外扩张一定区域,获取该扩张区域内的颜色均匀部分作为确定的头发区域。

B16、如B14所述的装置,其中所述力度计算模块适于根据不同超像素之间的颜色相似性计算连接力度,其中,当超像素i和j不相邻时,连接力度wn(i,j)=0,否则其中c(i)=[Ri,Gi,Bi]表示第i个超像素的颜色特征向量,σ是控制高斯函数形状的参数。

B17、如B14所述的装置,其中所述模型构建模块适于根据以下方法构建相应类别的概率模型:分别根据所述头发区域和非头发区域的特征向量构建“头发类”的混合高斯模型GMMhair和“非头发类”的混合高斯模型GMMnon-hair,其中所述超像素的特征向量为该超像素所包含的像素的特征向量的均值。

B18、如B17所述的装置,其中所述超像素i的特征向量t(i)包括颜色特征向量c(i)和纹理特征向量,其中所述颜色特征为RGB三通道像素值,所述纹理特征为基于梯度的特征。

B19、如B18所述的装置,所述纹理特征为通过Gabor滤波器检测到的特征。

B20、如B17所述的装置,超像素i属于头发类的概率为Phair(i)=GMMhair(t(i))/(GMMhair(t(i))+GMMnon-hair(t(i)))。

B21、如B14所述的装置,其中所述MRF求解模块适于根据以下方法计算马尔可夫随机场的最优解:为所述马尔可夫随机场的每个超像素赋予两种连接参数:nlink和tlink,其中nlink表示不同超像素之间的连接,其连接力度为wn(i,j);tlink表示每个超像素属于不同类别的连接,其中属于“头发类”的连接力度为属于“非头发类”的连接力度为

B22、如B21所述的装置,MRF求解模块还适于采用maxflow/mincut算法计算向量L=[l1,l2,...,ln],其中lk表示第k个超像素的类别标签,其值为1表示该超像素属于“头发类”,为0则表示属于“非头发类”。

B23、如B22所述的装置,其中所述maxflow/mincut算法的最小化能量方程为:其中当表达式li≠lj为真时,T(li≠lj)为1,否则为0;所述马尔可夫随机场的最优解表示每个超像素所对应的类别。

B24、如B14所述的装置,还包括:二值图输出模块,适于根据所述马尔可夫随机场的最优解所给出的每个超像素的类别得到每个像素的类别,并得到一个与待处理图像一样大小的二值模板图;其中类别值为1的像素组成的区域即为分割出来的头发区域。

B25、如B24所述的装置,所述二值图输出模块还适于对所述二值模板图进行后处理操作,其中所述后处理操作包括边缘平滑或alpha matting。

B26、如B14所述的装置,其中所述超像素分割方法包括:Simple Linear Iterative Clustering算法、NomarlizedCuts算法、graph-based approach算法、Mean-Shift算法、QuickShift算法、TurboPixel算法和分水岭算法等算法中的至少一种。

在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下被实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。

类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员应当理解在本文所公开的示例中的设备的模块或单元或组件可以布置在如该实施例中所描述的设备中,或者可替换地可以定位在与该示例中的设备不同的一个或多个设备中。前述示例中的模块可以组合为一个模块或者此外可以分成多个子模块。

本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

此外,所述实施例中的一些在此被描述成可以由计算机系统的处理器或者由执行所述功能的其它装置实施的方法或方法元素的组合。因此,具有用于实施所述方法或方法元素的必要指令的处理器形成用于实施该方法或方法元素的装置。此外,装置实施例的在此所述的元素是如下装置的例子:该装置用于实施由为了实施该发明的目的的元素所执行的功能。

如在此所使用的那样,除非另行规定,使用序数词“第一”、“第二”、“第三”等等来描述普通对象仅仅表示涉及类似对象的不同实例,并且并不意图暗示这样被描述的对象必须具有时间上、空间上、排序方面或者以任意其它方式的给定顺序。

尽管根据有限数量的实施例描述了本发明,但是受益于上面的描述,本技术领域内的技术人员明白,在由此描述的本发明的范围内,可以设想其它实施例。此外,应当注意,本说明书中使用的语言主要是为了可读性和教导的目的而选择的,而不是为了解释或者限定本发明的主题而选择的。因此,在不偏离所附权利要求书的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。对于本发明的范围,对本发明所做的公开是说明性的,而非限制性的,本发明的范围由所附权利要求书限定。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1