一种复杂光照下图像特征提取方法与流程

文档序号:11177819阅读:1460来源:国知局
一种复杂光照下图像特征提取方法与流程

本发明属于图像处理技术领域,涉及一种图像特征提取方法,尤其是一种复杂光照下图像特征提取方法。



背景技术:

近年来,随着科技的不断发展,图像特征提取技术逐渐成为计算机视觉领域最热门的研究课题之一,吸引了大量学者的研究和关注。该技术的普及顺应了时代的发展,也给人们的工作和生活带来方便。但由于提取到的图像特征容易受到光照变化的影响,因此即便发展到今天,图像特征提取技术依旧存在着一定的局限性。

现有技术中,典型的图像特征提取技术有wld、lgs等,这些算法都存在一些缺陷,具体如下所述:

一、wld算法:

(1)wld算子在计算像素点xc的差分激励ξ(xc)时采用的是各向同性的滤波器,即二阶拉普拉斯算子,而这就造成了像素点之间的差值互相抵消,从而没有将局部灰度信息充分展现出来;

(2)wld算子仅对像素点xc水平方向和垂直方向上的灰度变化情况进行了表述,并没有完全表述出xc所有邻接像素点的灰度变化情况,因此在对纹理的内在变化进行描述时存在着一些问题。

二、lgs算法

局部图结构(lgs)算子虽然拥有计算简单、纹理区分能力强、灰度不变性等诸多显著优点,然而,lgs算子亦有一定的局限性:

(1)它包含了邻域像素之间的冗余信息;

(2)由于这种局部纹理描述子在结构上是不对称的,它并没有从像素的左右邻域内获取数量一致的信息,其右侧邻域相比于左侧包含了更多的像素(左侧拥有2个像素,而右侧则拥有3个像素)。因此,在表示像素的局部纹理特征时,从其邻域计算得出的lgs值包含了更多的右侧空间信息。



技术实现要素:

本发明的目的在于克服上述现有技术的缺点,提供一种复杂光照下图像特征提取方法。

本发明的目的是通过以下技术方案来实现的:

这种复杂光照下图像特征提取方法为:

(1)首先计算wld各向异性差分激励,得到图像的差分激励特征;

(2)计算对称性lgs算子,得到图像的对称性lgs特征;

(3)使用各向异性的wld差分激励特征和对称性lgs特征分别替代wld算子中的差分激励特征和梯度方向特征,融合成wlgs特征;

(4)将步骤(3)中的二维wlgs特征直方图进一步映射成一维wlgs特征直方图,以增强特征的区分性能和描述能力。

进一步,以上步骤(1)中,计算wld各向异性差分激励方法为:

log算子的函数形式如下:

通过对σ在x和y方向上分别取不同的值,从而使得σ对x和y产生具有差别的影响;

对于一个标准的椭圆,其数学表达式为:

x2/a2+y2/b2=1(a≠b)(3)

将这个椭圆逆时针方向转α角度后,得出新的坐标关系:

将式(4)带入式(3)中,可得到此时该椭圆方程为:

(xcosα+ysinα)2/a2+(ycosα-xsinα)2/b2=1(5)

再将式(5)带入式(2)中,可得到各向异性的log算子:

式中各参数的取值分别为:a=xcos2α+ysinαcosα,b=xsin2α-ysinαcosα,c=xsinαcosα+ysin2α,d=-xsinαcosα+ycos2α,e=xcosα+ysinα,f=ycosα-xsinα;

尺度参量σx的计算公式如下:

其中i(x,y)代表像素点(x,y)的灰度值,i(x,y)的值归一化为[0,1]区间;

尺度参量σy的计算公式如下:

式中,k取固定值,表示m×n窗口内的灰度均方差,代表邻域灰度的均值,和i(i,j)的取值范围均为[0,255];

针对各向异性log算子中的角度参量α,采用kirsch算子来进行确定;通过对图像中各点的每个方向模板进行计算,并将其中取得最大值的模板对应的方向作为该点的角度参量值,即可实现α根据每个像素点的最大方向值自适应确定角度的目的;

将得到的尺度参量σx,σy,角度参量α代入式6,就能够形成各向异性的log算子,然后再通过以下公式(9)得到图像f的各向异性wld差分激励算子:

进一步,以上步骤(2)中,计算对称性lgs算子:

对于目标像素点(xd,yd),其对称性lgs编码计算公式如式(10)所示:

其中,p=7,6,…,0表示二项式加权值,gd-gn表示后一个像素点与前一个像素点之间的像素差值,并且

进一步,以上步骤(4)中:

wlgs由两部分组成:差分激励和ilgs;对于给定的一副图像,首先利用图计算出每个像素点的ilgs编码值,然后计算出每个像素点的各向异性差分激励,从而得到ilgs图像和差分激励图像;根据ilgs图像和差分激励图像,构造二维直方图来描述图像的特征wlgshistogram(m,t):

wlgshistogram(m,t)={ξ,ilgs}

其中m=0,1,…,m-1,t=0,1,…,t-1,wlgshistogram(m,t)的大小为t×m,m是ξ的区间数,t是ilgs值的总数。进一步,所述t的最优值设为256。

进一步,以上二维直方图中的每一列对应的是一个ilgs值,每一行则对应着一个差分激励区间,因此,每一小块wlgshistogram(m,t)对应的是一个确定的差励区间m和ilgs值t的频率。

进一步,对以上二维直方图wlgshistogram(m,t)按行进行展开,并形成一个一维直方图h;其中,每一个子直方图h(m)对应的是差励区间m;把m个子直方图按照一定的顺序连接起来就形成了最终的一维直方图h=[h(0),h(1),…h(m-1)]。

与现有技术相比,本发明具有以下有益效果:

本发明复杂光照下图像特征提取方法结合了韦伯局部描述符和局部图结构的优点,提出基于局部图结构的特征提取方法(wlgs),其通过使用各向异性的wld差分激励和对称性lgs算子分别替代原始wld算子中的差分激励和梯度方向而产生的。利用wlgs算子进行图像特征提取时,首先计算出该图像的各向异性差分激励图像和对称性lgs图像,然后将其融合形成二维wlgs直方图,并进而转化为一维直方图,以用其对图像特征进行表示。实验结果表明,与现有技术中经典的图像特征提取方法相比,本文算法在进行图像特征提取时对光照变化更具鲁棒性。

附图说明

图1为ilgs算子结构图;

图2为ilgs算子计算示意图;

图3为韦伯局部图结构(wlgs)算子示意图;

图4为wlgs直方图计算示意图;

图5为差分激励计算示意图;

图6为lgs算子结构图;

图7为lgs算子;

图8为photex数据库部分图像;

图9为photex数据库对比实验结果图;

图10为rawfoot数据库部分图像;

图11为rawfoot数据库对比实验结果图。

具体实施方式

本发明的复杂光照下图像特征提取方法,具体包括以下步骤:

步骤一、首先计算wld各向异性差分激励,得到图像的差分激励特征;具体为:

log算子的函数形式如下:

可以通过对σ在x和y方向上分别取不同的值,从而使得σ对x和y产生具有差别的影响。

对于一个标准的椭圆,其数学表达式为:

x2/a2+y2/b2=1(a≠b)(3)

如果将这个椭圆逆时针方向转α角度后,可得出其新的坐标关系:

将式(4)带入式(3)中,可得到此时该椭圆方程为:

(xcosα+ysinα)2/a2+(ycosα-xsinα)2/b2=1(5)

再将式(5)带入式(2)中,可得到各向异性的log算子:

式中各参数的取值分别为:a=xcos2α+ysinαcosα,b=xsin2α-ysinαcosα,c=xsinαcosα+ysin2α,d=-xsinαcosα+ycos2α,e=xcosα+ysinα,f=ycosα-xsinα。

尺度参量σx的计算公式如下:

其中i(x,y)代表像素点(x,y)的灰度值,i(x,y)的值归一化为[0,1]区间。

尺度参量σy的计算公式如下:

式中,k取固定值,表示m×n窗口内的灰度均方差,代表邻域灰度的均值,和i(i,j)的取值范围均为[0,255]。

针对各向异性log算子中的角度参量α,采用kirsch算子来进行确定。通过对图像中各点的每个方向模板进行计算,并将其中取得最大值的模板对应的方向作为该点的角度参量值,即可实现α根据每个像素点的最大方向值自适应确定角度的目的。

将得到的尺度参量σx,σy,角度参量α代入式(6),就能够形成各向异性的log算子。然后再通过公式(9)就能够得到图像f的各向异性wld差分激励算子。

步骤二、计算对称性lgs算子,得到图像的对称性lgs特征;具体计算对称性lgs算子(ilgs):

对于目标像素点(xd,yd),其对称性lgs编码计算公式如式(10)所示:

其中,p=7,6,…,0表示二项式加权值,gd-gn表示后一个像素点与前一个像素点之间的像素差值,并且

其计算过程示意图如图1所示。

图2给出了一个ilgs的计算实例,其计算过程与lgs类似。

步骤三、使用各向异性的wld差分激励特征和对称性lgs特征分别替代wld算子中的差分激励特征和梯度方向特征,融合成wlgs特征。

步骤四、将步骤三中的二维wlgs特征直方图进一步映射成一维wlgs特征直方图,以增强特征的区分性能和描述能力,具体如下:

wlgs由两部分组成:差分激励和ilgs。对于给定的一副图像,首先利用图计算出每个像素点的ilgs编码值,然后计算出每个像素点的各向异性差分激励,从而得到ilgs图像和差分激励图像。如图3所示。根据这两幅图像,构造二维直方图来描述图像的特征:

wlgshistogram(m,t)={ξ,ilgs}

其中m=0,1,…,m-1,t=0,1,…,t-1,wlgshistogram(m,t)的大小为t×m,m是ξ的区间数,t是ilgs值的总数,在本文中,t的值设为256。

简而言之,二维直方图中的每一列对应的是一个ilgs值,每一行则对应着一个差分激励区间。因此,每一小块wlgshistogram(m,t)对应的是一个确定的差励区间m和ilgs值t的频率。

出于增强特征的区分性和描述能力的目的,需要对二维直方图wlgshistogram(m,t)按行进行展开,并形成一个一维直方图h。其中,每一个子直方图h(m)对应的是差励区间m。把m个子直方图按照一定的顺序连接起来就形成了最终的一维直方图h=[h(0),h(1),…h(m-1)]。如图4所示。

下面结合附图对本发明做进一步详细描述:

本发明基于韦伯算子(wld)和局部图结构(lgs)算子展开。针对wld算子各向同性的特点,提出了一种各向异性的wld算子,以解决其在具有方向性差异的场合中局部纹理区分能力不足的问题。同时,针对lgs算子结构上的不对称且包含了冗余信息的问题,提出了一种对称性的lgs算子,从而构建了一种更为均衡的用来提取像素邻域间纹理信息的方式。并在此基础上结合韦伯局部描述符和局部图结构的优点,提出了一种基于韦伯局部图结构的人脸特征提取方法(wlgs),它是通过用各向异性wld差分激励和对称性lgs算子分别替代原始wld算子中的差分激励和梯度方向而产生的,能够提取更多的纹理细节和多个方向梯度信息,所以能更好地提取出图像的细节信息。

项异性wld算子

wld差分激励通过中心像素和邻域像素的灰度值来计算,它用来描述图像的显著变化,反映了局部窗内灰度变化的强度信息,其目的是寻找一幅图像在人眼视觉感知中变化比较明显的区域。设当前像素点为xc,该像素点的差分激励为ξ(xc)。则各向同性wld差分激励计算过程如下图5所示。其中:表示当前像素点xc与其p个邻接像素点之间的像素差值,表示当前像素点xc的像素值。

由于wld算子在计算像素点xc的差分激励ξ(xc)时采用的是各向同性的二阶拉普拉斯算子来作为滤波器,而这就造成了像素点之间的差值互相抵消,从而没有将局部灰度信息充分展现出来。因此本发明的改进算法将从此入手,将高斯滤波和拉普拉斯算子结合在一起并对其进行改进,形成各向异性log(laplacianofgaussian)算子。然后通过式2.1对图像f与log算子进行卷积来对δi进行计算,即得各向异性的wld差分激励算子。

δi=log*f(x,y)(2.1)

根据上述理论基础,通过推导出改进型的log算子就可以实现对原始wld算子差分激励分量的改进。

传统的log算子的函数形式如下:

可以通过对σ在x和y方向上分别取不同的值,从而使得σ对x和y产生具有差别的影响。

对于一个标准的椭圆,其数学表达式为:

x2/a2+y2/b2=1(a≠b)(2.4)

如果将这个椭圆逆时针方向转α角度后,可得出其新的坐标关系:

将式2.5带入式2.4中,可得到此时该椭圆方程为:

(xcosα+ysinα)2/a2+(ycosα-xsinα)2/b2=1(2.6)

再将式2.6带入式2.3中,可得到各向异性的log算子:

式中各参数的取值分别为:a=xcos2α+ysinαcosα,b=xsin2α-ysinαcosα,c=xsinαcosα+ysin2α,d=-xsinαcosα+ycos2α,e=xcosα+ysinα,f=ycosα-xsinα。

尺度参量σx的计算公式如下:

其中i(x,y)代表像素点(x,y)的灰度值,i(x,y)的值归一化为[0,1]区间。

尺度参量σy的计算公式如下:

式中,k取固定值,表示m×n窗口内的灰度均方差,代表邻域灰度的均值,和i(i,j)的取值范围均为[0,255]。

针对各向异性log算子中的角度参量α,本文采用kirsch算子来对其进行确定。kirsch算子含有8个方向模板,并且每个模板分别代表一种特定方向,通过对图像中各点的每个方向模板进行计算,并将其中取得最大值的模板对应的方向作为该点的角度参量值,即可实现α根据每个像素点的最大方向值自适应确定角度的目的。

将得到的尺度参量σx,σy,角度参量α代入式2.7,就能够形成各向异性的log算子。然后再通过公式2.1即可得到各向异性的wld差分激励算子。

对称性lgs算子

lgs算子定义在一个3×4的矩形窗口内,如图6所示,针对目标像素点(图中用灰色圆点表示),局部图结构首先按逆时针方向沿着该像素左边区域移动。如果后一个像素点的值大于或者等于前一个像素点的值,那么将会标记一个二进制值1用于连接两个像素点,否则将会其标记为0。在完成目标像素点左边区域的比较后,水平移动至该像素点的右侧邻接像素点进行比较,然后再按顺时针方向对右边区域应用相同的过程,直到回到目标像素点为止。因此当比较完所有的像素点之后,在3×4的矩形窗口内将会获得一个八比特的二进制数,然后再按照位置分别赋予不一样的权重值,并对其进行求和,就可以将该二进制数转换为一个十进制的整数,这个整数就作为这个矩形窗口中目标像素点的lgs编码值,然后就能够用这个编码值来反映这个区域的纹理特征信息。

局部图结构(lgs)算子虽然拥有计算简单、纹理区分能力强、灰度不变性等诸多显著优点,然而,lgs算子亦有一定的局限性。它包含了邻域像素之间的冗余信息,例如图7中像素分别为30和33的像素点,并且由于这种局部纹理描述子在结构上是不对称的,它并没有从像素的左右邻域内获取数量一致的信息,其右侧邻域相比于左侧包含了更多的像素(左侧拥有2个像素,而右侧则拥有3个像素)。因此,在表示像素的局部纹理特征时,从其邻域计算得出的lgs值包含了更多的右侧空间信息。

针对上述问题,本发明提出一种改进型的lgs算子,称为ilgs算子,用以提高lgs算子的性能。ilgs算子是一个对称性的局部图结构,如图4所示,其对称性主要是通过修改普通lgs左右邻域内不相等的像素数量得到的,ilgs在其左右邻域内拥有相同的像素数量(左右邻域内均有3个像素的值被加以利用)。与普通lgs算子相比,该算子能提取到更多关于图像纹理的空间信息,并且可以以一种更加平衡的方式提取像素左右邻域的纹理信息,使得每一个像素的局部特征有一个更好的表示。

韦伯局部图结构(wlgs)

wlgs由两部分组成:差分激励和ilgs。对于给定的一副图像,首先利用图计算出每个像素点的ilgs编码值,然后计算出每个像素点的各向异性差分激励,从而得到ilgs图像和差分激励图像。

根据这两幅图像,构造二维直方图来描述图像的特征:

wlgshistogram(m,t)={ξ,ilgs}

其中m=0,1,…,m-1,t=0,1,…,t-1,wlgshistogram(m,t)的大小为t×m,m是ξ的区间数,t是ilgs值的总数,在本文中,t的值设为256。

简而言之,二维直方图中的每一列对应的是一个ilgs值,每一行则对应着一个差分激励区间。因此,每一小块wlgshistogram(m,t)对应的是一个确定的差励区间m和ilgs值t的频率。

出于增强特征的区分性和描述能力的目的,需要对二维直方图wlgshistogram(m,t)按行进行展开,并形成一个一维直方图h。其中,每一个子直方图h(m)对应的是差励区间m。把m个子直方图按照一定的顺序连接起来就形成了最终的一维直方图h=[h(0),h(1),…h(m-1)]。

实验结果与对比分析

为了验证算法的有效性,本发明选用了photex数据库<http://www.macs.hw.ac.uk/texturelab/resources/databases/>,该数据中包括了各种方向的纹理图像,这些图像是从不同光照环境下拍摄的各种图像,可以很好的验证光照复杂性目标图像的描述性能。在试验中,本发明选取了18种纹理,每种有20种不同光照的环境,部分图像图8所示。

为了更好的表示算法的有效性,本发明选择经典的去光照特征提取方法局部二进制模式,韦伯二进制模式韦、伯局部描述算子和本发明方法进行对比,在试验中,分类识别算法选取径向基神经网络(取matlab工具箱),实验的结果如图9所示,从图9可以看出,随着训练样本数的增加,各种方法的识别率都在增加。此外,我们可以看出,我们提出的方法取得了最好的识别效果,验证了方法的有效性。

为了进一步验证算法的有效性,选取了rawfoot(rawfoodtexturedatabase)纹理数据库,该库包括了46种不同光照的68种纹理图像,可以很好的验证算法对复杂光照的鲁棒性,部分图像如图10所示。

为了更好的表示算法的有效性,选择经典的去光照特征提取方法局部二进制模式,韦伯二进制模式韦、伯局部描述算子和本发明方法进行对比,在试验中,分类识别算法我们选取径向基神经网络(取matlab工具箱),实验的结果如图11所示,从图11可以看出,随着训练样本数的增加,各种方法的识别率都在增加。此外可以看出,本发明提出的方法取得了最好的识别效果,进一步验证了方法的有效性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1