一种基于Gabor相位模式的图像识别方法

文档序号:6549348阅读:265来源:国知局
专利名称:一种基于Gabor相位模式的图像识别方法
技术领域
本发明涉及图像识别领域,特别涉及到基于Gabor相位模式的图像识别方法。
背景技术
随着数字图像的大量出现,需要对图像进行处理,图像处理的一个重要方面就是图像识别。图像识别就是通过图像间的比对,判断两个或多个图像是否是同一个图像或图像间是否大致相同。图像识别在生物特征识别领域有着广泛的应用并取得了成功,例如指纹识别,人脸识别,虹膜识别等。
人脸识别是图像识别技术的一个成功应用,它在商业应用和研究领域受到了广泛的重视。具体的说,人脸识别就是以一个人脸图像作为标准,对另一个人脸图像进行识别,看这两个人脸图像中的人脸是否是同一个人脸。在人脸识别的过程中,在人脸图像上不可避免地会遇到姿态、光照、老化、噪声等干扰因素的影响,一种好的人脸识别方法就要尽可能地克服干扰,准确地识别人脸。
现有的人脸识别方法从总体上可以分成两类,一类是基于统计分析的人脸识别方法,另一类是基于模板匹配的人脸识别方法。基于统计分析的人脸识别方法在人脸识别领域得到广泛的应用,基于统计分析的典型的人脸识别方法有主成分分析、线性判别技术和Bayesian(贝叶斯)方法等(参考文献[1]M.Turk and A.Pentland,“Face recognition using eigenfaces”,In Proc.IEEE Conference on Computer Vision andPattern Recognition,1991,pp.586-591。参考文献[2]P.Belhumer,P.Hespanha,andD.Kriegman,“Eigenfaecs vs fishertacesrecognition using class specific linearprojection”,IEEE Transactions on Pattern Analysis and Machine Intelligence,1997,19(7),pp.711-720。参考文献[3]B.Moghaddam,C.Nastar,A.Pentland,“A Bayesiansimilarity measure for direct image matching”,In13th International Conference onPattern Recognition,1996,II,pp.350-358.)。上述的基于统计分析的方法都存在着泛化能力不强的缺点,即这些方法需要大量的训练数据来训练识别模型,但通常所能得到的训练数据是有限的,因此经常会造成训练数据的分布不能很好地反映测试数据的分布,从而最终影响识别结果。
针对基于统计分析的人脸识别方法经常存在泛化能力不强的缺点,提出了基于模板匹配的人脸识别方法。基于模板匹配的人脸识别方法是将人脸图像用统一的模板进行编码,然后通过编码之间的匹配来实现人脸识别。基于模板匹配的人脸识别方法的一个具体应用实例是采用Gabor变换实现人脸识别。
Gabor变换是以高斯(Gaussian)函数作为窗函数的短时傅立叶变换,短时傅立叶变换的基本思想是把信号划分成许多小的时间间隔,用傅立叶变换分析每一个时间间隔,以便确定该时间间隔存在的频率。利用了Gabor变换原理的Gabor滤波器能够同时保留空域和频域信息,因此在基于模板匹配的人脸识别方法中得到了应用。Gabor变换在具体实现上就是将Gabor小波和图像灰度图做卷积运算,得到Gabor特征图谱。Gabor小波可由公式(1)表示Ψμ,v(z)=(‖Kμ,v‖/σ2)exp(‖Kμ,v‖2‖z‖2/σ2)(exp(i.Kμ,vz)-exp(-σ2/2))(1)其中,‖代表模运算,z=(x,y)表示空域中像素的位置,σ是高斯函数沿着x轴和y轴的标准差,Kμ,v=(kvcos(Фμ),kvsin(Фμ)),kv=2-(v+2)π/2,Фμ=μπ/8,μ表示尺度,v表示Gabor小波方向。此处所指的尺度与通常意义上的尺度含义不同,它是一个用来表示频率的量。尺度μ和方向v的取值在具体的应用中可变,通常μ=0,1,...,4,v=0,1,...,7(关于小波计算公式的详细信息可见参考文献[4]chengiun Liuand Hurry Wechsler,Gabor Feature Based Classification Using the Enhanced FisherLinear Discriminant Model for Face Recognition.IEEE Trans Image processing vol.11no.4,(2002)467-476)。令I(z)表示人脸图像的灰度分布,I(z)可以通过对图像做灰度化处理得到。图像I(z)和Gabor小波Ψμ,v(z)的卷积公式为Gμ,v(z)=I(z)*Ψμ,v(z) (2)这里*表示卷积运算。
利用Gabor变换得到Gabor特征图谱后,在现有技术中,一种人脸识别方法是利用Gabor幅值信息进行人脸识别(关于利用Gabor幅值信息进行人脸识别的详细信息可见参考文献[5]W.Y.Zhao,R.Chellappa,P.J.Phillips and A.Rosenfeld,“Face RecognitionA Literature Survey”,ACM Computing Survey 2003,pp.399-458.)。利用Gabor变换进行人脸识别的另一种思考方向是利用Gabor相位信息,Gabor相位信息包括实部信息和虚部信息。与Gabor幅值信息相比,Gabor相位信息所包含的信息更多,更有利于提高人脸识别的准确率。
现有技术中,Gabor相位信息已经在虹膜识别中得到应用并取得了很好的识别效果。在利用Gabor相位信息进行虹膜识别的方法中,用Re(Gμ,v(z))和Im(Gμ,v(z))分别表示Gabor特征图Gμ,v(z)的实部和虚部部分。用Pμ,vRe(z)和Pμ,vIm(z)分别表示Gabor相位信息的实部和虚部部分,它们是Gabor特征图谱量化以后的结果。Gabor特征图谱量化的原则为如果Gabor特征图的实部大于0,则相位信息的实部为0,如果Gabor特征图的实部小于或等于0,则相位信息的实部为1;对于虚部,也同样如此。量化计算公式如公式(3)所示Pμ,vRe(z)=0,ifRe(Gμ,v(z))>0;Pμ,vRe(z)=1,ifRe(Gμ,v(z))<=0]]>Pμ,vIm(z)=0,ifIm(Gμ,v(z))>0;Pμ,vIm(z)=1,ifRe(Gμ,v(z))<=0---(3)]]>根据上述公式,可以将量化以后的结果串接成一个二进制字符串,利用该字符串作为最后提取出来的特征,然后在识别过程中利用海明距离作为相似度公式进行人脸识别(利用Gabor相位信息进行虹膜识别方法的详细信息可见参考文献[6]J.G.Daugman,‘High confidence visual recognition of persons by a test of statisticalindependence’,IEEE Transaction on Pattern Analysis and Machine Intelligence,1993,Vol.15,pp.1148-1161)。这种方法利用了Gabor相位信息实现了虹膜识别,但本方法存在模式过于简单的问题,无法用到更复杂图像(如人脸)的识别上,因此也就限制了本方法的使用范围。

发明内容
本发明的目的是提供一种基于Gabor相位模式的图像识别方法,实现对复杂图像的识别。
为了实现上述目的,本发明提供了一种基于Gabor相位模式的图像识别方法,包括1)图像选取步骤,选择所要比较的图像;2)对所要比较的图像做Gabor变换,每个图像得到各自的Gabor特征图谱,Gabor特征图谱中的Gabor特征图分为基于实部的Gabor特征图和基于虚部的Gabor特征图;3)对步骤2)得到的Gabor特征图谱中的各个Gabor特征图提取全局Gabor相位模式,全局Gabor相位模式分为基于实部Gabor特征图的全局Gabor相位模式和基于虚部Gabor特征图的全局Gabor相位模式;4)对步骤2)得到的Gabor特征图谱中的各个Gabor特征图提取局部Gabor相位模式,局部Gabor相位模式分为基于实部Gabor特征图的局部Gabor相位模式和基于虚部Gabor特征图的局部Gabor相位模式;5)对由步骤3)得到的全局Gabor相位模式和由步骤4)得到的局部Gabor相位模式做统计,并将统计结果串接成高维特征向量,每个图像都有各自对应的高维特征向量;6)对图像的高维特征向量做比较,得到高维特征向量间的相似度,利用相似度识别图像。
上述技术方案中,在所述的步骤1)中,在选取图像时对图像做分割操作,分割出图像的核心区域,在后续的Gabor变换时,只对图像的核心区域做Gabor变换。
上述技术方案中,在所述的步骤2)中,所述的Gabor变换是将Gabor小波和图像灰度图做卷积运算,在Gabor变换时,Gabor小波的尺度和方向可有多个取值,由不同的取值得到不同的Gabor特征图,从而得到所述的Gabor特征图谱。
上述技术方案中,在所述的步骤3)中,提取全局Gabor相位模式包括a1)Gabor特征图谱中,在具有相同尺度不同方向的各个Gabor特征图上选取位置相同的一点,对该点的Gabor相位信息做量化处理,每个Gabor特征图得到1位二进制数的量化结果;a2)对具有相同尺度不同方向的各个Gabor特征图上其他位置的点的Gabor相位信息做量化处理,得到多个由二进制数组成的矩阵,矩阵的数目与尺度相同、方向不同的Gabor特征图的数目相同;a3)对由步骤a2)得到的各个矩阵同一位置的二进制数做串接,得到全局Gabor相位模式,若量化处理所基于的Gabor特征图是实部Gabor特征图时,全局Gabor相位模式为基于实部Gabor特征图的全局Gabor相位模式,若量化处理所基于的Gabor特征图是虚部Gabor特征图时,全局Gabor相位模式为基于虚部Gabor特征图的全局Gabor相位模式。
上述技术方案中,在所述的步骤4)中,提取局部Gabor相位模式包括b1)对Gabor特征图谱中各个Gabor特征图做量化处理,得到1位二进制数的量化结果;
b2)对Gabor特征图谱中的某一个Gabor特征图,在图中选取一点,将该点在步骤b1)中所得的量化结果与该点周围的八个点在步骤b1)中所得到的量化结果分别做异或运算,八个异或运算结果按顺序串接成一8位的二进制数字串,所述的8位二进制数字串代表所选取的点,对Gabor特征图中的其他点做相同的操作,得到该Gabor特征图的局部Gabor相位模式;b3)选取Gabor特征图谱中的其他Gabor特征图,重复步骤b2),直到所有的Gabor特征图都得到各自的局部Gabor相位模式。
上述技术方案中,在所述的步骤5)中,在统计Gabor相位模式前先将Gabor相位模式分成多个互不相交的块;Gabor特征图谱中的各个Gabor相位模式的分块方法相同,或不同,但是不同Gabor特征图谱中对应的Gabor相位模式之间的分块方法必须相同。
上述技术方案中,在所述的步骤5)中,用提取直方图法统计Gabor相位模式,统计所得的直方图做串接得到高维直方图,对不同的高维直方图做直方图交运算实现高维直方图之间的比对。
在所述的Gabor相位模式分块以后,在所述的统计Gabor相位模式前,对各个分块赋予不同的权重,对识别效果影响明显的区域所在分块的权重较大,相比较图像的对应分块的权重相同,在所述的步骤6)中,对高维特征向量的比较结果分别乘以权重,得到高维特征向量间的相似度。
本发明的优点在于1、本发明的基于Gabor相位模式的图像识别方法能够保留纹理图像的结构信息,可用于对复杂图像的识别,识别精度高。
2、本发明的基于Gabor相位模式的图像识别方法能有效克服光照、姿态、老化和噪声等干扰因素的影响,识别效果好。


图1为图像在Gabor变换域内的变换结果;图2为基于实部信息的局部Gabor相位模式;图3为基于实部信息的全局Gabor相位模式;图4为计算局部Gabor相位模式的示意图;图5为本发明方法用于人脸识别时与现有人脸识别方法在表情变化测试集上的识别效果比较图;图6为本发明方法用于人脸识别时与现有人脸识别方法在光照变化测试集上的识别效果比较图;图7为本发明方法用于人脸识别时与现有人脸识别方法在时间变化测试集(duplicate-I)上的识别效果比较图;图8为本发明方法用于人脸识别时与现有人脸识别方法在时间变化测试集(duplicate-II)上的识别效果比较图;图9为本发明方法的流程图。
具体实施例方式
下面结合附图和具体实施方式
对本发明的基于Gabor相位模式的图像识别方法进行详细说明。
以图像识别中最为常见的人脸识别为例,如图9所示,本发明方法包括步骤10选取两幅图像,一幅图像是用于比对的标准图像,另一幅图像是待识别的图像。在人脸识别实施例中,所选取的两幅图像上分别包含有人脸区域。标准图像记为图像1,待识别的图像记为图像2。
步骤20对选取的两幅图像分别做分割操作,分割出两幅图像的核心区域,免除图像中与核心区域无关的背景部分对图像识别可能造成的影响,在图像识别时主要识别图像的核心区域是否一致。在人脸识别实施例中,对图像1和图像2在做分割操作时,可以依据图像中人脸的眼睛的位置将人脸按指定的大小分割,从而得到图像1和图像2中的人脸的核心区域,将图像1和图像2中的人脸核心区域分别记为人脸区域1和人脸区域2。
步骤30将两幅图像分割出的核心区域分别做Gabor变换,得到各自图像的Gabor特征图谱。在人脸识别的实施例中,将人脸区域1和人脸区域2分别做Gabor变换,得到Gabor特征图谱1和Gabor特征图谱2。对人脸区域1和人脸区域2的Gabor变换的具体操作大致相同,并且有类似的变换结果,以人脸区域1为例,对Gabor变换做简要说明。Gabor变换过程如背景技术中的公式(1)和公式(2)所示,将Gabor小波和人脸区域1的灰度图做卷积得到Gabor特征图谱1。在Gabor小波的表达公式(1)中,由于尺度μ、方向v可变,如果对μ和v取多个值,就可以得到多个Gabor小波,从而得到多个Gabor特征图。如图1所示,在图中,(a)表示原始人脸图像,在一个实施例中,μ取0、1、2、3、4五个值,v取0、1、2、3、4、5、6、7八个值,计算Gabor小波时首先保持尺度不变,对方向取不同的值,即当μ取0时,方向v分别取0、1、2、3、4、5、6、7得到不同的Gabor小波,对Gabor小波和图像灰度图做卷积,得到不同的Gabor特征图,当μ取1、2、3、4时,方向v分别取0、1、2、3、4、5、6、7等不同的值,同样得到不同的Gabor特征图,所有的Gabor特征图形成Gabor特征图谱。Gabor特征图可进一步划分为实部Gabor特征图和虚部Gabor特征图,在图1中的(b)就是Gabor特征图谱的实部,它是由实部Gabor特征图组成。在Gabor特征图谱1中,包含有40个实部Gabor特征图和40个虚部Gabor特征图。Gabor变换是成熟的现有技术,本领域的普通技术人员由本发明所提供的公式和相关参考文献很容易实现。
步骤40对两幅图像的Gabor特征图谱分别提取全局Gabor相位模式,全局Gabor相位模式体现了在一定尺度下,Gabor特征图在不同方向上的变化规律。在人脸识别的实施例中,对Gabor特征图谱1和Gabor特征图谱2提取全局Gabor相位模式的步骤大致相同,因此以对Gabor特征图谱1的操作为例,说明全局Gabor相位模式的提取过程。
步骤41在Gabor特征图谱1中选取具有相同尺度不同方向的Gabor特征图,在这些特征图上选取位置相同的一点Z0。对所选取的点Z0的Gabor相位信息做量化处理,得到量化结果。在一个具体的实施例中,首先将μ的值取为0并保持不变,然后对v取不同的值,根据量化计算公式(3)得到量化结果Pμ,0Re(Z0)、Pμ,1Re(Z0)……Pμ,kRe(Z0)(μ=0,k=7)。所得到的量化结果是0或1的二进制数,也就是该点的Gabor相位信息。
步骤42对Gabor特征图谱1上具有相同尺度不同方向的Gabor特征图的其他点做同样的量化处理,得到与步骤41类似的量化结果。Gabor特征图谱1上具有相同尺度不同方向的Gabor特征图的所有点量化以后得到多个与Gabor特征图大小相等的矩阵,Gabor特征图上的一个点对应矩阵中相应位置的一个二进制数。矩阵个数的多少与Gabor特征图谱1中当尺度不变时所能取的方向数有关,在一个具体的实施例中,实部Gabor特征图中的方向v可取8个不同的值,从而可得到8个矩阵。在每个矩阵中,每个数所代表的点的方向相同,不同矩阵的数所代表的点之间的方向不同。同样的,虚部Gabor特征图也可得到8个矩阵。
步骤43对同一尺度的不同方向上的Gabor相位信息做串接,得到实部Gabor特征图的全局Gabor相位模式和虚部Gabor特征图的全局Gabor相位模式。用GGPPμRe(Z0)表示实部Gabor特征图的全局Gabor相位模式,用GGPPμIM(Z0)表示虚部Gabor特征图的全局Gabor相位模式。全局Gabor相位模式的提取如公式(4)所示GGPPμRe(Z0)=(Pμ,0Re(Z0),Pμ,1Re(Z0),......,Pμ,kRe(Z0))]]>GGPPμIm(Z0)=(Pμ,0Im(Z0),Pμ,1Im(Z0),......,Pμ,kIm(Z0))---(4)]]>在一个实施例中,也就是将实部Gabor特征图的8个矩阵的对应位置的1位二进制数串接在一起,得到一个新的矩阵,在该矩阵中的每一个元素由8位的二进制字符串组成,各个1位二进制数的串接顺序与方向有关。对实部Gabor特征图的8个矩阵也做了同样的处理。
实部Gabor特征图的全局Gabor相位模式GGPPμRe(Z0)和虚部Gabor特征图的全局Gabor相位模式GGPPμIm(Z0)也可用十进制表示,其计算公式如公式(5)所示GGPPμRe(Z0)=Pμ,0Re(Z0)×2k+Pμ,1Re(Z0)×2k-1,......,+Pμ,kRe(Z0)]]>GGPPμIm(Z0)=Pμ,0Im(Z0)×2k+Pμ,1Im(Z0)×2k-1,......,+Pμ,kRe(Z0)---(5)]]>将同一尺度的不同方向上的相位信息做串接后,对于Gabor特征图谱上尺度一定的点可以用十进制的0-255来表示。
步骤44改变Gabor特征图的尺度值,对该尺度值上不同方向的特征图重复量化、提取、串接操作得到该尺度对应的Gabor特征图的全局Gabor相位模式,直到Gabor特征图谱1中所有尺度的全局Gabor相位模式都已得到。在一个实施例中,改变尺度μ的值,分别将μ的值取为1、2、3、4,重复步骤41、42和43得到全局Gabor相位模式。如图3所示,实部Gabor特征图的全局Gabor相位模式,图3中的5个图有不同的尺度。
对Gabor特征图谱1完成全局Gabor相位模式的提取以后,最后得到了10个与Gabor特征图大小相等的矩阵,这10个矩阵中,5个是关于实部Gabor特征图的矩阵,另5个是关于虚部Gabor特征图的矩阵。在实部Gabor特征图(或虚部Gabor特征图)的矩阵中,不同的矩阵代表了不同的尺度。对Gabor特征图谱2的全局Gabor相位模式的提取与Gabor特征图谱1相类似。
步骤50对两幅图像的Gabor特征图谱分别提取局部Gabor相位模式,局部Gabor相位模式体现了图像中的点与周围点之间的联系。在人脸识别实施例中,对Gabor特征图谱1和Gabor特征图谱2提取局部Gabor相位模式的步骤大致相同,因此以对Gabor特征图谱1的操作为例,说明局部Gabor相位模式的提取过程。
步骤51对Gabor特征图谱1中的各个实部Gabor特征图根据量化计算公式(3)做量化处理,得到量化结果Pμ,vRe(Z)(μ=1、2、3、4;v=0、1、2、3、4、5、6、7),其中的Z表示图中的任意一点;对Gabor特征图谱1中的各个虚部Gabor.特征图根据量化计算公式(3)做量化处理,得到量化结果Pμ,vIm(Z)(μ=1、2、3、4;v=0、1、2、3、4、5、6、7),其中的Z表示图中的任意一点。
步骤52选取Gabor特征图谱1中的某一个Gabor特征图,无论该图是实部Gabor特征图还是虚部Gabor特征图,在图中选取一点Z0,如图4所示,将该点周围的点分别标记为Z1至Z8,把所选取的点Z0和周围的点做异或运算,异或运算的结果是8个1位二进制数,将这8个1位二进制数按照周围点Z1至Z8的顺序串接成一个8位的二进制字符串,该8位的二进制字符串就是该点的局部Gabor相位信息,局部Gabor相位信息也可以转换成十进制数来表示。用LGPPμ,vRe(Z0)表示点Z0基于实部信息的局部Gabor相位信息,用LGPPμ,vIm(Z0)表示点Z0基于虚部信息的局部Gabor相位信息,求解的具体公式如公式(6)所示,其中的XOR表示异或运算LGPPμ,vRe(Z0)=(Pμ,vRe(Z0)XORPμ,vRe(Z1),Pμ,vRe(Z0)XORPμ,vRe(Z2),......,Pμ,vRe(Z0)XORPμ,vRe(Z8))]]>LGPPμ,vIm(Z0)=(Pμ,vIm(Z0)XORPμ,vIm(Z1),Pμ,vIm(Z0)XORPμ,vIm(Z2),......,Pμ,vIm(Z0)XORPμ,vIm(Z8))---(6)]]>通过上述的运算可以得到所选取的点Z0的局部Gabor相位信息,根据同样的方法可以求得某一个Gabor特征图中其他点的局部Gabor相位信息,将所有可求点的局部Gabor相位信息用矩阵表示,所得到的矩阵就是所述的局部Gabor相位模式。对Gabor特征图中的上下左右边界处的点的局部Gabor相位信息不必求取。
步骤53选取Gabor特征图谱1中其他的Gabor特征图,对这些特征图做与步骤52相同的操作,直到Gabor特征图谱1中的所有Gabor特征图都做了类似的操作。如图2所示,为实部Gabor特征图的局部Gabor相位模式。在图2中的各个图的尺度和方向不同。
通过对Gabor特征图谱1的提取局部Gabor相位模式操作,可得到40个基于实部Gabor特征图的局部Gabor相位模式和40个基于虚部Gabor特征图的局部Gabor相位模式。对Gabor特征图谱2的操作也同样如此。
步骤60对两幅图像的所有全局Gabor相位模式和局部Gabor相位模式做分块操作,所分成的各个块之间互不相交。在人脸识别的一个实施例中,每一幅图像可得到10个全局Gabor相位模式和80个局部Gabor相位模式,分别将上述相位模式分块,各个全局Gabor相位模式之间以及各个局部Gabor相位模式之间分块的方法可以相同,也可以各不相同,即分块的数目可以不同,所分成的各个块的大小也可以不同,但是用于识别的两幅图像对应的相位模式之间的分块方法必须相同。此处所述的对应的相位模式是指所对的相位模式必须都是基于实部Gabor特征图的或者都是基于虚部Gabor特征图的,而且所对的相位模式所代表的Gabor特征图的尺度和方向也都要相同。
步骤70在各个分块上统计相位信息,将所有分块的统计结果连接成一个高维特征向量。在人脸识别的一个实施例中,统计相位信息可以通过提取直方图实现。提取直方图的操作过程以基于实部信息的一个全局Gabor相位模式为例,该相位模式中包含有图像上各个点在一定尺度时的全局Gabor相位信息,这些相位信息如果用十进制表示范围在0-255之间,将全局Gabor相位模式分成10个块,在每个块中统计0-255这256个数字的出现次数,一个块的直方图就是将该块中256个数字的出现次数按顺序分别列在图上。一个相位模式被分成10个块就可以列出10个直方图,然后将这10个直方图并排串在一起,得到该相位模式的直方图。对其他Gabor相位模式提取直方图的操作与此类似,最后,对一个图像的所有Gabor相位模式(包含全局Gabor相位模式和局部Gabor相位模式)的直方图串接在一起得到一高维直方图,实现对人脸图像的编码。在图像识别时,两个图像中的各个直方图的串接顺序应当相同。Gabor特征图谱1得到高维直方图1,Gabor特征图谱2得到高维直方图2。直方图的提取和高维直方图的串接都是公开的现有技术,本领域的技术人员很容易实现。
步骤80两个图像得到各自的高维特征向量后,对高维特征向量做比对,得到一个相似度,根据相似度识别图像,相似度的数值越高表明两个图像越相似。在人脸识别的实施例中,将高维直方图1和高维直方图2做比较,采用直方图匹配的方法进行人脸识别,得到图像1和图像2的相似度。直方图匹配的方法可以采用直方图交公式实现,如公式(7)所示D(H2,H1)=Σl=1kmin(H2l,H1l)---(7)]]>其中H1和H2表示高维直方图1和高维直方图2,H1l和H2l表示高维直方图1和高维直方图2的比较项,所述比较项是各个分块的直方图。取两个高维直方图的比较项的较小值,最后将所有的值相加得到图像1和图像2的相似度。直方图匹配是成熟的现有技术,在此不再详细说明。
得到图像1和图像2的相似度后,利用相似度可实现对人脸的识别,在人脸识别的应用中,可以预先设定一个阀值,若图像1和图像2的相似度高于该阀值,则说明图像1和图像2中的人脸是同一个人的人脸,这两个人脸之间可以在光线、年龄、姿态上有所不同。
上述步骤说明了在两个图像间做图像识别的具体操作步骤,在实际应用中,利用本发明方法同样可以对多个图像做识别,图像识别的具体过程与两个图像做图像识别一样,在多个图像做识别的过程中,选取相似度最大的图像作为最终识别结果。
在图像识别时,图像中的某些区域对识别效果的影响较为明显,为了提高图像识别的效果,本发明方法的一个优选方案是在步骤60实现对图像的Gabor相位模式的分块操作以后,对各个分块赋予不同的权重w,其中对识别效果影响明显的区域所在分块的权重较大,相比较图像对应分块的权重应当相同。当分块分别被赋予权重后,在步骤80计算相似度的过程中,对高维特征向量的比对结果分别乘以权重w。以人脸识别为例,当采用直方图交方法实现直方图匹配时,直方图交公式如公式(8)所示D(H2,H1)=Σl=1kmin(H2l,H1l)×wl---(8)]]>权重的使用提高了图像的识别率。
利用本发明的方法可以有效地解决人脸识别过程中姿态、光照、老化、噪声等干扰因素的影响,并得到良好的识别效果。将本发明方法在FERET人脸数据库上做测试,同时与现有的几个著名的人脸识别系统UMD 97、USC 97和MIT 96的识别效果做对比,识别效果如图5、6、7、8所示,其中的图5是表情变化测试集,图6是光照变化测试集,图7和图8是时间变化测试集,在各个图中的GPP就代表本发明的方法,从4个图中的各条识别率曲线可以明显看出,本发明方法较现有的人脸识别系统在各个测试集上都有明显的提高。以图6的光照变化测试集为例,在该测试集中,本发明方法(GPP)平均识别率接近100%,USC 97的识别率在80%到95%之间,UMD 97的识别率在60%到90%之间,而MIT 96的识别率只有30%到75%之间。
本发明方法不仅适用于人脸识别领域,也适用于图像识别的其他领域,并可以取得良好的识别效果。
权利要求
1.一种基于Gabor相位模式的图像识别方法,包括1)图像选取步骤,选择所要比较的图像;2)对所要比较的图像做Gabor变换,每个图像得到各自的Gabor特征图谱,Gabor特征图谱中的Gabor特征图分为基于实部的Gabor特征图和基于虚部的Gabor特征图;3)对步骤2)得到的Gabor特征图谱中的各个Gabor特征图提取全局Gabor相位模式,全局Gabor相位模式分为基于实部Gabor特征图的全局Gabor相位模式和基于虚部Gabor特征图的全局Gabor相位模式;4)对步骤2)得到的Gabor特征图谱中的各个Gabor特征图提取局部Gabor相位模式,局部Gabor相位模式分为基于实部Gabor特征图的局部Gabor相位模式和基于虚部Gabor特征图的局部Gabor相位模式;5)对由步骤3)得到的全局Gabor相位模式和由步骤4)得到的局部Gabor相位模式做统计,并将统计结果串接成高维特征向量,每个图像都有各自对应的高维特征向量;6)对图像的高维特征向量做比较,得到高维特征向量间的相似度,利用相似度识别图像。
2.根据权利要求1所述的基于Gabor相位模式的图像识别方法,其特征在于,在所述的步骤1)中,在选取图像时对图像做分割操作,分割出图像的核心区域,在后续的Gabor变换时,只对图像的核心区域做Gabor变换。
3.根据权利要求1所述的基于Gabor相位模式的图像识别方法,其特征在于,在所述的步骤2)中,所述的Gabor变换是将Gabor小波和图像灰度图做卷积运算,在Gabor变换时,Gabor小波的尺度和方向可有多个取值,由不同的取值得到不同的Gabor特征图,从而得到所述的Gabor特征图谱。
4.根据权利要求1所述的基于Gabor相位模式的图像识别方法,其特征在于,在所述的步骤3)中,提取全局Gabor相位模式包括a1)Gabor特征图谱中,在具有相同尺度不同方向的各个Gabor特征图上选取位置相同的一点,对该点的Gabor相位信息做量化处理,每个Gabor特征图得到1位二进制数的量化结果;a2)对具有相同尺度不同方向的各个Gabor特征图上其他位置的点的Gabor相位信息做量化处理,得到多个由二进制数组成的矩阵,矩阵的数目与尺度相同、方向不同的Gabor特征图的数目相同;a3)对由步骤a2)得到的各个矩阵同一位置的二进制数做串接,得到全局Gabor相位模式,若量化处理所基于的Gabor特征图是实部Gabor特征图时,全局Gabor相位模式为基于实部Gabor特征图的全局Gabor相位模式,若量化处理所基于的Gabor特征图是虚部Gabor特征图时,全局Gabor相位模式为基于虚部Gabor特征图的全局Gabor相位模式。
5.根据权利要求1所述的基于Gabor相位模式的图像识别方法,其特征在于,在所述的步骤4)中,提取局部Gabor相位模式包括b1)对Gabor特征图谱中各个Gabor特征图做量化处理,得到1位二进制数的量化结果;b2)对Gabor特征图谱中的某一个Gabor特征图,在图中选取一点,将该点在步骤b1)中所得的量化结果与该点周围的八个点在步骤b1)中所得到的量化结果分别做异或运算,八个异或运算结果按顺序串接成一8位的二进制数字串,所述的8位二进制数字串代表所选取的点,对Gabor特征图中的其他点做相同的操作,得到该Gabor特征图的局部Gabor相位模式;b3)选取Gabor特征图谱中的其他Gabor特征图,重复步骤b2),直到所有的Gabor特征图都得到各自的局部Gabor相位模式。
6.根据权利要求1所述的基于Gabor相位模式的图像识别方法,其特征在于,在所述的步骤5)中,在统计Gabor相位模式前先将Gabor相位模式分成多个互不相交的块;Gabor特征图谱中的各个Gabor相位模式的分块方法相同,或不同,但是不同Gabor特征图谱中对应的Gabor相位模式之间的分块方法必须相同。
7.根据权利要求1所述的基于Gabor相位模式的图像识别方法,其特征在于,在所述的步骤5)中,用提取直方图法统计Gabor相位模式,统计所得的直方图做串接得到高维直方图,对不同的高维直方图做直方图交运算实现高维直方图之间的比对。
8.根据权利要求6所述的基于Gabor相位模式的图像识别方法,其特征在于,在所述的Gabor相位模式分块以后,在所述的统计Gabor相位模式前,对各个分块赋予不同的权重,对识别效果影响明显的区域所在分块的权重较大,相比较图像的对应分块的权重相同,在所述的步骤6)中,对高维特征向量的比较结果分别乘以权重,得到高维特征向量间的相似度。
全文摘要
本发明公开了一种基于Gabor相位模式的图像识别方法,包括图像选取;对所要比较的图像做Gabor变换,每个图像得到各自的Gabor特征图谱;对Gabor特征图谱中的各个Gabor特征图提取全局Gabor相位模式;对Gabor特征图谱中的各个Gabor特征图提取局部Gabor相位模式;对全局Gabor相位模式和局部Gabor相位模式做统计,并将统计结果串接成高维特征向量;对图像的高维特征向量做比较,得到高维特征向量间的相似度,利用相似度识别图像。本发明的优点在于能够保留纹理图像的结构信息,可用于对复杂图像的识别,识别精度高;能有效克服光照、姿态、老化和噪声等干扰因素的影响,识别效果好。
文档编号G06K9/00GK1858773SQ20051006802
公开日2006年11月8日 申请日期2005年4月30日 优先权日2005年4月30日
发明者高文, 张宝昌, 山世光, 陈熙霖 申请人:中国科学院计算技术研究所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1