用万有引力场转换算法识别人耳特征的方法

文档序号:1131161阅读:241来源:国知局
专利名称:用万有引力场转换算法识别人耳特征的方法
技术领域
本发明涉及利用人体生物特征的个人身份识别领域,特别涉及一种用万有引力场转换算法识别人耳特征的方法。

背景技术
人耳识别技术是一种新兴的生物识别技术,涉及到生物特征提取、计算机视觉、图像处理、模式识别和身份认证技术等诸多领域。其独特的生理特征和观测角度,使它具有相当的理论研究价值和实际应用前景。它既可以作为其他生物识别技术的有益补充,如和人脸、指纹相结合进行识别,也可以单独应用于一些个体身份鉴别的场合。
人耳识别与其他生物特征识别相比具有独特的优势,与指纹识别相比它具有非接触的信息采集方式,比较容易被人接受,与人脸识别相比具有特征稳定不变的优点。目前,一般的人耳识别方法都包含以下步骤人耳图像的采集、预处理、边缘检测与分割、特征提取和识别。其中,由于人耳图像容易受头发和头部饰物如耳环、眼镜等的影响,使得人耳图像的边缘检测与分割成为研究者们面临的一个复杂难题。
针对识别过程中出现的这种检测难题,英国南安普敦大学的David J.Hurley等提出了一种无需人耳边缘检测的特征提取方法。该方法利用力场转换理论将图像转换为像素之间的高斯力场,利用能量守恒定律找出图像的势能阱作为人耳的特征并通过这个特征来识别人耳。由于这种方法在实际的识别中仍然存在边缘图像不清晰、没有解决噪声污染下势能阱的分裂、对所提取的势能阱的特征表示不利于识别等问题,使得人耳识别的准确性不高。


发明内容
本发明针对人耳识别中边缘检测以及特征提取的难题,提出一种用万有引力场转换算法识别人耳特征的方法。它对图像源的要求低,在提取人耳特征时,无需精确边缘检测,转换图像有更清晰真实的边缘,人耳的识别更加准确。
本发明的技术方案如下 针对待识别的图像源,通过图像预处理,得到标准的人耳图像。然后根据万有引力场转换算法得到人耳图像的势能阱,多角度利用势能阱的位置信息提取特征,然后对人耳进行识别。
具体方法为采集人耳图像,对所述人耳图像做预处理,是将人耳图像进行旋转、裁剪、比例缩放、灰度归一化和滤波的处理,得到标准的人耳图像; 对得到标准的人耳图像用万有引力场转换,计算出测试人耳图像所受引力合力为零的像素即为所述势能阱,通过势能阱分裂的提取和势能阱特征表示,确定人耳特征向量。
所述万有引力场转换,采用下列计算 式中,F(rj)表示每个像素所受的合力,ri表示施力像素的位置向量,rj表示受力像素的位置向量,P(ri)表示施力像素灰度,P(rj)表示受力像素灰度,j表示图像中任意像素。
利用势能阱的位置信息进行特征提取,采用下式判断两个势能阱是否由分裂形成 i,j=1,2,Λ,n且i≠j 式中,n为势能阱个数,当两个势能阱间的距离d<10时,判定为属于同一势能阱分裂出来的两个势能阱,反之则判定为属于两个不同的势能阱,找出属于同一势能阱分裂出的一组势能阱后,连接同一组中相邻的势能阱,然后用位于中间位置的势能阱代替该分裂组其他势能阱,由此提取分裂的势能阱。
利用势能阱位置结构的差异,确定四个判别变量,用以确定人耳的特征向量 其中,n为势能阱个数,|<di>|表示相邻两个势能阱之间的距离,|wi|表示第i个势能阱与坐标原点的距离。
本发明与其他人耳识别方法相比,具有以下优点 1.本发明用万有引力场转换算法的力场转换图像要比基于高斯力场的转换图像有更清晰真实的边缘,更有利于下一步的识别。
2.采用势能阱的分裂判断与处理方法,提出对噪声污染下的势能阱分裂现象进行判断和处理,使得噪声污染的人耳图像也可用于势能阱提取和进行人耳的识别,从而降低了对图像源的要求。
3.改进了David J.Hurley等采用两个特征分量来描述势能阱的方法,多角度利用势能阱的位置信息进行特征提取,人耳的势能阱特征形成更加明显,人耳的识别更加准确。
本发明对噪声污染下的势能阱分裂现象进行判断和处理,使得噪声污染和分辨率改变的人耳图像也可用于后续识别。在识别阶段,首先依据势能阱的个数进行粗分类,然后多角度利用势能阱的位置信息进行特征提取,从而有效地进行人耳识别。
本发明所述的万有引力场转换算法所提取的势能阱,对于同一人耳具有较强的鲁棒性,对于不同人耳具有可分性,可以用来进行人耳识别。



图1为原始的人耳图像; 图2为标准人耳图像; 图3为力场转换图像,其中图3(a)为高斯力场转换图像,图3(b)为万有引力场转换图像; 图4为势能阱形成过程,其中图4(a)为40个测试像素初步运动形成图像,图4(b)为测试像素受力多步运动形成图像,图4(c)为最终形成的势能阱图像; 图5为势能阱分裂判别结果,其中图5(a)为噪声污染图像初始势能阱图像,图5(b)为噪声污染图像的势能阱形成时的场线图,图5(c)为对污染图像势能阱进行自动判别处理结果图像; 图6为测试点初始无关性证明,其中图6(a)为所选取的40个测试像素均匀分布在外耳边缘上,图6(b)为将40个测试像素的位置改变为图像的边缘,图6(c)为将测试像素的个数改变为20个; 图7为分辨率无关性证明,其中图7(a)是分辨率为153×222时的人耳图像势能阱及其场线形成图,图7(b)为110×160时的人耳图像势能阱及其场线形成图,图7(c)为76×111时的人耳图像势能阱及其场线形成图; 图8为抗干扰性证明,其中图8(a)为无眼镜干扰时提取的势能阱及场线,图8(b)为增加了眼镜的干扰时所提取的势能阱及场线; 图9为抗噪性证明,其中图9(a)为无噪声污染时的势能阱及场线形成结果图,图9(b)为在原图中加入中度噪声污染时的势能阱及场线形成结果图,图9(c)为在原图中加入重度噪声污染时的势能阱及场线形成结果图。

具体实施例方式 实施例1势能阱的形成 1.图像的预处理 本实验采用的人耳图像库由早、中、晚三个时段拍摄的320幅(40人每人8幅)图像构成。为使提取的特征具有统一标准,我们对人耳图像库中的图像进行旋转、裁剪、比例缩放等预处理,把得到的人耳图像定义为标准人耳图像。图1和图2分别显示采集到的原始人耳图像和经过预处理后得到的标准人耳图像。
2.万有引力场转换理论 人耳图像是由一系列像素构成的,力场转换理论把图像的像素看作力场的源头,通过对图像中相互吸引的像素进行力场转换得到图像的力场。图像中,每一个像素对其它像素产生的作用力Fi(rj)由公式(1)给出 其中ri代表施力像素的位置向量,rj代表受力像素的位置向量,P(ri)代表施力像素灰度。
每个像素所受的合力F(rj)等于图像中其它像素施加的力向量之和。如式(2)所示 万有引力场转换算法就是在David J.Hurley等提出的力场转换理论基础上,加入了受力像素自身灰度值的影响,用万有引力场代替高斯力场进行力场转换,如公式(3)所示。其中像素的灰度值P代表像素的质量m,两个像素之间的距离为r,万有引力常数G取为1。
其中,P(rj)代表受力像素灰度。
为了得到整幅图像的万有引力场表示,计算出图像中任意像素(j)所受的引力合力F(rj),如公式(4)。这样,所有像素的引力合力就形成了一个完整的万有引力场。
对图像库中的人耳图像分别进行高斯力场和万有引力场转换,基于万有引力场转换算法的力场转换图像要比基于高斯力场的转换图像有更清晰真实的边缘,有利于下一步的识别,如图3所示。
3.势能阱的形成 像素由于能量的差异而在与力场相对应的能量场上产生运动,直至运动到没有能量差异的点。假设围绕目标耳朵设置一系列封闭可移动的测试像素,如果两像素点间存在能量差,相互之间就会有作用力,并且像素会在此力的作用下运动,直至到达其势能阱。为确保测试像素的位置对于所有标准的人耳图像都能够围绕待识别人耳,我们把测试像素的位置平均分布于图像的四边,数目取为40个,即每边各取10个测试像素。
确定测试像素之后,通过万有引力场转换公式(4)计算出测试像素所受引力合力的大小和方向。每个测试像素受力产生运动,最终汇集到所受引力合力为零的像素,即我们用以描述人耳特征的势能阱。图4显示了40个测试像素均匀分布在耳朵的四周,这些像素点由于受力产生运动,从而形成一系列场线并最终形成势能阱。
4.势能阱分裂问题的解决 虽然人耳图像万有引力场转换之前做了去噪、灰度归一化等预处理,但是还不能完全消除噪声或亮度等因素的影响,提取出的势能阱有时会出现分裂的情况。由势能阱提取实验可知,对于尺度归一化110×160像素大小的图像,势能阱出现分裂的时候通常分裂数目较小,而且这些分裂出来的势能阱相距很近,离d一般不超过10像素。根据这个规律,我们通过式(5)来判断两个势能阱是否由分裂形成。
i,j=1,2,∧,n且i≠j(5) 其中n为势能阱个数。当两个势能阱间的距离d<10时,判定为属于同一势能阱分裂出来的两个势能阱,反之则判定为属于两个不同的势能阱。
分别找出属于同一势能阱分裂出的一组势能阱后,我们定义一种自动补偿的方法进行处理。首先连接同一组中相邻的势能阱,然后用位于中间位置的势能阱代替该分裂组其他势能阱,这样就完成了分裂情况下势能阱的提取工作。图5显示了对由分裂形成的势能阱采用自动补偿方法判别及处理前后的结果. 5.势能阱特征表示 为了描述人耳特征的差异,David J.Hurley等定义了两个分量anwd和wdir。
其中,|wi|表示第i个势能阱与坐标原点的距离,w表示势能阱的个数。
利用该分量对部分图像进行了特征提取,但在其后的研究中都未用该特征分量进行人耳识别。在实际的识别中,当样本数量较大时,特征向量过少且类间距离较小会为分类器的设计带来很大困难。为了能够提取出适合大量样本的分类特征,我们充分利用势能阱位置结构的差异,定义了四个判别变量λ、ω、μ、δ 其中,n为势能阱个数,|<di>|表示相邻两个势能阱之间的距离,利用四个判别变量确定人耳特征向量,对人耳进行识别。
实施例2人耳特征的稳定性测定 由于在相同条件下,利用万有引力场转换算法提取的势能阱对于不同的耳朵其特征描述是不同的。为测试势能阱的稳定性,我们对不同条件下的人耳图像进行了实验,以确定人耳特征提取的稳定性。
1.测试点初始无关性证明。
如图6所示,针对同一幅人耳图像,图6(a)所选取的40个测试像素均匀分布在外耳边缘上,图6(b)则将40个测试像素的位置改变为图像的边缘,而图6(c)则将测试像素的个数改变为20个。但各种条件下所提取的势能阱个数及其对应的特征值λ、ω、μ、δ却相差很小。实验证明,当改变测试点的初始位置和个数时,所提取的势能阱个数以及位置依然不变。由此可知,人耳势能阱的提取与测试点的初始设置具有无关性。
2.分辨率不敏感性证明。
如图7所示,针对同一幅人耳图像,图7(a)为当分辨率是153×222像素时所提取的势能阱、场线以及其最终的特征量表示,图7(b)为当分辨率是110×160像素时所提取的势能阱、场线以及其最终的特征量表示,图7(c)为当分辨率是76×111像素时所提取的势能阱、场线以及其最终的特征量表示。结果显示在此三种不同的分辨率下同一幅人耳图像所提取的势能阱个数是相同的,并且不同分辨率下的势能阱特征值相差很小。由此可知,无论是提高或者降低同一人耳图像的分辨率,采用本发明所述算法提取的势能阱都保持相对一致。
3.抗干扰性证明。
如图8所示,针对同一幅人耳图像,图8(a)为无眼镜干扰时提取的势能阱及场线,图8(b)为增加了眼镜的干扰时,所提取的势能阱及场线。结果表明该算法提取的势能阱个数以及位置依然不变,对于由眼镜等引起的干扰不敏感,特征稳定。
4.抗噪性证明。
如图9所示,针对同一幅人耳图像,图9(a)为无噪声污染时提取的势能阱以及测试像素在受力运动过程中形成的场线,图9(b)为在原图上加入中度噪声时最终形成的势能阱以及测试像素在受力运动过程中形成的场线,图9(c)则为在原图中加入严重的白噪声污染时最终形成的势能阱以及测试像素受力运动过程形成的场线。虽然在加入了严重的噪声污染时提取的势能阱产生分裂,但根据前述的势能阱分裂自动补偿算法可以进行处理。实验结果表明,该算法具有良好的抗噪声性能。
综上可知,万有引力场转换算法所提取的势能阱对于同一人耳具有较强的鲁棒性,对于不同人耳具有可分性,可以用来进行人耳识别。
实施例3人耳识别 进行识别时,从人耳图像数据库里40个人中每人选取3幅(共120幅)组成训练样本集,5幅(共200幅)组成测试样本集。首先对选取出来的样本进行万有引力场转换算法提取其势能阱,然后在不分类和依据势能阱个数对样本进行粗分类两种情况下,分别利用硬C-均值分类器、模糊C-均值分类器和改进模糊C-均值分类器进行实验,统计和比对结果如下 当不依据势能阱个数进行粗分类时,分别采用硬C-均值、模糊C-均值、改进模糊C-均值得到的识别率为89%、91%、93%。而相应的误判率为11%、9%、7%。
当依据势能阱个数进行粗分类时,分别采用硬C-均值、模糊C-均值、改进模糊C-均值得到的识别率为91.5%、93%、94.5%。而相应的误判率为8.5%、7%、5.5%。
虽然本发明已以较佳实施例披露如上,然其并非用以限定本发明,任何所属技术领域的技术人员,在不脱离本发明之精神和范围内,当可作些许之更动与改进,因此本发明之保护范围当视权利要求所界定者为准。
权利要求
1.一种用万有引力场转换算法识别人耳特征的方法,其特征在于所述方法有以下步骤
(1)采集人耳图像,对所述人耳图像做预处理,得到标准的人耳图像;
(2)对得到的标准人耳图像用万有引力场转换算法提取其势能阱;
(3)利用势能阱的位置信息进行特征提取,确定人耳特征向量并进行识别。
2.根据权利要求1所述的用万有引力场转换算法识别人耳特征的方法,其特征在于所述对人耳图像做预处理,是将人耳图像进行旋转、裁剪、比例缩放等预处理。
3.根据权利要求1所述的用万有引力场转换算法识别人耳特征的方法,其特征在于用万有引力场转换,计算出人耳图像中像素所受引力合力为零的像素即为所述势能阱,通过势能阱分裂的提取和势能阱特征表示,确定人耳特征向量。
4.根据权利要求1或3所述的用万有引力场转换算法识别人耳特征的方法,其特征在于所述万有引力场转换,采用下式计算
式中,F(rj)表示每个像素所受的合力,ri表示施力像素的位置向量,rj表示受力像素的位置向量,P(ri)表示施力像素灰度,P(rj)表示受力像素灰度,j表示图像中任意像素。
5.根据权利要求1或3所述的用万有引力场转换算法识别人耳特征的方法,其特征在于所述势能阱分裂的提取,采用下式判断两个势能阱是否由分裂形成
i,j=1,2,∧,n且i≠j
式中,n为势能阱个数,当两个势能阱间的距离d<10时,判定为属于同一势能阱分裂出来的两个势能阱,反之则判定为属于两个不同的势能阱,找出属于同一势能阱分裂出的一组势能阱后,连接同一组中相邻的势能阱,然后用位于中间位置的势能阱代替该分裂组其他势能阱,由此提取分裂的势能阱。
6.根据权利要求1或3所述的用万有引力场转换算法识别人耳特征的方法,其特征在于所述势能阱特征表示为利用势能阱位置结构的差异,确定四个判别变量,用以确定人耳的特征向量λ、ω、μ、δ
其中,n为势能阱个数,|<di>|表示相邻两个势能阱之间的距离,|wi|表示第i个势能阱与坐标原点的距离。
全文摘要
本发明涉及一种用万有引力场转换算法识别人耳特征的方法,其特征在于所述方法有以下步骤采集人耳图像,对所述人耳图像做预处理,得到标准的人耳图像;对得到的标准人耳图像用万有引力场转换算法提取其势能阱;利用势能阱的位置信息进行特征提取,确定人耳特征向量并进行识别。本发明对图像源的要求低,在提取人耳特征时,无需精确边缘检测,转换图像有更清晰真实的边缘,人耳的识别更加准确。
文档编号A61B5/117GK101214150SQ20071009322
公开日2008年7月9日 申请日期2007年12月27日 优先权日2007年12月27日
发明者刘嘉敏, 李丽娜, 建 郭, 莫兴俊, 谢海军 申请人:重庆大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1