检测图像中对称图形的方法和装置的制作方法

文档序号:6449259阅读:531来源:国知局
专利名称:检测图像中对称图形的方法和装置的制作方法
技术领域
本发明涉及检测图像中对称图形的方法和装置,尤其涉及检测图像中人脸的方法和装置。
背景技术
众所周知,许多技术可用于检测图像中感兴趣的区域,如人脸或者其他感兴趣的要识别的目标。人脸检测是一个令人特别感兴趣的领域,因为人脸识别不仅对于图像处理,而且对于身份鉴别和安全,以及人机界面都有重要性。人机界面不仅识别人脸的位置,如果人脸存在的话,其还能识别特定的人脸,并可以理解面部表情和姿势。
近来,报道了许多关于自动人脸检测的研究。参考资料例如包括1996年5th IEEE International Workshop on Robot and HumanCommunication,第341到第346页中的“Face Detection and RotationsEstimation using Color Information”和1999年6月IEEE Transactionon Pattern Analysis and Machine Intelligence卷21第6号中的“FaceDetection from Color Images Using a Fuzzy Pattern MatchingMethod”。
日本专利申请第H10-162118号公开了一种检测图像中人脸的方法。按照该方法,根据由其他装置对预定区域左边部分和右边部分所作的比较,查找到最对称的轴所在的位置,然后将该区域与模板相比较。
日本专利申请第H10-293840号公开了一种检测图像中人脸的方法。按照该方法,通过肤色确定候选区域。针对该区域,计算出最近似的椭圆;通过比较左边部分和右边部分计算出最对称的y轴;通过比较上面部分和下面部分计算出x轴。
欧洲专利申请第EP0984386号公开了一种检测图像中人脸的方法。该方法利用了人脸的多个对称的特点,却引起候选人脸信息的丢失。
所有检测人脸的常规方法都有其自身的优点和缺点,这取决于处理图像时所用的不同算法,而实际上每张人脸都是一个对称图形。某些方法虽然准确但却复杂而耗时。

发明内容
本发明的目的在于提供一种用于检测图像中对称图形的方法和装置,根据该方法也可以检测人脸。
为实现上面的目的,本发明提供了一种检测图像中对称图形的方法,其特征在于包括如下步骤识别上述图像中的一个候选对称图形;根据上述候选对称图形形成多维测试向量,其中,上述测试向量的每一维代表上述候选对称图形中相应部分的特征;如果上述测试向量不满足预定标准,则将上述测试向量翻转;将上述测试向量与预定图形模型相比较,其中,上述预定图形模型是通过利用多个图像和上述预定标准预先得到的;以及根据上述比较步骤的结果,将上述候选对称图形分类为真对称图形或者假对称图形。
本发明还提供了一种检测图像中对称图形的装置,其特征在于包括候选对称图形识别器,用于识别上述图像中的一个候选对称图形;向量形成器,用于根据由上述候选对称图形识别器已识别出的上述候选对称图形形成多维测试向量,其中,上述测试向量的每一维代表上述候选对称图形相应部分的特征;用于在上述测试向量不满足预定标准时将上述测试向量翻转的装置;
比较器,用于将上述测试向量与预定图形模型相比较,其中,上述预定图形模型是通过利用多个图像和上述预定标准预先得到的;以及分类器,用于根据上述比较器的输出,将上述候选对称图形分类为真对称图形或者假对称图形。
本发明还提供了一种检测图像中人脸的方法,其特征在于,包括如下步骤根据上述图像,形成一条多维信息;判断上述多维信息是否满足预定标准;只有当上述判断步骤的结果为否时,才将上述多维信息翻转;以及将上述多维信息与用于检测人脸的预定模型相比较。
本发明还提供了一种获得用于检测图像中人脸的模型的方法,其特征在于,包括如下步骤根据图像,形成一条多维信息;判断上述多维信息是否满足预定标准;只有当上述判断步骤的结果为否时,才将上述多维信息翻转;对多个图像重复上述形成多维信息步骤、判断步骤和翻转步骤,得到多条多维信息;以及根据上述多条多维信息,获得检测人脸的上述模型。
不管对称图形(例如人脸)被哪个方向的光照亮,根据本发明的方法或者装置,总是能将对称图形精确地检测出来。
结合附图,本发明的其他特点和优点可从下面通过举例来对本发明的原理进行解释的优选实施方式的说明中变得更清楚。


图1是按照本发明检测图像中对称图形的方法的流程图;图2示出获得图1中使用的预定图形模型的流程图;图3示出图1中形成测试向量步骤的例子的图;
图4是按照本发明用于检测图像中对称图形的装置的示意性框图;图5示出图4中向量形成器内部结构的一个例子;图6示意性示出一种图像处理系统,图1到图3中所示的各种方法可在该系统中实现;图7示出用于推导图形模型的一系列图像;图8示出根据图7所示的图像形成的训练向量;以及图9示出待检测图像,以及根据待检测图像形成的测试向量。
具体实施例方式
下面将对本发明进行详细说明。在下面的说明中,关于如何识别图像中的一个候选对称图形(实质上为人脸),可参考中国专利申请第00127067.2号,其由同一申请人于2000年9月15日提出申请,并于2002年4月10日公开,并且可参考中国专利申请第01132807.X号,其由同一申请人于2001年9月6日提出申请。这些申请在此作为参考。但是,中国专利申请第00127067.2号和第01132807.X号中公开的识别候选对称图形的方法并不构成对本发明的限制。任何识别图像中候选对称图形的常规方法都可以在本发明中使用。
图1是按照本发明检测图像中对称图形的方法的流程图。该流程开始于步骤101。然后,在步骤102,识别图像中一个候选对称图形。在本技术领域中已知,可以使用不同的方法识别图像中的对称图形,例如人脸。
在步骤103,根据步骤102中识别的候选对称图形形成多维测试向量。该测试向量的每一维代表该候选对称图形中相应部分的特征。这里,图像的一部分的特征表示该图像的该部分内的平均灰度级,或者该图像的该部分内的平均边缘强度,或者对于该图像的该部分计算出的其他特征值。
在步骤104,判断步骤103中形成的多维测试向量是否满足预定标准。
预定标准可以要求候选对称图形左边部分的平均特征强于候选对称图形右边部分的平均特征。预定标准也可以要求候选对称图形左边部分的平均特征弱于候选对称图形右边部分的平均特征。
如果步骤104的结果为“否”,则流程进入步骤105;否则进入步骤106。
在步骤105,将步骤103中形成的多维测试向量翻转,即如果多维测试向量不满足预定标准,则将该测试向量翻转。
“向量(又被称为“原始向量”)翻转”意味着调整原始向量的各维,好像经调整的向量是根据原始图像的镜像形成,而原始向量根据该原始图像形成。“向量翻转”的效果与将原始图像沿着其中垂线翻转并根据翻转的图像形成向量的效果相同。也就是,将图像原来的左边作为右边,并且将图像原来的右边作为左边。
在此对“向量翻转”的优点进行简要的讨论。对于图像中对称的图形,例如人脸,根据该图像中该对称图形形成的向量(训练向量或者测试向量)也应该是对称的。但实际上,有几个条件可能对图像产生影响。例如,不同的人具有不同的脸。从左边或者从右边来的光通常是不相等的。于是,对称图形的左边部分可能比其右边部分亮,或者对称图形的右边部分可能比其左边部分亮。可以合理地假定这两种情况的概率相等。
出于上面一段所述的原因,对于多个训练向量或者测试向量,某些向量的左边部分比相应的右边部分亮,而其他向量的右边部分比相应的左边部分亮。
在本发明中,利用“翻转”步骤(图1中步骤105或者图2中步骤206),使得所有向量的左边部分比右边部分亮,或者所有向量的右边部分比左边部分亮,正如预定标准所要求的。
由于使用了“翻转”步骤,当某些条件(如照明)影响图像的特征值(例如,灰度级,边缘强度)的情况下,可以消除对向量的影响,并且可以提高检测对称图形(例如人脸)的精确性。
假设在步骤104,预定标准要求候选对称图形左边部分的平均特征强于候选对称图形右边部分的平均特征。因此,如果候选对称图形左边部分的平均特征弱于候选对称图形右边部分的平均特征,则在步骤105将测试向量翻转。否则,测试向量不翻转。
假设在步骤104,预定标准要求候选对称图形左边部分的平均特征弱于候选对称图形右边部分的平均特征。因此,如果候选对称图形左边部分的平均特征强于候选对称图形右边部分的平均特征,则在步骤105将测试向量翻转。否则,测试向量不翻转。
步骤105之后,流程进入步骤106。
在步骤106,将测试向量与预定图形模型相比较。预定图形模型是通过利用多个图像和预定标准预先得到的。即,预定图形模型是根据多个图像和预定标准进行训练的结果。后面将参照图2对得到预定图形模型的过程进行说明。
在步骤107,判断测试向量是否与预定图形模型相匹配。如果步骤107判断的结果为“是”,则流程进入步骤108;否则进入步骤109。
在步骤108,候选对称图形被分类为真对称图形。
在步骤109,候选对称图形被分类为假对称图形。
流程结束于步骤110。
图2示出获得图1中使用的预定图形模型的流程。该流程开始于步骤201。在步骤202,选择多个图像。已知在这些图像中,哪些代表对称图形,哪些不代表对称图形。
在后面的步骤203到207中,根据步骤202中选择的多个图像形成多个多维训练向量,并且将不满足预定标准的训练向量翻转。
例如,在步骤203,从步骤202中选出的多个图像中选取一个图像,而根据该选取图像的多维训练向量还未形成。
在步骤204,根据该选取的图像形成多维训练向量。该训练向量的每一维代表该训练向量据以形成的图像中相应部分的特征。形成训练向量的流程与参考图1或者3所说明的形成测试向量的流程相似。图像中某一部分的特征表示该图像中这一部分的平均灰度级或者该图像中这一部分的平均边缘强度,或者针对该图像中这一部分计算出的其他特征值。
在步骤205,判断步骤204中形成的多维训练向量是否满足预定标准。该预定标准与图1中步骤104使用的预定标准相同。
如果步骤205的结果为“否”,则流程进入步骤206;否则进入步骤207。
在步骤206,将步骤204中形成的多维训练向量翻转。即,如果该训练向量不满足预定标准,则将其翻转。
假定步骤205中的预定标准要求图像左边部分的平均特征强于图像右边部分的平均特征。因此,如果图像左边部分的平均特征弱于图像右边部分的平均特征,则在步骤206将训练向量翻转。否则,训练向量不翻转。
假定步骤205中的预定标准要求图像左边部分的平均特征弱于图像右边部分的平均特征。因此,如果图像左边部分的平均特征强于图像右边部分的平均特征,则在步骤206将训练向量翻转。否则,训练向量不翻转。
步骤206之后,流程进入步骤207。
在步骤207,判断是否存在训练向量尚未形成的图像。如果步骤207的结果为“是”,则流程进入步骤203。否则,流程进入步骤208。
步骤203到207的顺序并不重要,重要的是,根据步骤202中选择的图像中的一个图像,形成多维训练向量,并且,如果该向量不满足预定标准,则将该多维训练向量翻转。
步骤203到207之后,针对步骤202中选出的多个图像,得到多个多维训练向量。
在步骤208,从多个多维训练向量推导出图形模型。一旦推导出图形模型,其将被用作图1中所示检测对称图形的预定图形模型。
在步骤209,流程结束。
图3示出图1中形成测试向量步骤(即步骤103)的例子。图1中的步骤103可以包括步骤301到303。在步骤301,将候选对称图形的灰度级图均衡化,得到均衡化的灰度级图。参见Prentice Hall公司Kenneth R.Castleman的“数字图像处理”,1996年版,第六章“均衡化”。在步骤302,对均衡化的灰度级图中的多个部分进行采样,得到该多个部分的多个特征值。在步骤303,利用该多个特征值组合成测试向量。相应地,每个训练向量均可由相同的方法形成。
如果步骤302中的特征值是图像的一部分中的平均灰度级,则在形成多维测试向量的步骤或者形成多维训练向量的步骤中,可以使用线性判别方法。预定图形模型包括多维加权向量和第一阈值。并且在比较步骤(图1的步骤106)中,将第一阈值与测试向量和加权向量的内积相比较。
线性判别方法可以是Fisher算法(R.A.Fisher,“The Use of MultipleMeasures in Taxonomic Problems”,Ann.Eugenics,第7卷第179至188页,1936年)。如果使用该方法,若测试向量和加权向量的内积大于第一阈值,则分类步骤(图1中步骤108)将候选对称图形分类为真对称图形。
线性判别方法可以是SVM算法(C.Cortes和V.Vapnik,SupportVector Networks,Machine Learning 20273-297,1995年)。如果使用该方法,若测试向量和加权向量的内积大于第一阈值,则分类步骤(图1中步骤108)将候选对称图形分类为真对称图形。
线性判别方法可以是Fisher算法和SVM算法之外的其他为本技术领域熟知的算法。
或者,在形成多维测试向量步骤或者形成多维训练向量步骤中,可以使用基于主元分析(PCA)法(Principal Component Analysis-basedmethod)。如果使用该方法,预定图形模型包括至少两个PCA向量和第二阈值。比较步骤(图1中的步骤106)将第二阈值与测试向量和PCA向量间的PCA距离相比较。如果PCA距离小于第二阈值,则分类步骤(图1中步骤108)将候选对称图形分类为真对称图形。
由于形成多维测试向量的流程应该与形成多维训练向量的流程相同,因此图3中的步骤301到303也适用于形成多维训练向量。
在本发明中,对称图形例如可为人脸。
在待检测的对称图形为人脸的情况下,图1所示方法可简化为一种检测图像中人脸的方法,并且图2所示方法可简化为一种得到用于检测图像中人脸的模型的方法。
检测图像中人脸的方法包括如下步骤首先,根据将在其中检测人脸的图像形成一条多维信息。这里,该条多维信息可以是结合图1所述的多维测试向量;下一步,判断该条多维信息是否满足预定标准(例如,图1步骤104中的预定标准);如果上述判断步骤的结果为否,则将该条多维信息翻转;以及然后,将该条多维信息与用于检测人脸的预定模型(例如,图1步骤107中所述的模型)相比较。
获得用于检测图像中人脸的模型的方法包括如下步骤首先,根据图像形成一条多维信息;下一步,判断该条多维信息是否满足预定标准;然后,如果判断步骤的结果为否,则将该条多维信息翻转;对多个图像中的每个图像重复上述形成、判断和翻转的三个步骤,以便根据多个图像形成多条多维信息;以及最后,根据该多条多维信息,获得用于检测人脸的模型。
图4是按照本发明用于检测图像中对称图形的装置的示意性框图。401表示候选对称图形识别器,402表示向量形成器,403表示向量翻转装置,404表示预定标准,405表示预定图形模型,406表示比较器,以及407表示分类器。
候选对称图形识别器401用于识别图像中的一个候选对称图形。在候选对称图形识别器401中,可以使用任何识别图像中候选对称图形的常规方法。
向量形成器402用于根据候选对称图形识别器401识别出的候选对称图形形成多维测试向量。该测试向量的每一维代表该候选对称图形中相应部分的特征。
向量翻转装置403用于当测试向量不满足预定标准404时,将测试向量翻转。
术语“翻转”和“预定标准”已参照图1进行了详细说明。
即,预定标准404可以要求候选对称图形左边部分的平均特征(例如,平均灰度级)强于候选对称图形右边部分的平均特征。
预定标准404也可以要求候选对称图形左边部分的平均特征(例如,平均灰度级)弱于候选对称图形右边部分的平均特征。
如下面所述,预定标准404也用在推导预定图形模型405的流程中。
比较器406用于将测试向量与预定图形模型405进行比较。
通过利用多个图像和预定标准404预先得到预定图形模型405。
预定图形模型405和得到预定图形模型的流程已参照图1和图2进行了详细说明。
分类器407用于根据比较器406的输出将候选对称图形分类为真对称图形或者假对称图形。
即,如果比较器406的输出表明向量翻转装置403输出的测试向量与预定图形模型405相匹配,则分类器407将候选对称图形识别器401识别出的候选对称图形分类为真对称图形。另一方面,如果比较器406的输出表明向量翻转装置403输出的测试向量与预定图形模型405不相匹配,则分类器407将候选对称图形识别器401识别出的候选对称图形分类为假对称图形。
一旦检测出图像中的对称图形,就可以对图像或者检测出的对称图形进行进一步的处理。
图5示出图4中向量形成器402内部结构的一个例子。除了向量形成器402以外,图5中的各部件与图4中的各部件相同。
如图5所示,向量形成器402包括图像均衡器4021,特征值采样器4022和向量组合器4023。
图像均衡器4021用于均衡候选对称图形的灰度级图,得到均衡化的灰度级图。
特征值采样器4022用于对均衡化的灰度级图中的多个部分进行采样,得到多个部分的多个特征值。
向量组合器4023用于利用上述多个特征值组合成上述测试向量,其中该测试向量的每一维代表该候选对称图形中相应部分的特征。
向量形成器402中使用的方法可以是线性判别方法(如Fisher算法,SVM算法)或者基于主元分析法或其他方法。
图6示意性示出一种图像处理系统,图1到图3中所示的各种方法可在该系统中实现。图6中所示的图像处理系统包括CPU(中央处理单元)601,RAM(随机存取存储器)602,ROM(只读存储器)603,系统总线604,HD(硬盘)控制器605,键盘控制器606,串行接口控制器607,并行接口控制器608,显示器控制器609,硬盘610,键盘611,照相机612,打印机613和显示器614。在这些部件中,与系统总线604相连的有CPU 601、RAM 602、ROM 603、HD控制器605、键盘控制器606,串行接口控制器607,并行接口控制器608和显示器控制器609。硬盘610与HD控制器605相连,键盘611与键盘控制器606相连,照相机612与串行接口控制器607相连,打印机613与并行接口控制器608相连,以及显示器614与显示器控制器609相连。
图6中每个部件的功能在本技术领域内都是众所周知的,并且图6所示的结构也是常规的。这种结构不仅用于个人计算机,而且用于手持设备,如Palm PC、PDA(个人数据助理)、数码相机等等。在不同的应用中,图6中所示的某些部件可以被省略。例如,如果整个系统是数码相机,并行接口控制器608和打印机613可以被省略,并且该系统可由单片机实现。如果应用软件存储在EPROM或者其他非易失性存储器中,HD控制器605和硬盘610可以被省略。
图6中所示的整个系统由通常作为软件存储在硬盘610中(或者如上所述,存储在EPROM或者其他非易失性存储器中)的计算机可读指令控制。软件也可从网络(图中未示出)下载。或者存储在硬盘610中,或者从网络下载的软件可被加载到RAM 602中,并由CPU 601执行,以便完成由软件确定的功能。
在图1到图3所示的一个或者更多的流程图的基础上,对于一个本技术领域内熟练的技术人员无需创造性的工作即可开发出一个或者更多的软件。这样开发出的软件将执行图1所示的检测图像中对称图形的方法,图2所示的得到预定图形模型的流程,以及图3所示的方法。
在某种意义上,图6所示的图像处理系统,如果得到根据图1到图5所示流程图而开发出的软件的支持,可以实现与图4和图5所示图像处理装置相同的功能。
图7示出用于图2中推导图形模型的一系列图像。在图7中,预先知道哪些图像代表真对称图形,哪些图像不代表真对称图形。图7中所示的各图像仅作为例子。如图7所示,有1000个图像,A1,A2,...,A1000。该数目1000不构成对下述推导图形模型流程的限制。图像A1,A5,A7代表真对称图形,图像A2,A3,A4,A6不代表对称图形。
首先,将图像A1,A2,...,A1000的灰度级图均衡化。
然后,将经均衡化的灰度级图中的每一个图压缩为小图像。小图像的大小例如为6乘7个像素。即,该小图像包括42个像素。选取42个像素中每个像素的灰度级,形成42维灰度级向量。
图8示出根据图7所示图像形成的训练向量。图像A7代表对称图形。将图像A7压缩为小图像A7-1。小图像A7-1包括42个像素,被排列为6行7列。该42维灰度级向量为(118,127,153,160,179,213,...,73,72,63,149,201,205)。
将图像A7压缩为小图像A7-1并形成多维灰度级向量的效果与对图像A7进行采样并利用经采样的特征值组合成多维灰度级向量的效果相同。
假定预定标准要求小图像左边部分的平均灰度级大于小图像右边部分的平均灰度级。因此,如果小图像不满足该预定标准,则将相应的42维训练向量翻转。
如图8所示,A7-1是小图像,而A7-2是将小图像A7-1翻转后的结果。
小图像A7-1对应于训练向量(118,127,153,160,179,213,...,73,72,63,149,201,205),而小图像A7-2对应于向量翻转的结果(213,179,160,153,127,128,...,205,201,149,63,72,73)。
根据图7所示的1000个图像,形成1000个多维训练向量。其中可能将这1000个向量中的某些向量进行了翻转。最终,所有的1000个训练向量都满足预定标准。
最后,根据这1000个训练向量,推导出图形模型。该推导出的图形模型可作为检测对称图形的方法或者装置中使用的预定图形模型。参见图1中步骤106和107以及图4或者图5中的预定图形模型405。
如果使用Fisher算法形成这些42维训练向量,则该图形模型包括一个42维向量(-0.040215,0.038981,0.004779,-0.008135,0.029676,-0.061686,-0.014365,-0.026122,0.023329,0.049953,-0.035115,-0.014710,0.051523,-0.041612,0.020749,-0.010770,0.018293,-0.006546,0.014391,-0.072563,0.050983,-0.027415,-0.002443,-0.008548,0.030198,-0.017414,0.047583,-0.015559,-0.013473,0.029273,0.027290,-0.003407,0.000035,-0.007655,0.013484,0.024707,0.012625,0.010460,-0.019425,-0.035703,-0.012970,-0.002442)及一个等于0.6的阈值。
对于任意一个42维测试向量,如果测试向量与图形模型所包含的向量的内积大于阈值0.6,则该测试向量与该图形模型相匹配(图1中步骤107)。
如果使用SVM算法形成这些42维训练向量,则该图形模型包括一个42维向量(0.003379,0.007032,0.001266,0.003015,0.002903,-0.008147,-0.002592,-0.005749,0.007717,0.008002,-0.003061,-0.004259,0.010666,-0.006589,0.001532,-0.001167,0.005033,0.005072,0.000348,-0.014649,0.009771,0.000249,-0.003556,-0.003292,0.011239,0.000433,0.008436,-0.003258,0.000251,0.007973,0.002512,-0.003638,0.005653,0.002737,0.000383,0.002218,0.009049,-0.000907,-0.003503,-0.005538,-0.000452,0.005822)及一个等于8的阈值。
对于任意一个42维测试向量,如果测试向量与图形模型所包含的向量的内积大于阈值8,则该测试向量与图形模型相匹配(图1中步骤107)。
如果使用基于主元分析法形成这些42维训练向量,则该图形模型例如包括五个42维向量(有时被称为PCA向量)及一个阈值。
平均向量为(140.35,155.978,149.842,134.415,102.273,66.5027,129.038,128.721,156.951,150.186,95.7322,66.5628,145.251,106.705,140.383,124.738,102.246,88.3005,140.721,108.913,155.798,122.792,100.661,91.9563,209.82,192.426,186.24,138.967,146.421,158.891,203.705,164.47,151.678,127.393,122.432,151.792,184.033,164.639,126.514,95.7978,101.891,125.842)。
四个特征向量为(0.333933,0.258449,0.176123,0.151869,0.161734,0.118452,0.266051,0.10049,0.0143378,-0.00944111,0.022348,0.0828405,0.0190867,-0.157675,-0.170736,-0.217301,-0.166319,-0.0648021,-0.0331033,-0.153777,-0.0671618,-0.146345,-0.206263,-0.0966661,-0.0640368,-0.0955347,0.0546851,-0.0477159,-0.156063,-0.139501,-0.103838,-0.231298,-0.047752,-0.176715,-0.237904,-0.169381,-0.104431,-0.174352,-0.134577,-0.212789,-0.184677,-0.136662);(-0.00181931,0.227537,0.364282,0.333633,0.226025,0.0895567,0.0623759,0.268144,0.321805,0.282518,0.237459,0.137843,0.0227484,0.161285,0.148757,0.135504,0.158207,0.0454127,-0.00350835,0.159817,0.0999776,0.0853184,0.172948,0.0479508,0.0688646,0.143191,-0.045281,0.0096293,0.217711,0.122602,-0.00327809,0.0629239,-0.106721,-0.0966255,0.117333,0.0141328,-0.0590484,0.0114281,-0.0213253,-0.0121763,0.0700363,-0.0615728);(0.155974,0.0986145,0.0475103,-0.00423329,-0.126048,-0.166855,0.0992729,0.0893167,0.0505397,0.0788505,-0.031664,-0.160958,0.148496,0.075114,0.170466,0.0760634,0.0509022,-0.150787,0.105201,0.0783455,0.179952,0.0464025,0.0162198,-0.188391,0.0444115,0.0745042,0.140993,-0.00879304,-0.242854,-0.325209,0.105797,0.189946,0.106341,0.0707378,-0.11519,-0.296815,0.152539,0.271023,0.328581,0.161654,-0.110414,-0.301476);以及(-0.0081864,-0.00346344,0.0124905,0.0512229,-0.0500731,-0.0548758,-0.16184,0.0297463,0.207007,0.168652,-0.0631442,-0.0955881,-0.121542,-0.0401602,0.204367,0.0356136,0.0324031,-0.0922179,-0.134031,-0.0967257,-0.202621,-0.366802,-0.062456,-0.0909554,-0.0330462,-0.0653756,-0.35007,-0.5125,-0.148757,-0.0408957,0.152896,0.0408614,-0.111965,-0.163865,-0.00714144,0.105089,0.278002,0.0815478,-0.044651,0.012332,-0.0470648,0.133649)。
阈值等于81500。
对于任意一个42维测试向量,如果测试向量与PCA向量间的PCA距离小于阈值81500,则该测试向量与图形模型相匹配(图1中步骤107)。
图9示出待检测图像,以及根据待检测图像形成的测试向量。T1为待检测图像。T2为根据图像T1形成的42维测试向量。例如,测试向量T2为(140,72,91,73,40,95,...,125,94,39,55,106,98)。
图9中使用的预定标准与图8中使用的预定标准相同。即,该预定标准也要求小图像左边部分的平均灰度级大于小图像右边部分的平均灰度级。
由于测试向量T2不满足该预定标准,所以将测试向量T2翻转,得到的T3为(95,40,73,91,72,140...,98,106,55,39,94,125)。
下一步,将测试向量T3与预定图形模型相比较。
以Fisher算法为例。测试向量T3与预定图形模型所包含的向量的内积为0.9,其大于阈值0.6。因此,图像T1被分类为真对称图形。
以SVM算法为例。测试向量T3与预定图形模型所包含的向量的内积为8.3,其大于阈值8。因此,图像T1被分类为真对称图形。
以PCA算法为例。测试向量T3与PCA向量之间的PCA距离为74826,其小于阈值81500。因此,图像T1被分类为真对称图形。
虽然前面参照了本发明的特定实施方式,对于本技术领域内的熟练技术人员而言,应当理解,这些仅是举例进行说明,不脱离本发明的原理,可以对这些实施方式作出许多改变,本发明的范围由所附权利要求限定。
权利要求
1.一种检测图像中对称图形的方法,其特征在于,包括如下步骤识别上述图像中的一个候选对称图形;根据上述候选对称图形,形成多维测试向量,其中,上述测试向量的每一维代表上述候选对称图形相应部分的特征;如果上述测试向量不满足预定标准,则将上述测试向量翻转;将上述测试向量与预定图形模型相比较,其中,上述预定图形模型是通过利用多个图像和上述预定标准预先得到的;以及根据上述比较步骤的结果,将上述候选对称图形分类为真对称图形或者假对称图形。
2.根据权利要求1所述的检测图像中对称图形的方法,其特征在于,上述预定图形模型是通过执行如下步骤得到的选择多个图像,其中某些图像代表对称图形;对于上述多个图像中的每个图像,根据上述每个图像形成一个多维训练向量,上述训练向量的每一维代表上述每个图像相应部分的特征,如果上述训练向量不满足上述预定标准,则将上述训练向量翻转,得到针对上述多个图像的多个多维训练向量;以及从上述多个多维训练向量中推导上述预定图形模型。
3.根据权利要求2所述的检测图像中对称图形的方法,其特征在于上述翻转上述测试向量的步骤中,上述预定标准要求,据以形成上述测试向量的上述候选对称图形的左边部分的平均特征强于上述候选对称图形右边部分的平均特征,并且其特征在于上述翻转上述训练向量的步骤中,上述预定标准要求,据以形成上述训练向量的上述每个图像的左边部分的平均特征强于上述每个图像右边部分的平均特征。
4.根据权利要求2所述的检测图像中对称图形的方法,其特征在于上述翻转上述测试向量的步骤中,上述预定标准要求,据以形成上述测试向量的上述候选对称图形的左边部分的平均特征弱于上述候选对称图形右边部分的平均特征,并且其特征在于上述翻转上述训练向量的步骤中,上述预定标准要求,据以形成上述训练向量的上述每个图像的左边部分的平均特征弱于上述每个图像右边部分的平均特征。
5.根据权利要求2所述的检测图像中对称图形的方法,其特征在于上述形成多维测试向量的步骤中,上述候选对称图形相应部分的上述特征为上述候选对称图形的上述相应部分中的平均灰度级,并且其特征在于上述形成多维训练向量的步骤中,上述每个图像相应部分的上述特征为上述每个图像的上述相应部分中的平均灰度级。
6.根据权利要求2所述的检测图像中对称图形的方法,其特征在于上述形成多维测试向量的步骤中,上述候选对称图形相应部分的上述特征为上述候选对称图形的上述相应部分中的平均边缘强度,并且其特征在于上述形成多维训练向量的步骤中,上述每个图像相应部分的上述特征为上述每个图像的上述相应部分中的平均边缘强度。
7.根据权利要求2所述的检测图像中对称图形的方法,其特征在于,上述形成多维测试向量的步骤包括如下步骤将上述候选对称图形的灰度级图均衡化,得到均衡化的灰度级图;对上述均衡化的灰度级图中的多个部分进行采样,得到对应于上述多个部分的多个特征值;利用上述多个特征值组合成上述测试向量,其中,上述测试向量的每一维代表上述候选对称图形相应部分的特征。
8.根据权利要求7所述的检测图像中对称图形的方法,其特征在于上述形成多维测试向量的步骤中,上述候选对称图形相应部分的上述特征为上述候选对称图形的上述相应部分中的平均灰度级,并且其特征在于上述形成多维训练向量的步骤中,上述每个图像相应部分的上述特征为上述每个图像的上述相应部分中的平均灰度级。
9.根据权利要求8所述的检测图像中对称图形的方法,其特征在于上述形成多维测试向量的步骤中和上述形成多维训练向量的步骤中,使用了线性判别方法;上述预定图形模型包括多维加权向量和第一阈值;以及上述比较步骤包括,将上述第一阈值与上述测试向量和上述加权向量的内积相比较的步骤。
10.根据权利要求9所述的检测图像中对称图形的方法,其特征在于上述线性判别方法为Fisher算法,并且其特征在于上述分类步骤包括,如果上述测试向量和上述加权向量的上述内积大于上述第一阈值,则将上述候选对称图形分类为真对称图形的步骤。
11.根据权利要求9所述的检测图像中对称图形的方法,其特征在于上述线性判别方法为SVM算法,并且其特征在于上述分类步骤包括,如果上述测试向量和上述加权向量的上述内积大于上述第一阈值,则将上述候选对称图形分类为真对称图形的步骤。
12.根据权利要求8所述的检测图像中对称图形的方法,其特征在于上述形成多维测试向量的步骤和上述形成多维训练向量的步骤中,使用了基于主元分析法;上述预定图形模型包括至少两个PCA向量和第二阈值;以及上述比较步骤包括将上述第二阈值与上述测试向量和上述PCA向量之间的PCA距离相比较的步骤;并且其特征在于上述分类步骤包括,如果上述PCA距离小于上述第二阈值,则将上述候选对称图形分类为真对称图形的步骤。
13.根据权利要求1至12中任一项所述的检测图像中对称图形的方法,其特征在于,上述形成多维训练向量的步骤与上述形成多维测试向量的步骤相似。
14.根据权利要求13所述的检测图像中对称图形的方法,其特征在于上述对称图形为人脸。
15.一种检测图像中对称图形的装置,其特征在于,包括候选对称图形识别器,用于识别上述图像中的一个候选对称图形;向量形成器,用于根据由上述候选对称图形识别器已识别出的上述候选对称图形,形成多维测试向量,其中,上述测试向量的每一维代表上述候选对称图形相应部分的特征;用于在上述测试向量不满足预定标准时将上述测试向量翻转的装置;比较器,用于将上述测试向量与预定图形模型相比较,其中,上述预定图形模型是通过利用多个图像和上述预定标准预先得到的;以及分类器,用于根据上述比较器的输出,将上述候选对称图形分类为真对称图形或者假对称图形。
16.根据权利要求15所述的检测图像中对称图形的装置,其特征在于从根据其中某些图像代表对称图形的多个图像而形成的多个多维训练向量中推导出上述预定图形模型;每个训练向量的每一维代表上述每个训练向量据以形成的一个图像相应部分的特征;以及其中,推导出上述预定图形模型之前,将所有不满足上述预定标准的训练向量翻转。
17.根据权利要求16所述的检测图像中对称图形的装置,其特征在于,上述预定标准要求上述训练向量据以形成的上述候选对称图形的左边部分的平均特征强于上述候选对称图形右边部分的平均特征;并且其特征在于训练向量据以形成的图像的左边部分的平均特征强于上述图像右边部分的平均特征。
18.根据权利要求16所述的检测图像中对称图形的装置,其特征在于,上述预定标准要求上述训练向量据以形成的上述候选对称图形的左边部分的平均特征弱于上述候选对称图形右边部分的平均特征;并且其特征在于训练向量据以形成的图像的左边部分的平均特征弱于上述图像右边部分的平均特征。
19.根据权利要求16所述的检测图像中对称图形的装置,其特征在于上述候选对称图形相应部分中的上述特征是上述候选对称图形的上述相应部分中的平均灰度级;并且其特征在于训练向量据以形成的一个图像的相应部分中的上述特征是上述图像的上述相应部分中的平均灰度级。
20.根据权利要求16所述的检测图像中对称图形的装置,其特征在于上述候选对称图形的相应部分中的上述特征是上述候选对称图形的上述相应部分中的平均边缘强度;并且其特征在于训练向量据以形成的一个图像的相应部分中的上述特征是上述图像的上述相应部分中的平均边缘强度。
21.根据权利要求16所述的检测图像中对称图形的装置,其特征在于,上述向量形成器包括图像均衡器,用于对上述候选对称图形的灰度级图均衡化,得到均衡化的灰度级图;特征值采样器,用于对上述均衡化的灰度级图中的多个部分进行采样,得到针对上述多个部分的多个特征值;以及向量组合器,用于利用上述多个特征值组合成上述测试向量,其中,上述测试向量的每一维代表上述候选对称图形相应部分的特征。
22.根据权利要求21所述的检测图像中对称图形的装置,其特征在于上述候选对称图形相应部分的上述特征是上述候选对称图形的上述相应部分中的平均灰度级;并且其特征在于训练向量据以形成的一个图像的相应部分的上述特征是上述图像的上述相应部分中的平均灰度级。
23.根据权利要求22所述的检测图像中对称图形的装置,其特征在于在上述向量形成器中使用一种线性判别方法;上述预定图形模型包括多维加权向量和第一阈值;以及上述比较器将上述第一阈值与上述测试向量和上述加权向量的内积进行比较。
24.根据权利要求23所述的检测图像中对称图形的装置,其特征在于上述线性判别方法为Fisher算法;并且其特征在于如果上述测试向量和上述加权向量的上述内积大于上述第一阈值,则上述分类器将上述候选对称图形分类为真对称图形。
25.根据权利要求23所述的检测图像中对称图形的装置,其特征在于上述线性判别方法为SVM算法;并且其特征在于如果上述测试向量和上述加权向量的上述内积大于上述第一阈值,则上述分类器将上述候选对称图形分类为真对称图形。
26.根据权利要求22所述的检测图像中对称图形的装置,其特征在于上述向量组合器中使用基于主元分析法;上述预定图形模型包括至少两个PCA向量和第二阈值;上述比较器将上述第二阈值与上述测试向量和上述PCA向量之间的PCA距离进行比较;并且其特征在于如果上述PCA距离小于上述第二阈值,则上述分类器将上述候选对称图形分类为真对称图形。
27.根据权利要求15到26中的任一项所述的检测图像中对称图形的装置,其特征在于,多维训练向量是以与形成多维测试向量相同的方式形成的。
28.根据权利要求27所述的检测图像中对称图形的装置,其特征在于,上述对称图形是人脸。
29.一种检测图像中的人脸的方法,其特征在于,包括如下步骤根据上述图像,形成一条多维信息;判断上述多维信息是否满足预定标准;只有当上述判断步骤的结果为否时,将上述多维信息翻转;以及将上述多维信息与用于检测人脸的预定模型相比较。
30.一种获得用于检测图像中的人脸的模型的方法,其特征在于,包括如下步骤根据图像,形成一条多维信息;判断上述多维信息是否满足预定标准;只有当上述判断步骤的结果为否时,将上述多维信息翻转;对多个图像重复上述形成多维信息步骤、判断步骤和翻转步骤,得到多条多维信息;以及根据上述多条多维信息,获得用于检测人脸的上述模型。
全文摘要
一种检测图像中对称图形的方法,其特征在于,包括如下步骤识别上述图像中的一个候选对称图形;根据上述候选对称图形,形成多维测试向量,上述测试向量的每一维代表上述候选对称图形相应部分的特征;如果上述测试向量不满足预定标准,则将上述测试向量翻转;将上述测试向量与预定图形模型相比较,上述预定图形模型是通过利用多个图像和上述预定标准预先得到的;以及根据上述比较步骤的结果,将上述候选对称图形分类为真对称图形或者假对称图形。
文档编号G06T3/00GK1527246SQ03119289
公开日2004年9月8日 申请日期2003年3月7日 优先权日2003年3月7日
发明者陈新武, 尹志远, 纪新, 王立冰 申请人:佳能株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1