图像处理装置的制作方法

文档序号:6430584阅读:115来源:国知局
专利名称:图像处理装置的制作方法
技术领域
本发明涉及一种用于识别例如人的脸等的规定对象的图像处理装置。
背景技术
近年,安全技术以及大量图像信息处理的必要性不断增大,并且开发了用于根据使用视频照相机等摄像的图像数据中所含的脸图像来识别个人的各种技术。作为用于根据脸图像而识别个人的技术,公知的一种方法是,从脸图像中抽出多个特征点,并使用所登记的多个模板来核对这些特征点(如以下文献所述“Face Recognition by Elastic BunchGraph Matching”,written by Laurenz Wiskott,Jean-Marc Fellous,Norbert Krouger and Christoph von der Malsburg,Proc.7th Intern.Conf.on Computer Analysis of Image and Patterns 1997)。公知的另一方法是,把表示脸的图案信息映射到一个为增大个人差异而定义的空间(如以下文献所述“Eigenfaces for Recognition”,written byMatthew A.Turk and Alex P.Pentland,Journal of CognitiveNeuroscience,vol.3,No.1,pp.71-86,1991)。
上述传统的个人识别技术基于以眼、鼻、口等的特征部分的形状和排列,因此,图像数据有必要具有使它们的形状和排列清晰易辨的分辨率。具体地说,一般认为,分辨率有必要是至少100像素×100像素。然而,并不总是能获得具有这种高分辨率的脸图像。
JP-A-H02-311962公开了一种用于通过把脸的三维形状的差异理解为个人差异(而不是根据上述特征部分的形状和排列)来识别个人的技术。然而,为了利用该技术,有必要获得脸的三维信息,因此,该技术并不总是能应用于实际用途。

发明内容
本发明是鉴于上述情况而提出的,本发明的目的是提供能通过使用具有较低分辨率的二维图像来识别对象的图像处理装置。
根据本发明的一个方面,提供一种图像处理装置,包括计算单元;以及存储单元,其中,计算单元将通过拍摄一对象而获得的二维图像数据的多个像素转换为一N维转换值,并且计算多个N维估算特征值,所述多个N维估算特征值是用于以多个N维区域作为基础来表达该N维转换值的多个参数,其中N是大于2的整数;存储单元存储上述多个N维估算特征值和表示该对象并与这些N维估算特征值相关联的信息;并且计算单元利用识别数据库执行识别处理。
根据本发明的另一方面,提供一种图像处理装置,包括计算单元,配置成可访问一识别数据库;以及,输出单元,其中,该识别数据库保存一用于识别各预备对象的预备对象识别信息,和用于各个预备对象的多个N维估算特征值,其中所述多个N维估算特征值是用于以多个N维区域作为基础来表达一N维转换值的多个参数,该N维转换值是该预备对象的二维图像数据的多个像素的转换后的值,并且N是大于2的整数,计算单元将通过拍摄一用于重构的目标对象而获得的二维图像数据的多个像素转换为一N维转换值,并且计算多个N维估算特征值,其中所述多个N维估算特征值是用于以多个N维区域作为基础来表达一N维转换值的多个参数,该N维转换值是该目标对象的二维图像数据的多个像素的转换后的值,计算单元将目标对象的多个N维估算特征值与预备对象的多个N维估算特征值进行比较,并且,输出单元输出比较结果。
可能的是,计算单元根据该目标对象的拍摄状态来修改多个预备对象的多个N维估算特征值。根据修改量可以对比较结果进行控制。还可能的是,N维估算特征值是与作为混合分布的一部分的一种分布有关的值,各所述分布代表各区域。
根据本发明的又一方面,提供一种图像处理方法,包括(a)载入通过拍摄一对象而获得的二维图像数据;(b)转换多个多维变量,各多维变量包括各像素的位置坐标值和一像素值,这些像素被包含在该二维图像数据内;(c)计算针对各像素生成的多个多维变量的似然(likelihood),在把多维变量描述成混合分布时使用该似然;以及(d)使用该似然执行识别处理。
可能的是,混合分布具有多个概率分布作为要素分布(elementaldistribution),每个概率分布具有单一峰值,并且除以下情况以外都进行似然计算,即在峰值位置和像素的位置坐标值之间的距离超过一预定阈值。
并且,可能的是,混合分布具有多个概率分布作为要素分布,每个概率分布具有单一峰值。还可能的是,混合分布是混合高斯分布。
根据本发明的再一方面,提供一种产生识别数据库的方法,包括(a)载入包括多个区域的二维图像数据,该二维图像数据是通过拍摄一对象而获得的;(b)将通过拍摄一对象而获得的二维图像数据的多个像素转换为一N维转换值;(c)计算多个N维估算特征值,所述多个N维估算特征值是用于以多个N维区域作为基础来表达该N维转换值的多个参数,其中N是大于2的整数;以及(d)存储所述多个N维估算特征值和表示该对象的信息,作为识别数据库。
根据本发明的另一方面,提供一种可由计算机执行的图像处理方法,其中,将计算机配置成可访问一识别数据库,该识别数据库保存一用于识别各预备对象的预备对象识别信息,和用于各个预备对象的多个N维估算特征值,其中所述多个N维估算特征值是用于以多个N维区域作为基础来表达该N维转换值的多个参数,该N维转换值是该预备对象的二维图像数据的多个像素的转换后的值,并且N是大于2的整数,该程序使计算机执行包括以下步骤的过程(a)载入通过对一目标对象进行拍摄而获得的二维图像数据;(b)将通过拍摄一对象而获得的二维图像数据的多个像素转换为一N维转换值;(c)计算多个N维估算特征值,其中所述多个N维估算特征值是用于以多个N维区域作为基础来表达该N维转换值的多个参数;(d)将目标对象的多个N维估算特征值与预备对象的多个N维估算特征值进行比较,以识别该目标对象;以及(e)输出比较结果。
根据本发明的又一方面,提供一种可由计算机执行的程序,其中,计算机配置成可访问一识别数据库,该识别数据库保存一用于识别各预备对象的预备对象识别信息,和用于各个预备对象的多个N维估算特征值,其中所述多个N维估算特征值是用于以多个N维区域作为基础来表达该N维转换值的多个参数,该N维转换值是该预备对象的二维图像数据的多个像素的转换后的值,并且N是大于2的整数;该程序使计算机执行包括以下步骤的过程(a)载入一包括一目标对象的二维图像数据,该二维图像数据是通过对一目标对象进行拍摄而获得的;(b)将通过拍摄一对象而获得的二维图像数据的多个像素转换为一N维转换值;(c)计算多个N维估算特征值,所述多个N维估算特征值是用于以多个N维区域作为基础来表达该N维转换值的多个参数;(d)将目标对象的多个N维估算特征值与预备对象的多个N维估算特征值进行比较,以识别该目标对象;以及(e)输出比较结果。
根据本发明的再一方面,提供一种可由计算机执行的程序,该程序使计算机执行包括以下步骤的过程(a)载入通过拍摄一对象而获得的二维图像数据;(b)生成多个多维变量,各多维变量包括各像素的位置坐标值和一像素值,这些像素包含在该二维图像数据内;以及(c)计算针对各像素生成的多个多维变量的似然,在把多维变量描述成混合分布时使用该似然。


本发明的这些和其他目的和优点将通过以下结合附图所作的详细说明而变得更加充分明显,在附图中图1是示出根据本发明的实施例的图像处理装置的构成的方框图;图2A至图2C是示出根据本发明的实施例的图像处理概要的说明图;图3是示出识别数据库的内容示例的说明图;图4是示出识别数据库的生成处理示例的流程图;图5是示出识别处理示例的流程图;以及图6是示出识别处理的实验结果示例的图。
具体实施例方式
将参照附图对本发明的实施例进行说明。如图1所示,根据本发明的实施例的图像处理装置由控制部11、存储器部12、外部接口部13、存储部14和信息显示部15构成。控制部11根据存储在存储器部12内的程序来操作。控制部11执行一识别数据库的生成处理,和通过使用由此生成的识别数据库来识别对象的处理。在以下说明中,为简便起见,假定对象是人的脸,并且将个人识别信息作为识别结果输出。以下将对由控制部11执行的处理内容进行详细说明。
存储器部12存储由控制部11执行的程序。存储器部12还用作工作存储器,用于存储在控制部11的处理操作中所生成的各种数据。外部接口部13从外部装置接收图像数据(包含二维排列的像素的二维图像数据)作为处理目标,并将其输出到控制部11。存储部14存储由控制部11生成的识别数据库。信息显示部15例如是显示装置,用于输出控制部11的识别处理结果。
将对由控制部11执行的处理内容进行具体说明。在本实施例中,将三维估算特征值用作作为识别的基础的信息,这样,在生成识别数据库时以及与记录于识别数据库内的模板进行比较时,也对三维估算特征值进行运算。因此,将首先对三维估算特征值的运算处理内容进行说明。
在本实施例中,根据从外部接口部13输入的一个二维图像数据来运算三维估算特征值。因此,采用以下方式执行运算,即把对象表示成分别与对象配位的多个区域的一组,以确定与各区域对应的三维估算特征值。尽管可使用多个函数来表示这些区域,然而通过使用指定要素分布和参数的组合来进行描述,可容易地执行该运算。具体地说,控制部11针对构成对象的各像素,生成具有一像素的位置和与该像素的像素值有关的一值的组合的三维变量,并且计算规定混合分布的多个参数(规定混合分布的这些参数在将针对各像素生成的一组三维变量描述成具有规定数量的参数的规定混合分布时使似然达到最大),作为三维估算特征值。作为在图像数据中查找对象位置的技术,可使用JP-A-2003-281541所公开的技术。
控制部11针对一对象(脸)的一矩形区域(脸图像数据),通过使用该矩形区域内的一个像素的位置坐标值(a,b)和该像素的亮度值I(a,b)来生成一三维变量x(a,b,I(a,b))。可以将该位置坐标值定义成矩形区域的左下部,为(0,0)。
通过使用以m个要素分布的混合分布作为基础来描述针对各像素而由此生成的三维变量的概率由以下公式(1)和(2)来表示。
p(x;θ)=Σj=1mξjp(x;θj)---(1)]]>p(x;θj)=1(2π)d/2exp[-12(x-μj)TΣj-1(x-μj)]---(2)]]>式中,ξj表示第j个要素分布的混合参数,θj表示第j个要素分布的参数。要素分布优选的是具有单一峰值的概率分布,具体地说,可以是高斯分布。μj表示第j个要素分布的峰值中心,即分布中心,∑j表示协方差矩阵。d表示维数,在本实施例中d为3。在以下说明中假定,作为基础的要素分布为高斯分布,因此,该混合分布为混合高斯分布。
因此,与该抽样有关的混合分布的多个参数为混合参数ξj、高斯分布中心μj以及协方差矩阵∑j,并且将这些参数作为三维估算特征值进行处理。可以由公知的EM算法来定义与规定的脸图像数据对应的这些参数。
在采用高斯分布的情况下,混合参数ξj是表示第j个高斯分布的权重的数值,协方差矩阵∑j是表示第j个高斯分布的峰值方向的数值。因此,通过针对m个要素分布中的各个分布获得这三个参数,把该对象表示为m个区域的一组。
可以任意地设定构成混合分布的各要素分布的初始值,而不限于高斯分布。例如,可能的是,针对一矩形图像设定等间距的多个栅格(lattice),并把这些栅格的中心指定为多个要素分布的初始位置,另选地,在预期该对象的结构将变得复杂的一区域内(例如图像中心附近)将多个要素分布彼此靠近地密集排列。在将要素分布的初始位置等间距排列或者规则排列的前一情况中,所获得的优点是,可以处理各种对象,但是存在的缺点是,容易发生使混合参数ξj在图像的周缘基本上为零的要素分布,从而使可实质用于识别的特征值的数量减少。在将要素分布的初始位置不规则排列的情况下,优点和缺点通常交互作用,但由于由此输入的图像一般由等间距的像素构成,因而存在的缺点是,在将多个要素分布的初始值密集排列的区域中由这些要素分布所区分的那些区域的尺寸(面积)变小,并且其中所包含的像素数量减少,从而使分布精度下降。因此,优选的是,采用以下方式来确定要素分布的初始位置和要素分布数m,即在与多个要素分布的各区域相对应的一区域内包含至少10个像素。要素分布数m优选的是30或以上,这是因为在要素分布数m太小的情况下,不能表示十分复杂的特征。除非在各区域内所含的上述像素数得不到确保的情况下,否则没有要素分布数m的具体上限。
具体地说,在以下公式(3)中获得该抽样符合第J高斯分布的概率q(t)(J|x)=ξJp(x;θJ(t))Σj=1mξjp(x;θj(t))---(3)]]>并且在以下公式(4)中计算全部数据的对数似然(将该处理称为E步骤)。
Q(θ)=Σi=1nΣj=1mq(t)(j|xi)log{ξjp(xi;θj)}---(4)]]>随后,在以下公式(5)、(6)和(7)中确定使对数似然Q最大的混合分布的参数(将该处理称为M步骤)。
ξJ(t+1)=1nΣi=1nq(t)(J|xi)---(5)]]>μJ(t+1)=1nξJ(t+1)Σi=1nq(t)(J|xi)xi---(6)]]>ΣJ(t+1)=1nξJ(t+1)Σi=1nq(t)(J|xi)(xi-μJ(t+1))(xi-μJ(t+1))T---(7)]]>通过以规定次数重复上述运算可以获得使对数似然Q最大的那些参数。这样,控制部11输出与所处理的脸图像数据对应的参数作为三维估算特征值。
具体地说,例如,图2B示出了在图2A所示的原始图像中利用由EM算法所定义的那些参数求出的高斯分布。图2B中的多个椭圆形分别与多个高斯分布对应。在图2C示意性地示出与图2B所示的高斯分布具有最高似然的图像。在实际运算中,把以多个规定值或多个随机值作为参数的多个混合分布用作为初始状态,并且根据EM算法来调整与各混合分布的要素分布(高斯分布)有关的参数。
还可能的是,由三维排列的多个平面来替代表示该对象的多个区域。例如,在要素分布是高斯分布的情况下,与高斯分布有关的参数是限定多个平面的值,这些平面近似地表示作为对象的脸。在由多个平面近似表示作为对象的脸的情况下,还可能的是,针对各平面生成四维或更高维的值,并使用这些高维值。
控制部11针对要进行核对的各预备对象生成上述三维估算特征值,并使由此生成的三维估算特征值和对象识别信息(例如,人的姓名)相互关联并作为识别数据库存储在存储部14内(图3)。
具体地说,如图4所示,对要核对的对象图像进行初始化处理(S1)。在初始化处理中,把对象的图像数据缩放至一规定大小(例如,64×100像素),并通过采用高斯滤波器对缩放后的图像数据进行平滑,然后进行直方图均衡化(histogram equalization)。此处所称的直方图均衡化是将像素值再分布为以下方式的一种转换处理,即,使得这些像素值的频值在各像素值的值域(codomain)内彼此大致相等。已知,作为转换处理的结果,明确了图像对比度。
然后,控制部11把进行了初始化处理的图像数据的像素值转换成具有其位置坐标值及亮度值的组合的一多维变量(S2)。然后,控制部11在该对象的图像数据中均匀地设置初始高斯分布的多个中心位置(例如,7×7=49)(S3)。控制部11以初始高斯分布的中心位置作为起点,执行E步骤的处理(S4),然后执行M步骤的处理(S5)。然后,控制部11对步骤S4和S5是否重复了必要次数进行调查(S6),在重复了必要次数的情况下,控制部11生成包含彼此关联的以下两项数据的模板数据,即在最后的S5步骤中运算的参数和要核对的对象的识别信息(将其用作参数运算的基础)。然后,控制部11将模板数据存储在存储部4中(S7),从而完成处理。一组模板数据构成识别数据库。
将对控制部11执行的识别处理进行说明。控制部11将存储在存储部14内的识别数据库中的各个模板数据标记为未选择,并启动如图5所示的处理。控制部11对通过外部接口部13输入的图像数据进行处理并从中鉴别脸部(S11),该图像数据包括用于识别的目标对象。例如,可通过在JP-A-2003-281541中公开的方法来进行该鉴别。然后,对由此鉴别的脸部的部分图像数据进行初始化处理(S12)。此处的初始化处理与生成识别数据库时的初始化处理相同,其中,将脸部的部分图像数据缩放至一规定尺寸(例如,64×100像素),并且通过使用高斯滤波器平滑缩放后的图像数据,然后进行直方图均衡化。
然后,控制部11将进行了初始化处理的图像数据的像素值转换成具有其位置坐标值及亮度值的组合的一多维变量(S13)。然后,将存储在存储部14内的识别数据库中的标记为未选择的一个模板数据选择作为注目模板数据(focused template data)(在该步骤可以将其标记为已选择),并将在该注目模板数据内所含的多个参数设定为初始值(S14)。
控制部11以上述初始值为起点,执行E步骤的处理(S15),然后执行M步骤的处理(S16)。然后,控制部11对于步骤S15和S16是否重复了必要次数进行调查(S17),在未重复必要次数的情况下,处理返回到步骤S15继续处理。根据该处理,自动地修改了模板。在以必要次数重复这些步骤后,进一步执行E步骤(S18)。在步骤S17的重复次数可以为零(即,不执行E步骤和M步骤的处理),在此情况下,步骤S15、S16和S17的处理并不总是必要的。
控制部11对于作为S18的处理结果所获得的对数似然是否超过一规定阈值进行调查(S19)。在对数似然未超过该规定阈值的情况下,控制部11对于所有模板数据是否被标记为已选择进行调查(S20),在它们被标记为已选择的情况下,控制部11判定为不能识别,并相应输出到信息显示部15(S21),以完成处理。
在未将所有模板数据都标记为已选择而在步骤S20留有标记为未选择的模板数据的情况下,处理返回到步骤S14以继续处理。
在步骤S19,在作为S18的处理结果所获得的对数似然超过规定阈值的情况下,此时,控制部11把注目模板数据中所包含的对象识别信息输出到信息显示部15(S22)。在执行步骤S22的处理后,控制部11可以完成处理,或者另选地,可以返回到步骤S20以继续处理,并可以利用对数似然超过规定阈值的模板数据来显示对象识别信息的列表。在该情况下,可以在按对数似然以降序排序后来显示对象识别信息列表。
在识别处理中,控制部11可以进一步获取模板数据和与所鉴别的脸部有关的信息(与脸的方向、位置、尺寸和表情、作为模板数据基础的对象的成像状况、以及作为处理目标的对象的成像状况有关的信息),并根据该信息,控制部11可以移动模板数据中所包含的高斯分布的中心位置。例如,在坐标系中,当由此根据作为处理目标的输入图像数据而鉴别的脸部的中心位置与模板数据的脸部的中心位置偏离一偏离长度(Δx,Δy)时,高斯分布的中心位置的坐标移动了该偏离长度。对于脸部表情,在冷淡和微笑两种情况下脸颊的部位会存在差异,并且模板数据中位于脸颊的部位的高斯分布的中心位置移动了规定量。
通过在JP-A-2003-281541中所公开的处理可以获得与脸的方向、位置和尺寸有关的信息,或者可以由操作者从附图中未示出的操作部输入这些信息。
本实施例的特征之一是,在对模板数据进行上述修改时,根据修改量来控制作为比较结果的似然。具体地说,在使高斯分布的中心位置从μ0j移动到μj的情况下,通过由以下公式(8)替代公式(4)来定义对数似然。
Q(θ)=Σi=1nΣj=1mq(t)(j|xi)log{ξjp(xi;θj)}+ηΣi=1nΣj=1mq(t)(j|xi)(μj-μ0j)---(8)]]>与公式(4)相比,公式(8)包括附加项(右侧项的第二项,以下称为罚项(penalty term))。在公式(8)中,η代表表示罚项强度的系数,并可通过实验确定。
在该情况下,由以下公式(9)获得M步骤处理中的分布的中心位置的参数。
μJ(t+1)=(1+2ηΣJ)-1{1nξJ(t+1)Σi=1nq(t)(J|xi)xi+2ηΣJμ0J}---(9)]]>在M步骤中移动了高斯分布的中心位置,但其移动量受罚项的限制。
也可以在通过附加该罚项定义对数似然后,执行步骤S15~S17的处理,从而可以限制自动执行的模板修改。
识别数据库可以包含与相同对象识别信息有关的多个模板数据。具体地说,针对同一人的脸,生成脸的方向和尺寸不同的多个模板数据,并使这些多个模板数据与该对象识别信息相关联。在该情况下,与对象的脸的方向和尺寸有关的信息可以与模板数据相关联并被包含在识别数据库内。
在以上所述的本实施例中,在对数似然的计算中,针对各像素,运算来自所有高斯分布的发生概率(在所有高斯分布中能使用高斯分布进行描述的概率),但在距注目像素的距离超过规定阈值的部分中,可以将该概率指定为零,以省略运算。该距离的阈值可以是高斯分布的协方差的1.2倍。根据该过程,可减少计算量,以减轻处理负荷。
将对根据本实施例的图像处理装置的操作进行说明。在根据本实施例的图像处理装置中,预先针对要核对的人的脸图像计算三维估算特征值,并使三维估算特征值与该人的识别信息相关联并且将其作为识别数据库存储在存储部14内。
在例如通过视频成像所连续获得的多个图像数据中,鉴别脸部,并通过利用识别数据库内所包含的三维估算特征值,取得与该脸部对应的对象识别信息。
此外,根据本实施例的图像处理装置可以应用于以下处理,即与使用三维估算特征值的处理并行地执行传统的二维图案匹配处理,并可以根据这两种处理的结果来获得最终处理结果。在该情况下,将通过使用三维估算特征值的处理所获得的识别结果和相似性(似然)的组合的列表,与通过传统处理所获得的识别结果和相似性的组合的列表进行合成。换句话说,可能的是,针对各识别结果(对象识别信息)把来自各处理的相似性结果加权求和,以计算点数(point),并在以点数的降序进行排序后,输出识别结果(对象识别信息)。
通过使用上述三维估算特征值,生成登记了1096个人的脸的识别数据库,并随着脸部的像素数的改变,执行识别处理。结果在图6示出。
从图6所示的结果可以理解,使用超过100像素×100像素的像素数(128×200和64×100),可获得95%或以上的识别率,并且即使在像素数低于100像素×100像素(32×50和24×38)的情况下,也能获得等于95%的识别率。如上所述,根据本实施例,即使通过使用具有较低分辨率的二维图像,也能识别对象。
本发明的优选实施例的以上说明是为了图示和说明目而提出。并不旨在穷举或者将本发明限制到所公开的确切形式,并且鉴于上述教导可以进行各种修改和变形,或者可以通过本发明的实施来获知各种修改和变形。实施例的选择和描述是为了对本发明的原理及其实际应用进行说明,以使本领域技术人员能在各种实施例中利用本发明,并设想出适合于具体用途的各种修改。其意图是使本发明的范围由所附权利要求及其等效物来限定。
权利要求
1.一种图像处理装置,包括计算单元;以及存储单元,其中,所述计算单元将通过拍摄一对象而获得的二维图像数据的多个像素转换为一N维转换值,并且计算多个N维估算特征值,所述多个N维估算特征值是用于以多个N维区域作为基础来表达所述N维转换值的多个参数,其中N是大于2的整数,所述存储单元存储所述多个N维估算特征值和表示所述对象并与所述多个N维估算特征值相关联的信息,并且所述计算单元利用识别数据库执行识别处理。
2.一种图像处理装置,包括计算单元,其被配置成可访问一识别数据库;以及输出单元,其中,所述识别数据库保存一用于识别各预备对象的预备对象识别信息,和用于各个预备对象的多个N维估算特征值,其中所述多个N维估算特征值是用于以多个N维区域作为基础来表达一N维转换值的多个参数,所述N维转换值是所述预备对象的二维图像数据的多个像素的转换后的值,并且N是大于2的整数,所述计算单元将通过拍摄一用于重构的目标对象而获得的二维图像数据的多个像素转换为一N维转换值,并且计算多个N维估算特征值,其中所述多个N维估算特征值是用于以多个N维区域作为基础来表达一N维转换值的多个参数,所述N维转换值是所述目标对象的二维图像数据的多个像素的转换后的值,所述计算单元将所述目标对象的多个N维估算特征值与所述预备对象的多个N维估算特征值进行比较;以及输出单元输出比较结果。
3.根据权利要求2所述的图像处理装置,其中,所述计算单元根据所述目标对象的拍摄状态来修改所述预备对象的多个N维估算特征值。
4.根据权利要求1所述的图像处理装置,其中,所述N维估算特征值是与作为一混合分布的一部分的一种分布有关的值,所述各分布代表各区域。
5.根据权利要求2所述的图像处理装置,其中,所述N维估算特征值是与作为一混合分布的一部分的一种分布有关的值,所述各分布代表各区域。
6.一种图像处理方法,包括(a)载入通过拍摄一对象而获得的二维图像数据;(b)转换多个多维变量,各多维变量包括各像素的位置坐标值和一像素值,所述多个像素包含在所述二维图像数据内;(c)计算针对各像素生成的多个多维变量的似然,在将所述多维变量描述为多个混合分布时使用所述似然;以及(d)利用所述似然执行识别处理。
7.根据权利要求6所述的图像处理方法,其中,所述混合分布具有多个概率分布作为要素分布,每个概率分布具有单一峰值,并且所述似然是在除以下情况以外计算的,即所述峰值位置和所述像素的位置坐标值之间的距离超过一预定阈值。
8.根据权利要求4所述的图像处理装置,其中,所述混合分布具有多个概率分布作为要素分布,每个概率分布具有单一峰值。
9.根据权利要求5所述的图像处理装置,其中,所述混合分布具有多个概率分布作为要素分布,每个概率分布具有单一峰值。
10.根据权利要求4所述的图像处理装置,其中,所述混合分布是混合高斯分布。
11.根据权利要求5所述的图像处理装置,其中,所述混合分布是混合高斯分布。
12.根据权利要求6所述的图像处理方法,其中,所述混合分布是混合高斯分布。
13.一种产生识别数据库的方法,包括(a)载入包括多个区域的二维图像数据,所述二维图像数据是通过拍摄一对象而获得的;(b)将通过拍摄一对象而获得的二维图像数据的多个像素转换为一N维转换值;(c)计算多个N维估算特征值,所述多个N维估算特征值是用于以多个N维区域作为基础来表达所述N维转换值的多个参数,其中N是大于2的整数;以及(d)存储所述多个N维估算特征值和表示所述对象的信息,作为识别数据库。
14.一种可由计算机执行的图像处理方法,其中,所述计算机被配置成可访问一识别数据库,所述识别数据库保存一用于识别各预备对象的预备对象识别信息,和用于各个预备对象的多个N维估算特征值,其中所述多个N维估算特征值是用于以多个N维区域作为基础来表达一N维转换值的多个参数,所述N维转换值是所述预备对象的二维图像数据的多个像素的转换后的值,并且N是大于2的整数,所述程序使所述计算机执行包括以下步骤的过程(a)载入通过对一目标对象进行拍摄而获得的二维图像数据;(b)将通过拍摄一对象而获得的二维图像数据的多个像素转换为一N维转换值;(c)计算多个N维估算特征值,所述多个N维估算特征值是用于以多个N维区域作为基础来表达所述N维转换值的多个参数;(d)将目标对象的多个N维估算特征值与预备对象的多个N维估算特征值进行比较,以识别所述目标对象;以及(e)输出比较结果。
15.一种可由计算机执行的程序,其中,所述计算机被配置成可访问一识别数据库,所述识别数据库保存一用于识别各预备对象的预备对象识别信息,和用于各个预备对象的多个N维估算特征值,其中所述多个N维估算特征值是用于以多个N维区域作为基础来表达一N维转换值的多个参数,所述N维转换值是所述预备对象的二维图像数据的多个像素的转换后的值,并且N是大于2的整数;所述程序使所述计算机执行包括以下步骤的过程(a)载入一包括一目标对象的二维图像数据,该二维图像数据是通过对一目标对象进行拍摄而获得的;(b)将通过拍摄一对象而获得的二维图像数据的多个像素转换为一N维转换值;(c)计算多个N维估算特征值,所述多个N维估算特征值是用于以多个N维区域作为基础来表达所述N维转换值的多个参数;(d)将目标对象的多个N维估算特征值与预备对象的多个N维估算特征值进行比较,以识别所述目标对象;(e)输出比较结果。
16.一种可由计算机执行的程序,所述程序使所述计算机执行包括以下步骤的过程(a)载入通过拍摄一对象而获得的二维图像数据;(b)生成多个多维变量,各所述多维变量包括各像素的位置坐标值和一像素值,所述多个像素包含在所述二维图像数据中;以及(c)计算针对各像素生成的所述多个多维变量的似然,在把所述多维变量描述为混合分布时使用所述似然。
全文摘要
本发明提供一种能通过使用具有较低分辨率的二维图像来执行对象识别的图像处理装置。在该图像处理装置中,将通过拍摄规定对象而获得的图像数据用作处理目标;对于与该对象的一部分有关的至少一个平面,计算定义该平面的N维估算特征值(N≥3);使该N维估算特征值和原始对象识别信息相互关联,并将其作为识别数据库存储在存储单元内;以及把识别数据库应用于对象的识别处理。
文档编号G06K9/46GK1658219SQ20041008115
公开日2005年8月24日 申请日期2004年9月30日 优先权日2004年2月18日
发明者加藤典司, 福井基文 申请人:富士施乐株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1