对图像进行分类的方法和设备的制作方法

文档序号:6353674阅读:200来源:国知局
专利名称:对图像进行分类的方法和设备的制作方法
技术领域
本发明涉及对视频或图像的分类(包含对象/不包含対象),即视频或图像中对象的检测或识别,尤其涉及生成用于区分视频或图像中是否包含所要检测的对象的分类器的方法和设备,以及用所生成的分类器对图像进行分类的方法和设备。
背景技术
随着视频监控、人工智能、计算机视觉等应用的不断普及,对检测视频和图像中出现的特定对象,例如人、动物、车辆等等的技术的需求日益増加。在用于检测视频或者图像中的对象的方法中,已知有ー类方法是采用静态图像特征来建立用于区分视频或图像中是包含对象还是非对象的分类器,从而用该分类器来对图像进行分类,即在图像中检测对象, 其中对于视频,将每一帧视为一幅图像来进行检測。Paul Viola 和 Michael Jones 在“Robust Real-time Object Detection,,, Second International Workshop On Statistical And Computational Theories Of Vision-Modeling,Learning,Computing,And Sampling,Vancouver,Canada,July 13,2001 中公开了ー种这样的技术。在Paul Viola等人的技术中,从图像中提取矩形块的像素和之间的差作为特征,通过AdaBoost方法从所提取的特征中选择更适合用来区分对象和非对象的特征来形成弱分类器,并且通过融合弱分类器来形成强分类器。这类方法比较适合在图像中检测例如人脸这样的对象,但是对于例如人这样的对象的检测的鲁棒性则不是很闻。

发明内容
鉴于现有技术的上述不足,本发明g在提供ー种生成分类器的方法、设备和对图像进行分类的方法和设备,以提高图像中对象检测的鲁棒性。本发明的一个实施例是ー种生成用于区分对象图像和非对象图像的分类器的方法,包括从输入图像中提取特征向量,其中所述特征向量包括多个第一候选特征,每个所述第一候选特征与沿第一轴的方向布置的多个第一区域、和沿与所述第一轴方向相交的第 ニ轴的方向布置的多个第二区域和多个预定取向之一的候选组合相对应,每个所述第一候选特征的提取包括获得相应候选组合的多个第一区域的像素和或均值之间的差值,以得到所述第一轴方向上的第一差向量,和相应候选组合的多个第二区域的像素和或均值之间的差值,以得到所述第二轴方向上的第二差向量;获得所述第一差向量和第二差向量在相应候选组合的预定取向的直线上的第一投影差向量和第二投影差向量;以及获得所述第一投影差向量和第二投影差向量的大小的和,以作为所述第一候选特征;以及根据所述提取的特征向量训练出所述分类器,其中,这些候选组合中的至少ー个组合的多个第一区域和多个第二区域中的至少ー个区域由单个像素构成。本发明的另ー个实施例是ー种生成用于区分对象图像和非对象图像的分类器的设备,所述设备从输入图像中提取特征向量,其中所述特征向量包括多个第一候选特征,每个所述第一候选特征与沿第一轴的方向布置的多个第一区域、和沿与所述第一轴方向相交的第二轴的方向布置的多个第二区域和多个预定取向之一的候选组合相对应,并且所述设备包括差计算单元,其针对每个所述第一候选特征,获得相应候选组合的多个第一区域的像素和或均值之间的差值,以得到所述第一轴方向上的第一差向量,和相应候选组合的多个第二区域的像素和或均值之间的差值,以得到所述第二轴方向上的第二差向量,并且获得所述第一差向量和第二差向量在相应候选组合的预定取向的直线上的第一投影差向量和第二投影差向量;以及特征计算単元,其获得所述第一投影差向量和第二投影差向量的大小的和,以作为所述第一候选特征;以及训练单元,根据所述提取的特征向量训练出所述分类器,其中,这些候选组合中的至少ー个组合的多个第一区域和多个第二区域中的至少 ー个区域由单个像素构成。根据本发明的上述实施例,分别基于沿两个方向布置的区域的像素来计算第一差向量和第二差向量,并且区域可以由单个像素构成,使得提取的特征得到丰富,并且所提取的特征能够更加真实地反映相应图像部分中对象边缘的分布。此外,通过不同的预定取向来假设对象局部的各种可能的边缘取向,能够进ー步提高分类器的鲁棒性。进ー步地,在上述方法和设备中,特征向量还可以包括至少ー个第二候选特征,每个所述第二候选特征与沿第一轴的方向布置的多个第一区域、沿与所述第一轴方向相交的第二轴的方向布置的多个第二区域和多个预定取向之一的至少两个候选组合相对应。每个第二候选特征的提取可以包括针对与所述第二候选特征相对应的至少两个候选组合中的每个候选组合,获得所述候选组合的多个第一区域的像素和或均值之间的差值,以得到所述第一轴方向上的第一差向量,和所述候选组合的多个第二区域的像素和或均值之间的差值,以得到所述第二轴方向上的第二差向量;获得所述第一差向量和第二差向量在所述候选组合的预定取向的直线上的第一投影差向量和第二投影差向量;以及获得所述第一投影差向量和第二投影差向量的大小的和;以及获得与所述至少两个候选组合对应的和的均值或总和,以作为所述第二候选特征。根据本发明的上述实施例,每个候选组合的相应特征表征ー个对象边缘,而将至少两个候选组合的相应特征联合起来,则能够获得表征至少两个对象边缘的单个特征,从而有利于训练出更加鲁棒的分类器。在上述方法和设备中,在这至少一个候选组合的每个候选组合中,单个像素可以与该候选组合的其它区域间隔开。在上述方法和设备中,这至少ー个候选组合可以包括第一区域和第二区域均由单个像素构成的候选组合。在上述方法和设备中,在第一区域区域的连线基本上等分所述第二区域的连线, 反之亦然。在上述方法和设备中,在第一区域的数目和第二区域的数目均为三的情况下,所述第一区域是共线的,所述第二区域也是共线的,并且第一区域中居于中间的第一区域和第二区域中居于中间的第二区域在所述第一区域的连线和所述第二区域的连线的交点上或所述交点的预定范围内。在上述方法和设备中,至少两个所述候选组合之间的差别可以包括下述中的ー个或多个区域的相对位置关系、区域的数目、区域的形状、区域的大小、区域的纵横比。这使得可供考察的特征更加丰富,从而更加利于选择适合区分对象和非对象的特征。在上述方法和设备中,多个预定取向相对于所述第一轴或第二轴旋转的角度范围可以为0度到180度或0度到360度。在上述方法和设备中,多个预定取向中的相邻预定取向间的角度可以相同。在上述方法和设备中,可以根据与第一候选特征对应的候选组合生成至少ー个集合,其中每个所述集合包含至少两个所述候选组合。可以通过以下述方式获得对应于每个所述集合的第二候选特征,来评估所述第二候选特征的鉴别能力针对所述集合的每个候选组合,获得所述候选组合的多个第一区域的像素和或均值之间的差值,以得到所述第 ー轴方向上的第一差向量,和所述候选组合的所述多个第二区域的像素和或均值之间的差值,以得到所述第二轴方向上的第二差向量;获得所述第一差向量和第二差向量在所述候选组合的预定取向的直线上的第一投影差向量和第二投影差向量;以及获得所述第一投影差向量和第二投影差向量的大小的和;以及获得所述集合的各个候选组合的相应和的均值或总和,以作为所述第二候选特征。在所述第二候选特征的鉴别能力不满足预定要求的情况下,可以从生成的集合中排除所述集合。之后,可以将每个集合的各个候选组合作为第二候选特征之一的对应候选组合。本发明的另ー个实施例是ー种对图像进行分类的方法,包括从所述图像中提取特征向量,其中所述特征向量包括多个第一特征,每个所述第一特征与沿第一轴的方向布置的多个第一区域、和沿与所述第一轴方向相交的第二轴的方向布置的多个第二区域和多个预定取向之一的组合相对应,每个所述第一特征的提取包括获得相应组合的多个第一区域的像素和或均值之间的差值,以得到所述第一轴方向上的第一差向量,和相应组合的多个第二区域的像素和或均值之间的差值,以得到所述第二轴方向上的第二差向量;获得所述第一差向量和第二差向量在相应组合的预定取向的直线上的第一投影差向量和第二投影差向量;以及获得所述第一投影差向量和第二投影差向量的大小的和,以作为所述第一特征;以及根据所述提取的特征向量,对所述图像进行分类,其中,这些组合中的至少ー 个组合的多个第一区域和多个第二区域中的至少ー个区域由单个像素构成。本发明的另ー个实施例是ー种对图像进行分类的设备,所述设备从所述图像中提取特征向量,其中所述特征向量包括多个第一特征,每个所述第一特征与沿第一轴的方向布置的多个第一区域、和沿与所述第一轴方向相交的第二轴的方向布置的多个第二区域和多个预定取向之一的组合相对应,并且所述设备包括差计算单元,其针对每个所述第一特征,获得相应组合的所述多个第一区域的像素和或均值之间的差值,以得到所述第一轴方向上的第一差向量,和相应组合的所述多个第二区域的像素和或均值之间的差值,以得到所述第二轴方向上的第二差向量,并且获得所述第一差向量和第二差向量在相应组合的预定取向的直线上的第一投影差向量和第二投影差向量;以及特征计算単元,其获得所述第一投影差向量和第二投影差向量的大小的和,以作为所述第一特征;以及分类单元,其根据所述提取的特征向量,对所述图像进行分类,其中,这些组合中的至少ー个组合的多个第一区域和多个第二区域中的至少ー个区域由单个像素构成。根据本发明的上述实施例,分别基于沿两个方向布置的区域的像素来计算第一差向量和第二差向量,并且区域可以由单个像素构成,使得提取的特征得到丰富,并且所提取的特征能够更加真实地反映相应图像部分中对象边缘的分布。此外,通过不同的预定取向来假设对象局部的各种可能的边缘取向,能够得到具有更强鉴别能力的特征,从而进ー步提高分类的鲁棒性。在上述方法和设备中,特征向量还可以包括至少ー个第二特征,其中每个所述第 ニ特征与沿第一轴的方向布置的多个第一区域、沿与所述第一轴方向相交的第二轴的方向布置的多个第二区域和多个预定取向之一的至少两个组合相对应。每个第二特征的提取可以包括针对与所述第二特征相对应的至少两个组合中的每个组合,获得所述组合的多个第一区域的像素和或均值之间的差值,以得到所述第一轴方向上的第一差向量,和所述组合的多个第二区域的像素和或均值之间的差值,以得到所述第二轴方向上的第二差向量; 获得所述第一差向量和第二差向量在所述组合的预定取向的直线上的第一投影差向量和第二投影差向量;以及获得所述第一投影差向量和第二投影差向量的大小的和;以及获得与所述至少两个组合对应的和的均值或总和,以作为所述第二特征。根据本发明的上述实施例,每个组合的相应特征表征ー个对象边缘,而将至少两个候选组合的相应特征联合起来,则能够获得表征至少两个对象边缘的单个特征,从而增强特征的鉴别能力,有利于提高分类的鲁棒性。在上述方法和设备中,在这至少一个组合的每个组合中,单个像素可以与该组合的其它区域间隔开。在上述方法和设备中,这至少ー个组合可以包括第一区域和第二区域均由单个像素构成的组合。在上述方法和设备中,在第一区域的数目和第二区域的数目均为ニ,第一区域是间隔开的并且第二区域是间隔开的情况下,第一区域的连线基本上等分所述第二区域的连线,反之亦然。在上述方法和设备中,在第一区域的数目和第二区域的数目均为三的情况下,所述第一区域是共线的,所述第二区域也是共线的,并且第一区域中居于中间的第一区域和第二区域中居于中间的第二区域在所述第一区域的连线和所述第二区域的连线的交点上或所述交点的预定范围内。在上述方法和设备中,至少两个所述组合之间的差别可以包括下述中的一个或多个区域的相对位置关系、区域的数目、区域的形状、区域的大小、区域的纵横比。这使得可供考察的特征更加丰富,从而更加利于选择适合区分对象和非对象的特征。在上述方法和设备中,与每个所述第二特征相对应的至少两个组合能够形成ー个序列,该序列中相邻组合的预定取向的偏差在预定范围内,其各个区域的覆盖范围彼此接近并且所述至少两个组合所覆盖的像素彼此不完全相同。在上述方法和设备中,多个预定取向相对于所述第一轴或第二轴旋转的角度范围可以为0度到180度或0度到360度。在上述方法和设备中,多个预定取向中的相邻预定取向间的角度可以相同。


參照下面结合附图对本发明实施例的说明,会更加容易地理解本发明的以上和其它目的、特点和优点。在附图中,相同的或对应的技术特征或部件将采用相同或对应的附图标记来表示。在附图中不必依照比例绘制出単元的尺寸和相对位置。
图I的框图示出了根据本发明一个实施例的、生成用于区分对象图像和非对象图像的分类器的设备的结构。图2a至图21是示出特征的区域的布局的例子的示意图。图3a示出了对象(人体)的轮廓边缘的分布的ー个例子。图3b和3c分别示出了基于图2a和2b示出的区域布局在图3a示出的部分中确定第一区域和第二区域的示意图。图4a是示出图3a所示的部分302中所包含的对象轮廓边缘的示意图,图4b是多个预定取向的示意图,图4c是示出差向量和投影差向量的示例的图例,图4d示出了差向量和投影差向量之间的投影关系的例子。图5示出了根据本发明一个实施例的生成用于区分对象图像和非对象图像的分类器的方法的流程图。图6a示出了存在关联的候选组合的覆盖范围的例子的示意图,图6b是示出存在连续性的对象轮廓边缘部分的例子的示意图,图6c是说明候选组合的取向一致性约束的图例。图7示出了根据本发明一个优选实施例的、生成用于区分对象图像和非对象图像的分类器的设备的框图。图8示出了根据本发明一个优选实施例的、生成用于区分对象图像和非对象图像的分类器的方法的流程图。图9示出了根据本发明一个优选实施例的、生成用于区分对象图像和非对象图像的分类器的方法的流程图。图10示出了根据本发明一个优选实施例的、生成用于区分对象图像和非对象图像的分类器的设备的框图。图11示出了根据本发明一个优选实施例的、生成用于区分对象图像和非对象图像的分类器的方法的流程图。图12的框图示出了根据本发明一个实施例的、对图像进行分类的设备的结构。图13示出了根据本发明一个实施例的、检测图像中的对象的方法的流程图。图14示出了根据本发明一个优选实施例的分类方法的流程图。图15是示出其中实现本发明的计算机的示例性结构的框图。
具体实施例方式下面參照附图来说明本发明的实施例。应当注意,为了清楚的目的,附图和说明中省略了与本发明无关的、本领域普通技术人员已知的部件和处理的表示和描述。图I的框图示出了根据本发明一个实施例的、生成用于区分对象图像和非对象图像的分类器的设备100的结构。如图I所示,设备100包括差计算单元102、特征计算单元103和训练单元104。在采用静态图像特征来建立分类器的技术中,收集对象图像和非对象图像,从所收集的对象图像和非对象图像中提取特征,利用例如AdaBoost方法的筛选方法对提取的特征进行选择和融合,得到区分对象图像和非对象图像的分类器。在Ding等人的标题为“A Robust Human Face Detecting Method In Complicated Background Image,,的专利申请WO 2008/151470中公开了收集和准备这样的对象图像和非对象图像的方法(參见说明书第2页至第3页)。所收集和准备的对象图像和非对象图像可作为设备100的输入图像。 设备100从多个输入图像的每个图像中提取ー组特征作为特征向量。因而,每个图像提取出一个特征向量VJf1, f2,. . . fn),然后根据所提取的向量的集合来训练出分类器。对于各个图像的特征向量而言,其每个维的特征是基于相应图像的一或多个部分的像素来计算的。在本发明的实施例中,特征由特征区域和取向決定。每个特征的计算所基于的像素由若干像素区域来限定。为便于说明,这里将限定一个特征的计算所基于的像素的像素区域称为该特征的特征区域。相同维的特征的特征区域是相同的。可以预先确定要提取的特征向量包含哪些特征,以及这些特征中的每个特征与什么样的特征区域相对应。一个特征的特征区域可以包括沿第一轴的方向布置的多个第一区域和沿与第一轴方向相交(例如,以直角或非直角相交)的第二轴的方向布置的多个第二区域。可从布局和位置两个方面确定特征的特征区域。这里所说的布局包括区域的相对位置关系、区域的数目、区域的形状、区域的大小、区域的纵横比。第一区域和第二区域的布局可以有各种方式。在一个例子中,多个第一区域的像素的位置的加权平均位置以及多个第二区域的像素的位置的加权平均位置在所述第一轴和第二轴的交点的预定范围内。具体以第一区域为例,可以将第一区域的像素的位置表示为(xu,yu),其中表示第i个第一区域中的第j个像素在第一轴(例如X轴)上的座标,yu表示第i个第一区域中的第j个像素在第二轴(例如Y轴)上的座标。可将第一区域的像素的位置的加权平均位置(xa, ya)定义如下
权利要求
1.一种对图像进行分类的方法,包括从所述图像中提取特征向量,其中所述特征向量包括多个第一特征,每个所述第一特征与沿第一轴的方向布置的多个第一区域、和沿与所述第一轴方向相交的第二轴的方向布置的多个第二区域和多个预定取向之一的组合相对应,每个所述第一特征的提取包括获得相应组合的多个第一区域的像素和或均值之间的差值,以得到所述第一轴方向上的第一差向量,和相应组合的多个第二区域的像素和或均值之间的差值,以得到所述第二轴方向上的第二差向量;获得所述第一差向量和第二差向量在相应组合的预定取向的直线上的第一投影差向量和第二投影差向量;以及获得所述第一投影差向量和第二投影差向量的大小的和,以作为所述第一特征;以及根据所述提取的特征向量,对所述图像进行分类,其中,所述组合中的至少一个组合的多个第一区域和多个第二区域中的至少一个区域由单个像素构成。
2.如权利要求I所述的方法,其中所述特征向量还包括至少一个第二特征,其中每个所述第二特征与沿第一轴的方向布置的多个第一区域、沿与所述第一轴方向相交的第二轴的方向布置的多个第二区域和多个预定取向之一的至少两个组合相对应,每个所述第二特征的提取包括针对与所述第二特征相对应的至少两个组合中的每个组合,获得所述组合的多个第一区域的像素和或均值之间的差值,以得到所述第一轴方向上的第一差向量,和所述组合的多个第二区域的像素和或均值之间的差值,以得到所述第二轴方向上的第二差向量;获得所述第一差向量和第二差向量在所述组合的预定取向的直线上的第一投影差向量和第二投影差向量;以及获得所述第一投影差向量和第二投影差向量的大小的和;以及获得与所述至少两个组合对应的和的均值或总和,以作为所述第二特征。
3.如权利要求I或2所述的方法,其中,在所述至少一个组合的每个组合中,所述单个像素与所述组合的其它区域间隔开。
4.如权利要求I或2或3所述的方法,其中,所述至少一个组合包括第一区域和第二区域均由单个像素构成的组合。
5.如权利要求4所述的方法,其中,对于第一区域和第二区域均由单个像素构成的组合,在所述第一区域的数目和所述第二区域的数目均为二,所述第一区域是间隔开的并且所述第二区域是间隔开的情况下,所述第一区域的连线基本上等分所述第二区域的连线,反之亦然。
6.如权利要求4所述的方法,其中,第一区域和第二区域均由单个像素构成的组合,在所述第一区域的数目和所述第二区域的数目均为三的情况下,所述第一区域是共线的,所述第二区域也是共线的,并且所述第一区域中居于中间的第一区域和所述第二区域中居于中间的第二区域在所述第一区域的连线和所述第二区域的连线的交点上或所述交点的预定范围内。
7.如权利要求2所述的方法,其中与每个所述第二特征相对应的至少两个组合能够形成一个序列,该序列中相邻组合的预定取向的偏差在预定范围内,其各个区域的覆盖范围彼此接近并且所述至少两个组合所覆盖的像素彼此不完全相同。
8.如权利要求I所述的方法,其中所述多个预定取向相对于所述第一轴或第二轴旋转的角度范围为O度到180度或O度到360度。
9.如权利要求I或8所述的方法,其中所述多个预定取向中的相邻预定取向间的角度相同。
10.一种对图像进行分类的设备,所述设备从所述图像中提取特征向量,其中所述特征向量包括多个第一特征,每个所述第一特征与沿第一轴的方向布置的多个第一区域、和沿与所述第一轴方向相交的第二轴的方向布置的多个第二区域和多个预定取向之一的组合相对应,并且所述设备包括差计算单元,其针对每个所述第一特征,获得相应组合的所述多个第一区域的像素和或均值之间的差值,以得到所述第一轴方向上的第一差向量,和相应组合的所述多个第二区域的像素和或均值之间的差值,以得到所述第二轴方向上的第二差向量,并且获得所述第一差向量和第二差向量在相应组合的预定取向的直线上的第一投影差向量和第二投影差向量;以及特征计算单元,其获得所述第一投影差向量和第二投影差向量的大小的和,以作为所述第一特征;以及分类单元,其根据所述提取的特征向量,对所述图像进行分类,其中,所述组合中的至少一个组合的多个第一区域和多个第二区域中的至少一个区域由单个像素构成。
11.一种生成用于区分对象图像和非对象图像的分类器的方法,包括从输入图像中提取特征向量,其中所述特征向量包括多个第一候选特征,每个所述第一候选特征与沿第一轴的方向布置的多个第一区域、和沿与所述第一轴方向相交的第二轴的方向布置的多个第二区域和多个预定取向之一的候选组合相对应,每个所述第一候选特征的提取包括获得相应候选组合的多个第一区域的像素和或均值之间的差值,以得到所述第一轴方向上的第一差向量,和相应候选组合的多个第二区域的像素和或均值之间的差值,以得到所述第二轴方向上的第二差向量;获得所述第一差向量和第二差向量在相应候选组合的预定取向的直线上的第一投影差向量和第二投影差向量;以及获得所述第一投影差向量和第二投影差向量的大小的和,以作为所述第一候选特征;以及根据所述提取的特征向量训练出所述分类器,其中,所述候选组合中的至少一个候选组合的多个第一区域和多个第二区域中的至少一个区域由单个像素构成。
12.如权利要求11所述的方法,其中所述特征向量还包括至少一个第二候选特征,其中每个所述第二候选特征与沿第一轴的方向布置的多个第一区域、沿与所述第一轴方向相交的第二轴的方向布置的多个第二区域和多个预定取向之一的至少两个候选组合相对应, 每个所述第二候选特征的提取包括针对与所述第二候选特征相对应的至少两个候选组合中的每个候选组合,获得所述候选组合的多个第一区域的像素和或均值之间的差值,以得到所述第一轴方向上的第一差向量,和所述候选组合的多个第二区域的像素和或均值之间的差值,以得到所述第二轴方向上的第二差向量;获得所述第一差向量和第二差向量在所述候选组合的预定取向的直线上的第一投影差向量和第二投影差向量;以及获得所述第一投影差向量和第二投影差向量的大小的和;以及获得与所述至少两个候选组合对应的和的均值或总和,以作为所述第二候选特征。
13.如权利要求12所述的方法,还包括从与第一候选特征对应的候选组合中搜索至少一个集合,其中每个所述集合包含满足下述条件的至少两个所述候选组合所述候选组合能够形成一个序列,该序列中相邻候选组合的预定取向的偏差在预定范围内并且其各个区域的覆盖范围彼此接近,以及不同的所述候选组合所覆盖的像素彼此不完全相同;以及将每个所述集合的各个候选组合作为所述第二候选特征之一的对应候选组合。
14.如权利要求13所述的方法,其中在将每个所述集合的各个候选组合作为所述第二候选特征之一的对应候选组合之前还包括通过以下述方式获得对应于每个所述集合的第二候选特征,来评估所述第二候选特征的鉴别能力针对所述集合的每个候选组合,获得所述候选组合的多个第一区域的像素和或均值之间的差值,以得到所述第一轴方向上的第一差向量,和所述候选组合的所述多个第二区域的像素和或均值之间的差值,以得到所述第二轴方向上的第二差向量;获得所述第一差向量和第二差向量在所述候选组合的预定取向的直线上的第一投影差向量和第二投影差向量;以及获得所述第一投影差向量和第二投影差向量的大小的和;以及获得所述集合的各个候选组合的相应和的均值或总和,以作为所述第二候选特征,其中,在所述第二候选特征的鉴别能力不满足预定要求的情况下,从搜索到的集合中排除所述集合。
15.如权利要求11至14之一所述的方法,其中,在所述至少一个候选组合的每个候选组合中,所述单个像素与所述候选组合的其它区域间隔开。
16.如权利要求11至15之一所述的方法,其中,所述至少一个候选组合包括第一区域和第二区域均由单个像素构成的候选组合。
17.如权利要求16所述的方法,其中,对于第一区域和第二区域均由单个像素构成的候选组合,在所述第一区域的数目和所述第二区域的数目均为二,所述第一区域是间隔开的并且所述第二区域是间隔开的情况下,所述第一区域的连线基本上等分所述第二区域的连线,反之亦然。
18.如权利要求16所述的方法,其中,对于第一区域和第二区域均由单个像素构成的候选组合,在所述第一区域的数目和所述第二区域的数目均为三的情况下,所述第一区域是共线的,所述第二区域也是共线的,并且所述第一区域中居于中间的第一区域和所述第二区域中居于中间的第二区域在所述第一区域的连线和所述第二区域的连线的交点上或所述交点的预定范围内。
19.如权利要求11所述的方法,其中所述多个预定取向相对于所述第一轴或第二轴旋转的角度范围为O度到180度或O度到360度。
20.如权利要求11或19所述的方法,其中所述多个预定取向中的相邻预定取向间的角度相问。
21.如权利要求12所述的方法,还包括根据与第一候选特征对应的候选组合生成至少一个集合,其中每个所述集合包含至少两个所述候选组合;通过以下述方式获得对应于每个所述集合的第二候选特征,来评估所述第二候选特征的鉴别能力针对所述集合的每个候选组合,获得所述候选组合的多个第一区域的像素和或均值之间的差值,以得到所述第一轴方向上的第一差向量,和所述候选组合的所述多个第二区域的像素和或均值之间的差值,以得到所述第二轴方向上的第二差向量;获得所述第一差向量和第二差向量在所述候选组合的预定取向的直线上的第一投影差向量和第二投影差向量;以及获得所述第一投影差向量和第二投影差向量的大小的和;以及获得所述集合的各个候选组合的相应和的均值或总和,以作为所述第二候选特征,以及在所述第二候选特征的鉴别能力不满足预定要求的情况下,从生成的集合中排除所述集合;以及将每个所述集合的各个候选组合作为所述第二候选特征之一的对应候选组合。
22.—种生成用于区分对象图像和非对象图像的分类器的设备,所述设备从输入图像中提取特征向量,其中所述特征向量包括多个第一候选特征,每个所述第一候选特征与沿第一轴的方向布置的多个第一区域、和沿与所述第一轴方向相交的第二轴的方向布置的多个第二区域和多个预定取向之一的候选组合相对应,并且所述设备包括差计算单元,其针对每个所述第一候选特征,获得相应候选组合的多个第一区域的像素和或均值之间的差值,以得到所述第一轴方向上的第一差向量,和相应候选组合的多个第二区域的像素和或均值之间的差值,以得到所述第二轴方向上的第二差向量,并且获得所述第一差向量和第二差向量在相应候选组合的预定取向的直线上的第一投影差向量和第二投影差向量;以及特征计算单元,其获得所述第一投影差向量和第二投影差向量的大小的和,以作为所述第一候选特征;以及训练单元,根据所述提取的特征向量训练出所述分类器,其中,所述候选组合中的至少一个组合的多个第一区域和多个第二区域中的至少一个区域由单个像素构成。
全文摘要
公开了对图像进行分类的方法和设备。方法包含从图像中提取包括多个第一特征的特征向量,各第一特征与沿第一/第二轴的方向布置的多个第一/第二区域和多个预定取向之一的组合相对应,各第一特征的提取包括获得相应组合的多个第一/第二区域的像素和或均值之间的差值,以得到第一/第二轴方向上的第一/第二差向量;获得第一/第二差向量在相应组合的预定取向的直线上的第一/第二投影差向量;以及获得第一和第二投影差向量的大小的和,以作为第一特征;以及根据提取的特征向量,对图像进行分类,其中,组合中的至少一个组合的多个第一区域和多个第二区域中的至少一个区域由单个像素构成。
文档编号G06T7/00GK102609713SQ20111002683
公开日2012年7月25日 申请日期2011年1月20日 优先权日2011年1月20日
发明者张伦 申请人:索尼公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1