检测图像中的对象的装置和方法、分类器生成装置和方法

文档序号:6607951阅读:339来源:国知局
专利名称:检测图像中的对象的装置和方法、分类器生成装置和方法
技术领域
本发明涉及图像处理领域,尤其涉及一种检测图像中的对象的装置和方法以及分类器生成装置和方法。
背景技术
在图像检测和识别等很多应用场合中,诸如,在对图像中的对象进行检测以及生成对象分类器的应用中,图像中的对象的形状成为检测和识别的极为有用的依据。因此,如何有效并且高效地表征对象的形状成为人们关注的问题。已经提出了很多表征图像的形状的方法,包括基于网格的方法、使用傅立叶描述子的方法、使用Zernike矩特征的方法以及曲率尺度空间(CCS,curvature scale space) 方法。基于网格的方法将图像映射到具有固定大小的网格。然后,对网格进行扫描,并依据每个网格中前景像素的数目是否大于预定阈值来为各个网格分配“1”和“0”。最后,连接这些“ 1,,和“0”来生成最终的形状特征。傅立叶描述子在频域中获得图像中对象的轮廓表示,以傅立叶级数展开的系数作为对象的形状特征。其中,形状特征可以基于曲率、半径或边界坐标。由于基于正交多项式分解的矩能够对图像内容进行重建,有人提出了 Zernike矩特征。具体来说,该方法将图像信号展开为正交基的级数,并采用变换系数作为特征元素。在常用的曲率尺度空间方法中,使用不同的尺度对图像轮廓进行平滑,并检测曲率为零的位置,由此生成曲率尺度空间图像,最后使用曲率尺度空间图像的极大值来表示图像中对象轮廓的形状。

发明内容
然而,已有的方法只描述图像中对象的空间信息。一些方法使用部分结构作为特征描述子,诸如基于网格的方法,而其它方法从整体统计中提取特征,诸如傅立叶描述子以及基于特征的矩。基本没有特征能够将空间结构和统计特征有机的结合起来。传统的特征通常限于一些特定目标图像。例如,CSS特征只能处理闭合的轮廓。此外,在已有方法中存在的另一个问题是仿射不变性。本发明的目的是提供一种对图像中的对象进行检测的装置和方法以及生成分类器的装置和方法,其将图像中对象的空间结构和统计特征有机结合,并实现对象检测的特征描述子的旋转不变性。本发明的一个实施例是一种用于对图像中的对象进行检测的装置,包括网格划分部分,用于在以图像中的特定点为极点的极坐标系中,用多条极线和以极点为圆心的多个圆划分网格,其中,网格是相邻极线与相邻圆或相邻极线与圆中的最小圆所限定的区域, 极线的条数和圆的个数为常数,并且,圆中最大圆的半径大于等于图像中的前景图像的像素与特定点之间的最大距离;梯度方向直方图获得部分,用于针对每个网格,至少计算前景图像中轮廓像素的相对于网格的参考方向的梯度方向并且根据所计算的梯度方向获得网格的梯度方向直方图;特征构造部分,用于将所有网格的梯度方向直方图连接成总直方图向量,其中,每对相邻极线限定的网格的梯度方向直方图的连接顺序相同,并且,特征构造部分对总直方图向量进行傅立叶变换,以得到图像的特征向量;以及对象检测部分,用于基于所得到的特征向量对图像中的对象进行检测。本发明的另一个实施例是一种对图像中的对象进行检测的方法,包括在以图像中的特定点为极点的极坐标系中,用多条极线和以极点为圆心的多个圆划分网格,其中,网格是相邻极线与相邻圆或相邻极线与圆中的最小圆所限定的区域,极线的条数和圆的个数为常数,并且,圆中最大圆的半径大于等于图像中的前景图像的像素与特定点之间的最大距离;针对每个网格,至少计算前景图像中轮廓像素的相对于网格的参考方向的梯度方向并且根据所计算的梯度方向获得网格的梯度方向直方图;将所有网格的梯度方向直方图连接成总直方图向量,其中,每对相邻极线限定的网格的梯度方向直方图的连接顺序相同,并且,对总直方图向量进行傅立叶变换,以得到图像的特征向量;以及基于所得到的特征向量对图像中的对象进行检测。本发明的另一个实施例是一种用于生成分类器的装置,包括网格划分部分,用于在以图像中的特定点为极点的极坐标系中,用多条极线和以极点为圆心的多个圆划分网格,其中,网格是相邻极线与相邻圆或相邻极线与圆中的最小圆所限定的区域,极线的条数和圆的个数为常数,并且,圆中最大圆的半径大于等于图像中的前景图像的像素与特定点之间的最大距离;梯度方向直方图获得部分,用于针对每个网格,至少计算前景图像中轮廓像素的相对于网格的参考方向的梯度方向并且根据所计算的梯度方向获得网格的梯度方向直方图;特征构造部分,用于将所有网格的梯度方向直方图连接成总直方图向量,其中, 每对相邻极线限定的网格的梯度方向直方图的连接顺序相同,并且,特征构造部分对总直方图向量进行傅立叶变换,以得到图像的特征向量;以及分类器生成部分,用于基于所得到的特征向量生成分类器。本发明的另一个实施例是一种生成分类器的方法,包括在以图像中的特定点为极点的极坐标系中,用多条极线和以极点为圆心的多个圆划分网格,其中,网格是相邻极线与相邻圆或相邻极线与圆中的最小圆所限定的区域,极线的条数和圆的个数为常数,并且, 圆中最大圆的半径大于等于图像中的前景图像的像素与特定点之间的最大距离;针对每个网格,至少计算前景图像中轮廓像素的相对于网格的参考方向的梯度方向并且根据所计算的梯度方向获得网格的梯度方向直方图;将所有网格的梯度方向直方图连接成总直方图向量,其中,每对相邻极线限定的网格的梯度方向直方图的连接顺序相同,并且,对总直方图向量进行傅立叶变换,以得到图像的特征向量;以及基于所得到的特征向量生成分类器。利用本发明,通过网格划分和在每个网格中的信息提取来将对象内容的空间分布转换为由网格划分得到的特征,并将局部统计信息整合为图像特征。除此之外,还实现了对象检测的特征描述子的旋转不变性。


参照下面结合附图对本发明实施例的说明,会更加容易地理解本发明的以上和其它目的、特点和优点。在附图中,相同的或对应的技术特征或部件将采用相同或对应的附图标记来表示。在附图中不必依照比例绘制出单元的尺寸和相对位置。图1是示出根据本发明一个实施例的对象检测装置的结构的框图。图2是示出根据本发明一个实施例的对象检测方法的流程图。图3是示出根据本发明一个实施例的分类器生成装置的结构的框图。图4是示出根据本发明一个实施例的分类器生成方法的流程图。图5是示出根据本发明一个实施例的基于前景图像的轮廓获得图像的特征向量的过程的流程图。图6是示出根据本发明一个实施例的基于前景图像所有内容获得图像的特征向量的过程的流程图。图7是说明如何均勻划分网格以及基于轮廓像素非均勻划分网格的示意图。图8是说明如何均勻划分网格以及基于前景图像上全部像素非均勻划分网格的示意图。图9是说明梯度方向总直方图连接顺序的图。图10是说明如何通过距离变换得到非轮廓像素的梯度方向的示意图。图11是示出实现本发明实施例的计算机的示例性结构的框图。
具体实施例方式下面参照附图来说明本发明的实施例。应当注意,为了清楚的目的,附图和说明中省略了与本发明无关的、本领域技术人员已知的部件和处理的表示和描述。图1是示出根据本发明一个实施例的对象检测装置的结构框图。如图1所示,对象检测装置100包括网格划分部分101、梯度方向直方图获得部分102、特征构造部分103 以及对象检测部分104。该对象检测装置进行检测所采用的分类器以及该分类器的训练过程将在后文中进行说明。当对象检测装置100接收到待检测的图像时,由网格划分部分101针对待检测图像划分网格。为了保证图像特征提取的旋转不变性,该划分在极坐标系中进行。选择待检测图像中的特定点作为该极坐标系的极点。该特定点可以是任意的。在某些实施例中,示例性而非限制地,可以采用待检测图像中的前景图像的重心或者几何中心作为该坐标系的极点。下面说明前景图像的几何中心和重心的概念。设对于任一前景图像和特定的直角坐标系,该前景图像的几何中心为(,^iniL-),其中^-和^^是前景图像
在该特定直角坐标系上的最小横坐标和最小纵坐标,Xfflax和ymax是前景图像在该特定直角坐标系上的最大横坐标和最大纵坐标。
QQ而该前景图像的重心为()其中,Q为前景图像中像素的数目,(Xi,
β ‘ β ‘
Yi)为前景图像中第i个像素Pi的坐标。恰当的极点选择可以带来图像检测的平移不变性。参考图8,图8的(a)中所示的黑色部分是待检测图像的前景图像。在使用图8所描述的实施例中,如图8的(b)和(c)所示,极坐标系的极点选择为前景图像的几何中心。在确定极点后,以多条从极点发射的射线(下文中称为“极线”)以及多个以极点为圆心的圆划分网格。所谓网格,即两条相邻极线与两个相邻圆或者两条相邻极线与该多个同心圆中的最小圆共同限定的区域。就特定的分类器而言,对于不同的样本图像,用于划分网格的极线的条数和圆的个数分别为常数。极线条数和圆的个数的确定取决于特定分类器的具体要求,通常考虑图像检测准确度和对噪声的鲁棒性来确定。大体来说,网格划分越精细,即极线条数和圆的个数越多,图像检测准确度越高,但当达到或超过一定阈值时,检测准确性受噪声干扰的影响将变得不可接受。在一些实施例中,所采用的角度方向的划分(如12个)比径向方向的划分(如4 至8个)要多。也就是说,用于划分的极线的数目多于以极点为中心的圆的数目。以极点为圆心的圆中的最大圆的半径可以根据前景图像的像素与极点的最大距离来确定。虽然在图7和图8中只示出了最大圆的半径等于前景图像的像素与极点的最大距离的实施例,然而,本领域技术人员可以明白该最大圆半径的选取只要满足使得能够对所确定的前景图像进行全面分析,即网格能够覆盖前景图像的所有像素即可。因此,该最大圆的半径也可以大于待检测的图像中的前景图像的像素与极点之间的最大距离。关于前景图像的确定,可以使用本领域公知的各种方法。需要注意的是在确定出前景图像之后,使用本申请公开的方法进行网格划分之前,在某些实施例中,出于突出主体的目的,将使用已有方法确定出的前景图像中某些异常突起的部分作为噪声排除在要进行网格划分的前景图像之外,来确定多个圆中最大圆的半径。针对这种实施例,“要进行网格划分的前景图像”是进行了上述排除之后的前景图像。下面说明这种排除的具体实现的例子。例如,以图像的重心(此处必须是重心,不能是中心)为极点,在极坐标系中建立同心圆的划分。一般来说,同心圆的距离相等,即同心圆的半径构成等差序列。然后,统计相邻同心圆之间的圆环中图像的像素的数目。最后, 从最大的同心圆圆环开始,如果连续几个圆环中的像素数目都比较少,则认为这几个圆环对应的图像属于“异常突起或噪声”,于是,将这部分图像从前景图像中排除。下面参考图7和图8进一步说明网格划分部分101进行的网格划分的具体示例。 在不同的实施例中,可以采用不同的网格划分方式,大致分为均勻划分和非均勻划分方式。其中,均勻划分是指用于划分网格的圆中相邻圆之间的径向距离等于最小圆的半径, 并且相邻极线之间的夹角相等。非均勻划分是指使得相邻圆之间所限定的以及最小圆所限定的前景图像上的像素或轮廓像素的数目相等,并且使得相邻极线之间所限定的前景图像上的像素或轮廓像素的数目相等的划分方式。可见,非均勻划分方式可分为基于前景图像上的全部像素的划分和基于前景图像上的轮廓像素的划分。下面将逐个说明这几种方式。图7是说明如何均勻划分网格以及基于轮廓像素非均勻划分网格的示意图。图8 是说明如何均勻划分网格以及基于前景图像上全部像素非均勻划分网格的示意图。图7和图8的(a)中各自示出了从待检测图像中确定出的前景图像(黑色部分)。 图7的(b)和(c)示出该前景图像的轮廓部分。图8的(b)和(c)示出该前景图像的全部内容。在图7和图8的(b)中,各自示出了以均勻划分的方式划分网格的实施例。在这两个实施例中,网格划分部分101都使用4条极线和4个以极点为圆心的圆对前景图像进行划分。从图中可以直观地看到4条极线两两之间的夹角相等(90° ),并且相邻圆之间的径向距离等于4个圆中最小圆的半径。采用均勻划分方式,使得对对象的检测过程更简单且计算量较小。图7的(c)中示出了基于前景图像上的轮廓像素的数目进行非均勻划分的示例。 所述的非均勻是指几何空间上可能出现的不均勻,如图7的(c)所示。在该实施例中,网格划分部分101确定圆和极线,使得相邻圆之间所限定的以及最小圆内限定的前景图像上的轮廓像素的数目相等,并且相邻极线之间所限定的轮廓像素的数目相等。例如,该示例中,最小圆内所限定的轮廓像素的数目等于最小圆与第二小的圆所限定圆环内的轮廓像素的数目,等于第二小的圆与第三小的圆(即第二大的圆)所限定圆环内的轮廓像素的数目,并等于第二大的圆与最大圆所限定圆环内的轮廓像素的数目。同时,图7的(c)中所示4条极线中两两相邻的两条极线所限定的区域内的前景图像轮廓像素的数目相等。图8的(c)中示出了基于前景图像上的全部像素的数目进行非均勻划分的示例。 在该示例中,网格划分部分101确定圆和极线,使得相邻圆之间所限定的以及最小圆所限定的前景图像上的像素的数目相等,并且相邻极线之间所限定的前景图像上的像素的数目相等。例如,该实施例中,最小圆内所限定的前景图像像素的数目等于最小圆与第二小的圆所限定的圆环内的前景图像像素的数目,等于第二小的圆与第三小的圆(即第二大的圆)所限定圆环内的前景图像像素的数目,并等于第二大的圆与最大圆所限定圆环内的前景图像像素的数目。同时,图8的(c)中所示4条极线中两两相邻的两条极线所限定的区域内的前景图像像素的数目相等。在对待检测图像进行网格划分后,针对由网格划分部分101划分的每个网格,梯度方向直方图获得部分102进行计算以获得每个网格的梯度方向直方图。为了得到每个网格的梯度方向直方图,梯度方向直方图获得部分102计算前景图像上轮廓像素或前景图像中所有像素的相对于网格的参考方向的梯度方向。像素相对于网格的参考方向的梯度方向例如可以通过该像素的梯度方向与该网格的参考方向的夹角来获得。然后,梯度方向直方图获得部分102根据所计算的梯度方向获得每个网格的梯度方向直方图。首先,说明网格参考方向的概念。为了便于说明,设给定一个网格Cij,其中i = 1,. . .,M,j = 1,. . . N分别表示角度方向和径向网格个数。假设限定该网格Cij的两条极线的极角分别是Qi* ei+1。则在一个实施例中,参考图7,代表该网格Cu的参考方向的X方向的反向延长线穿过极点,并且,该χ方向与极轴所成的极角是θχ= (θ +θ +1)/2ο换句话说,该网格的参考方向经过极点并且均分限定该网格的两个相邻极线的夹角。但可选择的网格的参考方向不限于此,参考方向χ既可以均分限定该网格的两条相邻极线的夹角, 也可以不均分相邻极线的夹角,诸如以1 2或2 3等任意比例分割该夹角。对于所划分的网格中的每个网格,可以基于相同的准则来确定参考方向。网格参考方向的确定规则可以是预先指定的。在不同的实施例中,梯度方向直方图获得部分102可以只计算前景图像中的轮廓像素相对于网格参考方向的梯度方向,也可以计算前景图像中所有像素相对于网格参考方向的梯度方向。相比较而言,计算前景图像中所有像素相对于网格参考方向的梯度方向增加了计算量,但带来了相对更准确的检测效果。在只计算前景图像中的轮廓像素相对于网格参考方向的梯度方向的一个实施例中,梯度方向直方图获得部分102计算网格中轮廓像素的梯度方向,并针对该网格的参考方向进行转换,得到轮廓像素相对于该参考方向的梯度方向。轮廓像素梯度方向的计算方法可以使用本领域中已知的各种方法。在得到该网格中轮廓像素相对于参考方向的梯度方向后,将该网格中的轮廓像素按方向划分到k个区间(bin)中,即生成k-bin的方向直方图。在计算前景图像中的所有像素相对于网格参考方向的梯度方向的实施例中,在得到轮廓像素的梯度方向之后,通过到轮廓像素的距离变换来获得非轮廓像素的梯度方向。 具体来说,首先,以轮廓像素为边界像素计算整个连通域的距离变换。距离变换以后,就可以为连通域内部的每个像素(即非轮廓像素)找到距离最近的轮廓像素。换句话说,连通域内部的每个像素都有至少一个对应的轮廓像素。将与非轮廓像素距离最近的轮廓像素的梯度方向作为该非轮廓像素的梯度方向。同样,在得到网格中所有前景图像上的像素相对于参考方向的梯度方向后,将该网格中的前景图像上的像素按方向划分到k个区间(bin) 中,即生成k-bin的方向直方图。距离变换的具体方法参见诸如Heinz Breu, Joseph Gil, David Kirkpatrick,以 Μ. Michael Werman ^AW "Linear Time Euclidean Distance Transform Algorithms,,。图10是说明如何通过距离变换得到非轮廓像素的梯度方向的示意图。如图10所示,闭合连通域1001是待检测图像的前景图像。其中,像素a、b和c是该前景图像上的非轮廓像素,而像素A、B以及C和C’是非轮廓像素a、b和c通过距离变换分别映射到的轮廓像素。根据上述本发明的实施例,则轮廓像素A和B的梯度方向分别作为非轮廓像素a和b的梯度方向。而由于非轮廓像素c具有两个对应的轮廓像素C和C’, 因此,择一选用轮廓像素C和C’的梯度方向作为非轮廓像素c的梯度方向。该选择可以随机进行。显然,在不同实施例中,既可以先计算轮廓像素相对于参考方向的梯度方向,再进行距离变换以获得非轮廓像素相对于参考方向的梯度方向;也可以在计算轮廓像素的梯度方向之后即进行距离变换,以得到非轮廓像素的梯度方向,然后,再统一计算轮廓像素和非轮廓像素相对于参考方向的梯度方向。在由梯度方向直方图获得部分102获得每个网格的梯度方向直方图之后,特征构造部分103将获得的所有网格的梯度方向直方图连接成MXNXk(M,角度方向划分数;N,径向划分数;k,每个网格的梯度方向直方图的区间(bin)数)的总直方图向量。需要注意的是每对相邻极线限定的网格的梯度方向直方图的连接顺序相同。现在参考图9说明总直方图的连接顺序。图9是说明梯度方向总直方图连接顺序的图。如上面提到的,设给定一个网格Cij,其中,i = 1,...,M,j = 1,...N分别表示角度方向和径向网格个数。在图9所示的实施例中,M = N = 4。在一个实施例中,可以先径向后角度地且按照逆时针方向进行总直方图的连接。 具体来说,连接顺序可以是 ^n ? C12 9 C13 C14 C219 C22J C23J C24,· · ·,C42 ? C43 C^o 此外,连接顺序还可以是 〇14,C13,C12 C11J C24, C23,C22,C2i ? · · ·,C44 C43,C42 ? C4^ ;或者甚至是 C12, C11J C13
C14,C22,C219 C23J C24,· · · c42 9 C41,C43 C440在另外一个实施例中,可以先径向后角度地且按照顺时针方向进行总直方图的连接。例如, Cn,C14 C12 9 C13 C419 C44 C42,C43,C3i· · · C219 c24,C22,C230 其它情况与上面类似,不再赘述。可见,只要保证每对相邻极线限定的网格(即径向方向)的梯度方向直方图的连接顺序相同,而无论是先后如何的连接顺序,都可以满足要求。上面两个实施例举出了沿角度方向顺时针、逆时针连接的情况,此外,即使在角度方向上跳行连接也可以满足要求。例
如C11J C12 ? C13 C14 C3I ? C32J C33J C34 C41,· · ·,c21,C22,C23,C240在将所有网格的梯度方向直方图连接成总直方图向量之后,特征构造部分103对该总直方图向量进行傅立叶变换,并以变换后得到的幅值作为待检测图像的特征向量。由于采用了极坐标空间和傅立叶变换,所得到的特征向量具有旋转不变性。基于所得到的特征向量,对象检测部分104采用要在下面结合图3说明的对象分类器对待检测图像中的对象进行检测。图2是示出根据本发明一个实施例的对象检测方法的流程图。以下说明的对象检测是采用后文将要结合图3说明的分类器进行的。如图2所示,在步骤S201中,针对待检测图像中的前景图像划分网格。该划分在以待检测图像中的特定点为极点的极坐标系中进行。就特定的分类器而言,对于不同的样本图像,划分网格所使用的以极点为中心的圆和极线的个数分别为常数。此外,这些圆中最大圆的半径大于等于待检测图像中前景图像的像素与极点之间的最大距离。该极点可以选用前景图像的重心或几何中心。网格的划分可以采用基于几何空间的均勻划分方法,或者基于相邻圆和相邻极线之间所限定轮廓像素数或前景像素数的非均勻划分方法。其具体实现与对检测装置的描述部分相同,此处不再进行赘述。在步骤S202中,计算每个网格中前景图像上的像素或轮廓像素相对于该网格的参考方向的梯度方向,并获得梯度方向直方图。像素相对于网格的参考方向的梯度方向例如可以通过该像素的梯度方向与该网格的参考方向的夹角来获得。网格的参考方向可以是预先确定的。该方向所在直线可以经过极点,均分或以任意比例分割限定该网格的两个极线的夹角。可以根据每个网格中轮廓像素或所有前景像素的梯度方向相对于参考方向的梯度方向获得每个网格的k-bin梯度方向直方图。在基于所有前景像素的梯度方向获得梯度方向直方图的实施例中,可以使用距离变换将非轮廓像素映射到最近的轮廓像素,并将该最近的轮廓像素的梯度方向作为该非轮廓像素的梯度方向。在步骤S203中,基于每个网格的梯度方向直方图获得总直方图,并进行傅立叶变换,从而将变换后的幅值作为待检测图像的特征向量。在将所有网格的梯度方向直方图连接为总直方图的过程中,每对相邻极线所限定的网格的梯度方向直方图的连接顺序保持相同。在步骤S204中,基于构造的特征向量,采用下面结合图3所说明的分类器,检测图像中的对象。根据本发明的实施例,还提供了一种图像分类器生成装置。图3是示出根据本发明一个实施例的分类器生成装置的结构的框图。
如图3所示,分类器生成装置300包括网格划分部分301、梯度方向直方图获得部分302、特征构造部分303以及分类器生成部分304。其中,网格划分部分301、梯度方向直方图获得部分302和特征构造部分303的功能和构造分别与图1中所示网格划分部分 101、梯度方向直方图获得部分102和特征构造部分103的相似;其区别仅在于网格划分部分301、梯度方向直方图获得部分302和特征构造部分303对一组样本图像进行特征提取,而检测装置100中的网格划分部分101、梯度方向直方图获得部分102和特征构造部分 103只对待检测图像的前景图像进行特征提取。因而,省略重复说明。在分类器生成部分304中,基于从特征构造部分303得到的多个样本图像的特征向量生成分类器。相似地,根据本发明的实施例,还提供了一种分类器生成方法。图4是示出根据本发明一个实施例的分类器生成方法的流程图。图4中所示的、为获得图像特征向量所进行的步骤S401到S403与图2中所示的步骤S201到S203中所进行的处理相似;区别在于步骤S401到S403中进行的处理是针对一组样本图像进行的。因而,省略其重复说明。在图4的步骤S404中,基于在步骤S403中得到的样本图像的特征向量,生成图像的分类器。下面结合具体实例说明从输入图像中提取图像的特征向量的处理。图5是示出根据本发明一个实施例的基于前景图像的轮廓获得图像的特征向量的过程的流程图。首先,在步骤S501中,对输入的图像进行二值化处理以及连通域分析,以确定前
景图像。 前景图像确定后,在步骤S502中,计算前景图像的轮廓像素的梯度方向。然后,进行到步骤S503。在步骤S503中,按照预先确定的网格划分规则,确定划分网格的同心圆和极线的数目,以及使用均勻划分和非均勻划分哪一种划分方式。并基于前景图像,选择网格所在极坐标系的极点,并确定同心圆中最大圆的半径。在网格划分完毕后,按照一定规则确定网格的参考方向。在确定了网格以及其参考方向后,在步骤S504中,计算轮廓像素相对于各网格参考方向的梯度方向,并得到每个网格的梯度方向直方图。然后,步骤进行到步骤S505。在步骤S505中,将每个网格的方向直方图连接为整个前景图像的总直方图向量, 并对该总直方图向量进行傅立叶变换,从而得到待检测图像的特征向量。在本实例中,该特征向量为傅立叶变换后得到的幅值。图6是示出根据本发明一个实施例的基于前景图像所有内容获得图像的特征向量的过程的流程图。图6所述实例与图5所述实例的区别在于除前景图像的轮廓像素之外,还基于前景图像的非轮廓像素获得图像的特征向量。图6中的步骤S601、S602以及步骤S603到S605与图5中的步骤S501到S505实质相同。唯一的区别是在S604中,每个网格的梯度方向直方图是基于前景图像中的轮廓像素和非轮廓像素相对于参考方向的梯度方向获得的。因此,在此省略这些步骤的详细说明。
在图6的步骤S606中,计算前景图像的非轮廓像素的梯度方向。该梯度方向可以利用距离变换来获得。详细地说,将轮廓像素作为边界像素,通过距离变换,将非轮廓像素映射到距其最近的轮廓像素,并将该轮廓像素的梯度方向作为该非轮廓像素的梯度方向。在本发明的各个实施例中,将对象内容的空间分布转换为由网格划分得到的特征,并且将局部统计信息整合为特征。更具体地,在每个网格中分别计算边缘方向直方图, 并根据所有这些直方图产生最终的特征向量。此外,提出了实现特征的仿射不变性的方案 采用极坐标系和傅立叶变换实现了对象检测的旋转不变性;在一些实施例中,采用图像的特定点诸如中心或重心提取特征,实现了对象检测的平移不变性;此外,还可以在一些实施例中,使用归一化的直方图(即直方图的和为1),实现对象检测的尺度不变性。下文中,参考图11描述实现本发明的数据处理设备的计算机的示例性结构。图11 是示出实现本发明的计算机的示例性结构的框图。在图11中,中央处理单元(CPU) 1101根据只读存储器(ROM) 1102中存储的程序或从存储部分1108加载到随机存取存储器(RAM) 1103的程序执行各种处理。在RAM 1103中, 也根据需要存储当CPU 1101执行各种处理时所需的数据。CPU 110UR0M 1102和RAM 1103经由总线1104彼此连接。输入/输出接口 1105 也连接到总线1104。下述部件连接到输入/输出接口 1105 输入部分1106,包括键盘、鼠标等;输出部分1107,包括显示器,诸如阴极射线管(CRT)、液晶显示器(LCD)等,以及扬声器等;存储部分1108,包括硬盘等;以及通信部分1109,包括网络接口卡诸如LAN卡、调制解调器等。通信部分1109经由网络诸如因特网执行通信处理。根据需要,驱动器1110也连接到输入/输出接口 1105。可拆卸介质1111诸如磁盘、光盘、磁光盘、半导体存储器等根据需要被安装在驱动器1110上,使得从中读出的计算机程序根据需要被安装到存储部分1108中。在通过软件实现上述步骤和处理的情况下,从网络诸如因特网或存储介质诸如可拆卸介质1111安装构成软件的程序。本领域的技术人员应当理解,这种存储介质不局限于图11所示的其中存储有程序、与方法相分离地分发以向用户提供程序的可拆卸介质1111。可拆卸介质1111的例子包含磁盘、光盘(包含光盘只读存储器(⑶-ROM)和数字通用盘(DVD))、磁光盘(包含迷你盘 (MD)和半导体存储器。或者,存储介质可以是ROM 1102、存储部分1108中包含的硬盘等, 其中存有程序,并且与包含它们的方法一起被分发给用户。在前面的说明书中参照特定实施例描述了本发明。然而本领域的普通技术人员理解,在不偏离如权利要求书限定的本发明的范围的前提下可以进行各种修改和改变。关于包括以上各实施例的实施方式,还公开下述附记Mid 1. 一种用于对图像中的对象进行检测的装置,包括网格划分部分,用于在以图像中的特定点为极点的极坐标系中,用多条极线和以极点为圆心的多个圆划分网格,其中,所述网格是相邻极线与相邻圆或相邻极线与圆中的最小圆所限定的区域,所述极线的条数和所述圆的个数为常数,并且,所述圆中最大圆的半径大于等于所述图像中的前景图像的像素与所述特定点之间的最大距离;
梯度方向直方图获得部分,用于针对每个网格,至少计算前景图像中轮廓像素的相对于所述网格的参考方向的梯度方向并且根据所计算的梯度方向获得所述网格的梯度方向直方图;特征构造部分,用于将所有网格的梯度方向直方图连接成总直方图向量,其中,每对相邻极线限定的网格的梯度方向直方图的连接顺序相同,并且,所述特征构造部分对所述总直方图向量进行傅立叶变换,以得到所述图像的特征向量;以及对象检测部分,用于基于所得到的特征向量对所述图像中的对象进行检测。2.根据附记1所述的装置,其中,所述梯度方向直方图获得部分还计算在所述前景图像上的非轮廓像素的梯度方向。3.根据附记2所述的装置,其中,所述梯度方向直方图获得部分将所述前景图像的非轮廓像素通过距离变换所映射到的轮廓像素的梯度方向作为所述非轮廓像素的梯度方向。4.根据附记1到3中任一个所述的装置,其中,所述相邻圆之间的径向距离等于所述圆中最小圆的半径,并且所述相邻极线之间的夹角相等。5.根据附记1到3中任一个所述的装置,其中,所述网格划分部分确定所述圆和极线,使得相邻圆之间所限定的以及所述最小圆所限定的前景图像上的像素或轮廓像素的数目相等,并且使得所述相邻极线之间所限定的前景图像上的像素或轮廓像素的数目相等。6.根据附记1到3中任一个所述的装置,其中,所述特定点是所述前景图像的几何中心或重心。7.根据附记1到3中任一个所述的装置,其中,所述网格的所述参考方向经过所述特定点并且均分限定所述网格的两个极线的夹角。8. 一种对图像中的对象进行检测的方法,包括在以图像中的特定点为极点的极坐标系中,用多条极线和以极点为圆心的多个圆划分网格,其中,所述网格是相邻极线与相邻圆或相邻极线与圆中的最小圆所限定的区域, 所述极线的条数和所述圆的个数为常数,并且,所述圆中最大圆的半径大于等于所述图像中的前景图像的像素与所述特定点之间的最大距离;针对每个网格,至少计算前景图像中轮廓像素的相对于所述网格的参考方向的梯度方向并且根据所计算的梯度方向获得所述网格的梯度方向直方图;将所有网格的梯度方向直方图连接成总直方图向量,其中,每对相邻极线限定的网格的梯度方向直方图的连接顺序相同,并且,对所述总直方图向量进行傅立叶变换,以得到所述图像的特征向量;以及基于所得到的特征向量对所述图像中的对象进行检测。9.根据附记8所述的方法,其中,所述计算还包括计算在所述前景图像上的非轮廓像素的梯度方向。10.根据附记9所述的方法,其中,所述计算还包括将所述前景图像的非轮廓像素通过距离变换所映射到的轮廓像素的梯度方向作为所述非轮廓像素的梯度方向。11.根据附记8到10中任一个所述的方法,其中,所述相邻圆之间的径向距离等于所述圆中最小圆的半径,并且所述相邻极线之间的夹角相等。12.根据附记8到10中任一个所述的方法,其中,所述划分包括确定所述圆和极线,使得相邻圆之间所限定的以及所述最小圆所限定的前景图像上的像素或轮廓像素的数目相等,并且使得所述相邻极线之间所限定的前景图像上的像素或轮廓像素的数目相等。13.根据附记8到10中任一个所述的方法,其中,所述特定点是所述前景图像的几何中心或重心。14.根据附记8到10中任一个所述的方法,其中,所述网格的所述参考方向经过所述特定点并且均分限定所述网格的两个极线的夹角。15. 一种用于生成分类器的装置,包括网格划分部分,用于在以图像中的特定点为极点的极坐标系中,用多条极线和以极点为圆心的多个圆划分网格,其中,所述网格是相邻极线与相邻圆或相邻极线与圆中的最小圆所限定的区域,所述极线的条数和所述圆的个数为常数,并且,所述圆中最大圆的半径大于等于所述图像中的前景图像的像素与所述特定点之间的最大距离;梯度方向直方图获得部分,用于针对每个网格,至少计算前景图像中轮廓像素的相对于所述网格的参考方向的梯度方向并且根据所计算的梯度方向获得所述网格的梯度方向直方图;特征构造部分,用于将所有网格的梯度方向直方图连接成总直方图向量,其中,每对相邻极线限定的网格的梯度方向直方图的连接顺序相同,并且,所述特征构造部分对所述总直方图向量进行傅立叶变换,以得到所述图像的特征向量;以及分类器生成部分,用于基于所得到的特征向量生成分类器。16.根据附记15所述的装置,其中,所述梯度方向直方图获得部分还计算在所述前景图像上的非轮廓像素的梯度方向。17.根据附记16所述的装置,其中,所述梯度方向直方图获得部分将所述前景图像的非轮廓像素通过距离变换所映射到的轮廓像素的梯度方向作为所述非轮廓像素的梯度方向。18.根据附记15到17中任一个所述的装置,其中,所述相邻圆之间的径向距离等于所述圆中最小圆的半径,并且所述相邻极线之间的夹角相等。19.根据附记15到17中任一个所述的装置,其中,所述网格划分部分确定所述圆和极线,使得相邻圆之间所限定的以及所述最小圆所限定的前景图像上的像素或轮廓像素的数目相等,并且使得所述相邻极线之间所限定的前景图像上的像素或轮廓像素的数目相寸。20.根据附记15到17中任一个所述的装置,其中,所述特定点是所述前景图像的几何中心或重心。21.根据附记15到17中任一个所述的装置,其中,所述网格的所述参考方向经过所述特定点并且均分限定所述网格的两个极线的夹角。22. 一种生成分类器的方法,包括在以图像中的特定点为极点的极坐标系中,用多条极线和以极点为圆心的多个圆划分网格,其中,所述网格是相邻极线与相邻圆或相邻极线与圆中的最小圆所限定的区域, 所述极线的条数和所述圆的个数为常数,并且,所述圆中最大圆的半径大于等于所述图像中的前景图像的像素与所述特定点之间的最大距离;针对每个网格,至少计算前景图像中轮廓像素的相对于所述网格的参考方向的梯度方向并且根据所计算的梯度方向获得所述网格的梯度方向直方图;将所有网格的梯度方向直方图连接成总直方图向量,其中,每对相邻极线限定的网格的梯度方向直方图的连接顺序相同,并且,对所述总直方图向量进行傅立叶变换,以得到所述图像的特征向量;以及基于所得到的特征向量生成分类器。23.根据附记22所述的方法,其中,所述计算还包括计算在所述前景图像上的非轮廓像素的梯度方向。24.根据附记23所述的方法,其中,所述计算还包括将所述前景图像的非轮廓像素通过距离变换所映射到的轮廓像素的梯度方向作为所述非轮廓像素的梯度方向。25.根据附记22到M中任一个所述的方法,其中,所述相邻圆之间的径向距离等于所述圆中最小圆的半径,并且所述相邻极线之间的夹角相等。26.根据附记22到M中任一个所述的方法,其中,所述划分包括确定所述圆和极线,使得相邻圆之间所限定的以及所述最小圆所限定的前景图像上的像素或轮廓像素的数目相等,并且使得所述相邻极线之间所限定的前景图像上的像素或轮廓像素的数目相等。27.根据附记22到M中任一个所述的方法,其中,所述特定点是所述前景图像的几何中心或重心。28.根据附记22到M中任一个所述的方法,其中,所述网格的所述参考方向经过所述特定点并且均分限定所述网格的两个极线的夹角。
权利要求
1.一种用于对图像中的对象进行检测的装置,包括网格划分部分,用于在以图像中的特定点为极点的极坐标系中,用多条极线和以极点为圆心的多个圆划分网格,其中,所述网格是相邻极线与相邻圆或相邻极线与圆中的最小圆所限定的区域,所述极线的条数和所述圆的个数为常数,并且,所述圆中最大圆的半径大于等于所述图像中的前景图像的像素与所述特定点之间的最大距离;梯度方向直方图获得部分,用于针对每个网格,至少计算前景图像中轮廓像素的相对于所述网格的参考方向的梯度方向并且根据所计算的梯度方向获得所述网格的梯度方向直方图;特征构造部分,用于将所有网格的梯度方向直方图连接成总直方图向量,其中,每对相邻极线限定的网格的梯度方向直方图的连接顺序相同,并且,所述特征构造部分对所述总直方图向量进行傅立叶变换,以得到所述图像的特征向量;以及对象检测部分,用于基于所得到的特征向量对所述图像中的对象进行检测。
2.根据权利要求1所述的装置,其中,所述梯度方向直方图获得部分还计算在所述前景图像上的非轮廓像素的梯度方向。
3.根据权利要求2所述的装置,其中,所述梯度方向直方图获得部分将所述前景图像的非轮廓像素通过距离变换所映射到的轮廓像素的梯度方向作为所述非轮廓像素的梯度方向。
4.根据权利要求1到3中任一个所述的装置,其中,所述相邻圆之间的径向距离等于所述圆中最小圆的半径,并且所述相邻极线之间的夹角相等。
5.根据权利要求1到3中任一个所述的装置,其中,所述网格划分部分确定所述圆和极线,使得相邻圆之间所限定的以及所述最小圆所限定的前景图像上的像素或轮廓像素的数目相等,并且使得所述相邻极线之间所限定的前景图像上的像素或轮廓像素的数目相等。
6.根据权利要求1到3中任一个所述的装置,其中,所述特定点是所述前景图像的几何中心或重心。
7.根据权利要求1到3中任一个所述的装置,其中,所述网格的所述参考方向经过所述特定点并且均分限定所述网格的两个极线的夹角。
8.一种对图像中的对象进行检测的方法,包括在以图像中的特定点为极点的极坐标系中,用多条极线和以极点为圆心的多个圆划分网格,其中,所述网格是相邻极线与相邻圆或相邻极线与圆中的最小圆所限定的区域,所述极线的条数和所述圆的个数为常数,并且,所述圆中最大圆的半径大于等于所述图像中的前景图像的像素与所述特定点之间的最大距离;针对每个网格,至少计算前景图像中轮廓像素的相对于所述网格的参考方向的梯度方向并且根据所计算的梯度方向获得所述网格的梯度方向直方图;将所有网格的梯度方向直方图连接成总直方图向量,其中,每对相邻极线限定的网格的梯度方向直方图的连接顺序相同,并且,对所述总直方图向量进行傅立叶变换,以得到所述图像的特征向量;以及基于所得到的特征向量对所述图像中的对象进行检测。
9.一种用于生成分类器的装置,包括网格划分部分,用于在以图像中的特定点为极点的极坐标系中,用多条极线和以极点为圆心的多个圆划分网格,其中,所述网格是相邻极线与相邻圆或相邻极线与圆中的最小圆所限定的区域,所述极线的条数和所述圆的个数为常数,并且,所述圆中最大圆的半径大于等于所述图像中的前景图像的像素与所述特定点之间的最大距离;梯度方向直方图获得部分,用于针对每个网格,至少计算前景图像中轮廓像素的相对于所述网格的参考方向的梯度方向并且根据所计算的梯度方向获得所述网格的梯度方向直方图;特征构造部分,用于将所有网格的梯度方向直方图连接成总直方图向量,其中,每对相邻极线限定的网格的梯度方向直方图的连接顺序相同,并且,所述特征构造部分对所述总直方图向量进行傅立叶变换,以得到所述图像的特征向量;以及分类器生成部分,用于基于所得到的特征向量生成分类器。
10. 一种生成分类器的方法,包括在以图像中的特定点为极点的极坐标系中,用多条极线和以极点为圆心的多个圆划分网格,其中,所述网格是相邻极线与相邻圆或相邻极线与圆中的最小圆所限定的区域,所述极线的条数和所述圆的个数为常数,并且,所述圆中最大圆的半径大于等于所述图像中的前景图像的像素与所述特定点之间的最大距离;针对每个网格,至少计算前景图像中轮廓像素的相对于所述网格的参考方向的梯度方向并且根据所计算的梯度方向获得所述网格的梯度方向直方图;将所有网格的梯度方向直方图连接成总直方图向量,其中,每对相邻极线限定的网格的梯度方向直方图的连接顺序相同,并且,对所述总直方图向量进行傅立叶变换,以得到所述图像的特征向量;以及基于所得到的特征向量生成分类器。
全文摘要
检测图像中的对象的装置和方法和分类器生成装置和方法。对图像中的对象进行检测的方法包括在以图像中的特定点为极点的极坐标系中,用多条极线和以极点为圆心的多个圆划分网格,网格是相邻极线与相邻圆或与最小圆限定的区域,极线的条数和圆的个数为常数,最大圆的半径大于等于前景图像的像素与特定点之间的最大距离;针对每个网格,至少计算前景图像中轮廓像素相对于网格的参考方向的梯度方向并且根据梯度方向获得网格的梯度方向直方图;将所有网格的梯度方向直方图连接成总直方图向量,每对相邻极线限定的网格的梯度方向直方图的连接顺序相同,对总直方图向量进行傅立叶变换,以得到图像的特征向量;基于该特征向量对图像中的对象进行检测。
文档编号G06T7/00GK102376087SQ201010257560
公开日2012年3月14日 申请日期2010年8月17日 优先权日2010年8月17日
发明者上原祐介, 于浩, 刘汝杰, 增本大器, 王月红 申请人:富士通株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1