一种基于图像轮廓特征的目标识别方法与流程

文档序号:11432765阅读:385来源:国知局
一种基于图像轮廓特征的目标识别方法与流程

本发明涉及机器视觉与模式识别技术领域,更具体地,涉及一种基于图像轮廓特征的目标识别方法。



背景技术:

当前目标识别的方法可以分为三类:基于表象特征的方法、基于形状特征的方法、基于表象和形状特征相结合的方法。基于形状特征的目标识别方法是当前研究的一个热点,近些年来取得了显著的进展。从传统的基于傅里叶变换或不变矩等方法,发展为当前大多属于基于轮廓和骨架两种形状描述子的形状匹配方法。相对于点集,轮廓具有更加丰富的信息,且轮廓不容易受到光照、物体颜色和纹理变化的影响,最重要的是能够有效的描述大尺度范围的物体结构。

近些年来很多基于轮廓的目标检测和识别方法被提出,其中主要包含两大步骤:提取轮廓的描述子和描述子之间的相似度计算。基于这两点,国内外的学者对此进行了深入的研究。2012年leedj等人提出的一种高效的虾的形状分析方法的研究,该文中是选取轮廓转角特征来对物体图像进行分类识别,为了实现旋转不变性转弯角度,计算了转角的互相关函数和参考函数,对于每一类的虾的样本图,得到一个统一的模型,以匹配基于物体形状识别的数据库中的轮廓。

2014年xinggangwang等人在中提出一种基于轮廓片段集形状鲁棒性分类,该文提出的是一个紧凑的形状表示,即轮廓片段,在形状的表示过程中,首先使用离散曲线演化方法(dce)使每个形状的oueter轮廓分解为凸轮廓片段,然后用上下文特征对每一段轮廓特征进行描述并且使用局部约束线性编码(llc)的方法把它们编成形状码,最后利用空间金字塔匹配(spm)的形状识别。2002年belongie等人在中提出一种基于形状上下文的形状描述子,它允许用于测量形状和发现之间的相似性点集对应。这背后的基本想法方法是通过一个有限子集来捕获对象的形状对象的内部或外部轮廓上的点。然后求在对数极坐标中求出每个点表示的上下文直方图,最后采用成本矩阵检验统计量之间产生的关系,试图找到最佳的点之间的匹配集,最大限度地减少总成本。此方法已成功用于形状匹配和识别。

然而,上述方法均未能找到一种对轮廓简单有效的描述,以解决在轮廓匹配过程中的旋转不变性的问题。



技术实现要素:

针对现有技术存在的问题,本发明的主要目的在于提供一种在匹配过程中旋转不变的基于图像轮廓特征的目标识别方法。

为解决上述技术问题,本发明的技术方案如下:

一种基于图像轮廓特征的目标识别方法,包括以下步骤:

s1:图像二值化:对待测物体图像和若干的模板图像进行预处理生成二值化图像,所述模板图像为确定物体的图像,所述待测物体图像为待测物体的图像;

s2:建立模板轮廓的特征库:提取二值化模板图像中物体的完整轮廓,在轮廓上等间隔取若干数目的特征点,利用特征点的上下文特征对物体轮廓进行描述;

s3:待测图像特征描述:提取二值化待测物体图像的轮廓边缘,在轮廓上选取若干的特征点;对待测物体的形状方向进行转换变成模板的取向;用选定的特征点的上下文特征描述转换取向后的待测物体轮廓;

s4:对待测物体图像的特征描述与模板图像中物体轮廓的特征描述进行匹配,通过匹配代价来衡量待测物体与模板物体的相似度,进而识别待测物体。

在一种优选的技术方案中,步骤s1中,具体包括:用颜色分割算法对图像进行分割,但是对于背景颜色一致的采用简单的阈值处理办法。

在一种优选的技术方案中,步骤s2中,具体包括以下步骤:

s2.1:提取二值化模板图像中物体的完整轮廓;

s2.2:对二值化模板图像中物体的完整轮廓进行等间隔取样,选取一定数目的轮廓点,即特征点;

s2.3:对选取的轮廓点用上下文的特征进行描述。

在一种优选的技术方案中,步骤s2.3中,对选取轮廓上的点用上下文的特征进行描述,包括以下步骤:

a)对于一幅二值图像,黑点表示字符,白点表示空白,这样就可以用黑点集合来表示一幅图像,即一幅图像可以表示为集合p={p1,p2,p3,...,pn};

b)计算形状轮廓点的上下文特征:

对于整个特征点集p,分别以其中的每个特征点p1,p2,p3,...,pn作参考点,依次计算该点与其余的n-1个点构成的向量分布直方图,最终得到n个向量分布直方图,并以n*(n-1)大小的矩阵存储;这样,对于任一目标,可用n*(n-1)大小的矩阵表示其形状信息,n*(n-1)大小的矩阵即为点集p的形状上下文,它描述了整个轮廓形状的特征;由于描述信息量太大,所以采用极坐标系,将向量的极半径和极角离散化的在空间具体分布描述出来,并且使越临近pi的点权值越大;

三角形包围的点的为极坐标的中心,对于每一个由r和θ确定的极坐标区域,如果该区域内包含的点越多,则其在由θ和log(r)组成的直角坐标系中对应的区域颜色越深点;

以特征点集中任意一点pi为参考点,在pi为圆心、r为半径的局域内按对数距离间隔建立n个同心圆;将此区域沿圆周方向m等分,点pi到其它各点的向量相对位置简化为模板上各扇区内的点分布数。

在一种优选的技术方案中,步骤s3中,具体包括以下步骤:

s3.1:提取待测物体二值图像的完整轮廓;

s3.2:对待测物体轮廓上的点进行等间隔取样,选取与s2.2当中相同数目的轮廓点,即特征点;

s3.3:对待测物体的形状方向进行转换,使之与模板图像的取向相同;

s3.4:对转换后的待测物体上的轮廓点选取上下文的特征,从而形成对轮廓整体的描述。

在一种优选的技术方案中,步骤s3.3中,为了解决旋转不变性,对当中等间隔选取的m个轮廓点所组成的查询形状采用最佳拟合椭圆模型的方法用于标准化其尺度和取向。

在一种优选的技术方案中,步骤s4中,具体包括以下步骤:

s4.1:分别计算模板物体上每一个点和待测物体任意一点的形状匹配代价;

s4.2:通过匹配代价把对应的点转成二分图最大匹配问题,二分图采用匈牙利算法来解决,进而得到模板物体与待测物体特征点的最优匹配;

s4.3:用薄板样条变换模型来模拟待测物体相对模板物体的形变;

s4.4:计算模板物体与待测物体形状距离,通过两者之间的形状距离衡量模板图像与待测图像的形状相似性,进而识别待测物体。

在一种优选的技术方案中,步骤s4.1中,分别计算模板物体上每一个点和待测物体任意一点的形状匹配代价,计算代价矩阵代价值cost:计算一个目标的形状直方图与另一目标的形状直方图之间的匹配代价,设pi为模板图像上轮廓特征点,而qj是待测物体图像上轮廓点,计算每个样本点之间的差别,即形状上下文的差别。

在一种优选的技术方案中,步骤s4.2中,通过匹配代价把对应的点转成二分图最大匹配问题,二分图采用匈牙利算法来解决,进而得到模板物体与待测物体的最优匹配,然后,基于计算得到的代价矩阵c,进行点的匹配操作,使最优匹配获得最小值。

与现有技术相比,本发明技术方案的有益效果是:本发明公开一种基于图像轮廓特征的目标识别方法,对模板图像和待测物体图像进行预处理生成二值图像;建立物体模板轮廓的特征库:提取物体模板二值图像的完整轮廓,在轮廓上等间隔取一定数目的特征点,利用特征点的上下文特征对物体轮廓进行描述;对待检测物体图像进行目标识别:提取待检测二值图像的轮廓边缘;并选取一定的特征点;对待测物体的形状方向进行转换变成模板的取向;用选定点的上下文特征描述转换取向后的待测物体轮廓;通过匹配代价来衡量待测物体与模板物体的相似度。本发明相对于现有的技术,解决了在轮廓匹配过程中的旋转不变性的问题,使轮廓匹配过程中的旋转具有不变性,并有效的应用于图像中的目标识别。

附图说明

图1为本发明的基于轮廓特征的目标识别方法的流程图。

图2为本发明的对物体进行上下文特征提取的点的直方图。

图3为本发明的物体原图及点集构成的向量图。

图4为本发明的物体最佳拟合椭圆模型方法的椭圆图。

图5为尺度和旋转不变性变换方法举例图。

具体实施方式

下面结合附图和实施例对本发明的技术方案做进一步的说明。

实施例1

如图1所示,一种基于图像轮廓特征的目标识别方法,包括以下步骤:

s1:图像二值化:对待测物体图像和若干的模板图像进行预处理生成二值化图像,所述模板图像为确定物体的图像,所述待测物体图像为待测物体的图像;

s2:建立模板轮廓的特征库:提取二值化模板图像中物体的完整轮廓,在轮廓上等间隔取若干数目的特征点,利用特征点的上下文特征对物体轮廓进行描述;

s3:待测图像特征描述:提取二值化待测物体图像的轮廓边缘,在轮廓上选取若干的特征点;对待测物体的形状方向进行转换变成模板的取向;用选定的特征点的上下文特征描述转换取向后的待测物体轮廓;

s4:对待测物体图像的特征描述与模板图像中物体轮廓的特征描述进行匹配,通过匹配代价来衡量待测物体与模板物体的相似度,进而识别待测物体。

其中步骤s1对模板图像和待测物体图像进行预处理生成二值图像包括如下步骤:

可以用颜色分割算法对图像进行分割,其中包括直方图阈值,特征空间聚类,边缘检测,模糊集和神经网络,但是对于背景颜色一致的可以采用简单的阈值处理办法,hsv(色相、饱和度和价值)是常见的选择的颜色空间颜色分割和转换从rgb到hsv是一个简单的过程。可以通过阈值的选定来对图像进行分割处理,进而得到二值图。

其中步骤s2如下步骤s2.1-s2.3:

s2.1:提取物体模板的二值图像的完整轮廓边缘;

s2.2:对模板物体完整轮廓上提取特征点进行等间隔取样,选取一定数目的轮廓点;

s2.3:对选取轮廓上的点用上下文的特征进行描述。

其中步骤s3包括如下步骤s3.1-s3.4:

s3.1:提取待测物体二值图像的完整轮廓边缘;

s3.2:对待测物体轮廓上的点进行等间隔取样,选取与s2.2当中相同数目的轮廓点;

s3.3:对待测物体的形状方向进行转换,使之与模板方向的取向相同;

s3.4:对转换后的待测物体上的轮廓点选取上下文特征,从而形成对轮廓整体的描述。

其中步骤s4包括如下步骤s4.1-s4.4:

s4.1:分别计算模板物体上每一个点和待测物体任意一点的形状匹配代价;

s4.2:通过匹配代价把对应的点转成二分图最大匹配问题,二分图采用匈牙利算法来解决,进而得到最优匹配;

s4.3:薄板样条(tps)变换模型来模拟待测物体相对模板物体的形变;

s4.4:计算模板物体与待测物体形状的距离,通过两者之间的距离衡量模板图像与待测图像的形状相似度。

步骤s1.1中用颜色分割算法对图像进行分割,其中包括直方图阈值,特征空间聚类,边缘检测,模糊集和神经网络,但是对于背景颜色一致的可以采用简单的阈值处理办法。hsv(色相、饱和度和价值)是常见的选择的颜色空间,颜色分割和转换从rgb到hsv是一个简单的过程。可以通过阈值的选定来对图像进行分割处理,进而得到二值图。

步骤s2.1利用八邻域法追踪法提取物体的完整轮廓,轮廓的结果表示为s={pi;i=1,2,3,...,n},其中s表示模板的完整轮廓,pi表示像素点,n表示轮廓点的个数。

步骤s2.1对模板物体完整轮廓上提取特征点进行等间隔取样,选取一定数目的轮廓点。包括如下步骤:图像轮廓提取的完整轮廓点集p={p1,p2,p3,...,pn},选取轮廓点的数目为m,用总轮廓点数n除以所需要的点的数量m,可以得到取样的距离l=n/m,即每隔l个点选取一个点,轮廓上的起始点可以是任意的。最后用得到的m个点对物体轮廓进行描述,m值越大,位置信息就越精确,描述出的形状也越准确,但由于每个特征点均需使用下文所述的特征描述,计算量过高而不利于实现,因此,本方法采用等间隔取点的方式实现对物体轮廓形状的有效描述。

步骤s2.3对选取轮廓上的点用上下文的特征进行描述。包括如下步骤:

a)对于一幅二值图像,黑点表示字符,白点表示空白,这样我们就可以用黑点集合来表示一幅图像,即一幅图像可以表示为集合p={p1,p2,p3,...,pn},图2中(a)(b)展示了图像上的点的例子。我们取了这两幅图像上的三个点a,b,c,然后用对数极坐标来重新表示这三个点,就得到了图2(d)(e)(f)。

b)计算形状轮廓点的上下文特征。

对于整个点集p,分别以其n个点p1,p2,p3,...,pn作参考点,依次计算与剩下的n-1个点构成的形状直方图,最终得到n个形状直方图。以n*(n-1)大小的矩阵存储。这样,对于任一目标,可用n*(n-1)大小的矩阵表示其形状信息,n*(n-1)大小的矩阵就是点集p的形状上下文,它描述了整个轮廓形状的特征。如字母b,由于描述信息量太大,所以采用极坐标系,将向量的极半径和极角离散化的在空间具体分布描述出来,并且使越临近pi的点权值越大

图2中(b)的菱形或者(a)中圆,三角形包围的点为极坐标的中心,对于每一个由r和θ确定的极坐标区域,如果该区域内包含的点越多,则其在由θ和log(r)组成的直角坐标系中对应的区域颜色越深点。

以特征点集中任意一点pi为参考点,在pi为圆心、r为半径的局域内按对数距离间隔建立n个同心圆。将此区域沿圆周方向m等分,点pi到其它各点的向量相对位置简化为模板上各扇区内的点分布数。

本方法使用由12个角度和5个环组成的对数极坐标系,把空间化为60个区域,每个区域的值大小不同。这样原图每个点都可以对应一个位数为60的向量。这个向量成为点对应的形状上下文。其计算公式为:

hi(k)=#{q≠pi:(q-pi)∈bin(k)}(a)

其中k代表极坐标系中的顺序代号,值取0到60,#表示统计第k个区域轮廓点的个数,q-pi表示属于点pi的形状直方图的第k个分量。

由于每个轮廓点的对数极坐标空间都有60个区域,所以点pi的直方图也就有60个属性。由公式(a),可以计算出点集p={p1,p2,p3,...,pn}中的每个点与除它之外的n-1个点构成的直方图,最后可以得到n个形状直方图。可以用n*60矩阵表示这个物体的形状信息。矩阵的描述如下:

其中i表示轮廓上的每个点,n为轮廓上总的点的数目。

步骤s3.1提取待测物体的轮廓边缘。其提取方法与s2.1所述提取方法一样。

步骤s3.2对待测物体轮廓上的点进行等间隔取样,选取与s2.2当中相同数目的轮廓点,选取轮廓特征点的方法与s2.2的方法一致。

步骤s3.3对待测物体的形状方向进行转换,变成模板方向的取向。步骤如下:为了解决旋转不变性,对s2.2当中等间隔选取的m个轮廓点所组成的查询形状采用最佳拟合椭圆模型的方法用于标准化其尺度和取向。具体方法:

1)图像f(x,y)的(p+q)阶几何矩定义为:

mpq=∫∫xp*yq*f(x,y)dxdy(p,q=0,1,2,...,∞)

将图像视为灰度值关于空间坐标。最常用的,物体的零阶矩表示了图像的“质量”:μ00=∫∫dxdyf(x,y)一阶矩(μ01,μ10)用于确定图像质心(xc,yc):xc=μ10/μ00;yc=μ01/μ00;

若将坐标原点移至xc和yc处,就得到了对于图像位移不变的中心矩。如:

upq=∫∫[(x-xc)p*(y-yc)q]f(x,y)dxdy

μ00=∫∫dxdyf(x,y)(1)

零阶矩表示整个图像的‘能量’

μ10=∫∫dxdyxf(x,y)(2)

μ01=∫∫dxdyyf(x,y)(3)

一阶矩找到幅度分布的质心

二阶矩描述图像的大小和方向,原始图像完全等价于恒定的辐照度椭圆形,具有确定的尺寸,取向和偏心率,并以图像质心为中心

μ20=∫∫dxdyf(x,y)x2(5)

μ11=∫∫dxdyf(x,y)xy(6)

μ02=∫∫dxdyf(x,y)y2(7)

图4椭圆的参数中,a为椭圆的长轴,b为椭圆的短轴,θ为长轴方位椭圆倾角,θ为主要求的参数。图4为椭圆图,图5为尺度和旋转不变性变换方法举例图

通过(8)(9)(10),采用最佳拟合椭圆模型的方法可以得到椭圆的长轴与短轴。

α=γcosθ,β=γsinθ(13)

ltemplate是最小矩形模板图像形状的对角线长度。因此查询形状f(x,y)可以通过(12)转化为归一化形状f(x',y'),而该形状f(x',y')上轮廓点即为后面待测物体用来对该物体形状进行上下文特征描述的点。

步骤s4.1分别计算模板物体上每一个点和待测物体任意一点的形状匹配代价。计算代价矩阵:计算一个目标的形状直方图与另一目标的形状直方图之间的匹配代价,设pi为模板图像上轮廓特征点,而qj是待测物体图像上轮廓点,计算它们每个样本点之间的差别,即形状上下文的差别,定义这两个点的匹配代价cost值为cij,代价函数如下:

步骤s4.1通过匹配代价把对应的点转成二分图最大匹配问题,二分图采用匈牙利算法来解决,进而得到模板物体与待测物体的最优匹配。步骤如下:通过匹配代价把对应的点转成二分图最大匹配问题,二分图采用匈牙利算法来解决,进而得到模板无图与待测物体的最优匹配

然后,基于计算得到的代价矩阵c,进行点的匹配操作,使公式(16)获得最小值。

如图3所示,步骤s4.3薄板样条(tps)变换模型来模拟待测物体相对模板物体的形变。方法如下:tps可以把两个形状上的差异描述成一种形状到另一种形状的形变,几乎所有的形变都可以用tps来近似。在二维空间中,如果原形状表示成有n个点组成的点集a,待测试形状表示成有n个点组成的点集b,点集b中的n个点用一个tps变换来模拟形变,保证这n个点可以正确匹配。用tps可以找到一个通过所有控制点的弯曲最小的光滑曲面,经常用来对形状进行非刚性变换。在进行点集匹配时,点集之间一一对应,可以使用tps最小化弯曲能量,来求解点集之间的映射参数及匹配矩阵。tps仿射函数f(x)在对应点集{xi}和{yi}最小弯曲能量函数如下:

步骤s4.4计算模板物体与待测物体的形状距离,通过两者之间的距离来衡量模板图像与待测图像的形状相度。方法如下:由(4.3)形状上下文匹配和正规化的tps转换模型。计算两个形状特征点之间的距离之和以及弯曲能量,其中两个物体形状特征点之间的距离之间显示两个物体的相似程度,该值越小说明两个物体越相似。而两个物体形状上下文距离和弯曲能量的加权总和则作为形状匹配距离成本。

已知两个形状p和q的形状上下文距离,可以使用下式对称加权和计算最佳匹配点的匹配成本。

由以上公式计算出最佳匹配点的匹配成本,通过比较匹配成本的大小可以得到待测物体中与模板物体最相似的图像,匹配成本值越低表明进行匹配的两者物体最相似,从而能够有效的对物体进行分类识别。

显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1