基于FHOG‑LBPH特征的图像行人识别方法与流程

文档序号:11920673阅读:853来源:国知局
基于FHOG‑LBPH特征的图像行人识别方法与流程

本发明提供一种基于FHOG-LBPH特征的图像行人识别方法,属于计算机视觉监控技术领域。

二、

背景技术:

行人检测是计算机视觉和模式识别领域中的重要研究方向,它在智能交通、视频监控、人群安全预测与管理、机器人与高级人机交互等领域有着很好的应用价值。由于人体是非刚性目标,容易受到姿态、衣着、视觉、光照等方面的影响,加之复杂的背景环境,这些都将影响到行人检测的精度,因此,如何快速准确地将行人从视频图像中检测出来,仍然是目前的研究热点。

在众多行人检测的技术方法中,基于机器学的检测方法是目前较为主流的方法。该方法包括两个重要方面:特征提取和分类器学习。在特征提取过程中,常用的行人特征有HOG特征和LBP特征等。在分类器学习中应用最多的是用SVM对样本特征进行训练得到较高性能的分类器。但目前,针对梯度方向直方图(HOG)和局部二值模式(LBP)的检测,存在特征维数高、冗余信息多、影响视频图像中行人检测速度等问题。

为此,本发明提出一种基于FHOG-LBPH特征的图像行人识别方法。通过对融合HOG特征(FHOG)进行统计平均,结合单独最优特征组合和巴氏距离可分性判据选出最优特征,并与LBPH特征融合得到改进的FHOG-LBPH特征,从根本上降低特征维数;利用支持向量机(SVM)对样本特征进行训练获得分类器,达到对测试样本进行分类的目的。实验结果表明,该方法使得行人检测的准确率和实时性都有一定的提高,并用自行拍摄的图像验证了该方法的有效性,在实际行人识别中具有一定的应用价值。

三、

技术实现要素:

(1)目的:本发明的目的在于提供一种基于FHOG-LBPH特征的图像行人识别方法,即通过对融合HOG特征(FHOG)进行统计平均,选出最优特征,并与LBPH特征融合得到改进的FHOG-LBPH特征,利用支持向量机(SVM)对样本特征进行训练获得分类器,在提高准确率和实时性的同时达到对测试样本分类的目的。

(2)本发明提出一种基于FHOG-LBPH特征的图像行人识别方法,具体包括如下步骤:

步骤一:FHOG特征提取。计算FHOG描述子是一个将区域特征相互叠加的过程,目标区域通过细胞单元划分为各个小区域,各个小区域组合成一个块单元,FHOG特征即各个区域特征的组合。

FHOG描述子用来计算局部图像梯度的方向信息的统计值,描述局部目标的表象和形状,表征出行人的轮廓信息。FHOG特征提取包括:灰度空间归一化、梯度计算、梯度方向直方图、重叠块直方图归一化、生成FHOG特征。

步骤二:LBPH特征提取。由于步骤一的特征描述是行人轮廓边缘信息,较多地忽略了平坦的表面,导致分类器对于嘈杂的边缘信息的处理能力和鲁棒性较差。由此引入一种有效的纹理描述子(LBPH),它提取和度量了灰度图中局部邻近区域的纹理特征。LBPH特征提取包括:LBP特征图像计算、LBP特征图像分块、直方图归一化、计算LBPH特征向量。

由于纹理特征比较稳定,不易受背景颜色和光照的影响,有助于图像的区分,从而提高行人检测的准确率。

步骤三:FHOG-LBPH特征融合。将步骤一与步骤二得到的FHOG特征与LBPH特征串联起来形成一幅图像的特征来检测行人。FHOG-LBPH融合特征整体提高了分类器的鲁棒性。

步骤四:行人识别。利用SVM对步骤三提取的训练样本特征进行训练获得分类器,通过该分类器对测试数据集进行检测,从而判断图像是否是行人。

本发明的优点和积极效果在于:本发明在图像行人识别方面,基于FHOG特征对行人轮廓边缘信息的描述和LBPH特征对灰度图中局部邻近区域纹理信息的描述,将FHOG+LBPH的图像特征进行联合,更加有助于图像的区分,增强分类器对于嘈杂边缘信息的处理能力和鲁棒性,提高行人检测的效率,在实际行人识别中具有一定的应用价值。

四、附图说明:

图1为本发明一种基于FHOG-LBPH特征的图像行人识别方法的整体步骤流程图;

图2为本发明一种基于FHOG-LBPH特征的图像行人识别方法的实验效果。

五、具体实施方式:

下面结合图1、2对本发明一种基于FHOG-LBPH特征的图像行人识别方法作进一步的说明:

步骤一:FHOG特征提取;计算局部图像梯度的方向信息的统计值,表征出行人的轮廓信息。

步骤1.1,采用Gamma法对输入图像进行归一化。

其中,I(x,y)表示当前像素的灰度值。目的在于调节图像的对比度,降低图像局部的阴影和光照变化所造成的影响,同时可以抑制噪声的干扰。

步骤1.2,像素梯度计算。

FHOG特征的计算对模板算子非常敏感,经过对比发现,最简单的一维离散微分模板(-1,0,+1)及其转置在水平和垂直两个方向上对图像各个像素进行梯度计算取得的检测效果最好。计算过程如下:

Gx(x,y)=H(x+1,y)-H(x-1,y)

Gy(x,y)=H(x,y+1)-H(x,y-1)

ω(x,y)=tan-1(Gy(x,y)/Gx(x,y))

Gx(x,y),Gy(x,y)分别为当前像素点的水平梯度和垂直梯度;G(x,y)为当前像素点的梯度幅值;ω(x,y)为当前像素点的梯度方向。

将梯度方向限定在[0,π]的范围内,并将梯度方向等分成9个区间,然后利用该方向上的幅值对每一个区间做加权统计直方图。

步骤1.3,块内归一化。把图像分为相同大小的cell和Block;与HOG每个cell提取36维特征不同,FHOG每个cell提取31维特征并对31维特征向量进行归一化。

归一化的目的是进一步消除光照、阴影的影响:

其中,和vi分别表示初始和归一化后的每个像素的梯度值,ε是一个常量,取值为0.001。

步骤1.4,获取FHOG特征。采用滑动窗口搜索法,按照步骤1.3中的归一化方法对每个Block进行归一化,把每个归一化后Block内的特征向量串联起来,从而得到最终的特征向量。

步骤二:LBPH特征提取。LBPH是一种有效的纹理描述子,它提取和度量了灰度图中局部邻近区域的纹理特征,其特征相对稳定,不易受背景颜色和光照的影响。

步骤2.1,计算图像的LBP特征图像(旋转不变等价模式的LBP值);

步骤2.2,将LBP特征图像进行分块;

步骤2.3,计算每块区域特征图像的直方图,将直方图进行归一化;

步骤2.4,将上面计算的每块区域特征图像的直方图按分块的空间顺序依次排列成一行,形成LBPH特征向量;

步骤三:FHOG-LBPH特征融合。由于到FHOG特征维数较高,忽略了平坦的表面,使得分类器的鲁棒性较差,因此用选择后的FHOG特征与LBPH特征进行融合的方法来检测行人,融合方法如下所述:

将步骤一与步骤二得到的FHOG特征与LBPH特征串联起来形成一幅图像的特征来检测行人。其中,提取FHOG特征时cell大小为8×8,padding大小为1×1,整幅图像的FHOG特征为10×18×31维;提取LBPH特征时cell大小为8×8,每块区域统计9个直方图,整幅图像提取12×20×9维特征。

步骤四:行人识别。利用SVM对步骤三提取的训练样本特征进行训练获得分类器,通过该分类器对测试数据集进行检测,从而判断图像是否是行人。

最终,通过试验进行行人识别的验证;实验使用了INRIA的行人图像库并添加了一部分行人图片做为正样本用于分类器的训练。把数据集按照9:1的比例划分训练集和测试集,用训练集训练线性SVM分类器,测试集测试分类器的分类效果。结果表明,FHOG-LBPH特征坚固了图像的形状和纹理两个方面的特征,增强分类器对于嘈杂边缘信息的处理能力和鲁棒性;经过SVM的分类训练能够很好的识别行人和非行人,提高行人检测的效率,在实际行人识别中具有一定的应用价值。

应当指出,本实例仅列示性说明本发明的应用方法,而非用于限制本发明。任何熟悉此种使用技术的人员,均可在不违背本发明的精神及范围下,对上述实施例进行修改。因此,本发明的权利保护范围,应如权利要求书所列。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1