一种基于红外图像的行人检测方法

文档序号:6542452阅读:2366来源:国知局
一种基于红外图像的行人检测方法
【专利摘要】本发明公开了一种基于红外图像的行人检测方法。建立红外图像的行人和非行人标准数据集;提取样本图像梯度方向直方图特征(HOG);提取样本图像强度直方图特征(HOI);设计行人分类特征-梯度方向和强度直方图特征(HOGI);提取样本图像HOGI特征并训练行人分类器;基于多尺度滑动窗口法对红外图像进行搜索检测;融合多窗口分类结果确定行人位置。本发明在研究目前常用的行人检测特征的基础上,提出了专门针对于红外图像的行人检测特征。结合HOG以及HOI特征各自的优点,通过支持向量机(SVM)的帮助,得到了适合红外图像行人检测的HOGI特征。实现夜间环境的行人检测,具有检测率高,误检率低,环境适应性好等特点。
【专利说明】一种基于红外图像的行人检测方法
【技术领域】
[0001]本发明涉及行人检测方法,尤其涉及基于红外图像的行人检测方法。
【背景技术】
[0002]行人检测技术是计算机视觉的一个重要应用,在日常的生活和生产中具有很高的实用价值。行人检测的目的就是把图像或视频序列中出现的行人从背景中分割出来并精确定位。汽车安全技术的进步可以提高车辆驾驶的安全性,从而减少交通事故的发生,减轻医疗系统的负担。而行人检测系统是智能辅助驾驶系统、无人驾驶汽车等汽车安全技术的核心技术之一。此外,随着智能视频监控等技术的发展,行人检测(尤其是夜晚环境)也成为其中必不可少的功能之一。
[0003]目前夜间的行人检测技术主要采用的是可见光图像、激光雷达、红外图像等技术。在夜间,由于光照等条件不理想,可见光相机等探测器的成像与环境监测效果较差。而激光雷达是无人自主车上用于道路扫描、障碍物检测等的重要工具。激光雷达依据测距原理来测量前方障碍物的距离,拥有测速快、精度高、不易受干扰、不受光照等因素的影响等优点,可以全天候工作,因此也可用于行人检测。然而行人相比于车辆等物体,尺度较小,在激光雷达获得的点云数据中,随着行人与雷达的距离变大,行人的点云数据变得更少、更稀疏,使得远距离的行人检测非常困难。而红外探测器具备出众的夜视能力,对不同环境都有较强的适应能力。影响红外图像中物体亮度的主要因素是温度和热辐射,通常情况下,行人要比道路、树木等背景对象辐射出更多的热量,所以一般情况下行人比背景更亮,因此,在红外图像的行人检测(特别是在夜间)具有很大的潜力。

【发明内容】

[0004]为克服在夜间等光照不理想环境下,自动行人检测困难、检测率低、误检率高等缺点,本发明的目的在于提供了一种基于红外图像的行人检测方法,在研究目前常用的行人检测特征的基础上,提出了专门针对于红外图像的行人检测特征。结合HOG以及强度直方图(HOI)特征各自的优点,通过支持向量机(SVM)的帮助,得到了一种新的适合红外图像行人检测的特征一梯度方向和强度直方图混合特征(H0GI)。有效地实现了夜间环境的行人检测,具有检测率高,误检率低,环境适应性好等特点。
[0005]本发明的目的是通过以下技术方案来实现的:
[0006]该方法包括以下步骤:
[0007](I)建立红外图像的行人和非行人标准数据集;
[0008](2)提取样本图像梯度方向直方图特征,标记为HOG ;
[0009](3)提取样本图像强度直方图特征,标记为HOI ;
[0010](4)设计行人分类特征-梯度方向和强度直方图特征,标记为HOGI ;
[0011](5)提取样本图像HOGI特征并训练行人分类器;
[0012](6)基于多尺度滑动窗口法对红外图像进行搜索检测;[0013](7)融合多窗口分类结果确定行人位置。
[0014]所述步骤(1)建立红外图像的行人和非行人标准数据集的步骤如下:
[0015]利用红外相机采集各种不同场景下的红外图像,然后从采集到的红外图像中提取行人样本和非行人样本;标注行人样本时采用包含行人的最小矩形窗口,由于行人一般站在地面上,而地面的特征通常相对稳定,所以标注的训练样本最好对该窗口进行扩充,尤其是向下延伸,要保持行人的宽高比。
[0016]所述步骤(2)提取样本图像梯度方向直方图特征的步骤如下:
[0017]采用梯度算子ΛΧ和Ay对原图像做卷积运算得到每个像素的水平和垂直方向的梯度分量&(1,j)、Gy(i,j);
【权利要求】
1.一种基于红外图像的行人检测方法,其特征在于,该方法包括以下步骤: (1)建立红外图像的行人和非行人标准数据集; (2)提取样本图像梯度方向直方图特征,标记为HOG; (3)提取样本图像强度直方图特征,标记为HOI; (4)设计行人分类特征-梯度方向和强度直方图特征,标记为HOGI; (5)提取样本图像HOGI特征并训练行人分类器; (6)基于多尺度滑动窗口法对红外图像进行搜索检测; (7)融合多窗口分类结果确定行人位置。
2.根据权利要求1所述的一种基于红外图像的行人检测方法,其特征在于,所述步骤(1)建立红外图像的行人和非行人标准数据集的步骤如下: 利用红外相机采集各种不同场景下的红外图像,然后从采集到的红外图像中提取行人样本和非行人样本;标注行人样本时采用包含行人的最小矩形窗口,由于行人一般站在地面上,而地面的特征通常相对稳定,所以标注的训练样本最好对该窗口进行扩充,尤其是向下延伸,要保持行人的宽高比。
3.根据权利要求1所述的一种基于红外图像的行人检测方法,其特征在于,所述步骤(2)提取样本图像梯度方向直方图特征的步骤如下: 采用梯度算子Λχ和Ay对原图像做卷积运算得到每个像素的水平和垂直方向的梯度分量 Gx(i,j)、Gy(i,j);
4.根据权利要求1所述的一种基于红外图像的行人检测方法,其特征在于,所述步骤(3)提取样本图像强度直方图特征的步骤如下: 将图像分成若干个大的块,每个块划分成多个单元,这里的块与单元结构与HOG的相同,将强度值分成若干个区间,为每个单元构建强度直方图;用若干个单元组成空间上连通的块,块与块之间是互有重叠,然后将每个块的特征向量进行归一化;最后将各个块的特征向量组合起来就构成了描述物体亮度信息的强度直方图特征,标记为Η0Ι。
5.根据权利要求1所述的一种基于红外图像的行人检测方法,其特征在于,所述步骤(4)设计行人分类特征-梯度方向和强度直方图特征的步骤如下: 将HOG和HOI特征向量串联起来输入到同一支持向量机中训练,支持向量机也成为SVM,通过训练后获得的模型中包含参数W,即SVM权值;每一维特征向量都有其对应的w值,w表示每一维特征向量对分类的贡献权值正值越大,代表该w对应的那一维特征越能表征行人的特点;训练后获得了 HOG和HOI每一维特征向量的w值;每一个块内有多维向量,分析时分别统计HOG和HOI特征每一个块内的最大正w权值P_H0G、P_H0I ;通过比较来决定每个块是计算HOG还是HOI,通过选择权值更大的来决定;
6.根据权利要求1所述的一种基于红外图像的行人检测方法,其特征在于,所述步骤(5)提取样本图像HOGI特征并训练行人分类器的步骤如下: 先将红外图像的行人和非行人样本统一缩放到同一尺度,如64*128,再提取行人样本的HOGI特征向量,标注分类标签为+1 ;提取非行人样本的HOGI特征向量,标注分类标签为O;然后将行人样本的HOGI特征向量、分类标签以及非行人样本的HOGI特征向量、分类标签统一输入到SVM中训练,通过SVM的学习训练获得行人分类器。
7.根据权利要求1所述的一种基于红外图像的行人检测方法,其特征在于,所述步骤(6)基于多尺度滑动窗口法对红外图像进行搜索检测的步骤如下: 根据行人在图像中的尺度范围来确定图像缩放的尺度空间,假设图像的分辨率为WiXHi, WiR表图像宽度,Hi代表图像高度,&表示缩放比例,检测窗口的大小为WnXHn,其中Wn表示检测窗口的宽度,Hn表示检测窗口的高度,初始尺度为Ss = 1,终止缩放尺度为Se=min (Wi/Wn,HiZHn),窗口滑动步长为Ns以及平滑参数σ χ,σ y,σ s ;对每一个尺度的图像选取一个固定大小的窗口依次滑动窗口,对每个窗口提取HOGI特征,利用事先训练好的行人分类器来判断窗口内是否有行人,通过滑动窗口来遍历图像,将检测结果为行人的窗口存入链表中。
8.根据权利要求1所述的一种基于红外图像的行人检测方法,其特征在于,所述步骤(7)融合多窗口分类结果确定行人位置的步骤如下: 对图像进行多尺度滑动窗口检测后,图像中的同一个行人可能出现在不同尺度上不同的检测窗口中,为了使系统最终输出为一个行人对应唯一的窗口,米用非极大值抑制的方法将上述链表中的多个中间检测结果融合在一起;假设第i个检测结果中心点的位置和尺度分别表示为Xi = [Xi, Yi],Si';检测结果响应的强度用Wi表示,Wi > O ;由位置和尺度构成的三维空间中的点表示为Y = [χ, y, s],其中s = log(s’);然后根据公式(IiagIiHi]=[(exp (Si) σχ)2, (exp (Si) oy)2, σ s2]计算三维空间中每一个点Yi对应的协方差矩阵Hi,为每一个点Yi用式4 =%, (4) Jwi (7)^迭代计算直到收敛,收敛后的点为最终的融.r “ rV τι..1~ — j.」-t=s合后的点,其中兩满 足巧=1;最后对应每个融合后的点在原始图像中标出行人的位置。
【文档编号】G06K9/66GK103902976SQ201410126887
【公开日】2014年7月2日 申请日期:2014年3月31日 优先权日:2014年3月31日
【发明者】项志宇, 朱聪聪 申请人:浙江大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1