一种基于小波分形特征的行人检测方法

文档序号：6581105阅读：178来源：国知局

专利名称：一种基于小波分形特征的行人检测方法
技术领域：
本发明涉及智能交通系统中的智能车辆技术，尤其是一种基于小波分形特征的行人检测方法。
背景技术：
目标检测是机器视觉研究的重要内容，在视频监控，移动机器人，智能车辆等领域中得到广泛的应用。由于行人外表，姿势以及光照强度的组合千变万化，导致行人检测成为视觉目标检测中最为复杂的问题之一。
现有的行人检测方法在过程上可归结为两个主要的处理步骤，即特征提取和目标检测。目标检测步骤的主要任务是将特征提取步骤构造出来的目标特征，用于分类器训练，从而对新的测试样本做出判别。因此，特征提取方法对行人检测的效果有着重要的影响。特征提取根据特征表达的方式，又可分为稀疏表达和稠密表达两类。稀疏表达法通过某种关键特征提取算法，将目标区域中的兴趣点提取出来，组成目标的稀疏特征表达模式。例如尺度不变特征变换 (Scale-invariant feature transform, SIFT)禾Q主成分分析(Principal Component Analysis, PCA)。使用这些特征表达方式提取的目标特征具有表达简洁的优点，但在描述复杂模式时，其特征向量所包含的信息不利于分类器训练，因而在行人检测领域的应用效果不佳。而稠密表达是对给定区域进行逐点扫描，提取出目标区域的稠密特征表达模式。典型的有哈尔特征和梯度方向直方图 (Histograms of Oriented Gradient, HOG)等。这些提取方法提取的目标特征包含的信息量大，有利于分类器训练，但特征向量维数过高。以HOG方法为例，64X 128大小的图像将产生至少4096维的特征向量，若采用哈尔特征将得到更多的特征维数，导致特征冗余量大，计算效率低，一般还需要特征选择方法的配合。

发明内容
本发明目的在于提供一种特征表达简洁，信息冗余小，检测效率高的基于小波分形特征的行人检测方法。
本发明所采用的技术方案是-
(1) 、读入训练样本集，样本集合包括分类器训练的完整行人图像和不包含行人的
自然场景图像，将所有样本图像规格化到48X96像素大小，其中训练样本图像为灰度图像；
(2) 、对样本图像/;c,力进行3次二维小波变换，得到3层小波分解后的12个子图，各层对应的尺度分别是2x2、 4x4、 8x8，取其中尺度为4x4、 8xg两层中的 6个小波子图，即
其中，y(x,力为图像灰度值，(x,力为像素坐标，/的上标A、 V、 D、 H为二维小波分解子空间包含的各子图，分别对应LL子图、LH子图、HL子图和HH子图，/ 的下标代表分解层数；
(3) 、对步骤(2)得到各小波子图分别取绝对值后再进行适当的拉伸和縮放变换，使其取值范围统一映射到0 255;
(4) 、对步骤(3)处理后的小波子图分别求取分形维数向量，令尺度^= 1,2,3,...,"， n取2 100中的正整数，按照下式依次求得A"2,…,A^，即分形维数向量，
<formula>formula see original document page 5</formula>
(5) 、对步骤(4)得到的每个子图所对应的分形向量分别做规范化处理；
(6) 、将步骤(5)规范化后的所有子图对应的规范化后的分形向量进行组合，得到一
个6x("—l)维向量，即小波分形特征向量；
(7) 、将步骤(6)提取的小波分形特征用于训练软支持向量分类器，用训练后的判别函数实现对未知样本的检测。
本发明结合小波和分形理论，提出一种新的行人目标特征提取方法，称为小波分形特征(Wavelet Fractal Signature, WFS)，用于训练SVM分类器，该特征具有简洁的特征表达形式，更优的特征分辨能力，从而能提高行人检测效果。 WFS特征包括稠密采样和抽象两个环节
(1) 在稠密采样环节将输入图像分解到不同分辨率下非自相关的小波子模式，选择其中最有利于刻画行人特征的6个子模式，包含了大量的亮度差信息，方向信息，从而将行人检测问题转化为6维空间的模式分类问题，提高了分类效果。
(2) 在抽象环节，通过计算分形维向量，提取出各子模式在不同尺度下的特征差别，能够在非常少的特征维数(尺度s的最大取值w为9时，生成的特征向量仅有48维)下抽象出目标在不同分辨率下的特征，具有表达简洁的优点。
(3) 根据常识，本发明所涉及的二维小波分解，分形维计算、Ll规范化等
环节计算效率都很高，SVM的计算开销主要取决于特征维数和支持向量个数。
一方面，给出的WFS特征仅有48维，仅为H0G特征的1X;另一方面，采用WFS
特征能够在非常少的训练样本时就能取得较高的检测效率，大幅减少了支持向
量的个数，从而降低了计算开销。
因此，本发明既具有稠密采样信息量大的优点，又具备稀疏采样简洁性的优
点。在降低计算效率的同时，提高了检测率。本发明的另一个有益效果是，实践
证明在训练样本非常少时，本发明方案仍能具有很高的检测率，可应用于训练样
本难以收集的场合。

图l是本发明的方法流程图。
具体实施例方式
下面结合附图对发明的实施做出进一步说明。图l是本发明的方法流程图，如图1所示，该方法包括以下7个步骤。
.步骤101:读入训练样本集，样本集合包括分类器训练的完整行人图像和不包含
行人的自然场景图像，将所有样本图像规格化到48X96像素大小，其中训练样本图像为灰度图像；
步骤102、对样本图像Xx,力进行3次二维小波变换，得到3层小波分解后的子图，各层对应的尺度分别是2x2、 4x4、 8x8。除去尺度为2x2的所有子图，以及其它两种尺度中的/A子图，剩下的子图为
"H"，/3D} (1)
其中，/x，力为图像灰度值，(x,力为像素坐标，/的上标A、 V、 D、 H为二维小波分解子空间包含的各子图，分别对应LL子图、LH子图、HL子图和HH子图，/的下标代表分解层数；
步骤103:对式(l)中的每个小波子图取绝对值后再进行适当的拉伸和缩放变换，使其取值范围统一映射到0 255;
步骤104:对步骤103处理后的小波子图分别求取分形维数向量，具体为，令尺度e二 1,2,3,...,",按照式(2)依次求得A,"2,…,A:-i，即分形维数向量，"取2 100之间的整数。w的取值与生成的特征维数成正比，但其值越大，包含的特征信息量越大，反之则越小。通过大量实验得到当"取9时为最优；
A=2 —
(2)
''J
、("= max & i (/, , max 6F, (w,")}
步骤105:对步骤104得到的每个子图所对应的分形向量分别做规范化，即用式(3)规范化每个子图对应的分形维向量，
A=]i^TT (3)
II' +几
其中，1Hh为l范数，a,表示规范化之前的子图分形维向量，A表示规范化之后的标准化向量，义为一个很小的正数，为了保证式(3)有效；
该步骤还可以使用L2范数等其它方式来规范化分形向量，但L1范数具有最高的计算效率。
步骤106:将步骤105规范化后的所有子图对应的规范化后的分形向量进行组合，得到一个6x^—l)维向量，即最终的小波分形特征向量；
步骤107:将步骤106提取的小波分形特征用于训练软支持向量分类器。具体算
7法如下
(A) 已知训练样本集
<formula>formula see original document page 8</formula>
(B) 选择核函数和惩罚参数C，构造并求解最优化问题
<formula>formula see original document page 8</formula>
其中，〖(x,，x,)-^(x,)沐&)为核函数。
(C) 解出步骤(B)中式(4)的最优解，记作ct 用式(5)求出最优分类超平面(v//)，
(D) 从而得到用于分类的判别函数/x),
<formula>formula see original document page 8</formula>
其中，SVM的惩罚因子C为大于零的常数，其最优值需要通过试验确定，本发明中取2000。核函数可使用多项式核、二层神经网络核和高斯核，本发明首选高斯核，"取1.5,其它核次之。
利用一个与训练样本图像同样尺寸的窗口在被测图像中滑动，通过得到判别
函数/(x)对窗口中的目标进行分类，判断该模式是否为行人，从而实现行人检测，其中x代表图像的WFS特征，判别函数/(;c)的输出代表行人或非行人。
权利要求
1.一种基于小波分形特征的行人检测方法，其特征是，该方法包括以下步骤(1)、读入训练样本集，样本集合包括分类器训练的完整行人图像和不包含行人的自然场景图像，将所有样本图像规格化到48×96像素大小，其中训练样本图像为灰度图像；(2)、对样本图像f(x，y)进行3次二维小波变换，得到3层小波分解后的12个子图，各层对应的尺度分别是2×2、4×4、8×8，取其中尺度为4×4、8×8两层中的6个小波子图，即{f2H，f2V，f2D，f3H，f3V，f3D}其中，f(x，y)为图像灰度值，(x，y)为像素坐标，f的上标A、V、D、H为二维小波分解子空间包含的各子图，分别对应LL子图、LH子图、HL子图和HH子图，f的下标代表分解层数；(3)、对步骤(2)得到各小波子图分别取绝对值后再进行适当的拉伸和缩放变换，使其取值范围统一映射到0～255；(4)、对步骤(3)处理后的小波子图分别求取分形维数向量，令尺度ε＝1，2，3，...，n，n取2～100中的正整数，按照下式依次求得D1，D2，...，Dn-1，即分形维数向量，<maths id="math0001" num="0001" ><math><![CDATA[ <mrow><msub> <mi>D</mi> <mi>k</mi></msub><mo>=</mo><mn>2</mn><mo>-</mo><mfrac> <mrow><mi>ln</mi><mi>A</mi><mrow> <mo>(</mo> <msub><mi>ϵ</mi><mi>k</mi> </msub> <mo>)</mo></mrow><mo>-</mo><mi>ln</mi><mi>A</mi><mrow> <mo>(</mo> <msub><mi>ϵ</mi><mrow> <mi>k</mi> <mo>+</mo> <mn>1</mn></mrow> </msub> <mo>)</mo></mrow> </mrow> <mrow><mi>ln</mi><msub> <mi>ϵ</mi> <mi>k</mi></msub><mo>-</mo><mi>ln</mi><msub> <mi>ϵ</mi> <mrow><mi>k</mi><mo>+</mo><mn>1</mn> </mrow></msub> </mrow></mfrac> </mrow>]]></math></maths><maths id="math0002" num="0002" ><math><![CDATA[ <mrow><mi>A</mi><mrow> <mo>(</mo> <msub><mi>ϵ</mi><mi>k</mi> </msub> <mo>)</mo></mrow><mo>=</mo><mfrac> <mrow><msub> <mi>V</mi> <msub><mi>ϵ</mi><mi>k</mi> </msub></msub><mo>-</mo><msub> <mi>V</mi> <msub><mi>ϵ</mi><mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn></mrow> </msub></msub> </mrow> <mn>2</mn></mfrac> </mrow>]]></math></maths><maths id="math0003" num="0003" ><math><![CDATA[ <mrow><msub> <mi>V</mi> <mi>ϵ</mi></msub><mo>=</mo><munder> <mi>Σ</mi> <mrow><mi>i</mi><mo>,</mo><mi>j</mi> </mrow></munder><mrow> <mo>(</mo> <msub><mi>u</mi><mi>ϵ</mi> </msub> <mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo> </mrow> <mo>-</mo> <msub><mi>b</mi><mi>ϵ</mi> </msub> <mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo> </mrow> <mo>)</mo></mrow> </mrow>]]></math></maths><maths id="math0004" num="0004" ><math><![CDATA[ <mrow><msub> <mi>u</mi> <mi>ϵ</mi></msub><mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>)</mo></mrow><mo>=</mo><mi>max</mi><mo>{</mo><msub> <mi>u</mi> <mrow><mi>ϵ</mi><mo>-</mo><mn>1</mn> </mrow></msub><mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>)</mo></mrow><mo>,</mo><munder> <mi>max</mi> <mrow><mo>|</mo><mrow> <mo>(</mo> <mi>m</mi> <mo>,</mo> <mi>n</mi> <mo>)</mo></mrow><mo>-</mo><mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>)</mo></mrow><mo>≤</mo><mn>1</mn><mo>|</mo> </mrow></munder><msub> <mi>u</mi> <mrow><mi>ϵ</mi><mo>-</mo><mn>1</mn> </mrow></msub><mrow> <mo>(</mo> <mi>m</mi> <mo>,</mo> <mi>n</mi> <mo>)</mo></mrow><mo>}</mo> </mrow>]]></math></maths><maths id="math0005" num="0005" ><math><![CDATA[ <mrow><msub> <mi>b</mi> <mi>ϵ</mi></msub><mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>)</mo></mrow><mo>=</mo><mi>max</mi><mo>{</mo><msub> <mi>b</mi> <mrow><mi>ϵ</mi><mo>-</mo><mn>1</mn> </mrow></msub><mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>)</mo></mrow><mo>,</mo><munder> <mi>max</mi> <mrow><mo>|</mo><mrow> <mo>(</mo> <mi>m</mi> <mo>,</mo> <mi>n</mi> <mo>)</mo></mrow><mo>-</mo><mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>)</mo></mrow><mo>≤</mo><mn>1</mn><mo>|</mo> </mrow></munder><msub> <mi>b</mi> <mrow><mi>ϵ</mi><mo>-</mo><mn>1</mn> </mrow></msub><mrow> <mo>(</mo> <mi>m</mi> <mo>,</mo> <mi>n</mi> <mo>)</mo></mrow><mo>}</mo> </mrow>]]></math></maths>(5)、对步骤(4)得到的每个子图所对应的分形向量分别做规范化处理；(6)、将步骤(5)规范化后的所有子图对应的规范化后的分形向量进行组合，得到一个6×(n-1)维向量，即小波分形特征向量；(7)、将步骤(6)提取的小波分形特征用于训练软支持向量分类器，获得用于分类的判别函数，再利用一个与训练样本图像同样尺寸的窗口在被测图像中滑动，用训练后得到的判别函数对滑动窗口中的目标进行分类，判断该模式是否为行人，从而实现行人检测。
2. 根据权利要求1所述的一种基于小波分形特征的行人检测方法，其特征是-所述步骤(4)中尺度s的最大取值n为9。
3. 根据权利要求1所述的一种基于小波分形特征的行人检测方法，其特征是-所述步骤(5)所使用的规范化的方法为用Ll范数规范化每个子图对应的分形维向量，艮卩其中，l卜lh为l范数，a,表示规范化之前的子图分形维向量，A表示规范化之后的标准化向量，A为一个很小的正数，为了保证除法有效。
全文摘要
本发明公开了一种基于小波分形特征的行人检测方法，涉及智能交通系统中的智能车辆技术，包括(1)读入训练样本集，将所有样本图像规格化到48×96像素大小；(2)对样本图像进行3次二维小波变换，取其中2、3两层的6个小波子图；(3)对步骤(2)得到各小波子图取绝对值，再进行拉伸和缩放，使其取值范围统一映射到0～255；(4)对步骤(3)处理后的小波子图分别求取分形维数向量；(5)对步骤(4)得到的各子图对应的分形向量规范化；(6)将步骤(5)规范化后的分形向量进行组合，得到一个6×(n-1)维的小波分形特征向量；(7)将步骤(6)提取的小波分形特征用于训练软支持向量机，用得到判别函数实现行人检测；本发明的特征表达形式简洁，特征分辨能力强，能提高行人检测效率。
文档编号G06K9/66GK101630369SQ20091018307
公开日2010年1月20日申请日期2009年7月30日优先权日2009年7月30日
发明者李舜酩, 柏芳超, 毛建国, 峘沈, 缪小冬申请人:南京航空航天大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李舜酩;沈峘;毛建国;柏芳超;缪小冬
技术所有人：南京航空航天大学
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。