一种单幅图像行人检测方法

文档序号:8905471阅读:1270来源:国知局
一种单幅图像行人检测方法
【技术领域】
[0001] 本发明属于计算机视觉和图像处理技术领域,特别的设及单幅图像的行人检测方 法。
【背景技术】
[0002] 行人检测是计算机视觉技术中的热点和难点,可理解为判断输入图像是否包含行 人,如果包含行人,则给出行人的位置信息,近年来,行人检测技术在人体行为分析、视频监 控、车辆辅助驾驶及灾难营救等领域发挥了作用。
[0003] 行人检测技术中最为核屯、的问题可W归结为特征提取,分类和定位=个方面。现 有技术中对该=个方面的研究可归结为两类;基于背景建模的方法和基于统计学习的方 法,都取得了一定的成果,然而基于背景建模的方法鲁椿性不高,抗干扰能力较差,而基于 统计学习的方法受训练样本的影响较大,且应对真实场景的能力不够。
[0004] 为克服现有技术的上述不足之处,本发明提出了一种多层次的基于快速和精细行 人检测器的行人检测方法,利用梯度幅值特征和线性支持向量机,训练得到粗的行人检测 器,实现非行人窗口的快速过滤,在快速过滤的结果上,利用加速的窗口扫描方法,得到更 为精确的窗口正例样本的反例样本,W此训练得到作为精细检测器的自动编码机,基于层 叠的自动编码机,区分行人和非行人窗口,实现对输入图像的行人检测,本发明提供的多层 次的基于训练实现的行人检测方法具有更好的鲁椿性,能够快速且准确的实现图像中行人 的检测。

【发明内容】

[0005] 在本发明要解决的问题是提供一种单幅图像行人检测方法,W解决现有技术中行 人检测易受环境影响,不够准确的缺陷。
[0006] 为了实现W上目的,本发明提供了一种单幅图像行人检测方法,其特征在于: (1) 数据准备,设置行人数据集和背景数据集; (2) 训练快速行人检测器; (3) 利用快速行人检测器进行快速行人检测与行人样本提取; (4) 利用快速检测结果训练精细行人检测器; (5) 利用训练得到的快速行人检测器和精细行人检测器对输入图像进行行人检测。
[0007] 优选的,其中步骤(1)具体为: (1.1) 设置行人数据集并标记人体矩形框; (1.2) 设置背景数据集。
[0008] 优选的,其中步骤(1.1)具体为: 义集M幅图像组成行人数据集,记为/=L./j,/y.../j,....1/,图 像馬上包含有禹个行人样本,A; > 1,标记图像/;:上第j个行人样本的位置为: Z,U,,r.rj,其中|,v,_r.)为矩形框左上顶点坐标,r为矩形框宽度,A为矩 形框长度,所述矩形框为表示完全包含该行人样本轮廓的人体矩形框,采集的每幅图像的 宽均大于20像素,高均大于50像素。
[0009] 优选的,其中步骤(1. 2)具体为: 采集N幅不包含行人的图像组成背景数据集,记为:浸,,皮。
[0010] 优选的,其中步骤(2)具体为: (2. 1)利用行人数据集获取正例样本的特征表示; (2. 2)利用背景数据集获取反例样本的特征表示; (2. 3)利用W上获取的正例样本和反例样本的特征表示训练线性分类器作为快速行人 检测器。
[0011] 优选的,其中步骤化1)具体为: (2. 1. 1)对行人数据集I中的每一幅图像i;,根据图像上每个人体矩形框的位置,经过 截取,获得对应的人体子图像,行人数据集I中所有图像的所有人体子图像构成了正例样 本; (2. 1. 2)将截取的正例人体子图像转换为对应的人体灰度子图像,经过归一化处理得 至IJ10*25像素大小的标准人体灰度子图像; (2. 1. 3)计算该10*25像素大小的标准人体灰度子图像的梯度幅值特征Fe公将 该特征拉直,该拉直后的梯度幅值特征为一个250维的列向量; (2. 1.4)将所有正例样本的特征记为:巧,朽.f 其中
巧表示第i幅图像的第j个人体矩形框的拉直梯度幅值特征。
[0012] 优选的,其中步骤化2)具体为: (2. 2. 1)在训练集B中的图像上,选择宽高比例为10:25的背景矩形框共10T个,经过 截取,获得对应的背景子图像,则该10T个背景子图像构成了反例样本; (2. 2. 2)将截取的反例背景子图像转换为对应的背景灰度子图像,经过归一化处理得 至IJ10*25像素大小的标准背景灰度子图像; (2. 2. 3)计算该10*25像素大小的标准背景灰度子图像的梯度幅值特征/应,将 该特征拉直,该拉直后的梯度幅值特征为一个250维的列向量; (2. 2. 4)将所有反例样本的特征记为: ;/:. £,.....如]& 其中表示第a个反例样本的拉直梯度幅值特征。
[0013] 优选的,其中步骤化3)具体为: (2. 3. 1)将所有正例样本的标签设置为1,反例样本的标签设置为0,训练一个二类线 性分类的SVM,得到判别投影W6 5^4; (2. 3. 2)设置得分函数J:::::々:切'知酱》=r;' *ir,其中g表示任意10*25大小的灰度图 像样本经过拉直后的梯度幅值特征,该拉直后的梯度幅值特征是一个250维的列向量; (2. 3. 3)计算每个正例样本的标准人体灰度子图像的得分函数值,进行排序,设置检测 阔值ff,使得该阔值大于99%的正例样本的标准人体灰度子图像的得分函数值。
[0014] 优选的,其中步骤(3)具体为: (3. 1)将行人训练集I中的每幅图像进行灰度处理,得到灰度图像,对其进行高斯金字 塔处理,缩放比例为1. 日' < 化巧> 1,直到最小尺寸的灰度图像的 宽大于10个像素且高大于25个像素; (3. 2)将上述D+1个尺度作为主尺度,计算每个主尺度灰幅图像的梯度幅值特征图像; (3. 3)通过双=次Bi-化bic插值在每两个相邻主尺度之间获得中间尺度的梯度幅值 特征图像; (3. 4)在所有尺度的梯度幅值特征图像上进行窗口扫描,窗口大小为10*25像素,水平 和垂直方向的步长都是1; (3. 5)对扫描得到的每个10*25像素大小的梯度幅值特征窗口,将其拉直为一个250维 的列向量,计算其得分函数值; (3. 6)对得分函数值大于检测阔值^的窗口,W该窗口所在的比例为的梯度幅值 特征图像的比例倒数2 =缩放该图像,并W该窗口在该尺度的梯度幅值特征图像上的相对位 置进行还原,还原得到该窗口在行人训练集I中的对应图像的灰度图像上的相对位置,该 灰度图像的尺度为1,该位置为一个宽高比为10:25的矩形框; (3. 7)计算还原得到的每个矩形框与行人训练集I中对应图像上的所有人体矩形框之 间的重合度,重合度具体计算方法为
,即该两个矩形框.1. 的面积重合 部分除W两个矩形框的平均面积; (3. 8)将与对应图像上的所有人体矩形框之间的重合度都低于0. 5的矩形框作为反 例,将与所有人体矩形框中任意一个的重合度大于0. 8的矩形框作为正例。
[0015] 优选的,其中步骤化3)具体为:在相邻的两个主尺度之间等间隔的插入四个中 间尺度,上述四个尺度由距离其最近的主尺度的梯度幅值特征图像插值得到。
[0016] 优选的,其中在相邻的两个主尺度之间等间隔的插入四个中间尺度具体为;在1-^ 尺度图像和^,尺度图像之间等间隔的插入四个中间尺度,则每个中间尺度可W表示为:
其申巧表示.1.尺度图像和^尺 -,- I.]二-- 度图像之间第q个中间尺度的缩放比例。
[0017] 优选的,其中步骤(4)具体为: (4. 1)对步骤3. 8中得到的正例矩形框和反例矩形框,统一缩放为10*25像素大小的灰 度图像,组成精细行人检测器的训练样本集合,记为Z= [?,,%.],其中正 例矩形框有C个,反例矩形框有V个,r>Lr> '!; (4. 2)设置一个包含=个隐层的自动编码机作为精细行人检测器; (4. 3)逐层进行预训练Pre-Train; (4. 4)进行微调Fine-tune,将正例样本的输出设置为1,反例样本的输出设置为 0,利用BP算法对层级编码机S个隐层的参数ff-,,r:.N':,W及sofwmax层的参数fi,;进行 Fine-tune,W此训练得到具有上述参数的自动编码机作为精细行人检测器。
[0018] 优选的,其中步骤(4. 3)具体为: (4.3. 1)基于去噪自动编码机De-noisingAutoEncoder!^无监督的方式训练神经网 络的第一层,将其输出作为原始输入的最小化重构误差; (4. 3. 2)将每个隐含层的输出作为下一层神经网络的输入,进行无监督训练; (4. 3. 3)重复步骤4. 3. 2,直到
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1