一种基于稀疏编码和神经网络的行人图片检测方法

文档序号:9911596阅读:281来源:国知局
一种基于稀疏编码和神经网络的行人图片检测方法
【技术领域】
[0001] 本发明涉及图片检索方法,特别涉及一种基于稀疏编码和神经网络的行人图片检 测方法。
【背景技术】
[0002] 随着科技的进步,计算机等智能设备在人们的日常生活中应用越来越广泛,计算 机在处理重复的,数据密集的任务时,比人类更有效,更准确。自然地人们希望计算机能够 像人类一样处理一些更智能的问题。在计算机新的应用领域中计算机视觉是一个重要的部 分,由计算机代替或辅助人类完成对目标的检测与跟踪是计算机视觉最核心也是最广泛的 应用,从日常生活中用到的指纹或人脸解锁,到汽车的自动驾驶,机器人控制等都与计算机 视觉技术息息相关。人类是社会生活的主体,对行人的识别理所当然的也是计算机视觉应 用中最重要的任务之一。但由于人体姿态多变,外形不固定且随着衣着的变化表现的颜色 特征也不同,目前仍然是一个极富挑战的课题,但因其广泛的应用前景,虽然行人检测任务 面临着众多困难,仍然吸引了大量研究者的目光。
[0003] 基于计算机视觉的行人检测主要任务就是计算机判断输入的图片(或视频帧)是 否包含行人,如果包含行人就给出行人的位置信息。在对输入图像处理的过程中要用到计 算机视觉与数字图像处理的知识,对目标模型的判定与分类则需要用到机器学习模式识别 的相关知识,是一个多学科相结合的复杂的研究课题。行人检测具有广泛的应用前景,在智 能汽车辅助驾驶系统、智能视频监控系统、机器人智能控制系统等方面都有很高的应用价 值,同时行人检测也是人体行为分析应用中的第一步。近年来在航拍图像、受害者营救等新 兴领域也得到应用。目前的检测方法多是基于H0G+SVM行人分类方法,但当图片场景有较大 变化时不能够保证鲁棒性,无法适用于多个场景(即背景固定的图,可移植性不好),而且 SVM分类器对于样本线性可分的情况效果较好,但是对于样本线性不可分的情况就不够理 想,而且SVM对于大规模的训练样本无法实施(如今是大数据时代,数据可以达到数以万 计),而且传统支持向量机算法只给出了二类分类的算法,而在行人检测的实际应用中,一 般要解决多类的分类问题(比如性别、大人、小孩等等)。

【发明内容】

[0004] 针对在样本数目很大时行人检测流行的Adboost+SVM模型难以实施训练的问题, 本发明提供了一种适用于样本数量大、检测速度快和准确率高的基于稀疏编码和神经网络 的行人图片检索方法。
[0005] 为了实现上述发明目的,本发明提供了一种基于稀疏编码和神经网络的行人图片 检测方法,其中,所述图片检测方法具体为:
[0006] 步骤S101:首先对样本数据集中的正样本和负样本做图像预处理,然后再提取聚 合通道特征;
[0007] 步骤S102:构建BP-AdaBoost强分类器模型,并利用步骤S101得到的聚合通道特征 对BP-AdaBoost强分类器进行训练;
[0008] 步骤S103:获取待检测视频帧,并对视频帧进行图像预处理,并根据缩放因子进行 不同尺度的缩放得到图片金字塔,所述图片金字塔是由视频帧的原图像和若干缩放图像组 成的层图像集;
[0009] 步骤S104:利用快速图像特征金字塔计算方法结合滑动窗口检测法,对层图像集 每一层图像所处的窗口图像进行计算得出聚合通道特征,并利用训练好的BP-AdaBoost强 分类器进行分类识别;
[0010] 步骤S105:当窗口图像的检测结果为正样本,则BP-AdaBoost强分类器输出检测窗 口,将所有层图像对应的检测窗口进行融合得到准确的定位窗口;当窗口图像的检测结果 为负样本,则无输出。
[0011] 其中,所述步骤S101中,所述样本数据集为INRIA训练样本集和INRIA训练样本集 的对称变换样本集。
[0012] 所述步骤S101和所述步骤S103中,所述图像预处理包括尺寸归一化处理和图像降 噪处理;所述降噪预处理采用的滤波器为小波滤波器,平滑半径与检测精度的关系,r=l时 检测效果最佳。小波滤波器能通过大多数频率分量,但将某些范围的频率分量衰减到极低 水平,有着较好的可调性,小波滤波可以较快的给出结果,提高整体检测速度。
[0013] 所述步骤S101和所述步骤S103中,所述聚合通道特征包括三种通道特征:3个HSV 颜色空间、6个量化的梯度方向直方图和1个梯度强度特征。使用HSV颜色空间变换方法,HSV 相比LUV颜色空间变换计算量小,避免LUV中求立方根问题,加快了 ACF特征提取速度,变换 速度相对传统方法提高了 一个数量级。
[0014] 所述HSV颜色空间由视频帧的RGB颜色空间转换得到,具体为:
[0015] 设RGB颜色空间中红、绿和蓝颜色的坐标均为(r,g,b),r、g、b的值是在0到1之间的 实数,设max等价于r、g和b中的最大者,设min等于r、g和b中值中的最小者,设HSV空间坐标 值为(h,s,v),其中he [0° ,360° )为色调,se[0, 1]为颜色,ve [0, 1]为饱和度,计算公式 为:
[0016
[0017
[0018] v=max
[0019] 统计中采用了固定h和s,统计v特征,比如,划分h为16份,s为4份,v为4份,那么我 们最终会得到一个256维的特征向量,具体的维数可以相应的调整;
[0020] 所述梯度强度的计算公式为:
[0021]
[0022] 所述梯度方向直方图的计算公式为:
[0023] 0(x,y)=arctan((I(x,y+l)-I(x,y-l))/(I(x+l ,y)-I(x-l ,y)))〇
[0024] 所述步骤S102中,构建BP-AdaBoost强分类器具体为:
[0025]步骤S601:从样本数据集中随机选择m组训练数据(XI,yi) (X2,y2)…(xm,ym),其中 Xl为训练样本数据,yie{l,-l}为样本期望分类结果,其中i = l,2,'",m;初始化训练数据的 分布权值Di (i) = 1 /m,i = 1,2,…,m,根据样本输入和输出的维数确定BP神经网络的网络结 构,即输入层和输出层节点的个数;并初始化BP神经网络的其他参数值包括权值、学习效 率、隐含层节点个数和决策阈值;
[0026] 步骤S602:训练第t(t = l,2,'",m)个弱分类器时,用训练样本集训练BP神经网络, 并得到预测训练数据的网络输出,得到弱分类器序列g(t)的预测误差和ei,其计算公式为:
[0027]
[0028] 其中,g(t)为网络的实际输出,y为样本期望分类结果;
[0029] 步骤S603:根据计算出的预测误差和ei,计算弱分类器的权重&1,计算公式为:
[0030]
[0031] 步骤S604:根据权重计算结果,调整下一次训练时样本的权重,调整公式如下:
[0032]
[0033] 其中 1 = 1,2,.",111,1^为归一化算子;
[0034] 步骤S605:t次迭代后,得到t组弱分类器函数f(gl,ai),并由这些弱分类器函数共 同构成了最终的BP-AdaBoost强分类器:
[0035]所述步骤S103中,所述图片金字塔通过如下方式得到:
[0036]使用缩放因子s = 2_k/8,将视频帧的原图像进行缩放得到19层的精密采样金字塔, 所述精密采样金字塔为由视频帧的原图像和18张缩放图像组成的层图像集,其中最小缩放 图像与滑动窗口检测法采用的窗口大小相同。
[0037]所述步骤S104中,所述快速图像特征金字塔计算方法具体为:
[0038]先计算出缩放因子为1、1/2、1/4的层图像的特征层,依据计算好的层图像的特征 层估算其左右层图像的特征层,特征估算公式为:
[0039] Cs ?R(Cs,,s/s,)(s/s,)-λΩ
[0040] 其中,Cs为待估算的特征层,其缩放因子为s,s'为事先己经计算好的层中与s距离
最近的层的缩放因子,其中 以心,8/8')表示将(^的尺寸缩放为原来的8/ 8' 〇 倍;λΩ是取决于具体特征的常系数,事先通过训练样本估计。
[00411所述步骤S105中,融合具体为:
[0042]步骤S901、标记BP-AdaBoost强分类器输出的检测窗口并进行转换,得到与视频帧 原图像对应的位置窗口,其中检测窗口和位置窗口由四个元素组成:左上角坐标、窗口高 度、窗口宽度和分类算法计算得到的置信分数;
[0043]步骤S902、采用非极大值抑制算法将位置窗口进行融合,具体为:
[0044]假设两个检测窗口分别为bbl和bb2,二者重合率ao计算公式如下:
[0045]
[0046] 当重合率ao〈0时,两个检测窗口不做任何处理,其中Θ = 〇. 5;
[0047]当重合率ao>0时,则再计算两个检测窗口的重合面积阈值,假设抑制窗口为BBU,其 检测分数为sd、高度为hu,被抑制窗口为BBd,其检测分数为sd、高度为hd,则抑制窗口 BBU与被 抑制窗口 BBd的重合面积阈值为:
[0048]
[0049 ]当重合面积阈值结果为0.65时,不采用动态阈值抑制,其中α = 〇. 7;
[0050]当重合面积阈值小于0.65时,采用动态阈值抑制
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1