一种融合时域信息和空域信息的行人检测方法

文档序号：9288587阅读：556来源：国知局

一种融合时域信息和空域信息的行人检测方法
【技术领域】
[0001] 本发明涉及一种检测方法，属于图像处理技术领域，具体涉及的是一种融合时域信息和空域信息的行人检测方法。
【背景技术】
[0002] 近年来，行人检测越来越受到人们的关注，例如，在公安视频监控系统中，对场景中出现的可疑人物进行预警，从而预防犯罪和群体性事件的发生，保障人民群众的生命和财产安全；再例如，在超市、购物中心等商业活动场所，通过对出现在监控视频中的行人进行检测跟踪，能够实现客流量统计、人群密度分析，客流分布密度等功能；再例如，在大型展会及旅游景点等重点监控区域，通过对行人检测分析，可以实现人群聚集程度的检测和分析，从而及早预防群体性踩踏事件的发生。
[0003] 然而，现有的行人检测方式，大多停留在视频录像、存储、查询检索和分析等阶段，对于行人的运动检测存在着预判不足的缺陷，因此，这也令相关的监控人员难以针对特定场景及时做出有效的预防措施。

【发明内容】

[0004] 本发明的目的在于提供一种融合时域信息和空域信息的行人检测方法，主要解决现有的行人检测方式存在对特定场景预警能力不足的问题。
[0005] 为了实现上述目的，本发明采用的技术方案如下：
[0006] -种融合时域信息和空域信息的行人检测方法，包括以下步骤：
[0007] (1)于特定场景中实时采集监控视频图像；
[0008] (2)根据采集的图像，采用混合高斯模型进行背景建模，检测场景中的运动前景；
[0009] (3)根据检测到的运动前景，采用滑动窗口策略分别提取空间域HOG特征、时间域 HOG特征、空间域LBP特征和时间域LBP特征；
[0010] ⑷根据步骤⑶提取到的特征，利用随机森林分类器对上述特征进行分类判别，判断当前滑动窗口所覆盖的区域内是否包含有行人，然后输出结果。
[0011] 进一步地，所述步骤（3)中，时间域HOG特征采用以下公式求取：
[0012] α， ~ 'A - IiWv τΛ -u (ν τΛ I
[0013]
[0014] 式中W t(x，y)表示视频中第t帧的像素位置（x，y)的梯度幅值，Ht (x，y)和 Htl(x，y)分别表示视频中第t帧和第（t-Ι)帧的像素位置（x，y)的像素值，Θ表示视频中第t帧的方向，G t表示视频中第t帧的梯度值，GdP G y分别表示视频中第t帧在水平方向和垂直方向上的梯度值。
[0015] 再进一步地，所述步骤（3)中，时间域LBP特征的LBP值采用下列公式计算得到：
[0016] LBPt= f t(x, y)-ft ! (x, y)
[0017] 式中，LBPt表示视频第t帧的LBP值，f t(x，y)和ft Jx，y)分别表示视频第t帧和第（t-Ι)帧的像素位置（x，y)处的像素值。
[0018] 更进一步地，所述步骤（3)中，空间域LBP特征和时间域LBP特征均采用图像的分块LBP直方图表示，其具体过程如下：
[0019] (a)将图像划分为NXN的图像子块，并计算每个图像子块中每个像素的LBP值，N 为自然数；
[0020] (b)对每个子块进行直方图统计，得到NXN个子块的直方图；
[0021] (c)将NXN个子块的直方图串联起来，构成空间域LBP特征向量或时间域LBP特征向量，用于描述该图像的纹理特征。
[0022] 与现有技术相比，本发明具有以下显著效果：
[0023] (1)本发明通过采集监控视频图像、运动前景检测、空域和时域特征提取、随机森林分类的方式，大幅提高了对特定场景进行行人运动检测的准确性，有效增强了对特定场景的预警能力，使相关监控人员能够针对行人运动情况及时做出一些有针对性的预防措施，从而最大程度上避免和应对突发情况的发生。
[0024] (2)本发明采用图像的分块LBP直方图表示，并对每个分块提取空间域LBP特征和时间域LBP特征，从而可以很好地避免噪声对LBP特征的干扰。
[0025] (3)本发明设计合理，流程清晰、明了，其具有广泛应用前景，非常适合用于安防视频监控方面的行人检测。
【附图说明】
[0026] 图1为本发明的流程示意图。
【具体实施方式】
[0027] 下面结合附图和实施例对本发明作进一步说明，本发明的实施方式包括但不限于下列实施例。
[0028] 实施例
[0029] 如图1所示，本发明提供了一种融合时域信息和空域信息的行人检测方法，尤其适合于安防视频监控领域的行人检测。本发明主要由监控视频图像采集、行人运动检测、行人特征提取、随机森林分类判别及结果输出几大步骤组成。
[0030] -、图像采集
[0031] 在特定场景中（例如公安视频监控的场景），利用视频监控器实时采集监控视频图像，然后输入到监控中心。
[0032] 二、运动检测
[0033] 本发明采用混合高斯模型进行背景建模，从而对行人运动前景进行检测。在混合高斯背景模型中，像素之间的颜色信息互不相关，对各像素点的处理都是相互独立的。对于视频图像中的每一个像素点，其值在序列图像中的变化可看作是不断产生像素值的随机过程，即用高斯分布来描述每个像素点的颜色呈现规律，即：呈现单模态（单峰）或者多模态 (多峰）。对于多峰高斯分布模型，图像的每一个像素点按不同权值的多个高斯分布的叠加来建模，每种高斯分布对应一个可能产生像素点所呈现颜色的状态，各个高斯分布的权值
[0034] 和分布参数随时间更新。随机变量X的观测数据集{χρ χ2,…，χΝ}，xt= (r t, gt, bt)为t时刻像素的样本，则单个采样点xt其服从的混合高斯分布概率密度函数：
[0035] .......... ..... _ ........j第i个高斯分布，μ lit为其均值，τ lit为其协方差矩阵，δ iit为方差，I为三维单位矩阵，ω iit为t时刻第i个高斯分布的权重。
[0036] 混合高斯模型的详细计算流程：
[0037] (1)每个新的像素值Xt同当前K各模型按照下面的公式进行比较，直到找到匹配新像素的分布模型，即：同该模型的均值偏差在2. 5 σ内：
[0038] Xt-yljtl| ^ 2.5〇i>tl
[0039] 如果所匹配的模式符合背景要求，则该像素属于背景；否则，属于前景。
[0040] (2)各个模式的权重系数按照下面的公式进行更新，其中α是学习速率，对于匹配的模才M = 1M = η彼义措：^1%柯重系数进行归一化处理：
[0041 ]
[0042] 未匹配的模式其均值μ和标准差σ不变，匹配模式的参数按照下面的公式进行更新：
[0043] ρ = α * n (Xt| μ k, σ k)
[0044] μ t= (1-p )* μ t i+P *Xt
[0045] < -μ/
[0046] 如果第I步当中没有任何模式匹配，则权重最小的模式将被替代，即该模式的均值为当前像素值，标准差为初始最大值，权重为最小值。
[0047] (3)各模式根据w/ α 2按照降序进行排列，权重大、标准差小的模式排列考前。
[0048] 〈心播谋前R +措才你先费县-R、：黾下面的公式，参数T表示背景所占的比例：
[0049]
[0050] 三、特征提取
[0051] 根据检测到的运动前景，需要提取特征。本发明采用滑动窗口策略来提取行人特征，提取的特征有四种，分别是：空间域的HOG特征、时间域的HOG特征、空间域的LBP特征和时间域的LBP特征。
[0052] 空间域的HOG特征
[0053] 空间域的HOG特征就是平时常见的HOG特征，它是一种对图像局部重叠区域的密集型描述符，它通过计算局部区域的梯度方向直方图来构成特征。能够很好地描述人体的边缘，同时对光照变化和小量的偏移不敏感。HOG特征结合SVM分类器已经被广泛应用于图像识别中，尤其在行人检测中获得了极大的成功。
[0054] HOG特征的计算需要用到梯度的概念，图像中像素点（X，y)的梯度为：
[0055] Gx(x，y) = H(x+1，y)-H(x_l，y)
[0056] G y(x，y) = H(x，y+l)_H(x，y-1)
[0057] 上面式子当中的6：!"，7)，6￥"，7)，!1(1，7)分别表示水平方向的梯度、垂直方向的梯度以及像素值。像素点（x，y)处的梯度幅值和梯度方向分别是：
[0058]
[0059]

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：薛晓利;朱小军;柳斌;
技术所有人：成都市高博汇科信息科技有限公司;
我是此专利的发明人

上一篇：一种基于卷积神经网络的人脸亲属关系识别方法及装置的制造方法
上一篇：一种视频场景检测方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。