基于视频中运动先验信息的行人检测方法及装置的制造方法_2

文档序号：9327380阅读：来源：国知局

实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。
[0036] 实施例1
[0037] 本发明实施例提供一种基于视频中运动先验信息的行人检测方法，如图1所示，所述基于视频中运动先验信息的行人检测方法包括：
[0038] SI 1、通过背景差分的方法提取待检测视频中的运动信息。
[0039] 进一步地，所述通过背景差分的方法提取待检测视频中的运动信息可以包括：
[0040] S111、针对待检测视频的开头片段，进行运动检测背景模型的初始化。
[0041] 具体地，可以针对待检测视频，截取视频的前10秒片段，每秒取3帧，共30帧，用于基于ViBe方法的运动检测背景模型的初始化。
[0042] 假设X为图像中的某一像素位置，V(X)为该像素位置的像素值，SR(v(x))为以X 为中心、R为半径的区域的像素集合，其中R= 15,BG(X) = IV1, V2，…，VN}为X位置周围的背景样本集，BG即为背景模型，其中N = 20。
[0043] 背景模型初始化过程如图3所示。，随着帧数增加，"鬼影"逐渐消失，背景模型越来越稳定。并且，运动速度快的目标更容易在初始化过程中消失，说明视频中的运动目标运动速度越快，背景模型初始化速度越快。
[0044] S112、对于所述待检测视频中的当前视频帧图像，与所述背景模型进行差分，得到前景图像，即运动先验?目息。
[0045] 具体地，对于当前视频帧图像I，基于ViBe方法，与背景模型进行差分，求得前景图像。
[0046] 对于位置X的像素，如果SR(ν(χ)) (? BG(X)小于预设的阈值，则认为X为前景点，否则为背景点。最终得到二值化的前景图像Μ，即运动先验信息。
[0047] S113、对所述运动先验信息进行形态学滤波，以及腐蚀和膨胀处理，得到处理后的运动信息。
[0048] 具体地，对前景运动信息M进行形态学滤波，如图4所示，剔除空洞和"鬼影"现象。采用游程编码方式进行连通区域分析，使得单个的二值像素点变成有意义的连通区域。然后再进行腐蚀和膨胀处理，得到处理后的运动信息。由于在行人检测过程中，人体的轮廓信息是重要的检测依据，所以需要尽量设置较大的膨胀阈值，使得运动区域充分的覆盖人体的轮廓信息，防止下一步特征提取过程的信息丢失。
[0049] S12、对所述运动信息中的运动目标进行区域聚类，得到运动密集区域块。
[0050] 具体地，依据检测面积最小化原则对所述运动信息中的运动目标进行区域聚类，将相互覆盖面积较大的运动目标聚集为一个运动密集区域块。聚类过程中，要保证对最终得到的运动密集区域块进行特征提取时计算量最小，即面积和最小。
[0051] 用方框框出前景图像M中的运动子块b (X，y，w，h)，其中X和y是运动块的左上角位置坐标，w和h为宽和高。行人检测模型的分辨率是128X64,其中行人大小为100X40，为了增加人体的轮廓信息，并提升行人定位精度，扩展所有运动子块的边缘：
[0053] 得到运动块集合Block = [by b2，…，bj。然后，根据检测面积最小化原则，即总的待检测运动块面积和最小，对运动块集合进行聚类，实现对运动块较多的区域聚集为一个运动密集区域块。定乂：
[0055] 将满足I h U b I < I Vbj I的所有运动块合并为新的运动密集区域块B，其中B = Id1 U b j U…，得到最终的运动密集区域块集合Block = [B η B2，…，BJ，对于任意&和B。满足 Bi U B」> B 其中 Bi= (X ;，y;，Wi, hi; {b η …，bni})，其中 Od1,…，bni}是构成 Bj的运动子块集合。
[0056] S13、对所述待检测视频中的视频帧图像依据所述运动密集区域块进行分割处理，分别建立图像金字塔。
[0057] 根据Block对原帧图像进行分割，对每个运动密集区域块分别建立图像金字塔，如图5所示，并根据每个运动子块的尺度大小，确定图像金字塔的尺度缩放范围。
[0058] 对每个运动密集区域分别建立图像金字塔，如图5所示。已知运动密集区域中每个运动子块的尺度，可以预估待行人的尺度范围。当运用滑窗方法检测行人时，需要基于一个分辨率为128X64的窗口，以固定的步长在每层图像金字塔中滑动，并对每个滑窗结果进行分类。在建立图像金子塔时，只需要保证运动密集区域块中的所有行人，在某层金子塔图像中，分辨率满足或者接近100X40。对于每个运动密集区域块，首先求得所有运动子块的最小宽w_和高h_，以及最大的宽和高h_，得出该运动密集区域块建立图像金字塔需要缩放的尺度范围：
[0060] 其中，图像金字塔的缩放尺度步长为71: X 〇
[0061] S14、对所述运动密集区域块的每层图像金字塔进行特征提取，仅提取运动区域及附近像素的特征信息。
[0062] 对运动密集区域块的每层图像金字塔进行特征提取，特征提取过程中，以前景图像M作为依据，只对运动区域的像素进行相应变换，背景区域不做处理。如图6所示，特征数据中剔除掉了复杂背景的干扰，将背景区域的特征置零，使得特征显著区域集中于行人周围，相当于是在一个简单背景下的行人检测，提升了检测精度，也减小了特征变换的计算量，加速了特征提取的过程。
[0063] S15、运用滑窗的方式，检测所述运动密集区域块的每层金字塔图像中的行人，定位行人目标，获取行人检测结果。
[0064] 其中，在步骤Sll之前，所述方法还包括：
[0065] 基于大量行人样本和非行人背景样本，离线训练行人检测分类器。
[0066] 本发明采用分辨率为128X64的行人检测模型，训练样本中的行人样本和非行人背景样本图像的分辨率均为128X64,其中行人样本图像中的有效行人区域占比为 100 X 40。本发明的行人检测基本方法基于DolIar等人提出的积分通道特征实现，该特征主要基于对原图像进行10种变换映射，如图2所示。
[0067] 3个LUV颜色通道变换：输入原始图像I为RGB颜色空间，将其转化为LUV颜色空间表示，图像I在LUV颜色空间上的三个通道信息组成LUV颜色通道图，即/f T，k = 1, 2, 3〇
[0068] 1个梯度赋值变换：梯度赋值通道M的计算基于图像I的灰度图Igray，计算方法如下：
[0070] 6个梯度方向变换：首先要要基于灰度图IgraH+算每个像素位置的梯度方向：
[0072] 然后把Θ (x，y)离散为六个梯度方向i
，得到六个方向上的梯度赋值通道图：
[0073] Hk= M · 1 [ Θ (X，y) = Θ k

完整全部详细技术资料下载

当前第2页1 2 3 4