一种融合时域信息和空域信息的行人检测方法_2

文档序号：9288587阅读：来源：国知局

>[0060] 干个像素的单元（cell)，把梯度方向平均划分为9个区间（bin)，在每个单元里面对所有像素的梯度方向在各个方向区间进行直方图统计，得到一个9维的特征向量，每相邻的4个单元构成一个块（block)，把一个块内的特征向量联起来得到36维的特征向量，用块对样本图像进行扫描，扫描步长为一个单元。最后将所有块的特征串联起来，就得到了人体的特征。例如，对于64*128的图像而言，每2*2 的单元（16*16的像素）构成一个块，每个块内有4*9 = 36个特征，以8个像素为步长，那么，水平方向将有7个扫描窗口，垂直方向将有15个扫描窗口。也就是说，64*128的图片，总共有36*7*15 = 3780个特征。
[0061] 时间域的HOG特征
[0062] 传统的HOG特征主要是以空间位置信息来计算特征，而本发明中的时间域的HOG 特征则是以不同时间的视频帧之间来求取HOG特征。
[0063] 即，时域的梯度计算公式为：
[0064] Gt (X，y) = Ht (X，y) -Ht ! (X，y)
[0065] 时域的梯度幅值和方向计算公式为：
[0066] G1t(x, y) = |Ht(x, y)-Ht ! (x, y)
[0067]
[0068] A屮，Gt U，y;衣不视频屮弟t ψ贝的傢素位置（x，y)的梯度值，Ht (x，y)和Ht ! (x， y)分别表示视频中第t帧和第（t-Ι)帧的像素位置（x，y)的像素值，G' t(x，y)表示视频中第t帧的像素位置（X，y)的梯度幅值，Θ表示视频中第t帧的方向，Gt表示视频中第t 帧的梯度值，GdP Gy分别表示视频中第t帧在水平方向和垂直方向上的梯度值。
[0069] 空间域的LBP特征
[0070] LBP (Local Binary Pattern，局部二值模式）是一种用来描述图像局部纹理特征的算子；它具有旋转不变性和灰度不变性等显著的优点。提取的特征是图像局部的纹理特征。
[0071] 原始的LBP算子定义为在3X3的窗口内，以窗口中心像素为阈值，将相邻的8个像素的灰度值与其进行比较，若周围像素值大于中心像素值，则该像素点的位置被标记为 1，否则为0。这样，3X3邻域内的8个点经比较可产生8位二进制数（通常转换为十进制数即LBP码，共256种），即得到该窗口中心像素点的LBP值，并用这个值来反映该区域的纹理信息。
[0072] 原始的LBP特征对噪声较为敏感，在实际应用中，通常是以图像的分块LBP直方图表示，具体计算步骤如下：
[0073] (1)将图像划分为NXN的图像子块，并计算每个图像子块中每个像素的LBP值，N 为自然数；
[0074] (2)对每个子块进行直方图统计，得NXN图像子块的直方图；
[0075] (3)利用NXN个子块的直方图，描述该图像的纹理特征。
[0076] 时间域的LBP特征
[0077] 跟空间域LBP特征的计算方法类似，这里的时间域LBP特征的计算并没有利用像素同周围邻域之间进行比较运算，而是将当前像素值同前后帧对应像素位置的像素值之间进行比较运算。即：
[0078] LBPt= f t (X，y) _ft ! (X，y)
[0079] 类似的，在实际应用过程中，依然需要将图像划分为NXN的子块，对每个子块内进行时域LBP特征计算。然后对每个子块进行直方图统计，得到时域LBP特征描述。
[0080] 四、随机森林分类判别及结果输出
[0081] 根据上述提取到的空间域HOG特征、时间域HOG特征、空间域LBP特征和时间域 LBP特征，利用随机森林分类器对行人特征进行分类判别，然后输出结果。随机森林分类器是一个利用随机方式建立的，包含多个决策树的分类器，即，随机森林算法是一种基于决策树的分类器集成算法。随机森林分类器具有需要调整的参数较少、不必担心过度拟合、分类速度较快、能高效处理大样本数据、能估计哪个特征在分类中更重要以及较强的抗噪音能力等特点。随机森林算法的随机性主要体现在两个方面：（1)训练每棵树时，从全部训练样本中选取一个子集进行训练（即bootstrap取样）；用剩余的数据进行评测，评估其误差； (2)在每个节点，随机选取所有特征的一个子集，用来计算最佳分割方式。
[0082] 随机森林算法的计算步骤如下：
[0083] (1)从原始训练数据中随机抽取样本生成K个自助样本集，每个自助样本集是每个决策树分类器的全部训练样本数据；
[0084] (2)每个自助样本集生长为单个决策树，在树的每个节点处从M个特征当中随机挑选m(m〈〈M)个特征，按照节点不纯度最小的准则从m个特征中选择一个特征进行分支生长；将这棵树进行充分生长，使得每个节点的不纯度达到最小，不进行通常的减枝操作；
[0085] (3)根据生成的多个树分类器对新的数据进行预测，分类结果按照每个树分类器的投票来决定。
[0086] 本发明在行人检测方式中融合了时域信息和空域信息，并利用随机森林分类器对这些时域信息和空域信息进行分类判断，从而很好地检测出了行人的运动前景，实时掌握相关信息，进而可以针对一些特定场景和行人运动情况做出有效的预判措施，实现预期的效果。
[0087] 上述实施例仅为本发明较佳的实现方式之一，不应当用以限制本发明的保护范围，凡在本发明的主体设计思想和精神下对本发明技术方案做出的改动或润色，或进行等同置换，其解决的技术问题实质上仍与本发明一致的，均应当在本发明的保护范围之内。
【主权项】
1. 一种融合时域信息和空域信息的行人检测方法，其特征在于，包括w下步骤： (1) 于特定场景中实时采集监控视频图像； (2) 根据采集的图像，采用混合高斯模型进行背景建模，检测场景中的运动前景； (3) 根据检测到的运动前景，采用滑动窗口策略分别提取空间域册G特征、时间域册G 特征、空间域LBP特征和时间域LBP特征； (4) 根据步骤（3)提取到的特征，利用随机森林分类器对上述特征进行分类判别，判断当前滑动窗口所覆盖的区域内是否包含有行人，然后输出结果。2. 根据权利要求1所述的一种融合时域信息和空域信息的行人检测方法，其特征在于，所述步骤（3)中，时间域HOG特征采用W下公式求取： G't(X，y) =IHt(X，y)-Ht1 (X，y)式中，G't(X，y)表示视频中第t帖的像素位置（X，y)的梯度幅值，Ht(X，y)和Ht1 (X，y) 分别表示视频中第t帖和第（t-1)帖的像素位置（X，y)的像素值，0表示视频中第t帖的方向，Gt表示视频中第t帖的梯度值，Gy和Gy分别表示视频中第t帖在水平方向和垂直方向上的梯度值。3. 根据权利要求2所述的一种融合时域信息和空域信息的行人检测方法，其特征在于，所述步骤（3)中，时间域LBP特征的LBP值采用下列公式计算得到： LBPt=ft(x,y)-ft1(x,y) 式中，LBPt表示视频第t帖的LBP值，ft(x，y)和fti(x，y)分别表示视频第t帖和第 (t-1)帖的像素位置（x，y)处的像素值。4. 根据权利要求3所述的一种融合时域信息和空域信息的行人检测方法，其特征在于，所述步骤（3)中，空间域LBP特征和时间域LBP特征均采用图像的分块LBP直方图表示，其具体过程如下： (a)将图像划分为NXN的图像子块，并计算每个图像子块中每个像素的LBP值，N为自然数；化）对每个子块进行直方图统计，得到NXN个子块的直方图； (C)将NXN个子块的直方图串联起来，构成空间域LBP特征向量或时间域LBP特征向量，用于描述该图像的纹理特征。
【专利摘要】本发明公开了一种融合时域信息和空域信息的行人检测方法，包括：(1)于特定场景中实时采集行人图像；(2)根据采集的图像，采用混合高斯模型进行背景建模，检测行人运动前景；(3)根据检测到的运动前景，分别提取出行人特征中的空间域HOG特征、时间域HOG特征、空间域LBP特征和时间域LBP特征；(4)根据步骤(3)提取到的特征，利用随机森林分类器对行人特征进行分类判别，然后输出结果。本发明设计合理，流程简洁，其通过在行人检测方式融入时域信息和空域信息的方式，大幅提高了对特定场景进行行人运动检测的准确性，有效增强了对特定场景的预警能力，进而为相关监控人员及时采取预防措施提供了重要的保障。
【IPC分类】G06T7/20, G06K9/00, G06K9/46
【公开号】CN105005773
【申请号】CN201510443436
【发明人】薛晓利, 朱小军, 柳斌
【申请人】成都市高博汇科信息科技有限公司
【公开日】2015年10月28日
【申请日】2015年7月24日

完整全部详细技术资料下载

当前第2页1 2