一种行人/车辆检测方法与流程

文档序号:14951068发布日期:2018-07-17 22:33阅读:225来源:国知局

本发明涉及视频安防领域,尤其涉及一种行人/车辆检测方法。



背景技术:

现有的行人/车辆检测算法大都部署在后端服务器,服务器需要接入前端摄像机视频流才能进行算法分析,这对网络带宽提出了较高的要求,同时后端视频解码也占用了服务器相当一部分的计算资源。将检测算法部署在前端摄像机,将计算压力分担在每个摄像机中,大大降低了服务器端的压力,并且系统实施部署快捷方便。但是前端摄像机处理芯片的计算力较弱,运行在摄象机端的算法需要高度优化和裁剪,优化和裁剪过程中带来了性能的下降,使得行人/车辆检测精度不高,误报较多。

近些年来基于卷积神经网络的深度学习算法在图像检测识别领域取得了很好的效果,相比于传统的检测识别算法在精度上都有了很大的提升,但是由于卷积神经网络本身的计算量较大,如何在摄像机端使用仍然是一个难点。



技术实现要素:

本发明所要解决的技术问题是提供一种行人/车辆检测方法,解决了高清图像数据量大,前端摄像机计算力有限的问题,提高了检测分类的准确性。

本发明解决上述技术问题的技术方案如下:一种行人/车辆检测方法,包括以下步骤:

(1)通过摄像装置采集一帧包括人脸/车辆的视频图像;

(2)基于采集的所述视频图像进行下采样,得到低分辨率图像序列;

(3)通过前景检测算法从所述低分辨率图像序列中抠取前景团块区域;

(4)计算所述前景团块区域在视频图像中的位置,并通过行人/车辆检测算法实现行人/车辆的检测和分类。

本发明的有益效果是:在低分辨率下通过前景检测算法,进行前景团块区域提取,大大降低了后续行人车辆检测算法的分析的区域,由于采用了低分辨率图像分析保证了前景检测算法的实时和高效;利用低分辨率下得到的前景团块的位置信息转换到高清图像中,在高清图像中抠取需要分析的区域,这样保证分析区域有足够的图像细节信息,通过卷积神经网络实现行人/车辆检测和分类,提高检测分类的准确性,同时计算效率大大提高。

在上述技术方案的基础上,本发明还可以做如下改进。

进一步,所述步骤(3)的具体过程为:

(31)背景建模:

基于核函数密度估计对图像序列中的像素点进行背景建模,具体过程为:

设x1,x2,...xn为缓存的背景图像序列中的n个像素点特征值,则t时刻象素点特征值xt的概率为:

其中,pr(xt)表示将特征值xt判断为背景的概率,d表示颜色通道的数目,这里d=3,假设颜色通道是统计独立的,σj表示第j个颜色通道的标准差,通过缓存的背景图像序列计算得到,表示t时刻第j个颜色通道的特征值,表示图像序列中第i幅背景图像对应象素点的第j个通道;

为了增加模型抵抗噪声的能力,对标准差设置最小值σj=max(δ,σj),这里δ=4,n=12,t=1、2、3……n;

(32)图像二值化:

将背景中各象素点特征值的概率与阈值进行比较,得到从背景中分离出的前景区域:

其中,t=1、2、3……n,255表示前景,0表示背景,t为阈值。

(33)降噪预处理:

根据形态学滤波将前景区域连通形成前景团块,过滤小面积噪声区域,得到前景团块位置信息:

(34)前景团块跟踪:

前景团块跟踪包括:前景团块位置预测,前景团块特征选择,前景团块关联匹配和前景团块特征更新;

前景团块位置预测:

采用估计团块速度的方式,根据当前帧及前一帧前景团块位置信息估计前景团块在下一帧的位置,如下式所示:

其中,t=1、2、3……n,分别表示t时刻前景团块在x方向和y方向的速度,n为时间窗口;x和y分别表示前景团块外接矩形框中心的x坐标和y坐标;xt-n和yt-n分别表示t-n时刻前景团块在x方向和y方向的坐标;xt-n-1和yt-n-1分别表示t-n-1时刻前景团块在x方向和y方向的坐标;

前景特征选择:

选择前景团块面积s和前景团块外接矩形框的中心c;

前景团块关联匹配:

根据相关跟踪原理,当前帧前景团块与待匹配的前景团块满足下式时才进行特征匹配,即:

其中,γ为搜索距离阈值,

特征匹配由面积s和中心c点两部分组成,即匹配准则如下式:

其中,ω为特征的权重因子,表示当前帧前景团块与待匹配的前景团块中心点的距离,距离越小,相似度越高,γ为搜索距离阈值,表示当前帧前景团块与待匹配的前景团块面积大小的差异程度,t为匹配的误差上限;

前景团块特征更新:

采用一阶平滑的方式更新,如下式所示:

其中α为更新因子;

(35)背景更新:

采用选择性更新和盲目更新相结合的方式,采用基于象素的盲目更新方式过滤降噪预处理中的小面积噪声区域;采用基于区域的选择性更新前景团块区域。

进一步,所述步骤(4)的具体过程为:

根据图像缩放比例关系计算得到的前景团块外接矩形框在视频图像中的外接矩形框;

保持长边不变,短边扩展到长边的长度,将前景团块区域外接矩形框修正为正方形框;

将正方形框向外扩展,然后缩放成固定尺寸的图像;

行人/车辆检测算法采用基于ssd卷积神经网络的深度学习算法,并对ssd卷积神经网络进行裁剪,将输入的固定尺寸的图像与预设的不同类型不同尺寸的特征图像进行比较,实现行人/车辆的检测和分类。

附图说明

图1为本发明检测方法流程图;

图2为本发明前景检测算法流程图;

图3为本发明前景团块区域外接矩形框修正示意图;

图4为本发明基于ssd卷积神经网络的深度学习算法流程图。

具体实施方式

以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。

近几年来随着前端摄像机处理器计算力的提升,加之基于卷积神经网络的深度学习算法在图像检测识别领域的突出性能表现,使得高准确度低误检的行人/车辆检测算法前端化成为可能,本文正是在这样的背景下,提出了一种行人/车辆检测方法。

如图1、图2所示,首先从高清视频流中抓取高清图像,高清图像进行下采样,得到低分辨率图像,在低分辨率图像中通过运动检测算法前景团块的位置信息,根据坐标变换关系得到前景团块在高清图像中的位置,在原高清图像中抠取前景团块所在的区域,送入行人车辆检测模块得到行人/车辆的位置信息。

其中包括两部分关键技术:前景检测算法和行人车辆检测算法。对整个方法来说,希望前景检测算法能够尽可能准确的检测出前景区域的位置,同时减小误报区域,进而减小后续行人车辆检测算法的压力,行人车辆检测算法在保证检测精度的同时运算速度要尽量快。

一种行人/车辆检测方法,包括以下步骤:

(1)通过摄像装置采集一帧包括人脸/车辆的视频图像;

(2)基于采集的所述视频图像进行下采样,得到低分辨率图像序列;

(3)通过前景检测算法从所述低分辨率图像序列中抠取前景团块区域;

(4)计算所述前景团块区域在视频图像中的位置,并通过行人/车辆检测算法进行行人/车辆的定位和分类。

所述步骤(3)的前景检测算法主要包括背景建模、图像二值化、降噪预处理、前景团块跟踪和背景更新五部分,其具体过程为:

(31)背景建模:

由于监控场景背景是静止的,这里采用基于核函数密度估计的背景建模,该方法不需要对背景象素进行参数化建模,同时能保留背景的多个模态,实际场景的适应性较强。

基于核函数密度估计对图像序列中的像素点进行背景建模,具体过程为:

设x1,x2,...xn为缓存的背景图像序列中的n个像素点特征值,则t时刻象素点特征值xt的概率为:

其中,pr(xt)表示将特征值xt判断为背景的概率,d表示颜色通道的数目,这里d=3,假设颜色通道是统计独立的,σj表示第j个颜色通道的标准差,通过缓存的背景图像序列计算得到,表示t时刻第j个颜色通道的特征值,表示图像序列中第i幅背景图像对应象素点的第j个通道;

为了增加模型抵抗噪声的能力,对标准差设置最小值σj=max(δ,σj),这里δ=4,n=12,t=1、2、3……n;

(32)图像二值化:

将背景中各象素点特征值的概率与阈值进行比较,得到从背景中分离出的前景区域:

其中,t=1、2、3……n,255表示前景,0表示背景,t为阈值。

(33)降噪预处理:

根据形态学滤波将前景区域连通形成团块,过滤小面积噪声区域,得到前景团块位置信息:

(34)前景团块跟踪:这里对团块进行跟踪主要是为了对背景更新提供区域信息。

前景团块跟踪包括:前景团块位置预测,前景团块特征选择,前景团块

关联匹配和前景团块特征更新;

前景团块位置预测:

采用估计团块速度的方式,根据当前帧及前一帧前景团块位置信息估计前景团块在下一帧的位置,有利于提高后续关联匹配的精度如下式所示:

其中,t=1、2、3……n,分别表示t时刻前景团块在x方向和y方向的速度,n为时间窗口;x和y分别表示前景团块外接矩形框中心的x坐标和y坐标;xt-n和yt-n分别表示t-n时刻前景团块在x方向和y方向的坐标;xt-n-1和yt-n-1分别表示t-n-1时刻前景团块在x方向和y方向的坐标;

前景特征选择:

选择了相对稳定可靠的前景团块面积s和前景团块外接矩形框的中心c;

前景团块关联匹配:

前景团块关联匹配就可以找到前一帧团块在当前帧的位置,实现前景团块的定位。根据相关跟踪原理,只要保证足够图像采样率的情况下,同一个团块在相邻两帧之间的位置变化不会太大,因此可以将团块的搜索范围限定在一个较小的距离范围,同时也大大降低了误匹配的风险。当前帧前景团块与待匹配的前景团块满足下式时才进行特征匹配,即:

其中,γ为搜索距离阈值,

特征匹配由面积s和中心c点两部分组成,即匹配准则如下式:

其中,ω为特征的权重因子,表示当前帧前景团块

待匹配的前景团块中心点的距离,距离越小,相似度越高,γ为搜

索距离阈值,表示当前帧前景团块与待匹配的前景团

面积大小的差异程度,t为匹配的误差上限,防止误匹配;

前景团块特征更新:

采用一阶平滑的方式更新,如下式所示:

其中α为更新因子;

(35)背景更新:

背景更新策略对于维护背景模型来说至关重要。这里采用选择性更新和盲目更新相结合的方式。采用基于象素的盲目更新方式过滤降噪预处理中的小面积噪声区域;采用基于区域的选择性更新前景团块区域。只有当前景团块静止时间超过设定时间时才将前景团块区域强制更新到背景中,用于解决背景更新中的死锁问题。这样可以保证前景团块和短暂停留的团块不会被更新到背景中。

如图3、图4所示,所述步骤(4)的具体过程为:

通过前景检测得到了前景团块在低分辨率图像中的位置,即外接矩形框,如图3左图所示;

根据图像缩放比例关系计算得到的前景团块外接矩形框在视频图像中的外接矩形框,如图3中间图所示;

保持长边不变,短边扩展到长边的长度,将团块区域外接矩形框修正为正方形框;

将正方形框向外扩展,然后缩放成固定尺寸的图像,这里为200个象素,如图3右图所示;

行人/车辆检测算法采用基于ssd卷积神经网络的深度学习算法,将输入的固定尺寸的图像与预设的不同尺度上的特征图像进行比较,得到行人/车辆的定位和分类。

如图4所示,针对摄像机处理芯片计算力较弱的情况,对ssd卷积神经网络进行了裁剪。具体的调整如下:首先这里设定检测类别为5类,依次为背景,行人,非机动车(直行车,三轮车),轿车,卡车(包括公交车),送入神经网络的图像尺寸为200象素x200象素,基础网络由vgg16网络替换为squeezenet网络,最后的输出分类改为5类。

网络结构图如下:

输入图像为rgb3个颜色通道的图像,图像尺寸为200x200,基础网络采用了裁剪后的squeezenet网络,squeezenet网络保留了fire9之前的网络,fire9输出的特征图像尺寸为12x12。conv10,conv11,conv12,conv13为新增的层。在fire9和conv10,conv11,conv12,conv13之间通过池化层连接,建立了5个不同尺度上的特征图像,尺寸依次为12x12,6x6,3x3,2x2和1x1,输入图像为200x200象素的rgb彩色图像,经过一次前向推演,在fire9和conv10,conv11,conv12,conv13这五个关键的网络层会输出5组不同尺寸的特征图像,通过这5组特征图像可以检测5组不同尺寸的物体(这里是行人和车辆)。保证了神经网络能够检测不同尺寸大小的物体,最后通过detectionout这一层网络实现检测结果聚类,阈值化输出。在ssd卷积神经网络的训练过程中,图片数据源于实际的监控场景,并且通过人工标注了行人车辆在图片中的位置,squeezenet中的权重是预先在imagenet数据集中训练得到的权重,整个训练采用权值微调的方式进行,通过大约50000轮迭代完成训练。

本发明在低分辨率下通过前景检测算法,进行前景团块区域提取,大大降低了后续行人车辆检测算法的分析的区域,由于采用了低分辨率图像分析保证了前景检测算法的实时和高效;利用低分辨率下得到的前景团块的位置信息转换到高清图像中,在高清图像中抠取需要分析的区域,这样保证分析区域有足够的图像细节信息,通过卷积神经网络实现行人/车辆检测和分类,提高检测分类的准确性,同时计算效率大大提高。

以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1