一种动态场景中基于区域均值核密度估计的运动目标检测方法

文档序号:6397196阅读:555来源:国知局
专利名称:一种动态场景中基于区域均值核密度估计的运动目标检测方法
技术领域
本发明涉及智能视频监控系统中运动目标检测的算法,尤其涉及一种动态场景中 基于区域均值核密度估计的运动目标检测算法。
背景技术
运动目标检测是目标识别、跟踪以及后期物体行为理解的基础,是智能监控系统 中的关键问题。在视频监控系统中都使用固定摄像头对目标区域进行监视,因此大多检测 算法假设在静止背景下,仅考虑光照、阴影等背景变换。但是在真实复杂场景中,静止场景 的假设是不存在的,例如喷泉、摇曳的树叶、水波等均导致背景的动态变化。此外,摄像机 也可能由于各种原因发生轻微抖动。因此,动态场景下运动目标检测算法已成为计算机视 觉领域研究的热点,受到广泛关注。目前,背景减除法是运动检测中最常使用的一种方法,基本原理是通过将当前帧 图像与背景图像进行相减运算并阈值化来实现运动检测。基于背景减除法的运动检测效果 主要取决于背景模型及其更新算法的优劣,其中背景模型分为基于像素点的背景模型和基 于区域或整体视频帧的背景模型。基于像素点的背景建模方法应用最为广泛,其典型算法为混合高斯模型。它将 每个像素的颜色或者灰度值用K个高斯分布的混合建模,其优点是模型简单,执行效率 高,但是它需要预先设定混合高斯的数目,而且当实际密度函数具有很大数量的峰值, 或者峰值经常变化时,其性能不佳。进而,Elgammal等人在“Non-parametric model for backgroundsubtraction,, (the 6th European Conference on Computer Version, Springer, Dublin, Ireland, 2000,751-767)中提出 了核密度估计(Kernel Density Estimation, KDE)的建模方法,利用最近的历史样本通过非参数估计的方法建立背景模 型。此方法不需要高斯模型的假设,非常灵活,能够动态适应复杂的密度函数的变化。 Sheikh 等人在"Bayesian modelingof dynamic scenes for object detection,,(IEEE transactions on pattern analysis andmachine intelligence,2005,27(11) 1778-1792)中进一步对KDE方法进行改进,在建立背景模型的基础上建立前景模型,同 时建模过程中使用包含颜色和位置信息的五维向量空间。这两种方法虽然使检测率大大 提高,但在背景更新过程需要消耗很大的内存存储历史样本,且更新速度慢。以上基于单 像素建模的方法存在的主要问题是忽略了一帧图像中像素间存在的空间相关性。因此 许多学者提出了基于区域或整体视频帧的背景建模方法。Oliver等人在“A Bayesian computer vision system for modeling human interactions" (IEEETransaction on Pattern Analysis and Machine Intelligence, 2000, 22 (8) :831_843)中对整幅背景图像 进行特征分解得到k帧的背景模型,考虑了背景模型的空间相关性。Eng等人在“Robust human detection within a highly dynamic aquatic environment in realtime" (IEEE Transactions on Image Processing. 2006,15(6) 1583-1600)中提出将图像分为互不交
4叠区域并进行聚类,建立基于区域的背景模型。 综上所述,现有的检测算法包含如下问题基于像素点的背景模型更新方法仅考 虑了背景的时域特性,且在动态场景背景不断变化的情况下,如果采用某一函数或多函数 的混合方法并不能准确描述像素点的时域特性,如果采用核密度估计方法虽然无需估计和 确定函数,直接利用样本进行背景的描述,但其在更新过程中,执行效率低,无法满足实时 要求;基于区域或整体视频帧的方法仅仅考虑了背景的空间相关性,其执行效率高,但检测 准确度低于基于像素的检测方法。

发明内容
本发明的技术解决问题为克服现有技术的不足,提出一种动态场景中基于区域 均值核密度估计的运动目标检测方法。该方法结合像素点的时间和空间特性,建立时空背 景模型和确定快速更新策略,进一步提出了邻域信息量的前景检测方法,提高了运动目标 检测的准确性和检测效率。本发明的技术解决方案一种动态场景中基于区域均值核密度估计的运动目标检 测方法,其特征在于包含时空背景建模、背景变化分类更新策略、邻域信息量运动目标前景 检测三部分。时空背景模型能够很好的描述动态复杂场景。但随着光照、天气等导致背景 不断变化,基于背景变化分类的更新策略能够保证背景模型的实时性。尽管利用准确的背 景模型,提高了运动目标提取的准确性,但背景中仍然会包含少量噪声点和背景模型中未 定义的像素点,因此,基于邻域信息量前景检测方法,能够更加完整的提取前景中的运动物 体。运动目标检测方法的步骤如下(1)基于样本背景视频帧利用区域均值的核密度估计方法建立初始的背景模型, 具体实现如下(1. 1)区域均值重编码设样本背景视频帧数为N,且视频帧序列中某一位置的像素点所组成样本序列为 Xn = Ix1, X2,... ,Xi,... ,XN}, Xi为第i帧图像中的该位置的像素点,Xn为第N帧中的某一
个像素点,N为自然数,Xi的区域均值为Σ P为窗口大小,R(P)为窗口在第
r xreR{P)
i帧图像中所围成的区域,\为区域内某一像素点,XN进行区域均值编码后的样本序列为(1. 2)利用区域均值的核密度估计方法建立初始的背景模型当前时刻t所在视频帧中某一像素点_的背景函数为=,式
X^/=1
为该像素点属于背景的概率,α i为权重系数,K。为核函数,σ为核半径,I为瓦 样本序列中第i个值。(1. 3)对视频帧中每个位置的像素点通过步骤(1. 2)中的公式计算背景概率,最 终建立整个视频帧的背景模型;(2)当有新的视频帧进入系统,需要对当前的背景模型进行更新以适应动态场景
5中背景的不断变化;当前时刻t所在视频帧中的某一像素点;的背景更新模型按下式计
算Κ ) = /^—1!;^^ —Q + G-^WG),式中β为混合权重,G为高斯函数,上述公式 /=1
中前半部分是利用区域均值核密度估计函数K。适应瞬时背景变化进行背景模型更新,后 半部分是利用单高斯函数G适应持续性背景变化进行背景模型更新;所述瞬时背景变化是 指由于风、光线、水波、钟摆所导致的同一像素点每一帧都会产生差异;所述持续背景变化 是指在长时间的监控过程中背景中会出现新的静止物体、静止物体消失、由于光照随着时 间变化所导致的背景持续的变化;区域均值核密度函数K。的更新速率为P k,即经过1/Pk个帧后,重新计算区域均 值核密度函数K。的分布,具体实现如下直接利用样本信息,为每个像素维护一个样本队 列,队列长度为N ;该队列采用盲目更新策略,其不做任何判断直接将每一帧中的新样本更 新到样本队列中,然后丢弃最早样本;当到达更新时刻,利用最新样本重新计算K。。高斯函数G的更新速率为P g,即经过1/P 8个帧后,对高斯函数的均值和方差两
个参数进行更新,所述均值的更新方法为H+‘「μ:、;所述方差的更新方法为
44 = (|,+7[(^』/4)2画4];式中,Υ为混合权重,时刻高斯函数的均值,
时刻高斯函数的方差,μ t+1为t+i时刻高斯函数的均值,δ t+1为t+i时刻高斯函数的方差;K。和G更新速率的关系如下Pg>> Pk;(3)基于已建立的背景模型得到像素点属于背景的概率,考虑相邻像素所含的信 息对中心像素点的影响,利用邻域信息量方法进行运动目标检测,提出前景和背景分类方 法,确定当前像素点是否属于运动目标;所述邻域信息量方法具体实现如下(3. 1)像素当前亮度值为xt,计算其自信息量为I,/ =-logP(7)(3. 2)像素I邻域区域为R(W),其中W为区域窗口大小,设yj为邻域区域内的任意
Λ^J
一个像素,计算像素y」的信息量与像素_之差为d(h) = Iiyj)-I(X1) = Iog^,ρ (Yj)
xtP\yj)
为像素点y为背景的概率;
m _(3.3)像素一的修正自信息量为4=々+^>( ,力),式中ε为修正自信息量
j=\
权重,式中m为R(W)区域内包含像素点的个数,且m彡1 ;(3. 4)当像素;的修正自信息量大于固定阈值Ith时,即〈>Ith,该像素点为前景
像素;当修正自信息量小于固定阈值Ith时,即< <4,该像素点为背景像素。所述(1. 2)中基于样本背景视频帧利用区域均值的核密度估计方法建立初始的
背景模型所选取的核函数K。为高斯核函数,权重系数、简化取值为+,因此,像素点; 背景模型公式为
权利要求
一种动态场景中基于区域均值核密度估计的运动目标检测方法,其特征在于步骤如下(1)基于样本背景视频帧利用区域均值的核密度估计方法建立初始的背景模型,具体实现如下(1.1)区域均值重编码设样本背景视频帧数为N,且视频帧序列中某一位置的像素点所组成样本序列为XN={x1,x2,...,xi,...,xN},xi为第i帧图像中的该位置的像素点,xN为第N帧中的某一个像素点,N为自然数,xi的区域均值为P为窗口大小,R(P)为窗口在第i帧图像中所围成的区域,xr为区域内某一像素点,XN进行区域均值编码后的样本序列为;(1.2)利用区域均值的核密度估计方法建立初始的背景模型当前时刻t所在视频帧中某一像素点xt的背景函数为式中为该像素点属于背景的概率,αi为权重系数,Kσ为核函数,σ为核半径,为样本序列中第i个值。(1.3)对视频帧中每个位置的像素点通过步骤(1.2)中的公式计算背景概率,最终建立整个视频帧的背景模型;(2)当有新的视频帧进入系统,需要对当前的背景模型进行更新以适应动态场景中背景的不断变化;当前时刻t所在视频帧中的某一像素点的背景更新模型按下式计算 式中β为混合权重,G为高斯函数,上述公式中前半部分是利用区域均值核密度估计函数Kσ适应瞬时背景变化进行背景模型更新,后半部分是利用单高斯函数G适应持续性背景变化进行背景模型更新;所述瞬时背景变化是指由于风、光线、水波、钟摆所导致的同一像素点每一帧都会产生差异;所述持续背景变化是指在长时间的监控过程中背景中会出现新的静止物体、静止物体消失、由于光照随着时间变化所导致的背景持续的变化;区域均值核密度函数Kσ的更新速率为ρk,即经过1/ρk个帧后,重新计算区域均值核密度 函数Kσ的分布,具体实现如下直接利用样本信息,为每个像素维护一个样本队列,队列长度为N;该队列采用盲目更新策略,其不做任何判断直接将每一帧中的新样本更新到样本队列中,然后丢弃最早样本;当到达更新时刻,利用最新样本重新计算Kσ。高斯函数G的更新速率为ρg,即经过1/ρg个帧后,对高斯函数的均值和方差两个参数进行更新,所述均值的更新方法为;所述方差的更新方法为;式中,γ为混合权重,μt为t时刻高斯函数的均值,δt为t时刻高斯函数的方差,μt+1为t+1时刻高斯函数的均值,δt+1为t+1时刻高斯函数的方差;Kσ和G更新速率的关系如下ρg>>ρk;(3)基于已建立的背景模型得到像素点属于背景的概率,考虑相邻像素所含的信息对中心像素点的影响,利用邻域信息量方法进行运动目标检测,提出前景和背景分类方法,确定当前像素点是否属于运动目标;所述邻域信息量方法具体实现如下(3.1)像素当前亮度值为xt,计算其自信息量为I,;(3.2)像素邻域区域为R(W),其中W为区域窗口大小,设yj为邻域区域内的任意一个像素,计算像素yj的信息量与像素之差为p(yj)为像素点y为背景的概率;(3.3)像素的修正自信息量为式中ε为修正自信息量权重,式中m为R(W)区域内包含像素点的个数,且m≥1;(3.4)当像素的修正自信息量大于固定阈值Ith时,即该像素点为前景像素;当修正自信息量小于固定阈值Ith时,即该像素点为背景像素。F2009102438151C00011.tif,3.tif,F2009102438151C00012.tif,20091024381511000011.tif,5.tif,F2009102438151C00013.tif,6.tif,7.tif,8.tif,F2009102438151C00021.tif,F2009102438151C00022.tif,F2009102438151C00023.tif,F2009102438151C00024.tif
2.根据权利要求1所述的一种动态场景中基于区域均值核密度估计的运动目标检测 方法,其特征在于所述(1.2)中基于样本背景视频帧利用区域均值的核密度估计方法建立初始的背景模型所选取的核函数K。为高斯核函数,权重系数、简化取值为+,因此, 像素点;背景模型公式为
3.根据权利要求1所述的一种动态场景中基于区域均值核密度估计的运动目标检测 方法,其特征在于所述(2)中高斯函数G的均值μ和方差δ初始值的计算方法如下 Μ = ~Σχ' 'δ = Τ;Σ(χι-^),两式中-为初始化背景模型样本序列7中第 个值,N为 Nti‘XiX,样本序列的总个数。
全文摘要
一种动态场景中基于区域均值核密度估计的运动目标检测方法,首先进行背景模型的初始化。在背景建模过程中利用训练样本,考虑视频帧中像素点的时序特性和像素点邻域内的空间特性,建立描述动态复杂场景的时空背景模型;其次,在运动目标检测过程中,利用新的视频帧样本对背景模型进行不断地更新。采用区域核密度估计方法适应瞬时性背景变化,采用单高斯背景模型适应持续性背景变化。两种模型相结合能够快速、准确适应背景的不断变化,同时提高了方法执行效率;最后,提出基于邻域信息量的方法进行前景检测方法,进一步消除检测过程中背景区域的噪声点和运动目标空洞,更加完整的提取前景中的运动物体。本发明可广泛应用于室外场景中的智能监控系统或军事禁区的可疑运动目标的报警,具有广阔的市场前景和应用价值。
文档编号G06T7/20GK101957997SQ20091024381
公开日2011年1月26日 申请日期2009年12月22日 优先权日2009年12月22日
发明者李超, 杨晓辉, 熊璋, 郝久月 申请人:北京航空航天大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1