本发明属于信息科学、计算机视觉、机器学习、模式识别等多个技术领域,特别是涉及一种基于模糊均值聚类与卡尔曼滤波跟踪相结合的运动目标检测方法。
背景技术
目前,监控视频信息的自动处理与预测在信息科学、计算机视觉、机器学习、模式识别等多个领域中受到极大的关注。而如何有效、快速抽取出监控视频中的前景目标信息,是其中非常重要而基础的问题。这一技术已被广泛应用于视频目标追踪,城市交通检测,长时场景监测,视频动作捕捉,视频压缩等应用中。
传统的运动目标检测方法包括帧差法、背景减除法和光流法。帧差法是在连续的图像序列中两个或三个相邻帧间采用基于像素的时间差分并且阈值化来提取出图像中的运动目标。帧差法的优点是算法简单,速度快,易于硬件实现,能够较好的适应环境变化大的情况,但对于图像序列中运动缓慢的目标,难以有效检测出完整前景,运动实体内部容易产生较大“空洞”。光流法是通过建立目标运动矢量场,用图像序列中像素在时间域上的变化以及相邻帧之间的相关性来找到上一帧跟当前帧之间存在的对应关系,从而计算出相邻帧之间物体的运动信息的一种方法。光流法在运动背景环境中也可以对运动目标进行检测,但其最大的缺点是计算量过大,难以做到实时检测。
在进行运动目标检测时,不仅仅目标本身,而且还受到其他因素的影响,例如变化的照明、动态背景、拥挤的场景和遮挡。在摄像机不稳定的情况下,运动物体检测问题变得更加具有挑战性,因为背景不再是静态的,背景减法方法不能再被使用。
技术实现要素:
为了克服上述现有技术存在的不足,本发明的目的在于提出一种基于模糊均值聚类与卡尔曼滤波跟踪相结合的运动目标检测方法,提出的基于模糊色差直方图fcdh的背景减除机制采用补丁级方法代替像素级,这种方法是将重点放在色差上,而不是色彩大小上。通过减少虚假错误的数量,fcdh可以显示出优良的性能。
为了达到上述目的,本发明所采用的技术方案是:基于模糊均值聚类与卡尔曼滤波跟踪相结合的运动目标检测方法,其特征在于,所述方法包括如下步骤:
步骤1,计算像素局部邻域的色差直方图cdh;
步骤2,采用模糊c均值聚类fcm来获得模糊色差直方图;
步骤3,进行背景建模,并使用相似性匹配检测前景;
步骤4,采用基于块匹配的卡尔曼滤波器进行目标追踪。
进一步地,步骤1使用对应于两个颜色分量的色差来计算像素的局部邻域的色差直方图cdh,具体包括;
1.1计算色差值:读入视频段中的所有帧并进行保存,分别记为i1,i2,…,im∈nm×n,其中,m为视频段中的总帧数,m,n为每帧图片的大小;将具有强度等级i(p,q,ch)的彩色图像量化为w个等级,i∈{0,1,2,...w-1};(p,q)是位置坐标,ch是颜色通道,将rgb图像转换为ciel*a*b*颜色模型;
求在以位置(p,q)为中心的小局部n×n邻域中的色差d,使用下式计算:
其中,i(r,s,ch)表示邻域中像素的强度;
1.2色差直方图:使用高斯隶属函数将从(1)计算出的色差d模糊化为:
σ表示标准差;
色差直方图最终由以下公式给出:
其中,a×a是以(p,q)位置为中心的局部区域,并且用k计算像素的频率。
进一步地,步骤2采用模糊c均值聚类fcm来获得模糊色差直方图,具体包括:
fcm将k-bin局部直方图h={h1,h2,h3,...,hk}分类为以li位置为中心的c聚类,每个聚类基于模糊隶属度分配bin,这是通过最小化成本函数的迭代来完成的;
模糊色差直方图使用隶属度矩阵u(c×k维)和cdh向量h(k×1)构建c维cdh(fcdh)模糊向量v,如下:
hc×1=uc×khk×1(5)。
进一步地,步骤3进行背景建模,并使用相似性匹配检测前景,具体包括;
3.1背景建模:相似性度量p是使用直方图测量的建模背景帧f和当前帧h的之间fcdh的交集;
其中,c为给出直方图箱的数量,背景b通过同阈值作比较得出:
3.2背景更新:背景fcdh使用[0,1]作为背景学习率更新每个像素,t是时间索引,如下所示:
进一步地,步骤4采用基于块匹配的卡尔曼滤波器进行目标追踪,具体包括:
4.1自下而上可变块大小(bvbs)bm:在刚开始选择小尺寸块以检测到更多运动块,然后块尺寸在每个维度上增加一倍,一系列块{bi,i=1,2,3,4}}在更小的尺寸,它们共享相同的较大尺寸父块sb,定义如下:
sb=b1∪b2∪b3∪b4,wherebi,1≤1≤4
1、2、3和4分别对应于父块sb的左上、右上、左下,右下子块;
在先前的步骤中bi以小的运动块检测该bm过程可以按需要重复多次,或者直到块大小达到预定的最大尺寸为止,这样,可以以较大的块大小丢弃更多的假运动块,同时保持较小块大小的真实运动细节;
4.2时间更新:已知状态xk-1,开始迭代对下一状态xk进行预测;
其中,
xk,
过程噪声协方差的确定一般比较困难,因为直接观察的估计过程并不总是可行的,在这项工作中,可以将加速度作为分段常数wiener过程,即加速度在每个时间段的持续时间内保持不变,但对于每个时间段不同,并且每一个都是零均值高斯序列,
q为连续时间白噪声的能量谱密度密度,为了减少计算量,令p0=cqk,c为一个常数;
4.3:测量更新:状态xk的zk可以用一个线性方程来表示:
zk=hkxk+vk(13)
zk是k时刻的m×1测量值,hk是与zk相关的m×n的观测矩阵,vk是m×1的额外的测量噪声向量,具体测量更新的方程如下:
公式n×m矩阵k为使得后验误差协方差最小的增益。
与现有技术相比,本发明的有益效果是:本发明提出了一种模糊均值聚类与卡尔曼滤波跟踪相结合的运动目标检测方法,与现有方法相比,其显著优点在于:
a)局部邻域的色差直方图计算可以处理由于动态背景(例如自来水,挥动树木)而出现的问题。
b)采用模糊c均值聚类fcm来获得模糊色差直方图,克服了由于光照变化(突然或渐变)而产生的影响。
c)自下而上的可变块大小的块匹配的方法更精准的确定可能的目标块,然后自适应卡尔曼滤波器用于区分显著的运动与其他分散注意力的运动的存在,提高正确检测目标的可靠性检测同时减少噪声的存在。
附图说明
图1是本发明的运动目标检测方法的流程图。
具体实施方式
为了便于本领域普通技术人员理解和实施本发明,下面结合实施例对本发明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限定本发明。
本发明提供一种基于颜色特征与卡尔曼滤波跟踪相结合的运动目标检测方法。首先,对于视频处理问题可以看做是对每一帧图片做处理的问题,而灰度图可以看做是一个矩阵xi∈rw×h,其中w为图像的宽,h为图像的高,矩阵中每个元素为0~255之间的某个整数值,那么对视频的处理就可以转化为对矩阵集合x=x1,x2,x3,...,xt的处理,其中t表示视频的帧数。
该方法的主要思想是:先计算像素局部邻域的色差直方图(cdh),然后采用模糊c均值聚类(fcm)来获得模糊色差直方图,紧接着进行背景建模,并使用相似性匹配检测前景,进一步采用基于块匹配的卡尔曼滤波器进行目标追踪。
本发明的算法流程图如图1所示,具体步骤如下:
步骤1:使用对应于两个颜色分量的色差来计算像素的局部邻域的色差直方图cdh。
1.1计算色差值:读入视频段中的所有帧并进行保存,分别记为i1,i2,…,im∈nm×n,其中m为视频段中的总帧数,m,n为每帧图片的大小;将具有强度等级i(p,q,ch)的彩色图像量化为w个等级,例如i∈{0,1,2,...w-1};(p,q)是位置坐标,ch是颜色通道。将rgb图像转换为ciel*a*b*颜色模型。
求在以位置(p,q)为中心的小局部n×n邻域中的色差d,使用下式计算:
其中i(r,s,ch)表示邻域中像素的强度。
1.2色差直方图:使用高斯隶属函数将从(1)计算出的色差d模糊化为:
σ表示标准差。
色差直方图最终由以下公式给出:
其中a×a是以(p,q)位置为中心的局部区域,并且用k计算像素的频率。
步骤2:模糊c均值聚类
fcm将k-bin局部直方图h={h1,h2,h3,...,hk}分类为以li位置为中心的c聚类,每个聚类基于模糊隶属度分配bin,这是通过最小化成本函数的迭代来完成的。
模糊色差直方图使用隶属度矩阵u(c×k维)和cdh向量h(k×1)构建c维cdh(fcdh)模糊向量v,如下:
hc×1=uc×khk×1(5)
步骤3:背景减除法
3.1背景建模:相似性度量p是使用直方图测量的建模背景帧f和当前帧h的之间fcdh的交集。
其中c为给出直方图箱的数量。背景b通过同阈值作比较得出:
3.2背景更新:背景fcdh使用[0,1]作为背景学习率更新每个像素,t是时间索引,如下所示:
步骤4:基于块匹配的卡尔曼滤波器的目标追踪
4.1自下而上可变块大小(bvbs)bm:在刚开始选择小尺寸块以检测到更多运动块,。然后块尺寸在每个维度上增加一倍。一系列块{bi,i=1,2,3,4}}在更小的尺寸,它们共享相同的较大尺寸父块sb,定义如下:
sb=b1∪b2∪b3∪b4,wherebi,l≤l≤4
1、2、3和4分别对应于父块sb的左上、右上、左下,右下子块。
在先前的步骤中bi以小的运动块检测该bm过程可以按需要重复多次,或者直到块大小达到预定的最大尺寸为止。这样,可以以较大的块大小丢弃更多的假运动块,同时保持较小块大小的真实运动细节。
4.2时间更新:已知状态xk-1,开始迭代对下一状态xk进行预测。
其中
xk,
过程噪声协方差的确定一般比较困难,因为直接观察的估计过程并不总是可行的。在这项工作中,我们将加速度作为分段常数wiener过程,即加速度在每个时间段的持续时间内保持不变,但对于每个时间段不同,并且每一个都是零均值高斯序列。
q为连续时间白噪声的能量谱密度密度,为了减少计算量,令p0=cqk,c为一个常数。
4.3:测量更新:状态xk的zk可以用一个线性方程来表示:
zk=hkxk+vk(13)
zk是k时刻的m×1测量值,hk是与zk相关的m×n的观测矩阵,vk是m×1的额外的测量噪声向量。具体测量更新的方程如下:
公式n×m矩阵k为使得后验误差协方差最小的增益。
在这项工作中,测量值zk最有可能是在目前的补偿帧的目标对象块坐标。因此x,y,观测矩阵h在每个方向定义为在[100]。目标块的位置是由三步(tss)bm算法测量。测量噪声vk表示传感器的噪声特性。因为只从块匹配的角度测量目标物体的坐标,协方差矩阵r在vk中由
应当理解的是,本说明书未详细阐述的部分均属于现有技术。
应当理解的是,上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。