基于在线低秩背景建模的视频序列背景恢复方法与流程

文档序号:11953369阅读:339来源:国知局
基于在线低秩背景建模的视频序列背景恢复方法与流程
本发明属于视频分析领域。特别涉及基于在线低秩背景建模的视频序列背景恢复方法。
背景技术
:随着互联网和大众媒体的快速发展,视频数据的可用性迅速增加,远远超出了人们手动分析的范围。因此,利用自动视频分析在大量的视频中挖掘感兴趣的信息具有极其重要的意义。背景恢复,作为提取视频中感兴趣目标的一项预处理技术,广泛应用于许多视觉应用中,例如目标检测、目标跟踪和行为识别。近年来,关于解决视频背景恢复问题的方法已经有很多研究成果,一类最主要的方法是基于鲁棒主成分分析(RPCA)的方法,其大致思路是:假定视频背景帧之间是线性相关的,将视频分解成低秩背景和稀疏前景两部分,其中,对于低秩背景的近似采用核范数来约束。这类方法可以同时实现视频背景的恢复和运动前景的检测。但求解核范数就要求对所有视频帧同时进行奇异值分解,因此,限制此方法只能以批处理的方式进行求解,无法实现实时的背景恢复。此外,在求解此类方法时,每迭代一次,都需要对所有的视频帧进行处理,导致算法时间和内存效率较低,不适用于流式视频和大的视频。所以,在大数据的时代背景下,寻找一种有效的在线背景恢复方法是十分必要的。现阶段,针对上述传统批处理RPCA方法的缺点,国内外已经提出了一些在线的背景恢复方法,即可以对单帧视频图像进行实时的处理获得其相应的背景。其思路是:对限制批处理实现方式的核范数项进行低秩矩阵分解,得到背景的基和与基相对应的系数。在此基础上,分别对每一帧视频图像进行矩阵低秩稀疏分解,最终恢复的背景为求解得到的基和系数转置的乘积。这类在线恢复方法可以实时地恢复每一帧图像的背景,极大地提高了算法的内存效率和对流式数据的适用性。但是,因为它忽视了视频的运动信息,所以在前景运动缓慢的区域,恢复的背景中容易出现拖影效应。为克服这一缺点,本发明在模型中采用光流算法对运动信息进行估计。技术实现要素:本发明意在弥补现有技术的不足,即实现对视频序列的背景进行准确的在线的恢复。本发明采取的技术方案是,基于在线低秩背景建模的视频序列背景恢复方法,在传统的背景建模基础上引入核范数的低秩矩阵分解和二值化的运动信息估计,从而解决已有技术无法处理的问题。本发明包括下列步骤:1)将视频序列中背景恢复问题具体地表述为求解如下无约束优化方程:其中||·||F表示矩阵的弗罗贝尼乌斯范数,||·||*表示矩阵的核范数,||·||1表示矩阵的一范数,ο表示两个矩阵的点乘运算,D为实际的视频序列帧依次按列向量排列而成的矩阵,B表示待恢复的背景,E代表前景部分,W表示二值运动场映射权重矩阵,λ1,λ2分别表示视频中低秩背景和前景的权重系数;为解决核范数需要对所有帧一起进行奇异值分解SVD,对待恢复背景B进行低秩矩阵分解:||B||*=infL,C{12||L||F2+12||C||F2:B=LCT}---(2)]]>其中inf{·}表示对{·}取下确界,L是视频序列背景对应的低维子空间的基,C是视频序列对应于基L的系数矩阵;得到如下的分解模型:求解此方程时,采用交替优化方法,以增量方式最小化如下损失函数:其中n表示视频序列当前的总帧数,dk表示视频序列第k帧的列向量,为第k帧图像dk在基L下所对应的损失函数,其定义如下:其中||·||2表示向量的二范数,w表示当前帧dk的运动映射权重向量,c是dk在基L下的系数向量,e为当前帧的前景部分;求解过程为,在线地对每一帧图像dk依次:估计运动信息计算第k帧运动映射权重向量wk,更新第k帧系数向量ck,更新第k帧前景ek,更新前k帧对应的基Lk;2)构建第k帧运动映射权重向量wk:采用前向运动估计方案在线地求解wk;对第一帧,基于稀疏前景的假设,将二值运动权重全部赋值为1;对于后续帧,分别以第一帧作为参考帧,采用光流算法估计当前帧的稠密运动场,然后将其二值化为运动映射;3)使用交替方向法ADM将方程(5)转换成如下序列进行求解:上式中的表示使目标函数取最小值时的变量c的值,表示使目标函数取最小值时的变量e的值,l是迭代次数;然后按照步骤4)、5)的方法进行迭代求解得到系数向量ck和前景ek;4)求解通过求解最小二乘问题的闭式解求得系数去掉式子(7)中求解第k帧系数向量ck的目标函数里与ck无关的项,得到如下方程:使用最小二乘法求得的解为:ckl+1=(LkTW~kTW~kLk+λ1I)-1LkTW~kTW~k(dk-ekl)---(9)]]>其中表示运动映射wk的对角矩阵,即将向量wk的每个元素依次放到矩阵的主对角线上,I表示单位矩阵;5)求解使用收缩算子求得第k帧前景去掉式子(7)中求解第k帧前景ek的目标函数里与ek无关的项,得到如下方程:对式子(10)使用收缩算子解得:eik=0,sik<λ2wik,sign(|sik|-λ2wik),sik≥λ2wik,---(11)]]>其中eik,sik,wik分别表示ek,sk,wk的第i个像素值,6)重复上述步骤4)、5)直到算法收敛,这时迭代的结果和就是当前帧dk的系数向量ck和前景ek,由得到前k帧图像的系数矩阵Ck;7)使用变量代换将方程(3)转换为如下无约束优化问题进行求解:其中为新引入的变量,Rk=[r1,...,rk]表示已经求得的当前帧及之前的视频帧的背景,rk=dk-ek表示已求得的第k帧图像的背景,λ3为权重系数;使用交替方向法ADM将方程(12)转换成如下序列进行求解:然后按照步骤8)、9)的方法进行迭代求解得到变量Yk和视频序列低维子空间的基Lk;8)求解逐像素方式求得去掉式子(13)中求解Yk的目标函数里与Yk无关的项,得到如下方程:使用最小二乘法,逐像素计算解得:yik=2λ3wik2+2λ3(rik-l^ick)---(15)]]>其中表示基Lk的第i行,yik表示第i行第k列的元素值,rik表示rk的第i个像素值;9)求解通过求解最小二乘问题的闭式解求得基去掉式子(13)中求解Lk的目标函数里与Lk无关的项,得到如下方程:Lkl+1=argminLλ12||Lkl||F2+λ32||Ykl+1-Rk+LklCkT||F2---(16)]]>使用最小二乘法求得的解为:Lkl+1=λ3(Rk-Ykl+1)Ck(λ3CkTCk+λ1I)-1---(17)]]>进一步,引入中间变量Pk=RkCk,以增量方式高效地求解Lkl+1=λ3(Pk-Xk)(λ3Zk+λ1I)-1---(18)]]>其中:Pk←Pk-1+rkckT,Xk←Xk-1+ykckT,Zk←Zk-1+ckckT,---(19)]]>10)重复上述步骤8)、9)直到算法收敛,这时迭代的结果就是前k帧图像背景的基Lk;11)求解视频背景B:由6)和10)分别得到的Ck和Lk求得Bk就是原问题的最终解B。步骤2)具体公式是:其中wik表示第k帧图像第i个像素的运动映射权重,即为wk的第i个像素值,和分别表示第k帧图像第i个像素的水平运动分量和垂直运动分量,τ为用于二值化运动场的阈值。本发明的技术特点及效果:本发明方法针对视频序列的背景在线恢复问题,通过引入对核范数的低秩矩阵分解和对视频运动信息的逐帧估计,实现了对视频序列的背景在线恢复问题的求解。本发明具有以下特点:1、运用了交替方向法(ADM)算法、收缩算子求解子问题,整合了已有算法的优点。2、实现了对视频序列背景的在线恢复。在传统的矩阵低秩稀疏分解模型中引入核范数的低秩分解,可以对背景进行在线的恢复,极大地提高了内存效率,适用于对流式视频和大视频数据进行处理。3、将低秩矩阵分解和运动信息估计相结合,引入光流算法估计视频中的运动信息,并将其二值化为运动权重矩阵,可以更有效地分离视频背景中的运动前景,使得视频序列背景恢复结果更加准确。附图说明图1是算法流程图;图2是原始的browser1视频帧及采用本发明方法的背景恢复结果图;图3是原始的browser1视频帧及采用本发明方法的背景恢复结果图。具体实施方式在传统的矩阵低秩稀疏分解模型中引入核范数的低秩分解和运动信息估计,使得能够在线地恢复出视频序列的准确背景,即基于在线低秩背景建模的视频序列背景恢复方法,从而解决已有技术无法处理的问题。下面结合附图和实施例对本发明作详细说明。1)将视频序列中背景恢复问题具体地表述为求解如下无约束优化方程:其中||·||F表示矩阵的弗罗贝尼乌斯(Frobenius)范数。||·||*表示矩阵的核范数。||·||1表示矩阵的一范数。ο表示两个矩阵的点乘运算。D为实际的视频序列帧依次按列向量排列而成的矩阵。B表示待恢复的背景。E代表前景部分。W表示二值运动场映射权重矩阵。λ1,λ2分别表示视频中低秩背景和前景的权重系数。11)为解决核范数需要对所有帧一起进行奇异值分解(SVD),本发明对待恢复背景B进行低秩矩阵分解:||B||*=infL,C{12||L||F2+12||C||F2:B=LCT}---(2)]]>其中inf{·}表示对{·}取下确界,L是低维子空间的基,C是视频帧对应于基L的系数,CT表示矩阵C的转置。模型(1)转化为如下的在线运动信息辅助的矩阵低秩稀疏分解模型:12)求解此方程时,本发明采用交替优化方法,以增量方式最小化如下损失函数:其中n表示视频序列当前的总帧数,dk表示视频序列第k帧的列向量,为第k帧图像对应的损失函数,其定义如下:其中||·||2表示矩阵的二范数。w表示当前帧dk的运动映射权重向量。c是dk在基L下的系数向量。e为当前帧的前景部分。13)求解过程为,在线地对每一帧图像dk依次:估计运动信息计算第k帧运动映射权重向量wk,更新第k帧系数向量ck,更新第k帧前景ek,更新前k帧对应的基Lk。2)构建第k帧运动映射权重向量wk:采用前向运动估计方案在线地求解wk;21)对第一帧,基于稀疏前景的假设,将二值运动权重全部赋值为1。22)对于后续帧,分别以第一帧作为参考帧,采用光流算法估计当前帧的稠密运动场,然后将其二值化为运动映射,具体公式如下:其中wik表示第k帧图像第i个像素的运动映射权重,即为wk的第i个像素值,和分别表示第k帧图像第i个像素的水平运动分量和垂直运动分量。τ为用于二值化运动场的阈值,根据估计的运动场的平均像素值设定。3)本发明使用交替方向法(ADM)求解方程(5),即将方程(5)转换成如下序列进行求解:上式中的表示使目标函数取最小值时的变量c的值,表示使目标函数取最小值时的变量e的值。l是迭代次数。设定好各参数初值,然后按照步骤4)、5)的方法进行迭代求解,得到第k帧图像对应的系数向量ck和前景ek。4)求解通过求解最小二乘问题的闭式解求得第k帧系数去掉式子(7)中求解系数ck的目标函数里与ck无关的项,得到如下方程:给定前k帧图像对应的基Lk和第k帧前景使用最小二乘法求得的解为:ckl+1=(LkTW~kTW~kLk+λ1I)-1LkTW~kTW~k(dk-ekl)---(9)]]>其中表示第k帧图像的运动映射向量wk的对角矩阵,即将向量wk的每个元素依次放到矩阵的主对角线上,的其他位置元素值均为0。I表示单位矩阵。5)求解使用收缩算子求得第k帧前景去掉式子(7)中求解ek的目标函数里与ek无关的项,得到如下方程:给定基Lk和4)的迭代结果对式子(10)使用收缩算子解得:eik=0,sik<λ2wik,sign(|sik|-λ2wik),sik≥λ2wik,---(11)]]>其中eik,sik,wik分别表示ek,sk,wk的第i个像素,6)重复上述步骤4)、5)直到算法收敛,这时迭代的结果和就是当前帧dk的系数向量ck和前景ek。将赋给C的第k行,于是得到前k帧图像的系数Ck;7)使用变量代换和交替方向法(ADM)求解模型(3)。71)因为直接求解背景的基Lk需要对矩阵点乘进行求导,不易求解,所以本发明使用变量代换将方程(3)转换为如下无约束优化问题进行求解:其中是为方便计算而新引入的变量,Rk=[r1,...,rk]表示已经求得的前k帧的背景,rk=dk-ek表示已求得的第k帧图像的背景,λ3为权重系数。72)使用交替方向法(ADM)将方程(12)转换成如下序列进行求解:设定好变量Yk的初值,然后按照步骤8)、9)的方法进行迭代求解得到变量和视频序列低维子空间的基Lk。8)求解去掉式子(13)中求解Yk的目标函数里与Yk无关的项,得到如下方程:使用最小二乘法,逐像素计算解得:yik=2λ3wik2+2λ3(rik-l^ick)---(15)]]>其中表示基Lk的第i行,yik表示第i行第k列的元素值,rik表示rk的第i个像素值。9)求解通过求解最小二乘问题的闭式解求得基91)去掉式子(13)中求解Lk的目标函数里与Lk无关的项,得到如下方程:Lkl+1=argminLλ12||Lkl||F2+λ32||Ykl+1-Rk+LklCkT||F2---(16)]]>使用最小二乘法求得的解为:Lkl+1=λ3(Rk-Ykl+1)Ck(λ3CkTCk+λ1I)-1---(17)]]>92)为了提高内存效率,本发明进一步引入中间变量Pk=RkCk,以增量方式高效地求解方程如下:Lkl+1=λ3(Pk-Xk)(λ3Zk+λ1I)-1---(18)]]>其中中间变量Pk、Xk和Zk的更新规则为:Pk←Pk-1+rkckT,Xk←Xk-1+ykckT,Zk←Zk-1+ckckT,---(19)]]>10)重复上述步骤8)、9)直到算法收敛,这时迭代的结果就是前k帧图像背景的基Lk;11)求解视频序列的背景B:由6)和10)分别得到的Ck和Lk求得Bk就是原问题最终解B。本发明方法将低秩矩阵分解和运动信息估计相结合,在传统的矩阵低秩稀疏分解模型中引入核范数的低秩分解和二值的运动信息权重,从而解决已有技术无法处理的问题,即实现对视频序列背景进行准确的在线恢复(实验流程图如图1所示)。结合附图和实施例的详细说明如下:1)实验中使用115×86像素的browser1视频帧(如图2所示)作为原始数据输入,每一帧图像像素点为m=115×86个。本发明将原始视频帧处理成列向量形式进行处理,将其按顺序排列构成矩阵D,恢复该视频序列背景问题具体地表述为求解如下无约束优化方程:其中||·||F表示矩阵的弗罗贝尼乌斯(Frobenius)范数。||·||*表示矩阵的核范数。||·||1表示矩阵的一范数。ο表示两个矩阵的点乘运算。B表示待恢复的背景。E代表前景部分。W表示二值运动场映射权重矩阵。λ1,λ2分别表示视频中低秩背景和前景的权重系数,在实验中分别取值为1。11)为解决核范数需要对所有帧一起进行奇异值分解,本发明对B进行低秩矩阵分解:||B||*=infL,C{12||L||F2+12||C||F2:B=LCT}---(2)]]>其中inf{·}表示对{·}取下确界,L是低维子空间的基,C是视频帧对应于基L的系数,CT表示矩阵C的转置。模型(1)转化为如下的在线运动信息辅助的矩阵低秩稀疏分解模型:实验中L的秩取值为5。12)求解此方程时,本发明采用交替优化方法,以增量方式最小化如下损失函数:其中n表示视频序列当前的总帧数,dk表示视频序列第k帧的列向量,为第k帧图像对应的损失函数,其定义如下:其中||·||2表示矩阵的二范数。w表示当前帧dk的运动映射权重向量。c是dk在基L下的系数向量。e为当前帧的前景部分。13)求解过程为,在线地对每一帧图像dk依次:估计运动信息计算第k帧运动映射权重向量wk,更新第k帧系数向量ck,更新第k帧前景ek,更新前k帧对应的基Lk。2)构建第k帧运动映射权重向量wk:采用前向运动估计方案在线地求解wk。21)对第一帧,基于稀疏前景的假设,将二值运动权重全部赋值为1。22)对于后续帧,分别以第一帧作为参考帧,采用光流算法估计当前帧的稠密运动场,然后将其二值化为运动映射,具体公式如下:其中wik表示第k帧图像第i个像素的运动映射权重,即为wk的第i个像素值,和分别表示第k帧图像第i个像素的水平运动分量和垂直运动分量。τ为用于二值化运动场的阈值,根据估计的运动场的平均像素值设定,实验中取τ=0.1。3)本发明使用交替方向法(ADM)求解方程(5),即将方程(5)转换成如下序列进行求解:上式中的表示使目标函数取最小值时的变量c的值。表示使目标函数取最小值时的变量e的值。l是迭代次数。设定好各参数初值,然后按照步骤4)、5)的方法进行迭代求解,得到系数向量ck和前景ek。实验中设定初值为:l=1;k=1;w1=1;L1由该视频序列的十帧背景帧做奇异值分解后得到的前5个主分量赋值。4)通过求解最小二乘问题的闭式解求解对应于基Lk的系数ck。去掉式子(7)中求解系数ck的目标函数里与ck无关的项,得到如下方程:给定前k帧图像对应的基Lk和前景使用最小二乘法求得的解为:ckl+1=(LkTW~kTW~kLk+λ1I)-1LkTW~kTW~k(dk-ekl)---(9)]]>其中表示运动映射wk的对角矩阵,即将向量wk的每个元素依次放到矩阵的主对角线上,的其他位置元素值均为0。I表示单位矩阵。5)求解使用收缩算子求得第k帧前景去掉式子(7)中求解ek的目标函数里与ek无关的项,得到如下方程:给定基Lk和4)的迭代结果对式子(10)使用收缩算子解得:eik=0,sik<λ2wik,sign(|sik|-λ2wik),sik≥λ2wik,---(11)]]>其中eik,sik,wik分别表示ek,sk,wk的第i个像素,6)重复上述步骤4)、5)直到算法收敛,这时迭代的结果和就是当前帧dk的系数向量ck和前景ek。将赋给C的第k行,于是得到前k帧图像的系数Ck。7)使用变量代换和交替方向法(ADM)求解模型(3)。71)因为直接求解背景的基Lk需要对矩阵点乘进行求导,不易求解,所以本发明使用变量代换将方程(3)转换为如下无约束优化问题进行求解:其中是为方便计算而新引入的变量,Rk=[r1,...,rk]表示已经求得的前k帧的背景,rk=dk-ek表示已求得的第k帧图像的背景,λ3为权重系数。72)使用交替方向法(ADM)将方程(12)转换成如下序列进行求解:变量Yk的初值设为0,然后按照步骤8)、9)的方法进行迭代求解得到变量和视频序列低维子空间的基Lk。8)求解去掉式子(13)中求解Yk的目标函数里与Yk无关的项,得到如下方程:使用最小二乘法,逐像素计算解得:yik=2λ3wik2+2λ3(rik-l^ick)---(15)]]>其中表示基Lk的第i行,yik表示第i行第k列的元素值,rik表示rk的第i个像素值。9)求解通过求解最小二乘问题的闭式解求得基91)去掉式子(13)中求解Lk的目标函数里与Lk无关的项,得到如下方程:Lkl+1=argminLλ12||Lkl||F2+λ32||Ykl+1-Rk+LklCkT||F2---(16)]]>使用最小二乘法求得的解为:Lkl+1=λ3(Rk-Ykl+1)Ck(λ3CkTCk+λ1I)-1---(17)]]>92)为了提高内存效率,本发明进一步引入中间变量Pk=RkCk,以增量方式高效地求解方程如下:Lkl+1=λ3(Pk-Xk)(λ3Zk+λ1I)-1---(18)]]>其中中间变量Pk、Xk和Zk的更新规则为:Pk←Pk-1+rkckT,Xk←Xk-1+ykckT,Zk←Zk-1+ckckT,---(19)]]>各变量初值分别为:P0=0,X0=0,Z0=0。10)重复上述步骤8)、9)直到算法收敛,这时迭代的结果就是前k帧图像背景的基Lk;11)求解B:由6)和10)分别得到的Ck和Lk求得Bk就是原问题的最终解B。12)依次将B的每一列调整成115×86像素的图像,最终得到恢复的视频序列的背景(如图2所示)。再使用106×86的hallmonitor视频帧作为原始数据输入,其他参数不变,得到其恢复的背景图像(如图3所示)。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1