本发明属于计算机视觉领域,具体涉及一种拉普拉斯正则约束下低秩稀疏优化的目标分割方法。
背景技术:
视频目标分割技术是将视频中既定目标的轮廓抽取出来,它作为图像的预处理过程被广泛应用在行为识别、动作估计、目标识别以及跟踪系统中,它是计算机视觉领域中一个备受关注且发展迅速的领域。对视频中目标的分割通常被认为是一个二分类的问题,其中,待分割的目标表示前景,通常用1表示,其它部份表示背景,通常用0表示。视频目标分割的关键在于时间和空间的一致性,时间一致性描述了在连续帧中目标的相似性,空间一致性描述了在一帧图像中目标与背景的分辨能力。
目前国内外很多算法在计算时空一致性都采用了分步的方式,而这种方式分步的方式会因上一步的计算误差导致后续步骤的计算,例如,现有技术中的分步方式的步骤:首先根据已知条件为待跟踪或分割的目标在特征空间中建立模板,然后在特征空间中找到后续图像与模板相似的区域,并将这个区域作为结果进行输出,这两种方法均采用了模板跟踪的方式,在计算过程中,往往只考虑每个元素特征与模板的相似性,而没考虑被计算元素之间的空间相关性,使得目标分割精度不高,特别是在目标边界区域,因此急需一种新的视频目标分割方法对其作出进一步地改进。
技术实现要素:
针对现有技术中的上述不足,本发明提供的一种拉普拉斯正则约束下低秩稀疏优化的目标分割方法,包括如下步骤:
(s1)使用slic算法将视频中每帧图像分割成n个超级像素;
(s2)提取vgg网络中不同卷积层的特征,计算每个超级像素的平均特征作为超级像素的特征,并建立图像特征矩阵x;
(s3)根据由第一帧图像确定的目标轮廓,将第一帧图像特征矩阵x1进行重新排列,得到属于目标的特征集和属于背景的特征集,并建立模板d,其中,d=[dodb],do为属于目标的特征集,db为属于背景的特征集;
(s4)从视频中第t帧图像开始,根据第t帧图像特征矩阵xt求解第t帧图像对模板d在拉普拉斯正则约束下低秩稀疏优化的系数矩阵z,其中t=2,3,...n,n为图像的总帧数;
(s5)通过所述系数矩阵z确定当前帧中每个像素ii的低秩稀疏优化显著性地图;
(s6)将图像作为像素的集合
(s7)根据(s6)所述像素的集合计算当前帧与前一帧的光流信息,并通过所述光流信息确定当前帧中每个像素ii的位置,从而生成位置显著性地图;
(s8)计算当前帧中两个不同位置像素ii和ij之间在颜色空间的相关性,得到相关性函数ψ(ii,ij),其中,ii和ij为任意两个不同位置的像素;
(s9)根据上述得到的低秩稀疏优化显著性地图、颜色显著性地图、位置显著性地图及相关性函数ψ(ii,ij),构造能量函数模型,并利用最大流最小割算法对目标进行分割,从而得到目标区域和背景区域的分割结果;
(s10)判断所有帧是否已分割,是则结束视频,否则利用当前帧得到的目标区域和背景区域的分割结果更新模板d,并更新t=t+1,返回步骤(s4),直到视频结束,其中,t=2,3,...n,n为图像的总帧数。
进一步地,所述步骤(s2)中建立图像特征矩阵x的方法为:
计算每个超级像素的平均特征
建立图像特征矩阵x:
其中,fj为超级像素建立的特征向量,
再进一步地,所述(s4)中的系数矩阵z的计算公式为:
argminz(||z||*+λ||z||1+βtr(zlzt)+γ||e||1)
s.t.x=dz+e
其中,x为当前帧的图像特征矩阵,argminz为选取使目标函数最小时的z,s.t为约束条件,||.||*为核范数,||.||1为l1范数,tr(·)为矩阵的迹,l为正则矩阵,e为噪声,λ、β和γ为权重因子。
再进一步地,所述(s5)中的低秩稀疏优化显著性地图pi的计算公式为:
其中,max(·)为取向量中的最大值,ti为归一化参数,使得pi∈[0,1],zi为矩阵z的一列向量,
再进一步地,所述(s5)中的低秩稀疏优化显著性地图为当前帧中每个像素ii相对于目标的概率分布fs(ii);
所述(s6)中的颜色显著性地图为当前帧中每个像素ii相对于目标的颜色概率分布fc(ii);
所述(s7)中的位置显著性地图为当前帧中每个像素ii相对于目标的位置概率分布fp(ii)。
再进一步地,所述(s8)中的相关性函数ψ(ii,ij)的计算公式为:
其中,ε为拉普拉斯平滑系统,exp(·)为指数函数,||·||2为二范数的平方,μ为当前图像中第i个像素点四领域像素值的平均值,冲激函数δ(ii≠ij)为当ii与ij为同一像素时,δ(ii≠ij)=0,其余情况为1。
再进一步地,所述(s9)中分割结果的求解过程为:
构造能量函数模型e(u)为:
计算目标区域和背景区域的最优分割结果u*为:
u*=argmine(u)
其中,
本发明的有益效果:
本发明通过低秩稀疏优化技术,计算元素在特征空间中的相似性,同时,通过拉普拉斯正则约束,在低秩稀疏优化的基础上增加被计算元素在空间中的相关性运算,使得元素特征在目标边界处具有较强的辨识能力,从而提高了系统分割的精度,并且本发明将时空一致性计算统一在一个框架中,有效地降低了系统的复杂度,提高了系统的鲁棒性。
附图说明
图1为本发明的方法流程示意图。
图2为本发明的框架示意图。
具体实施方式
下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
实施例
如图1-图2所示,本发明提供了一种拉普拉斯正则约束下低秩稀疏优化的目标分割方法,其具体实施步骤如下:
(s1)使用slic算法将视频中每帧图像分割成n个超级像素;
(s2)提取vgg网络中不同卷积层的特征,计算每个超级像素的平均特征作为超级像素的特征,并建立图像特征矩阵x,所述图像特征矩阵x的建立方法为:
计算每个超级像素的平均特征
建立图像特征矩阵x:
其中,fj为超级像素建立的特征向量,
(s3)对于第一帧图像,由于已知目标轮廓,因此,将第一帧图像特征矩阵x1进行重新排列,得到属于目标的特征集和属于背景的特征集,并建立模板d,其中,d=[dodb],do为属于目标的特征集,db为属于背景的特征集;
(s4)从视频中第t帧图像开始,根据第t帧图像特征矩阵xt求解第t帧图像对模板d在拉普拉斯正则约束下低秩稀疏优化的系数矩阵z,其中t=2,3,...n,n为图像的总帧数,
所述系数矩阵z的计算公式为:
argminz(||z||*+λ||z||1+βtr(zlzt)+γ||e||1)
s.t.x=dz+e
其中,x为当前帧的图像特征矩阵,argminz为选取使目标函数最小时的z,s.t为约束条件,||.||*为核范数,||.||1为l1范数,tr(·)为矩阵的迹,l为正则矩阵,e为噪声,λ、β和γ为权重因子,正则矩阵l=t-w,w的每个元素
(s5)通过所述系数矩阵z确定当前帧中每个像素ii相对于目标的概率分布fs(ii),并生成低秩稀疏优化显著性地图,其计算公式为:
其中,max(·)为取向量中的最大值,ti为归一化参数,使得pi∈[0,1],zi为矩阵z的一列向量,
(s6)将图像作为像素的集合
(s7)根据(s6)所述像素的集合,计算当前帧与前一帧的光流信息,并通过所述光流信息确定当前帧中每个像素ii的位置,从而生成位置显著性地图,所述位置显著性地图即当前帧中每个像素ii相对于目标的位置概率分布fp(ii);
(s8)计算当前帧中两个不同位置像素ii和ij之间在颜色空间的相关性,得到相关性函数ψ(ii,ij),其中,ii和ij为任意两个不同位置的像素,所述相关性函数ψ(ii,ij)的计算公式为:
其中,ε为拉普拉斯平滑系统,exp(·)为指数函数,||·||2为二范数的平方,μ为当前图像中第i个像素点四领域像素值的平均值,冲激函数δ(ii≠ij)为当ii与ij为同一像素时,δ(ii≠ij)=0,其余情况为1;
(s9)根据上述得到的低秩稀疏优化显著性地图、颜色显著性地图、位置显著性地图及相关性函数ψ(ii,ij),构造能量函数模型,并利用最大流最小割算法对目标进行分割,从而得到目标区域和背景区域的分割结果,所述分割结果的求解过程为:
构造能量函数模型e(u)为:
计算目标区域和背景区域的最优分割结果u*为:
u*=argmine(u)
其中,
(s10)利用当前帧得到的目标区域和背景区域的分割结果更新模板d,并更新t=t+1,进而判断下一帧图像是否已分割,是则结束视频,否则返回步骤(s4),直到视频结束,其中,t=2,3,...n,n为图像的总帧数。
本发明通过低秩稀疏优化技术,计算元素在特征空间中的相似性,同时,通过拉普拉斯正则约束,在低秩稀疏优化的基础上增加被计算元素在空间中的相关性运算,解决了现有技术中在边界区域目标分割精度不高的问题,从而有效地使元素特征在目标边界处具有较强的辨识能力,提高了系统分割的精度,并且本发明将时空一致性计算统一在一个框架中,有效地降低了系统的复杂度,提高了系统的鲁棒性。