本发明涉及一种基于并行注意力相关滤波的视频目标跟踪方法,属于图像处理技术领域。
背景技术
视觉跟踪在一些重要的计算机视觉应用中是一个先决条件,例如视频监控、行为识别、视频检索和人机交互等。尽管近几年视觉跟踪技术已经取得了较大进步,但还是只能给定第一帧的目标位置信息,在一些无约束的环境中,持续地跟踪一个一般目标仍然具有挑战性,这是因为目标的表观受到遮挡、快速运动和形变等干扰因素的严重影响。
目标跟踪的任务是寻找目标位置并判断目标特性,这是哪里和什么的问题,也和人类视觉感知中的注意力选择机制有关。心理学和认知学研究证据表明,人类视觉感知具有着重性和选择性,以至于人们的视觉系统能够专注于快速处理相关重要的视觉信息。人类视觉感知中有两个主要的视觉注意力机制:一个是空间选择性注意力(ssa),它能够减小一个神经元的相对领域,并提高对视觉域中一个特殊位置的敏感性;另一个是表观选择注意力(asa),它通过专门处理不同类型的特征以增强响应值,以此在大脑皮层的不同区域增强活性。
在离开眼睛后,这些进入前额大脑皮层的场景输入信号被分成背部流和腹部流,前者利用现存的空间关系(即哪里),而后者则着重强调表观特征(即什么)。一些感知学研究证明,这两种类型的机能可能被并行处理,这些机理在处理目标跟踪的干扰项、模糊和遮挡时可以扮演重要角色。如何利用这些研究去处理相关滤波类跟踪器中的哪里和什么的问题,对于解决复杂环境下的目标跟踪具有重要意义。
技术实现要素:
本发明要解决的技术问题是针对现有目标跟踪方法不能持续地跟踪一般目标的缺点,提出一种基于并行注意力相关滤波的视频目标跟踪方法,通过融合空间选择性注意力和表观选择注意力,实现对视频目标的持续有效跟踪。
为解决上述技术问题,本发明提供一种基于并行注意力相关滤波的视频目标跟踪方法,将跟踪问题设计为估计一个目标位置的概率,整合空间选择注意力(ssa)和表观选择注意力(asa),利用log函数得到目标函数,实现视频目标的持续有效跟踪,包括以下步骤:
(1)获取ssa位置响应图:首先,针对跟踪目标,在跟踪目标周围的局部域,产生一系列的二值图来描述不同粒度下目标和它的周围场景之间的拓扑结构,将图片从上到下按由粗到细的描述粒度排列,得到一组跟踪目标布尔图bi(i=1,2,......,nb),粗粒度布尔图对全局形状信息进行编码描述明显的目标表观变化,细粒度的布尔图描述空间的细节结构;然后,针对跟踪目标定义一个二值滤波器f,将f作用在布尔图bi上,获得条件位置响应图,并通过最小化线性回归函数完成学习权重,为每个布尔图学习一个最优的权重,对每个图加权得到最后的位置响应图:
(2)获取asa目标图:首先,在跟踪目标周围的半局部域采样一系列干扰区域,将岭回归目标函数近似等价为一个度量学习的相关滤波器,在相关视频滤波中学习抗干扰距离度量,解决建模正样本间的相互关系;然后,引入抗干扰度量正则项,对经目标图像进行抗干扰度量正则相关滤波,在相关滤波中学习抗干扰距离度量,同时考虑来自真实负样本的有用的相互关系,将干扰项推入负域,获取目标跟踪图片:
(3)持续跟踪视频目标:通过log函数建模获得整合ssa和asa的目标函数,利用该函数对视频目标进行跟踪,并在线更新参数,实现对视频目标的有效跟踪。
所述基于并行注意力相关滤波的视频目标跟踪方法的具体步骤如下:
(1)获取ssa位置响应图
(1.1)针对跟踪目标,在跟踪目标周围的局部域,通过下式产生一系列的二值图来描述不同粒度下目标和它的周围场景之间的拓扑结构:
其中,i(j)表示第j个像素强度,u(·)是一个一元函数,r(·)表示一个取整函数,
将图片从上到下按由粗到细的描述粒度排列,得到一组跟踪目标布尔图bi(i=1,2,......,nb),粗粒度布尔图对全局形状信息进行编码描述明显的目标表观变化,细粒度的布尔图描述空间的细节结构
(1.2)进行权重学习:按常规方法,针对跟踪目标定义一个二值滤波器
其中,ωo是场景中出现目标的区域,ωb是场景中出现的背景区域,dw是特征的宽度,dh是特征的高度,
(2)获取asa目标图
(2.1)在跟踪目标周围的半局部域采样一系列干扰区域
其中,
(2.2)在相关滤波目标函数中引入抗干扰度量正则项,获得抗干扰度量正则相关滤波模型
其中,
其中,xi是第i个样本向量,
(4)持续跟踪视频目标
通过log函数建模,整合ssa和asa图像,得到如下目标函数:
其中,p(bi,f|i∈ωo)表示获得的ssa位置响应图,
利用该目标函数,对视频目标进行跟踪,并在线更新参数,实现对目标的有效跟踪。
所述正则项系数λ的取值为0.001,融合系数η的取值是0.006。
本发明的原理是:
本发明的核心是把跟踪问题规划为估计一个目标位置概率,无缝地整合ssa和asa:
这里ωo∈r2表示目标区域并且o表示出现在场景中的目标,
这里的p(bi,f|i∈ωo)和p(xi,wi|i∈ωo)定义为:
这里的*是一个空间相关操作,βi是一个待优化的权重系数,并且e(·)是个指数函数。
在建模ssa中,本发明首先产生一系列的二值图,即产生bmr,描述不同粒度下目标和它的周围场景之间的拓扑结构。图2中,从上到下,布尔图描述的粒度从粗到细,其中粗粒度布尔图编码了全局形状信息,它对大的目标表观变化是鲁棒的,然而,细粒度的则描述了空间的结构细节,它对精确的目标定位是有效的。然后将一个预先定义的二值滤波器作用在这些图上,得到一组条件位置响应图,其中每个被加权来得到最后的位置响应图,目标是为每个布尔图去学习一个最优的权重。
bmr是受最近人类视觉注意力研究的启发,表现为对一个场景的短暂知觉意识能够利用一组布尔图来表示。特别地,给出的
这里的阈值θi来自一个在[0,255]之间的独立分布(黑白二值图),并且这个符号≥表示元素级的不等号。为了简化,把阈值设为θi=nb(i-1)/255,它通过一个固定的步长δ=nb/255从0到255之间采样,因为固定步长的采样是和无穷δ→0统一采样完全等价的。因此,很容易证明
这里的u(·)是一个一元函数,如u(2)=[1;1;0],u(3)=[1;1;1]有3个离散的层,并且,r(·)表示一个取整函数。
在进行权重学习时,本发明通过最小化以下的线性回归函数来学习权重:
这里||·||f表示f范数。很显然,最小化式(6)中的
这里的式(5)已经被式(7)取代了。ωo和ωb分别表示目标和背景区域,并且
通过置
为了自适应目标随着时间的表观变化,在线更新系数
这里的
在解决干扰问题方面,本发明利用人类视觉感知中的asa着重于学习表观特征原理,通过学习一个抗干扰距离度量来把干扰项推到负空间里,以此增强特征的判别能力,从而产生针对干扰项时的鲁棒跟踪,可以很好地把目标从干扰项里区分出来。先将学习相关滤波近似为学习一个距离度量,解决建模正样本间的相互关系,然后在相关滤波中学习抗干扰距离度量,同时考虑来自真实负样本的有用的相互关系。
在距离度量学习中,学习cf被表示成一个空间岭回归目标函数:
这里的
基于此,为了清楚地展示相关滤波学习和度量学习之间的关系,在式(10)中设置
接下来,用标志
这里的
但是在式(11)中只考虑了正样本之间的关系,因此限制了它从背景中区分出目标的判别能力。为了解决这个问题,在式(10)中添加一个抗干扰度量正则项,其由负空间的关系组成,并且作为把干扰项推到负空间的一种力量。
在进行抗干扰度量正则相关滤波时,首先从目标周围的半局部域采样一系列干扰区域
这里的γ是一个正则项系数,并且wmn是一个权重,它度量出样本i和j之间的相似性。权重越大,样本差异性就越大,从而使得学到的表观特征更有判别力。
式(12)能够被重新规划成:
这里的
这里的
这里的
因为循环矩阵x满足
这里的f表示离散傅立叶变换(dft)矩阵,
这里
在式(14)中代入式(17)、(18),得到它的解的fft
这里的
这里的
这里的
本发明基于人类视觉感知提出了一个相关滤波类跟踪算法,反映了在人类视觉感知中的ssa和asa机制,通过并行地处理一个局部和半局部背景域,增强了目标跟踪的鲁棒性和抗干扰性。对于局部域,为了建模ssa,一个简单但是有效的bmr被引入相关滤波学习之中,通过随机二值化图像颜色通道来刻画目标和它的场景的局部拓扑结构,其对于各种变换是不变的。对于半局部域,为了建模asa,一个抗干扰度量正则项被引入相关滤波的目标函数之中,它作为把干扰项推入负域的一个力量,因此在遇到有挑战性的目标相似物体干扰项时,增强了跟踪的鲁棒性。具有处理问题时更加稳健准确、适应性强、跟踪效果好等优点,可实现对视频目标的持续有效跟踪。
附图说明
图1是本发明的原理图。
图2是本发明建模ssa的流程图。
具体实施方式
下面结合附图对本发明的具体实施方式作进一步详尽描述,实施例中未注明的技术或产品,均为现有技术或可以通过购买获得的常规产品。
实施例1:如图1、2所示,本基于并行注意力相关滤波的视频目标跟踪方法是将跟踪问题设计为估计一个目标位置的概率,整合空间选择注意力(ssa)和表观选择注意力(asa),利用log函数得到目标函数,实现视频目标的持续有效跟踪,包括以下步骤:
(1)获取ssa位置响应图:首先,针对跟踪目标,在跟踪目标周围的局部域,产生一系列的二值图来描述不同粒度下目标和它的周围场景之间的拓扑结构,将图片从上到下按由粗到细的描述粒度排列,得到一组跟踪目标布尔图bi(i=1,2,......,nb),粗粒度布尔图对全局形状信息进行编码描述明显的目标表观变化,细粒度的布尔图描述空间的细节结构;然后,针对跟踪目标定义一个二值滤波器f,将f作用在布尔图bi上,获得条件位置响应图,并通过最小化线性回归函数完成学习权重,为每个布尔图学习一个最优的权重,对每个图加权得到最后的位置响应图:
(2)获取asa目标图:首先,在跟踪目标周围的半局部域采样一系列干扰区域,将岭回归目标函数近似等价为一个度量学习的相关滤波器,在相关视频滤波中学习抗干扰距离度量,解决建模正样本间的相互关系;然后,引入抗干扰度量正则项,对经目标图像进行抗干扰度量正则相关滤波,在相关滤波中学习抗干扰距离度量,同时考虑来自真实负样本的有用的相互关系,将干扰项推入负域,获取目标跟踪图片:
(3)持续跟踪视频目标:通过log函数建模获得整合ssa和asa的目标函数,利用该函数对视频目标进行跟踪,并在线更新参数,实现对视频目标的有效跟踪。
本基于并行注意力相关滤波的视频目标跟踪方法的具体步骤如下:
(1)获取ssa位置响应图
(1.1)针对跟踪目标,在跟踪目标周围的局部域,通过下式产生一系列的二值图来描述不同粒度下目标和它的周围场景之间的拓扑结构:
其中,i(j)表示第j个像素强度,u(·)是一个一元函数,r(·)表示一个取整函数,
将图片从上到下按由粗到细的描述粒度排列,得到一组跟踪目标布尔图bi(i=1,2,......,nb),粗粒度布尔图对全局形状信息进行编码描述明显的目标表观变化,细粒度的布尔图描述空间的细节结构
(1.2)进行权重学习:按常规方法,针对跟踪目标定义一个二值滤波器
其中,ωo是场景中出现目标的区域,ωb是场景中出现的背景区域,dw是特征的宽度,dh是特征的高度,
(2)获取asa目标图
(2.1)在跟踪目标周围的半局部域采样一系列干扰区域
其中,
(2.2)在相关滤波目标函数中引入抗干扰度量正则项,获得抗干扰度量正则相关滤波模型
其中,
其中,xi是第i个样本向量,
(4)持续跟踪视频目标
通过log函数建模,整合ssa和asa图像,得到如下目标函数:
其中,p(bi,f|i∈ωo)表示获得的ssa位置响应图,
利用该目标函数,对视频目标进行跟踪,并在线更新参数,实现对目标的有效跟踪。
本例中,正则项系数λ=0.001,融合系数η=0.3。
实施例2:如图1、2所示,本基于并行注意力相关滤波的视频目标跟踪方法是将跟踪问题设计为估计一个目标位置的概率,整合空间选择注意力ssa和表观选择注意力asa,利用log函数得到目标函数,实现视频目标的持续有效跟踪,包括以下步骤:
(1)获取ssa位置响应图:首先,针对跟踪目标产生一系列的二值图来描述不同粒度下目标和它的周围场景之间的拓扑结构,将图片从上到下按由粗到细的描述粒度排列,得到一组跟踪目标布尔图bi,粗粒度布尔图对全局形状信息进行编码描述明显的目标表观变化,细粒度的布尔图描述空间的细节结构;然后,针对跟踪目标定义一个二值滤波器f,将f作用在布尔图bi上,获得条件位置响应图,并通过最小化线性回归函数完成学习权重,为每个布尔图学习一个最优的权重,对每个图加权得到最后的位置响应图:
(2)获取asa目标图:首先在跟踪目标周围的半局部域采样一系列干扰区域,将岭回归目标函数近似等价为一个度量学习的相关滤波器,在相关视频滤波中学习抗干扰距离度量,解决建模正样本间的相互关系;然后引入抗干扰度量正则项,对经目标图像进行抗干扰度量正则相关滤波,在相关滤波中学习抗干扰距离度量,同时考虑来自真实负样本的有用的相互关系,将干扰项推入负域,获取目标跟踪图片:
(3)持续跟踪视频目标:通过log函数建模获得整合ssa和asa的目标函数,利用该函数对视频目标进行跟踪,并在线更新参数,实现对视频目标的有效跟踪。
本例的具体步骤与实施例1相同,正则项系数λ=0.001,融合系数η=0.3。
上面结合附图对本发明的技术内容作了说明,但本发明的保护范围并不限于所述内容,在本领域的普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下对本发明的技术内容做出各种变化,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。