一种视频中运动目标跟踪的方法及装置与流程

文档序号:12887587阅读:192来源:国知局
一种视频中运动目标跟踪的方法及装置与流程

本发明实施例涉及计算机视觉、图像处理技术领域,具体涉及一种视频中运动目标跟踪的方法及装置。



背景技术:

视频特别是体育比赛视频已经成为网民娱乐互动的重要方式。视频中蕴含了丰富的信息,如体育比赛视频中,跟踪并识别画面中的运动物体,如球员和球,进而可以实现智能数据分析,可以为观众提供更好的交互体验。计算机视觉领域的目标跟踪技术就可以良好的实现上述目的。

现有的目标跟踪技术很多,如meanshift、基于粒子滤波的方法、基于统计学习的方法、基于相关滤波(correlationfilter)的方法,但是在体育视频中,同一队球员们的球衣颜色相同,外观相似,球员间区分较差,如果有两个球员靠的太近,跟踪算法很可能会产生漂移现象。原因之一就是目前基于相关滤波的跟踪算法利用的特征比较简单,对相似物体的区分度不够好,它用的都是简单的静态特征,如灰度或者人工设计的hog特征。在球员在争抢球时,在持球突破的情况下,不可避免的会被其他球员遮挡,有时候是部分遮挡,有时候是全部遮挡,跟踪的准确度都有待提高。

因此,如何提高视频中运动目标跟踪的准确性,成为亟须解决的问题。



技术实现要素:

针对现有技术存在的问题,本发明实施例提供一种视频中运动目标跟踪的方法及装置。

第一方面,本发明实施例提供一种视频中运动目标跟踪的方法,所述方法包括:

读取包含有待跟踪运动目标的视频帧,并提取所述视频帧的图像序列;

初始化所述图像序列,并将所述待跟踪运动目标划分为多个子块;

提取每个子块的运动特征,并将所述运动特征与预先提取的静态特征相融合,以形成融合特征;其中,所述运动特征是每帧图像序列的光流;

根据所述融合特征和子块位置计算模型,获得每个子块的位置信息;

根据每帧图像序列的每个子块的位置信息,确定每帧图像序列中每个子块的有效性,并根据有效子块获得所述待跟踪运动目标的整体位移;

根据所述每帧图像序列的有效子块,获取反映所述待跟踪运动目标图像尺度变化的伸缩系数;

根据所述伸缩系数和预设移动平均参数,获取所述待跟踪运动目标的图像尺度,并根据所述整体位移和所述图像尺度对所述待跟踪运动目标进行跟踪。

第二方面,本发明实施例提供一种视频中运动目标跟踪的装置,所述装置包括:

读取单元,用于读取包含有待跟踪运动目标的视频帧,并提取所述视频帧的图像序列;

初始化单元,用于初始化所述图像序列,并将所述待跟踪运动目标划分为多个子块;

融合单元,用于提取每个子块的运动特征,并将所述运动特征与预先提取的静态特征相融合,以形成融合特征;其中,所述运动特征是每帧图像序列的光流;

输入单元,用于根据所述融合特征和子块位置计算模型,获得每个子块的位置信息;

确定单元,用于根据每帧图像序列的每个子块的位置信息,确定每帧图像序列中每个子块的有效性,并根据有效子块获得所述待跟踪运动目标的整体位移;

获取单元,用于根据所述每帧图像序列的有效子块,获取反映所述待跟踪运动目标图像尺度变化的伸缩系数;

跟踪单元,用于根据所述伸缩系数和预设移动平均参数,获取所述待跟踪运动目标的图像尺度,并根据所述整体位移和所述图像尺度对所述待跟踪运动目标进行跟踪。

第三方面,本发明实施例提供另一种视频中运动目标跟踪的装置,包括:处理器、存储器和总线,其中,

所述处理器和所述存储器通过所述总线完成相互间的通信;

所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如下方法:

读取包含有待跟踪运动目标的视频帧,并提取所述视频帧的图像序列;

初始化所述图像序列,并将所述待跟踪运动目标划分为多个子块;

提取每个子块的运动特征,并将所述运动特征与预先提取的静态特征相融合,以形成融合特征;其中,所述运动特征是每帧图像序列的光流;

根据所述融合特征和子块位置计算模型,获得每个子块的位置信息;

根据每帧图像序列的每个子块的位置信息,确定每帧图像序列中每个子块的有效性,并根据有效子块获得所述待跟踪运动目标的整体位移;

根据所述每帧图像序列的有效子块,获取反映所述待跟踪运动目标图像尺度变化的伸缩系数;

根据所述伸缩系数和预设移动平均参数,获取所述待跟踪运动目标的图像尺度,并根据所述整体位移和所述图像尺度对所述待跟踪运动目标进行跟踪。

第四方面,本发明实施例提供一种非暂态计算机可读存储介质,包括:

所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如下方法:

读取包含有待跟踪运动目标的视频帧,并提取所述视频帧的图像序列;

初始化所述图像序列,并将所述待跟踪运动目标划分为多个子块;

提取每个子块的运动特征,并将所述运动特征与预先提取的静态特征相融合,以形成融合特征;其中,所述运动特征是每帧图像序列的光流;

根据所述融合特征和子块位置计算模型,获得每个子块的位置信息;

根据每帧图像序列的每个子块的位置信息,确定每帧图像序列中每个子块的有效性,并根据有效子块获得所述待跟踪运动目标的整体位移;

根据所述每帧图像序列的有效子块,获取反映所述待跟踪运动目标图像尺度变化的伸缩系数;

根据所述伸缩系数和预设移动平均参数,获取所述待跟踪运动目标的图像尺度,并根据所述整体位移和所述图像尺度对所述待跟踪运动目标进行跟踪。

本发明实施例提供的视频中运动目标跟踪的方法及装置,能够提高视频中运动目标跟踪的准确性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例视频中运动目标跟踪的方法流程示意图;

图2为本发明实施例包含有待跟踪运动目标的视频帧的其中一帧图像序列图;

图3为本发明实施例视频中运动目标跟踪的装置结构示意图;

图4为本发明实施例提供的装置实体结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

图1为本发明实施例视频中运动目标跟踪的方法流程示意图,如图1所示,本发明实施例提供的一种视频中运动目标跟踪的方法,包括以下步骤:

s1:读取包含有待跟踪运动目标的视频帧,并提取所述视频帧的图像序列。

具体的,装置读取包含有待跟踪运动目标的视频帧,并提取所述视频帧的图像序列。待跟踪运动目标可以是体育类视频中运动员及运动物体(球类等),但不作具体限定。读取视频帧、提取视频帧的图像序列采用本领域成熟技术,不再赘述。图2为本发明实施例包含有待跟踪运动目标的视频帧的其中一帧图像序列图,如图2所示,选定为白色队服9号球员作为待跟踪运动目标,待跟踪运动目标的选择可以自主灵活的设置。

s2:初始化所述图像序列,并将所述待跟踪运动目标划分为多个子块。

具体的,装置初始化所述图像序列,并将所述待跟踪运动目标划分为多个子块。初始化图像序列可以包括对跟踪参数进行初始化设置,如对每帧图像序列提取的特征类型,特征类型至少包括有运动特征。还有静态特征中的一种或多种,静态特征可选为灰度、方向梯度直方图(histogramoforientedgradient,以下简称hog)等。多个子块的个数可以预先设置,将待跟踪运动目标按照图2所示分成5个子块。提取的hog特征的维度可以是31维,而运动特征维度可以是384维,还可以对运动特征做pca(principalcomponentanalysis)降维处理,以实现加速计算。pca是一种常用的数据分析方法,pca通过线性变换将原始数据变换为一组各维度线性无关的表示,可用于提取数据的主要特征分量和高维数据的降维。

s3:提取每个子块的运动特征,并将所述运动特征与预先提取的静态特征相融合,以形成融合特征;其中,所述运动特征是每帧图像序列的光流。

具体的,装置提取每个子块的运动特征,并将所述运动特征与预先提取的静态特征相融合,以形成融合特征;其中,所述运动特征是每帧图像序列的光流。本发明实施例采用人工设计的hog特征作为静态特征,将hog特征与运动特征融合,可以通过pca对运动特性和/或hog特征先降维处理,再将降维处理后的运动特征的向量和hog特征的向量合成一个向量,从而得到融合特征的向量,例如:hog特征的维度可以降为30维,运动特征维度可以降为是60维,融合特征的向量就是90维。可以采用由预先训练好的神经网络来提取运动特征。

s4:根据所述融合特征和子块位置计算模型,获得每个子块的位置信息。

具体的,装置根据所述融合特征和子块位置计算模型,获得每个子块的位置信息。需要说明的是:子块位置计算模型可采用样本分类器,预先包括有训练好的训练样本,具体对训练样本进行训练的方式为现有的成熟技术,可以采用如下方式:通过

(1)在t帧时,以各个子块中心点为中心选取子块2.5倍大小的图像块作为初始样本x0,0;

(2)对x0,0分别向子块水平方向和垂直方向循环移位,得到的图像块xm,n作为训练样本,(m,n)∈{0,1,…,m-1}×{0,1,…,n-1};分类器训练时以前述在图像块上提取的融合特征来代表图像块xm,n。

(3)训练rls(自适应滤波器)线性分类器,目标函数为:

f(x)=wtx,

通过最小化误差函数:

来得到分类器的权重w,将w表示成xm,n的非线性映射函数的线性加权,λ为0~1之间小数、为范数:

(4)利用循环矩阵可以被傅里叶矩阵对角化的特性可以将计算变换到傅里叶域从而实现快速计算,上述公式中的am,n对应初始分类器系数a,a的快速计算方式如下:

其中,是服从高斯分布的回归标签的傅里叶变换,表示子块初始样本的每次循环移位是目标准确位置的真实概率。是训练核函数,该训练核函数是进行傅里叶变换后的x0.0和x0.0之间的向量乘积。

先对子块位置计算模型参数进行傅里叶变换,以得到变换后模型参数分类器系数和训练样本中的训练核函数子块位置计算模型包括有每个子块位置响应值的傅里叶变换值与位置信息的映射关系;

根据如下公式计算待跟踪运动目标对应的每个子块位置响应值的傅里叶变换值:

其中,z是包含待跟踪运动目标的图像块、x表示从前一帧样本学习到的目标表示、是核函数,是进行傅里叶变换后的z和x之间的向量间乘积、是分类器系数,⊙表示向量元素之间的点乘,为待跟踪运动目标对应的每个子块位置响应值的傅里叶变换值;

将所述傅里叶变换值中的最大值在所述映射关系中所对应的位置信息作为每个子块的位置信息。

s5:根据每帧图像序列的每个子块的位置信息,确定每帧图像序列中每个子块的有效性,并根据有效子块获得所述待跟踪运动目标的整体位移。

具体的,装置根据每帧图像序列的每个子块的位置信息,确定每帧图像序列中每个子块的有效性,并根据有效子块获得所述待跟踪运动目标的整体位移。根据如下公式计算每个子块对应的参数峰值均值比par:

其中,为第t帧图像序列中所述待跟踪运动目标对应的第i个子块的位置响应值的傅里叶变换值最大值、为第n帧图像序列中所述待跟踪运动目标对应的第i个子块的位置响应值的傅里叶变换值最大值,其中n的取值范围为1~t-1;

根据如下公式确定每帧图像序列对应的多个子块的有效性:

其中,t为预设阈值,为0~1之间的小数,t可选为0.5,可根据实际情况自主设置,每一个子块对应一个par,参照图2,5个子块对应有5个par,当子块被遮挡时,par参数会突然变小,因此通过预设阈值t(t=0.5)可以判断子块是否被遮挡,若par的数值大于等于预设阈值t,说明子块有效(没有被遮挡);若par的数值小于预设阈值t,说明子块无效(被遮挡);

根据所述位置信息,获取有效子块在第t帧图像序列与第t-1帧图像序列的位移变化量si;

根据如下公式获得所述每帧图像序列中所述待跟踪运动目标的整体位移s:

其中,m为每帧图像序列的有效子块个数、i表示m个有效子块中的其中一个、si为第i个有效子块在第t帧图像序列与第t-1帧图像序列的位移变化量、πi根据如下公式进行计算:

其中,t为预设阈值,为0~1之间的小数、par为每个有效子块对应的参数峰值均值比。

s6:根据所述每帧图像序列的有效子块,获取反映所述待跟踪运动目标图像尺度变化的伸缩系数。

具体的,装置根据所述每帧图像序列的有效子块,获取反映所述待跟踪运动目标图像尺度变化的伸缩系数。可分别根据如下公式计算每帧图像序列宽度值变化的伸缩系数rw(t)和高度值变化的伸缩系数rh(t):

其中,m为每帧图像序列的有效子块个数、i表示m个有效子块中的其中一个、wi(t)为第t帧图像序列的第i个有效子块的宽度值、wi(t-1)为第t-1帧图像序列的第i个有效子块的宽度值、hi(t)为第t帧图像序列的第i个有效子块的高度值、hi(t-1)为第t-1帧图像序列的第i个有效子块的高度值。需要说明的是:rw(t)和rh(t)能够反映待跟踪的运动目标作为一个目标整体的宽度和高度的伸缩程度。

s7:根据所述伸缩系数和预设移动平均参数,获取所述待跟踪运动目标的图像尺度,并根据所述整体位移和所述图像尺度对所述待跟踪运动目标进行跟踪。

具体的,装置根据所述伸缩系数和预设移动平均参数,获取所述待跟踪运动目标的图像尺度,并根据所述整体位移和所述图像尺度对所述待跟踪运动目标进行跟踪。可以分别根据如下公式计算宽度值变化的伸缩系数rw(t)对应的移动平均值ρw(t)和高度值变化的伸缩系数rh(t)对应的移动平均值ρh(t):

其中,q为预设的移动平均参数,为不小于2的自然数、q的设置可根据实际情况自主设置,可选为2或3,j为图像序列中的第j帧;

根据如下公式计算待跟踪运动目标的图像尺度:

其中,r为图像序列的第r帧,其中,r为自然数,且满足2≤r≤t、wt为第t帧图像序列中所述待跟踪运动目标的图像尺度的宽度、w1为初始帧图像序列中所述待跟踪运动目标的图像尺度的宽度、ρwr为第r帧图像序列中所述待跟踪运动目标宽度值变化对应的移动平均值;ht为第t帧图像序列中所述待跟踪运动目标的图像尺度的高度、h1为初始帧图像序列中所述待跟踪运动目标的图像尺度的高度、ρhr为第r帧图像序列中所述待跟踪运动目标高度值变化对应的移动平均值。通过整体位移和图像尺度可以实现对运动目标的有效跟踪。

本发明实施例提供的视频中运动目标跟踪的方法,能够提高视频中运动目标跟踪的准确性。

在上述实施例的基础上,所述根据所述融合特征和子块位置计算模型,获得每个子块的位置信息,包括:

对所述子块位置计算模型参数进行傅里叶变换,以得到变换后模型参数,所述变换后模型参数包括分类器系数和训练样本中的训练核函数所述子块位置计算模型包括有每个子块位置响应值的傅里叶变换值与位置信息的映射关系。

具体的,装置对所述子块位置计算模型参数进行傅里叶变换,以得到变换后模型参数,所述变换后模型参数包括分类器系数和训练样本中的训练核函数所述子块位置计算模型包括有每个子块位置响应值的傅里叶变换值与位置信息的映射关系。可参照上述实施例,不再赘述。

根据如下公式计算所述待跟踪运动目标对应的每个子块位置响应值的傅里叶变换值:

其中,z是包含待跟踪运动目标的图像块,x表示从前一帧样本学习到的目标表示,是核函数,是进行傅里叶变换后的z和x之间的向量间乘积,是分类器系数,⊙表示向量元素之间的点乘,为待跟踪运动目标对应的每个子块位置响应值的傅里叶变换值。

具体的,装置根据如下公式计算所述待跟踪运动目标对应的每个子块位置响应值的傅里叶变换值:

其中,z是包含待跟踪运动目标的图像块,x表示从前一帧样本学习到的目标表示,是核函数,是进行傅里叶变换后的z和x之间的向量间乘积,是分类器系数,⊙表示向量元素之间的点乘,为待跟踪运动目标对应的每个子块位置响应值的傅里叶变换值。可参照上述实施例,不再赘述。

将所述傅里叶变换值中的最大值在所述映射关系中所对应的位置信息作为每个子块的位置信息。

具体的,装置将所述傅里叶变换值中的最大值在所述映射关系中所对应的位置信息作为每个子块的位置信息。可参照上述实施例,不再赘述。

本发明实施例提供的视频中运动目标跟踪的方法,能够通过子块位置计算模型参数,准确获取到每个子块的位置信息。

在上述实施例的基础上,所述根据每帧图像序列的每个子块的位置信息,确定每帧图像序列中每个子块的有效性,并根据有效子块获得所述待跟踪运动目标的整体位移,包括:

根据如下公式计算每个子块对应的参数峰值均值比par:

其中,为第t帧图像序列中所述待跟踪运动目标对应的第i个子块的位置响应值的傅里叶变换值最大值、为第n帧图像序列中所述待跟踪运动目标对应的第i个子块的位置响应值的傅里叶变换值最大值,其中n的取值范围为1~t-1。

具体的,装置根据如下公式计算每个子块对应的参数峰值均值比par:

其中,为第t帧图像序列中所述待跟踪运动目标对应的第i个子块的位置响应值的傅里叶变换值最大值、为第n帧图像序列中所述待跟踪运动目标对应的第i个子块的位置响应值的傅里叶变换值最大值,其中n的取值范围为1~t-1。可参照上述实施例,不再赘述。

根据如下公式确定每帧图像序列对应的多个子块的有效性:

其中,t为预设阈值,为0~1之间的小数。

具体的,装置根据如下公式确定每帧图像序列对应的多个子块的有效性:

其中,t为预设阈值,为0~1之间的小数。可参照上述实施例,不再赘述。

根据所述位置信息,获取有效子块在第t帧图像序列与第t-1帧图像序列的位移变化量si。

具体的,根据所述位置信息,获取有效子块在第t帧图像序列与第t-1帧图像序列的位移变化量si。可参照上述实施例,不再赘述。

根据如下公式获得所述每帧图像序列中所述待跟踪运动目标的整体位移s:

其中,m为每帧图像序列的有效子块个数、i表示m个有效子块中的其中一个、si为第i个有效子块在第t帧图像序列与第t-1帧图像序列的位移变化量、πi根据如下公式进行计算:

其中,t为预设阈值,为0~1之间的小数、par为每个有效子块对应的参数峰值均值比。

具体的,装置根据如下公式获得所述每帧图像序列中所述待跟踪运动目标的整体位移s:

其中,m为每帧图像序列的有效子块个数、i表示m个有效子块中的其中一个、si为第i个有效子块在第t帧图像序列与第t-1帧图像序列的位移变化量、πi根据如下公式进行计算:

其中,t为预设阈值,为0~1之间的小数、par为每个有效子块对应的参数峰值均值比。可参照上述实施例,不再赘述。

本发明实施例提供的视频中运动目标跟踪的方法,通过累加计算有效子块位移变化量,从而准确获取待跟踪的运动目标的整体位移变化。

在上述实施例的基础上,所述根据所述每帧图像序列的有效子块,获取反映所述待跟踪运动目标图像尺度变化的伸缩系数,包括:

分别根据如下公式计算每帧图像序列中待跟踪运动目标宽度值变化的伸缩系数rw(t)和高度值变化的伸缩系数rh(t):

其中,m为每帧图像序列的有效子块个数、i表示m个有效子块中的其中一个、wi(t)为第t帧图像序列的第i个有效子块的宽度值、wi(t-1)为第t-1帧图像序列的第i个有效子块的宽度值、hi(t)为第t帧图像序列的第i个有效子块的高度值、hi(t-1)为第t-1帧图像序列的第i个有效子块的高度值。

具体的,装置分别根据如下公式计算每帧图像序列中待跟踪运动目标宽度值变化的伸缩系数rw(t)和高度值变化的伸缩系数rh(t):

其中,m为每帧图像序列的有效子块个数、i表示m个有效子块中的其中一个、wi(t)为第t帧图像序列的第i个有效子块的宽度值、wi(t-1)为第t-1帧图像序列的第i个有效子块的宽度值、hi(t)为第t帧图像序列的第i个有效子块的高度值、hi(t-1)为第t-1帧图像序列的第i个有效子块的高度值。可参照上述实施例,不再赘述。

本发明实施例提供的视频中运动目标跟踪的方法,通过计算反映待跟踪运动目标图像尺度变化的伸缩系数,保证获取运动目标图像尺度的正常进行。

在上述实施例的基础上,所述根据所述伸缩系数和预设移动平均参数,获取所述待跟踪运动目标的图像尺度,包括:

分别根据如下公式计算所述待跟踪运动目标整体宽度值变化的伸缩系数rw(t)对应的移动平均值ρw(t)和高度值变化的伸缩系数rh(t)对应的移动平均值ρh(t):

其中,q为预设的移动平均参数,为不小于2的自然数、j为图像序列中的第j帧。

具体的,装置分别根据如下公式计算所述待跟踪运动目标整体宽度值变化的伸缩系数rw(t)对应的移动平均值ρw(t)和高度值变化的伸缩系数rh(t)对应的移动平均值ρh(t):

其中,q为预设的移动平均参数,为不小于2的自然数、j为图像序列中的第j帧。可参照上述实施例,不再赘述。

根据如下公式计算所述待跟踪运动目标的图像尺度:

其中,r为图像序列的第r帧,其中,r为自然数,且满足2≤r≤t、wt为第t帧图像序列中所述待跟踪运动目标的图像尺度的宽度、w1为初始帧图像序列中所述待跟踪运动目标的图像尺度的宽度、ρwr为第r帧图像序列中所述待跟踪运动目标宽度值变化对应的移动平均值;ht为第t帧图像序列中所述待跟踪运动目标的图像尺度的高度、h1为初始帧图像序列中所述待跟踪运动目标的图像尺度的高度、ρhr为第r帧图像序列中所述待跟踪运动目标高度值变化对应的移动平均值。

具体的,装置根据如下公式计算所述待跟踪运动目标的图像尺度:

其中,r为图像序列的第r帧,其中,r为自然数,且满足2≤r≤t、wt为第t帧图像序列中所述待跟踪运动目标的图像尺度的宽度、w1为初始帧图像序列中所述待跟踪运动目标的图像尺度的宽度、ρwr为第r帧图像序列中所述待跟踪运动目标宽度值变化对应的移动平均值;ht为第t帧图像序列中所述待跟踪运动目标的图像尺度的高度、h1为初始帧图像序列中所述待跟踪运动目标的图像尺度的高度、ρhr为第r帧图像序列中所述待跟踪运动目标高度值变化对应的移动平均值。可参照上述实施例,不再赘述。

本发明实施例提供的视频中运动目标跟踪的方法,通过伸缩系数,保证运动目标图像尺度获取的准确性。

在上述实施例的基础上,所述方法还包括:

分别根据如下公式对分类器系数和训练样本进行更新:

其中,为更新后的分类器系数、为更新前的分类器系数、为初始帧图像序列中所述待跟踪运动目标对应的分类器系数;为更新后的训练样本、为更新前的训练样本、为初始帧图像序列中所述待跟踪运动目标对应的训练样本;i表示第i个子块、t为第t帧图像序列、η为预设的学习率,为0~1之间的小数。

具体的,装置分别根据如下公式对分类器系数和训练样本进行更新:

其中,为更新后的分类器系数、为更新前的分类器系数、为初始帧图像序列中所述待跟踪运动目标对应的分类器系数;为更新后的训练样本、为更新前的训练样本、为初始帧图像序列中所述待跟踪运动目标对应的训练样本;i表示第i个子块、t为第t帧图像序列、η为预设的学习率,为0~1之间的小数,η可根据实际情况自主设置,可以理解:当子块i有效时,采用初始帧图像序列对应的分类器系数和当前第t帧的前一帧(t-1帧)图像序列对应的分类器系数以及预设的学习率η,计算出更新的分类器系数初始帧可选为第一帧,但不做具体限定。同理,对于更新的训练样本的说明不再赘述。

分别采用更新后的分类器系数和更新后的训练样本替代更新前的分类器系数和更新前的训练样本并重复执行所述提取每个子块的运动特征之后的步骤,以实时跟踪运动目标。

具体的,装置分别采用更新后的分类器系数和更新后的训练样本替代更新前的分类器系数和更新前的训练样本并重复执行所述提取每个子块的运动特征之后的步骤,以实时跟踪运动目标,由此保证实时采用更新的训练样本和更新的分类器系数,对待跟踪运动目标进行实时跟踪。

本发明实施例提供的视频中运动目标跟踪的方法,不断地优化分类器系数和训练样本,进一步保证运动目标跟踪的准确性。

在上述实施例的基础上,所述并将所述运动特征与预先提取的静态特征相融合,以形成融合特征,包括:

将所述运动特征与人工设计的方向梯度直方图特征相融合,以形成融合特征。

具体的,装置将所述运动特征与人工设计的方向梯度直方图特征相融合,以形成融合特征。即:将运动特征与hog特征相融合,以形成融合特征,可参照上述实施例,不再赘述。

本发明实施例提供的视频中运动目标跟踪的方法,通过将运动特征与hog特征相融合,能够进一步保证运动目标跟踪的准确性。

图3为本发明实施例视频中运动目标跟踪的装置结构示意图,如图3所示,本发明实施例提供了一种视频中运动目标跟踪的装置,包括读取单元1、初始化单元2、融合单元3、输入单元4、确定单元5、获取单元6和跟踪单元7,其中:

读取单元1用于读取包含有待跟踪运动目标的视频帧,并提取所述视频帧的图像序列;初始化单元2用于初始化所述图像序列,并将所述待跟踪运动目标划分为多个子块;融合单元3用于提取每个子块的运动特征,并将所述运动特征与预先提取的静态特征相融合,以形成融合特征;其中,所述运动特征是每帧图像序列的光流;输入单元4用于根据所述融合特征和子块位置计算模型,获得每个子块的位置信息;确定单元5用于根据每帧图像序列的每个子块的位置信息,确定每帧图像序列中每个子块的有效性,并根据有效子块获得所述待跟踪运动目标的整体位移;获取单元6用于根据所述每帧图像序列的有效子块,获取反映所述待跟踪运动目标图像尺度变化的伸缩系数;跟踪单元7用于根据所述伸缩系数和预设移动平均参数,获取所述待跟踪运动目标的图像尺度,并根据所述整体位移和所述图像尺度对所述待跟踪运动目标进行跟踪。

具体的,读取单元1用于读取包含有待跟踪运动目标的视频帧,并提取所述视频帧的图像序列;初始化单元2用于初始化所述图像序列,并将所述待跟踪运动目标划分为多个子块;融合单元3用于提取每个子块的运动特征,并将所述运动特征与预先提取的静态特征相融合,以形成融合特征;其中,所述运动特征是每帧图像序列的光流;输入单元4用于根据所述融合特征和子块位置计算模型,获得每个子块的位置信息;确定单元5用于根据每帧图像序列的每个子块的位置信息,确定每帧图像序列中每个子块的有效性,并根据有效子块获得所述待跟踪运动目标的整体位移;获取单元6用于根据所述每帧图像序列的有效子块,获取反映所述待跟踪运动目标图像尺度变化的伸缩系数;跟踪单元7用于根据所述伸缩系数和预设移动平均参数,获取所述待跟踪运动目标的图像尺度,并根据所述整体位移和所述图像尺度对所述待跟踪运动目标进行跟踪。

本发明实施例提供的视频中运动目标跟踪的装置,能够提高视频中运动目标跟踪的准确性。

本发明实施例提供的视频中运动目标跟踪的装置具体可以用于执行上述各方法实施例的处理流程,其功能在此不再赘述,可以参照上述方法实施例的详细描述。

图4为本发明实施例提供的装置实体结构示意图,如图4所示,所述装置包括:处理器(processor)401、存储器(memory)402和总线403;

其中,所述处理器401、存储器402通过总线403完成相互间的通信;

所述处理器401用于调用所述存储器402中的程序指令,以执行上述各方法实施例所提供的方法,例如包括:读取包含有待跟踪运动目标的视频帧,并提取所述视频帧的图像序列;初始化所述图像序列,并将所述待跟踪运动目标划分为多个子块;提取每个子块的运动特征,并将所述运动特征与预先提取的静态特征相融合,以形成融合特征;其中,所述运动特征是每帧图像序列的光流;根据所述融合特征和子块位置计算模型,获得每个子块的位置信息;根据每帧图像序列的每个子块的位置信息,确定每帧图像序列中每个子块的有效性,并根据有效子块获得所述待跟踪运动目标的整体位移;根据所述每帧图像序列的有效子块,获取反映所述待跟踪运动目标图像尺度变化的伸缩系数;根据所述伸缩系数和预设移动平均参数,获取所述待跟踪运动目标的图像尺度,并根据所述整体位移和所述图像尺度对所述待跟踪运动目标进行跟踪。

本实施例公开一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的方法,例如包括:读取包含有待跟踪运动目标的视频帧,并提取所述视频帧的图像序列;初始化所述图像序列,并将所述待跟踪运动目标划分为多个子块;提取每个子块的运动特征,并将所述运动特征与预先提取的静态特征相融合,以形成融合特征;其中,所述运动特征是每帧图像序列的光流;根据所述融合特征和子块位置计算模型,获得每个子块的位置信息;根据每帧图像序列的每个子块的位置信息,确定每帧图像序列中每个子块的有效性,并根据有效子块获得所述待跟踪运动目标的整体位移;根据所述每帧图像序列的有效子块,获取反映所述待跟踪运动目标图像尺度变化的伸缩系数;根据所述伸缩系数和预设移动平均参数,获取所述待跟踪运动目标的图像尺度,并根据所述整体位移和所述图像尺度对所述待跟踪运动目标进行跟踪。

本实施例提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行上述各方法实施例所提供的方法,例如包括:读取包含有待跟踪运动目标的视频帧,并提取所述视频帧的图像序列;初始化所述图像序列,并将所述待跟踪运动目标划分为多个子块;提取每个子块的运动特征,并将所述运动特征与预先提取的静态特征相融合,以形成融合特征;其中,所述运动特征是每帧图像序列的光流;根据所述融合特征和子块位置计算模型,获得每个子块的位置信息;根据每帧图像序列的每个子块的位置信息,确定每帧图像序列中每个子块的有效性,并根据有效子块获得所述待跟踪运动目标的整体位移;根据所述每帧图像序列的有效子块,获取反映所述待跟踪运动目标图像尺度变化的伸缩系数;根据所述伸缩系数和预设移动平均参数,获取所述待跟踪运动目标的图像尺度,并根据所述整体位移和所述图像尺度对所述待跟踪运动目标进行跟踪。

本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:rom、ram、磁碟或者光盘等各种可以存储程序代码的介质。

以上所描述的装置等实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是:以上各实施例仅用以说明本发明的实施例的技术方案,而非对其限制;尽管参照前述各实施例对本发明的实施例进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明的实施例各实施例技术方案的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1