一种视频数据多维非负隐特征的提取装置和方法与流程

文档序号:13736486阅读:289来源:国知局
一种视频数据多维非负隐特征的提取装置和方法与流程

本发明属于图像识别领域,尤其涉及一种视频数据多维非负隐特征的提取装置和方法。



背景技术:

图像识别是涉及计算机工程应用、多媒体信息处理、机器学习和模式识别的重要应用和研究热点,是计算机科学与人工智能的主要问题之一。图像识别又包含若干研究,其中主流的一类问题就是视频图像数据的特征提取问题。由于视频数据可以转化为非负的高维稀疏数据矩阵,可以利用非负矩阵分解技术对视频数据进行分析,从数据中提取有效的特征信息,以揭示视频数据中蕴含的潜在规律和意义,从而达到识别的目的。所以非负矩阵分解是实现非负数据特征提取的一类主要技术。

在视频数据中,视频数据都可以看做多帧图像数据的集合,所以可以通过像素域来对其进行分析。目前的矩阵分解技术,已经能够并且从视频数据中有效的提取出隐特征。但是目前的非负矩阵分解技术基本都是利用欧氏距离作为目标函数,即只能提取一维的非负隐特征。但实际上距离函数有不同的表达形式,也会对特征提取结果造成不同的影响。欧式距离仅仅是一种特殊情况。同时这种特殊目标函数对应的不一定就是最优的隐特征提取结果。因此我们可以根据不同视频数据的特点提取多维非负隐特征,并且能够从提取的多维非负隐特征中自适应选择精度最高的提取结果

在海量数据应用时代,由于大量视频数据存在高速、动态、异构的特性,在很多情况下,视频数据的关键帧可以代表整个视频数据的特点和内容。因此,针对现代大型视频监控系统中的视频数据,进行高精度的关键帧隐特征提取,是图像识别中所需要解决的一个关键技术问题。



技术实现要素:

有鉴于此,本发明的目的在于提供一种视频数据多维非负隐特征的提取装置和方法,从而解决现代大型视频监控系统中的视频数据的高效高准确度的隐特征提取问题。

为达到上述目的,本发明提供如下技术方案:

一种视频数据多维非负隐特征的提取装置,该装置包含接收模块,距离目标函数模块,储存模块,特征提取模块;

所述接收模块用于接收视频数据采集设备的图像并指示所述存储模块对采集的视频数据进行存储;

所述距离目标函数模块用于根据不同的视频数据,选择不同的距离目标函数计算不同维的非负隐特征;

所述储存模块包含隐特征储存单元和视频数据储存单元,所述视频数据存储单元用于储存所述接收模块传来的视频数据,所述隐特征储存单元用于储存在不同距离目标函数下提取的不同维的非负隐特征;

所述特征提取模块用于结合不同的距离目标函数计算视频数据的多维非负隐特征提取过程,并将提取的多维非负隐特征存入所述隐特征储存单元。

进一步,所述特征提取模块包含参数初始化单元、迭代单元和迭代结果输出单元,

所述参数初始化单元用于初始化视频数据隐特征提取过程中涉及的提取参数;

所述迭代单元用于将所述视频数据储存单元储存的视频数据和不同的距离目标函数以及所述提取参数结合并提取出不同距离目标函数下的视频数据隐特征;

所述迭代结果输出单元用于提取最高隐特征分解结果并储存至所述隐特征储存单元。

一种视频数据多维非负隐特征的提取方法,包含如下步骤:

s1:接收模块接收视频采集设备采集的视频数据,并存入存储模块的视频数据储存单元;

s2:特征提取模块接收服务器发送的提取视频非负隐特征指令;

s3:特征提取模块的参数初始化单元对视频数据隐特征提取过程中涉及的提取参数进行初始化;

s4:距离目标函数模块针对视频数据,选择不同的距离目标函数计算不同维的非负隐特征;

s5:特征提取模块结合不同的距离目标函数计算视频数据的多维非负隐特征,提取视频数据的非负隐特征,并将提取的非负隐特征存入存储模块的隐特征存储单元。

进一步,所述视频数据隐特征提取过程中涉及的提取参数包含:行隐特征矩阵s、列隐特征矩阵t、矩阵空间维数f、迭代控制变量l、矩阵分解迭代次数上限k、迭代步长δ、正则化惩罚项因子λs和λt、迭代收敛终止门限τ。

进一步,所述步骤s5中提取的视频数据的非负隐特征包括行隐特征矩阵s和列隐特征矩阵t。

进一步,所述步骤s4具体为:

s41:距离目标函数模块针接收计算距离目标函数指令;

s42:距离目标函数模块从接收模块中读取视频数据目标矩阵r的已知数据合集rk计算距离目标函数;

所述距离目标函数模块中的距离目标函数为:

其中rk为已知数据集合,β≥0,ru,i代表视频数据目标矩阵r中第u行,第i列的数据,表示ru,i估计值

进一步,所述步骤s5具体为:

s51:特征提取模块根据视频数据的目标矩阵r的已知数据集合rk,并结合距离目标函数,构造目标损失函数ε如下:

(1)β=0时目标函数为:

(2)β=1时目标函数为:

(3)β≠0,β≠1时目标函数为:

其中:su,m表示行隐特征矩阵s中的第u行第m列的数据,tm,i表示列隐特征矩阵t中第m行第i列的数据;

s52:判断提取迭代控制变量l是否已达上限k,若已达到上限k则进行s55,若未达上限k则进行步骤s53;

s53:根据迭代收敛终止门限τ判断目标损失函数ε是否收敛,若不收敛则进行步骤s54,若收敛则进行步骤s55;

s54:用梯度下降法根据行隐特征矩阵s和列隐特征矩阵t对目标损失函数ε进行迭代优化,并回到步骤s52进行判断,迭代公式如下:

ⅰ:β=0时迭代公式为:

ⅱ:β=1时迭代公式为:

ⅲ:β≠0,β≠1时迭代公式为:

其中:iu表示第i列有数据的像素点个数、ui表示第u行有数据的像素点个数;

s55:特征提取模块提取多维行隐特征矩阵s和列隐特征矩阵t,并选取分解精度最高的多维行隐特征矩阵s和列隐特征矩阵t输出至存储模块的隐特征存储单元。本发明的有益效果在于:

本发明的有益效果为:本发明提供了一种视频数据多维非负隐特征的提取装置和方法,其专门作用于视频数据,能够针对不同视频数据提取多维非负隐特征,并且能够从提取的多维非负隐特征中自适应选择精度最高的提取结果,能够解决现代大型视频监控系统中的视频数据的高效高准确度的隐特征提取问题。

附图说明

为了使本发明的目的、技术方案和有益效果更加清楚,本发明提供如下附图进行说明:

图1为本发明的视频数据多维非负隐特征的提取装置结构示意图;

图2为本发明的视频数据多维非负隐特征的提取流程图;

图3为本发明的视频数据多维非负隐特征提取的准确度对比。

具体实施方式

下面将结合附图,对本发明的优选实施例进行详细的描述。

图1为本发明视频数据多维非负隐特征的提取装置(以下简称装置)结构示意图。装置包括:

接收模块110:接收视频采集设备采集的视频数据,并指示存储模块130对接收的视频数据进行存储。

距离目标函数模块120:针对视频数据,选择不同的距离目标函数计算不同维的非负隐特征。

存储模块130:用于存储由接收模块接收的视频数据以及提取的非负隐特征;包括视频数据存储单元131,存储接收模块110接收的视频数据;隐特征存储单元132,存储装置在不同距离目标函数下提取的多维非负隐特征,以备用。

特征提取模块140:结合不同的距离目标函数计算视频数据的多维非负隐特征提取过程,并将提取的非负隐特征存入存储模块中的隐特征存储单元;包括:参数初始化单元141,参数初始化隐特征提取过程中涉及的相关提取参数;迭代单元142,根据存储模块中隐特征存储单元131存储的视频数据,距离目标函数模块120中的不同距离目标函数和参数初始化单元141参数初始化的提取参数,提取视频数据隐特征;迭代结果输出单元143,提取迭代单元142中分解精度最高的视频数据隐特征,存储至视频数据模块中的隐特征存储单元132。

本发明装置的工作步骤如下:

(1)装置接收服务器发送的提取视频数据隐特征的指令。

(2)装置参数初始化相关参数。

(3)装置对视频数据的目标矩阵r的已知数据集合rk,根据不同的β-距离函数,构造目标损失函数ε。

(4)装置判断提取迭代控制变量l是否已达到上限l,若是,则执行步骤(7),否则,执行步骤(5)。

(5)装置判断ε是否在rk上收敛,若是,则执行步骤(7),否则,执行步骤(6)。

(6)装置使用梯度下降法,对ε进行迭代优化。

(7)计算行隐特征矩阵s和图像列隐特征矩阵t。

(8)装置将提取的行隐特征矩阵s和列隐特征矩阵t输出,存至隐特征存储单元133。

图2为本发明的视频数据多维非负隐特征的提取流程图,如图2所示,提取流程包括:

步骤200:装置计算不同的距离目标函数。

本步骤中,装置从接收模块中读取对视频数据的目标矩阵r的已知数据集合rk,然后根据距离函数的不同形式构造不同的目标损失函数ε。

步骤201:装置接收服务器发送的提取视频数据隐特征的指令。服务器向装置发送指令的方式可以是:定期、或根据所述装置的通知、或根据某服务器的通知,将要求从指定视频数据中提取隐特征的指令发送给装置。

步骤202:装置参数初始化相关参数,装置需要参数初始化的参数包括:初始化视频数据多维非负隐特征提取过程中涉及的相关参数,包括行隐特征矩阵s(矩阵中的元素su,m代表矩阵中第u行,第m列的数据)、列隐特征矩阵t(矩阵中的元素tm,i代表矩阵中第m行,第i列的数据),矩阵空间维数f、迭代控制变量l、矩阵分解迭代次数最高为k、迭代步长为δ、正则化惩罚项因子分别为λs和λt、迭代收敛终止门限为τ;

其中,矩阵空间维数f初始值为正整数;视频数据行隐特征矩阵s的大小是行数为m和列数为f的矩阵,并且每个元素参数初始化为0;视频数据列隐特征矩阵t的大小是行数为f和列数为n的矩阵,并且每个元素参数初始化为0;迭代控制变量l是控制迭代过程的变量,上限为k,参数初始化为正整数;迭代步长δ是迭代过程中对s和t进行迭代的步长的参数,是根据每一轮迭代过程中的分解结果进行自适应调整的参数;正则化惩罚项因子λs和λt是防止迭代过程中对应s和t相关元素过度拟合的正则化常数,初始化为极小正数;iu表示第i列有数据的像素点个数、ui表示第u行有数据的像素点个数。迭代收敛终止门限τ是判断迭代过程是否已收敛的门限参数,初始化为极小正数。

本实施例中,隐特征空间维数f是输出的隐特征维数的变量,初始值为正整数,如10或者20。行隐特征矩阵s是根据r的行数m,和f,建立的m行,d列的矩阵,其中每个元素参数初始化为开区间(0,0.05)内的随机数。列隐特征矩阵t是根据行数f,和r的列数n,建立的d行,n列的矩阵,其中每个元素参数初始化为开区间(0,0.05)内的随机数。参数初始化迭代控制变量l是控制提取迭代过程的变量;提取迭代控制变量l,参数初始化为0。迭代上限是控制提取迭代过程中,迭代次数上限的变量,参数初始化为正整数,如1000。正则化惩罚项因子λs和λt是控制提取迭代过程中,对应s和t相关元素的正则化项的正则化效应的常数,参数初始化为小于0.1的正数,如0.03。收敛终止阈值为τ是判断提取迭代过程是否已收敛的阈值参数,参数初始化为极小正数,如0.002。

步骤203:装置对视频数据的目标矩阵r的已知数据集合rk,结合不同的距离函数,构造目标损失函数ε。目标损失函数ε表示如下:

(1)β=0,目标函数以下式表示:

(2)β=1,目标函数以下式表示:

(3)β≠0和1,目标函数以下式表示:

使用行隐特征矩阵s和列隐特征矩阵t内积对其进行逼近;建立对应逼近值的β-距离,作为优化目标;使用tikhonov正则化,对优化过程进行约束。

步骤204:装置判断提取迭代控制变量l已达到上限l。装置首先在提取迭代控制变量l上累加1,然后判断提取迭代控制变量l是否大于提取迭代上限l。

步骤205:装置判断ε在rk上收敛。装置判断ε在rk上收敛的依据为,本轮迭代开始前,ε的数值,对比上轮迭代开始前,其差的绝对值是否小于收敛判定阈值τ;如果小于,则判定为已收敛,反之,则判定为未收敛。

步骤206:装置使用随机梯度下降法,根据s和t对ε进行迭代优化,训练迭代的如下公式所示:

(1)β=0,训练迭代过程以下式表示:

(2)β=1,训练迭代过程以下式表示:

(3)β≠0和1,训练迭代过程以下式表示:

步骤207:装置计算得到不同的距离目标函数下的多维行隐特征矩阵s和多维列隐特征矩阵t输出。

步骤208:装置将提取分解精度最高的行隐特征矩阵s和列隐特征矩阵t输出,存至隐特征存储单元132。装置存储至隐特征存储单元132的视频数据隐特征包括:行隐特征矩阵s和列隐特征矩阵t。

为了验证上述视频数据多维非负隐特征提取装置和方法的性能,我们在服务器上(配置:intelxeone5-2630v4,2.2ghz处理器,256g内存)安装了本装置,并运行仿真实验进行实例分析。在实例分析中,采用的视频数据来源于某监控系统高清视频数据。实例分析使用均方误差rmse作为视频数据隐特征提取准确度的评价指标,rmse越低,隐特征提取准确度越高。

图3为应用本发明实施例前后,对高清视频数据进行隐特征提取的准确度对比。参见图3,应用本发明实施例后,进行视频数据隐特征提取时,不同的距离目标函数会得到不同维的非负隐特征结果,从而导致不同的提取准确度。其中第一种情况表示欧式距离目标函数下隐特征提取结果,第二种情况表示应用本实施发明后,自适应选择最佳的隐特征提取结果。

由上述技术方案可见,本发明专门作用于视频数据,能够针对不同视频数据提取多维非负隐特征,并且能够从提取的多维非负隐特征中自适应选择精度最高的提取结果,能够解决现代大型视频监控系统中的视频数据的高效高准确度的隐特征提取问题。

最后说明的是,以上优选实施例仅用以说明发明的技术方案而非限制,尽管通过上述优选实施例已经对本发明进行了详细的描述,但本领域技术人员应当理解,可以在形式上和细节上对其作出各种各样的改变,而不偏离本发明权利要求书所限定的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1