一种视频去重方法、装置、计算机设备和存储介质与流程

文档序号:21408879发布日期:2020-07-07 14:43阅读:225来源:国知局
一种视频去重方法、装置、计算机设备和存储介质与流程

本发明实施例涉及视频处理的技术,尤其涉及一种视频去重方法、装置、计算机设备和存储介质。



背景技术:

随着移动互联网技术的发展,短视频类的应用广发普及,用户随时随地可制作并上传大量视频至平台,平台从中挑选出可能会受观众喜欢的视频,向观众推送。

但是,用户上传的视频中可能存在高度相似甚至雷同的重复的视频,这些重复的视频主要来自从其他平台搬运、一稿多投、模仿跟风等途径。

对观众用户来说,如推送的视频中存在重复视频,则会降低推送视频的多样性,使观众用户容易对内容产生厌倦,降低用户的观看积极性。

对投稿用户来说,如模仿、搬运热门视频容易被推送,则会挫伤创作的积极性。

因此,去除重复视频,有利于提高观众观看内容的多样性,提升观众用户的体验,同时,让原创内容获得更多的展示机会,能引导投稿用户创作原创内容,减少模仿跟风、直接搬运的投稿,有利于保护和鼓励原创内容,提高用户投稿的积极性。

由于深度学习的识别准确率较高,因此,目前平台多使用深度神经网络判断视频是否重复,即利用既存的或新训练的深度神经网络,提取视频特征并判断视频是否重复。

但是,深度神经网络计算量巨大,时间和设备成本较高,可扩展性较低,难以应对迅速增长的海量视频。



技术实现要素:

本发明实施例提供一种视频去重方法、装置、计算机设备和存储介质,以解决视频去重的时间和设备成本较高,可扩展性较低,难以应对迅速增长的海量视频的问题。

第一方面,本发明实施例提供了一种视频去重方法,包括:

获取多个原始视频数据;

从所述原始视频数据中提取静态图像特征,并依据所述静态图像特征筛选内容重复的第一候选视频数据;

从所述第一候选视频数据中提取视频纹理特征,并依据所述视频纹理特征筛选内容重复的第二候选视频数据;

从所述第二候选视频数据中学习视频动作特征,并依据所述视频动作特征筛选内容重复的第三候选视频数据;

从所述第三候选视频数据中选择作为视频代表的目标视频数据。

可选地,所述从所述原始视频数据中提取静态图像特征,并依据所述静态图像特征筛选内容重复的第一候选视频数据,包括:

从所述原始视频数据中提取视频图像数据;

从所述视频图像数据中提取静态图像特征;

计算所述静态图像特征之间的第一差异度;

若所述第一差异度小于预设的第一阈值,则确定所述静态图像特征所属的原始视频数据为第一候选视频数据。

可选地,所述从所述第一候选视频数据中提取视频纹理特征,并依据所述视频纹理特征筛选内容重复的第二候选视频数据,包括:

从所述第一候选视频数据中提取视频图像数据;

从所述视频图像数据中提取图像纹理特征;

将所述图像纹理特征组合为视频纹理特征;

计算所述视频纹理特征之间的第二差异度;

若所述第二差异度小于预设的第二阈值,则确定所述固定的视频特征所属的第一候选视频数据为第二候选视频数据。

可选地,所述从所述第二候选视频数据中学习视频动作特征,并依据所述视频动作特征筛选内容重复的第三候选视频数据,包括:

从所述第二候选视频数据中提取视频图像数据;

将所述视频图像数据输入预置的特征学习模型中,以学习图像动作特征;

将所述图像动作特征输入预置的特征生成模型中,以学习视频动作特征;

计算所述视频动作特征之间的第三差异度;

若所述第三差异度小于预设的第三阈值,则确定所述视频动作特征所属的第二候选视频数据为第三候选视频数据。

可选地,所述从所述第三候选视频数据中选择作为视频代表的目标视频数据,包括:

将所述第三候选视频数据聚合为视频簇;

从所述视频簇中选择作为视频代表的目标视频数据。

可选地,所述将所述第三候选视频数据聚合为视频簇,包括:

将所述第三候选视频数据转换为无向有权图;其中,所述无向有权图中的节点为所述第三候选视频数据,所述节点之间的边为所述第三候选视频数据之间的第三差异度;

合并具有相同边的节点,获得视频簇。

可选地,所述从所述视频簇中选择作为视频代表的目标视频数据,包括:

在所述视频簇中,查找所述第三候选视频数据对应的用户操作数据;

依据所述用户操作数据从所述第三候选视频数据中确定作为视频代表的目标视频数据。

第二方面,本发明实施例还提供了一种视频去重装置,包括:

原始视频数据获取模块,用于获取多个原始视频数据;

第一候选视频数据筛选模块,用于从所述原始视频数据中提取静态图像特征,并依据所述静态图像特征筛选内容重复的第一候选视频数据;

第二候选视频数据筛选模块,用于从所述第一候选视频数据中提取视频纹理特征,并依据所述视频纹理特征筛选内容重复的第二候选视频数据;

第三候选视频数据筛选模块,用于从所述第二候选视频数据中学习视频动作特征,并依据所述视频动作特征筛选内容重复的第三候选视频数据;

目标视频数据选择模块,用于从所述第三候选视频数据中选择作为视频代表的目标视频数据。

可选地,所述第一候选视频数据筛选模块包括:

第一视频帧提取子模块,用于从所述原始视频数据中提取视频图像数据;

静态图像特征提取子模块,用于从所述视频图像数据中提取静态图像特征;

第一差异度计算子模块,用于计算所述静态图像特征之间的第一差异度;

第一候选视频数据确定子模块,用于若所述第一差异度小于预设的第一阈值,则确定所述静态图像特征所属的原始视频数据为第一候选视频数据。

可选地,所述第二候选视频数据筛选模块包括:

第二视频帧提取子模块,用于从所述第一候选视频数据中提取视频图像数据;

静态纹理特征提取子模块,用于从所述视频图像数据中提取图像纹理特征;

视频纹理特征组合子模块,用于将所述图像纹理特征组合为视频纹理特征;

第二差异度计算子模块,用于计算所述视频纹理特征之间的第二差异度;

第二候选视频数据确定子模块,用于若所述第二差异度小于预设的第二阈值,则确定所述固定的视频特征所属的第一候选视频数据为第二候选视频数据。

可选地,所述第三候选视频数据筛选模块包括:

第三视频帧提取子模块,用于从所述第二候选视频数据中提取视频图像数据;

图像动作特征学习子模块,用于将所述视频图像数据输入预置的特征学习模型中,以学习图像动作特征;

视频动作特征学习子模块,用于将所述图像动作特征输入预置的特征生成模型中,以学习视频动作特征;

第三差异度计算子模块,用于计算所述视频动作特征之间的第三差异度;

第三候选视频数据确定子模块,用于若所述第三差异度小于预设的第三阈值,则确定所述视频动作特征所属的第二候选视频数据为第三候选视频数据。

可选地,所述目标视频数据选择模块包括:

视频数据聚合子模块,用于将所述第三候选视频数据聚合为视频簇;

视频簇选择子模块,用于从所述视频簇中选择作为视频代表的目标视频数据。

可选地,所述视频数据聚合子模块包括:

无向有权图转换单元,用于将所述第三候选视频数据转换为无向有权图;其中,所述无向有权图中的节点为所述第三候选视频数据,所述节点之间的边为所述第三候选视频数据之间的第三差异度;

节点合并单元,用于合并具有相同边的节点,获得视频簇。

可选地,所述视频簇选择子模块包括:

用户操作数据查找单元,用于在所述视频簇中,查找所述第三候选视频数据对应的用户操作数据;

用户操作数据选择单元,用于依据所述用户操作数据从所述第三候选视频数据中确定作为视频代表的目标视频数据。

第三方面,本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现第一方面所述的视频去重方法。

第四方面,本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面所述的视频去重方法。

在本发明实施例中,获取多个原始视频数据,从原始视频数据中提取静态图像特征,并依据静态图像特征筛选内容重复的第一候选视频数据,从第一候选视频数据中提取视频纹理特征,并依据视频纹理特征筛选内容重复的第二候选视频数据,从第二候选视频数据中学习视频动作特征,并依据视频动作特征筛选内容重复的第三候选视频数据,从第三候选视频数据中选择作为视频代表的目标视频数据,设置由粗到精逐步细化的三个筛选层次,扩展性好,以此来筛选内容重复的视频数据,在保证精确度的同时,逐步减少视频数据的数量,从而减少运算量,提高筛选的效率,并且,较好地保证视频数据的多样性,提高用户的观看体验,并鼓励用户投稿原创内容。

附图说明

图1为本发明实施例一提供的一种视频去重方法的流程图;

图2是本发明实施例二提供的一种视频去重方法的流程图;

图3为本发明实施例二提供的一种视频去重模型的结构示意图;

图4a和图4b为本发明实施例二提供的一种无向有权图和视频簇的示例图;

图5为本发明实施例三提供的一种视频去重装置的结构示意图;

图6为本发明实施例四提供的一种计算机设备的结构示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。

实施例一

图1为本发明实施例一提供的一种视频去重方法的流程图,本实施例可适用于去重内容重复的视频的场景,尤其适用于大量的短视频,从内容重复的视频中选择代表的视频,并推荐给用户。

所谓内容重复,可以指相同的视频数据(即文件相同,md5(messagedigestalgorithm,消息摘要算法第五版)等内容标识相同),也可以指将视频数据重新进行编码(原视频数据与新视频数据仅格式、长度等不一致,内容相同),还可以指对其他视频内容进行模仿(如舞蹈)、重新进行拍摄(语言、动作等模式大体相同或者保持一致,背景可能存在一定的差异、也可能大体相同或者保持一致)。

该方法可以由一种视频去重装置来执行,该视频去重装置可由软件和/或硬件实现,可配置在计算机设备中,该方法具体包括如下步骤:

s110、获取多个原始视频数据。

在本发明实施例中,在短视频的场景中,用户可在手机、平板电脑、智能穿戴设备(如智能手表、智能眼镜等)等移动终端中安装视频应用,调用摄像头录制视频数据,并上传至指定的计算机设备,或者,直接将移动终端本地存储的视频数据上传至指定的计算机设备。

在短视频的场景中,该视频数据可以为短视频,即长度从数秒至数分钟的视频。

需要说明的是,在其它场景中,用户也可以通过个人电脑、智能电视等非移动终端上传其它类型的视频数据,本发明实施例对此不加以限制。

对于计算机设备而言,可实时获取视频应用上传的视频数据,对于这些视频数据,可作为原始视频数据,进行去重处理之后,推荐给用户。

当然,在将视频推荐给用户之前,除了去重处理之外,还可以进行其它处理,例如,剔除违规视频、添加水印,等等,本发明实施例对此不加以限制。

s120、从所述原始视频数据中提取静态图像特征,并依据所述静态图像特征筛选内容重复的第一候选视频数据。

在本发明实施例中,可以从原始视频数据中提取静态图像特征,应用静态图像特征进行初次筛选,查找出内容重复的原始视频数据,并设置为第一候选视频数据。

其中,静态图像特征可以指原始视频数据中各帧视频图像数据的静态特征,应用静态图像特征进行筛选,精细度有限,但计算速度快,适合对海量的原始视频数据进行初次筛选。

需要说明的是,初次筛选出来的第一候选视频数据,实际为疑似内容重复的视频数据,其中可能包含了内容并非重复的视频数据。

s130、从所述第一候选视频数据中提取视频纹理特征,并依据所述视频纹理特征筛选内容重复的第二候选视频数据。

在本发明实施例中,可以从第一候选视频数据中提取视频纹理特征,应用视频纹理特征进行二次筛选,查找出内容重复的第一候选视频数据,并设置为第二候选视频数据。

其中,视频纹理特征可以指第一候选视频数据中各帧视频图像数据的纹理特征所组成的纹理特征,纹理特征是一种全局特征,它描述了图像所对应景物的表面性质,应用视频纹理特征进行筛选,精细度较高,计算速度较快,适合对数量较多的第一候选视频数据进行二次筛选。

需要说明的是,二次筛选出来的第二候选视频数据,实际也为疑似内容重复的视频数据,其中可能包含了内容并非重复的视频数据。

s140、从所述第二候选视频数据中学习视频动作特征,并依据所述视频动作特征筛选内容重复的第三候选视频数据。

在本发明实施例中,可以从第二候选视频数据中提取视频动作特征,应用视频动作特征进行三次筛选,查找出内容重复的第二视频数据,并设置为第三候选视频数据。

其中,视频动作特征可以指第二候选视频数据表达人物动作的特征,应用视频动作特征进行筛选,精细度高,计算速度较慢,适合对数量较少的第二候选视频数据进行三次筛选。

需要说明的是,三次筛选出来的第三候选视频数据,实际为疑似内容重复的视频数据,其中可能包含了内容并非重复的视频数据。

s150、从所述第三候选视频数据中选择作为视频代表的目标视频数据。

对于第三候选视频数据,可从中选择至少一个第三候选视频数据,作为视频代表的目标视频数据,推送给用户,对于内容与目标视频数据的其他第三候选视频数据,则可以去除,如忽略或删除,并不推送给用户。

需要说明的是,选择的目标视频数据还可以通过协同过滤、关联规则等其它方式再次进行筛选,选择与用户个性化适配的目标视频数据,再推送给用户。

在本发明实施例中,获取多个原始视频数据,从原始视频数据中提取静态图像特征,并依据静态图像特征筛选内容重复的第一候选视频数据,从第一候选视频数据中提取视频纹理特征,并依据视频纹理特征筛选内容重复的第二候选视频数据,从第二候选视频数据中学习视频动作特征,并依据视频动作特征筛选内容重复的第三候选视频数据,从第三候选视频数据中选择作为视频代表的目标视频数据,设置由粗到精逐步细化的三个筛选层次,扩展性好,以此来筛选内容重复的视频数据,在保证精确度的同时,逐步减少视频数据的数量,从而减少运算量,提高筛选的效率,并且,较好地保证视频数据的多样性,提高用户的观看体验,并鼓励用户投稿原创内容。

实施例二

图2为本发明实施例二提供的一种视频去重方法的流程图,本实施例以前述实施例为基础,进一步增加初次筛选、二次筛选、三次筛选、决策的处理操作。该方法具体包括如下步骤:

s201,获取多个原始视频数据。

s202,从所述原始视频数据中提取视频图像数据。

s203,从所述视频图像数据中提取静态图像特征。

s204,计算所述静态图像特征之间的第一差异度。

s205,若所述第一差异度小于预设的第一阈值,则确定所述静态图像特征所属的原始视频数据为第一候选视频数据。

在本发明实施例,如图3所示,设置快速筛选模型310,将原始视频数据输入至快速筛选模型310中进行处理,可输出第一候选视频数据。

具体地,快速筛选模型310可以应用静态图像哈希算法,包括但不限于phash(感知哈希算法)、marr-hildrethhash(马尔希尔德拉斯哈希算法)等算法。

这些算法可以分析图像的频域信息、边缘信息等静态图像特征,即该静态图像特征可以包括phash特征、marr-hildrethhash特征,等等。

需要说明的是,该静态图像特征为一个固定长度的哈希码,图像之间的差异度通过计算哈希码之间不同的位(bit)数量来衡量。

以汉明hamming距离为例,hamming距离越小,图像之间越相似,差异度越小。

将输入快速筛选模型310的原始视频数据解码为一系列连续或有间隔的视频图像数据,并对两个原始视频数据中每一帧视频图像数据计算静态图像特征,按视频图像数据在原始视频数据中的顺序,两两计算图像静态特征之间的第一差异度,取值最小的第一差异度作为两个原始视频数据的第一差异度。

如果两个原始视频数据中帧的数量不同,则以长度较短的原始视频数据的帧数为主,忽略长度较长的原始视频数据中剩余的部分。

设定第一阈值,如果两个原始视频数据之间的第一差异度低于该第一阈值,则视为疑似内容重复的视频对,记录下所有疑似内容重复的视频对,作为快速筛选模型310输出的结果。

s206,从所述第一候选视频数据中提取视频图像数据。

s207,从所述视频图像数据中提取图像纹理特征。

s208,将所述图像纹理特征组合为视频纹理特征。

s209,计算所述视频纹理特征之间的第二差异度。

s210,若所述第二差异度小于预设的第二阈值,则确定所述固定的视频特征所属的第一候选视频数据为第二候选视频数据。

在本发明实施例,如图3所示,设置精细筛选模型320,将第一候选视频数据输入至精细筛选模型320中进行处理,可输出第二候选视频数据。

具体地,精细筛选模型320可应用较为精细的哈希算法,包括但不限于dft(discretefouriertransform,离散傅里叶变换)、hog(histogramoforientedgradient,方向梯度直方图)、sift(scale-invariantfeaturetransform,尺度不变特征变换)等算法。

因此,该视频纹理特征可以包括dft特征、hog特征、sift特征,等等。

这些算法能针对第一候选视频数的特性,为每个第一候选视频数据输出一个固定长度的哈希码,作为视频纹理特征。

将输入精细筛选模型320的第一候选视频数据解码为一系列连续或有间隔的视频图像数据,并对第一候选视频数据中每一帧视频图像数据计算图像纹理特征,将各帧的图像纹理特征聚合后,生成整个第一候选视频数据的视频纹理特征。

对于第一候选视频数据,两两计算视频纹理特征之间的第二差异度,并设定第二阈值,如果两个第一候选视频数据之间的第二差异度低于该第二阈值,则视为疑似内容重复的视频对,记录下所有疑似内容重复的视频对,作为精细筛选模型320输出的结果。

s211,从所述第二候选视频数据中提取视频图像数据。

s212,将所述视频图像数据输入预置的特征学习模型中,以学习图像动作特征。

s213,将所述图像动作特征输入预置的特征生成模型中,以学习视频动作特征。

s214,计算所述视频动作特征之间的第三差异度。

s215,若所述第三差异度小于预设的第三阈值,则确定所述视频动作特征所属的第二候选视频数据为第三候选视频数据。

在本发明实施例,如图3所示,设置深度筛选模型330,将第二候选视频数据输入至深度筛选模型330中进行处理,可输出第三候选视频数据。

深度筛选模型330为一个融合学习图像动作特征学习和生成视频动作特征的深度神经网络,其中包括特征学习模型331和特征生成模型332两个部分。

特征学习模型331可使用视频分类数据集中各类网络来组成,包括但不限于基于3d卷积的c3d、i3d等网络、基于光流和空间的2stream方法的tsn(timescalarnetwork,时标网状图),以及基于rnn(recurrentneuralnetwork,循环神经网络)的各种动作识别网络。

因此,视频动作特征可以包括3d卷积特征、tsn特征、rnn特征,等等。

特征生成模型332可以是简单的mlp(multi-layerperceptron,多层感知器),也可以是更复杂的其他深度神经网络结构。其训练可以采无监督方式,包括但不限于auto-encoder(自动编码器),boltzmannmachine(玻尔兹曼机)等,也可以采用有监督的度量学习方式,本发明实施例对此不加以限制。

将输入深度筛选模型330的第二候选视频数据解码为一系列连续或有间隔的视频图像数据,将视频图像数据输入至特征学习模型331,对第二候选视频数据中每一帧视频图像数据计算图像动作特征,将图像动作特征输入特征生成模型332,产生一个固定长度的实数特征向量,作为第二候选视频数据的视频动作特征。

对于第二候选视频数据,两两计算视频动作特征之间的第三差异度,如直接计算欧式距离、量化为离散哈希码后计算汉明hamming距离等,并设定第三阈值,如果两个第二候选视频数据之间的第三差异度低于该第三阈值,则视为疑似内容重复的视频对,记录下所有疑似内容重复的视频对,作为深度筛选模型330输出的结果。

s216,将所述第三候选视频数据聚合为视频簇。

s217,从所述视频簇中选择作为视频代表的目标视频数据。

在本发明实施例,如图3所示,设置决策选择模型340,将第三候选视频数据输入至决策选择模型340中进行处理,可输出目标视频数据。

在具体实现中,决策选择模型340可将第三候选视频数据转换为无向有权图,又称无向带权图。

所谓无向,是指图中的边没有方向,可以从任意一边到达另一边。

所谓有权,是指图中的边被赋予一个权值,权值是一个数字,它能代表两个节点间的物理距离,或者从一个节点到另一个节点的时间。

其中,无向有权图中的节点为第三候选视频数据,节点之间的边为第三候选视频数据之间的第三差异度,即如果两个第三候选视频数据疑似内容重复,则它们直接存在一条表连接。

对于无向有权图,合并具有相同边的节点,获得视频簇。

具体地,合并的方法包括但不限于:如果无向有权图上两节点间存在一条边,则合并这两个节点,它们直接的边就不再存在。重复这个过程,直至无向有权图上不存在边,图上剩余的由多个节点合并而成的聚合节点,即为疑似内容相同的多个第三候选视频数据组成的视频簇。

在视频簇中,查找第三候选视频数据对应的用户操作数据,包括但不限于上传时间、上传用户、上传地点、点击次数等外部信息。

依据用户操作数据从第三候选视频数据中确定作为视频代表的目标视频数据,其中,确定的方法包括但不限于决策树、深度学习等方法。

在一个示例中,a、b、c、d、e、f、g、h、i、j、k、l均为第三候选视频数据。

其中,疑似内容重复的视频对包括如下:

a-c、a-g、a-d、b-d、b-e、b-h、c-d、c-f、e-g、e-h、f-h、i-k、i-j、j-k、k-l

如图4a所示,将第三候选视频数据配置为节点,按照视频对之间的差异度对节点之间配置边,生成无向有权图。

如图4b所示,将节点进行合并,获得两个视频簇,其中一个视频簇包含a、b、c、d、e、f、g、h,另一个视频簇包含i、j、k、l。

从前一个视频簇中选择a作为视频代表的目标视频数据,从后一个视频簇中选择j作为视频代表的目标视频数据。

实施例三

图5为本发明实施例三提供的一种视频去重装置的结构示意图,该装置具体可以包括如下模块:

原始视频数据获取模块510,用于获取多个原始视频数据;

第一候选视频数据筛选模块520,用于从所述原始视频数据中提取静态图像特征,并依据所述静态图像特征筛选内容重复的第一候选视频数据;

第二候选视频数据筛选模块530,用于从所述第一候选视频数据中提取视频纹理特征,并依据所述视频纹理特征筛选内容重复的第二候选视频数据;

第三候选视频数据筛选模块540,用于从所述第二候选视频数据中学习视频动作特征,并依据所述视频动作特征筛选内容重复的第三候选视频数据;

目标视频数据选择模块550,用于从所述第三候选视频数据中选择作为视频代表的目标视频数据。

在本发明的一个实施例中,所述第一候选视频数据筛选模块520包括:

第一视频帧提取子模块,用于从所述原始视频数据中提取视频图像数据;

静态图像特征提取子模块,用于从所述视频图像数据中提取静态图像特征;

第一差异度计算子模块,用于计算所述静态图像特征之间的第一差异度;

第一候选视频数据确定子模块,用于若所述第一差异度小于预设的第一阈值,则确定所述静态图像特征所属的原始视频数据为第一候选视频数据。

在本发明的一个实施例中,所述第二候选视频数据筛选模块530包括:

第二视频帧提取子模块,用于从所述第一候选视频数据中提取视频图像数据;

静态纹理特征提取子模块,用于从所述视频图像数据中提取图像纹理特征;

视频纹理特征组合子模块,用于将所述图像纹理特征组合为视频纹理特征;

第二差异度计算子模块,用于计算所述视频纹理特征之间的第二差异度;

第二候选视频数据确定子模块,用于若所述第二差异度小于预设的第二阈值,则确定所述固定的视频特征所属的第一候选视频数据为第二候选视频数据。

在本发明的一个实施例中,所述第三候选视频数据筛选模块540包括:

第三视频帧提取子模块,用于从所述第二候选视频数据中提取视频图像数据;

图像动作特征学习子模块,用于将所述视频图像数据输入预置的特征学习模型中,以学习图像动作特征;

视频动作特征学习子模块,用于将所述图像动作特征输入预置的特征生成模型中,以学习视频动作特征;

第三差异度计算子模块,用于计算所述视频动作特征之间的第三差异度;

第三候选视频数据确定子模块,用于若所述第三差异度小于预设的第三阈值,则确定所述视频动作特征所属的第二候选视频数据为第三候选视频数据。

在本发明的一个实施例中,所述目标视频数据选择模块550包括:

视频数据聚合子模块,用于将所述第三候选视频数据聚合为视频簇;

视频簇选择子模块,用于从所述视频簇中选择作为视频代表的目标视频数据。

在本发明的一个实施例中,所述视频数据聚合子模块包括:

无向有权图转换单元,用于将所述第三候选视频数据转换为无向有权图;其中,所述无向有权图中的节点为所述第三候选视频数据,所述节点之间的边为所述第三候选视频数据之间的第三差异度;

节点合并单元,用于合并具有相同边的节点,获得视频簇。

在本发明的一个实施例中,所述视频簇选择子模块包括:

用户操作数据查找单元,用于在所述视频簇中,查找所述第三候选视频数据对应的用户操作数据;

用户操作数据选择单元,用于依据所述用户操作数据从所述第三候选视频数据中确定作为视频代表的目标视频数据。

本发明实施例所提供的视频去重装置可执行本发明任意实施例所提供的视频去重方法,具备执行方法相应的功能模块和有益效果。

实施例四

图6为本发明实施例四提供的一种计算机设备的结构示意图,如图6所示,该计算机设备包括处理器600、存储器610、输入装置620和输出装置630;计算机设备中处理器600的数量可以是一个或多个,图6中以一个处理器600为例;计算机设备中的处理器600、存储器610、输入装置620和输出装置630可以通过总线或其他方式连接,图6中以通过总线连接为例。

存储器610作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的视频去重方法对应的程序指令/模块(例如,原始视频数据获取模块510、第一候选视频数据筛选模块520、第二候选视频数据筛选模块530、第三候选视频数据筛选模块540和目标视频数据选择模块550)。处理器600通过运行存储在存储器610中的软件程序、指令以及模块,从而执行计算机设备的各种功能应用以及数据处理,即实现上述的视频去重方法。

存储器610可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器610可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器610可进一步包括相对于处理器600远程设置的存储器,这些远程存储器可以通过网络连接至计算机设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

输入装置620可用于接收输入的数字或字符信息,以及产生与计算机设备的用户设置以及功能控制有关的键信号输入。输出装置630可包括显示屏等显示设备。

实施例五

本发明实施例五还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种视频去重方法,该方法包括:

获取多个原始视频数据;

从所述原始视频数据中提取静态图像特征,并依据所述静态图像特征筛选内容重复的第一候选视频数据;

从所述第一候选视频数据中提取视频纹理特征,并依据所述视频纹理特征筛选内容重复的第二候选视频数据;

从所述第二候选视频数据中学习视频动作特征,并依据所述视频动作特征筛选内容重复的第三候选视频数据;

从所述第三候选视频数据中选择作为视频代表的目标视频数据。

当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的视频去重方法中的相关操作.

通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、闪存(flash)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。

值得注意的是,上述视频去重装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。

注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1