视频指纹生成方法、检索方法、电子设备及介质与流程

文档序号:20701717发布日期:2020-05-12 15:48阅读:694来源:国知局
视频指纹生成方法、检索方法、电子设备及介质与流程

本发明涉及视频处理技术领域,尤其涉及一种视频指纹生成方法、检索方法、电子设备及介质。



背景技术:

视频指纹(videofingerprinting)服务是基于视频指纹技术,根据视频内容生成一串可唯一标识当前视频的指纹字符,可以有效避免视频文件的格式转换、编辑、裁剪拼接和压缩旋转等操作的影响。可用于视频相似查重、视频版权、广告识别等多种场景,视频指纹具有视频识别、检索、版权保护等多种用途。

现有的视频指纹匹配技术中,对获取的待测视频的帧图片进行分块,根据每个分块的像素对待测视频的帧图片进行编码形成视频指纹;将测试视频的帧图片的编码进行哈希映射,获取哈希映射地址;在预先建立的视频指纹库的哈希表中查找所述哈希映射地址,根据查找结果进行匹配识别。

现有技术中,还有在视频指纹提取阶段,将视频感兴趣区域作为提取视频指纹的基本单元,采用基于聚类算法去除视频指纹的时域冗余特征;在视频指纹匹配阶段,采用多个视频指纹距离平均值方法的进行视频指纹匹配。

现有技术中,还有按照帧间相关性对视频序列关键帧分块并从中提取视频特征,在关键帧各子块中依据像素点的分类结果统计像素点特征字典各元素的出现次数,得到子块的特征向量拼接成关键帧的高维指纹,经降维,将各关键帧指纹按照时间先后顺序连成视频关键帧指纹串。

现有技术中,还有对视频进行标签预处理;搜索视频前,先对视频进行多标签分类,然后通过视频库标签匹配来缩小识别范围。

其中,对于分块进行处理,都是生成高维特征向量,通过高维特征向量进行视频的检索和匹配时需要的运算能力巨大,而且一般意义上的一维表达会由于视频处理出现信息丢失或者表达不准确的问题,因此目前如何精简视频指纹在视频检索和匹配的应用是业内亟需解决的一个重要难题。



技术实现要素:

本发明实施例提供一种视频指纹生成方法、检索方法、电子设备及介质,用以解决现有技术中视频检索不准确和运算量大的问题。

第一方面,本发明实施例提供一种视频指纹的生成方法,所述方法包括:基于视频特征提取模型,获取二维特征向量表征的视频精细指纹;基于信息熵,将所述视频精细指纹转换为一维特征向量表征的视频简要指纹。

其中,所述的视频指纹的生成方法还包括:根据所述视频精细指纹和视频简要指纹,建立对应的视频精细指纹库和视频简要指纹库;根据所述视频简要指纹,建立所述视频简要指纹库对应于一维特征向量值的空间坐标索引。

其中,所述将所述视频精细指纹转换为一维特征向量表征的视频简要指纹包括:将所述二维特征向量进行一维压缩;对所述视频的每帧压缩后的特征向量值获取信息熵的和,作为所述帧的信息熵;基于所述帧的信息熵,将所述视频的帧序列转换为所述一维特征向量。

第二方面,本发明实施例提供一种视频指纹的检索方法,包括:基于视频特征提取模型,获取二维特征向量表征的待测视频的精细指纹;基于信息熵,将所述待测视频的精细指纹转换为一维特征向量表征的待测视频的简要指纹;基于空间坐标索引,将所述待测视频的简要指纹和视频简要指纹库进行匹配,从视频简要指纹库中获取对应于匹配结果的初选视频集合。

其中,所述的视频指纹的检索方法还包括:匹配所述待测视频的精细指纹和所述初选视频集合对应的精细指纹库,获取匹配结果。

其中,所述基于空间坐标索引,将所述待测视频的简要指纹和视频简要指纹库进行匹配,从视频简要指纹库中获取对应于匹配结果的初选视频集合,包括:确定所述待测视频的一维特征向量,根据影响因子和步长,调整所述待测视频的一维特征向量的取值范围;将所述待测视频的一维特征向量的每一个值与所述空间坐标索引进行匹配,确认匹配结果在所述取值范围内;记录所述空间坐标索引中对应的初选空间坐标,根据所述初选空间坐标,确定对应的初选视频集合。

其中,所述将所述待检测视频的一维特征向量的每一个值与所述空间坐标索引进行匹配,包括:根据所述待测视频的每一帧图像的一维特征向量与所述空间坐标索引匹配的空间坐标对应的熵值,计算标准差;根据所述标准差与预设阈值的关系,确定所述待测视频的初选匹配度,所述初选匹配度用于表示所述待测视频与简要指纹库对应的视频的相近程度。

第三方面,本发明实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如第一方面所述的一种视频指纹的生成方法的步骤。

第四方面,本发明实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现第二方面所述的一种视频指纹的检索方法的步骤。

第五方面,本发明实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如第一方面所述的一种视频指纹的生成方法的步骤。

第六方面,本发明实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现第二方面所述的一种视频指纹的检索方法的步骤。

本发明实施例提供的视频指纹的生成方法、检索方法、电子设备及存储介质,通过建立独立的视频指纹库,基于信息熵的计算获取准确表征视频的一维特征向量。进一步,将待测视频与建立的视频指纹库中的视频指纹进行快速比对,可以准确进行视频的检索和确认,实时召回重复视频或重复片段,防止媒资库中内容重复存储,提高媒资存储效率;减少内容分发和个性化推荐结果中相同或相似视频过多出现现象,提升用户体验。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例基于信息熵的视频指纹的生成方法的流程示意图;

图2为本发明实施例基于信息熵的视频指纹的检索方法的流程示意图;

图3为本发明实施例视频特征提取模型的处理示意图;

图4为本发明实施例视频特征提取模型的结构示意图;

图5为本发明实施例视频指纹的生成设备的示意图;

图6为本发明实施例视频指纹的检索设备的示意图;

图7为本发明实施例视频指纹的生成电子设备的结构示意图;

图8为本发明实施例视频指纹的检索电子设备的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

总的来说,本发明通过改进的无监督深度学习方法,对原始视频或者待测视频进行特征提取,生成统一格式的二维特征向量作为视频的精细指纹;然后将视频精细指纹使用信息熵的信息度量方法,生成一维特征向量的视频简要指纹,提升视频表征的精准度。

进一步,将一维特征向量值生成空间坐标索引,作为视频指纹快速匹配的依据,形成对应的简要指纹的指纹库。

检索或者匹配时,对待测的视频对应生成标准的二维特征向量和一维特征向量。将一维特征向量表征的简要指纹与视频简要指纹库中的一维特征向量依据空间坐标索引和相应匹配算法进行快速查找和匹配,求得初选集合。然后,将精细指纹与初选集合的视频进行基于精细指纹的匹配,输出最终匹配结果,从而实现查全率的提升和匹配子集的快速划分。

图1为本发明实施例提供的一种视频指纹的生成方法的流程图,如图1所示,该方法包括如下步骤:s11,基于视频特征提取模型,获取二维特征向量表征的视频精细指纹;s12,基于信息熵,将所述视频精细指纹转换为一维特征向量表征的视频简要指纹。

其中,步骤s11中,通过构建视频特征提取模型,基于其中的自动编解码网络,获取对应于二维特征向量的视频精细指纹,进而获取视频精细指纹的二维特征向量库。

其中,在一个实施例中,基于视频特征提取模型,也就是无监督自编码器的神经网络,将所有不同分辨率的视频进行降维和关键帧提取,获取基准分辨率统一的对应于所述视频的二维特征向量矩阵。其中,所述二维特征向量中,第一维表示所述视频的每幅关键帧的特征向量组,第二维表示所述关键帧的时序。注意到,视频特征提取模型,在本申请中可以是无监督自编码器的神经网络,其中,自动编解码网络是该神经网络的一部分。

其中,如图3所示,图3为本发明实施例视频特征提取模型的示意图。进一步,获取基准分辨率统一的对应于所述视频的二维特征向量矩阵,包括:将所述视频提取全部关键帧,输入图3中的自编码器;经由共用5层隐含层的自动编解码网络,获取相同的基准分辨率的图像帧的特征值;构建基于无监督自编码器神经网络,将所有不同分辨率的视频通过降维和核心特征提取,输出大小统一的视频指纹特征向量矩阵,为后续相同内容但不同分辨率的视频的对比提供基准支持。

其中,在一个具体的实施例中,将视频库的每部视频提取全部关键帧,对每幅关键帧图像做灰度转化,作为自编码器的输入。经过共用5层隐含层的自动编解码网络,输出与原图像相同维度的图像;对此模型进行训练,当误差目标小于特定值时,结束训练。

进一步,由于不同视频的分辨率有所不同,在该图3中,对模型加以改进,将不同分辨率的输入和输出层单独接入,但共用隐含层,即编解码网络,确保生成相同的特征提取规则。

其中,在一个实施例中,确认所述特征值符合阈值要求,获取对应于所述视频的二维特征向量。

其中,在另一个实施例中,即使同一内容,也有可能出现不同分辨率的相同视频同时并存的情况。如果依此模型提取出两个差异较大的特征编码,则导致视频指纹去重的查全率有所降低。为解决此问题,在上述模型预训练结束,完成预设初始权重之后,对模型继续加以改进。

图4为本发明实施例视频特征提取模型改进后的示意图,如图4所示,设定视频的基准分辨率,如480p。调整输出层特征为基准分辨率级别一致的特征。进一步,修改误差判断标准,改为与基准分辨率的原始特征输入值的比较。

即,将原始的误差函数e(xout–xin)改为e(xout’–xin‘)。

其中,xin表示事先提供的该内容视频的分辨率,如可能是1080p的原始图像特征。

xout表示经自编码网络训练后与原始xin相匹配分辨率的图像输出,即也是基于1080p的特征输出。

xin‘表示事先提供的该内容480p视频的原始图像特征,作为基准输入。

xout‘表示经自编码网络训练后输出的只有基准分辨率为480p的图像特征值,作为基准输出。

这样,确保相同内容的视频不论有多少个不同分辨率的输入,经过模型计算后总是输出相同的特征编码。对改进后的模型继续训练,输入不同分辨率但相同内容的等时间序列的关键帧,输出相同的基准分辨率图像帧的特征值并做误差判断,直到满足阈值要求。训练结束,取输入层到编码层的部分作为最终的特征提取模型,即图4中所示虚线框内部分。

其中,在一个实施例中,每个视频都转换为一个二维特征向量,其中第一维为代表每幅关键帧图像的特征向量组,第二维代表每幅关键帧图像的时序。

其中,在步骤12中,生成基于信息熵的一维特征向量,对应的生成视频简要指纹。进而,构建生成视频简要指纹库。

其中,在一个实施例中,所述将所述视频精细指纹转换为一维特征向量表征的视频简要指纹包括:将所述二维特征向量进行一维压缩;对所述视频的每帧压缩后的特征向量值获取信息熵的和,作为所述帧的信息熵;基于所述帧的信息熵,将所述视频的帧序列转换为所述一维特征向量。

也就是,将生成的每个视频的二维特征向量组进行一维压缩,采用信息熵的方法将视频转为一维特征向量组作为视频的简要指纹。

其中,信息熵是对信息的度量表示,一幅图像可以用信息熵来表示。当两幅图像的内容相等或接近时,其信息熵也是相等或接近的。

信息熵的表示公式如下:

pi为对应的向量值,h为对应的信息熵值。从而,通过信息熵实现图像内容表达的信息度量,即使对原始视频做手脚,如对视频画面旋转等,其信息熵的值是不变的,从而提升视频匹配的容错性和查全率。

另外,通过建立基于信息熵的向量值的空间索引,为后续的快速查找提供基础,且由于视频特征向量由二维转为一维,一个视频的粗选对比的时间复杂度在最理想情况下可从o(n2)降至o(logn),从而极大地减少了查找时间。

其中,根据所述视频简要指纹,建立对应的视频简要指纹库;根据所述视频简要指纹,建立所述视频简要指纹库对应于一维特征向量值的空间坐标索引。

其中,在一个具体实施例中,对视频的每幅图像的特征值求得信息熵之和,作为该图像的信息熵,将视频的图像序列转为一维特征向量,作为该视频的简要指纹。进一步,对一维向量建立格式为<一维特征向量的向量值,数组坐标序号>的空间坐标索引,为后续快速查找做准备。

图2为本发明实施例基于信息熵的视频指纹的检索方法的流程示意图,如图2所示,一种视频指纹的检索方法包括:s21,基于视频特征提取模型,获取二维特征向量表征的待测视频的精细指纹;基于信息熵,将所述待测视频的精细指纹转换为一维特征向量表征的待测视频的简要指纹;s22,基于空间坐标索引,将所述待测视频的简要指纹和视频简要指纹库进行匹配,从视频简要指纹库中获取对应于匹配结果的初选视频集合。

其中,s21中对于精细指纹和简要指纹的获取过程与上述实施例的获取过程相同,上一实施例获取精细指纹和简要指纹,作为匹配的指纹库数据;而在本实施例中,作为实际匹配的样本数据。

其中,在s21中,通过构建视频特征提取模型,基于其中的自动编解码网络,获取对应于二维特征向量的视频精细指纹。

其中,在一个实施例中,基于视频特征提取模型,也就是无监督自编码器的神经网络,将所有不同分辨率的视频进行降维和关键帧提取,获取基准分辨率统一的对应于所述视频的二维特征向量矩阵。其中,所述二维特征向量中,第一维表示所述视频的每幅关键帧的特征向量组,第二维表示所述关键帧的时序。注意到,视频特征提取模型,在本申请中可以是无监督自编码器的神经网络,其中,自动编解码网络是该神经网络的一部分。

其中,在一个具体的实施例中,将待测视频提取全部关键帧,对每幅图像做灰度转化,作为自编码器的输入;经过5层隐含层的自动编解码网络,输出与原图像相同维度的图像。

进一步,由于不同视频的分辨率有所不同,对模型加以改进,将不同分辨率的输入和输出层单独接入,但共用隐含层,即编解码网络,确保生成相同的特征提取规则。

如图4所示,设定视频的基准分辨率,如480p。调整输出层特征为基准分辨率级别的特征。进一步,修改误差判断标准,改为与基准分辨率的原始特征输入值的比较。即,将原始的误差函数e(xout–xin)改为e(xout’–xin‘)。

其中,xin表示事先提供的该内容视频的分辨率,如可能是1080p的原始图像特征。

xout表示经自编码网络训练后与原始xin相匹配分辨率的图像输出,即也是基于1080p的特征输出。

xin‘表示事先提供的该内容480p视频的原始图像特征,作为基准输入。

xout‘表示经自编码网络训练后输出的只有基准分辨率为480p的图像特征值,作为基准输出。

这样,确保相同内容的视频不论有多少不同分辨率的输入,经过模型计算后总是输出相同的特征编码。对改进后的模型继续训练,输入不同分辨率但相同内容的等时间序列的关键帧,输出相同的基准分辨率图像帧的特征值并做误差判断,直到满足阈值要求。

其中,在步骤21中,生成基于信息熵的一维特征向量,对应的生成视频简要指纹。其中,在一个实施例中,所述将所述视频精细指纹转换为一维特征向量表征的视频简要指纹包括:将所述二维特征向量进行一维压缩;对所述视频的每帧压缩后的特征向量值获取信息熵的和,作为所述帧的信息熵;基于所述帧的信息熵,将所述视频的帧序列转换为所述一维特征向量。

其中,信息熵是对信息的度量表示,一幅图像可以用信息熵来表示。当两幅图像的内容相等或接近时,其信息熵也是相等或接近的。

信息熵的公式如下:

通过信息熵实现图像内容表达的信息度量,即使对原始视频做手脚,如对视频画面旋转等,其信息熵的值是不变的,从而提升视频匹配的容错性和查全率。

另外,通过建立基于信息熵的向量值的空间索引,为后续的快速查找提供基础,且由于视频特征向量由二维转为一维,一个视频的粗选对比的时间复杂度在最理想情况下可从o(n2)降至o(logn),从而极大地减少了查找时间。

其中,在一个具体实施例中,对视频的每幅图像的特征值求得信息熵之和,作为该图像的信息熵,将视频的图像序列转为一维特征向量,作为该视频的简要指纹,同时对一维向量建立格式为<一维特征向量的向量值,数组坐标序号>的空间坐标索引。

也就是,输出待检测视频的精细指纹和简要指纹,与视频库中的每个视频的简要指纹进行匹配。

其中,在一个实施例中,所述基于空间坐标索引,将所述待测视频的简要指纹和视频简要指纹库进行匹配,从视频简要指纹库中获取对应于匹配结果的初选视频集合,包括:确定所述待测视频的一维特征向量,根据影响因子和步长,调整所述待测视频的一维特征向量的取值范围;将所述待测视频的一维特征向量的每一个值与所述空间坐标索引进行匹配,确认匹配结果在所述取值范围内;记录所述空间坐标索引中对应的初选空间坐标,根据所述初选空间坐标,确定对应的初选视频集合。

其中,在一个实施例中,所述将所述待检测视频的一维特征向量的每一个值与所述空间坐标索引进行匹配,包括:根据所述待测视频的每一帧图像的一维特征向量与所述空间坐标索引匹配的空间坐标对应的熵值,计算标准差;根据所述标准差与预设阈值的关系,确定所述待测视频的初选匹配度,所述初选匹配度用于表示所述待测视频与简要指纹库对应的视频的相近程度。

其中,在一个具体实施例中,对于每个视频,获取待测视频简要指纹向量的第一个值作为原始值,设置影响因子ε如0.03,设置步长如0.01,调整待测取值范围为[原始值±ε],作为集合a。

对于集合a中的每一个值,依次与视频事先建立的图像空间索引进行匹配,如果能找到与之相同的数值,返回与之对应的空间位置坐标,组成集合b。

选取集合b中的第一个坐标值作为候选视频简要指纹对比的起始点,将待测视频的简要指纹特征向量与候选视频向量的起始点,开始进行特征向量对比,计算标准差。如果标准差小于特定阀值,则说明二者拟合程度较高,认为待测视频与候选视频内容的相似的可能性较大,标记该候选视频,归属到后续需进行精细指纹对比的初选集合中,结束匹配。

具体地,如果标准差值大于阀值,使用b集合中的下一个坐标作为对比起始点,进行特征向量匹配;依次循环,直到发现在某个坐标起始点与待测指纹匹配结果标准差小于阈值,认为匹配成功并退出;或者b集合中的所有坐标作为起始点都已完成匹配。

其中,将待测视频精细指纹与初选精细指纹库进行匹配并输出结果。进一步,匹配所述待测视频的精细指纹和所述初选视频集合对应的精细指纹库,获取匹配结果。

进一步,将待测视频的精细指纹与初选视频子集的精细指纹,依据之前记录的对比起始点坐标,采用现有图像相似度精确对比算法或算法组合,包括但不限于欧式距离、余弦夹角、汉明距离或使用更高级的尺度不变特征转换算法(scale-invariantfeaturetransform或sift)等,进行对比,如确认视频与待测视频内容出现重复,提醒人工介入。

图5为本发明实施例视频指纹的生成设备的示意图,如图5所示,一种视频指纹的生成设备包括:精细指纹获取模块51,所述精细指纹获取模块51用于基于视频特征提取模型,获取二维特征向量表征的视频精细指纹;简要指纹获取模块52,所述简要指纹获取模块用于基于信息熵,将所述视频精细指纹转换为一维特征向量表征的视频简要指纹。

进一步,所述视频指纹的生成设备还包括空间索引建立模块,所述空间索引建立模块用于:根据所述视频精细指纹和视频简要指纹,建立对应的视频精细指纹库和视频简要指纹库;所述空间索引建立模块还用于根据所述视频简要指纹,建立所述视频简要指纹库对应于一维特征向量值的空间坐标索引。

进一步,所述精细指纹获取模块还用于:

基于视频特征提取模型,将所有不同分辨率的视频进行降维和关键帧提取,获取基准分辨率统一的对应于所述视频的二维特征向量矩阵;

其中,所述二维特征向量中,第一维表示所述视频的每幅关键帧的特征向量组,第二维表示所述关键帧的时序。

进一步,所述简要指纹获取模块还用于:

将所述二维特征向量进行一维压缩;

对所述视频的每帧压缩后的特征向量值获取信息熵的和,作为所述帧的信息熵;

基于所述帧的信息熵,将所述视频的帧序列转换为所述一维特征向量。

图6为本发明实施例视频指纹的检索设备的示意图,如图6所示,所述视频指纹的检索设备包括:视频指纹获取模块61和视频指纹匹配模块62;所述视频指纹获取模块61用于基于视频特征提取模型,获取二维特征向量表征的待测视频的精细指纹;所述视频指纹获取模块61还用于基于信息熵,将所述待测视频的精细指纹转换为一维特征向量表征的待测视频的简要指纹;所述视频指纹匹配模块62用于基于空间坐标索引,将所述待测视频的简要指纹和视频简要指纹库进行匹配,从视频简要指纹库中获取对应于匹配结果的初选视频集合。

进一步,所述视频指纹匹配模块62还用于:匹配所述待测视频的精细指纹和所述初选视频集合对应的精细指纹库,获取匹配结果。

进一步,所述视频指纹获取模块61还用于:确定所述待测视频的一维特征向量,根据影响因子和步长,调整所述待测视频的一维特征向量的取值范围;

将所述待测视频的一维特征向量的每一个值与所述空间坐标索引进行匹配,确认匹配结果在所述取值范围内;

记录所述空间坐标索引中对应的初选空间坐标,根据所述初选空间坐标,确定对应的初选视频集合。

图7示例了一种电子设备的实体结构示意图,如图7所示,该电子设备可以包括:处理器(processor)710、通信接口(communicationsinterface)720、存储器(memory)830和通信总线740。其中,处理器710,通信接口720,存储器730通过通信总线740完成相互间的通信。处理器710可以调用存储器730中的逻辑指令,以执行如下方法:基于视频特征提取模型,获取二维特征向量表征的视频精细指纹;基于信息熵,将所述视频精细指纹转换为一维特征向量表征的视频简要指纹。

需要说明的是,本实施例中的电子设备在具体实现时可以为服务器,也可以为pc机,还可以为其他设备,只要其结构中包括如图7所示的处理器710、通信接口720、存储器730和通信总线740,其中处理器710、通信接口720、存储器730通过通信总线740完成相互间的通信,且处理器710可以调用存储器730中的逻辑指令以执行上述方法即可。本实施例不对电子设备的具体实现形式进行限定。

此外,上述的存储器730中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

图8示例了一种电子设备的实体结构示意图,如图8所示,该电子设备可以包括:处理器(processor)810、通信接口(communicationsinterface)820、存储器(memory)830和通信总线840,其中,处理器810、通信接口820、存储器830通过通信总线840完成相互间的通信。处理器810可以调用存储器830中的逻辑指令,以执行如下方法:基于视频特征提取模型,获取二维特征向量表征的待测视频的精细指纹;基于信息熵,将所述待测视频的精细指纹转换为一维特征向量表征的待测视频的简要指纹;基于空间坐标索引,将所述待测视频的简要指纹和视频简要指纹库进行匹配,从视频简要指纹库中获取对应于匹配结果的初选视频集合。

需要说明的是,本实施例中的电子设备在具体实现时可以为服务器,也可以为pc机,还可以为其他设备,只要其结构中包括如图8所示的处理器810、通信接口820、存储器830和通信总线840,其中处理器810、通信接口820、存储器830通过通信总线840完成相互间的通信,且处理器810可以调用存储器830中的逻辑指令以执行上述方法即可。本实施例不对电子设备的具体实现形式进行限定。

此外,上述的存储器830中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

进一步地,本发明实施例公开一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的一种视频指纹的生成方法,例如包括:基于视频特征提取模型,获取二维特征向量表征的视频精细指纹;基于信息熵,将所述视频精细指纹转换为一维特征向量表征的视频简要指纹。

另一方面,本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的视频指纹的检索方法,例如包括:基于视频特征提取模型,获取二维特征向量表征的待测视频的精细指纹;基于信息熵,将所述待测视频的精细指纹转换为一维特征向量表征的待测视频的简要指纹;基于空间坐标索引,将所述待测视频的简要指纹和视频简要指纹库进行匹配,从视频简要指纹库中获取对应于匹配结果的初选视频集合。

以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1