一种检测视频中目标视频片段的方法、装置及电子设备与流程

文档序号:15848686发布日期:2018-11-07 09:29阅读:144来源:国知局
一种检测视频中目标视频片段的方法、装置及电子设备与流程

本发明涉及检测技术领域,特别是涉及一种检测视频中目标视频片段的方法、装置及电子设备。

背景技术

随着文件产业的发展,影视剧的数量呈海量增长之势,用户可以通过手机、电视、电脑等设备观看影视剧,这里所说的影视剧为具有多集、且所有各集都有片头和/或片尾的影视剧。用户在观看影视剧中某一集时,有时需要跳过片头和/或片尾,为了满足用户的这一需求的前提是:需要检测出影视剧中的每一集的片头和/或片段。片头检测的原理与片尾检测的原理相同,且不管是片头,还是片尾都是剧集中的视频片段,对片头或片尾检测,就是对目标视频片段的检测,其中,目标视频片段为片头或片尾。

目前,目标视频片段的检测大多是采用人工的方法进行检测的,即通过人工观看影视剧检测出影视剧中每一集的目标视频片段,具体的,通过观看确定每一集的目标视频片段对应的视频帧范围。示例性的,通过观看确定某一集中帧号为1-300的视频帧为目标视频片段的内容,则将帧号1-300的视频帧作为该集的目标视频片段。

然而,发明人在实现本发明的过程中发现,现有技术至少存在如下问题:通过人工观看影视剧检测目标视频片段的方式,需要消耗大量的人工成本,使用现有自动检测技术,对视频内容的一致性要求较高,对于不同集数中视频内容存在的剪裁/形变等情况或视频内容部分删剪的情况难以进行处理。



技术实现要素:

本发明实施例的目的在于提供一种检测视频中目标视频片段的方法、装置及电子设备,利用对目标视频片段中各关键帧进行图像特征提取,并将提取到图像特征与数据库中模板中的图像特征进行匹配的方法,实现视频中目标视频片段的自动检测,可以实现减少人工成本的消耗,同时由于本发明实施例中提供的方法、装置及电子设备,是对待检测镜头中的各关键帧的图像特征进行图像特征的提取和图像特征匹配,且对匹配结果进行了后处理,用于纠正匹配结果,获得帧级精度的目标视频片段的检测结果,因而,相较于现有的自动检测技术,对视频内容的一致性要求较低,对于不同集数的视频内容中可能存在的删减/剪裁/形变情况具有较好的鲁棒性。具体技术方案如下:

为了达到上述目的,第一方面,本发明实施例提供了检测视频中目标视频片段的方法,包括:

获取待检测视频;

从所述待检测视频中提取各个镜头的关键帧;

获取每个镜头的每个关键帧的图像特征;

确定所述待检测视频所属的剧集;

从预设数据库中获取所确定的剧集的匹配模板,所述匹配模板中包含预先存储的所述剧集中指定一集视频的片头和/或片尾的关键帧的模板图像特征;所述待检测视频为所述剧集中除所述指定一集外的其他集视频;

将每个镜头的每个关键帧的图像特征与所述匹配模板中的各个关键帧的模板图像特征进行匹配;

将匹配成功的关键帧数超过预设匹配帧阈值的镜头,确定为所述待检测视频中目标视频片段的镜头;所述目标视频片段为:视频的片头和/或片尾。

可选的,所述从所述待检测视频中提取各个镜头的关键帧的步骤,包括:

根据各个镜头中属于所述目标视频片段内容的视频帧范围和预设的关键帧数量的比值确定各个镜头的候选采样间隔;

针对每一镜头,判断该镜头的候选采样间隔是否大于预设的采样间隔的第一采样间隔阈值;

若该镜头的候选采样间隔大于预设的采样间隔的第一采样间隔阈值,则将第一预设值作为所述镜头的目标采样间隔;

或者,若该镜头的候选采样间隔不大于预设的采样间隔的第一采样间隔阈值,则判断所述镜头的候选采样间隔是否大于预设的采样间隔的第三采样间隔阈值;

若所述镜头的候选采样间隔大于预设的采样间隔的第三采样间隔阈值,则将第三采样间隔阈值作为所述镜头的目标采样间隔;

或者,若所述镜头的候选采样间隔不大于预设的采样间隔的第三采样间隔阈值,则将所述镜头的候选采样间隔,作为所述镜头的目标采样间隔;

根据获取的各个镜头的目标采样间隔,在各个镜头的所述视频帧范围内进行采样,获取各个镜头的关键帧。

可选的,所述获取每个镜头的每个关键帧的图像特征,包括:

对所述关键帧的图像进行缩放,将所述图像的中央区域划分为均等的三个子区域,分别计算图像整体及划分的所述三个子区域的感知哈希特征,获得4个感知哈希特征;

将获得的4个感知哈希特征,接续连接为1个向量,将所述向量作为所述关键帧的图像特征。

可选的,所述确定所述待检测视频所属的剧集的步骤,包括:

从所述待检测视频的属性信息中获取所述待检测视频所属的剧集标识;

所述从预设数据库中获取所确定的剧集的匹配模板的步骤,包括:

从所述预设数据库中获取与所述剧集标识相同的剧集的匹配模板。

可选的,所述预先存储所述剧集中指定一集视频的片头和/或片尾的关键帧的模板图像特征,包括:

对剧集中指定一集视频,获取被标识为所述指定一集的片头的第一起始帧和第一结束帧,和/或被标识为所述指定一集的片尾的第二起始帧和第二结束帧;

根据被标识为所述指定一集的片头的第一起始帧和第一结束帧,确定所述指定一集中包含片头内容的片头视频帧范围;和/或根据被标识为所述指定一集的片尾的第二起始帧和第二结束帧,确定所述指定一集中包含片尾内容的片尾视频帧范围;

从所述片头视频帧范围中提取片头关键帧;

获取每个片头关键帧的图像特征,作为片头关键帧的模板图像特征;

和/或,从所述片尾视频帧范围中提取片尾关键帧;

获取每个片尾关键帧的图像特征,作为片尾关键帧的模板图像特征;

将所述剧集标识与片头的各个关键帧的模板图像特征和/或片尾的各个关键帧的模板图像特征对应存储至所述数据库中。

可选的,所述获取被标识为该集的片头的第一起始帧和第一结束帧,和/或被标识为该集的片尾的第二起始帧和第二结束帧的步骤,包括:

根据该集的视频帧率,将被标识为该集的片头的起始时间点和结束时间点转换为该集的片头的第一起始帧和第一结束帧,和/或被标识为该集的片尾的起始时间点和结束时间点转换为该集片尾的第二起始帧和第二结束帧。

可选的,所述根据被标识为所述指定一集的片头的第一起始帧和第一结束帧,确定所述指定一集中包含片头内容的片头视频帧范围的步骤,包括:

根据各个镜头起始帧号和结束帧号与所述指定一集的片头的第一起始帧和第一结束帧,在时间轴上的相对关系,确定各个镜头中属于片头内容的视频帧范围;

若待处理镜头的帧号范围完全落入所述片头的帧号范围,将所述待处理镜头的帧号范围作为所述片头内容的视频帧范围;

若所述片头的帧号范围完全落入所述待处理镜头的帧号范围,将所述目标视频片段帧号范围作为所述片头内容的视频帧范围;

若所述待处理镜头的帧号范围与所述片头的帧号范围只有部分重叠,则判断该所重叠的帧号的数量是否大于等于第三预设阈值,如果大于等于,将所重叠的帧号对应的视频帧范围作为所述片头内容的视频帧范围;

和/或,所述根据被标识为所述指定一集的片尾的第二起始帧和第二结束帧,确定所述指定一集中包含片尾内容的片尾视频帧范围的步骤,包括:

根据各个镜头起始帧号和结束帧号与所述指定一集的片尾的第二起始帧和第二结束帧,在时间轴上的相对关系,确定各个镜头中属于片尾内容的视频帧范围;

若待处理镜头的帧号范围完全落入所述片尾的帧号范围,将所述待处理镜头的帧号范围作为所述片尾内容的视频帧范围;

若所述片尾的帧号范围完全落入所述待处理镜头的帧号范围,将所述目标视频片段帧号范围作为所述片尾内容的视频帧范围;

若所述待处理镜头的帧号范围与所述片尾的帧号范围只有部分重叠,则判断所重叠的帧号的数量是否大于等于第三预设阈值,如果大于等于,将所重叠的帧号对应的视频帧范围作为所述片尾内容的视频帧范围。

可选的,所述从所述片头视频帧范围中提取片头关键帧的步骤,包括:

根据各个镜头中属于所述片头视频内容的视频帧范围和预设的关键帧数量的比值确定各个镜头的候选采样间隔;

针对每一镜头,判断该镜头的候选采样间隔是否大于预设的采样间隔的第一采样间隔阈值;

若该镜头的候选采样间隔大于预设的采样间隔的第一采样间隔阈值,则将第一预设值作为所述镜头的目标采样间隔;

或者,若该镜头的候选采样间隔不大于预设的采样间隔的第一采样间隔阈值,则判断所述镜头的候选采样间隔是否大于预设的采样间隔的第二采样间隔阈值;

若所述镜头的候选采样间隔大于预设的采样间隔的第二采样间隔阈值,则将第二采样间隔阈值作为所述镜头的目标采样间隔;

或者,若所述镜头的候选采样间隔不大于预设的采样间隔的第二采样间隔阈值,则将所述镜头的候选采样间隔,作为所述镜头的目标采样间隔;

根据获取的各个镜头的目标采样间隔,在各个镜头的所述片头内容的视频帧范围内进行采样,获取片头关键帧;

所述从所述片尾视频帧范围中提取片尾关键帧的步骤,包括:

根据各个镜头中属于所述片尾视频内容的视频帧范围和预设的关键帧数量的比值确定各个镜头的候选采样间隔;

针对每一镜头,判断该镜头的候选采样间隔是否大于预设的采样间隔的第一采样间隔阈值;

若该镜头的候选采样间隔大于预设的采样间隔的第一采样间隔阈值,则将第一预设值作为所述镜头的目标采样间隔;

或者,若该镜头的候选采样间隔不大于预设的采样间隔的第一采样间隔阈值,则判断所述镜头的候选采样间隔是否大于预设的采样间隔的第二采样间隔阈值;

若所述镜头的候选采样间隔大于预设的采样间隔的第二采样间隔阈值,则将第二采样间隔阈值作为所述镜头的目标采样间隔;

或者,若所述镜头的候选采样间隔不大于预设的采样间隔的第二采样间隔阈值,则将所述镜头的候选采样间隔,作为所述镜头的目标采样间隔;

根据获取的各个镜头的目标采样间隔,在各个镜头的所述片尾内容的视频帧范围内进行采样,获取片头关键帧。

可选的,所述获取每个片头关键帧的图像特征,作为片头关键帧的模板图像特征的步骤,包括:

对所述片头关键帧的图像进行缩放,将所述图像的中央区域划分为均等的三个子区域,分别计算图像整体及划分的所述三个子区域的感知哈希特征,获取4个感知哈希特征;

将获取的4个感知哈希特征,接续连接为1个向量,将所述向量作为所述片头关键帧的图像特征;

和/或,获取每个片尾关键帧的图像特征,作为片尾关键帧的模板图像特征的步骤,包括:

对所述片尾关键帧的图像进行缩放,将所述图像的中央区域划分为均等的三个子区域,分别计算图像整体及划分的所述三个子区域的感知哈希特征,获取4个感知哈希特征;

将获取的4个感知哈希特征,接续连接为1个向量,将所述向量作为所述片尾关键帧的图像特征。

可选的,所述获取每个镜头的每个关键帧的图像特征的步骤,包括:

对获取的待处理镜头的待处理关键帧的图像进行缩放,将所述图像的中央区域划分为均等的三个子区域,分别计算图像整体及划分的所述三个子区域的感知哈希特征,获取4个感知哈希特征;

将获取的4个感知哈希特征,接续连接为1个向量,将所述向量作为所述关键帧的图像特征;

所述将每个镜头的每个关键帧的图像特征与所述匹配模板中的各个关键帧的模板图像特征进行匹配的步骤,包括:

根据所述剧集标识和待处理镜头是属于片头内容或片尾内容设置检索范围,根据所述检索范围,在所述预设数据库中查找是否有与待检测的图像特征相似的图像特征。

可选的,所述方法还包括:对各个镜头匹配后获取匹配结果进行滤波处理,获取目标视频片段的帧级精度的时间点位信息。

可选的,所述对各个镜头匹配后获取的匹配结果进行滤波处理,获取目标视频片段的帧级精度的时间点位信息的步骤,包括:

采用窗口长度为第三预设值,对各个镜头的判断结果进行滤波处理,得到各个镜头的滤波结果;

根据各个镜头的滤波结果,确定所述待检测视频的目标视频片段的镜头,其中,所述滤波结果为所述镜头是所述目标片段的镜头或所述镜头不是所述目标视频片段的镜头。

第二方面,本发明实施例提供了一种检测视频中目标视频片段的装置,包括:

视频获取模块,用于获取待检测视频;

关键帧获取模块,用于从所述待检测视频中提取各个镜头的关键帧;

图像特征获取模块,用于获取每个镜头的每个关键帧的图像特征;

剧集判断模块,用于确定所述待检测视频所属的剧集;

匹配模板获取模块,用于从预设数据库中获取所确定的剧集的匹配模板;

图像特征匹配模块,用于将每个镜头的每个关键帧的图像特征与所述匹配模板中的各个关键帧的模板图像特征进行匹配;

判断模块,用于判断镜头中匹配成功的关键帧数是否超过预设匹配帧阈值。

可选的,所述关键帧获取模块,具体用于:根据各个镜头中属于所述目标视频片段内容的视频帧范围和预设的关键帧数量的比值确定各个镜头的候选采样间隔;

针对每一镜头,判断该镜头的候选采样间隔是否大于预设的采样间隔的第一采样间隔阈值;

若该镜头的候选采样间隔大于预设的采样间隔的第一采样间隔阈值,则将第一预设值作为所述镜头的目标采样间隔;

或者,若该镜头的候选采样间隔不大于预设的采样间隔的第一采样间隔阈值,则判断所述镜头的候选采样间隔是否大于预设的采样间隔的第三采样间隔阈值;

若所述镜头的候选采样间隔大于预设的采样间隔的第三采样间隔阈值,则将第三采样间隔阈值作为所述镜头的目标采样间隔;

或者,若所述镜头的候选采样间隔不大于预设的采样间隔的第三采样间隔阈值,则将所述镜头的候选采样间隔,作为所述镜头的目标采样间隔;

根据获取的各个镜头的目标采样间隔,在各个镜头的所述视频帧范围内进行采样,获取各个镜头的关键帧

可选的,所述图像特征获取模块,具体用于:对所述关键帧的图像进行缩放,将所述图像的中央区域划分为均等的三个子区域,分别计算图像整体及划分的所述三个子区域的感知哈希特征,获得4个感知哈希特征;

将获得的4个感知哈希特征,接续连接为1个向量,将所述向量作为所述关键帧的图像特征。

可选的,所述剧集判断模块,具体用于:

从所述待检测视频的属性信息中获取所述待检测视频所属的剧集标识;

所述匹配模板获取模块,具体用于:

从所述预设数据库中获取与所述剧集标识相同的剧集的匹配模板。

可选的,所述装置还包括:模板图像特征预存模块;

所述模板图像特征预存模块,包括:

标识帧获取子模块,用于对剧集中指定一集视频,获取被标识为所述指定一集的片头的第一起始帧和第一结束帧,和/或被标识为所述指定一集的片尾的第二起始帧和第二结束帧;

片头/片尾视频帧范围确定子模块,用于根据被标识为所述指定一集的片头的第一起始帧和第一结束帧,确定所述指定一集中包含片头内容的片头视频帧范围;和/或根据被标识为所述指定一集的片尾的第二起始帧和第二结束帧,确定所述指定一集中包含片尾内容的片尾视频帧范围;

模板图像特征获取子模块,用于从所述片头视频帧范围中提取片头关键帧;获取每个片头关键帧的图像特征,作为片头关键帧的模板图像特征;

和/或,从所述片尾视频帧范围中提取片尾关键帧;

获取每个片尾关键帧的图像特征,作为片尾关键帧的模板图像特征;

存储子模块,用于将所述剧集标识与片头的各个关键帧的模板图像特征和/或片尾的各个关键帧的模板图像特征对应存储至所述数据库中。

可选的,所述标识帧获取子模块,具体用于:根据该集的视频帧率,将被标识为该集的片头的起始时间点和结束时间点转换为该集的片头的第一起始帧和第一结束帧,和/或被标识为该集的片尾的起始时间点和结束时间点转换为该集片尾的第二起始帧和第二结束帧。

可选的,所述片头/片尾视频帧范围确定子模块,具体用于:

根据各个镜头起始帧号和结束帧号与所述指定一集的片头的第一起始帧和第一结束帧,在时间轴上的相对关系,确定各个镜头中属于片头内容的视频帧范围;

若待处理镜头的帧号范围完全落入所述片头的帧号范围,将所述待处理镜头的帧号范围作为所述片头内容的视频帧范围;

若所述片头的帧号范围完全落入所述待处理镜头的帧号范围,将所述目标视频片段帧号范围作为所述片头内容的视频帧范围;

若所述待处理镜头的帧号范围与所述片头的帧号范围只有部分重叠,则判断该所重叠的帧号的数量是否大于等于第三预设阈值,如果大于等于,将所重叠的帧号对应的视频帧范围作为所述片头内容的视频帧范围;

和/或,所述根据被标识为所述指定一集的片尾的第二起始帧和第二结束帧,确定所述指定一集中包含片尾内容的片尾视频帧范围的步骤,包括:

根据各个镜头起始帧号和结束帧号与所述指定一集的片尾的第二起始帧和第二结束帧,在时间轴上的相对关系,确定各个镜头中属于片尾内容的视频帧范围;

若待处理镜头的帧号范围完全落入所述片尾的帧号范围,将所述待处理镜头的帧号范围作为所述片尾内容的视频帧范围;

若所述片尾的帧号范围完全落入所述待处理镜头的帧号范围,将所述目标视频片段帧号范围作为所述片尾内容的视频帧范围;

若所述待处理镜头的帧号范围与所述片尾的帧号范围只有部分重叠,则判断所重叠的帧号的数量是否大于等于第三预设阈值,如果大于等于,将所重叠的帧号对应的视频帧范围作为所述片尾内容的视频帧范围。

可选的,所述模板图像特征获取子模块,从所述片头视频帧范围中提取片头关键帧,包括:

根据各个镜头中属于所述片头视频内容的视频帧范围和预设的关键帧数量的比值确定各个镜头的候选采样间隔;

针对每一镜头,判断该镜头的候选采样间隔是否大于预设的采样间隔的第一采样间隔阈值;

若该镜头的候选采样间隔大于预设的采样间隔的第一采样间隔阈值,则将第一预设值作为所述镜头的目标采样间隔;

或者,若该镜头的候选采样间隔不大于预设的采样间隔的第一采样间隔阈值,则判断所述镜头的候选采样间隔是否大于预设的采样间隔的第二采样间隔阈值;

若所述镜头的候选采样间隔大于预设的采样间隔的第二采样间隔阈值,则将第二采样间隔阈值作为所述镜头的目标采样间隔;

或者,若所述镜头的候选采样间隔不大于预设的采样间隔的第二采样间隔阈值,则将所述镜头的候选采样间隔,作为所述镜头的目标采样间隔;

根据获取的各个镜头的目标采样间隔,在各个镜头的所述片头内容的视频帧范围内进行采样,获取片头关键帧;

所述模板图像特征获取子模块,从所述片头视频帧范围中提取片尾关键帧,包括:

根据各个镜头中属于所述片尾视频内容的视频帧范围和预设的关键帧数量的比值确定各个镜头的候选采样间隔;

针对每一镜头,判断该镜头的候选采样间隔是否大于预设的采样间隔的第一采样间隔阈值;

若该镜头的候选采样间隔大于预设的采样间隔的第一采样间隔阈值,则将第一预设值作为所述镜头的目标采样间隔;

或者,若该镜头的候选采样间隔不大于预设的采样间隔的第一采样间隔阈值,则判断所述镜头的候选采样间隔是否大于预设的采样间隔的第二采样间隔阈值;

若所述镜头的候选采样间隔大于预设的采样间隔的第二采样间隔阈值,则将第二采样间隔阈值作为所述镜头的目标采样间隔;

或者,若所述镜头的候选采样间隔不大于预设的采样间隔的第二采样间隔阈值,则将所述镜头的候选采样间隔,作为所述镜头的目标采样间隔;

根据获取的各个镜头的目标采样间隔,在各个镜头的所述片尾内容的视频帧范围内进行采样,获取片尾关键帧。

可选的,所述模板图像特征获取子模块,获取每个片头关键帧的图像特征,作为片头关键帧的模板图像特征,包括:

对所述片头关键帧的图像进行缩放,将所述图像的中央区域划分为均等的三个子区域,分别计算图像整体及划分的所述三个子区域的感知哈希特征,获取4个感知哈希特征;

将获取的4个感知哈希特征,接续连接为1个向量,将所述向量作为所述片头关键帧的图像特征;

所述模板图像特征获取子模块,获取每个片尾关键帧的图像特征,作为片尾关键帧的模板图像特征的步骤,包括:

对所述片尾关键帧的图像进行缩放,将所述图像的中央区域划分为均等的三个子区域,分别计算图像整体及划分的所述三个子区域的感知哈希特征,获取4个感知哈希特征;

将获取的4个感知哈希特征,接续连接为1个向量,将所述向量作为所述片尾关键帧的图像特征。

可选的,图像特征获取模块,具体用于:

对获取的待处理镜头的待处理关键帧的图像进行缩放,将所述图像的中央区域划分为均等的三个子区域,分别计算图像整体及划分的所述三个子区域的感知哈希特征,获取4个感知哈希特征;

将获取的4个感知哈希特征,接续连接为1个向量,将所述向量作为所述关键帧的图像特征;

所述将每个镜头的每个关键帧的图像特征与所述匹配模板中的各个关键帧的模板图像特征进行匹配的步骤,包括:

根据所述剧集标识和待处理镜头是属于片头内容或片尾内容设置检索范围,根据所述检索范围,在所述预设数据库中查找是否有与待检测的图像特征相似的图像特征。

可选的,所述装置,还包括:

后处理模块:用于对各个镜头匹配后获取的匹配结果进行处理。

可选的,所述后处理模块,包括:

滤波处理子模块,用于对各个镜头匹配后获取的匹配结果进行滤波处理;

时间点获取子模块,用于获取目标视频片段的帧级精度的时间点位信息。

第三方面,本发明实施例提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;存储器,用于存放计算机程序;

处理器,用于执行存储器上所存放的程序时,实现以下方法步骤:

获取待检测视频;

从所述待检测视频中提取各个镜头的关键帧;

获取每个镜头的每个关键帧的图像特征;

确定所述待检测视频所属的剧集;

从预设数据库中获取所确定的剧集的匹配模板,所述匹配模板中包含预先存储的所述剧集中指定一集视频的片头和/或片尾的关键帧的模板图像特征;所述待检测视频为所述剧集中除所述指定一集外的其他集视频;

将每个镜头的每个关键帧的图像特征与所述匹配模板中的各个关键帧的模板图像特征进行匹配;

将匹配成功的关键帧数超过预设匹配帧阈值的镜头,确定为所述待检测视频中目标视频片段的镜头;所述目标视频片段为:视频的片头和/或片尾。

在本发明实施的又一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述任一所述的目标视频片段检测方法。

在本发明实施的又一方面,本发明实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一所述的目标视频片段检测方法。

本发明实施例提供的一种目标视频片段检测方法、装置及电子设备,可以通过获取待检测视频,确定所述待检测视频所属的剧集,从预设数据库中获取所确定的剧集的匹配模板,其中,所述匹配模板中包含预先存储的所述剧集中指定一集视频的片头和/或片尾的关键帧的模板图像特征,再从所述待检测视频中提取各个镜头的关键帧,获取每个镜头的每个关键帧的图像特征,将获取到的每个镜头的每个关键帧的图像特征与所述匹配模板中的各个关键帧的模板图像特征进行匹配,将匹配成功的关键帧数超过预设匹配帧阈值的镜头,确定为所述待检测视频中目标视频片段的镜头,相较于现有技术,可以自动地检测目标视频片段,减少人工成本的消耗,同时由于本发明实施例中提供的方法、装置及电子设备,是对待检测镜头中的各关键帧的图像特征进行图像特征的提取和图像特征匹配,且对匹配结果进行了后处理,用于纠正匹配结果,获得帧级精度的目标视频片段的检测结果,因而,相较于现有的自动检测技术,对视频内容的一致性要求较低,对于不同集数的视频内容中可能存在的删减/剪裁/形变情况具有较好的鲁棒性。。当然,实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。

图1为本发明实施例提供的一种检测视频中目标视频片段的方法的流程示意图;

图2为本发明实施例提供的一种检测视频中目标视频片段的方法的原理示意图;

图3为本发明实施例提供的一种检测视频中目标视频片段的方法的采样视频帧图像结构示意图;

图4为本发明实施例提供的一种检测视频中目标视频片段的装置示意图;

图5为本发明实施例提供的一种检测视频中目标视频片段的装置中模板图像特征预存模块示意图;

图6为本发明实施例提供的一种检测视频片段的装置中后处理模块示意图;

图7为本发明实施例提供的一种电子设备示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行描述。

为解决现有技术通过人工观看影视剧来检测目标视频片段的方式,需要消耗大量的人工成本的问题,本发明实施例提供了一种检测视频中目标视频片段的方法,图1为本发明实施例提供的一种检测视频中目标视频片段的方法的流程示意图,如图1所示,该方法包括:

s101:获取待检测视频;

本发明实施例主要针对视频剧集进行检测,本步骤中就是获取一个待检测视频,例如:一个电视剧中未确定片头或片尾的某一集。

s102:从所述待检测视频中提取各个镜头的关键帧;

具体的,可以通过如下的步骤来从所述待检测视频中提取各个镜头的关键帧:

根据各个镜头中属于所述目标视频片段内容的视频帧范围和预设的关键帧数量的比值确定各个镜头的候选采样间隔;

针对每一镜头,判断该镜头的候选采样间隔是否大于预设的采样间隔的第一采样间隔阈值;

若该镜头的候选采样间隔大于预设的采样间隔的第一采样间隔阈值,则将第一预设值作为所述镜头的目标采样间隔;

或者,若该镜头的候选采样间隔不大于预设的采样间隔的第一采样间隔阈值,则判断所述镜头的候选采样间隔是否大于预设的采样间隔的第三采样间隔阈值;

若所述镜头的候选采样间隔大于预设的采样间隔的第三采样间隔阈值,则将第三采样间隔阈值作为所述镜头的目标采样间隔;

或者,若所述镜头的候选采样间隔不大于预设的采样间隔的第三采样间隔阈值,则将所述镜头的候选采样间隔,作为所述镜头的目标采样间隔;

根据获取的各个镜头的目标采样间隔,在各个镜头的所述视频帧范围内进行采样,获取各个镜头的关键帧。

举例来说,从待检测视频中提取各个镜头的关键帧,具体的,可以包括如下步骤:

先确定所述待检测视频中的各个镜头,具体可以采用基于视频帧的镜头检测方法获得待检测视频中的各个镜头。

再针对每个镜头来提取关键帧。

提取关键帧可以用采样的方法进行提取。

具体的,先确定目标采样间隔:

示例性的,确定目标采样间隔的方法为:首先,根据一个待处理镜头中的视频帧范围r和预设的关键帧数量k1的比值,确定该待处理镜头的候选采样间隔intervalk,即其中k1的典型取值为10。

其次,将获取的候选采样间隔与预设的采样间隔的第一采样间隔阈值il进行比较;

若该待处理镜头的候选采样间隔intervalk大于预设的采样间隔的第一采样间隔阈值il,即intervalk>il,则当前镜头属于超长镜头,需要进行密集采样,则将第一预设值id作为该待处理镜头的目标采样间隔,即令intervalk=id,其中il的典型取值为50,id的典型取值为2;

若某一待处理镜头的候选采样间隔intervalk小于或等于预设的采样间隔的第一采样间隔阈值il,则判断该待处理镜头的候选采样间隔是否大于预设的采样间隔的第三采样间隔阈值in;

当intervalk≤il且intervalk>in,则当前镜头采样间隔过大,将第三采样间隔阈值in作为该待处理镜头的目标采样间隔,即令intervalk=in,其中in的典型取值为12;

当intervalk≤il且intervalk≤in,则将该待处理镜头的候选采样间隔intervalk,作为该待处理镜头的目标采样间隔。

根据获取的各个镜头的目标采样间隔,在各个镜头对应的视频帧范围r内进行采样,获取各个镜头的关键帧,其中,获取的关键帧的数量为其中length(r)表示视频帧范围r的长度。

其中,视频帧范围r的获取方式为:

以镜头为单位,每次仅对当前检测到的新镜头进行时间点位分析,将当前新镜头的起始帧和结束帧,分别记为shotsta和shotend,并将已处理的上一镜头的结束帧记为lastend,将镜头帧级信息[shotsta,shotend]记为r;

可选的,在一种具体实施方式中,可以将第三采样间隔阈值in的典型取值和在选取目标视频片段的特征匹配模板时的第二采样间隔阈值im的典型取值

s103:获取每个镜头的每个关键帧的图像特征;

所述获取每个镜头的每个关键帧的图像特征,具体包括:

对所述关键帧的图像进行缩放,将所述图像的中央区域划分为均等的三个子区域,分别计算图像整体及划分的所述三个子区域的感知哈希特征,获得4个感知哈希特征;

将获得的4个感知哈希特征,接续连接为1个向量,将所述向量作为所述关键帧的图像特征。

示例性的,获取各关键帧的图像特征的方法为:将获取的某一关键帧的图像,缩放至指定尺寸wxh,便于特征计算和后期特征比较,其中,w的典型取值为640,h的典型取值为480。

如图3所示,将缩放至指定尺寸的图像整体i的中央区域划分为均等的三个子区域a、b和c;分别计算图像整体i,以及图像整体i中央三个子区域a、b和c的感知哈希特征,获取i、a、b和c的感知哈希特征,将获取的4个感知哈希特征,接续连接为一个特征向量,然后将该特征向量作为该关键帧的图像特征,按照上述方法获取各关键帧的图像特征。

其中,感知哈希算法的作用是对每张图片生成一个”指纹”字符串即唯一的字符串,然后比较不同图片的指纹,结果越接近,就说明图片越相似。

示例性的,对于图像整体i,感知哈希算法的计算方法为:

第一步,缩小尺寸;将图片缩小至640x480的尺寸,该尺寸总共有640x480个像素,这一步的作用是去除图片的细节,只保留结构、明暗等基本信息,摒弃不同尺寸和比例带来的图片差异;

第二步,简化色彩;将缩小后的图像整体i,转为640x480级灰度;

第三步,计算平均值;计算所有640x480个像素的灰度平均值;

第四步,比较像素的灰度;将每个像素的灰度,与所有640x480个像素的灰度平均值进行比较,大于或等于平均值,记为1;小于平均值,记为0;

第五步,计算图像整体i感知哈希值;将第四步的比较结果,组合在一起,就构成了一个640x480位的整数,该数值即为图像整体i感知哈希值;

按照同样的方法计算图像整体i以及中央三个子区域a、b和c的感知哈希值,将获取到的i、a、b和c的感知哈希值,接续连接为一个特征向量,将该特征向量作为图像整体i的图像特征。

s104:确定所述待检测视频所属的剧集;

具体的,确定所述待检测视频所属的剧集的方法为:

从所述待检测视频的属性信息中获取所述待检测视频所属的剧集标识;

示例性的,如果要确定待检测视频属于哪一个剧集,则从所述待检测视频的属性信息中获取该待检测视频具体属于哪个剧集。

s105:从预设数据库中获取所确定的剧集的匹配模板。

具体的,从预设数据库中获取所确定的剧集的匹配模板的方法为:

首先,从所述待检测视频的属性信息中获取所述待检测视频所属的剧集标识;

其次,从所述预设数据库中获取与所述剧集标识相同的剧集的匹配模板。

示例性的,如果从待检测视频的属性信息中获取到所述待检测视频所属的剧集标识为《琅琊榜》,则从预设数据库中获取《琅琊榜》的匹配模板,而非其他剧集的匹配模板。

s106:将每个镜头的每个关键帧的图像特征与所述匹配模板中的各个关键帧的模板图像特征进行匹配;

具体的,将每个镜头的每个关键帧的图像特征与所述匹配模板中的各个关键帧的模板图像特征进行匹配的方法为:

针对某一镜头关键帧的图像特征,在数据库中查询是否有与该图像特征相似的特征向量,若数据库中有与该图像特征相似的特征向量,则匹配成功,那么认为该帧图像属于目标视频片段中的内容,将该图像的匹配结果设为1;若数据库中没有与该图像特征相似的特征向量,则匹配失败,那么认为该帧图像不是目标视频片段中的内容,将该图像的匹配结果设为0,这样,针对提取的各镜头关键帧的图像特征的匹配结果,会得到由0、1组成的一组数据。

其中,相似定义为:针对待检测图像整体i、以及图像中央三个子区域a、b和c共4个区域中,至少有2个区域的感知哈希特征,能够在数据库中查找到编辑距离小于第二预设阈值t的特征向量,其中,t=0.2×特征向量维度。

s107:将匹配成功的关键帧数超过预设匹配帧阈值的镜头,确定为所述待检测视频中目标视频片段的镜头;

具体的,确定待检测视频中目标视频片段的镜头的方法为:判断镜头中匹配成功的关键帧的数量是否超过预设匹配帧阈值。

示例性的,若某一个待处理镜头的匹配成功的关键帧数超过预设匹配帧阈值m,即至少有m帧均被判断为是目标视频片段内容,则认为该待检测镜头属于目标视频片段内容,否则,认为该待检测镜头不属于目标视频片段内容,其中,m的典型取值为2。

由图1所示的实施例可见,本发明实施例提供的一种目标视频片段检测方法,可以实现一部剧集中重复性目标视频片段的自动检测,本发明将标识目标视频片段的工作量从一部剧集每集均需人工标注降低为一部剧集只需人工标注一集,针对人工标注的一集,用视频镜头检测、视频镜头分析与图像特征提取的方法,获取目标视频片断中各个镜头的各个关键帧的图像特征,将获取到的图像特征,存储在数据库中作为匹配模板,针对剧集中的其它各集,采用模板匹配的方式,实现一部剧集中重复性目标视频片段的自动检测,减少人工成本的消耗,同时,相较于现有的自动检测技术,对视频内容的一致性要求较低,对于不同集数的视频内容中可能存在的删减/剪裁/形变情况具有较好的鲁棒性。

本发明实施例中,为实现一部剧集中重复性目标视频片段的自动检测,预先存储所述剧集中指定一集视频的片头和/或片尾的关键帧的模板图像特征。

具体的,预先存储所述剧集中指定一集视频的片头和/或片尾的关键帧的模板图像特征,可以包括:

对剧集中指定一集视频,获取被标识为所述指定一集的片头的第一起始帧和第一结束帧,和/或被标识为所述指定一集的片尾的第二起始帧和第二结束帧;

根据被标识为所述指定一集的片头的第一起始帧和第一结束帧,确定所述指定一集中包含片头内容的片头视频帧范围;和/或根据被标识为所述指定一集的片尾的第二起始帧和第二结束帧,确定所述指定一集中包含片尾内容的片尾视频帧范围;

从所述片头视频帧范围中提取片头关键帧;

获取每个片头关键帧的图像特征,作为片头关键帧的模板图像特征;

和/或,从所述片尾视频帧范围中提取片尾关键帧;

获取每个片尾关键帧的图像特征,作为片尾关键帧的模板图像特征;

将所述剧集标识与片头的各个关键帧的模板图像特征和/或片尾的各个关键帧的模板图像特征对应存储至所述数据库中。

示例性的,对剧集中指定一集视频,获取被标识为所述指定一集的片头的第一起始帧和第一结束帧和/或被标识为所述指定一集的片尾的第二起始帧和第二结束帧

分别根据被标识为所述指定一集的片头的第一起始帧和第一结束帧和/或根据被标识为所述指定一集的片尾的第二起始帧和第二结束帧确定目标视频片段的视频帧范围;

以镜头为单位,每次仅对当前检测到的新镜头进行时间点位分析,将当前新镜头的起始帧和结束帧,分别记为shotsta和shotend,并将已处理的上一镜头的结束帧记为lastend,根据镜头帧级信息[shotsta,shotend]与标识目标视频片段的帧级信息,在时间轴上的相对关系,判断当前镜头中属于片头的视频帧范围r;

则当前镜头内无目标视频片段内容;

则根据shotsta与的间隔进行判断,若则认为点位信息存在误差,当前镜头中无目标视频片段内容,若则记属于目标视频片段中的内容;

则记r[shotsta,shotend]属于目标视频片段中的内容;

则记属于目标视频片段中的内容;

则根据与shotend的间隔进行判断,若则认为点位信息存在误差,当前镜头中无目标视频片段内容,若则记属于目标视频片段中的内容;

则根据与shotend的间隔进行判断,若则当前镜头内无目标视频片段内容,其中,fth的典型取值为视频帧率。

以镜头为单位,每次仅对当前检测到的新镜头进行时间点位分析,将当前新镜头的起始帧和结束帧,分别记为shotsta和shotend,并将已处理的上一镜头的结束帧记为lastend,根据镜头帧级信息[shotsta,shotend]与标识目标视频片段的帧级信息,在时间轴上的相对关系,判断当前镜头中属于片尾的视频帧范围r;

则当前镜头内无目标视频片段内容;

则根据shotsta与的间隔进行判断,若则认为点位信息存在误差,当前镜头中无目标视频片段内容,若则记属于目标视频片段中的内容;

则记r[shotsta,shotend]属于目标视频片段中的内容;

则记属于目标视频片段中的内容;

则根据与shotend的间隔进行判断,若则认为点位信息存在误差,当前镜头中无目标视频片段内容,若则记属于目标视频片段中的内容;

则根据与shotend的间隔进行判断,若则当前镜头内无目标视频片段内容,其中,fth的典型取值为视频帧率。

根据获取的目标视频片段的视频帧范围,从所述目标视频片段的视频帧范围中提取片头关键帧,具体的方法,包括:

若待检测镜头是属于目标视频片段内容中的片头视频内容,则根据各个镜头中属于所述片头视频内容的视频帧范围和预设的关键帧数量的比值确定各个镜头的候选采样间隔;

针对每一镜头,判断该镜头的候选采样间隔是否大于预设的采样间隔的第一采样间隔阈值;

若该镜头的候选采样间隔大于预设的采样间隔的第一采样间隔阈值,则将第一预设值作为所述镜头的目标采样间隔;

或者,若该镜头的候选采样间隔不大于预设的采样间隔的第一采样间隔阈值,则判断所述镜头的候选采样间隔是否大于预设的采样间隔的第二采样间隔阈值;

若所述镜头的候选采样间隔大于预设的采样间隔的第二采样间隔阈值,则将第二采样间隔阈值作为所述镜头的目标采样间隔;

或者,若所述镜头的候选采样间隔不大于预设的采样间隔的第二采样间隔阈值,则将所述镜头的候选采样间隔,作为所述镜头的目标采样间隔;

根据获取的各个镜头的目标采样间隔,在各个镜头的所述片头内容的视频帧范围内进行采样,获取片头关键帧;

若待检测镜头是属于目标视频片段内容中的片尾视频内容,则根据各个镜头中属于所述片尾视频帧范围中提取片尾关键帧的步骤,可以包括:

根据各个镜头中属于所述片尾视频内容的视频帧范围和预设的关键帧数量的比值确定各个镜头的候选采样间隔;

针对每一镜头,判断该镜头的候选采样间隔是否大于预设的采样间隔的第一采样间隔阈值;

若该镜头的候选采样间隔大于预设的采样间隔的第一采样间隔阈值,则将第一预设值作为所述镜头的目标采样间隔;

或者,若该镜头的候选采样间隔不大于预设的采样间隔的第一采样间隔阈值,则判断所述镜头的候选采样间隔是否大于预设的采样间隔的第二采样间隔阈值;

若所述镜头的候选采样间隔大于预设的采样间隔的第二采样间隔阈值,则将第二采样间隔阈值作为所述镜头的目标采样间隔;

或者,若所述镜头的候选采样间隔不大于预设的采样间隔的第二采样间隔阈值,则将所述镜头的候选采样间隔,作为所述镜头的目标采样间隔;

根据获取的各个镜头的目标采样间隔,在各个镜头的所述片尾内容的视频帧范围内进行采样,获取片尾关键帧。

具体为,根据一个待处理镜头中的视频帧范围r和预设的关键帧数量k1的比值,确定该待处理镜头的候选采样间隔intervalk,即其中k1的典型取值为10。

其次,将获取的候选采样间隔与预设的采样间隔的第一采样间隔阈值il进行比较;

若该待处理镜头的候选采样间隔intervalk大于预设的采样间隔的第一采样间隔阈值il,即intervalk>il,则当前镜头属于超长镜头,需要进行密集采样,则将第一预设值id作为该待处理镜头的目标采样间隔,即令intervalk=id,其中il的典型取值为50,id的典型取值为2;

若某一待处理镜头的候选采样间隔intervalk小于或等于预设的采样间隔的第一采样间隔阈值il,则判断该待处理镜头的候选采样间隔是否大于预设的采样间隔的第二采样间隔阈值im;

当intervalk≤il且intervalk>im,则当前镜头采样间隔过大,将第二采样间隔阈值im作为该待处理镜头的目标采样间隔,即令intervalk=im,其中im的典型取值为6;

当intervalk≤il且intervalk≤im,则将该待处理镜头的候选采样间隔intervalk,作为该待处理镜头的目标采样间隔。

根据获取的各个镜头的目标采样间隔,在各个镜头对应的视频帧范围r内进行采样,获取各个镜头的关键帧,其中,获取的关键帧的数量为其中length(r)表示视频帧范围r的长度。

针对上述获取到的关键帧,分别获取每个片头关键帧的图像特征,作为片头关键帧的模板图像特征,和/或,获取每个片尾关键帧的图像特征,作为片尾关键帧的模板图像特征,包括:

对所述片头关键帧的图像进行缩放,将所述图像的中央区域划分为均等的三个子区域,分别计算图像整体及划分的所述三个子区域的感知哈希特征,获取4个感知哈希特征;

将获取的4个感知哈希特征,接续连接为1个向量,将所述向量作为所述片头关键帧的图像特征;

和/或,获取每个片尾关键帧的图像特征,作为片尾关键帧的模板图像特征的步骤,包括:

对所述片尾关键帧的图像进行缩放,将所述图像的中央区域划分为均等的三个子区域,分别计算图像整体及划分的所述三个子区域的感知哈希特征,获取4个感知哈希特征;

将获取的4个感知哈希特征,接续连接为1个向量,将所述向量作为所述片尾关键帧的图像特征。

具体的,根据获得片头和/或片尾的关键帧,获取每个片头和/或片尾关键帧的图像特征,作为片头和/或片尾关键帧的模板图像特征的方法,可以参见s103中所述的方法,此处不在做过多描述。

将所述剧集标识与片头的各个关键帧的模板图像特征和/或片尾的各个关键帧的模板图像特征对应存储至所述数据库中,作为匹配模板,为下一步的重复性目标视频片段的自动检测做准备。

在进行重复性目标视频片段的自动检测时,首先要按照上述s101-s103所述的方法,获得待检测视频的每个镜头的每个关键帧的图像特征,其次按照s104所述的方法,确定所述待检测视频所属的剧集,再按照s105所述的方法,从预设数据库中获取所确定的剧集的匹配模板,再按照s106所述的方法,将每个镜头的每个关键帧的图像特征与所述匹配模板中的各个关键帧的模板图像特征进行匹配;

所述将每个镜头的每个关键帧的图像特征与所述匹配模板中的各个关键帧的模板图像特征进行匹配的步骤,包括:

根据所述剧集标识和待处理镜头是属于片头内容或片尾内容设置检索范围,根据所述检索范围,在所述预设数据库中查找是否有与待检测的图像特征相似的图像特征。

示例性的,如果剧集标识为《琅琊榜》,而待处理镜头是属于片头内容的,就将检索范围设置为,在《琅琊榜》的片头模板中查找,是否有与待检测的图像特征相似的图像特征,这样的设计可以缩小检索范围,从而提高检索速度。

本发明实施例中,在完成针对待检测视频的各个镜头与模板特征的匹配后,可以再对获取的匹配结果进行滤波处理,从而,获取目标视频片段的帧级精度的时间点位信息,同时也可以纠正匹配结果中丢失的片段。

具体的,所述对各个镜头匹配后获取的匹配结果进行滤波处理,获取目标视频片段的帧级精度的时间点位信息的步骤,可以包括:

采用窗口长度为第三预设值,对各个镜头的判断结果进行滤波处理,得到各个镜头的滤波结果;

根据各个镜头的滤波结果,确定所述待检测视频的目标视频片段的镜头,其中,所述滤波结果为所述镜头是所述目标片段的镜头或所述镜头不是所述目标视频片段的镜头。

示例性的,对各镜头的匹配结果,即由0、1组成的一组数据,进行滤波处理,即中值滤波,根据镜头级匹配结果,采用窗口长度为k的中值滤波,纠正匹配结果,例如,若镜头中有一帧图像的匹配结果为0,但该帧前一帧的匹配结果为1,后一帧的匹配结果也为1,则将该帧的匹配结果设为1,即认为该帧是属于目标视频片段的,其中,k的典型取值为3。

图2为本发明实施例提供的一种检测视频中目标视频片段的方法的原理示意图,如图2所示,该方法包括:

由人工选择一部电视剧中的指定的某一集作为标识集,标识该集电视剧中目标视频片段的秒级精度的起始时间点和结束时间点的点位信息,根据视频帧率f,将人工标识的秒级时间点位信息转为帧级信息,其中,f的典型取值为25。

示例性的,上述,将目标视频片段的起始时间点和结束时间点转换为帧级信息的方法,包括:

针对目标视频片段内容中的片头,则分别将所述人工标注的片头的起始时间和结束时间与所述视频帧率f的乘积对应的整数分别得到目标视频片段内容中片头的起始帧号和结束帧号

针对目标视频片段内容中的片头,则分别将人工标注的片头的起始时间和结束时间与所述视频帧率f的乘积对应的整数分别得到目标视频片段内容中片尾的起始帧号和结束帧号

分别针对目标视频片段内容中的片头和片尾,分别获取手工标识的片头帧级信息和片尾的帧级信息

对该集内容进行镜头检测,并结合手工标识的信息确定目标视频片段的镜头范围,并对各个镜头进行采样,获取各个镜头的关键帧,对于获取到的关键帧进行图像特征提取,获取各关键帧的图像特征,将获取的各关键帧的图像特征存储至数据库,作为该部电视剧的目标视频片段的匹配模板。

将获取到的各关键帧的图像特征存储至数据库,作为待检测电视剧的目标视频片段匹配模板。

对于待检测电视剧中的其它各集,逐集进行目标视频片段检测,对待检测电视剧中的某一集的各镜头分别进行采样,获取各镜头的关键帧。

提取各镜头中各个关键帧的图像特征,针对提取到的某一镜头关键帧的图像特征,根据电视剧名称以及本次检测是属于片头检测还是片尾检测,设置检索范围。

根据设置的检索范围,在数据库中查询是否有与该图像特征相似的特征向量,若数据库中有与该图像特征相似的特征向量,则匹配成功,那么认为该帧图像属于目标视频片段中的内容,将该图像的匹配结果设为1;若数据库中没有与该图像特征相似的特征向量,则匹配失败,那么认为该帧图像不属于目标视频片段中的内容,将该图像的匹配结果设为0,这样,针对提取的各镜头关键帧的图像特征的匹配结果,会得到由0、1组成的一组数据。

其中,相似定义为:针对待检测图像整体i、以及图像中央三个子区域a、b和c共4个区域中,至少有2个区域的感知哈希特征,能够在数据库中查找到编辑距离小于第二预设阈值t的特征向量,其中,t=0.2×特征向量维度。

若某一个镜头中至少有m帧均被判断为是属于目标视频片段中的内容,则认为该镜头属于目标视频片段中的内容,m的典型取值为2;否则,认为该镜头不属于目标视频片段中的内容。

对各镜头的匹配结果,即由0、1组成的一组数据,进行后处理,根据镜头级匹配结果,采用窗口长度为k的中值滤波器,纠正匹配结果中的短暂丢失的片断,其中,k的典型取值为3。

示例性的,采用窗口长度为3的中值滤波器进行后处理,当前镜头的匹配结果为0,但前一镜头的匹配结果为1,后一镜头的匹配结果也为1,则将该镜头的匹配结果设为1,即认为该镜头是属于目标视频片段的。

后处理结束后,若只得到一个连续的候选镜头的匹配序列,记该序列的第一帧为最后一帧为即为帧级精度的目标视频片段的检测结果;若得到多个连续的候选镜头的匹配序列,选择持续时间,即最长的一个匹配结果作为帧级精度的目标视频片段检测结果。

可选的,在一种具体实现方式中,可以选择对待检测电视剧中某一集的前后多少分钟的内容进行检测是可以人为设定的,当然也可以选择对待检测电视剧中某一集的全部内容进行检测。

本发明实施例提供的一种目标视频片段检测方法,可以实现一部剧集中重复性目标视频片段的自动检测,本发明将标识目标视频片段的工作量从一部剧集每集均需人工标注降低为一部剧集只需人工标注一集,针对人工标注的一集,用视频镜头检测、视频镜头分析与图像特征提取的方法,获取目标视频片断中各个镜头的各个关键帧的图像特征,将获取到的图像特征,存储在数据库中作为匹配模板,针对剧集中的其它各集,采用模板匹配的方式,实现一部剧集中重复性目标视频片段的自动检测,减少人工成本的消耗,同时,相较于现有的自动检测技术,对视频内容的一致性要求较低,对于不同集数的视频内容中可能存在的删减/剪裁/形变情况具有较好的鲁棒性。

与图1所示实施例相对应,本发明实施例还提供了一种检测视频中目标视频片段的装置。如图4所示,该装置包括:视频获取模块101、关键帧获取模块102、图像特征获取模块103、剧集判断模块105、匹配模板获取模块106、图像特征匹配模块107及判断模块108,其中,

视频获取模块101,用于获取待检测视频;

关键帧获取模块102,用于从所述待检测视频中提取各个镜头的关键帧;

图像特征获取模块103,用于获取每个镜头的每个关键帧的图像特征;

剧集判断模块105,用于确定所述待检测视频所属的剧集;

匹配模板获取模块106,用于从预设数据库中获取所确定的剧集的匹配模板;其中,所述匹配模板中包含预先存储的所述剧集中指定一集视频的目标视频片段的关键帧的模板图像特征;所述待检测视频为所述剧集中除所述指定一集外的其他集视频;

图像特征匹配模块107,用于将每个镜头的每个关键帧的图像特征与所述匹配模板中的各个关键帧的模板图像特征进行匹配;

判断模块108,用于判断镜头中匹配成功的关键帧数是否超过预设匹配帧阈值,其中,将匹配成功的关键帧数超过预设匹配帧阈值的镜头,确定为所述待检测视频中目标视频片段的镜头。

可选的,所述关键帧获取模块102,具体用于:根据各个镜头中属于所述目标视频片段内容的视频帧范围和预设的关键帧数量的比值确定各个镜头的候选采样间隔;

针对每一镜头,判断该镜头的候选采样间隔是否大于预设的采样间隔的第一采样间隔阈值;

若该镜头的候选采样间隔大于预设的采样间隔的第一采样间隔阈值,则将第一预设值作为所述镜头的目标采样间隔;

或者,若该镜头的候选采样间隔不大于预设的采样间隔的第一采样间隔阈值,则判断所述镜头的候选采样间隔是否大于预设的采样间隔的第三采样间隔阈值;

若所述镜头的候选采样间隔大于预设的采样间隔的第三采样间隔阈值,则将第三采样间隔阈值作为所述镜头的目标采样间隔;

或者,若所述镜头的候选采样间隔不大于预设的采样间隔的第三采样间隔阈值,则将所述镜头的候选采样间隔,作为所述镜头的目标采样间隔;

根据获取的各个镜头的目标采样间隔,在各个镜头的所述视频帧范围内进行采样,获取各个镜头的关键帧

可选的,所述图像特征获取模块103,具体用于:对所述关键帧的图像进行缩放,将所述图像的中央区域划分为均等的三个子区域,分别计算图像整体及划分的所述三个子区域的感知哈希特征,获得4个感知哈希特征;

将获得的4个感知哈希特征,接续连接为1个向量,将所述向量作为所述关键帧的图像特征。

可选的,所述剧集判断模块105,具体用于:

从所述待检测视频的属性信息中获取所述待检测视频所属的剧集标识;

所述匹配模板获取模块,具体用于:

从所述预设数据库中获取与所述剧集标识相同的剧集的匹配模板。

如图5所示,可选的,所述装置,还包括:模板图像特征预存模块104;

所述模板图像特征预存模块104,包括:

标识帧获取子模块1041,用于对剧集中指定一集视频,获取被标识为所述指定一集的片头的第一起始帧和第一结束帧,和/或被标识为所述指定一集的片尾的第二起始帧和第二结束帧;

片头/片尾视频帧范围确定子模块1042,用于根据被标识为所述指定一集的片头的第一起始帧和第一结束帧,确定所述指定一集中包含片头内容的片头视频帧范围;和/或根据被标识为所述指定一集的片尾的第二起始帧和第二结束帧,确定所述指定一集中包含片尾内容的片尾视频帧范围;

模板图像特征获取子模块1043,用于从所述片头视频帧范围中提取片头关键帧;获取每个片头关键帧的图像特征,作为片头关键帧的模板图像特征;

和/或,从所述片尾视频帧范围中提取片尾关键帧;

获取每个片尾关键帧的图像特征,作为片尾关键帧的模板图像特征;

存储子模块1044,用于将所述剧集标识与片头的各个关键帧的模板图像特征和/或片尾的各个关键帧的模板图像特征对应存储至所述数据库中。

可选的,所述标识帧获取子模块1041,具体用于:根据该集的视频帧率,将被标识为该集的片头的起始时间点和结束时间点转换为该集的片头的第一起始帧和第一结束帧,和/或被标识为该集的片尾的起始时间点和结束时间点转换为该集片尾的第二起始帧和第二结束帧。

可选的,所述片头/片尾视频帧范围确定子模块1042,具体用于:

根据各个镜头起始帧号和结束帧号与所述指定一集的片头的第一起始帧和第一结束帧,在时间轴上的相对关系,确定各个镜头中属于片头内容的视频帧范围;

若待处理镜头的帧号范围完全落入所述片头的帧号范围,将所述待处理镜头的帧号范围作为所述片头内容的视频帧范围;

若所述片头的帧号范围完全落入所述待处理镜头的帧号范围,将所述目标视频片段帧号范围作为所述片头内容的视频帧范围;

若所述待处理镜头的帧号范围与所述片头的帧号范围只有部分重叠,则判断该所重叠的帧号的数量是否大于等于第三预设阈值,如果大于等于,将所重叠的帧号对应的视频帧范围作为所述片头内容的视频帧范围;

和/或,所述根据被标识为所述指定一集的片尾的第二起始帧和第二结束帧,确定所述指定一集中包含片尾内容的片尾视频帧范围的步骤,包括:

根据各个镜头起始帧号和结束帧号与所述指定一集的片尾的第二起始帧和第二结束帧,在时间轴上的相对关系,确定各个镜头中属于片尾内容的视频帧范围;

若待处理镜头的帧号范围完全落入所述片尾的帧号范围,将所述待处理镜头的帧号范围作为所述片尾内容的视频帧范围;

若所述片尾的帧号范围完全落入所述待处理镜头的帧号范围,将所述目标视频片段帧号范围作为所述片尾内容的视频帧范围;

若所述待处理镜头的帧号范围与所述片尾的帧号范围只有部分重叠,则判断所重叠的帧号的数量是否大于等于第三预设阈值,如果大于等于,将所重叠的帧号对应的视频帧范围作为所述片尾内容的视频帧范围。

可选的,所述模板图像特征获取子模块1043,从所述片头视频帧范围中提取片头关键帧,包括:

根据各个镜头中属于所述片头视频内容的视频帧范围和预设的关键帧数量的比值确定各个镜头的候选采样间隔;

针对每一镜头,判断该镜头的候选采样间隔是否大于预设的采样间隔的第一采样间隔阈值;

若该镜头的候选采样间隔大于预设的采样间隔的第一采样间隔阈值,则将第一预设值作为所述镜头的目标采样间隔;

或者,若该镜头的候选采样间隔不大于预设的采样间隔的第一采样间隔阈值,则判断所述镜头的候选采样间隔是否大于预设的采样间隔的第二采样间隔阈值;

若所述镜头的候选采样间隔大于预设的采样间隔的第二采样间隔阈值,则将第二采样间隔阈值作为所述镜头的目标采样间隔;

或者,若所述镜头的候选采样间隔不大于预设的采样间隔的第二采样间隔阈值,则将所述镜头的候选采样间隔,作为所述镜头的目标采样间隔;

根据获取的各个镜头的目标采样间隔,在各个镜头的所述片头内容的视频帧范围内进行采样,获取片头关键帧;

所述模板图像特征获取子模块1043,从所述片头视频帧范围中提取片尾关键帧,包括:

根据各个镜头中属于所述片尾视频内容的视频帧范围和预设的关键帧数量的比值确定各个镜头的候选采样间隔;

针对每一镜头,判断该镜头的候选采样间隔是否大于预设的采样间隔的第一采样间隔阈值;

若该镜头的候选采样间隔大于预设的采样间隔的第一采样间隔阈值,则将第一预设值作为所述镜头的目标采样间隔;

或者,若该镜头的候选采样间隔不大于预设的采样间隔的第一采样间隔阈值,则判断所述镜头的候选采样间隔是否大于预设的采样间隔的第二采样间隔阈值;

若所述镜头的候选采样间隔大于预设的采样间隔的第二采样间隔阈值,则将第二采样间隔阈值作为所述镜头的目标采样间隔;

或者,若所述镜头的候选采样间隔不大于预设的采样间隔的第二采样间隔阈值,则将所述镜头的候选采样间隔,作为所述镜头的目标采样间隔;

根据获取的各个镜头的目标采样间隔,在各个镜头的所述片尾内容的视频帧范围内进行采样,获取片尾关键帧。

所述模板图像特征获取子模块1043,获取每个片头关键帧的图像特征,作为片头关键帧的模板图像特征,包括:

对所述片头关键帧的图像进行缩放,将所述图像的中央区域划分为均等的三个子区域,分别计算图像整体及划分的所述三个子区域的感知哈希特征,获取4个感知哈希特征;

将获取的4个感知哈希特征,接续连接为1个向量,将所述向量作为所述片头关键帧的图像特征;

所述模板图像特征获取子模块1043,获取每个片尾关键帧的图像特征,作为片尾关键帧的模板图像特征的步骤,包括:

对所述片尾关键帧的图像进行缩放,将所述图像的中央区域划分为均等的三个子区域,分别计算图像整体及划分的所述三个子区域的感知哈希特征,获取4个感知哈希特征;

将获取的4个感知哈希特征,接续连接为1个向量,将所述向量作为所述片尾关键帧的图像特征。

可选的,图像特征获取模块103,具体用于:

对获取的待处理镜头的待处理关键帧的图像进行缩放,将所述图像的中央区域划分为均等的三个子区域,分别计算图像整体及划分的所述三个子区域的感知哈希特征,获取4个感知哈希特征;

将获取的4个感知哈希特征,接续连接为1个向量,将所述向量作为所述关键帧的图像特征;

所述将每个镜头的每个关键帧的图像特征与所述匹配模板中的各个关键帧的模板图像特征进行匹配的步骤,包括:

根据所述剧集标识和待处理镜头是属于片头内容或片尾内容设置检索范围,根据所述检索范围,在所述预设数据库中查找是否有与待检测的图像特征相似的图像特征。

如图6所示,可选的,所述装置,还包括:

后处理模块109:用于对各个镜头匹配后获取的匹配结果进行处理。

可选的,所述后处理模块109,包括:

滤波处理子模块1091,用于对各个镜头匹配后获取的匹配结果进行滤波处理;

时间点获取子模块1092,用于获取目标视频片段的帧级精度的时间点位信息。

本发明实施例提供的一种目标视频片段检测装置,可以实现一部剧集中重复性目标视频片段的自动检测,与现有技术标识目标视频片段需要人工重复性的标注剧集中的每一集相比,实施本发明可以实现一部剧集中重复性目标视频片段的自动检测,减少人工成本的消耗,与现有的自动检测技术相比,对视频内容的一致性要求较低,对于不同集数的视频内容中可能存在的删减/剪裁/形变情况具有较好的鲁棒性。

与图1所示实施例相对应,本发明实施例还提供了一种电子设备,如图7所示,该电子设备包括:处理器701、通信接口702、存储器703和通信总线704,其中,处理器701,通信接口702,存储器703通过通信总线704完成相互间的通信;

存储器703,用于存放计算机程序;

处理器701,用于执行存储器上所存放的程序时,实现以下方法步骤:

获取待检测视频;

从所述待检测视频中提取各个镜头的关键帧;

获取每个镜头的每个关键帧的图像特征;

确定所述待检测视频所属的剧集;

从预设数据库中获取所确定的剧集的匹配模板,所述匹配模板中包含预先存储的所述剧集中指定一集视频的片头和/或片尾的关键帧的模板图像特征;所述待检测视频为所述剧集中除所述指定一集外的其他集视频;

将每个镜头的每个关键帧的图像特征与所述匹配模板中的各个关键帧的模板图像特征进行匹配;

将匹配成功的关键帧数超过预设匹配帧阈值的镜头,确定为所述待检测视频中目标视频片段的镜头;所述目标视频片段为:视频的片头和/或片尾。

本发明实施例提供的一种目标视频片段检测装置,可以实现一部剧集中重复性目标视频片段的自动检测,与现有技术标识目标视频片段需要人工重复性的标注剧集中的每一集相比,实施本发明可以实现一部剧集中重复性目标视频片段的自动检测,减少人工成本的消耗,与现有的自动检测技术相比,对视频内容的一致性要求较低,对于不同集数的视频内容中可能存在的删减/剪裁/形变情况具有较好的鲁棒性。

在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的目标视频片段检测方法。

在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的目标视频片段检测方法。

在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(dsl))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,dvd)、或者半导体介质(例如固态硬盘solidstatedisk(ssd))等。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1