一种画面的提取方法及终端与流程

文档序号:11961441阅读:209来源:国知局
一种画面的提取方法及终端与流程

本发明涉及电子技术领域,尤其涉及一种画面的提取方法及终端。



背景技术:

目前视频在播放过程中有很多精彩部分,为了有效利用这些精彩部分的画面,厂商常会对这些精彩部分的画面进行人工截取,并对其进行运营,如制作广告,或者制作视频简介等。

但是,由于目标画面是人工进行截取,这往往取决于截取操作人员的惹人喜好以及个人素质等问题,这使得人工截取出来的画面质量不可控,无法保障目标画面的质量,且需花费大量人力成本进行查看视频并进行操作截取,这增加了厂商的成本开销,并且提取画面效率低下。



技术实现要素:

本发明实施例所要解决的技术问题在于,提供一种画面的提取方法及终端。可提高提取目标画面的效率,降低提取成本。

为了解决上述技术问题,本发明实施例提供了一种画面的提取方法,包括:

提取待处理的音视频数据中的音频数据;

获取预置的背景音乐特征,在所述音频数据中检测与所述背景音乐特征相匹配的目标音频数据;

在所述待处理的音视频数据中获取与所述目标音频数据对应的目标音视频数据;

从所述目标音视频数据中进行提取画面,获得目标画面。

其中,所述获取预置的背景音乐特征,在所述音频数据中检测与所述背景音乐特征相匹配的目标音频数据包括:

获取预置的背景音乐特征;

对所述音频数据进行划分,获得至少一段音频数据;

对每段音频数据分别进行特征提取,获得每段音频数据对应的特征数据;

在所述每段音频数据对应的特征数据中获取与所述背景音乐特征匹配的目标特征数据;

获取所述目标特征数据对应的音频数据,将所述目标特征数据对应的音频数据设置为目标音频数据。

其中,所述从所述目标音视频数据中进行提取画面,获得目标画面包括:

提取所述目标音视频数据中的目标视频数据;

对所述目标视频数据进行镜头划分,获得各镜头的视频数据;

从所述各镜头的视频数据中分别进行提取画面,获得至少一个目标画面。

其中,所述从所述各镜头的视频数据中分别进行画面提取,获得至少一个目标画面包括:

从所述各镜头的视频数据中分别进行提取画面,获得至少一个待处理的提取画面;

当仅获取到一个待处理的提取画面时,将所述待处理的提取画面设置为目标画面;

当获取到至少两个待处理的提取画面时,对所述至少两个待处理的提取画面进行滤除处理,获得所述至少一个目标画面。

其中,所述对所述至少两个待处理的提取画面进行滤除处理,获得所述至少一个目标画面包括:

在所述至少两个待处理的提取画面中计算任意两张待处理的提取画面之间的相似度;

判断所述相似度是否大于预设的阈值;

当所述相似度大于预设的阈值时,滤除所述任意两张待处理的提取画面中的任意一张待处理的提取画面,在所述任意两张待处理的提取画面中将除所述任意一张待处理的提取画面之外的另一张待处理的提取画面设置为所述目标画面;

当所述相似度小于预设的阈值时,将所述任意两张待处理的提取画面均设置为所述目标画面。

其中,所述从所述目标音视频数据中进行提取画面,获得目标画面之后,还包括:

将至少两个目标画面进行视频拼接,获得精彩视频并输出所述精彩视频。

本发明实施例还提供了一种终端,包括:

提取单元,用于提取待处理的音视频数据中的音频数据;

检测单元,用于获取预置的背景音乐特征,在所述音频数据中检测与所述背景音乐特征相匹配的目标音频数据;

获取单元,用于在所述待处理的音视频数据中获取与所述目标音频数据对应的目标音视频数据;

提取画面单元,用于从所述目标音视频数据中进行画面提取,获得目标画面。

其中,所述检测单元包括:

获取特征子单元,用于获取预置的背景音乐特征;

第一划分子单元,用于对所述音频数据进行划分,获得至少一段音频数据;

第一提取子单元,用于对每段音频数据分别进行特征提取,获得每段音频数据对应的特征数据;

获取子单元,用于在所述每段音频数据对应的特征数据中获取与所述背景音乐特征匹配的目标特征数据;

第一设置子单元,用于获取所述目标特征数据对应的音频数据,将所述目标特征数据对应的音频数据设置为目标音频数据。

其中,所述提取画面单元包括:

第二提取子单元,用于提取所述目标音视频数据中的目标视频数据;

第二划分子单元,用于对所述目标视频数据进行镜头划分,获得各镜头的视频数据;

第三提取子单元,用于从所述各镜头的视频数据中分别进行提取画面,获得至少一个目标画面。

其中,所述第三提取子单元包括:

第三提取子单元,用于从所述各镜头的视频数据中分别进行提取画面,获得至少一个待处理的提取画面;

第二设置子单元,用于当仅获取到一个待处理的提取画面时,将所述待处理的提取画面设置为目标画面;

处理子单元,用于当获取到至少两个待处理的提取画面时,对所述至少两个待处理的提取画面进行滤除处理,获得所述至少一个目标画面。

其中,所述滤除子单元包括:

计算子单元,用于在所述至少两个待处理的提取画面中计算任意两张待处理的提取画面之间的相似度;

判断子单元,用于判断所述相似度是否大于预设的阈值;

滤除子单元,用于当所述判断子单元判断所述相似度大于预设的阈值时,滤除所述任意两张待处理的提取画面中的任意一张待处理的提取画面,在所述任意两张待处理的提取画面中将除所述任意一张待处理的提取画面之外的另一张待处理的提取画面设置为所述目标画面;

第三设置子单元,用于当所述判断子单元判断所述相似度小于预设的阈值时,将所述任意两张待处理的提取画面均设置为所述目标画面。

其中,所述终端还包括:

拼接单元,用于将至少两个目标画面进行视频拼接,获得精彩视频并输出所述精彩视频。

本发明实施例还提供了一种终端,包括:壳体、处理器、存储器、电路板和电源电路,其中,所述电路板安置在所述壳体围成的空间内部,所述处理器和所述存储器设置在所述电路板上;所述电源电路,用于为所述移动终端的各个电路或器件供电;所述存储器用于存储可执行程序代码;所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于执行以下步骤:

提取待处理的音视频数据中的音频数据;

获取预置的背景音乐特征,在所述音频数据中检测与所述背景音乐特征相匹配的目标音频数据;

在所述待处理的音视频数据中获取与所述目标音频数据对应的目标音视频数据;

从所述目标音视频数据中进行提取画面,获得目标画面。

在本发明实施例中,终端提取待处理的音视频数据中的音频数据,获取预置的背景音乐特征,在所述音频数据中检测与所述背景音乐特征相匹配的目标音频数据,在所述待处理的音视频数据中获取与所述目标音频数据对应的目标音视频数据,从所述目标音视频数据中进行提取画面,获得目标画面,这可使得终端可自动从音视频数据中提取到目标画面,可提高从音视频数据中的提取目标画面的效率,降低提取成本。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种画面的提取方法的一种实施例流程示意图;

图2是本发明实施例提供的一种终端的一种实施例结构图;

图3是本发明实施例提供的一种终端的另一种实施例结构图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明实施例中的执行主体可以为终端,所描述的终端可包括:电脑、平板电脑、笔记本等智能终端,上述终端仅是举例,而非穷举,包含但不限于上述终端。

参见图1,是本发明实施例提供的一种画面的提取方法一种实施例流程示意图。本发明实施例的一种画面的提取方法包括如下步骤:

S100,提取待处理的音视频数据中的音频数据。

在本发明实施例中,音视频数据由音频数据以及视频数据组成,音视频数据可以通过声音播放器输出音频以及视频播放器输出视频,如音视频数据可以是电视播放的具有声音输出的节目内容、手机上具有声音输出的录像等音视频数据。

在本发明实施例中,待处理的音视频数据为用户选择所要进行处理的音视频数据,如终端接收到的音视频数据可以作为待处理的音视频数据,或者终端可以存储多个音视频数据,用户从中选择一个音视频数据作为待处理的音视频数据。

在本发明实施例中,当终端确定待处理的音视频数据,终端可对待处理的音视频数据进行解码,提取待处理的音视频数据所包括的音频数据。

S101,获取预置的背景音乐特征,在所述音频数据中检测与所述背景音乐特征相匹配的目标音频数据。

在本发明实施例中,音频数据中可包括多种类型音频数据,如背景音乐类型的音频数据、旁白类型的音频数据和静音类型的音频数据等类型音频数据。

在本发明实施例中,由于音视频中的目标画面一般出现在有背景音乐的音视频数据中,因此,终端可对音频数据进行识别出有背景音乐的音频数据,从而进行处理获得目标画面。

在本发明实施例中,终端可对音频数据进行识别出有背景音乐的音频数据可以是:获取预置背景音乐特征,在音频数据中检测与背景音乐特征匹配的音频数据,当检测到与背景音乐特征匹配的音频数据时,提取与背景音乐特征匹配的音频数据,将与背景音乐特征匹配的音频数据作为目标音频数据。其中,预置的背景音乐特征可以是用户进行预置存储。具体的,在音频数据中检测与背景音乐特征相匹配的目标音频数据可以是:对音频数据进行划分,获得至少一段音频数据,其中,可以是按时间段进行划分,如以1s的时间段对音频数据进行划分,每个分段的音频数据的播放时间为1s。当终端对音频数据进行划分后,终端可对每段音频数据分别进行特征提取,获得每段音频数据对应的特征数据,然后在每段音频数据对应的特征数据中获取与背景音乐特征匹配的目标特征数据,获取目标特征数据对应的音频数据,将目标特征数据对应的音频数据设置为目标音频数据,其中,当终端获取的目标特征数据有多个时,终端可获取多个目标特征数据各分别对应的多个音频数据,并将多个音频数据进行拼接,获得目标音频数据。

S102,在所述待处理的音视频数据中获取与所述目标音频数据对应的目标音视频数据。

在本发明实施例中,音频数据、视频数据以及音视频数据都携带有时间戳,其中,时间戳是一个字符序列,唯一地标识某一刻的时间。由于音视频数据中的音频数据与音视频数据中的视频数据需进行同步播放,因此,音频数据的时间戳、音视频数据中的视频数据的时间戳和音视频数据的时间戳都和一个时间参考线对应,从而使得音频数据与视频数据能进行同步播放,即是,终端输出音视频数据进行播放时,输出的音频和视频进行同步播放。因此,可根据目标音频数据中的时间戳在音视频数据中获取该时间戳对应的音视频数据,从而将该时间戳对应的音视频数据设为目标音视频数据获取到目标音视频数据。

S103,从所述目标音视频数据中进行提取画面,获得目标画面。

在本发明实施例中,目标音视频数据可包括目标音频数据以及目标视频数据,终端可提取目标音视频数据中所包括的目标视频数据。

当终端获取到目标视频数据后,终端可在目标视频数据中的预置的至少一个位置上提取至少一个画面。其中,至少一个位置可以是目标视频数据中的起点位置、中点位置以及终点位置,进一步的,位置还可以是其他位置,用户可以自行设置。因此,当终端预置的位置包括起点位置、中点位置以及终点位置时,终端可在目标视频数据中的起点位置、中点位置以及终点位置各提取到一张画面作为目标画面进行保存或者进行输出。

进一步的,当终端获取到目标视频数据后,终端可按镜头对目标视频数据进行分段,获取各镜头的视频数据,并从各镜头的视频数据进行提取画面,获得目标画面。其中,终端可从各镜头的视频数据中的预置的至少一个位置上分别提取至少一个画面。其中,至少一个位置可以是各镜头的视频数据中的起点位置、中点位置以及终点位置中的任意一个位置多个位置。进一步的,位置还可以是其他位置,用户可以自行设置。因此,当终端预置的位置包括起点位置、中点位置以及终点位置时,终端可在各镜头的视频数据中的起点位置、中点位置以及终点位置上各提取到一张画面作为目标画面进行保存以及输出。

进一步的,终端还可将上述所提取到的画面作为待处理的提取画面,即可以是,终端可从各镜头的视频数据中分别进行画面提取,获得至少一个待处理的提取画面,其中,终端可计算所获取到的待处理的提取画面的个数,根据待处理的提取画面的个数执行相应的步骤。具体的,当终端仅获取到一个待处理的提取画面时,终端将待处理的提取画面设置为目标画面;当终端获取到至少两个待处理的提取画面时,终端可对所获得的所有待处理的提取画面进行滤除处理,获得目标画面。其中,终端对所获得的所有待处理的提取画面进行滤除处理,获得目标画面可以是:终端在所获得的待处理的提取画面中计算任意两张待处理的提取画面之间的相似度,其中,计算任意两张待处理的提取画面之间的相似度可以是终端分别对该任意两张待处理的提取画面均进行画面检测,计算其内容的相似度。当终端计算出该任意两张待处理的提取画面的相似度后,终端可判断相似度是否大于预设的阈值,当终端判断相似度大于预设的阈值时,终端可滤除该任意两张待处理的提取画面中的任意一张待处理的提取画面,在该任意两张待处理的提取画面中将除该任意一张待处理的提取画面之外的另一张待处理的提取画面设置为目标画面,当终端判断相似度小于或等于预设的阈值时,终端可将该任意两张待处理的提取画面均设置为目标画面。从而终端可获取到目标画面。其中,终端可对所获得的待处理的提取画面分别进行两两组合,从而计算任意两张待处理的提取画面之间的相似度可以是计算每个组合的待处理的提取画面之间的相似度。

在本发明实施例中,当终端获取到目标画面后,终端还可以进行输出目标画面。或者提供给用户制作其他信息,如将目标画面作为精彩画面进行制作视频简介、制作广告等。

进一步的,在本发明实施例中,当终端获取到至少两张目标画面时,终端可所有的目标画面进行视频拼接获得精彩视频并输出精彩视频。同时,终端还可根据目标画面的个数获得精彩视频的播放时间,并在播放时间内进行播出目标视频。

在本发明实施例中,终端提取待处理的音视频数据中的音频数据,获取预置的背景音乐特征,在所述音频数据中检测与所述背景音乐特征相匹配的目标音频数据,在所述待处理的音视频数据中获取与所述目标音频数据对应的目标音视频数据,从所述目标音视频数据中进行提取画面,获得目标画面,这可使得终端可自动从音视频数据中提取到目标画面,可提高从音视频数据中的提取目标画面的效率,降低提取成本。

参见图2,是本发明实施例提供的一种终端的一种实施例流程示意图。本发明实施例的一种终端包括:

提取单元100,用于提取待处理的音视频数据中的音频数据。

检测单元200,用于获取预置的背景音乐特征,在所述音频数据中检测与所述背景音乐特征相匹配的目标音频数据。

获取单元300,用于在所述待处理的音视频数据中获取与所述目标音频数据对应的目标音视频数据。

提取画面单元400,用于从所述目标音视频数据中进行提取画面,获得目标画面。

在本发明实施例中,音视频数据由音频数据以及视频数据组成,音视频数据可以通过声音播放器输出音频以及视频播放器输出视频,如音视频数据可以是电视播放的具有声音输出的节目内容、手机上具有声音输出的录像等音视频数据。

在本发明实施例中,待处理的音视频数据为用户选择所要进行处理的音视频数据,如终端接收到的音视频数据可以作为待处理的音视频数据,或者终端可以存储多个音视频数据,用户从中选择一个音视频数据作为待处理的音视频数据。

在本发明实施例中,当终端确定待处理的音视频数据,提取单元100可对待处理的音视频数据进行解码,提取待处理的音视频数据所包括的音频数据。

在本发明实施例中,音频数据中可包括多种类型音频数据,如背景音乐类型的音频数据、旁白类型的音频数据和静音类型的音频数据等类型音频数据。

在本发明实施例中,由于音视频中的目标画面一般出现在有背景音乐的音视频数据中,因此,检测单元200可对音频数据进行识别出有背景音乐的音频数据,从而进行处理获得目标画面。

在本发明实施例中,检测单元200可对音频数据进行识别出有背景音乐的音频数据可以是:检测单元200获取预置背景音乐特征,在音频数据中检测与背景音乐特征匹配的音频数据,当检测到与背景音乐特征匹配的音频数据时,提取与背景音乐特征匹配的音频数据,将与背景音乐特征匹配的音频数据作为目标音频数据。其中,预置的背景音乐特征可以是用户进行预置存储。具体的,检测单元200在音频数据中检测与背景音乐特征相匹配的目标音频数据可以是:检测单元200对音频数据进行划分,获得至少一段音频数据,其中,可以是按时间段进行划分,如以1s的时间段对音频数据进行划分,每个分段的音频数据的播放时间为1s。当检测单元200对音频数据进行划分后,检测单元200可对每段音频数据分别进行特征提取,获得每段音频数据对应的特征数据,然后在每段音频数据对应的特征数据中获取与背景音乐特征匹配的目标特征数据,获取目标特征数据对应的音频数据,将目标特征数据对应的音频数据设置为目标音频数据,其中,当检测单元200获取的目标特征数据有多个时,检测单元200可获取多个目标特征数据各分别对应的多个音频数据,并将多个音频数据进行拼接,获得目标音频数据。

在本发明实施例中,音频数据、视频数据以及音视频数据都携带有时间戳,其中,时间戳是一个字符序列,唯一地标识某一刻的时间。由于音视频数据中的音频数据与音视频数据中的视频数据需进行同步播放,因此,音频数据的时间戳、音视频数据中的视频数据的时间戳和音视频数据的时间戳都和一个时间参考线对应,从而使得音频数据与视频数据能进行同步播放,即是,终端输出音视频数据进行播放时,输出的音频和视频进行同步播放。因此,获取单元300可根据目标音频数据中的时间戳在音视频数据中获取该时间戳对应的音视频数据,从而获取单元300将该时间戳对应的音视频数据设为目标音视频数据获取到目标音视频数据。

在本发明实施例中,目标音视频数据可包括目标音频数据以及目标视频数据,提取画面单元400可提取目标音视频数据中所包括的目标视频数据。

当提取画面单元400获取到目标视频数据后,提取画面单元400可在目标视频数据中的预置的至少一个位置上提取至少一个画面。其中,至少一个位置可以是目标视频数据中的起点位置、中点位置以及终点位置,进一步的,位置还可以是其他位置,用户可以自行设置。因此,当终端预置的位置包括起点位置、中点位置以及终点位置时,提取画面单元400可在目标视频数据中的起点位置、中点位置以及终点位置各提取到一张画面作为目标画面进行保存或者进行输出。

进一步的,当提取画面单元400获取到目标视频数据后,提取画面单元400可按镜头对目标视频数据进行分段,获取各镜头的视频数据,并从各镜头的视频数据进行提取画面,获得目标画面。其中,提取画面单元400可从各镜头的视频数据中的预置的至少一个位置上分别提取至少一个画面。其中,至少一个位置可以是各镜头的视频数据中的起点位置、中点位置以及终点位置中的任意一个位置多个位置。进一步的,位置还可以是其他位置,用户可以自行设置。因此,当终端预置的位置包括起点位置、中点位置以及终点位置时,提取画面单元400可在各镜头的视频数据中的起点位置、中点位置以及终点位置上各提取到一张画面作为目标画面进行保存以及输出。

进一步的,提取画面单元400还可将上述所提取到的画面作为待处理的提取画面,即可以是,提取画面单元400可从各镜头的视频数据中分别进行画面提取,其中,提取单元400可计算所获取到的待处理的提取画面的个数,根据待处理的提取画面的个数执行相应的步骤。具体的,当提取单元400仅获取到一个待处理的提取画面时,提取单元400将待处理的提取画面设置为目标画面;当提取单元400获取到至少两个待处理的提取画面时,提取画面单元400可对所获得的所有待处理的提取画面进行滤除处理,获得目标画面。其中,提取画面单元400对所获得的所有待处理的提取画面进行滤除处理,获得目标画面可以是:提取画面单元400在所获得的待处理的提取画面中计算任意两张待处理的提取画面之间的相似度,其中,计算任意两张待处理的提取画面之间的相似度可以是终端分别对该任意两张待处理的提取画面均进行画面检测,计算其内容的相似度。当提取画面单元400计算出该任意两张待处理的提取画面的相似度后,提取画面单元400可判断相似度是否大于预设的阈值,当提取画面单元400判断相似度大于预设的阈值时,提取画面单元400可滤除该任意两张待处理的提取画面中的任意一张待处理的提取画面,将在该任意两张待处理的提取画面中除该任意一张待处理的提取画面之外的另一张待处理的提取画面设置为目标画面,当提取画面单元400判断相似度小于或等于预设的阈值时,提取画面单元400可将该任意两张待处理的提取画面均设置为目标画面。从而提取画面单元400可获取到目标画面。其中,提取画面单元400可对所获得的待处理的提取画面分别进行两两组合,从而计算任意两张待处理的提取画面之间的相似度可以是计算每个组合的待处理的提取画面之间的相似度。

在本发明实施例中,当提取画面单元400获取到目标画面后,终端还可以进行输出目标画面。或者提供给用户制作其他信息,如将目标画面作为精彩画面进行制作视频简介、制作广告等。

进一步的,在本发明实施例中,当提取画面单元400获取到至少两张目标画面时,终端可所有的目标画面进行视频拼接获得精彩视频并输出精彩视频。同时,终端还可根据目标画面的个数获得精彩视频的播放时间,并在播放时间内进行播出目标视频。

其中,所述检测单元200包括:

获取特征子单元,用于获取预置的背景音乐特征;

第一划分子单元,用于对所述音频数据进行划分,获得至少一段音频数据;

第一提取子单元,用于对每段音频数据分别进行特征提取,获得每段音频数据对应的特征数据;

获取子单元,用于在所述每段音频数据对应的特征数据中获取与所述背景音乐特征匹配的目标特征数据;

第一设置子单元,用于获取所述目标特征数据对应的音频数据,将所述目标特征数据对应的音频数据设置为目标音频数据。

所述提取画面单元400包括:

第二提取子单元,用于提取所述目标音视频数据中的目标视频数据;

第二划分子单元,用于对所述目标视频数据进行镜头划分,获得各镜头的视频数据;

第三提取子单元,用于从所述各镜头的视频数据中分别进行画面提取,获得至少一个目标画面。

所述第三提取子单元包括:

第三提取子单元,用于从所述各镜头的视频数据中分别进行提取画面,获得至少一个待处理的提取画面;

第二设置子单元,用于当仅获取到一个待处理的提取画面时,将所述待处理的提取画面设置为目标画面;

处理子单元,用于当获取到至少两个待处理的提取画面时,对所述至少两个待处理的提取画面进行滤除处理,获得所述至少一个目标画面。

所述滤除子单元包括:

计算子单元,用于在所述至少一个待处理的提取画面中计算任意两张待处理的提取画面之间的相似度;

判断子单元,用于判断所述相似度是否大于预设的阈值;

滤除子单元,用于当所述判断子单元判断所述相似度大于预设的阈值时,滤除所述任意两张待处理的提取画面中的任意一张待处理的提取画面,在所述任意两张待处理的提取画面中将除所述任意一张待处理的提取画面之外的另一张待处理的提取画面设置为所述目标画面;

第三设置子单元,用于当所述判断子单元判断所述相似度小于预设的阈值时,将所述任意两张待处理的提取画面均设置为所述目标画面。

所述终端还包括:

拼接单元,用于将至少两个目标画面进行视频拼接,获得精彩视频并输出所述精彩视频。

其中,可以理解的是,本实施例的终端中的单元的各功能模块的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上述方法实施例的相关描述,此处不再进行赘述。

在本发明实施例中,终端提取待处理的音视频数据中的音频数据,获取预置的背景音乐特征,在所述音频数据中检测与所述背景音乐特征相匹配的目标音频数据,在所述待处理的音视频数据中获取与所述目标音频数据对应的目标音视频数据,从所述目标音视频数据中进行提取画面,获得目标画面,这可使得终端可自动从音视频数据中提取到目标画面,可提高从音视频数据中的提取目标画面的效率,降低提取成本。

请参见图3,为本发明一种终端的另一种实施例流程示意图。如图3所示,本实施例所述的一种终端包括:

壳体301、处理器302、存储器303、电路板307和电源电路305,其中,电路板307安置在壳体301围成的空间内部,处理器302和存储器303设置在电路板307上;电源电路305,用于为终端的各个电路或器件供电;存储器303用于存储可执行程序代码;处理器302通过读取存储器303中存储的可执行程序代码来运行与可执行程序代码对应的程序,以用于执行以下步骤:

提取待处理的音视频数据中的音频数据;

获取预置的背景音乐特征,在所述音频数据中检测与所述背景音乐特征相匹配的目标音频数据;

在所述待处理的音视频数据中获取与所述目标音频数据对应的目标音视频数据;

从所述目标音视频数据中进行提取画面,获得目标画面。

其中,所述处理器302获取预置的背景音乐特征,在所述音频数据中检测与所述背景音乐特征相匹配的目标音频数据包括:

获取预置的背景音乐特征;

对所述音频数据进行划分,获得至少一段音频数据;

对每段音频数据分别进行特征提取,获得每段音频数据对应的特征数据;

在所述每段音频数据对应的特征数据中获取与所述背景音乐特征匹配的目标特征数据;

获取所述目标特征数据对应的音频数据,将所述目标特征数据对应的音频数据设置为目标音频数据。

其中,所述处理器302从所述目标音视频数据中进行提取画面,获得目标画面包括:

提取所述目标音视频数据中的目标视频数据;

对所述目标视频数据进行镜头划分,获得各镜头的视频数据;

从所述各镜头的视频数据中分别进行画面提取,获得至少一个目标画面。

其中,所述处理器302从所述各镜头的视频数据中分别进行提取画面,获得至少一个目标画面包括:

从所述各镜头的视频数据中分别进行提取画面,获得至少一个待处理的提取画面;

当仅获取到一个待处理的提取画面时,将所述待处理的提取画面设置为目标画面;

当获取到至少两个待处理的提取画面时,对所述至少两个待处理的提取画面进行滤除处理,获得所述至少一个目标画面。

其中,所述处理器302对所述至少两个待处理的提取画面进行滤除处理,获得所述至少一个目标画面包括:

在所述至少两个待处理的提取画面中计算任意两张待处理的提取画面之间的相似度;

判断所述相似度是否大于预设的阈值;

当所述相似度大于预设的阈值时,滤除所述任意两张待处理的提取画面中的任意一张待处理的提取画面,在所述任意两张待处理的提取画面中将除所述任意一张待处理的提取画面之外的另一张待处理的提取画面设置为所述目标画面;

当所述相似度小于预设的阈值时,将所述任意两张待处理的提取画面均设置为所述目标画面。

其中,在所述处理器302从所述目标音视频数据中进行提取画面,获得目标画面之后,所述处理器302还执行:

将至少两个目标画面进行视频拼接,获得精彩视频并输出所述精彩视频。

可以理解的是,本实施例的终端的各功能模块的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上述方法实施例的相关描述,此处不再进行赘述。

在本发明实施例中,终端提取待处理的音视频数据中的音频数据,获取预置的背景音乐特征,在所述音频数据中检测与所述背景音乐特征相匹配的目标音频数据,在所述待处理的音视频数据中获取与所述目标音频数据对应的目标音视频数据,从所述目标音视频数据中进行提取画面,获得目标画面,这可使得终端可自动从音视频数据中提取到目标画面,可提高从音视频数据中的提取目标画面的效率,降低提取成本。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。

以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1