多媒体拼接方法、装置、终端及存储介质与流程

文档序号:18161971发布日期:2019-07-13 09:22阅读:188来源:国知局
多媒体拼接方法、装置、终端及存储介质与流程

本发明涉及计算机技术领域,尤其涉及一种多媒体拼接方法、装置、终端及存储介质。



背景技术:

多媒体数据是多种媒体数据的综合,一般包括文本、声音以及图像等多种媒体形式。在多媒体数据的播放应用中,通常存在一些播放场景需要把多个多媒体数据中的精彩片段拼接起来以形成新的多媒体数据。以多媒体数据为音乐为例,通常在音乐合辑、音乐串烧、音乐榜单等播放场景下,需要把多首音乐中的精彩片段拼接起来以形成新的音乐,供用户播放。在实现本发明过程中,发明人发现现有技术存在如下问题,大部分的拼接依赖于歌曲标签进行拼接或者由音乐专业人员设计拼接方式。因此,如何更好地、无缝地、平滑地拼接多媒体数据成为了研究热点。



技术实现要素:

本发明实施例提供了一种多媒体拼接方法、装置、终端及存储介质,可更好地拼接多媒体数据,提高拼接得到的多媒体数据的拼接合理度。

一方面,本发明实施例提供了一种多媒体拼接方法,包括:

获取待拼接的多媒体集合,所述多媒体集合中包括至少两个多媒体数据,所述多媒体数据包括初始片段、结尾片段以及待拼接片段;

对所述多媒体集合中的至少两个多媒体数据进行排列,得到多个排序集合,任意两个排序集合中的多媒体数据的排列顺序不同;

计算所述多个排序集合的每一个排序集合的拼接合理度衡量值,所述每一个排序集合的拼接合理度衡量值是根据排序集合中相邻的多媒体数据的初始片段和结尾片段之间的相似度计算得到;

将所述多个排序集合的拼接合理度衡量值满足预设条件的排序集合作为目标排序集合;

按照所述目标排序集合中的多媒体数据的排列顺序对所述各多媒体数据的待拼接片段进行拼接。

另一方面,本发明实施例提供了一种多媒体拼接装置,包括:

获取单元,用于获取待拼接的多媒体集合,所述多媒体集合中包括至少两个多媒体数据,所述多媒体数据包括初始片段、结尾片段以及待拼接片段;

排列单元,用于对所述多媒体集合中的至少两个多媒体数据进行排列,得到多个排序集合,任意两个排序集合中的多媒体数据的排列顺序不同;

计算单元,用于计算所述多个排序集合的每一个排序集合的拼接合理度衡量值,所述每一个排序集合的拼接合理度衡量值是根据排序集合中相邻的多媒体数据的初始片段和结尾片段之间的相似度计算得到;

拼接单元,用于将所述多个排序集合的拼接合理度衡量值满足预设条件的排序集合作为目标排序集合;

所述拼接单元,还用于按照所述目标排序集合中的多媒体数据的排列顺序对所述各多媒体数据的待拼接片段进行拼接。

再一方面,本发明实施例提供一种智能终端,包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备、输出设备和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如下步骤:

获取待拼接的多媒体集合,所述多媒体集合中包括至少两个多媒体数据,所述多媒体数据包括初始片段、结尾片段以及待拼接片段;

对所述多媒体集合中的至少两个多媒体数据进行排列,得到多个排序集合,任意两个排序集合中的多媒体数据的排列顺序不同;

计算所述多个排序集合的每一个排序集合的拼接合理度衡量值,所述每一个排序集合的拼接合理度衡量值是根据排序集合中相邻的多媒体数据的初始片段和结尾片段之间的相似度计算得到;

将所述多个排序集合的拼接合理度衡量值满足预设条件的排序集合作为目标排序集合;

按照所述目标排序集合中的多媒体数据的排列顺序对所述各多媒体数据的待拼接片段进行拼接。

再一方面,本发明实施例提供一种计算机存储介质,该计算机存储介质存储有计算机程序指令,该计算机程序指令被执行时用于实现上述的多媒体拼接方法。

本发明实施例可以获取多媒体集合所对应的多个排序集合,并根据多媒体集合中的各多媒体数据的初始片段和结尾片段计算多个排序集合的拼接合理度衡量值。根据各多媒体数据的初始片段和结尾片段计算出的拼接合理度衡量值,可以在一定程度上反映出各多媒体数据中的待拼接片段之间的拼接合理度。根据拼接合理度衡量值选取目标排序集合,并按照目标排序集合的排列顺序对各多媒体数据的待拼接片段进行拼接,可以使得拼接得到的多媒体数据更流畅、自然、平滑,提高用户体验。

附图说明

为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1a是本发明实施例提供的一种多媒体拼接方法的拼接示意图;

图1b是本发明实施例提供的一种多媒体拼接方法的应用场景图;

图2是本发明实施例提供的一种多媒体拼接方法的流程示意图;

图3是本发明实施例提供的一种多媒体数据的结构示意图;

图4是本发明另一实施例提供的一种多媒体拼接方法的流程示意图;

图5是本发明实施例提供的另一种多媒体数据的结构示意图;

图6是本发明实施例提供的一种相似度计算方法的示意图;

图7是本发明实施例提供的一种过渡多媒体数据的结构示意图;

图8是本发明实施例提供的一种多媒体插入的方法示意图;

图9是本发明实施例提供的一种多媒体拼接装置的结构示意图;

图10是本发明实施例提供的一种智能终端的结构示意图。

具体实施方式

在本发明实施例中,针对待拼接的多媒体集合,该多媒体集合中包括至少两个多媒体数据,此处的多媒体数据可以包括音乐和/或视频,提供一种多媒体拼接方法以实现对多个多媒体数据中的待拼接片段进行拼接,得到拼接的多媒体数据,即该拼接的多媒体数据中可以包括该多媒体集合中的各个多媒体数据的待拼接片段。其中,待拼接片段可以是指对多媒体数据中的精彩部分进行标注的片段,每个多媒体数据中的待拼接片段的时长可以相同,也可以不同;所谓的精彩部分可以包括以下至少一项:多媒体数据中点击率最高的部分、多媒体数据中出现次数最多的部分,等等;例如,多媒体数据a的总时长为50秒,其中第30秒到第40秒之间的部分的出现次数最多,则精彩部分为第30秒到第40秒,那么对该精彩部分进行标注所得到的待拼接片段为多媒体数据a中的第30秒到第40秒所构成的片段。当用户在多媒体合辑、多媒体串烧或者多媒体榜单等应用场景下播放多媒体数据时,终端可以为用户播放该拼接的多媒体数据,以供用户欣赏各个多媒体数据中的精彩部分。

例如,多媒体数据集合中包括了4个多媒体数据,分别是:多媒体数据1、多媒体数据2、多媒体数据3以及多媒体数据4,该多媒体集合中的4个多媒体数据的待拼接片段分别是:待拼接片段1、待拼接片段2、待拼接片段3以及待拼接片段4。终端可以采用多媒体拼接方法对这4个多媒体数据的待拼接片段进行拼接处理,得到拼接的多媒体数据,该拼接的多媒体数据中包括了待拼接片段1、待拼接片段2、待拼接片段3以及待拼接片段4,如图1a所示。用户可以点击多媒体播放应用中的“多媒体串烧”菜单,终端检测到用户的点击操作之后,可以为用户播放该拼接的多媒体数据,如图1b所示。

基于上述的描述,本发明实施例在图2中提出了一种多媒体拼接方法的示意流程图。本发明实施例的所述方法可以由一个终端来实现,例如智能手机、平板电脑等移动智能终端,以及台式电脑等,也可以由运行在终端中的应用程序来实现,例如运行在终端中的多媒体的播放应用程序,等等。为了便于描述,本发明实施例以终端执行该多媒体拼接方法为例。

终端在进行多媒体拼接时,可以在s201中获取待拼接的多媒体集合,该多媒体集合中包括至少两个多媒体数据,该多媒体数据包括初始片段、结尾片段以及待拼接片段;待拼接片段可位于初始片段和结尾片段之间。其中,待拼接片段是指对多媒体数据中的精彩部分进行标注的片段;初始片段是指多媒体数据中位于待拼接片段之前且与待拼接片段相邻或者相交的片段;结尾片段是指多媒体数据中位于待拼接片段之后且与待拼接片段相邻或者相交的片段。以初始片段和结尾片段均与待拼接片段相交为例,多媒体数据a中的第30秒到第50秒是多媒体数据a的精彩部分,那么待拼接片段为第30秒至第50秒之间的片段,初始片段可以是第25秒至第35秒之间的片段,结尾片段可以是第45秒至第55秒之间的片段,如图3所示。

在获取待拼接的多媒体集合时,针对任意一个待拼接的多媒体数据,首先可以标注出待拼接的多媒体数据的待拼接片段。其次,可以根据待拼接片段分别确定出待拼接的多媒体数据的初始片段和结尾片段。然后,可以将确定出初始片段、待拼接片段以及结尾片段的待拼接的多媒体数据添加至待拼接的多媒体集合。在一种实施方式中,可以将确定出初始片段、待拼接片段以及结尾片段的待拼接的多媒体数据直接添加至待拼接的多媒体集合,即通过该实施方式所得到的待拼接的多媒体集合中的多媒体数据可以不止包括初始片段、结尾片段以及待拼接片段,还可以包括其他片段,例如图3所示的第0秒至第25秒之间的片段,以及第55秒至第60秒之间的片段。再一种实施方式中,也可以截取出待拼接的多媒体数据的初始片段、待拼接片段以及结尾片段,将截取出的这三个片段作为一个多媒体数据添加至待拼接的多媒体集合中,即通过该实施方式所得到的待拼接的多媒体集合中的多媒体数据只包括初始片段、结尾片段以及待拼接片段。

在获取到待拼接的多媒体集合之后,可以在s202中对多媒体集合中的至少两个多媒体数据进行排列,得到多个排序集合,任意两个排序集合中的多媒体数据的排列顺序不同。具体的,终端在获取到多媒体集合后,可以对多媒体集合中的各个多媒体数据按照不同的拼接顺序进行排列,得到多个排序集合;此处的排列可以为随机排列,也可以为全排列,本发明实施例对此不作限定。以全排列为例,多媒体集合中总共有3个多媒体数据,分别是:多媒体数据a、多媒体数据b以及多媒体数据c,那么对3个多媒体数据按照不同的拼接顺序进行全排列,可以得到如表1所示的多个排序集合。

表1

在得到多个排序集合之后,可以在s203中计算多个排序集合的每一个排序集合的拼接合理度衡量值,每一个排序集合的拼接合理度衡量值是根据排序集合中相邻的多媒体数据的初始片段和结尾片段之间的相似度计算得到;所谓的拼接合理度衡量值是一个可反映排序集合的拼接顺序是否合理的衡量值,拼接顺序是否合理可以根据排序集合中的相邻的多媒体数据的待拼接片段给用户带来的视觉差异或者听觉差异来体现。相邻的多媒体数据的待拼接片段在播放过程中给用户带来的视觉差异或者听觉差异越小,该排序集合的拼接顺序越合理。例如,表1中的排序集合1中的相邻的多媒体数据包括多媒体数据a和多媒体数据b,多媒体数据a中的待拼接片段为慢节奏的古典音乐,多媒体数据b的待拼接片段也为慢节奏的古典音乐,那么在依次播放多媒体数据a的待拼接片段和多媒体数据b的待拼接片段的过程中给用户带来的听觉差异较小,此时可以认为该排序集合1的拼接顺序合理;又如表1中排序集合5中的相邻的多媒体数据包括多媒体数据c和多媒体数据a,多媒体数据c的待拼接片段为快节奏的嘻哈音乐,多媒体数据a的待拼接片段为慢节奏的古典音乐,那么在依次播放多媒体数据c的待拼接片段和多媒体数据a的待拼接片段的过程中给用户带来的听觉差异较大,此时可以认为该排序集合5的拼接顺序不合理。

在计算得到多个排序集合的拼接合理度衡量值之后,可以在s204中将多个排序集合的拼接合理度衡量值满足预设条件的排序集合作为目标排序集合。在一种实施方式中,将多个排序集合的拼接合理度衡量值满足预设条件的排序集合作为目标排序集合的具体实施方式可以是:从多个排序集合的拼接合理度衡量值中确定最大拼接合理度衡量值;将多个排序集合中的最大拼接合理度衡量值所对应的排序集合作为目标排序集合。再一种实施方式中,将多个排序集合的拼接合理度衡量值满足预设条件的排序集合作为目标排序集合的具体实施方式可以是:将各个排序集合的拼接合理度衡量值与预设合理度阈值进行比较;将拼接合理度衡量值大于预设合理度衡量值的排序集合作为候选排序集合;从多个候选排序集合中任意选取一个候选排序集合作为目标排序集合。

在确定出目标排序集合之后,可以在s205中按照目标排序集合中的多媒体数据的排列顺序对各多媒体数据的待拼接片段进行拼接。对各多媒体数据的待拼接片段进行拼接,可以得到一个拼接的多媒体数据。在一种实施方式中,若拼接的多媒体数据中的相邻两个待拼接片段的相似度较小,则终端还可以获取过渡多媒体数据,将过渡多媒体数据插入至相似度较小的两个待拼接片段之间,以提高拼接的多媒体数据的流畅自然度。终端在检测到多媒体播放指令之后,可以为用户播放该拼接的多媒体数据。

本发明实施例可以获取多媒体集合所对应的多个排序集合,并根据多媒体集合中的各多媒体数据的初始片段和结尾片段计算多个排序集合的拼接合理度衡量值。根据各多媒体数据的初始片段和结尾片段计算出的拼接合理度衡量值,可以在一定程度上反映出各多媒体数据中的待拼接片段之间的拼接合理度。根据拼接合理度衡量值选取目标排序集合,并按照目标排序集合的排列顺序对各多媒体数据的待拼接片段进行拼接,可以使得拼接得到的多媒体数据更流畅、自然、平滑,提高用户体验。

再一个实施例中,本发明实施例在图4中提出了另一种多媒体拼接方法的示意流程图。本发明实施例的所述方法可以由一个终端来实现,例如智能手机、平板电脑等移动智能终端,以及台式电脑等,也可以由运行在终端中的应用程序来实现,例如运行在终端中的多媒体的播放应用程序,等等。为了便于描述,本发明实施例以终端执行该多媒体拼接方法为例。

终端在进行多媒体拼接时,可以在s401中获取待拼接的多媒体集合,该多媒体集合中包括至少两个多媒体数据,该多媒体数据包括初始片段、结尾片段以及待拼接片段,待拼接片段位于初始片段和结尾片段之间。在获取待拼接的多媒体集合的过程中:首先,可以获取待拼接的多媒体数据,该待拼接的多媒体数据包括待拼接片段;该待拼接片段可以是由专业的标注人员预先对待拼接的多媒体数据进行标注得到,也可以是由终端获取待拼接的多媒体数据中满足标注条件的部分并对满足标注条件的部分进行标注得到,此处的标注条件可以包括但不限于:点击率最高的部分、出现次数最多的部分,等等。

其次,可以获取预设的时间匹配参数(用e表示),以及待拼接片段的开始时刻和结束时刻;所述时间匹配参数是一个用于对待拼接的多媒体数据进行分段处理的参数,时间匹配参数的取值可以根据经验值设置,例如e取值为10秒。然后根据开始时刻、结束时刻和时间匹配参数,确定待拼接的多媒体数据的初始片段和结尾片段;并将确定出初始片段、结尾片段以及待拼接片段的待拼接的多媒体数据添加至待拼接的多媒体集合。

在一种实施方式中,若初始片段是位于待拼接片段之前且与待拼接片段相邻的片段,结尾片段是位于待拼接片段之后且与待拼接片段相邻的片段,则根据开始时刻、结束时刻和时间匹配参数,确定待拼接的多媒体数据的初始片段和结尾片段的具体实施方式可以是:在待拼接片段的开始时刻往前选取时长等于时间匹配参数的片段作为初始片段,在待拼接片段的结束时刻往后选取时长等于时间匹配参数的片段作为结尾片段。再一种实施方式中,若初始片段是位于待拼接片段之前且与待拼接片段相交的片段,结尾片段是位于待拼接片段之后且与待拼接片段相交的片段,则根据开始时刻、结束时刻和时间匹配参数,确定待拼接的多媒体数据的初始片段和结尾片段的具体实施方式可以是:在待拼接片段的开始时刻往前选取时长等于时间匹配参数的片段作为第一子片段,并在待拼接片段的开始时刻往后选取时长等于时间匹配参数的片段作为第二子片段,采用第一子片段和第二子片段构建初始片段;在待拼接片段的结束时刻往前选取时长等于时间匹配参数的片段作为第三子片段,并在待拼接片段的结束时刻往后选取时长等于时间匹配参数的片段作为第四子片段,采用第三子片段和第四子片段构建结尾片段。例如,在待拼接的多媒体数据中,从时间c至时间d所构成的片段为待拼接片段f,时间匹配参数为e,那么从时间c-e至时间c所构成的片段g为第一子片段,从时间c至时间c+e所构成的片段h为第二子片段,第一子片段和第二子片段构成初始片段;从时间d-e至时间d所构成的片段i为第三子片段,从时间d至时间d+e所构成的片段j为第四子片段,第三子片段和第四子片段构成结尾片段,如图5所示。

在获取到待拼接的多媒体集合之后,终端可以在s402中对多媒体集合中的至少两个多媒体数据进行排列,得到多个排序集合。并在s403中计算多个排序集合的每一个排序集合的拼接合理度衡量值,每一个排序集合的拼接合理度衡量值是根据排序集合中相邻的多媒体数据的初始片段和结尾片段之间的相似度计算得到。多个排序集合中包括参考排序集合,该参考排序集合为多个排序集合中的任意一个排序集合;相应的,终端在计算多个排序集合的每一个排序集合的拼接合理度衡量值时,可以根据参考排序集合中各多媒体数据的初始片段和结尾片段,计算参考排序集合中的相邻的多媒体数据之间的相似度。参考排序集合中的相邻的多媒体数据之间的相似度包括:参考排序集合中的第一多媒体数据的结尾片段和第二多媒体数据的初始片段之间的相似度,第一多媒体数据和第二多媒体数据在参考排序集合中是相邻的,即第一多媒体数据和第二多媒体数据可构成相邻的多媒体数据;求取参考排序集合中的所有相邻的多媒体数据之间的相似度之和作为参考排序集合的拼接合理度衡量值。在其他实施例中,若业务需求包括循环播放拼接的多媒体数据,则在计算多个排序集合的每一个排序集合的拼接合理度衡量值时,排序集合中的最后一个多媒体数据和第一个多媒体数据被定义为相邻的多媒体数据,即排序集合的拼接合理度衡量值包括最后一个多媒体数据和第一个多媒体数据之间的相似度。

在一种实施方式中,在计算相邻的多媒体数据中的第一多媒体数据的结尾片段和第二多媒体数据的初始片段之间的相似度时,可以先采用特征矩阵算法计算出相邻的多媒体数据中的第一多媒体数据的结尾片段的特征向量矩阵以及第二多媒体数据的初始片段的特征向量矩阵,此处的特征矩阵算法可以包括但不限于:傅里叶变换、常数q变换等视频变换算法、梅尔倒谱系数等音频特征算法、神经网络等机器学习算法,等等。然后采用相似度算法计算第一多媒体数据的结尾片段的特征向量矩阵与第二多媒体数据的初始片段的特征向量矩阵之间的相似度,将计算得到的相似度作为第一多媒体数据的结尾片段和第二多媒体数据的初始片段之间的相似度,此处的相似度算法可以包括但不限于:余弦相似度算法、欧式距离算法、神经网络等机器学习算法,等等。为了便于描述,本发明实施例所提及的相似度可用b表示,并且b满足b>0且b<1。

再一种实施方式中,多媒体数据的初始片段可以包括第一子片段和第二子片段,第二子片段为多媒体数据的待拼接片段和多媒体数据的初始片段相交的片段,多媒体数据的结尾片段包括第三子片段和第四子片段,第三子片段为多媒体数据的待拼接片段和多媒体数据的结尾片段相交的片段。相应的,第一多媒体数据的结尾片段和第二多媒体数据的初始片段之间的相似度是根据第一相似度和第二相似度计算得到的;其中,第一相似度为第一多媒体数据的第三子片段和第二多媒体数据的第一子片段的相似度,第二相似度为第一多媒体数据的第四子片段和第二多媒体数据的第二子片段的相似度。那么,在计算相邻的多媒体数据中的第一多媒体数据的结尾片段和第二多媒体数据的初始片段之间的相似度时,可以采用特征矩阵算法计算出第一多媒体数据的第三子片段的特征向量矩阵和第四子片段的特征向量矩阵,以及第二多媒体数据的第一子片段的特征向量矩阵和第二子片段的特征向量矩阵;采用相似度算法计算第一多媒体数据的第三子片段的特征向量矩阵与第二多媒体数据的第一子片段的特征向量矩阵之间的第一相似度,以及第一多媒体数据的第四子片段的特征向量矩阵与第二多媒体数据的第二子片段的特征向量矩阵之间的第二相似度;求取第一相似度和第二相似度之和作为第一多媒体数据的结尾片段和第二多媒体数据的初始片段之间的相似度。

如图6所示,用k表示第一多媒体数据,则第一多媒体数据的第三子片段的特征向量矩阵可以表示为k.i,第四子片段的特征向量矩阵可以表示为k.j;用l表示第二多媒体数据,则第二多媒体数据的第一子片段的特征向量矩阵可以表示为l.g,第二子片段的特征向量矩阵可以表示为l.h;那么第一相似度可以表示为b(k.i,l.g),第二相似度可以表示为b(k.j,l.h),第一多媒体数据的结尾片段和第二多媒体数据的初始片段之间的相似度m可以表示为:m=b(k.i,l.g)+b(k.j,l.h)。

在计算得到多个排序集合的拼接合理度衡量值之后,可以在s404中将多个排序集合的拼接合理度衡量值满足预设条件的排序集合作为目标排序集合。终端可以根据多个排序集合的拼接合理度衡量值从多个排序集合中选取拼接合理度衡量值最大的排序集合作为目标排序集合。然后在s405中判断目标排序集合中是否存在相邻的第三多媒体数据和第四多媒体数据之间的相似度小于预设阈值,该预设阈值可以根据经验值或者实际业务需求设置,例如预设阈值设置为0.5。需要说明的是,第一多媒体数据和第三多媒体数据可以是同一个多媒体数据,第二多媒体数据和第四多媒体数据可以是同一个多媒体数据。例如,若第一多媒体数据和第二多媒体数据之间的相似度小于预设阈值,则此时的第一多媒体数据与第三多媒体数据相同,第二多媒体数据与第四多媒体数据相同。

实践表明,若相邻的第三多媒体数据和第四多媒体数据之间的相似度小于预设阈值,则说明该第三多媒体数据的结尾片段和第四多媒体数据的初始片段之间的相似性较低,即流畅自然度较低。此时若将第三多媒体数据的待拼接片段和第四多媒体数据的待拼接片段直接拼接,则会给用户带来较大的听觉差异或者视觉差异,导致用户体验较差。因此可以获取目标过渡多媒体数据插入至第三多媒体数据和第四多媒体数据之间,以提高流畅自然度;若相邻的第三多媒体数据和第四多媒体数据之间的相似度不小于预设阈值,则说明该第三多媒体数据的结尾片段和第四多媒体数据的初始片段之间的相似性较高,即流畅自然度较高,此时可以直接将第三多媒体数据的待拼接片段和第四多媒体数据的待拼接片段进行拼接。

因此,若存在,则在s406中获取目标过渡多媒体数据,并根据目标过渡多媒体数据和目标排序集合的多媒体数据的排列顺序对各多媒体数据的待拼接片段进行拼接。若不存在,则在s407中按照目标排序集合中的多媒体数据的排列顺序对各多媒体数据的待拼接片段进行拼接。具体的,可以按照目标排序集合的多媒体数据的排列顺序将各多媒体数据的待拼接片段进行拼接。

其中,步骤s406中获取目标过渡多媒体数据的具体实施方式可包括如下步骤s11-s14:

s11,获取过渡多媒体集合,该过渡多媒体集合中包括至少两个过渡多媒体数据,过渡多媒体数据包括过渡片段。在一个实施例中,过渡多媒体数据还可包括开始片段和结束片段。其中,开始片段可以是位于过渡片段之前且与过渡片段相交或相邻的片段,结束片段可以是位于过渡片段之后且与过渡片段相交或相邻的片段。

首先,可以标注出过渡多媒体数据的过渡片段;其次,可以根据过渡片段分别确定出过渡多媒体数据的开始片段和结束片段。在一种实施方式中,若开始片段是位于过渡片段之前且与过渡片段相邻的片段,结束片段是位于过渡片段之后且与过渡片段相邻的片段,则根据过渡片段确定过渡多媒体数据的开始片段和结束片段的具体实施方式可以是:获取预设的时间匹配时长(用e表示),该时间匹配时长是一个用于对过渡多媒体数据进行分段处理的时长,时间匹配时长的取值可以根据经验值设置,例如e取值为10秒;在过渡片段的开始时刻往前选取时长等于时间匹配时长的片段作为开始片段,在过渡片段的结束时刻往后选取时长等于时间匹配时长的片段作为结束片段。

再一种实施方式中,若开始片段是位于过渡片段之前且与过渡片段相交的片段,结束片段是位于过渡片段之后且与过渡片段相交的片段,则根据过渡片段确定过渡多媒体数据的开始片段和结束片段的具体实施方式可以是:获取预设的时间匹配时长;在过渡片段的开始时刻往前选取时长等于时间匹配时长的片段作为第一匹配片段,并在过渡片段的开始时刻往后选取时长等于时间匹配时长的片段作为第二匹配片段,采用第一匹配片段和第二匹配片段构建开始片段;在过渡片段的结束时刻往前选取时长等于时间匹配时长的片段作为第三匹配片段,并在过渡片段的结束时刻往后选取时长等于时间匹配时长的片段作为第四匹配片段,采用第三匹配片段和第四匹配片段构建结束片段。例如,在过渡多媒体数据中,从时间e至时间end-e所构成的片段为过渡片段o,时间匹配时长为e,那么从时间0-e至时间e所构成的片段p为第一匹配片段,从时间e至时间e+e所构成的片段q为第二匹配片段,第一匹配片段和第二匹配片段构成开始片段;从时间end-e-e至时间end-e所构成的片段r为第三匹配片段,从时间end-e至时间end所构成的片段s为第四匹配片段,第三匹配片段和第四匹配片段构成结束片段,如图7所示。

然后,可以将确定出开始片段、过渡片段以及结束片段的过渡多媒体数据添加至过渡多媒体集合。需要说明的是,时间匹配时长e与上述的时间匹配参数e的取值可以相同,也可以不同。若时间匹配时长e与上述的时间匹配参数e的取值不同,那么在后续的计算过程中,可以根据时间匹配时长e和待拼接片段重新对多媒体集合中的多媒体数据进行片段划分。为了便于描述,本发明实施例以时间匹配时长e与上述的时间匹配参数e的取值相同为例。

s12,根据第三多媒体数据和第四多媒体数据从过渡多媒体集合中确定候选过渡多媒体集合,该候选过渡多媒体集合包括至少一个候选过渡多媒体数据。

过渡多媒体集合中包括待计算的过渡多媒体数据,该待计算的过渡多媒体数据为过渡多媒体集合中的任意一个过渡多媒体数据;相应的,可以计算该待计算的过渡多媒体数据与第三多媒体数据之间的第三相似度,以及待计算的过渡多媒体数据与第四多媒体数据之间的第四相似度;若第三相似度和第四相似度均大于预设阈值,则将该待计算的过渡多媒体数据作为候选过渡多媒体数据并添加至候选过渡多媒体集合。

其中,待计算的过渡多媒体数据与第三多媒体数据之间的第三相似度是指:第三多媒体数据的结尾片段与待计算的过渡多媒体数据的开始片段之间的相似度;待计算的过渡多媒体数据与第四多媒体数据之间的第四相似度是指:待计算的过渡多媒体数据的结束片段与第四多媒体数据的初始片段之间的相似度。在一种实施方式中,待计算的过渡多媒体数据与第三多媒体数据之间的第三相似度是指:第三多媒体数据的第三子片段与待计算的过渡多媒体数据的第一匹配片段之间的相似度,以及第三多媒体数据的第四子片段与待计算的过渡多媒体数据的第二匹配片段之间的相似度之和。待计算的过渡多媒体数据与第四多媒体数据之间的第四相似度是指:待计算的过渡多媒体数据的第三匹配片段与第四多媒体数据的第一子片段之间的相似度,以及待计算的过渡多媒体数据的第四匹配片段与第四多媒体数据的第二子片段之间的相似度之和。

s13,将候选过渡多媒体集合中的各个候选过渡多媒体数据插入至目标排序集合中的第三多媒体数据和第四多媒体数据之间,得到多个插入排序集合。

具体的,可以将候选过渡多媒体集合中的各个候选过渡多媒体数据分别插入至目标排序集合中的第三多媒体数据和第四多媒体数据之间,以得到多个插入排序集合。例如,候选过渡多媒体集合中包括3个候选过渡多媒体数据,分别是候选过渡多媒体数据1、候选过渡多媒体数据2以及候选过渡多媒体数据3;目标排序集合中存在一个相邻的第三多媒体数据和第四多媒体数据之间的相似度小于预设阈值,那么将3个候选过渡多媒体数据分别插入至第三多媒体数据和第四多媒体数据之间,可以得到3个插入排序集合,分别是插入排序集合1、插入排序集合2以及插入排序集合3,如图8所示。

s14,计算各插入排序集合的插入合理度衡量值,并根据各插入排序集合的插入合理度衡量值确定目标过渡多媒体数据。

插入排序集合的插入合理度衡量值是根据目标排序集合中的相邻的多媒体数据之间的相似度、第三多媒体数据与插入排序集合中的候选过渡多媒体数据之间的相似度,以及插入排序集合中的候选多媒体数据与第四多媒体数据之间的相似度计算得到。在一种实施方式中,插入排序集合的插入合理度衡量值为:目标排序集合中的所有相邻的多媒体数据之间的相似度、第三多媒体数据与插入排序集合中的候选过渡多媒体数据之间的相似度,以及插入排序集合中的候选多媒体数据与第四多媒体数据之间的相似度的总和。再一种实施方式中,插入排序集合的插入合理度衡量值为:目标排序集合中除第三多媒体数据和第四多媒体数据以外的相邻的多媒体数据之间的相似度、第三多媒体数据与插入排序集合中的候选过渡多媒体数据之间的相似度,以及插入排序集合中的候选多媒体数据与第四多媒体数据之间的相似度的总和。

其中,第三多媒体数据与插入排序集合中的候选过渡多媒体数据之间的相似度是指:第三多媒体数据的结尾片段与插入排序集合中的过渡多媒体数据的开始片段之间的相似度;插入排序集合中的候选多媒体数据与第四多媒体数据之间的相似度是指:插入排序集合中的过渡多媒体数据的结束片段与第四多媒体数据的初始片段之间的相似度。在一种实施方式中,第三多媒体数据与插入排序集合中的候选过渡多媒体数据之间的相似度是指:第三多媒体数据的第三子片段与插入排序集合中的过渡多媒体数据的第一匹配片段之间的相似度,以及第三多媒体数据的第四子片段与插入排序集合中的过渡多媒体数据的第二匹配片段之间的相似度之和。插入排序集合中的过渡多媒体数据与第四多媒体数据之间的相似度是指:插入排序集合中的过渡多媒体数据的第三匹配片段与第四多媒体数据的第一子片段之间的相似度,以及插入排序集合中的过渡多媒体数据的第四匹配片段与第四多媒体数据的第二子片段之间的相似度之和。

在得到各插入排序集合的插入合理度衡量值之后,可以选取最大插入合理度衡量值所对应的插入排序集合作为目标插入排序集合,并将目标插入排序集合中的过渡多媒体数据作为目标过渡多媒体数据。然后根据目标过渡多媒体数据和目标排序集合的多媒体数据的排列顺序对各多媒体数据的待拼接片段进行拼接。具体的,可以先按照目标排序集合的多媒体数据的排列顺序将各多媒体数据(包括第三多媒体数据和第四多媒体数据)的待拼接片段进行拼接,然后将目标过渡多媒体数据中的过渡片段插入至第三多媒体数据的待拼接片段和第四多媒体数据的待拼接片段之间。

本发明实施例可以获取多媒体集合所对应的多个排序集合,并根据多媒体集合中的各多媒体数据的初始片段和结尾片段计算多个排序集合的拼接合理度衡量值。根据各多媒体数据的初始片段和结尾片段计算出的拼接合理度衡量值,可以在一定程度上反映出各多媒体数据中的待拼接片段之间的拼接合理度。根据拼接合理度衡量值选取目标排序集合,并按照目标排序集合的排列顺序对各多媒体数据的待拼接片段进行拼接,可以使得拼接得到的多媒体数据更流畅、自然、平滑,提高用户体验。

基于上述方法实施例的描述,在一个实施例中,本发明实施例还提供了一种如图9所示的多媒体拼接装置的结构示意图。如图9所示,本发明实施例中的多媒体拼接装置可包括:

获取单元101,用于获取待拼接的多媒体集合,所述多媒体集合中包括至少两个多媒体数据,所述多媒体数据包括初始片段、结尾片段以及待拼接片段;

排列单元102,用于对所述多媒体集合中的至少两个多媒体数据进行排列,得到多个排序集合,任意两个排序集合中的多媒体数据的排列顺序不同;

计算单元103,用于计算所述多个排序集合的每一个排序集合的拼接合理度衡量值,所述每一个排序集合的拼接合理度衡量值是根据排序集合中相邻的多媒体数据的初始片段和结尾片段之间的相似度计算得到;

拼接单元104,用于将所述多个排序集合的拼接合理度衡量值满足预设条件的排序集合作为目标排序集合;

所述拼接单元104,还用于按照所述目标排序集合中的多媒体数据的排列顺序对所述各多媒体数据的待拼接片段进行拼接。

在一个实施例中,所述多个排序集合中包括参考排序集合,所述参考排序集合为所述多个排序集合中的任意一个排序集合;相应的,在计算所述多个排序集合的每一个排序集合的拼接合理度衡量值时,计算单元103可具体用于:根据所述参考排序集合中各多媒体数据的初始片段和结尾片段,计算所述参考排序集合中的相邻的多媒体数据之间的相似度;求取所述参考排序集合中的所有相邻的多媒体数据之间的相似度之和作为所述参考排序集合的拼接合理度衡量值。

再一个实施例中,所述多媒体数据的初始片段包括第一子片段和第二子片段,所述第二子片段为所述多媒体数据的待拼接片段和所述多媒体数据的初始片段相交的片段;所述多媒体数据的结尾片段包括第三子片段和第四子片段,所述第三子片段为所述多媒体数据的待拼接片段和所述多媒体数据的结尾片段相交的片段;所述第一多媒体数据的结尾片段与所述第二多媒体数据的初始片段之间的相似度是根据第一相似度和第二相似度计算得到;所述参考排序集合中的相邻的多媒体数据之间的相似度包括:所述参考排序集合中的第一多媒体数据的结尾片段和第二多媒体数据的初始片段之间的相似度,所述第一多媒体数据和所述第二多媒体数据在所述参考排序集合中是相邻的;其中,所述第一相似度为所述第一多媒体数据的第三子片段和所述第二多媒体数据的第一子片段的相似度,所述第二相似度为所述第一多媒体数据的第四子片段和所述第二多媒体数据的第二子片段的相似度。

再一个实施例中,在按照所述目标排序集合中的多媒体数据的排列顺序对所述各多媒体数据的待拼接片段进行拼接时,拼接单元104可具体用于:判断所述目标排序集合中是否存在相邻的第三多媒体数据和第四多媒体数据之间的相似度小于预设阈值;若存在,则获取目标过渡多媒体数据,并根据所述目标过渡多媒体数据和所述目标排序集合中的多媒体数据的排列顺序对所述各多媒体数据的待拼接片段进行拼接;若不存在,则按照所述目标排序集合中的多媒体数据的排列顺序对所述各多媒体数据的待拼接片段进行拼接。

再一个实施例中,在获取目标过渡多媒体数据时,拼接单元104可具体用于:获取过渡多媒体集合,所述过渡多媒体集合中包括至少两个过渡多媒体数据,所述过渡多媒体数据包括过渡片段;根据所述第三多媒体数据和所述第四多媒体数据从所述过渡多媒体集合中确定候选过渡多媒体集合,所述候选过渡多媒体集合包括至少一个候选过渡多媒体数据;将所述候选过渡多媒体集合中的各个候选过渡多媒体数据插入至所述目标排序集合中的所述第三多媒体数据和所述第四多媒体数据之间,得到多个插入排序集合;计算各插入排序集合的插入合理度衡量值,并根据所述各插入排序集合的插入合理度衡量值确定目标过渡多媒体数据。

再一个实施例中,所述过渡多媒体集合中包括待计算的过渡多媒体数据,所述待计算的过渡多媒体数据为所述过渡多媒体集合中的任意一个过渡多媒体数据;相应的,在根据所述第三多媒体数据和所述第四多媒体数据从所述过渡多媒体集合中确定候选过渡多媒体集合时,拼接单元104可具体用于:计算所述待计算的过渡多媒体数据与所述第三多媒体数据之间的第三相似度,以及所述待计算的过渡多媒体数据与所述第四多媒体数据之间的第四相似度;若所述第三相似度和所述第四相似度均大于所述预设阈值,则将所述待计算的过渡多媒体数据作为候选过渡多媒体数据并添加至候选过渡多媒体集合。

再一个实施例中,所述插入排序集合的插入合理度衡量值是根据目标排序集合中的相邻的多媒体数据之间的相似度、所述第三多媒体数据与所述插入排序集合中的候选过渡多媒体数据之间的相似度,以及所述插入排序集合中的候选过渡多媒体数据与所述第四多媒体数据之间的相似度计算得到。

再一个实施例中,在获取待拼接的多媒体集合时,获取单元101可具体用于:获取至少两个待拼接的多媒体数据,所述多媒体数据包括待拼接片段;获取预设的时间匹配参数,以及所述待拼接片段的开始时刻和结束时刻;根据所述开始时刻、所述结束时刻和所述时间匹配参数,确定所述多媒体数据的初始片段和结尾片段;将确定出所述初始片段、所述结尾片段以及所述待拼接片段的多媒体数据添加至待拼接的多媒体集合。

本发明实施例可以获取多媒体集合所对应的多个排序集合,并根据多媒体集合中的各多媒体数据的初始片段和结尾片段计算多个排序集合的拼接合理度衡量值。根据各多媒体数据的初始片段和结尾片段计算出的拼接合理度衡量值,可以在一定程度上反映出各多媒体数据中的待拼接片段之间的拼接合理度。根据拼接合理度衡量值选取目标排序集合,并按照目标排序集合的排列顺序对各多媒体数据的待拼接片段进行拼接,可以使得拼接得到的多媒体数据更流畅、自然、平滑,提高用户体验。

请参见图10,是本发明实施例提供的一种智能终端的结构示意图。如图10所示的本实施例中的智能终端可以包括:一个或多个处理器201;一个或多个输入设备202,一个或多个输出设备203和存储器204。上述处理器201、输入设备202、输出设备203和存储器204通过总线205连接。存储器204用于存储计算机程序,所述计算机程序包括程序指令,处理器201用于执行所述存储器204存储的程序指令以执行上述的多媒体拼接方法。

在一个实施例中,该处理器201可以是中央处理单元(centralprocessingunit,cpu),该处理器还可以是其他通用处理器,即微处理器或者任何常规的处理器。该存储器204可以包括只读存储器和随机存取存储器,并向处理器201提供指令和数据。因此,在此对于处理器201和存储器204不作限定。

本发明实施例还提供一种计算机存储介质,所述计算机存储介质存储有计算机程序指令,由处理器201加载并执行计算机存储介质中存放的一条或一条以上计算机程序指令,以实现上述相应实施例中的方法的相应步骤;具体实现中,计算机存储介质中的至少一条计算机程序指令由处理器201加载并执行如下步骤:

获取待拼接的多媒体集合,所述多媒体集合中包括至少两个多媒体数据,所述多媒体数据包括初始片段、结尾片段以及待拼接片段;

对所述多媒体集合中的至少两个多媒体数据进行排列,得到多个排序集合,任意两个排序集合中的多媒体数据的排列顺序不同;

计算所述多个排序集合的每一个排序集合的拼接合理度衡量值,所述每一个排序集合的拼接合理度衡量值是根据排序集合中相邻的多媒体数据的初始片段和结尾片段之间的相似度计算得到;

将所述多个排序集合的拼接合理度衡量值满足预设条件的排序集合作为目标排序集合;

按照所述目标排序集合中的多媒体数据的排列顺序对所述各多媒体数据的待拼接片段进行拼接。

在一个实施例中,所述多个排序集合中包括参考排序集合,所述参考排序集合为所述多个排序集合中的任意一个排序集合;相应的,在计算所述多个排序集合的每一个排序集合的拼接合理度衡量值时,该至少一条计算机程序指令可由该处理器201加载并具体用于执行:根据所述参考排序集合中各多媒体数据的初始片段和结尾片段,计算所述参考排序集合中的相邻的多媒体数据之间的相似度;求取所述参考排序集合中的所有相邻的多媒体数据之间的相似度之和作为所述参考排序集合的拼接合理度衡量值。

再一个实施例中,所述多媒体数据的初始片段包括第一子片段和第二子片段,所述第二子片段为所述多媒体数据的待拼接片段和所述多媒体数据的初始片段相交的片段;所述多媒体数据的结尾片段包括第三子片段和第四子片段,所述第三子片段为所述多媒体数据的待拼接片段和所述多媒体数据的结尾片段相交的片段;所述第一多媒体数据的结尾片段与所述第二多媒体数据的初始片段之间的相似度是根据第一相似度和第二相似度计算得到;所述参考排序集合中的相邻的多媒体数据之间的相似度包括:所述参考排序集合中的第一多媒体数据的结尾片段和第二多媒体数据的初始片段之间的相似度,所述第一多媒体数据和所述第二多媒体数据在所述参考排序集合中是相邻的;其中,所述第一相似度为所述第一多媒体数据的第三子片段和所述第二多媒体数据的第一子片段的相似度,所述第二相似度为所述第一多媒体数据的第四子片段和所述第二多媒体数据的第二子片段的相似度。

再一个实施例中,在按照所述目标排序集合中的多媒体数据的排列顺序对所述各多媒体数据的待拼接片段进行拼接时,该至少一条计算机程序指令可由该处理器201加载并具体用于执行:判断所述目标排序集合中是否存在相邻的第三多媒体数据和第四多媒体数据之间的相似度小于预设阈值;若存在,则获取目标过渡多媒体数据,并根据所述目标过渡多媒体数据和所述目标排序集合中的多媒体数据的排列顺序对所述各多媒体数据的待拼接片段进行拼接;若不存在,则按照所述目标排序集合中的多媒体数据的排列顺序对所述各多媒体数据的待拼接片段进行拼接。

再一个实施例中,在获取目标过渡多媒体数据时,该至少一条计算机程序指令可由该处理器201加载并具体用于执行:获取过渡多媒体集合,所述过渡多媒体集合中包括至少两个过渡多媒体数据,所述过渡多媒体数据包括过渡片段;根据所述第三多媒体数据和所述第四多媒体数据从所述过渡多媒体集合中确定候选过渡多媒体集合,所述候选过渡多媒体集合包括至少一个候选过渡多媒体数据;将所述候选过渡多媒体集合中的各个候选过渡多媒体数据插入至所述目标排序集合中的所述第三多媒体数据和所述第四多媒体数据之间,得到多个插入排序集合;计算各插入排序集合的插入合理度衡量值,并根据所述各插入排序集合的插入合理度衡量值确定目标过渡多媒体数据。

再一个实施例中,所述过渡多媒体集合中包括待计算的过渡多媒体数据,所述待计算的过渡多媒体数据为所述过渡多媒体集合中的任意一个过渡多媒体数据;相应的,在根据所述第三多媒体数据和所述第四多媒体数据从所述过渡多媒体集合中确定候选过渡多媒体集合时,该至少一条计算机程序指令可由该处理器201加载并具体用于执行:计算所述待计算的过渡多媒体数据与所述第三多媒体数据之间的第三相似度,以及所述待计算的过渡多媒体数据与所述第四多媒体数据之间的第四相似度;若所述第三相似度和所述第四相似度均大于所述预设阈值,则将所述待计算的过渡多媒体数据作为候选过渡多媒体数据并添加至候选过渡多媒体集合。

再一个实施例中,所述插入排序集合的插入合理度衡量值是根据目标排序集合中的相邻的多媒体数据之间的相似度、所述第三多媒体数据与所述插入排序集合中的候选过渡多媒体数据之间的相似度,以及所述插入排序集合中的候选过渡多媒体数据与所述第四多媒体数据之间的相似度计算得到。

再一个实施例中,在获取待拼接的多媒体集合时,该至少一条计算机程序指令可由该处理器201加载并具体用于执行:获取至少两个待拼接的多媒体数据,所述多媒体数据包括待拼接片段;获取预设的时间匹配参数,以及所述待拼接片段的开始时刻和结束时刻;根据所述开始时刻、所述结束时刻和所述时间匹配参数,确定所述多媒体数据的初始片段和结尾片段;将确定出所述初始片段、所述结尾片段以及所述待拼接片段的多媒体数据添加至待拼接的多媒体集合。

本发明实施例可以获取多媒体集合所对应的多个排序集合,并根据多媒体集合中的各多媒体数据的初始片段和结尾片段计算多个排序集合的拼接合理度衡量值。根据各多媒体数据的初始片段和结尾片段计算出的拼接合理度衡量值,可以在一定程度上反映出各多媒体数据中的待拼接片段之间的拼接合理度。根据拼接合理度衡量值选取目标排序集合,并按照目标排序集合的排列顺序对各多媒体数据的待拼接片段进行拼接,可以使得拼接得到的多媒体数据更流畅、自然、平滑,提高用户体验。

需要说明的是,上述描述的终端和单元的具体工作过程,可以参考前述各个实施例中的相关描述,在此不再赘述。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(read-onlymemory,rom)或随机存储记忆体(randomaccessmemory,ram)等。

以上所揭露的仅为本发明的部分实施例而已,当然不能以此来限定本发明之权利范围,本领域普通技术人员可以理解实现上述实施例的全部或部分流程,并依本发明权利要求所作的等同变化,仍属于发明所涵盖的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1