视频配乐方法、装置、电子设备及存储介质与流程

文档序号:18753133发布日期:2019-09-24 21:26阅读:169来源:国知局
视频配乐方法、装置、电子设备及存储介质与流程

本公开涉及计算机技术领域,尤其涉及一种视频配乐方法、装置、电子设备及存储介质。



背景技术:

随着互联网的发展,人们习惯将自己拍摄的或剪辑的一段视频通过网络进行分享。为了使视频更具表现力,需要在视频中添加合适的背景音乐。

相关技术中通过对图像场景进行识别后自动配乐,如果采用该方法对视频进行配乐,需要对视频中的每帧图像的内容场景进行识别后配乐,配乐效率较低。



技术实现要素:

本公开提供一种视频配乐方法、装置、电子设备及存储介质,以至少解决相关技术中视频配乐效率低的问题。本公开的技术方案如下:

根据本公开的第一方面,提供一种视频配乐方法,所述方法包括:获取目标视频;

计算所述目标视频中相邻帧之间的运动向量;

根据所述目标视频中相邻帧之间的运动向量,确定所述目标视频的运动状态;

根据所述运动状态,为所述目标视频匹配对应的音乐。

在一种可选地实现方式中,所述计算所述目标视频中相邻帧之间的运动向量的步骤,包括:

将所述目标视频中相邻帧中的第一帧图像划分为多个第一区域块;

在所述相邻帧中的第二帧图像中,确定与所述第一区域块的相似度满足第一预设阈值的第二区域块;

计算相似度满足第一预设阈值的第一区域块与所述第二区域块之间的位置偏移向量;

将各所述第一区域块对应的位置偏移向量构成的集合,确定为所述第一帧图像与所述第二帧图像之间的运动向量。

在一种可选地实现方式中,所述在所述相邻帧中的第二帧图像中,确定与所述第一区域块的相似度满足第一预设阈值的第二区域块的步骤,包括:

在所述第二帧图像中,确定出所有与所述第一区域块之间的距离满足第二预设阈值的多个第三区域块;

对所述第三区域块与所述第一区域块中对应的像素点的灰度值之差的绝对值进行求和;

将和值最小的第三区域块,确定为与所述第一区域块的相似度满足第一预设阈值的第二区域块。

在一种可选地实现方式中,所述对所述第三区域块与所述第一区域块中对应的像素点的灰度值之差的绝对值进行求和的步骤,包括:

根据所述第一区域块中各像素点的权重值,对所述第三区域块与所述第一区域块中对应的像素点的灰度值之差的绝对值进行加权求和。

在一种可选地实现方式中,所述根据所述目标视频中相邻帧之间的运动向量,确定所述目标视频的运动状态的步骤,包括:

根据所述目标视频中相邻帧之间的运动向量,计算相邻帧之间运动向量的模长以及模长分量;

根据所有相邻帧之间运动向量的模长的均值,得到所述目标视频的第一参量;

根据所有相邻帧之间运动向量的模长分量的方差,得到所述目标视频的第二参量;

将所述第一参量和所述第二参量进行加权求和,得到所述目标视频的运动状态。

根据本公开的第二方面,提供一种视频配乐装置,所述装置包括:

第一模块,被配置为获取目标视频;

第二模块,被配置为计算所述目标视频中相邻帧之间的运动向量;

第三模块,被配置为根据所述目标视频中相邻帧之间的运动向量,确定所述目标视频的运动状态;

配乐模块,被配置为根据所述运动状态,为所述目标视频匹配对应的音乐。

在一种可选地实现方式中,所述第二模块包括:

第一单元,被配置为将所述目标视频中相邻帧中的第一帧图像划分为多个第一区域块;

第二单元,被配置为在所述相邻帧中的第二帧图像中,确定与所述第一区域块的相似度满足第一预设阈值的第二区域块;

第三单元,被配置为计算相似度满足第一预设阈值的第一区域块与所述第二区域块之间的位置偏移向量;

第四单元,被配置为将各所述第一区域块对应的位置偏移向量构成的集合,确定为所述第一帧图像与所述第二帧图像之间的运动向量。

在一种可选地实现方式中,所述第二单元包括:

第一子单元,被配置为在所述第二帧图像中,确定出所有与所述第一区域块之间的距离满足第二预设阈值的多个第三区域块;

第二子单元,被配置为对所述第三区域块与所述第一区域块中对应的像素点的灰度值之差的绝对值进行求和;

第三子单元,被配置为将和值最小的第三区域块,确定为与所述第一区域块的相似度满足第一预设阈值的第二区域块。

在一种可选地实现方式中,所述第二子单元还被配置为:

根据所述第一区域块中各像素点的权重值,对所述第三区域块与所述第一区域块中对应的像素点的灰度值之差的绝对值进行加权求和。

在一种可选地实现方式中,所述第三模块还被配置为:

根据所述目标视频中相邻帧之间的运动向量,计算相邻帧之间运动向量的模长以及模长分量;

根据所有相邻帧之间运动向量的模长的均值,得到所述目标视频的第一参量;

根据所有相邻帧之间运动向量的模长分量的方差,得到所述目标视频的第二参量;

将所述第一参量和所述第二参量进行加权求和,得到所述目标视频的运动状态。

根据本公开的第三方面,提供一种电子设备,所述电子设备包括:

处理器;

用于存储所述处理器可执行指令的存储器;

其中,所述处理器被配置为执行所述指令,以实现如第一方面所述的视频配乐方法。

根据本公开的第四方面,提供一种存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行如第一方面所述的视频配乐方法。

根据本公开的第五方面,提供一种计算机程序产品,当所述计算机程序产品中的指令由电子设备的处理器执行时,使得所述电子设备能够执行如第一方面所述的视频配乐方法。

本公开的实施例提供的技术方案至少带来以下有益效果:

本公开技术方案,根据目标视频中相邻帧之间的运动向量,确定目标视频的运动状态,然后为目标视频匹配与运动状态对应的音乐。根据相邻帧之间的运动向量mv完成配乐,不必逐帧识别图像的内容,由于计算相邻帧之间的运动向量mv比识别帧图像的内容效率更高,因此本公开可以提高配乐效率。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。

图1是根据一示例性实施例示出的一种视频配乐方法的流程图。

图2是根据一示例性实施例示出的一种计算相邻帧之间运动向量的流程图。

图3是根据一示例性实施例示出的一种确定相似度满足第一预设阈值的第二区域块的流程图。

图4是根据一示例性实施例示出的一种确定目标视频运动状态的流程图。

图5是根据一示例性实施例示出的一种视频配乐方法的流程示意图。

图6是根据一示例性实施例示出的一种视频配乐装置的框图。

图7是根据一示例性实施例示出的一种电子设备的框图。

图8是根据一示例性实施例示出的一种电子设备的框图。

具体实施方式

为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。

需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

图1是根据一示例性实施例示出的一种视频配乐方法的流程图,如图1所示,该方法包括以下步骤。

在步骤s11中,获取目标视频。

具体地,目标视频即待配乐视频,例如可以是完成剪辑后的一段视频。

在步骤s12中,计算目标视频中相邻帧之间的运动向量。

目标视频可以包括多个帧,每一帧对应一个图像。可以根据相邻的两帧图像之间的位置偏移量计算得到运动向量mv(motionvector)。

在步骤s13中,根据目标视频中相邻帧之间的运动向量,确定目标视频的运动状态。

其中,运动状态可以用来表征目标视频的运动剧烈程度。

根据相邻帧之间的运动向量确定目标视频运动状态的实现方式可以有多种。例如可以首先根据相邻帧之间的运动向量,计算相邻帧之间运动向量的模长以及模长分量,然后根据所有相邻帧之间的运动向量的模长均值和模长分量方差,确定目标视频的运动状态。后续实施例会详细介绍这种实现方式。

在步骤s14中,根据运动状态,为目标视频匹配对应的音乐。

具体地,在计算得到目标视频的运动状态(运动剧烈程度)以后,可以根据不同的运动状态匹配不同速度的音乐。

在实际应用中,可以预先将音频数据库中的音乐人工标注为快速、中速和慢速。例如当运动状态为归一化数值时,可以为运动状态大于或等于0.0且小于0.1的目标视频匹配慢速的音乐,为运动状态大于或等于0.1且小于0.2的目标视频匹配中速的音乐,为运动状态大于或等于0.2且小于或等于1.0的目标视频匹配快速的音乐,然后合成配乐的视频,自动完成视频配乐。

其中,音频数据库中的音乐速度可以人工标注,也可以根据音乐节奏bmp(beatperminute,每分钟节拍数)进行量化计算得到。

本实施例提供的视频配乐方法,针对视频具有时间域的特点,根据相邻帧之间的运动向量mv完成配乐,不必逐帧识别图像的内容,由于计算相邻帧之间的运动向量mv比识别帧图像的内容效率更高,因此本公开可以提高配乐效率。另外,本公开提供的技术方案可以为视频自动增加配乐,考虑了视频与配乐之间的相关性,与手动配乐相比,本公开可以提高视频与音乐之间的匹配度,减轻视频剪辑的难度。

在一种可选地实现方式中,参照图2,在步骤s12中具体可以包括:

在步骤s21中,将目标视频中相邻帧中的第一帧图像划分为多个第一区域块。

具体地,可以将第一帧图像ft划分为多个不重叠的块即第一区域块,第一区域块的大小可以根据实际情况确定,在本实施例中,第一区域块的大小为8x8个像素。

在步骤s22中,在相邻帧中的第二帧图像中,确定与第一区域块的相似度满足第一预设阈值的第二区域块。

为了确定第一帧图像中第一区域块对应的图像内容在第二帧图像中位置,可以在第二帧图像包括的多个区域块中,确定出与第一区域块相似度大于或等于第一预设阈值的第二区域块,也就是,第一帧图像中第一区域块对应的图像内容在第二帧图像中移动到了第二区域块的位置。

其中,相似度的计算方式可以有多种,例如可以根据区域块对应像素点之间的灰度值确定。第一预设阈值可以根据实际情况确定,例如可以设定为90%。第二帧图像f(t+1)中,第二区域块的大小可以与第一区域块的大小相同。

通过相似度满足第一预设阈值的方式确定第二区域块,可以不必遍历第二帧图像中的所有区域块,计算量较小,可以进一步提高配乐效率。

进一步地,为了能够更加准确地计算相邻帧之间的运动向量,可以在相邻帧的第二帧图像中,确定与第一区域块的相似度最高的第二区域块。这种情况下,相当于将第一预设阈值设定为第二帧图像中各区域块与第一区域块之间相似度的最大值。相似度最高的第二区域块与第一区域块之间的位置偏移量能够更加准确地表征相邻帧之间的运动向量。

在步骤s23中,计算相似度满足第一预设阈值的第一区域块与第二区域块之间的位置偏移向量。

具体地,第一区域块与第二区域块之间的位置偏移向量,可以通过计算第一区域块与第二区域块中对应像素点(如左上角、中心点、右下角等)的位置偏移向量得到。例如,假设第一区域块bt的左上角坐标为(xt,yt),第二区域块b(t+1)的左上角坐标为(x(t+1),y(t+1)),则第一区域块bt与第二区域块b(t+1)之间的位置偏移向量bmv(即第一区域块bt对应的位置偏移向量)为:

bmv=(x(t+1)-xt,y(t+1)-yt)

位置偏移向量bmv的x分量bmv_x=x(t+1)-xt,y分量bmv_y=y(t+1)-yt。

其中,(xt,yt)和(x(t+1),y(t+1))分别是第一区域块bt的左上角和第二区域块b(t+1)的左上角在同一坐标系中的坐标,坐标系可以是像素坐标系或直角坐标系等,本实施例以像素坐标系为例进行说明。

按照同样的计算方式,可以得到第一帧图像ft中所有的第一区域块对应的位置偏移向量bmv。

在步骤s24中,将各第一区域块对应的位置偏移向量构成的集合,确定为第一帧图像与第二帧图像之间的运动向量。

具体地,将第一帧图像ft中所有的第一区域块对应的位置偏移向量bmv构成的集合,作为相邻两帧图像之间的运动向量mv。假设第一帧图像ft划分了100个第一区域块,可以计算得到100个第一区域块对应的bmv,则两帧图像之间的运动向量mv为100个第一区域块对应的bmv构成的集合。

为了确定与第一区域块的相似度满足第一预设阈值的第二区域块,参照图3,在步骤s22中具体可以包括:

在步骤s31中,在第二帧图像中,确定出所有与第一区域块之间的距离满足第二预设阈值的多个第三区域块。

由于第一帧图像中第一区域块对应的图像内容在第二帧图像中移动到了第二区域块,因此,第二区域块应该在第一区域块附近。这样,可以首先在第二帧图像中,确定出所有与第一区域块之间的距离小于或等于第二预设阈值的多个第三区域块,与第一区域块之间的距离大于第二预设阈值的区域块不进行后续计算,从而可以减少计算量,进一步提高配乐效率。

其中,第三区域块的大小可以与第一区域块的大小相同。第二预设阈值可以根据实际情况确定,例如可以设置为x和y方向距离均小于或等于16个像素点。

例如,第三区域块的左上角坐标为(x(t+1),y(t+1)),第一区域块bt的左上角坐标为(xt,yt),二者满足如下限制:

|x(t+1)-xt|<=d1

|y(t+1)-yt|<=d2

其中,参数d1和d2可以均为16个像素点。

在步骤s32中,对第三区域块与第一区域块中对应的像素点的灰度值之差的绝对值进行求和。

具体地,可以根据第一区域块中各像素点的权重值,对第三区域块与第一区域块中对应的像素点的灰度值之差的绝对值进行加权求和。根据实际情况为每个像素点设置不同的权重值,可以更准确地确定出第二区域块。

当各像素点的权重值相同时,可以计算每个第三区域块(8x8)与第一区域块(8x8)中对应像素点的灰度值之差的绝对值之和sum,然后根据sum值在第二帧图像中确定第一区域块的相似块。其中,对应像素点是指在第三区域块和第一区域块中位置相同的像素点,例如第三区域块的左上角像素点与第一区域块的左上角像素点,第三区域块的中心像素点与第一区域块的中心像素点,等等。

在步骤s33中,将和值最小的第三区域块,确定为与第一区域块的相似度满足第一预设阈值的第二区域块。

具体地,sum值最小的第三区域块可以确定为与第一区域块相似度最高的第二区域块,然后计算相似度最高的第一区域块与第二区域块之间的位置偏移量等。

在一种可选地实现方式中,参照图4,在步骤s13中具体可以包括:

在步骤s41中,根据目标视频中相邻帧之间的运动向量,计算相邻帧之间运动向量的模长以及模长分量。

具体地,从相邻帧之间的运动向量mv(bmv集合)中提取特征,该特征由mv模长和mv模长分量组成。运动向量的模长mv_norm为所有帧之间位置偏移向量bmv的模长均值,使用以下公式计算:

mv_norm=average(||bmv||),

其中||·||表示向量模长,average表示均值。

运动向量的模长分量包括模长mv_norm的x分量和y分量,分别使用以下公式计算:

mv_x=mv_norm*cos(theta),mv_y=mv_norm*sin(theta),

其中,theta是相邻帧之间运动向量mv的角度,theta可以使用如下方式计算:

theta=atan(average(bmv_y)/average(bmv_x)),

其中,atan是反正切函数,bmv_x和bmv_y分别是位置偏移向量bmv的x分量和y分量。

按照同样的计算方式,可以得到目标视频所有相邻帧之间的运动向量的模长mv_norm,以及运动向量的模长分量mv_x和mv_y,将这些特征按照时间顺序进行排序,形成目标视频序列vec。假设目标视频包括10帧,则序列vec中包括9组特征,每组特征包括相邻两帧之间的运动向量的模长和模长x、y分量。

在步骤s42中,根据所有相邻帧之间运动向量的模长的均值,得到目标视频的第一参量。

具体地,可以计算vec中所有模长mv_norm的平均值score_amplitude:

score_amplitude=average(mv_norm_t)

其中,mv_norm_t为vec中所有mv_norm的集合。

在实际应用中,可以直接将score_amplitude作为目标视频的第一参量,还可以将score_amplitude除以第一指定值进行归一化处理,这样可以统一设定配乐阈值。其中,第一指定值可以根据实际情况设定,例如可以设定为7.5等。

在步骤s43中,根据所有相邻帧之间运动向量的模长分量的方差,得到目标视频的第二参量。

具体地,可以计算vec中的所有模长分量的方差score_shake:

score_shake=average(||mv_xy_t–mv_xy_mean||^2)

其中,mv_xy_t是一个二维向量,为vec中所有模长分量(mv_x,mv_y)的集合,mv_xy_mean是vec中所有模长分量(mv_x,mv_y)的平均向量:

mv_xy_mean=(average(mv_x_t),average(mv_y_t))

其中,mv_x_t为vec中所有模长分量mv_x的集合,mv_y_t为vec中所有模长分量mv_y的集合,||·||与bmv_norm公式中的||·||含义相同,是指二范数,对于二维向量(x,y),||(x,y)||=sqrt(x^2+y^2),sqrt是开根号。

在实际应用中,可以直接将score_shake作为目标视频的第二参量,还可以将score_shake除以第二指定值进行归一化处理,这样可以统一设定配乐阈值。其中,第二指定值可以根据实际情况设定,例如可以设定为45等。

在步骤s44中,将第一参量和第二参量进行加权求和,得到目标视频的运动状态。

具体地,目标视频的运动状态(运动剧烈程度)score_motion可以按照以下公式计算:

score_motion=w1*score_amplitude+w2*score_shake

其中,w1和w2分别是第一参量和第二参量的权重,具体数值可以根据实际情况设定,例如可以设置w1=0.5,w2=0.5。得到目标视频的运动状态之后,可以为该目标视频匹配相应速度的音乐,参照图5示出了一种视频配乐方法的流程示意图。

图6是根据一示例性实施例示出的一种视频配乐装置框图。参照图6,该装置包括:

第一模块61,被配置为获取目标视频;

第二模块62,被配置为计算所述目标视频中相邻帧之间的运动向量;

第三模块63,被配置为根据所述目标视频中相邻帧之间的运动向量,确定所述目标视频的运动状态;

配乐模块64,被配置为根据所述运动状态,为所述目标视频匹配对应的音乐。

其中,第一模块61获取的目标视频即待配乐视频,例如可以是完成剪辑后的一段视频。

目标视频可以包括多个帧,每一帧对应一个图像。第二模块62可以根据相邻的两帧图像之间的位置偏移量计算得到运动向量mv(motionvector)。

运动状态可以用来表征目标视频的运动剧烈程度。

第三模块63根据相邻帧之间的运动向量确定目标视频运动状态的实现方式可以有多种。例如可以首先根据相邻帧之间的运动向量,计算相邻帧之间运动向量的模长以及模长分量,然后根据所有相邻帧之间的运动向量的模长均值和模长分量方差,确定目标视频的运动状态。

具体地,在计算得到目标视频的运动状态(运动剧烈程度)以后,配乐模块64可以根据不同的运动状态匹配不同速度的音乐。

在实际应用中,可以预先将音频数据库中的音乐人工标注为快速、中速和慢速。例如当运动状态为归一化数值时,配乐模块64可以为运动状态大于或等于0.0且小于0.1的目标视频匹配慢速的音乐,为运动状态大于或等于0.1且小于0.2的目标视频匹配中速的音乐,为运动状态大于或等于0.2且小于或等于1.0的目标视频匹配快速的音乐,然后合成配乐的视频,自动完成视频配乐。

其中,音频数据库中的音乐速度可以人工标注,也可以根据音乐节奏bmp(beatperminute,每分钟节拍数)进行量化计算得到。

本实施例提供的视频配乐装置,针对视频具有时间域的特点,根据相邻帧之间的运动向量mv完成配乐,不必逐帧识别图像的内容,由于计算相邻帧之间的运动向量mv比识别帧图像的内容效率更高,因此本公开可以提高配乐效率。另外,本公开提供的技术方案可以为视频自动增加配乐,考虑了视频与配乐之间的相关性,与手动配乐相比,本公开可以提高视频与音乐之间的匹配度,减轻视频剪辑的难度。

在一种可选的实现方式中,第二模块62包括:

第一单元,被配置为将所述目标视频中相邻帧中的第一帧图像划分为多个第一区域块;

第二单元,被配置为在所述相邻帧中的第二帧图像中,确定与所述第一区域块的相似度满足第一预设阈值的第二区域块;

第三单元,被配置为计算相似度满足第一预设阈值的第一区域块与所述第二区域块之间的位置偏移向量;

第四单元,被配置为将各所述第一区域块对应的位置偏移向量构成的集合,确定为所述第一帧图像与所述第二帧图像之间的运动向量。

其中,第二单元具体可以包括:

第一子单元,被配置为在所述第二帧图像中,确定出所有与所述第一区域块之间的距离满足第二预设阈值的多个第三区域块;

第二子单元,被配置为对所述第三区域块与所述第一区域块中对应的像素点的灰度值之差的绝对值进行求和;

具体地,第二子单元还被配置为根据所述第一区域块中各像素点的权重值,对所述第三区域块与所述第一区域块中对应的像素点的灰度值之差的绝对值进行加权求和。

第三子单元,被配置为将和值最小的第三区域块,确定为与所述第一区域块的相似度满足第一预设阈值的第二区域块。

在一种可选的实现方式中,第二模块63还被配置为:

根据所述目标视频中相邻帧之间的运动向量,计算相邻帧之间运动向量的模长以及模长分量;

根据所有相邻帧之间运动向量的模长的均值,得到所述目标视频的第一参量;

根据所有相邻帧之间运动向量的模长分量的方差,得到所述目标视频的第二参量;

将所述第一参量和所述第二参量进行加权求和,得到所述目标视频的运动状态。

关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。

图7是本公开示出的一种电子设备800的框图。例如,电子设备800可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。

参照图7,电子设备800可以包括以下一个或多个组件:处理组件802,存储器804,电力组件806,多媒体组件808,音频组件810,输入/输出(i/o)的接口812,传感器组件814,以及通信组件816。

处理组件802通常控制电子设备800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件802可以包括一个或多个处理器820来执行指令,以完成任一实施例所述的视频配乐方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理组件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。

存储器804被配置为存储各种类型的数据以支持在设备800的操作。这些数据的示例包括用于在电子设备800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(sram),电可擦除可编程只读存储器(eeprom),可擦除可编程只读存储器(eprom),可编程只读存储器(prom),只读存储器(rom),磁存储器,快闪存储器,磁盘或光盘。

电源组件806为电子设备800的各种组件提供电力。电源组件806可以包括电源管理系统,一个或多个电源,及其他与为电子设备800生成、管理和分配电力相关联的组件。

多媒体组件808包括在所述电子设备800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(lcd)和触摸面板(tp)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当设备800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(mic),当电子设备800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。

i/o接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件814包括一个或多个传感器,用于为电子设备800提供各个方面的状态评估。例如,传感器组件814可以检测到设备800的打开/关闭状态,组件的相对定位,例如所述组件为电子设备800的显示器和小键盘,传感器组件814还可以检测电子设备800或电子设备800一个组件的位置改变,用户与电子设备800接触的存在或不存在,电子设备800方位或加速/减速和电子设备800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如cmos或ccd图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。

通信组件816被配置为便于电子设备800和其他设备之间有线或无线方式的通信。电子设备800可以接入基于通信标准的无线网络,如wifi,运营商网络(如2g、3g、4g或5g),或它们的组合。在一个示例性实施例中,通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件816还包括近场通信(nfc)模块,以促进短程通信。例如,在nfc模块可基于射频识别(rfid)技术,红外数据协会(irda)技术,超宽带(uwb)技术,蓝牙(bt)技术和其他技术来实现。

在示例性实施例中,电子设备800可以被一个或多个应用专用集成电路(asic)、数字信号处理器(dsp)、数字信号处理设备(dspd)、可编程逻辑器件(pld)、现场可编程门阵列(fpga)、控制器、微控制器、微处理器或其他电子元件实现,用于执行任一实施例所述的视频配乐方法。

在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器804,上述指令可由电子设备800的处理器820执行以完成任一实施例所述的视频配乐方法。例如,所述非临时性计算机可读存储介质可以是rom、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等。

在示例性实施例中,还提供了一种计算机程序产品,该计算机程序产品包括可读性程序代码,该可读性程序代码可由装置800的处理器820执行以完成任一实施例所述的视频配乐方法。可选地,该程序代码可以存储在装置800的存储介质中,该存储介质可以是非临时性计算机可读存储介质,例如,所述非临时性计算机可读存储介质可以是rom、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等。

图8是本公开示出的一种电子设备1900的框图。例如,电子设备1900可以被提供为一服务器。

参照图8,电子设备1900包括处理组件1922,其进一步包括一个或多个处理器,以及由存储器1932所代表的存储器资源,用于存储可由处理组件1922的执行的指令,例如应用程序。存储器1932中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件1922被配置为执行指令,以执行任一实施例所述的视频配乐方法。

电子设备1900还可以包括一个电源组件1926被配置为执行电子设备1900的电源管理,一个有线或无线网络接口1950被配置为将电子设备1900连接到网络,和一个输入输出(i/o)接口1958。电子设备1900可以操作基于存储在存储器1932的操作系统,例如windowsservertm,macosxtm,unixtm,linuxtm,freebsdtm或类似。

本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。

应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

a1、一种视频配乐方法,所述方法包括:

获取目标视频;

计算所述目标视频中相邻帧之间的运动向量;

根据所述目标视频中相邻帧之间的运动向量,确定所述目标视频的运动状态;

根据所述运动状态,为所述目标视频匹配对应的音乐。

a2、根据a1所述的视频配乐方法,所述计算所述目标视频中相邻帧之间的运动向量的步骤,包括:

将所述目标视频中相邻帧中的第一帧图像划分为多个第一区域块;

在所述相邻帧中的第二帧图像中,确定与所述第一区域块的相似度满足第一预设阈值的第二区域块;

计算相似度满足第一预设阈值的第一区域块与所述第二区域块之间的位置偏移向量;

将各所述第一区域块对应的位置偏移向量构成的集合,确定为所述第一帧图像与所述第二帧图像之间的运动向量。

a3、根据a2所述的视频配乐方法,所述在所述相邻帧中的第二帧图像中,确定与所述第一区域块的相似度满足第一预设阈值的第二区域块的步骤,包括:

在所述第二帧图像中,确定出所有与所述第一区域块之间的距离满足第二预设阈值的多个第三区域块;

对所述第三区域块与所述第一区域块中对应的像素点的灰度值之差的绝对值进行求和;

将和值最小的第三区域块,确定为与所述第一区域块的相似度满足第一预设阈值的第二区域块。

a4、根据a3所述的视频配乐方法,所述对所述第三区域块与所述第一区域块中对应的像素点的灰度值之差的绝对值进行求和的步骤,包括:

根据所述第一区域块中各像素点的权重值,对所述第三区域块与所述第一区域块中对应的像素点的灰度值之差的绝对值进行加权求和。

a5、根据a1至a4任一项所述的视频配乐方法,所述根据所述目标视频中相邻帧之间的运动向量,确定所述目标视频的运动状态的步骤,包括:

根据所述目标视频中相邻帧之间的运动向量,计算相邻帧之间运动向量的模长以及模长分量;

根据所有相邻帧之间运动向量的模长的均值,得到所述目标视频的第一参量;

根据所有相邻帧之间运动向量的模长分量的方差,得到所述目标视频的第二参量;

将所述第一参量和所述第二参量进行加权求和,得到所述目标视频的运动状态。

a6、一种视频配乐装置,所述装置包括:

第一模块,被配置为获取目标视频;

第二模块,被配置为计算所述目标视频中相邻帧之间的运动向量;

第三模块,被配置为根据所述目标视频中相邻帧之间的运动向量,确定所述目标视频的运动状态;

配乐模块,被配置为根据所述运动状态,为所述目标视频匹配对应的音乐。

a7、根据a6所述的视频配乐装置,所述第二模块包括:

第一单元,被配置为将所述目标视频中相邻帧中的第一帧图像划分为多个第一区域块;

第二单元,被配置为在所述相邻帧中的第二帧图像中,确定与所述第一区域块的相似度满足第一预设阈值的第二区域块;

第三单元,被配置为计算相似度满足第一预设阈值的第一区域块与所述第二区域块之间的位置偏移向量;

第四单元,被配置为将各所述第一区域块对应的位置偏移向量构成的集合,确定为所述第一帧图像与所述第二帧图像之间的运动向量。

a8、根据a7所述的视频配乐装置,所述第二单元包括:

第一子单元,被配置为在所述第二帧图像中,确定出所有与所述第一区域块之间的距离满足第二预设阈值的多个第三区域块;

第二子单元,被配置为对所述第三区域块与所述第一区域块中对应的像素点的灰度值之差的绝对值进行求和;

第三子单元,被配置为将和值最小的第三区域块,确定为与所述第一区域块的相似度满足第一预设阈值的第二区域块。

a9、根据a8所述的视频配乐装置,所述第二子单元还被配置为:

根据所述第一区域块中各像素点的权重值,对所述第三区域块与所述第一区域块中对应的像素点的灰度值之差的绝对值进行加权求和。

a10、根据a8所述的视频配乐装置,所述第三模块还被配置为:

根据所述目标视频中相邻帧之间的运动向量,计算相邻帧之间运动向量的模长以及模长分量;

根据所有相邻帧之间运动向量的模长的均值,得到所述目标视频的第一参量;

根据所有相邻帧之间运动向量的模长分量的方差,得到所述目标视频的第二参量;

将所述第一参量和所述第二参量进行加权求和,得到所述目标视频的运动状态。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1