音乐处理方法、视频生成方法、装置、计算机设备和介质与流程

文档序号：35541388发布日期：2023-09-23 18:22阅读：24来源：国知局

导航： X技术> 最新专利>电子通信装置的制造及其应用技术

本技术涉及视频处理，特别是涉及一种音乐处理方法、视频生成方法、装置、计算机设备和介质。

背景技术：

1、随着音乐处理技术的发展，可以通过计算机设备去获取音乐的高潮片段。

2、相关技术中，一般是通过用户手动调整音乐进度条的方式，对音乐的高潮片段进行截取。然而，此方式存在一定的操作难度，且需要花费一定的时间成本。

3、相关技术中，还可以通过神经网络模型结合音乐的歌词，对音乐的高潮片段进行自动截取。然而，当音乐无歌词时，会极大程度地降低截取的音乐的高潮片段的精度。

技术实现思路

1、基于此，有必要针对上述技术问题，提供一种能够提高截取的音乐的高潮片段的精度及通用性的音乐处理方法、视频生成方法、装置、计算机设备和介质。

2、第一方面，本技术提供了一种音乐处理方法。所述方法包括：

3、获取各音频帧的音频特征值；

4、根据各所述音频帧的音频特征值获取目标音频片段。

5、在其中一个实施例中，所述根据各所述音频帧的音频特征值获取目标音频片段，包括：

6、根据第一音频特征值，获取候选音频帧；

7、根据所述候选音频帧的第二音频特征值，确定多个音频区间；

8、根据多个所述音频区间的第三音频特征值，确定所述目标音频片段；其中，所述第三音频特征值为基于所述第一音频特征值获得的。

9、在其中一个实施例中，所述根据所述候选音频帧的第二音频特征值，确定多个音频区间，包括：

10、将时间间隔小于预设时间间隔阈值的相邻音频帧划入同一音频区间，以生成多个所述音频区间。

11、在其中一个实施例中，所述预设时间间隔阈值与所述目标音频片段的目标时长成正比例关系。

12、在其中一个实施例中，所述根据多个所述音频区间的第三音频特征值，确定所述目标音频片段，包括：

13、根据多个所述音频区间的第三音频特征值，从多个所述音频区间中确定目标音频区间；

14、获取所述目标音频区间的参考音频帧；

15、根据所述目标音频片段的目标时长，获取所述参考音频帧前后预设时长的音频帧作为第二目标音频帧，基于所述第二目标音频帧形成所述目标音频片段。

16、第二方面，本技术提供了一种视频生成方法。所述方法包括：

17、获取目标音频片段及多个待处理视频；其中，目标音频片段为如第一方面所述的目标音频片段；

18、根据所述目标音频片段、所述目标音频片段的音频参数以及所述待处理视频，生成目标视频。

19、在其中一个实施例中，所述方法还包括：获取音符起始点；所述根据所述目标音频片段、所述目标音频片段的音频参数以及所述待处理视频，生成目标视频，包括：

20、根据所述待处理视频的数量，确定所述目标音频片段中的视频剪辑点的目标数量；

21、根据所述目标音频片段的音频参数以及视频剪辑点的目标数量，从所述音频参数中确定所述目标音频片段中的视频剪辑点；其中，所述目标音频片段的音频参数包括强拍、预设节拍及所述音符起始点的数量；所述预设节拍为除了所述强拍之外的其他节拍；

22、根据所述目标音频片段、所述视频剪辑点以及所述待处理视频，生成所述目标视频。

23、在其中一个实施例中，所述根据所述目标音频片段的音频参数以及视频剪辑点的目标数量，从所述音频参数中确定所述目标音频片段中的视频剪辑点，包括：

24、若所述目标数量小于或者等于所述强拍的数量，则从所述强拍中选取所述目标数量个目标强拍作为所述视频剪辑点；

25、若所述目标数量大于所述强拍的数量，且所述目标数量小于或者等于预设数量总和，则从所述音符起始点中选取所述目标音符起始点，并将所述多个强拍及所述目标音符起始点作为所述视频剪辑点；所述预设数量总和为所述强拍的数量与所述音符起始点的数量之和；所述目标音符起始点的数量等于所述目标数量减去所述强拍的数量；

26、若所述目标数量大于所述预设数量总和，则从所述预设节拍中选取所述目标预设节拍，并将所述多个强拍、所述多个目标音符起始点及所述目标预设节拍作为所述视频剪辑点；所述目标预设节拍的数量等于所述目标数量减去所述预设数量总和。

27、在其中一个实施例中，所述方法还包括：

28、选取的所述目标音符起始点和所述强拍的时间间隔大于或者等于第一预设时间间隔；

29、或，选取的所述目标预设节拍和所述音符起始点的时间间隔大于或者等于第二预设时间间隔；且，选取的所述目标预设节拍和所述强拍的时间间隔大于或者等于第三预设时间间隔。

30、在其中一个实施例中，所述目标音频片段的音频参数包括强拍和预设节拍；所述方法还包括：

31、基于第一音频特征，将目标音频帧划分为第一强拍和待定节拍；

32、基于第二音频特征，将所述待定节拍划分为第二强拍和所述预设节拍；其中，第二音频特征是所述待定节拍和所述第一强拍的特征关系，所述第一强拍和所述第二强拍均为所述目标音频片段的强拍。

33、在其中一个实施例中，所述第一音频特征包括所述目标音频片段中各音频帧的音频振幅。

34、在其中一个实施例中，所述第二音频特征包括所述待定节拍与各所述第一强拍的时间间隔；

35、所述第二强拍与所述第一强拍的时间间隔小于或者等于预设时间间隔。

36、在其中一个实施例中，所述根据所述目标音频片段、所述视频剪辑点以及所述待处理视频，生成所述目标视频，包括：

37、根据所述视频剪辑点，将所述目标音频片段划分为多个音频数据片段；

38、针对所述多个音频数据片段，基于所述音频数据片段的时长，对所述音频数据片段对应的待处理视频进行数据处理，生成中间视频数据；

39、将各所述中间视频数据插入各所述中间视频数据对应的所述音频数据片段中，生成所述目标视频。

40、第三方面，本技术还提供了一种音乐处理装置。所述装置包括：

41、音频特征值获取模块，用于获取各音频帧的音频特征值；

42、目标音频片段获取模块，用于根据各所述音频帧的音频特征值获取目标音频片段。

43、第四方面，本技术还提供了一种计算机设备。所述计算机设备包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现上述第一方面和第二方面中任一项实施例中的方法的步骤。

44、第五方面，本技术还提供了一种计算机可读存储介质。所述计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述第一方面和第二方面中任一项实施例中的方法的步骤。

45、第六方面，本技术还提供了一种计算机程序产品。所述计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现上述第一方面和第二方面中任一项实施例中的方法的步骤。

46、上述音乐处理方法、视频生成方法、装置、计算机设备和介质，能够获取各音频帧的音频特征值，并根据各音频帧的音频特征值，获取目标音频片段。本技术实施例能够基于各音频帧的音频特征值，对音乐的高潮片段进行自动截取，即本技术无需用户手动截取音乐的高潮部分，也能够在音乐无歌词时，实现音乐高潮部分的自动选择。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：符峥
技术所有人：影石创新科技股份有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。