检测音频是否是纯音乐音频方法、终端及存储介质与流程

文档序号：26091200发布日期：2021-07-30 17:59阅读：来源：国知局

技术特征：

1.一种检测音频是否是纯音乐音频方法，其特征在于，所述方法包括：

根据目标音频中每个音频帧中每个采样频率点的频率和每个音级对应的多个频段单元，确定每个音频帧中每个音级对应的所有采样频率点；

根据每个音频帧中每个音级对应的所有采样频率点的幅值，确定每个音频帧中每个音级的总能量；

对于每个音频帧，在所述音频帧的每个音级的总能量中，确定最大总能量和次大总能量，根据所述次大总能量与所述最大总能量的比值，确定所述音频帧是否为纯音乐音频帧；

根据非纯音乐音频帧或纯音乐音频帧的数目与所述目标音频中音频帧的总数目的比值，确定所述目标音频是否是纯音乐音频。

2.根据权利要求1所述的方法，其特征在于，所述根据目标音频中每个音频帧中每个采样频率点的频率和每个音级对应的多个频段单元，确定每个音频帧中每个音级对应的所有采样频率点，包括：

获取每个音级对应的带通滤波器，其中，所述带通滤波器的多个通过频段分别为对应的音级所包含的多个频段单元；

对于每个音频帧，通过每个音级对应的带通滤波器，分别对所述音频帧中的每个采样频率点的频率进行筛选，得到每个音级对应的所有采样频率点。

3.根据权利要求2所述的方法，其特征在于，所述音级对应的带通滤波器为滤波器组，所述滤波器组由多个单通带带通滤波器组成，每个单通带带通滤波器对应的通过频段分别为所述音级的一个频段单元。

4.根据权利要求2所述的方法，其特征在于，所述音级对应的带通滤波器为滤波器，所述滤波器为多通带带通滤波器，所述带通滤波器上的每个通过频段分别为所述带通滤波器对应的音级的一个频段单元。

5.根据权利要求1所述的方法，其特征在于，所述根据每个音频帧中每个音级对应的所有采样频率点的幅值，确定每个音频帧中每个音级的总能量，包括：

根据每个音频帧中每个音级对应的所有采样频率点的幅值，确定每个音频帧中每个音级对应的所有采样频率点的幅值的平方和，作为每个音频帧中每个音级的总能量。

6.根据权利要求1所述的方法，其特征在于，所述根据每个音频帧中每个音级对应的所有采样频率点的幅值，确定每个音频帧中每个音级的总能量，包括：

根据每个音频帧中每个音级对应的所有采样频率点的幅值，确定每个音频帧中每个音级对应的所有采样频率点的幅值和，作为每个音频帧中每个音级的总能量。

7.根据权利要求3所述的方法，其特征在于，所述方法还包括：

确定第h个八度第c个音级对应的中心音分值；

根据每个频点索引对应的频率以及音分值和频率之间的转换公式，确定每个频点索引对应的音分值；

根据第h个八度第c个音级对应的中心音分值以及每个索引频点对应的音分值，构造第h个八度第c个音级的带通滤波器的增益特性曲线。

8.根据权利要求7所述的方法，其特征在于，所述第h个八度第c个音级的带通滤波器的增益特性曲线描述公式为：

其中，wh,c(k)表示第h个八度第c个音级的带通滤波器在第k个频点索引处对应的增益，fc(k)表示第k个频点索引对应的音分值，fcent(p)表示第h个八度第c个音级对应的中心音分值，p表示第h个八度第c个音级对应的半音标识。

9.一种终端，其特征在于，所述终端包括处理器和存储器，所述存储器中存储有至少一条程序代码，所述至少一条程序代码由所述处理器加载并执行以实现如权利要求1至权利要求8任一项所述的检测音频是否是纯音乐音频方法所执行的操作。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有至少一条程序代码，所述至少一条程序代码由处理器加载并执行以实现如权利要求1至权利要求8任一项所述的检测音频是否是纯音乐音频方法所执行的操作。

技术总结
本申请公开了一种检测音频是否是纯音乐音频方法、终端及存储介质，属于互联网技术领域。该方法包括：基于目标音频中每个音频帧中每个采样频率点的频率和每个音级对应的多个频段单元，确定每个音频帧中每个音级的总能量；对于每个音频帧，在音频帧的每个音级的总能量中，确定最大总能量和次大总能量，根据次大总能量与最大总能量的比值，确定音频帧是否为纯音乐音频帧；根据非纯音乐音频帧或纯音乐音频帧的数目与目标音频中音频帧的总数目的比值，确定目标音频是否是纯音乐音频。本申请实施例提供的方法相比于使用神经网络模型检测音频是否为纯音乐音频，可以更加简单快速的检测出音频是否为纯音乐音频。

技术研发人员：张超鹏;姜涛;胡鹏
受保护的技术使用者：腾讯音乐娱乐科技(深圳)有限公司
技术研发日：2021.05.28
技术公布日：2021.07.30

完整全部详细技术资料下载

当前第2页1 2