本申请涉及音频处理领域,特别是涉及一种特征频点识别模型的训练方法、音频指纹识别方法、计算机设备和计算机程序产品。
背景技术:
1、随着音频处理技术的不断发展,越来越多的音频类应用提供的音频匹配技术,而音频指纹被广泛应用于音频匹配领域。
2、在相关技术中,可以识别音频信号中具有指定特征的各个特征频点,并基于各特征频点得到音频信号的音频指纹。然而,当音频中存在干扰噪声时,通过上述方式识别得到音频指纹往往并不准确,识别准确率较低。
技术实现思路
1、基于此,有必要针对上述技术问题,提供一种特征频点识别模型的训练方法、音频指纹识别方法、计算机设备和计算机程序产品。
2、第一方面,本申请提供了一种特征频点识别模型的训练方法。所述方法包括:
3、获取原始歌曲音频的带噪歌曲音频;所述带噪歌曲音频的带噪歌曲信号包括噪声信号和所述原始歌曲音频的原始歌曲信号;
4、确定所述原始歌曲信号频域下的参考特征频点;
5、将所述带噪歌曲信号输入到待训练的神经网络模型,通过所述神经网络模型获取频域下与所述带噪歌曲信号中的原始歌曲信号关联的预测特征频点;
6、基于所述预测特征频点和所述参考特征频点之间的差异值,调整所述神经网络模型的模型参数,直到满足训练结束条件,得到训练好的特征频点识别模型。
7、第二方面,本申请还提供了一种音频指纹识别方法。所述方法包括:
8、获取待识别音频指纹的目标歌曲音频;
9、将所述目标歌曲音频的音频信号输入到训练好的特征频点识别模型,得到所述特征频点识别模型输出的所述目标歌曲音频的音频信号在频域下的多个特征频点,所述特征频点识别模型根据如上任一项所述特征频点识别模型的训练方法得到;
10、基于所述多个特征频点确定所述目标歌曲音频的音频指纹。
11、第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
12、获取原始歌曲音频的带噪歌曲音频;所述带噪歌曲音频的带噪歌曲信号包括噪声信号和所述原始歌曲音频的原始歌曲信号;
13、确定所述原始歌曲信号频域下的参考特征频点;
14、将所述带噪歌曲信号输入到待训练的神经网络模型,通过所述神经网络模型获取频域下与所述带噪歌曲信号中的原始歌曲信号关联的预测特征频点;
15、基于所述预测特征频点和所述参考特征频点之间的差异值,调整所述神经网络模型的模型参数,直到满足训练结束条件,得到训练好的特征频点识别模型。
16、第四方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
17、获取待识别音频指纹的目标歌曲音频;
18、将所述目标歌曲音频的音频信号输入到训练好的特征频点识别模型,得到所述特征频点识别模型输出的所述目标歌曲音频的音频信号在频域下的多个特征频点,所述特征频点识别模型根据如上任一项所述特征频点识别模型的训练方法得到;
19、基于所述多个特征频点确定所述目标歌曲音频的音频指纹。
20、第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
21、获取原始歌曲音频的带噪歌曲音频;所述带噪歌曲音频的带噪歌曲信号包括噪声信号和所述原始歌曲音频的原始歌曲信号;
22、确定所述原始歌曲信号频域下的参考特征频点;
23、将所述带噪歌曲信号输入到待训练的神经网络模型,通过所述神经网络模型获取频域下与所述带噪歌曲信号中的原始歌曲信号关联的预测特征频点;
24、基于所述预测特征频点和所述参考特征频点之间的差异值,调整所述神经网络模型的模型参数,直到满足训练结束条件,得到训练好的特征频点识别模型。
25、第六方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
26、获取待识别音频指纹的目标歌曲音频;
27、将所述目标歌曲音频的音频信号输入到训练好的特征频点识别模型,得到所述特征频点识别模型输出的所述目标歌曲音频的音频信号在频域下的多个特征频点,所述特征频点识别模型根据如上任一项所述特征频点识别模型的训练方法得到;
28、基于所述多个特征频点确定所述目标歌曲音频的音频指纹。
29、上述特征频点识别模型的训练方法、音频指纹识别方法、计算机设备和计算机程序产品,可以获取原始歌曲音频的带噪歌曲音频,其中,带噪歌曲音频的带噪歌曲信号包括噪声信号和原始歌曲音频的原始歌曲信号,进而可以确定原始歌曲信号频域下的参考特征频点,将带噪歌曲信号输入到待训练的神经网络模型,通过神经网络模型获取频域下与带噪歌曲信号中的原始歌曲信号关联的预测特征频点,基于预测特征频点和参考特征频点之间的差异值,调整神经网络模型的模型参数,直到满足训练结束条件,得到训练好的特征频点识别模型。本实施例的方案,在训练过程中通过神经网络模型从包含噪声信号和原始歌曲信号的带噪歌曲信号中识别预测特征频点,并基于原始歌曲信号的参考特征频点进行学习,能够使模型剔除输入的歌曲信号中与噪声信号相关联的特征频点,而仅保留带噪歌曲信号中与原始歌曲信号关联的特征频点,有效消除噪声信号产生的干扰频点,增加识别得到的特征频点的可靠性和准确性,进而提高音频指纹的识别准确率。
1.一种特征频点识别模型的训练方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述特征频点为局部峰值点,所述获取原始歌曲音频的带噪歌曲音频,包括:
3.根据权利要求2所述的方法,其特征在于,所述获取非平稳噪声的噪声信号,包括:
4.根据权利要求2所述的方法,其特征在于,所述对所述噪声信号和曲库中原始歌曲音频的原始歌曲信号进行融合处理,并基于融合结果得到所述原始歌曲音频的带噪歌曲音频,包括:
5.根据权利要求1所述的方法,其特征在于,所述将所述带噪歌曲信号输入到待训练的神经网络模型,包括:
6.根据权利要求1-5任一项所述的方法,其特征在于,所述基于所述预测特征频点和所述参考特征频点之间的差异值,调整所述神经网络模型的模型参数,直到满足训练结束条件,得到训练好的特征频点识别模型,包括:
7.一种音频指纹识别方法,其特征在于,所述方法包括:
8.根据权利要求7所述的方法,其特征在于,所述基于所述多个特征频点确定所述目标歌曲音频的音频指纹,包括:
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述的方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至8中任一项所述的方法的步骤。