本技术涉及人工智能,特别涉及一种确定歌曲听力健康程度的方法、计算机设备和存储介质。
背景技术:
1、听力是人类的重要感官,听力健康将直接影响人们的生活。对于大部分人而言,戴耳机听歌是在日常生活工作中最容易影响听力健康的行为。
2、对于戴耳机听歌来说,一般通过降低耳机的音量,来降低耳机中播放的歌曲对听力的损伤。不过即使在统一的音量下,不同歌曲对听力的影响程度也存在着较大差异。例如,重金属歌曲相对于抒情歌曲对听力的影响程度更高。可见,当前需要一种确定不同歌曲对听力健康影响的方法。
技术实现思路
1、本技术实施例提供了一种确定歌曲听力健康程度的方法、计算机设备和存储介质,能够准确的计算歌曲对听力健康的影响。相应的技术方案如下:
2、第一方面,提供了一种确定歌曲听力健康程度的方法,所述方法包括:
3、获取目标歌曲音频在目标维度的听力健康特征,所述目标维度包括乐器类型、噪声分布和歌曲流派中的至少两种维度;
4、获取所述目标歌曲音频对应的内容理解特征;
5、将所述目标歌曲音频对应的所述听力健康特征和所述内容理解特征进行融合,得到目标特征;
6、获取表征听力健康程度为目标健康值的参考特征;
7、基于所述目标特征与所述参考特征之间的相似度和所述目标健康值,确定所述目标歌曲的听力健康程度。
8、可选地,所述获取目标歌曲音频在目标维度的听力健康特征之前,还包括:
9、将第一样本歌曲音频输入至第一模型,得到所述第一模型输出的所述第一样本歌曲音频在所述目标维度的听力健康特征;
10、将第二样本歌曲音频输入至第二模型,得到所述第二模型输出的所述第二样本歌曲音频的内容理解特征,其中,所述第一样本歌曲音频和所述第二样本歌曲音频的听力健康程度对应的健康值的差值大于第一差值阈值;
11、确定所述第一样本歌曲音频的听力健康特征与所述第二样本歌曲音频的内容理解特征的对比损失,基于所述对比损失对所述第一模型和所述第二模型进行对比训练,其中,训练后的第一模型用于提取所述目标歌曲音频在所述目标维度的所述听力健康特征,训练后的第二模型用于提取所述目标歌曲音频对应的所述内容理解特征。
12、可选地,所述第一模型包括相连的残差网络层和全连接层,所述全连接层中包括并行的多个全连接网络,所述全连接网络数量与所述目标维度包括维度的数量相同;
13、所述将第一样本歌曲音频输入至第一模型,得到所述第一模型输出的所述第一样本歌曲音频在所述目标维度的听力健康特征之前,还包括:
14、将第三样本歌曲音频输入至所述残差网络,得到所述第三样本歌曲音频的中间特征;
15、将所述中间特征分别输入多个全连接网络,得到每个全连接网络输出的对应目标维度中每个维度的听力健康特征;
16、根据所述每个维度的听力健康特征,对所述每个全连接网络和所述残差网络进行训练。
17、可选地,所述第二模型为音乐基座大模型。
18、可选地,所述获取表征听力健康程度为目标健康值的参考特征,包括:
19、获取表征听力健康程度为目标健康值的参考歌曲音频在所述目标维度的听力健康特征;
20、获取所述参考歌曲音频对应的所述内容理解特征;
21、将所述参考歌曲音频对应的所述听力健康特征和所述内容理解特征进行融合,得到参考特征。
22、可选地,所述获取表征听力健康程度为目标健康值的参考特征,包括:
23、获取多个表征听力健康程度为目标健康值的参考歌曲音频对应的参考特征;
24、所述基于所述目标特征与所述参考特征之间的相似度和所述目标健康值,确定所述目标歌曲的听力健康程度,包括:
25、确定所述多个参考特征对应的平均特征,所述平均特征为所述多个参考特征的均值;
26、确定所述目标特征和所述平均特征的距离值,根据所述距离值以及所述目标健康值,确定所述目标歌曲的听力健康程度。
27、可选地,所述目标维度还包括每分钟节拍数或高低频分布。
28、第二方面,提供了一种确定歌曲听力健康程度的装置,所述装置包括:
29、获取模块,用于获取目标歌曲音频在目标维度的听力健康特征,所述目标维度包括乐器类型、噪声分布和歌曲流派中的至少两种维度;获取所述目标歌曲音频对应的内容理解特征;
30、融合模块,用于将所述目标歌曲音频对应的所述听力健康特征和所述内容理解特征进行融合,得到目标特征;
31、获取模块,用于获取表征听力健康程度为目标健康值的参考特征;
32、确定模块,用于基于所述目标特征与所述参考特征之间的相似度和所述目标健康值,确定所述目标歌曲的听力健康程度。
33、可选地,所述装置还包括训练模块,用于:
34、将第一样本歌曲音频输入至第一模型,得到所述第一模型输出的所述第一样本歌曲音频在所述目标维度的听力健康特征;
35、将第二样本歌曲音频输入至第二模型,得到所述第二模型输出的所述第二样本歌曲音频的内容理解特征,其中,所述第一样本歌曲音频和所述第二样本歌曲音频的听力健康程度对应的健康值的差值大于第一差值阈值;
36、确定所述第一样本歌曲音频的听力健康特征与所述第二样本歌曲音频的内容理解特征的对比损失,基于所述对比损失对所述第一模型和所述第二模型进行对比训练,其中,训练后的第一模型用于提取所述目标歌曲音频在所述目标维度的所述听力健康特征,训练后的第二模型用于提取所述目标歌曲音频对应的所述内容理解特征。
37、可选地,所述第一模型包括相连的残差网络层和全连接层,所述全连接层中包括并行的多个全连接网络,所述全连接网络数量与所述目标维度包括维度的数量相同;所述训练模块还用于:
38、将第三样本歌曲音频输入至所述残差网络,得到所述第三样本歌曲音频的中间特征;
39、将所述中间特征分别输入多个全连接网络,得到每个全连接网络输出的对应目标维度中每个维度的听力健康特征;
40、根据所述每个维度的听力健康特征,对所述每个全连接网络和所述残差网络进行训练。
41、可选地,所述第二模型为音乐基座大模型。
42、可选地,所述获取模块,用于获取表征听力健康程度为目标健康值的参考歌曲音频在所述目标维度的听力健康特征;获取所述参考歌曲音频对应的所述内容理解特征;
43、所述融合模块,用于将所述参考歌曲音频对应的所述听力健康特征和所述内容理解特征进行融合,得到参考特征。
44、可选地,所述获取模块,用于获取多个表征听力健康程度为目标健康值的参考歌曲音频对应的参考特征;
45、所述确定模块,用于确定所述多个参考特征对应的平均特征,所述平均特征为所述多个参考特征的均值;确定所述目标特征和所述平均特征的距离值,根据所述距离值以及所述目标健康值,确定所述目标歌曲的听力健康程度。
46、可选地,所述目标维度还包括每分钟节拍数或高低频分布。
47、第三方面,提供了一种计算机设备,计算机设备包括处理器和存储器,存储器中存储有至少一条指令,指令由处理器加载并执行以实现如上述第一方面所述的确定歌曲听力健康程度的方法所执行的操作。
48、第四方面,提供了一种计算机可读存储介质,该存储介质中存储有至少一条指令,指令由处理器加载并执行以实现如上述第一方面所述的确定歌曲听力健康程度的方法所执行的操作。
49、第五方面,提供了一种计算机程序产品,该计算机程序产品中存储有至少一条指令,指令由处理器加载并执行以实现如上述第一方面所述的确定歌曲听力健康程度的方法所执行的操作。
50、本技术提供的技术方案带来的有益效果至少包括:
51、在本技术提供的技术方案中,可以将目标歌曲音频在乐器类型、噪声分布和歌曲流派等维度的特征与目标歌曲音频的音频数据在数据层面的内容理解特征进行融合,得到用于确定听力健康程度的目标特征。这样,可以根据已设定听力健康程度的参考歌曲的参考特征与目标特征之间的相似度,准确的确定目标特征所指示的听力健康程度。