一种五音音乐调式识别方法及系统_2

文档序号:30829616发布日期:2022-07-22 20:30阅读:462来源:国知局
技术特征:
1.一种五音音乐调式识别方法,其特征在于,具体步骤为:(1)获取待识别音乐音频;(2)提取所述待识别音乐音频的色度特征;(3)构建并训练调式识别模型;(4)将所述待识别音乐音频的色度特征输入经过训练的调式识别模型中,即得到所述待识别音乐音频的调式。2.根据权利要求1所述的五音音乐调式识别方法,其特征在于,步骤(2)中所述提取所述待识别音乐音频的色度特征,具体包括:(2.1)对所述待识别音乐音频进行预处理操作,得到所述待识别音乐音频的频谱图;(2.2)将所述待识别音乐音频的频谱图转化为色谱图,所述待识别音乐音频的色谱图为所述待识别音乐音频的色度特征。3.根据权利要求2所述的五音音乐调式识别方法,其特征在于,步骤(2.1)中所述对待识别音乐音频进行预处理操作,具体包括:(2.1.1)对所述待识别音乐音频进行预加重处理,得到加重后的音乐音频;(2.1.2)对所述加重后的音乐音频进行分帧处理,得到分帧后的音乐音频;(2.1.3)对所述分帧后的音乐音频进行加窗处理,得到加窗后的音乐音频;(2.1.4)对所述加窗后的音乐音频进行短时间傅里叶变换,得到待识别音乐音频的频谱图。4.根据权利要求3所述的五音音乐调式识别方法,其特征在于,步骤(2.1.2)中所述加重后的音乐音频进行分帧处理,具体包括:对所述预加重后的音乐音频以512个采样点为一帧的方式进行分帧处理,得到分帧后的音乐音频;所述分帧后的音乐音频中每帧的时间长度为11.61ms,帧间重叠率为50%。5.根据权利要求2所述的五音音乐调式识别方法,其特征在于,步骤(2.2)中所述将所述待识别音乐音频的频谱图转化为色谱图,具体包括:(2.2.1)去除所述待识别音乐音频的频谱图中的泛音,得到去除后的频谱图;(2.2.2)将所述去除后的频谱图进行调音,得到调音后的频谱图;(2.2.3)采用基于响度的方法将所述调音后的频谱图转化为初始色谱图;(2.2.4)对所述初始色谱图的八度音进行合并,并对合并后的色谱图进行归一化处理,得到所述待识别音乐音频的色谱图。6.根据权利要求1所述的五音音乐调式识别方法,其特征在于,步骤(3)中所述构建调式识别模型,该调式识别模型具体包括依次连接的第一长短期记忆模型层、dropout层、第二长短期记忆模型层、全连接层和softmax函数。7.根据权利要求6所述的五音音乐调式识别方法,其特征在于,步骤(3)中所述训练调式识别模型,具体包括:(3.1)获取训练集;所述训练集包括训练音乐音频和对应的标注的调式;(3.2)提取所述训练音乐音频的色度特征;(3.3)将所述训练音乐音频的色度特征和对应的标注的调式,输入机器学习模型中进行训练,并将训练好的机器学习模型确定为调式识别模型。8.根据权利要求7所述的五音音乐调式识别方法,其特征在于,步骤(3.2)中所述提取
训练音乐音频的色度特征,具体包括:(3.2.1)对所述训练音乐音频进行数据增强处理,得到增强后的训练音乐音频;所述数据增强处理包括速度变换和音高变换;(3.2.2)对增强后的训练音乐音频进行预处理操作,得到所述训练音乐音频的频谱图;(3.2.3)将所述训练音乐音频的频谱图转化为色谱图,所述训练音乐音频的色谱图为所述训练音乐音频的色度特征。9.根据权利要求8所述的五音音乐调式识别方法,其特征在于,步骤(3.2.1)中所述对训练音乐音频进行数据增强处理,具体包括:(3.2.1.1)对所述训练音乐音频的速度分别按照1.1、1.2、0.9和0.8倍的速度进行变换,得到速度变换音乐音频;所述速度变换音乐音频包括速度变换前的音乐音频和速度变换后的音乐音频;(3.2.1.2)对所述速度变换音乐音频的音高分别提升和降低1-3个半音,得到音高变换音乐音频;所述音高变换音乐音频包括音高变换前的音乐音频和音高变换后的音乐音频;(3.2.1.3)将所述音高变换音乐音频确定为增强后的训练音乐音频。10.一种五音音乐调式识别系统,包括:音频获取模块,用于获取待识别音乐音频;色度特征提取模块,用于提取所述待识别音乐音频的色度特征;调式识别模型模块;调式识别模型训练与识别模块,用于将所述待识别音乐音频的色度特征输入调式识别模型中,得到所述待识别音乐音频的调式;所述调式识别模型是采用训练集对机器学习模型进行训练得到的;上述四个模块对应于五音音乐调式识别方法4个步骤的操作。

技术总结
本发明属于调式识别技术领域,具体为一种五音音乐调式识别方法及系统。本发明方法,包括:获取待识别音乐音频;提取所述待识别音乐音频的色度特征;构建并训练调式识别模型;将所述待识别音乐音频的色度特征输入经过训练的调式识别模型中,即得到所述待识别音乐音频的调式;本发明系统相应包括4个模块;本发明直接针对音乐音频进行调式识别,能提高识别的精度和识别的可靠性。度和识别的可靠性。度和识别的可靠性。


技术研发人员:李伟 胡佳弋
受保护的技术使用者:复旦大学
技术研发日:2022.03.17
技术公布日:2022/7/21
当前第2页1 2 
网友询问留言 留言:0条
  • 还没有人留言评论。精彩留言会获得点赞!