音频相似度检测方法及装置的制造方法

文档序号：8488608阅读：355来源：国知局

音频相似度检测方法及装置的制造方法
【技术领域】
[0001]本发明涉及音频处理技术领域，特别是涉及一种音频相似度检测方法、音频相似度检测装置。
【背景技术】
[0002]随着科技水平的发展，人们可以通过各种途径获取歌曲等影视资料。在日益加快的生活节奏下，人们已经不满足于对影视资料的单纯欣赏，而是通过模仿歌曲等方式来自娱自乐，以达到身心放松、减压的目的。另外，在很多场所，比如，演唱比赛等，需要判断用户演唱的好坏，就需要对选手或用户演唱的歌曲进行评价。然而现有技术中，人们只能够根据自身或他人的感受，粗略地判断出模仿过程中的音频相似度，导致音频相似度判断结果的准确性不高。

【发明内容】

[0003]基于此，有必要针对上述问题，提供一种音频相似度检测方法及装置，能够实现音频相似度的准确评价。
[0004]一种音频相似度检测方法，包括步骤:
[0005]获取待评价音频信号，根据所述待评价音频信号得到音频信号频谱；
[0006]识别所述音频信号频谱的波峰位置；
[0007]获取各所述波峰位置对应的特征值和时间点，根据各所述特征值和时间点得到待评价音频信号的第一时间序列；
[0008]将所述第一时间序列与第二时间序列进行对比，根据对比结果得到待评价音频信号与参考音频信号的相似度，其中所述第二时间序列为预先获取的所述待评价音频信号对应的参考音频信号的时间序列。
[0009]一种音频相似度检测装置，包括:
[0010]音频信号频谱确定模块，用于获取待评价音频信号，根据所述待评价音频信号得到音频信号频谱；
[0011]波峰位置识别模块，用于识别所述音频信号频谱的波峰位置；
[0012]第一时间序列确定模块，用于获取各所述波峰位置对应的特征值和时间点，根据各所述特征值和时间点得到待评价音频信号的第一时间序列；
[0013]相似度检测模块，用于将所述第一时间序列与第二时间序列进行对比，根据对比结果得到待评价音频信号与所述参考音频信号的相似度，其中所述第二时间序列为预先获取的所述待评价音频信号对应的参考音频信号的时间序列。
[0014]本发明音频相似度检测方法及装置，对待评价音频信号进行处理，得到音频信号频谱，识别音频信号频谱的波峰位置，并记录下每一个波峰位置对应的特征值和时间点，组成待评价音频信号的第一时间序列，然后将第一时间序列与参考音频信号的第二时间序列进行相似度分析，根据相似度分析结果得到待评价音频信号的相似度。本发明能够对音频信号进行快速准确的评价，可以应用于多种应用场景。
【附图说明】
[0015]图1为本发明方法实施例的流程示意图；
[0016]图2为本发明装置实施例的结构示意图；
[0017]图3为本发明音频信号频谱确定模块实施例的结构示意图；
[0018]图4为本发明相似度检测模块实施例的结构示意图。
【具体实施方式】
[0019]为了更好的理解本发明解决的技术问题、采取的技术方案以及达到的技术效果，下面结合附图对本发明音频相似度检测方法及装置的【具体实施方式】做详细描述。
[0020]如图1所示，一种音频相似度检测方法，包括步骤:
[0021]S110、获取待评价音频信号，根据所述待评价音频信号得到音频信号频谱；
[0022]S120、识别所述音频信号频谱的波峰位置；
[0023]S130、获取各所述波峰位置对应的特征值和时间点，根据各所述特征值和时间点得到待评价音频信号的第一时间序列；
[0024]S140、将所述第一时间序列与第二时间序列进行对比，根据对比结果得到待评价音频信号与参考音频信号的相似度，其中所述第二时间序列为预先获取的所述待评价音频信号对应的参考音频信号的时间序列。
[0025]对用户演唱歌曲等音频进行录音采样，获得分段的音频信号，其中录音采样的采样频率可以根据具体的需求进行设定。为了实现音频信号相似度的快速评价，可以只将其中一段音频信号作为待评价音频信号，将该段音频信号与相应的参考音频信号进行相似度分析。
[0026]获取到待评价音频信号后，需要将待评价音频信号进行处理，得到音频信号频谱，以便于后续的相似度分析。在一个实施例中，步骤SllO中的根据所述待评价音频信号得到音频信号频谱的步骤可以包括:
[0027]S1101、对所述待评价音频信号进行去干扰；
[0028]S1102、对去干扰后的待评价音频信号进行分帧、预加重、加汉明明窗以及傅立叶变换，得到音频信号频谱。
[0029]对音频信号进行去干扰处理、分帧、预加重、加汉明明窗处理以及傅立叶变换均可以通过现有技术中已有的方法实现。
[0030]得到音频信号频谱后，即可以识别该音频信号频谱中的波峰位置，并得到每一个波峰位置对应的特征值和时间点。每一个特征值对应一个唯一的时间点，这些特征值与对应的时间点组成待评价音频信号的时间序列。需要说明的是，第二时间序列可以按照上述得到第一时间序列相同的方法得到；第一时间序列与第二时间序列仅为了区别是待评价音频信号的时间序列还是参考音频信号的时间序列，并不对时间序列的顺序等加以限定。
[0031]根据第一时间序列和第二时间序列，即可以进行待评价音频信号的相似度分析。在一个实施例中，步骤S140中将所述第一时间序列与第二时间序列进行对比，根据对比结果得到待评价音频信号与参考音频信号的相似度的步骤包括:
[0032]S1401、根据第一时间序列中的特征值的顺序，将第一时间序列中的一个选定特征值与第二时间序列中的各特征值进行匹配，判断所述第二时间序列中是否有与所述选定特征值匹配的特征值；
[0033]S1402、若有，确定所述匹配的特征值对应的时间点与所述选定特征值对应的时间点的时间差，将所述选定特征值以及所述选定特征值后续的各特征值对应的各时间点均加上所述时间差，在所述时间差小于预设阈值时，将特征值匹配的个数加1，并将所述选定特征值的下一个特征值作为新的选定特征值，返回步骤S1401 ；
[0034]S1403、若没有，将第一时间序列中的所述选定特征值的下一个特征值作为新的选定特征值，返回步骤S1401 ；
[0035]S1404、在将第一时间序列中的各选定特征值与第二时间序列中的各特征值匹配完成后，根据第一时间序列中的特征值与第二时间序列中的特征值匹配的个数，得到待评价音频信号与参考音频信号的相似度。
[0036]为了更好的理解上述相似度分析的过程，下面进行详细阐述。
[0037]S1、将第一时间序列中的第一个特征值与第二时间序列中的各特征值进行匹配，在第二时间序列中有与第一个特征值匹配的特征值时进入步骤S2，否则进入S3。其中匹配指的是两个特征值的相似度大于预设阈值，具有相似性。
[0038]S2、计算匹配的特征值与第一个特征值的时间差，将第一时间序列中的第一个特征值以及第一个特征值后面的各个特征值对应的时间点均加上所述时间差。如果所述时间差小于预设阈值，则判断为第二时间序列中有与第一个特征值匹配的特征值，将特征值匹配的个数加I，否则判定为第二时间序列中没有与第一个特征值匹配的特征值。然后进入步骤S3。
[0039]S3、将第一时间序列中的第二个特征值与第二时间序列中的各特征值进行匹配。在第二时间序列中有与第二个特征值匹配的特征值时进入步骤S4,否则进入S5。
[0040]S4、计算匹配的特征值与第二个特征值的时间差，将第一时间序列中的第二个特征值以及第二个特征值后面的各个特征值对应的时间点均加上所述时间差。如果所述时间差小于预设阈值，则判断为第二时间序列中有与第二个特征值匹配的特征值，将特征值匹配的个数加1，否则判定为第二时间序列中没有与第二个特征值匹配的特征值。进入步骤S5o
[0041]S5、将第一时间序列中的第三个特征值与第二时间序列中的各特征值进行匹配。
[0042]......
[0043]按照上述方法，在将第一时间序列中的所有的特征值匹配完后，根据记录的匹配特征值的个数，即可以对待评价音频的相似度进行评价。
[0044]待评价音频可能出现漏音的情况，即第一时间序列中的特征值的数量与第二时间序列中的特征值的数量不相等。所以在评价待评价音频的相似度时，还可以考虑漏音的个数。漏音判断的方法为:将第一时间序列中的某特征值与第二时间序列中的各特征值进行匹配，如果第一时间序列中的某特征值与对应顺序的第二时间序列中的特征值不匹配，及两者的相似度不满足预设阈值，但是第一时间序列中的该特征值与第二时间序列中对应顺序特征值的后面的某一特征值匹配，则说明在第一时间序列的该特征值处出现漏音。例如第一时间序列中的第二个特征值与第二时间序列中的第二个特征值不匹配，但是第一时间序列中的第二个特征值与第二时间序列中的第三个特征值匹配，则说明第一时间序列中的第二个特征值处出现漏音。此时可以将漏音的个数加I。在第一时间序列的各特征值匹配完成后，根据漏音的个数以及匹配特征值的个数，对待评价音频信号的相似度进行评价。
[0045]基于同一发明构思，本发明还提供一种音频相似度检测装置，下面结合附图对本发明装置的【具体实施方式】做详细描述。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：曾荣;吴伟芬;
技术所有人：天翼爱音乐文化科技有限公司;
我是此专利的发明人

上一篇：一种读头传感器的制造方法
上一篇：一种双路麦克风语音降噪处理方法及系统的制作方法