副歌检测方法及系统的制作方法

文档序号:9525222阅读:767来源:国知局
副歌检测方法及系统的制作方法
【技术领域】
[0001] 本发明设及语音信号处理领域,具体设及一种副歌检测方法及系统。
【背景技术】
[0002] 流行歌曲一般来说结构简单,形式活泼,易于传唱。从作曲和编曲的角度,流行歌 曲通常包含W下几个部分:主歌、副歌、桥段。主歌可W说是内容,是每首音乐的主干,畐U 歌是指内容区别于主歌、发展与概括性比较强的且在节奏情感曲调上与主歌形成对比的段 落。副歌是歌曲感情最强烈抒发的部分,乐器使用多且音量较大、饱满,概括性很强,并且对 于每一首流行歌曲,其副歌都具有至少2次的旋律重复,因此它通常是每首流行歌曲中最 先为听众熟知的部分。随着数字音乐行业的发展,音乐内容大量增长,越来越多的用户喜欢 直接试听副歌,来选择自己喜欢的歌曲,或者将歌曲的副歌截取出来作为手机铃声或背景 音。因此,如果直接将歌曲的副歌位置检测出来展现给用户,用户直接从该位置试听歌曲, 无疑会给用户带来很大的便利。
[0003] 现有的副歌检测方法一般是根据歌曲歌词的相似性检测副歌,运种方法太过依赖 歌词,当歌曲中的副歌歌词不相同时,现有方法无法检测出副歌所在位置。另外,在实际的 歌曲中,副歌前的主歌的歌词也有可能相同,如下面为《容易受伤的女人》的两段主歌及副 歌的歌词,其中第一段为第一列时间点对应的歌词,第二段为第二列时间点对应的歌词:
[0004] [00:32. 44] [02:14. 1引曾被破碎过的屯、(主歌部分)
[0005] [00:35. 8引[02:16. 1引让你今天轻轻贴近
[0006] [00:39. 96] [02:21. 40]多少安慰及疑问
[0007] [00:42. 21] [02:25. 01]偷偷的再生
[0008] [00:46. 56] [02:28. 24]情难自禁(副歌开始)
[0009] [00:48. 24] [02:29. 92]我却其实属于
[0010] [00:50. 06] [02:31. 72]极度容易受伤的女人
[0011] 可W看出,两段副歌前的主歌歌词完全相同。在运种情况下,容易将主歌也作为副 歌检测出来,因此,现有根据歌词的相似性来检测副歌的准确度较低。

【发明内容】

[0012] 本发明提供一种副歌检测方法及系统,W提高副歌检测的准确度。 阳013] 为此,本发明提供如下技术方案:
[0014] 一种副歌检测方法,包括:
[0015] 接收待检测的音频数据;
[0016] 提取所述音频数据的检测特征,所述检测特征包括所述音频数据不同频段的频域 能量包络的极值点的频率值及能量值;
[0017] 利用提取的检测特征进行副歌检测,得到检测结果。
[0018] 优选地,所述提取所述音频数据的检测特征包括:
[0019] 确定所述音频数据的频域能量包络;
[0020] 获取所述频域能量包络的局部极值点;
[0021] 从所述局部极值点中选出表征所述检测特征的极值点;
[0022] 将选出的极值点对应的频率值及能量值作为当前帖音频数据的检测特征。
[0023] 优选地,所述确定所述音频数据的频域能量包络包括:
[0024] 对所述音频数据进行频域转换;
[00巧]计算频域转换后的音频数据每个频点的能量值;
[00%] 依次连接每个频点的能量值形成所述音频数据的频域能量包络。
[0027] 优选地,所述获取所述频域能量包络的局部极值点包括:
[0028] 将所述频域能量包络的整个频率区间划分为若干子区间,并获取每个子区间内的 极值点;或者
[0029] 确定与所述频域能量包络对应的曲线函数,对所述曲线函数求导得到所述频域能 量包络的局部极值点。
[0030] 优选地,所述从所述局部极值点中选出表征所述检测特征的极值点包括:
[0031] 将低频至高频之间的所述局部极值点作为候选极值点;
[0032] 对所述候选极值点中能量高于设定值的极值点频率对应倍频邻近区域的能量值 进行弱化处理;
[0033] 删除能量低于设定能量阔值的候选极值点;
[0034] 检查是否存在相近的候选极值点,所述相近的候选极值点是指频率差值小于设定 值的两个候选极值点;
[0035] 如果有,则删除其中能量较小的候选极值点,并将剩余的候选极值点作为表征所 述检测特征的极值点。
[0036] 优选地,所述利用提取的检测特征进行副歌检测,得到检测结果包括:
[0037] 依次匹配各帖音频数据,匹配过程包括:
[0038] 查找其它各帖音频数据检测特征中与当前帖音频数据检测特征中各极值点相匹 配的极值点作为所述极值点的匹配极值点;
[0039] 根据当前帖音频数据检测特征中各极值点的能量值和频率值、W及所述匹配极值 点的能量值和频率值,计算当前帖音频数据与各匹配极值点所在帖音频数据的匹配得分;
[0040] 匹配过程完成后,依次检测各帖音频数据,检测过程包括:
[0041] 将与当前帖音频数据匹配得分最低的帖作为检测起始帖;
[0042] 如果所述当前帖音频数据之后连续多帖音频数据分别与所述检测起始帖后相对 应的连续多帖音频数据的匹配得分均为最低,则确定当前帖音频数据及其后连续多帖音频 数据、W及所述检测起始帖及其后连续多帖音频数据为副歌数据;
[0043] 记录所述副歌数据的开始时间和结束时间。
[0044] 一种副歌检测系统,包括:
[0045] 接收模块,用于接收待检测的音频数据;
[0046] 检测特征提取模块,用于提取所述音频数据的检测特征,所述检测特征包括所述 音频数据不同频段的频域能量包络的极值点的频率值及能量值;
[0047] 检测模块,用于利用提取的检测特征进行副歌检测,得到检测结果。
[0048] 优选地,所述检测特征提取模块包括:
[0049] 包络确定单元,用于确定所述音频数据的频域能量包络;
[0050] 局部极值点获取单元,用于获取所述频域能量包络的局部极值点;
[0051] 选择单元,用于从所述局部极值点中选出表征所述检测特征的极值点;
[0052] 特征获取单元,用于将选出的极值点对应的频率值及能量值作为当前帖音频数据 的检测特征。
[0053] 优选地,所述包络确定单元包括:
[0054] 频域转换子单元,用于对所述音频数据进行频域转换;
[0055] 能量值计算子单元,用于计算频域转换后的音频数据每个频点的能量值;
[0056] 包络生成子单元,用于依次连接每个频点的能量值形成所述音频数据的频域能量 包络。
[0057] 优选地,所述局部极值点获取单元,具体用于将所述频域能量包络的整个频率区 间划分为若干子区间,并获取每个子区间内的极值点;或者确定与所述频域能量包络对应 的曲线函数,对所述曲线函数求导得到所述频域能量包络的局部极值点。
[0058] 优选地,所述选择单元包括:
[0059] 候选极值点确定子单元,用于将低频至高频之间的所述局部极值点作为候选极值 占.
[0060] 弱化处理子单元,用于对所述候选极值点中能量高于设定值的极值点频率对应倍 频邻近区域的能量值进行弱化处理;
[0061] 筛选子单元,用于删除能量低于设定能量阔值的候选极值点,然后检查是否存在 相近的候选极值点,所述相近的候选极值点是指频率差值小于设定值的两个候选极值点; 如果有,则删除其中能量较小的候选极值点,并将剩余的候选极值点作为表征所述检测特 征的极值点。
[0062] 优选地,所述检测模块包括:
[0063] 匹配单元,用于依次匹配各帖音频数据,匹配过程包括:查找其它各帖音频数据检 测特征中与当前帖音频数据检测特征中各极值点相匹配的极值点作为所述极值点的匹配 极值点;根据当前帖音频数据检测特征中各极值点的能量值和频率值、W及所述匹配极值 点的能量值和频率值,计算当前帖音频数据与各匹配极值点所在帖音频数据的匹配得分;
[0064] 检测单元,用于在匹配过程完成后,依次检测各帖音频数据,检测过程包括:将与 当前帖音频数据匹配得分最低的帖作为检测起始帖;如果所述当前帖音频数据之后连续多 帖音频数据分
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1