一种用于歌曲评分的曲谱生成方法和设备的制造方法

文档序号:9826936阅读:378来源:国知局
一种用于歌曲评分的曲谱生成方法和设备的制造方法
【技术领域】
[0001] 涉及一种音频数据中的信息提取,特别涉及从歌曲中提取曲谱生的方法。
【背景技术】
[0002] 音乐是人类文明的一大产物,音乐不仅仅是一种文明艺术,更是一种社会文化;不 同的音乐具有不同的社会功效,优秀的音乐更具有陶冶情操和灵魂升华的功能。音乐产业 在全世界的娱乐文化产业中占有巨大比例,与影视产业、游戏动漫产业也有千丝万缕的联 系。
[0003] 音乐有许多种类型,歌曲大约是最大的一种。从一首歌曲的内容来看,有三大组成 部分:词、曲、编曲。而"曲"则是一首歌最具显著的特征,是歌曲之间最显著的区别所在。一 首歌的"曲"由伴奏谱和人声谱组成。作为一首歌,人声的部分更是一首歌曲最关键的要素。
[0004] 作为一首歌最关键的要素,人声谱是各种基于内容的音乐信息检索或比对功能的 根基一一例如哼唱检索、音乐原创性比对、基于音乐相似度的推荐算法;另外,人声谱的也 是音乐教学领域、音乐创作领域当中重要的素材。
[0005] 发明人在实现本发明时发现,想要获取歌曲中的人声谱有三种方法,第一种方法 是由歌曲所属的唱片公司直接提供,但是在大多数情况下,唱片公司不会公开出歌曲原始 的人声谱,所以大多情况下往往无法使用第一种方法。
[0006] 第二种是由有音乐训练的工作人员听写出来,是非常的原始和低效的,虽然准确 率是最高的,但是这种方法不能够快速而自动化地完成,而且人力成本很高,特别不适用于 处理大批量歌曲。
[0007] 第三种是从音频信号处理的角度出发,基于人声和各式各样的乐器的声学特征、 或基于其他的监督或无监督机器学习方法,提取出来人声谱。但是在现如今的常见音乐制 作过程中,在混缩前的各种人声、器乐轨都有可能应用各种效果器,而且不同混缩过程都 有可能再叠加各种未知的效果器,所以这个问题变成了半盲源或者全盲源信号分离,所以 这种方法变得更加困难,得出来的人声谱准确性不高。
[0008] 以上三种方法,均不能够满足自动化高效地批量计算出海量歌曲的人声谱的目 的。

【发明内容】

[0009] 以下给出对一个或更多个方面的简化概述以力图提供对此类方面的基本理解。此 概述不是所有构想到的方面的详尽综览,并且既非旨在指认出所有方面的关键性或决定性 要素亦非试图界定任何或所有方面的范围。其唯一的目的是要以简化形式给出一个或更多 个方面的一些概念以作为稍后给出的更加具体的说明之序。
[0010]为此,需要提供一种自动化高效地批量计算出海量歌曲的人声谱的目的方法和设 备
[0011]为实现上述目的,发明人提供了一种用于歌曲评分的曲谱生成方法,其特征在于, 包括步骤,S010、获取原唱音轨中的一段实信号X0和伴奏音轨中与实信号X0对应的一段实 信号XI ;S020、对上述实信号X0和XI实施加窗离散傅里叶变换,得到对应原唱音轨的能量分 布谱X0'和对应伴奏音轨的能量分布谱ΧΓ ;S030、根据能量分布谱X0'和能量分布谱ΧΓ计 算原唱音轨与伴奏音轨在各频段上能量的差值,根据差值获得人声能量分布谱Xmag_diff。 S040、根据人声能量分布谱Xmag_difT计算基础频率;将歌曲分段并对各分段实施上述S010 ~S040步骤,获得各分段对应的基础频率,将各分段对应的基础频率按照时间顺序拼接,即 得到用于歌曲评分的曲谱。
[0012] 区别于现有技术,上述技术方案从对应原唱音轨的实信号X0和对应伴唱音轨的实 信号XI中计算获得人声能量的部分,从而根据人声的能量确定人声的频率(也被称作音 调),使用本方法,可以抵消伴奏中混杂的各种人声、器乐以及各种效果器的影响,增加了 人声识别的准确性。以及使用本方法能够高效自动化的批量处理歌曲,以获得人声部分的 乐谱,人声部分的乐谱可以进一步用于唱歌的评分系统。为能达成前述及相关目的,这一个 或更多个方面包括在下文中充分描述并在所附权利要求中特别指出的特征。以下描述和附 图详细阐述了这一个或更多个方面的某些说明性特征。但是,这些特征仅仅是指示了可采 用各种方面的原理的各种方式中的若干种,并且本描述旨在涵盖所有此类方面及其等效方 面。
【附图说明】
[0013] 以下将结合附图来描述所公开的方面,提供附图是为了说明而非限定所公开的方 面,附图中相似的标号标示相似要素,并且在其中:
[0014] 图1为本发明的一种实施方法;
[0015] 图2为某一首歌的原唱音轨和伴奏音轨示意图;
[0016] 图3为得到对应原唱音轨的能量分布谱X0'和对应伴奏音轨的能量分布谱ΧΓ ;
[0017] 图4为获得的人声能量分布谱Xmag_diff;
[0018] 图5为获得的用于歌曲评分的曲谱;
[0019] 图6为本发明的一种实施方式对应的模块图。
[0020] 附图标记说明:
[0021 ] 10、预处理模块;
[0022] 20、实信号获取模块;
[0023] 30、能量计算模块;
[0024] 40、基础频率计算模块;
[0025] 50、曲谱合成模块。
【具体实施方式】
[0026] 为详细说明技术方案的技术内容、构造特征、所实现目的及效果,以下结合具体实 施例并配合附图详予说明。在以下描述中,出于解释目的阐述了众多的具体细节以提供对 一个或更多个方面的透彻理解。但是显而易见的是,没有这些具体细节也可实践此类方面。
[0027] 本发明提供一种用于歌曲评分的曲谱生成方法,参见图1,步骤如下,
[0028] S010、获取原唱音轨中的一段实信号X0和伴奏音轨中与实信号X0对应的一段实信 号XI;
[0029] S020对上述实信号X0和XI实施加窗傅里叶变换,得到对应原唱音轨的能量分布谱 X0 '和对应伴奏音轨的能量分布谱ΧΓ ;
[0030] S030、根据能量分布谱X0'和能量分布谱ΧΓ计算原唱音轨与伴奏音轨在各频段上 能量的差值,根据差值获得人声能量分布谱X mag_dlff。
[0031 ] S040、根据人声能量分布谱Xmag_diff计算基础频率;
[0032]将歌曲分段并对各分段实施上述S010~S040步骤,获得各分段对应的基础频率, 将各分段对应的基础频率按照时间顺序拼接,即得到用于歌曲评分的曲谱。
[0033] 人声能量分布谱Xmag_diff也被称为人声幅值谱。
[0034] 在一些实施例中,上述方法具体为,获得一首歌原唱音轨的实信号和伴奏音轨的 实信号,然后对它们做加窗傅立叶变换,对窗内的短时信号计算频谱,本方法中通过傅里叶 变换得到的是在一段时间内的频域分布(即能量谱)。优选的分析使用的窗口长度为4096个 采样点,步移长度256个采样点。例如,图2所示的是某一歌曲做加窗傅里叶变换时,所使用 的对应原唱音轨的实信号X0和对应伴唱音轨的实信号XI。实信号X0和实信号XI是具有4096 采样点的短时信号(对应所述歌曲的1:26.600~1:26.685部分)。获得实信号XI和X2之后, 分别对实信号X0和XI做Hamming加窗傅立叶变换,然后分别得到对应原唱音轨的能量分布 谱X0 '和对应伴奏音轨的能量分布谱ΧΓ,对某一首歌的某一连续的4096各采样点做傅里叶 变换后得到的能量分布谱X0'和ΧΓ如图3所示,图中上方的是X0',下方的是ΧΓ )。
[0035] 对上述实信号X0和实信号XI实施傅里叶变换,可以是,
[0036] X0'=fft(x0 · w)
[0037]
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1