一种用于歌曲评分的曲谱生成方法和设备的制造方法

文档序号：9826936阅读：378来源：国知局

一种用于歌曲评分的曲谱生成方法和设备的制造方法
【技术领域】
[0001] 涉及一种音频数据中的信息提取，特别涉及从歌曲中提取曲谱生的方法。
【背景技术】
[0002] 音乐是人类文明的一大产物，音乐不仅仅是一种文明艺术，更是一种社会文化;不同的音乐具有不同的社会功效，优秀的音乐更具有陶冶情操和灵魂升华的功能。音乐产业在全世界的娱乐文化产业中占有巨大比例，与影视产业、游戏动漫产业也有千丝万缕的联系。
[0003] 音乐有许多种类型，歌曲大约是最大的一种。从一首歌曲的内容来看，有三大组成部分:词、曲、编曲。而"曲"则是一首歌最具显著的特征，是歌曲之间最显著的区别所在。一首歌的"曲"由伴奏谱和人声谱组成。作为一首歌，人声的部分更是一首歌曲最关键的要素。
[0004] 作为一首歌最关键的要素，人声谱是各种基于内容的音乐信息检索或比对功能的根基一一例如哼唱检索、音乐原创性比对、基于音乐相似度的推荐算法；另外，人声谱的也是音乐教学领域、音乐创作领域当中重要的素材。
[0005] 发明人在实现本发明时发现，想要获取歌曲中的人声谱有三种方法，第一种方法是由歌曲所属的唱片公司直接提供，但是在大多数情况下，唱片公司不会公开出歌曲原始的人声谱，所以大多情况下往往无法使用第一种方法。
[0006] 第二种是由有音乐训练的工作人员听写出来，是非常的原始和低效的，虽然准确率是最高的，但是这种方法不能够快速而自动化地完成，而且人力成本很高，特别不适用于处理大批量歌曲。
[0007] 第三种是从音频信号处理的角度出发，基于人声和各式各样的乐器的声学特征、或基于其他的监督或无监督机器学习方法，提取出来人声谱。但是在现如今的常见音乐制作过程中，在混缩前的各种人声、器乐轨都有可能应用各种效果器，而且不同混缩过程都有可能再叠加各种未知的效果器，所以这个问题变成了半盲源或者全盲源信号分离，所以这种方法变得更加困难，得出来的人声谱准确性不高。
[0008] 以上三种方法，均不能够满足自动化高效地批量计算出海量歌曲的人声谱的目的。

【发明内容】

[0009] 以下给出对一个或更多个方面的简化概述以力图提供对此类方面的基本理解。此概述不是所有构想到的方面的详尽综览，并且既非旨在指认出所有方面的关键性或决定性要素亦非试图界定任何或所有方面的范围。其唯一的目的是要以简化形式给出一个或更多个方面的一些概念以作为稍后给出的更加具体的说明之序。
[0010]为此，需要提供一种自动化高效地批量计算出海量歌曲的人声谱的目的方法和设备
[0011]为实现上述目的，发明人提供了一种用于歌曲评分的曲谱生成方法，其特征在于，包括步骤，S010、获取原唱音轨中的一段实信号X0和伴奏音轨中与实信号X0对应的一段实信号XI ;S020、对上述实信号X0和XI实施加窗离散傅里叶变换，得到对应原唱音轨的能量分布谱X0'和对应伴奏音轨的能量分布谱ΧΓ ;S030、根据能量分布谱X0'和能量分布谱ΧΓ计算原唱音轨与伴奏音轨在各频段上能量的差值，根据差值获得人声能量分布谱Xmag_diff。 S040、根据人声能量分布谱Xmag_difT计算基础频率;将歌曲分段并对各分段实施上述S010 ~S040步骤，获得各分段对应的基础频率，将各分段对应的基础频率按照时间顺序拼接，即得到用于歌曲评分的曲谱。
[0012] 区别于现有技术，上述技术方案从对应原唱音轨的实信号X0和对应伴唱音轨的实信号XI中计算获得人声能量的部分，从而根据人声的能量确定人声的频率（也被称作音调），使用本方法，可以抵消伴奏中混杂的各种人声、器乐以及各种效果器的影响，增加了人声识别的准确性。以及使用本方法能够高效自动化的批量处理歌曲，以获得人声部分的乐谱，人声部分的乐谱可以进一步用于唱歌的评分系统。为能达成前述及相关目的，这一个或更多个方面包括在下文中充分描述并在所附权利要求中特别指出的特征。以下描述和附图详细阐述了这一个或更多个方面的某些说明性特征。但是，这些特征仅仅是指示了可采用各种方面的原理的各种方式中的若干种，并且本描述旨在涵盖所有此类方面及其等效方面。
【附图说明】
[0013] 以下将结合附图来描述所公开的方面，提供附图是为了说明而非限定所公开的方面，附图中相似的标号标示相似要素，并且在其中：
[0014] 图1为本发明的一种实施方法；
[0015] 图2为某一首歌的原唱音轨和伴奏音轨示意图；
[0016] 图3为得到对应原唱音轨的能量分布谱X0'和对应伴奏音轨的能量分布谱ΧΓ ;
[0017] 图4为获得的人声能量分布谱Xmag_diff;
[0018] 图5为获得的用于歌曲评分的曲谱；
[0019] 图6为本发明的一种实施方式对应的模块图。
[0020] 附图标记说明：
[0021 ] 10、预处理模块；
[0022] 20、实信号获取模块；
[0023] 30、能量计算模块；
[0024] 40、基础频率计算模块；
[0025] 50、曲谱合成模块。
【具体实施方式】
[0026] 为详细说明技术方案的技术内容、构造特征、所实现目的及效果，以下结合具体实施例并配合附图详予说明。在以下描述中，出于解释目的阐述了众多的具体细节以提供对一个或更多个方面的透彻理解。但是显而易见的是，没有这些具体细节也可实践此类方面。
[0027] 本发明提供一种用于歌曲评分的曲谱生成方法，参见图1，步骤如下，
[0028] S010、获取原唱音轨中的一段实信号X0和伴奏音轨中与实信号X0对应的一段实信号XI;
[0029] S020对上述实信号X0和XI实施加窗傅里叶变换，得到对应原唱音轨的能量分布谱 X0 '和对应伴奏音轨的能量分布谱ΧΓ ;
[0030] S030、根据能量分布谱X0'和能量分布谱ΧΓ计算原唱音轨与伴奏音轨在各频段上能量的差值，根据差值获得人声能量分布谱X mag_dlff。
[0031 ] S040、根据人声能量分布谱Xmag_diff计算基础频率；
[0032]将歌曲分段并对各分段实施上述S010~S040步骤，获得各分段对应的基础频率，将各分段对应的基础频率按照时间顺序拼接，即得到用于歌曲评分的曲谱。
[0033] 人声能量分布谱Xmag_diff也被称为人声幅值谱。
[0034] 在一些实施例中，上述方法具体为，获得一首歌原唱音轨的实信号和伴奏音轨的实信号，然后对它们做加窗傅立叶变换，对窗内的短时信号计算频谱，本方法中通过傅里叶变换得到的是在一段时间内的频域分布（即能量谱）。优选的分析使用的窗口长度为4096个采样点，步移长度256个采样点。例如，图2所示的是某一歌曲做加窗傅里叶变换时，所使用的对应原唱音轨的实信号X0和对应伴唱音轨的实信号XI。实信号X0和实信号XI是具有4096 采样点的短时信号(对应所述歌曲的1:26.600~1:26.685部分）。获得实信号XI和X2之后，分别对实信号X0和XI做Hamming加窗傅立叶变换，然后分别得到对应原唱音轨的能量分布谱X0 '和对应伴奏音轨的能量分布谱ΧΓ，对某一首歌的某一连续的4096各采样点做傅里叶变换后得到的能量分布谱X0'和ΧΓ如图3所示，图中上方的是X0'，下方的是ΧΓ )。
[0035] 对上述实信号X0和实信号XI实施傅里叶变换，可以是，
[0036] X0'=fft(x0 · w)
[0037]

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张瑞怀;董昌朝;刘小峰;陈伟煌;
技术所有人：福建省百利亨信息科技有限公司;
我是此专利的发明人

上一篇：具有凹进区的近场换能器的制造方法
上一篇：一种基于语音相似性识别的s-t教学过程分析方法