基于稀疏表示的音乐和弦自动识别方法

文档序号：2833197阅读：320来源：国知局

专利名称：基于稀疏表示的音乐和弦自动识别方法
技术领域：
本发明属于计算机听觉技术领域，涉及一种音乐和弦识别方法。
背景技术：
随着互联网上音乐信息的存储和发布越来越普遍，音乐信息的存储量呈现出急剧增长态势，在这种情况下，单纯的基于文本的检索己经不能满足应用的需求。于是，基于内容的音乐信息检索(Music Information Retrieval,MIR)成为近几年来国内外学者研究的热点之一。现有的大多数对音乐信息的检索是通过Mel频率倒谱系数(Mel-FrequencyCepstral Coefficients, MFCC)等底层特征进行分析的。虽然Mel频率倒谱系数反应了人耳的听觉特性，然而该特征与音乐的语义内容并没有直接关系，因此在很多应用方面，这些底层特征所表现出来的信息量往往难以直接应用，而一些中层特征则包含了大量的音乐信息，能够更好地表现音乐的属性，对音乐内容的分析更加具有实用价值，其中，和弦就是典型的中层特征。不仅如此，和弦还可以为音乐的高层特征应用服务。例如，如果能够将任意一段音乐音频正确地转化为和弦序列的系统可以实现音乐结构的分割，能够识别出一段特定的旋律。另外，由于谐波进程与音乐潜在的情感有着密切的联系，因此在风格、情感相似的歌曲中很容易发现相同的和弦。由此可见，在音乐检索领域，音乐的情感分析领域，和弦都会起到至关重要的作用。音乐和弦识别的算法主要集中在两个方面特征提取和识别模型。现在用于和弦识别的特征虽然众多，但是大都是音高类别分布参数(Pitch Class Profiles, PCP)的变体，该特征不仅能表示音乐的结构，还能够表示音乐的谐波信息。用于和弦识别的分类器主要有基于模板的分类器和基于隐马尔科夫模型(Hidden Markov Model, HMM)的分类器。但是这两种分类器的识别效果都不佳，识别率集中在70%到80%之间。若是将和弦识别运用到实际中，这个结果显然有待提高。专利CN101123085提出通过拍子检测、小节检测、基音检测等单元来确定和弦名，该方法的每一个检测单元的错误可能会直接影响到后面的检测单元，这样三个检测单元的层层错误的传递和累积会影响最后的识别结果。近年来，基于最小一范数的稀疏表示分类器(Sparse Representation basedClassification, SRC)已经成功应用于模式识别与分类的很多领域，尤其在人脸识别中，表现出很强的稳定性和鲁棒性。该方法为基于内容的音乐语义符号的识别提供了全新的理论和技术支撑。SRC在音乐乐器分类、音乐流派分类、钢琴演奏转录等领域同样取得了良好的识别效果，而且该分类器不会产生累加错误，也不需要HMM中模型训练的过程，但目前尚未有基于最小一范数稀疏表示分类器用于音乐和弦自动识别的报道。

发明内容
本发明的目的是克服现有技术的上述不足，提供一种能够准确、快速地将不同的和弦检测出来的音乐和弦的自动识别方法，它主要是结合音乐理论知识分析音频数据并快速准确的识别出每种和弦，所分析的乐曲没有局限于某种固定的音乐风格。本发明的音乐和弦自动识别方法，包括下列步骤I)自实际音乐音频中截取同一和弦的不同样本，建立K个和弦的模板数据库；2)对每个和弦的每个样本提取MFCC和PCP两种特征，得到每个和弦的每个样本的特征矢量，构成每个和弦的特征矩阵Ai, Ai为第i个和弦的特征矩阵，i=l, 2，. . .，K ;3)实现和弦的自动分类，方法如下将特征矩阵按和弦类别分块，得到分块后的特征矩阵A= [A1, A2,. . .，Ai,. . .，Ak]，设y为待识别和弦样本的特征矢量，x代表待识别和弦样本关于特征矩阵A的系数向量，求出满足等式y=Ax，并使X的一范数I |x I |1最小的解X，F^x1，x2，...xKf，天与Ai对应,i=l, 2,... ,K ;分别保留K个和弦对应的系数矣,构建K个矢量^④二队^七儿力]7^=]^ 2，. . .，K,矢量4(天)的维数与支相同;4)求取二范数r,(.v) = Iy-^oMI2，i=l，2，...，K，由二范数最小值对应的i确定y 所对应的和弦。在特征选取方面，本发明选择了在其它识别系统中被成功采用的具有12维特征向量的PCP特征，并与传统的音乐特征向量MFCC相结合。相对于传统的仅依靠PCP这一种特征识别和弦相比，MFCC可以反映和弦旋律的低频段，具有较好的平滑性和感知性，正好可以弥补PCP没有考虑听者因素这一缺陷。然后将特征向量输入基于最小一范数稀疏表示分类器建模的和弦识别系统。最后我们将本实验结果同MIREX08、09中收录的多种和弦识别方法进行比较。从表I中可以看出该方法优于现有的任何一种方法，说明了 SRC具有良好的分类效果。

图I.本发明和弦识别流程图。图2.提取和弦特征的流程图。图3 大E和弦的PCP图。图4 (a)被测试的某大E和弦的36维特征图；(b)图计算所得的最小一范数解；(c)图测试和弦关于24类和弦的冗余图。
具体实施例方式下面结合附图和实施例对本发明做进一步说明。图I为本发明的总流程图。具体步骤如下I.建立音乐数据库自实际音乐音频中截取同一和弦的不同样本，建立K个和弦的模板数据库。其中每个和弦的不同样本应尽可能涵盖不同音色的乐器及不同的演奏风格等。该数据库来自于由Harte和Sandier标注的Beatles乐队的13首专辑(180首歌,采样率44100赫兹,16比特，单通道)。从这180首歌曲中截取所需的大三和弦和小三和弦共24类，每一类60个样本，几乎涵盖了该乐队的所有演奏风格。I..建立音乐数据库所述的有监督和弦模板数据库是自音乐音频中截取K个和弦的多个样本。其中每个和弦的不同样本应尽可能涵盖不同音色的乐器及不同的演奏风格等。
2.提取音乐特征首先将所有的音乐数据格式转化成WAV格式，单通道。对每个和弦的每个样本提取MFCC和PCP两种特征，，得到每个和弦的每个样本的特征矢量，构成每个和弦的特征矩阵Ai, Ai为第i个和弦的特征矩阵，i=l, 2，. . .，K，其流程图如图2所示。a.计算MFCC特征具体的计算步骤如下①将时域离散和弦音乐信号进行预加重，分帧和加窗处理。预加重滤波器是一阶的，系统函数为H(z)=l-uz—1 ;取巾贞长为N，巾贞移为
权利要求
1.一种基于稀疏表示的音乐和弦自动识别方法，包括下列步骤 .1)自实际音乐音频中截取同一和弦的不同样本，建立K个和弦的模板数据库； .2)对每个和弦的每个样本提取MFCC和PCP两种特征，得到每个和弦的每个样本的特征矢量，构成每个和弦的特征矩阵Ai, Ai为第i个和弦的特征矩阵，i=l, 2，…，K ; .3)实现和弦的自动分类，方法如下将特征矩阵按和弦类别分块，得到分块后的特征矩阵A=LA1, A2,. . .，Ai,. . .，Ak]，设y为待识别和弦样本的特征矢量，x代表待识别和弦样本关于特征矩阵A的系数向量，求出满足等式y=Ax，并使X的一范数I |X| |:最小的解i ,V2,....VjcJr,矣与Ai对应，i=l, 2， . ，K ;分别保留K个和弦对应的系数為，构建K个矢量4(无)=[0,..，0，1,，0...(^，1=1，2，K，矢量办矣)的维数与i相同。
.4)求取二范数=J = \，2,…，K，由二范数最小值对应的i确定Y所对应的和弦。
全文摘要
本发明属于计算机听觉技术领域，涉及一种基于稀疏表示的音乐和弦自动识别方法，包括自实际音乐音频中截取同一和弦的不同样本，建立K个和弦的模板数据库；对每个和弦的每个样本提取MFCC和PCP两种特征，得到每个和弦的每个样本的特征矢量，构成每个和弦的特征矩阵；实现和弦的自动分类；进行最小化二范数，由二范数最小值对应的i确定y所对应的和弦。本发明能够准确、快速地将不同的和弦检测出来，所分析的乐曲不局限于某种固定的音乐风格。
文档编号G10L19/02GK102723079SQ201210185639
公开日2012年10月10日申请日期2012年6月7日优先权日2012年6月7日
发明者关欣, 李锵, 董丽梦申请人:天津大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：关欣;李锵;董丽梦
技术所有人：天津大学
我是此专利的发明人