基于核范数的鲁棒音阶轮廓特征提取算法的制作方法

文档序号:12476002阅读:422来源:国知局
基于核范数的鲁棒音阶轮廓特征提取算法的制作方法与工艺
本发明属于计算机听觉系统中的音频信号分析领域,特别是涉及一种音阶轮廓特征提取算法。本发明提供的方法能准确地恢复不同类型和风格的音乐信号的音阶轮廓特征。
背景技术
:音乐的谐波成分是音乐的重要元素,是音乐信息检索领域的重要课题。音频信号的不同频率的基频及其谐波成分是构成和弦并影响音乐色彩的重要成分。另外,不同频率成分在时间上的延伸时构成和弦行进的关键因素。直观的讲,和弦持续时间内的音乐在频域会呈现一定的结构性——低秩特性。音乐的和弦特征提取属于计算机听觉系统中的音频信号分析中的一部分,这个领域主要处理从声音信号中分离出来的各种各样的信息。同时,音乐的和弦特征也是提取一些高级音乐信息的基础。音乐的中级特征是指从音频信号中提取出来的,并能够表示音频信号的信息,最终能够作为高级特征的一部分。近年来,有许多学者提出了多种能够表征音乐的中级特征。其中应用最为广泛的就是音级轮廓特征(PitchClassProfiles,PCP)。然而,由于原始音乐信号中包含有人声、鼓点、爆破音以及高斯噪声,使得PCP特征性能的好坏与要分析的音乐信号的类型有很大的关系。有许多学者提出了基于PCP的改进方案,例如,Gomez提出的HPCP(HarmonicPCP),Lee提出的EPCP(EnhancedPCP)。这些方案都从改变频域提取成分着手,进而得到适合于特定音乐类型的性能优越的特征。另外,从和弦行进来讲,由于每个和弦都有一定的持续时间,在这段时间内PCP特征的稳定性决定了和弦识别的准确率。有许多学者提出了基于PCP行进-chromagram的改进方案。Fujisjima假定和弦持续数帧,采用滑动窗均值滤波,从而减少噪声的影响,并且避免了和弦频繁变化;GeoffroyPeeters采用滑动窗中值滤波,来避免和弦的频繁变化;Bello假定和弦在一个节拍内是不变化的,使用节拍同步技术来避免和弦频繁变化。大部分节拍跟踪模型由音符端点检测、端点强度曲线周期提取两部分组成。不论哪种模型,端点检测的根本目的都是选取有效的端点曲线的峰值,其本质上是极值点是否为节拍点的聚类问题。可见,大部分和弦特征提取方案都未考虑音乐信号在频谱上表现出来的结构性,应用一些已知的假设,从而采用一些简单的处理方法来优化和弦特征。技术实现要素:基于现有技术,本发明提出了一种基于核范数的鲁棒音阶轮廓特征提取算法,将和弦特征提取问题转化为凸优化问题,利用核范数约束和一范数约束,同时,利用和弦的频谱所表现出来的低秩特性,实现了阈值自适应算法。本发明的一种专基于核范数的鲁棒音阶轮廓特征提取算法,该算法包括以下步骤:步骤1、将待输入音乐信号转换为采样率22050Hz/16bit/单通道的标准音频,作为被参考的音频信号x(n),其中n为转换后音频信号所包含的数据点数;步骤2、对音乐信号x(n)进行加窗处理,窗函数为W(k),其中k为窗函数的窗口宽度,从而得到信号时域矩阵Xk×m,其中X·,m=x(km/2:km/2+m)W(k),m为分帧之后得到的帧数,然后进行傅立叶变换(FourierTransform),得到音乐信号的时频矩阵D=FX,其中F为傅里叶变换矩阵;步骤3、假设音频信号频谱所包含的谐波成分与噪声是相互独立的,即D=A+E,其中矩阵A表示频谱矩阵中所包含的谐波成分做构成的矩阵,而E表示频谱矩阵中所包含的噪声成分所构成的矩阵;根据以上假设,谐波矩阵A的恢复可以归结为以下凸优化问题:s.t.A+E=D其中||||*表示矩阵的核范数(nuclearnorm),即矩阵的奇异值之和;||||1表示矩阵的一范数,即所有非零元素之和;分离出来的矩阵A就是低秩化之后的频谱,而矩阵E则包含稀疏大噪声以及其他非谐波成分,D则是原始的音乐信号的频谱;步骤4、在迭代约束过程中,利用频谱的低秩特性,实现阈值自适应调整算法;具体步骤如下:初始化奇异值截断阈值参数μ,参数λ,迭代索引k=0,临时矩阵Y0=D,E0为全零矩阵;进行奇异值分解得到奇异值矩阵Σ;接着,从μk到1.5μk等间隔选取二十个数据点其中1≤i≤20,对于每个进行奇异值分解逆操作由于谐波成分只分布在数个频率点上,因此计算矩阵中某一列的方差,并从中选取使得方差最大时,所对应的索引i,并使即完成阈值自适应选择算法;计算这一步得到的矩阵更新和k=k+1直至收敛。步骤5、对时频矩阵进行有效的降维处理,得到12维的和弦特征。通常情况下,规定音符A0处的频率440Hz为基准频率,并通过获得其他音符处的频率值。其中b为音符与A0之间的音程差。然后,通过映射公式来对谐波矩阵A的各个频率成分进行映射,从而获得鲁棒音阶轮廓特征向量。其中x对应矩阵A每一行所对应的频率值,而fref则通过获得。与现有技术相比,本发明在不破坏音乐频域原有结构的同时,有效地去除了人声和其他噪声对和弦结构的破坏,提取出了鲁棒性的和弦特征;有效地降低了算法的时间;能准确地恢复不同类型和风格的音乐信号的音阶轮廓特征。附图说明图1为本发明整体流程图;图2为不同类型和弦行进图;图3为本发明与其他算法的结果对比示意图,1、原始ALM算法;2、APS-ALM算法;3、ASP算法。具体实施方式下面结合附图对本发明作进一步详细描述。步骤1、音乐信号转换:将待输入音乐信号转换为采样率22050Hz/16bit/单通道的标准音频,作为被参考的音频信号。步骤2、对音乐信号x(n)进行加窗处理,窗函数为W(k),其中k为窗函数的窗口宽度,从而得到信号时域矩阵Xk×m,其中X·,m=x(km/2:km/2+m)W(k),m为分帧之后得到的帧数,然后进行傅立叶变换(FourierTransform),得到音乐信号的时频矩阵D=FX,其中F为傅里叶变换矩阵;步骤3、频谱低秩化和噪声去除:从频谱中可以看到,音乐信号主要包含两种成分:谐波成分和稀疏大噪声。谐波成分在结构上表现为具有明显的低秩结构;而稀疏大噪声主要表现为稀疏性。因此,用以下凸优化问题对信号频谱进行低秩化,并去除噪声:s.t.A+E=D其中||||*表示矩阵的核范数(nuclearnorm),即矩阵的奇异值之和;||||1表示矩阵的一范数,即所有非零元素之和。分离出来的矩阵A就是低秩化之后的频谱,而矩阵E则包含稀疏大噪声以及一些其他非谐波成分,D则是原始的音乐信号的频谱。步骤4、PCP特征值提取:(4-1)定义一个频谱到PCP特征的映射矩阵,矩阵形式如下:其中2π·ωj,0≤j≤N-1表示频谱中各个频率成分所代表的频率值,N代表频谱获得的频率个数范围;而fi,1≤i≤12则表示12个音阶所对应的频率值。其中,是映射函数,根据十二平均律所得到的函数,具有普适性;(4-2)通过C=P·A得到低秩约束下的和弦行进特征,即RPCP特征。本发明采用了国际音乐信息检索评测比赛(MIREX)的和弦自动识别的测试数据库(PracticeData),共计20个曲风节奏各不相同的音乐片段,同时,每个音乐片段有39或40位专家对该片段的和弦类型进行手工标记。为验证本发明算法的有效性,将本发明所提出的基于核范数的鲁棒性音阶轮廓特征算法对和弦行进的影响与现行流行算法进行比较。采用主要音阶在和弦行进中的平滑程度来对不同算法进行定量描述,从而判断不同算法对和弦行进的影响。结果如图2所示。从实验结果来看,本算法与其他算法相比,会对主要音阶上的和弦行进有更好的平滑作用,使和弦在一定时间内保持稳定,变化的频繁程度降低,这对整首歌曲的和弦识别有指导作用。另外,为了验证本算法对噪声的抑制作用,同时为了验证本算法对和弦识别准确率的影响,我们采用模板匹配算法,并以最为流行的HarmonicPCP作为对比特征,来对本算法的有效性进行说明。实验结果如表1所示。从实验结果中可以看出,本算法所得到的和弦识别准确率比HarmonicPCP提高了9%。表1、基于鲁棒PCP和HPCP的平均和弦识别率比较通常,解决核范数约束低秩凸优化问题的方法是使用增广拉格朗日乘子法(ALM),这种方法对于稀疏矩阵作为输入的应用较为广泛。但是,随着矩阵维度的增加,时间将会大大增加。根据和弦特征独有的特点,本发明提出了一种基于和弦特征的阈值自适应调整算法ASP-ALM(adaptiveselectingparameterArgumentLagrangeMultiplier,ASP-ALM)算法。该算法流程如下:初始化奇异值截断阈值参数μ,参数λ,迭代索引k=0,临时矩阵Y0=D,E0为全零矩阵;进行奇异值分解得到奇异值矩阵Σ;接着,从μk到1.5μk等间隔选取二十个数据点其中1≤i≤20,对于每个进行奇异值分解逆操作由于谐波成分只分布在数个频率点上,因此计算矩阵中某一列的方差,并从中选取使得方差最大时,所对应的索引i,并使即完成阈值自适应选择算法;计算这一步得到的矩阵更新和大三和弦AbABbBCDbDEbEFGbGRPCP(%)76.18076.669.076.171.880.472.979.677.673.363.6HPCP(%)737863.866.771.769.278.464.671.461.268.963.6小三和弦AbmAmBbmBmCmDbmDmEbmEmFmGbmGmRPCP(%)84.8746963.488.2877543.665.280.476.366.7HPCP(%)72.773.767.958.574.585.773.54165.267.963.256.4k=k+1直至收敛。自适应算法算法流程如图1所示。其中μ代表ALM算法中进行矩阵恢复的程度。ASP-ALM算法会极大地降低ALM算法在和弦特征提取过程中的时间消耗。测试结果对比如图3所示:从结果中可以清楚地看到,时间消耗得到了大的降低。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1