基于音频解码器的音调和节奏快速调节方法

文档序号:2829395阅读:326来源:国知局
专利名称:基于音频解码器的音调和节奏快速调节方法
技术领域
本发明涉及一种音调和节奏快速调节方法,尤其是涉及一种基于音频解码器的音调和节奏快速调节方法背景技术随着技术的发展和成本的下降,多媒体设备逐渐得到普及,在多媒体设备上播放音乐和语音就越来越流行。随着不同应用的普及,例如便携式学习机,音调和节奏调节就越来越成为多媒体设备中不可缺少的一项功能。其中音调的调节是在不改变总的播放时间的情况下,改变基音及其谐音的频率来实现;节奏的调节是在不改变音调的情况下,延长或者缩短总的播放时间来实现,音调和节奏的调节可以同时进行。
现有技术中,节奏调节采用时域相关的方法,该方法以帧为单位来改变时域的输出样点的数量。有选择的重复或者丢弃一些样点,在相邻帧之间的过渡部分采取寻找相关最大的一段和上一帧结束的一段做混叠。例如输入N个样点为一帧,如果是节奏变快一倍,经过这个算法的处理,则输出N/2个样点。节奏变慢的方法类似。该方法处理过程中需要占用大量的内存做缓冲,同时由于寻找相关系数最大的样点需要做大量的累乘加操作,运算量较大。
对音调的改变采用频域调节的方法如图1所示,该方法的核心是把时域信号转换成频域信号,对频域信号进行音调搬移(Pitch Shifting)之后,再转换成时域信号。这种通过频域调节的方法,处理过程中需要做一次离散傅立叶变换和一次离散傅立叶反变换,需要的运算量很大。因此,如果用在用在多媒体的音频解码器中,目前常用的这些方法要对输出的音频信号进行音调和节奏的调节时,都要做为一个独立的后处理模块来进行处理,则没有充分利用音频解码器中现有的模块,多媒体中常有的音频解码器的信号处理流程如图2所示,其中有时域到频域的转换处理过程。

发明内容
本发明的目的在于提供一种具有运算量小,占用内存少的音调和节奏的快速调节方法。
上述发明目的可通过以下的技术措施来实现一种基于音频解码器的音调和节奏快速调节方法,音频信号先依次经音频解码器解码、反量化、频域处理,接着对频域处理后的信号进行音调调节,再接着依次经音频解码器对音调调节后的信号进行频域到时域的转换、时域处理;最后时域处理后信号进行节奏调节输出。
本发明所述的音调调节的具体过程为对频域处理后的信号先进行频谱分析,用于改善由于分帧造成的频谱失真,使得到的频谱更接近于实际的频率,再进行音调搬移,用于补偿由于改变输出速率而造成的音调偏移,最后进行频谱综合,用于修复音调搬移造成的频谱失真;频谱综合后利用音频解码器进行频域到时域的转换。
本发明所述音调搬移过程中音调搬移的大小和方向由事先设定的音调和节奏两个参数决定,最终音调搬移的幅度按下式得出Pitch_New=Pitch_fs×(1-Tempo)+Pitch其中Pitch表示设定音调所需调节的幅度,大于0表示音调增高,小于0表示音调降低;Pitcn_fs表示输入样点中最高的音调值;Tempo表示设定节奏,大于1表示变快,小于1表示变慢;Pitcn_New表示最终音调搬移的幅度。
本发明所述的节奏调节的具体过程为根据设定的节奏来改变数模转换(DA)的输出速率。数模转换的输出速率同节奏快慢成正比,节奏变快,数模转换输出速率加大;节奏变慢,数模转换输出速率减小。调节后的输出速率按下式得出SR_New=SR×Tempo;其中SR是原来的DA输出速率,Tempo表示设定节奏,大于1表示变快,小于1表示变慢,SR_New表示调整后的输出速率。
本发明利用音频解码器中已有的前处理模块,在转换前的频域信号进行音调调节,再利用了音频解码中的频域到时域的转换,通过改变输出速率,达到节奏的调节,这样既继承了采用频域调节实现音调改变效果好的优点,同时大大减少了原有音调和节奏调节方法中需要的大量运算,也避免了使用大量的内存缓冲样点数据,同时对音频解码器增加的运算量也很小。


图1为现有技术采用频域调节实现音调改变的流程图;图2为现有的音频解码器的信号处理流程图;图3为本发明的信号处理流程图。
具体实施例方式
如图3所示,本发明具体实施步骤如下(1)音频信号先依次经音频解码器解码、反量化、频域处理,例如MP3解码流程中,首先进行Huffman(霍夫曼)解码,得到量化后的频谱系数,然后把量化后的频谱系数进行反量化处理,最后做一些频域处理,例如联合立体声的处理。
(2)对频域处理后的信号先进行频谱分析,根据编码时采用的时频转换方法,得到加窗的类型等信息,然后把频谱反加窗处理,使得到的频谱系数更接近真实的频谱。
(3)再进行音调搬移,音调搬移是指在原来的基础上主音偏移的大小。音调搬移过程中音调搬移的大小和方向由用户事先设置所需要的音调和节奏两个参数来决定,节奏是指播放的快慢,最终音调搬移的幅度按下式得出Pitch_New=Pitch_fs×(1-Tempo)+Pitch其中Pitch表示设定音调需要调节的幅度,大于0表示音调增高,小于0表示音调降低;Pitch_fs表示输入样点中最高的音调值;Tempo表示设定的节奏,大于1表示变快,小于1表示变慢;Pitch_New表示最终音调搬移的幅度。
根据得出的Pitch_New,进行音调搬移,如果大于0,则表示提高频谱,如果小于0则表示降低频谱。
(4)进行频谱综合,根据频域到时域转换的方法,把搬移后的频谱做调整,进行加窗处理。
(5)频谱综合后利用音频解码器对音调调节后的信号进行频域到时域的转换、时域处理;例如在MP3解码器中,做MDCT(离散余弦变换)和滤波器组综合。
(6)时域处理后信号进行节奏调节输出。节奏调节的具体过程为根据用户事先设置的节奏来改变数模转换(DA)的输出速率。DA的输出速率同节奏快慢成正比,节奏变快,DA输出速率加大;节奏变慢,DA输出速率减小。调节后的输出速率按下式得出SR_New=SR×Tempo;其中SR是原来的DA输出速率,Tempo表示节奏,大于1表示变快,小于1表示变慢,SR_New表示调整后的输出速率。
权利要求
1.一种基于音频解码器的音调和节奏快速调节方法,其特征在于音频信号先依次经音频解码器解码、反量化、频域处理,接着对频域处理后的信号进行音调调节,再接着依次经音频解码器对音调调节后的信号进行频域到时域的转换、时域处理;最后时域处理后信号进行节奏调节输出。
2.根据权利要求1所述的音调和节奏快速调节方法,其特征在于所述的音调调节的具体过程为对频域处理后的信号先进行频谱分析,用于改善由于分帧造成的频谱失真,使得到的频谱更接近于实际的频率;再进行音调搬移,用于补偿由于改变输出速率而造成的音调偏移;最后进行频谱综合,用于修复音调搬移造成的频谱失真;频谱综合后利用音频解码器进行频域到时域的转换。
3.根据权利要求2所述的音调和节奏快速调节方法,其特征在于所述音调搬移过程中音调搬移的大小和方向由事先设定的音调和节奏两个参数决定,最终音调搬移的幅度按下式得出Pitch_New=Pitch_fs×(1-Tempo)+Pitch其中Pitch表示设定音调所需调节的幅度,大于0表示音调增高,小于0表示音调降低;Pitch_fs表示输入样点中最高的音调值;Tempo表示设定节奏,大于1表示变快,小于1表示变慢;Pitch_New表示最终音调搬移的幅度。
4.根据权利要求1所述的音调和节奏快速调节方法,其特征在于所述的节奏调节的具体过程为根据设定的节奏来改变数模转换的输出速率;数模转换的输出速率同节奏快慢成正比,节奏变快,数模转换输出速率加大;节奏变慢,数模转换输出速率减小;调节后的输出速率按下式得出SR_New=SR×Tempo;其中SR是原来的数模转换输出速率,Tempo表示设定节奏,大于1表示变快,小于1表示变慢,SR_New表示调整后的输出速率。
全文摘要
本发明公开了一种基于音频解码器的音调和节奏快速调节方法,音频信号先依次经音频解码器解码、反量化、频域处理,接着对频域处理后的信号进行音调调节,再接着依次经音频解码器对音调调节后的信号进行频域到时域的转换、时域处理;最后时域处理后信号进行节奏调节输出。本发明利用音频解码器中已有的前处理模块,在转换前的频域信号进行音调调节,再利用了音频解码中的频域到时域的转换,通过改变输出速率,达到节奏的调节,这样既继承了采用频域调节实现音调改变效果好的优点,同时大大减少了原有音调和节奏调节方法中需要的大量运算,也避免了使用大量的内存缓冲样点数据,同时对音频解码器增加的运算量也很小。
文档编号G10H1/00GK1831940SQ20061003488
公开日2006年9月13日 申请日期2006年4月7日 优先权日2006年4月7日
发明者黄立新 申请人:安凯(广州)软件技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1