统一速率音频处理方法及装置的制作方法

文档序号:7616841阅读:276来源:国知局
专利名称:统一速率音频处理方法及装置的制作方法
技术领域
本发明涉及一种音频处理方法及装置背景技术不同速率的音频数据给后续的声音信号处理和播放带来很多问题。随着计算机技术的普及,出现了许多不同标准的音频数据格式,一般来说,不同格式音频数据的速率存在差异,即使相同格式的音频数据,也可能存在不同速率的音频数据。一方面随着人们生活水平的提高,对声音效果的追求越来越苛刻。基于数字信号处理的降噪、混响、回声、声场旋转、动态均衡、掐波、变调、变速不变调等后继音效处理成了音频处理系统必备功能。这些音效处理算法绝大多数与音频数据速率密切相关,能自适应处理不同速率音频数据的音效处理算法会复杂化音效处理器结构,大大提高音效处理器成本。另一方面符合AC97(Audio Codec 97)规范的音频处理芯片占据了绝大部分市场份额,AC97音频处理芯片存在众所周知的采样速率转换SRC(Sampling Rate Convert)问题。制定AC97规范时,为节约音频处理器生产成本,AC97音频处理芯片只支持48kHz音频数据。有些芯片厂商为了提高芯片的兼容性,采取简单的插值和抽取算法,SRC输出后的音频采样率为原始信号速率的非整数倍,产生较大的谐波和噪声,影响听感。

发明内容
本发明的目的是提供一种将任意速率的音频数据变换到恒定速率的音频数据的统一速率音频处理方法及装置。它既保留原有音频的频谱结构,又解决了AC97音频控制的采样速率转换SRC问题。
本发明的目的是通过下述处理方法及装置实现的统一速率音频处理方法(步骤)将输入音频数据速率通过插值器的N倍频部件,使输入音频数据速率增加N倍;增加N倍的音频数据速率再通过插值滤波器进行低通滤波,滤除N-1个频谱镜像;把经过插值滤波器的音频数据速率通过抽取器的抽取滤波器进行低通滤波;然后利用抽取器的M分频部件将音频数据速率降到1/M。
为实施上述方法而专门设计的统一速率音频处理装置
由N倍频部件和插值滤波器连接组成的插值器,与由抽取滤波器和M分频部件连接组成的抽取器,插值滤波器和抽取滤波器连接。
所述插值滤波器是多相子插值滤波器并联组成。
本发明由于采用了插值器和抽取器相结合的处理方法,能使任意音频数据速率转化成符合AC97规范的,能被所有音频处理器处理的48kHz的音频数据速率。基于多相子插值滤波器和抽取滤波器的统一速率音频处理算法从频谱结构角度保证了最小失真,最大限度保持原有声音听感,而且显著简化了后续音效处理算法。同时结构简单,成本低。


图1是本发明装置的结构示意图;图2是音频数据输入插值器前的频谱结构示意图;图3是音频数据输出插值器后的频谱结构示意图;图4是音频数据输入抽取器前的频谱结构示意图(fo≥fi);图5是音频数据输出抽取器后的频谱结构示意图(fo≥fi);图6是音频数据输入抽取器前的频谱结构示意图(fo<fi);图7是音频数据输出抽取器后的频谱结构示意图(fo<fi);图8是插值器的工作过程中与音频速率变化相对应的示意图;图9是多相子插值滤波器的工作原理与音频速率变化相对应的示意图。
具体实施例方式
参照图1,本发明由插值器1和抽取器4连接构成。插值器1由N倍增部件2和插值滤波器3连接组成,插值滤波器3是由多相子滤波器11并联而成。抽取器4由抽取滤波器5和M分频部件6连接组成。它是采用芯片FPGA(Field Programmable Gate Array)开发音频速率转换信号处理机,采用多相插值滤波器和抽取滤波器结合的方法,将任意速率的音频数据转化成符合AC97规范的能被,所有音频处理器处理的48kHz的音频数据。
统一速率音频处理算法先给出统一速率音频处理算法结构。现代计算机音频数据速率既有低于48kHz,也有高于48kHz。从常用音频数据速率来看,WAV(Wave)是脉冲编码调制PCM(Pulse Code Modulation)编码,有11.025kHz、22.05kHz、44.1kHz,MP3是MPEG1 Layer3编码,解码后得到PCM编码数据,音频数据速率也有22.05kHz、32kHz、44.1kHz、48kHz、96kHz等。简单的插值和抽取只能改变音频数据速率的整数倍。通用的采样音频数据速率变更算法能以任意有理因子比例改变音频数据速率,其输入与输出的音频数据速率满足fo=NMfi---(1)]]>式中fi为输入音频数据速率,fo为输出音频数据速率,N、M为自然数比例因子。采样速率的转化分两步完成首先通过插值器的N倍频部件2将输入音频数据速率增加到工作频率速率fm=Nfi,然后利用抽取器的M分频部件6将数据速率降到fo=fm/M。
对于输入数据速率为fo=32kHz,如果输出音频数据速率符合AC97要求,则输出音频数据速率fo要求为fo=48kHz。显然要求N=3,M=2,fm=96kHz。当然存在N=1的情况,这时统一速率音频处理算法简化为抽取器4;当M=1,统一速率处理算法简化为插值器1。
统一速率音频处理算法的设计准则就是保持输入/输出音频数据的速率频谱结构。音频数据频谱集中在20Hz~20kHz范围内,无论增加,还是减小音频数据速率,保持该频段内频谱结构不变,如图2、图3所示,图中有有用频谱8。
插值滤波器3扮演低通滤波器功能,滤除N-1个频谱镜像7,其工作频率速率为fm,带宽为fi/2=fm/(2N)。
与插值器1相比较,抽取器4要满足的频谱变换功能略为复杂。插值器1音频数据速率增加,只要滤除N-1个频谱镜像7,不存在频谱混叠现象。抽取器4功能刚好与插值器1功能相反,需要创建出M-1个频谱镜像7。分为两种情况当fo≥fi这种情况比较简单,不存在频谱混叠现象,如图4、图5所示。
此时抽取滤波器5设计非常简单,起到低通滤波器的作用,其工作频率速率为fm,带宽为fo/2=fm/(2M)≥fi/2,不会损失原有频谱。
当fo<fi这种情况比较复杂,抽取滤波器5会滤除部分频谱,如图6、图7所示。
事实上,音频数据速率频谱集中在20Hz~20kHz范围内,AC97规范规定的音频数据速率fo为48kHz,带宽为24kHz的低通抽取滤波器5足以保留音频数据速率fi的频谱,不会对音质产生影响。
多相子插值滤波器9先来考虑N倍频部件2插值,它首先会在输入音频数据速率为fi的低速输入序列x(n)的相邻样本间插入N-1个零值,然后对工作频率速率为fm=Nfi的高速中间序列xup(n)进行FIR(Finite Impulse Responce)低通滤波获得N-1个插值数据,最后获得插值器1输出序列y(n),频谱变换满足图2、图3所示要求,处理过程如图8所示从图8可以看出, 由图2、图3分析可知,插值滤波器3是带宽为fi/2=fm/(2N)的低通滤波器,其数字截止频率为ωc=2πfi/2fm=πN---(3)]]>通带内增益以N取代1,理想的插值低通滤波器系数可以通过逆Fourier变换得到d(k)=12π∫-ππD(ω)ejωπdω=12π∫-π/Nπ/NNejωπdω=sin(πk/N)πk/N---(4)]]>采用Hamming窗进行FIR低通滤波器设计,取窗口长度L=2NK+1,窗口经过因果移位得到低通滤波器h(n)=w(n)d(n-KM) n=0,1,...,L-1 (5)其中w(n)=0.54-0.46cos(2πnL-1)--n=0,1,···,L-1---(6)]]>最后插值器4输出序列y(n)可以通过中间序列xup(n)与h(n)卷积获得y(n)=Σk=0L-1h(k)xup(n-k)---(7)]]>在实际算法实现中,序列插零涉及内存分配和释放等繁琐操作,而且样本个数的增加也会显著增加运算量。仔细分析式(7),采用多相子插值滤波器9可以解决式(7)的计算。由于序列xup(n)是序列x(n)的相邻样本间插入N-1个零值获得,式(7)中n以nN+i(i=0,1,2,...,N-1)代替,k以kN+j(j=0,1,2,...,N-1,k=0,1,2,...,2K-1)代替,则式(7)为y(nN+i)=Σk=02k-1Σj=0N-1h(kN+j)xup(nN+i-kN-j)---(8)]]>定义第i个多相子滤波器9系数和输出分别为hi(k)=h(kN+i)i=0,1,...,N-1 k=0,1,...,2K-1(9)yi(n)=y(nN+i)i=0,1,...,N-1 n=0,1,...,2K-1(10)
而且xup(nN+i-kN-j)=x(n-k)i=j0i≠j---(11)]]>式(9)、(10)、(11)代入式(8)得多相子插值滤波器9卷积公式为yi(n)Σk=02K-1hi(k)x(n-k)--i=0,1,···,N-1---(12)]]>如果采用一般插值滤波器3,由式(7)可以看出,每计算一个插值点需要2L=2NK次乘法,N个插值点共需2N2K次乘法;如果采用多相子插值滤波器9,由式(12)可以看出,每计算一个插值点需要2K次乘法,N个插值点共需2NK次乘法。多相子插值滤波器9实现节约了N倍计算量。多相子插值滤波器9每输入一个低速样本,输出N个滤波值,如图9所示。
抽取器4抽取器4比较简单,经低通抽取滤波器5滤波后,每M个样本保留1个样本即可。由插值器1分析可知存在fo≥fi和fo<fi两种情况,低通滤波器截止频率不一样,因此抽取低通滤波器分别为d(k)=sin(πk/M)πk/Mfo≥fisin(πk/N)πk/Nfo<fi---(13)]]>为了降低旁瓣,对低通滤波器采用汉宁Hanning加窗,同时为了保证因果性,还需要进行移位操作。
权利要求
1.一种统一速率音频处理方法1)将输入音频数据速率通过插值器的N倍频部件,使输入音频数据速率增加N倍;2)增加N倍的音频数据速率再通过插值滤波器进行低通滤波,滤除N-1个频谱镜像;3)把经过插值滤波器的音频数据速率通过抽取器的抽取滤波器进行低通滤波;4)然后利用抽取器的M分频部件将音频数据速率降到1/M。
2.为实施权利要求1而专门设计的装置,其特征在于由N倍频部件(2)和插值滤波器(3)连接组成的插值器(1),与由抽取滤波器(5)和M分频部件(6)连接组成的抽取器(4),插值滤波器(3)和抽取滤波器(5)连接。
3.根据权利要求2所述的装置,其特征在于所述插值滤波器(3)是多相子插值滤波器(11)并联组成。
全文摘要
一种统一速率音频处理方法及装置,是将输入音频数据速率通过插值器的N倍频部件,使其增加N倍;再通过插值滤波器,滤除N-1个频谱镜像;然后经抽取滤波器进行低通滤波;最后经M分频部件将音频数据速率降到1/M。装置是由N倍频部件和插值滤波器连接组成的插值器,与由抽取滤波器和M分频部件连接组成的抽取器相连接。本发明由于采用了插值器和抽取器相结合的处理方法,使任意音频数据速率转化成符合AC97规范的,能被所有音频处理器处理的48kHz的音频数据速率。基于多相子插值滤波器和抽取滤波器的统一速率音频处理算法从频谱结构角度保证了最小失真,最大限度保持原有声音听感,而且显著简化了后续音效处理。同时具有结构简单,成本低。
文档编号H04R5/04GK1776808SQ20051006185
公开日2006年5月24日 申请日期2005年12月6日 优先权日2005年12月6日
发明者郁发新, 郎晓黎 申请人:浙江大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1