一种音频编解码方法与装置的制作方法

文档序号:2837077阅读:230来源:国知局
专利名称:一种音频编解码方法与装置的制作方法
技术领域
本发明涉及一种编码解码方法和装置,尤其涉及一种对音频信号进行编码解码的方法和装置。

背景技术
暂态信号是一种特殊的音频信号,多存在于有敲打乐器的音频序列中,例如,连续的敲锣打鼓产生的信号可以称之为暂态信号。它的特殊性在于,如果用常规的变换编码,例如MDCT(修正离散余弦变换)方法,对其进行编码,由于量化噪声的存在,会产生预回声现象。产生预回声现象的原因是由于量化比特不够所带来的量化噪声,量化噪声均匀的扩散到整个时域里,在暂态信号出现之前的那段信号会被量化噪声占据,进而产生预回声现象。预回声现象是人耳不能忍受的一种听觉上的失真,因此需要一种特殊的方法对暂态信号进行编解码。
现在有两类技术处理这种暂态信号,一种是长短窗切换处理,另一种是时域噪声整形处理方法。长短窗切换需要很大的运算开销和占用很多的缓存空间,时域噪声整形处理方法利用频域的自适应预测的结果对时域中量化噪声的分布作整形处理,其处理方法相对较为简单,但由于其对时域包络提取不够完全,会产生一些其他的失真。


发明内容
本发明的目的在于解决上述问题,提供了一种音频编码方法与对应的解码方法,避免了暂态音频信号的预回声现象,减弱了暂态信号的失真。
本发明还提供了一种音频编码装置与对应的解码装置,避免了暂态音频信号的预回声现象,减弱了暂态信号的失真。
本发明的技术方案为本发明提出了一种音频编码方法,对暂态信号进行编码,包括 对输入音频的暂态信号进行时域处理,得到新的时域信号; 将输入帧的采样点x1,x2,…,xN分成L段,其中N为输入帧长度,L为任意自然数且小于等于N; 计算每个段的能量Ei,其中i为1~L的自然数; 计算该输入帧各段能量的平均能量E0; 计算每个段对应的乘性参数λi=r(bitrate)*E0/Ei,其中i为1~L的自然数,r(bitrate)是一个与比特率相关的函数; 将该输入帧所有段的采样点都乘上对应的乘性参数λi,得到处理后的采样点x1’,x2’,…,xN’,同时将乘性参数λi送到码流传输; 将该处理后的采样点x1’,x2’,…,xN’经时频变换编码后输出至码流。
上述的音频编码方法,其中,将输入帧的采样点x1,x2,…,xN均分为32段。
上述的音频编码方法,其中,将输入帧的采样点x1,x2,…,xN均分为16段。
上述的音频编码方法,其中,将输入帧的采样点x1,x2,…,xN根据暂态出现的位置分成均匀或非均匀的若干段。
上述的音频编码方法,其中,计算每个段能量的公式为其中Ai表示该输入帧的其中一个段。
上述的音频编码方法,其中,计算当前输入帧的平均能量公式为 上述的音频编码方法,其中,比特率相关函数r(bitrate)中比特率BR为自变量,自变量BR指平均一个声道的比特率,当比特率BR<35k时函数值为15.0,当35k≤BR<37.5k时函数值为10.0,当37.5k≤BR<40k时函数值为8.5,当40k≤BR<42.5k时函数值为7.0,当42.5k≤BR<45k时函数值为6.0,当45k≤BR<47.5k时函数值为4.8,当47.5k≤BR<50k时函数值为3.9,当50k≤BR<52.5k时函数值为3.6,当52.5k≤BR<55k时函数值为3.4,当55k≤BR<57.5k时函数值为2.2,当57.5k≤BR<60k时函数值为1.5,当60k≤BR<62.5k时函数值为1.2,当BR≥62.5k时函数值为1.1。
本发明另外提出了一种音频编码方法,对暂态信号进行编码,包括 对输入音频的暂态信号进行时域处理; 将输入帧的采样点x1,x2,…,xN分成L段,其中N为输入帧长度,L为任意自然数且小于等于N; 计算每个段的能量Ei,其中i为1~L的自然数; 计算该输入帧各段能量的平均能量E0; 对于该输入帧的每一段,判断比特率相关函数r与E0/Ei的乘积和门限T的大小; 对乘积小于门限T的段Ai,对该段采样点乘上对应的乘性参数λi,其中λi=r(bitrate)*E0/Ei; 将这些乘性参数λi传输到码流,同时得到处理后的采样点x1’,x2’,…,xN’; 将该处理后的采样点x1’,x2’,…,xN’经时频变换编码后输出至码流。
上述的音频编码方法,其中,将输入帧的采样点x1,x2,…,xN均分为32段。
上述的音频编码方法,其中,将输入帧的采样点x1,x2,…,xN均分为16段。
上述的音频编码方法,其中,将输入帧的采样点x1,x2,…,xN根据暂态出现的位置分成均匀或非均匀的若干段。
上述的音频编码方法,其中,计算每个段能量的公式为其中Ai表示该输入帧的其中一个段。
上述的音频编码方法,其中,计算输入帧各段能量的平均能量的公式为 上述的音频编码方法,其中,该门限T是预设的。
上述的音频编码方法,其中,比特率相关函数r(bitrate)中比特率BR为自变量,自变量BR指平均一个声道的比特率,当比特率BR<35k时函数值为15.0,当35k≤BR<37.5k时函数值为10.0,当37.5k≤BR<40k时函数值为8.5,当40k≤BR<42.5k时函数值为7.0,当42.5k≤BR<45k时函数值为6.0,当45k≤BR<47.5k时函数值为4.8,当47.5k≤BR<50k时函数值为3.9,当50k≤BR<52.5k时函数值为3.6,当52.5k≤BR<55k时函数值为3.4,当55k≤BR<57.5k时函数值为2.2,当57.5k≤BR<60k时函数值为1.5,当60k≤BR<62.5k时函数值为1.2,当BR≥62.5k时函数值为1.1。
本发明提出了一种音频解码方法,对暂态信号进行解码,包括 将码流进行频时变换后得到处理后的采样点x1’,x2’,…,xN’; 从码流中得到乘性参数λi; 将采样点x1’,x2’,…,xN’各自除以对应的乘性参数λi后,得到原始的采样点x1,x2,…,xN; 时域处理,进行时域信号合成。
基于上述的方法,本发明还提出了一种音频编码装置,对暂态信号进行编码,包括 时域处理模块,对输入音频的暂态信号进行时域处理,得到新的时域信号; 分段模块,将输入帧的采样点x1,x2,…,xN分成L段,其中N为输入帧长度,L为任意自然数且小于等于N; 段能量计算模块,计算每个段的能量Ei,其中i为1~L的自然数; 输入帧平均能量计算模块,计算该输入帧各段能量的平均能量E0; 乘性参数计算模块,计算每个段对应的乘性参数λi=r(bitrate)*E0/Ei,其中i为1~L的自然数,r(bitrate)是一个与比特率相关的函数; 伸缩模块,将该输入帧所有段的采样点都乘上对应的乘性参数λi,得到处理后的采样点x1’,x2’,…,xN’; 乘性参数传输模块,将乘性参数λi送到码流传输; 时频变换编码模块,将该处理后的采样点x1’,x2’,…,xN’经时频变换编码后输出至码流。
上述的音频编码装置,其中,该分段模块将输入帧的采样点x1,x2,…,xN均分为32段。
上述的音频编码装置,其中,该分段模块将输入帧的采样点x1,x2,…,xN均分为16段。
上述的音频编码装置,其中,该分段模块将输入帧的采样点x1,x2,…,xN根据暂态出现的位置分成均匀或非均匀的若干段。
上述的音频编码装置,其中,该段能量计算模块计算每个段能量的公式为其中Ai表示该输入帧的其中一个段。
上述的音频编码装置,其中,该输入帧各段能量的平均能量计算模块计算输入帧平均能量的公式为 上述的音频编码装置,其中,该比特率相关函数r(bitrate)中比特率BR为自变量,自变量BR指平均一个声道的比特率,当比特率BR<35k时函数值为15.0,当35k≤BR<37.5k时函数值为10.0,当37.5k≤BR<40k时函数值为8.5,当40k≤BR<42.5k时函数值为7.0,当42.5k≤BR<45k时函数值为6.0,当45k≤BR<47.5k时函数值为4.8,当47.5k≤BR<50k时函数值为3.9,当50k≤BR<52.5k时函数值为3.6,当52.5k≤BR<55k时函数值为3.4,当55k≤BR<57.5k时函数值为2.2,当57.5k≤BR<60k时函数值为1.5,当60k≤BR<62.5k时函数值为1.2,当BR≥62.5k时函数值为1.1。
本发明另外提出了一种音频编码装置,对暂态信号进行编码,包括 时域处理模块,对输入音频的暂态信号进行时域处理,得到新的时域信号; 分段模块,将输入帧的采样点x1,x2,…,xN分成L段,其中N为输入帧长度,L为任意自然数且小于等于N; 段能量计算模块,计算每个段的能量Ei,其中i为1~L的自然数; 输入帧平均能量计算模块,计算该输入帧各段能量的平均能量E0; 乘性参数计算模块,计算每个段对应的乘性参数λi=r(bitrate)*E0/Ei,其中i为1~L的自然数,r(bitrate)是一个与比特率相关的函数; 判断模块,对于该输入帧的每一段,判断比特率相关函数r(bitrate)与E0/Ei的乘积和门限T的大小; 伸缩模块,对乘积小于门限T的段Ai,对该段采样点乘上对应的乘性参数λi,得到处理后的采样点x1’,x2’,…,xN’; 乘性参数传输模块,将乘性参数λi传输到码流; 时频变换编码模块,将该处理后的采样点x1’,x2’,…,xN’经时频变换编码后输出至码流。
上述的音频编码装置,其中,该分段模块将输入帧的采样点x1,x2,…,xN均分为32段。
上述的音频编码装置,其中,该分段模块将输入帧的采样点x1,x2,…,xN均分为16段。
上述的音频编码装置,其中,该分段模块将输入帧的采样点x1,x2,…,xN根据暂态出现的位置分成均匀或非均匀的若干段。
上述的音频编码装置,其中,该段能量计算模块计算每个段能量的公式为其中Ai表示该输入帧的其中一个段。
上述的音频编码装置,其中,该输入帧平均能量计算模块计算输入帧各段能量的平均能量的公式为 上述的音频编码装置,其中,该判断模块的门限T是预设的。
上述的音频编码装置,其中,该比特率相关函数r(bitrate)中比特率BR为自变量,自变量BR指平均一个声道的比特率,当比特率BR<35k时函数值为15.0,当35k≤BR<37.5k时函数值为10.0,当37.5k≤BR<40k时函数值为8.5,当40k≤BR<42.5k时函数值为7.0,当42.5k≤BR<45k时函数值为6.0,当45k≤BR<47.5k时函数值为4.8,当47.5k≤BR<50k时函数值为3.9,当50k≤BR<52.5k时函数值为3.6,当52.5k≤BR<55k时函数值为3.4,当55k≤BR<57.5k时函数值为2.2,当57.5k≤BR<60k时函数值为1.5,当60k≤BR<62.5k时函数值为1.2,当BR≥62.5k时函数值为1.1。
本发明提出了一种音频解码装置,对暂态信号进行解码,包括 频时变换模块,将码流进行频时变换后得到处理后的采样点x1’,x2’,…,xN’; 乘性参数获得模块,从码流中得到乘性参数λi; 反伸缩模块,将采样点x1’,x2’,…,xN’各自除以对应的乘性参数λi后,得到原始的采样点x1,x2,…,xN; 时域处理模块,对采样点信号进行时域处理,时域信号合成。
本发明对比现有技术有如下的有益效果本发明通过在编码端对暂态信号做变换编码之前对输入帧的时域采样点进行伸缩处理,同时在解码端对其进行反伸缩处理恢复成原始信号,避免了暂态音频信号的预回声现象,减弱了暂态信号的失真。



图1是本发明的音频编码方法的一个较佳实施例的流程图。
图2是本发明的音频编码方法的另一较佳实施例的流程图。
图3是本发明的音频解码方法的一个较佳实施例的流程图。
图4是本发明的音频编码装置的一个较佳实施例的框图。
图5是本发明的音频编码装置的另一较佳实施例的框图。
图6是本发明的音频解码装置的一个较佳实施例的框图。

具体实施例方式 下面结合附图和实施例对本发明作进一步的描述。
图1示出了本发明的音频编码方法的一个较佳实施例的流程,下面结合图1对流程中各步骤加以详细描述。
步骤S10对输入音频的暂态信号进行时域处理,得到新的时域信号。这一步是传统的信号处理方式,包括滤波器组的设计、增益控制、长短窗选取等。
步骤S11将输入帧的采样点x1,x2,…,xN分成L段,其中N为输入帧长度,L为任意自然数且小于等于N。这些采样点x1,x2,…,xN被分成其中l0=1,lL=N。
这里的分段方式多种多样,可以将所有的采样点均分为32段,也可以将所有的采样点均分为16段,也可以将所有的采样点根据暂态出现的位置分成非均匀或均匀的若干段。
步骤S12计算该输入帧中每个段的能量Ei,其中i为1~L的自然数。计算公式为其中Ai表示该输入帧的其中一个段。
步骤S13计算当前输入帧各段能量的平均能量E0。计算公式为 步骤S14计算该输入帧每个段对应的乘性参数λi,公式为λi=r(bitrate)*E0/Ei,其中i为1~L的自然数。
这里的函数r(bitrate)是一个与比特率相关的函数,其自变量BR为比特率,是指一个声道的比特率,比如当前有两个声道且总的比特率为120k,则自变量BR为120K/2=60k。函数的具体形式见下表 步骤S15将该输入帧所有段的采样点都乘上对应的乘性参数λi,得到处理后的采样点x1’,x2’,…,xN’。同时将这些乘性参数λi传输到码流中。伸缩处理的公式为 步骤S16将处理后的采样点x1’,x2’,…,xN’经时频变换编码后输出至码流。
基于上述的方法,本发明还提出了一种音频编码装置,请参见图4。音频编码装置1包括时域处理模块10、分段模块11、输入帧平均能量计算模块12、段能量计算模块13、乘性参数计算模块14、乘性参数传输模块15、伸缩模块16和时频变换编码模块17。
时域处理模块10对输入音频的暂态信号进行时域处理,得到新的时域信号,其中包括传统的滤波器组、增益控制模块、长短窗选取模块等。分段模块11将输入帧的采样点x1,x2,…,xN分成L段,其中N为输入帧长度,L为任意自然数且小于等于N。这些采样点x1,x2,…,xN被分成其中l0=1,lL=N。这里的分段方式多种多样,可以将所有的采样点均分为32段,也可以将所有的采样点均分为16段,也可以将所有的采样点根据暂态出现的位置分成非均匀或均匀的若干段。
段能量计算模块13计算该输入帧中每个段的能量Ei,其中i为1~L的自然数,计算公式为其中Ai表示该输入帧的其中一个段。输入帧平均能量计算模块12计算该当前输入帧的各个分段的平均能量E0,计算公式为乘性参数计算模块14计算该输入帧每个段对应的乘性参数λi,公式为λi=r(bitrate)*E0/Ei,其中i为1~L的自然数,r(bitrate)是一个与比特率相关的函数。函数r(bitrate)的形式见上述实施例的表格,在此不再赘述。由乘性参数传输模块15将这些乘性参数送至码流传输。伸缩模块16将该输入帧所有段的采样点都乘上对应的乘性参数λi,得到处理后的采样点x1’,x2’,…,xN’,伸缩处理的公式为时频变换编码模块17将处理后的采样点x1’,x2’,…,xN’经时频变换编码后输出至码流。
本发明另外提出了一种音频编码方法的较佳实施例,流程如图2所示。下面结合图2对流程各步骤加以详细的描述。
步骤S20对输入的音频暂态信号的采样信号进行时域处理。这一步是传统的信号处理方式,包括滤波器组的设计、增益控制、长短窗选取等。
步骤S21将输入帧的采样点x1,x2,…,xN分成L段,其中N为输入帧长度,L为任意自然数且小于等于N。这些采样点x1,x2,…,xN被分成其中l0=1,lL=N。
这里的分段方式多种多样,可以将所有的采样点均分为32段,也可以将所有的采样点均分为16段,也可以将所有的采样点根据暂态出现的位置分成均匀或非均匀的若干段。
步骤S22计算该输入帧中每个段的能量Ei,其中i为1~L的自然数。计算公式为其中Ai表示该输入帧的其中一个段。
步骤S23计算该输入帧所有分段能量的平均能量E0。计算公式为 步骤S24对于输入帧中的每一段Ai,判断比特率相关函数r(bitrate)与E0/Ei的乘积和门限T的大小,即r(bitrate)*E0/Ei和门限的T的大小。
对乘积小于门限T的段Ai,对该段采样点乘上对应的乘性参数λi,其中λi=r(bitrate)*E0/Ei。即对部分段Ai做伸缩处理,对其他的段中的采样点则不进行处理。
其中门限T是预设的,可以是任意值,而且函数r(bitrate)是一个和比特率有关的函数,在不同的比特率下有不同的函数值,具体形式请见第一实施例中的表格,在此不再赘述。
步骤S25将这些乘性参数送到码流传输,同时得到处理后的采样点点x1’,x2’,…,xN’ 步骤S26将处理后的采样点x1’,x2’,…,xN’经时频变换编码后输出至码流。
基于上述的方法,本发明还提出了一种音频编码装置,请参见图5。音频编码装置2包括时域处理模块20、分段模块21、输入帧平均能量计算模块22、段能量计算模块23、乘性参数计算模块24、判断模块25、伸缩模块26、时频变换编码模块27和乘性参数传输模块28。
时域处理模块20对输入音频的暂态信号进行时域处理,形成新的时域信号,其中包括传统的滤波器组、增益控制模块、长短窗选取模块等。分段模块21将输入帧的采样点x1,x2,…,xN分成L段,其中N为输入帧长度,L为任意自然数且小于等于N。这些采样点x1,x2,…,xN被分成其中l0=1,lL=N。这里的分段方式多种多样,可以将所有的采样点均分为32段,也可以将所有的采样点均分为16段,也可以将所有的采样点根据暂态出现的位置分成非均匀或均匀的若干段。
段能量计算模块23计算该输入帧中每个段的能量Ei,其中i为1~L的自然数,计算公式为其中Ai表示该输入帧的其中一个段。输入帧平均能量计算模块22计算该输入帧所有分段的平均能量E0,计算公式为乘性参数计算模块24计算该输入帧每个段对应的乘性参数λi,公式为λi=r(bitrate)*E0/Ei,其中i为1~L的自然数,函数r(bitrate)是一个和比特率有关的函数,在不同的比特率下有不同的函数值,具体形式请见第一实施例中的表格,在此不再赘述。由乘性参数传输模块28将这些乘性参数送至码流传输。
判断模块25对于输入帧中的每一段Ai,判断比特率相关函数r(bitrate)与E0/Ei的乘积(即乘性参数)和门限T的大小,即r(bitrate)*E0/Ei和门限的T的大小。对乘积小于门限T的段,由伸缩模块26对该段采样点乘上对应的乘性参数λi,其中λi=r(bitrate)*E0/Ei。即对部分段Ai做伸缩处理,时频变换编码模块27将处理后的采样点x1’,x2’,…,xN’经时频变换编码后输出至码流。
基于上述实施例的编码方法,本发明提出了与编码相对应的解码方法。下面结合图3对解码方法的一个较佳实施例的流程步骤加以详细的描述。
步骤S30将码流进行频时变换后得到处理后的采样点x1’,x2’,…,xN’。该步骤是图2中步骤S26的逆过程。
步骤S31从码流中得到乘性参数λi。
步骤S32将采样点x1’,x2’,…,xN’各自除以对应的乘性参数λi后,得到原始的采样点x1,x2,…,xN。即对每一段进行如下处理实际上该步骤是编码实施例中步骤S15或S24的逆过程。
步骤S33时域处理,利用综合滤波器进行时域信号合成。该步骤是编码实施例中步骤S10或S20的逆过程。
基于上述方法,本发明提出了一种音频解码装置。音频解码装置6包括频时变换模块30、反伸缩模块31、乘性参数获得模块32和时域处理模块33。频时变换模块30对码流进行频时变换后得到采样点x1’,x2’,…,xN’。乘性参数获得模块32从码流中得到乘性参数λi。反伸缩模块31将采样点x1’,x2’,…,xN’各自除以对应的乘性参数λi后,得到原始的采样点x1,x2,…,xN。时域处理模块33对采样点信号进行时域处理,时域信号合成。
上述实施例是提供给本领域普通技术人员来实现或使用本发明的,本领域普通技术人员可在不脱离本发明的发明思想的情况下,对上述实施例做出种种修改或变化,因而本发明的保护范围并不被上述实施例所限,而应该是符合权利要求书提到的创新性特征的最大范围。
权利要求
1一种音频编码方法,对暂态信号进行编码,包括
对输入音频的暂态信号进行时域处理,得到新的时域信号;
将输入帧的采样点x1,x2,…,xN分成L段,其中N为输入帧长度,L为任意自然数且小于等于N;
计算每个段的能量Ei,其中i为1~L的自然数;
计算该输入帧各段能量的平均能量E0;
计算每个段对应的乘性参数λi=r(bitrate)*E0/Ei,其中i为1~L的自然数,r(bitrate)是一个与比特率相关的函数;
将该输入帧所有段的采样点都乘上对应的乘性参数λi,得到处理后的采样点x1’,x2’,…,xN’,同时将乘性参数λi送到码流传输;
将该处理后的采样点x1’,x2’,…,xN’经时频变换编码后输出至码流。
2根据权利要求1所述的音频编码方法,其特征在于,将输入帧的采样点x1,x2,…,xN均分为32段。
3根据权利要求1所述的音频编码方法,其特征在于,将输入帧的采样点x1,x2,…,xN均分为16段。
4根据权利要求1所述的音频编码方法,其特征在于,将输入帧的采样点x1,x2,…,xN根据暂态出现的位置分成均匀或非均匀的若干段。
5根据权利要求1所述的音频编码方法,其特征在于,计算每个段能量的公式为其中Ai表示该输入帧的其中一个段。
6根据权利要求5所述的音频编码方法,其特征在于,计算当前输入帧的平均能量公式为
7根据权利要求1所述的音频编码方法,其特征在于,比特率相关函数r(bitrate)中比特率BR为自变量,自变量BR指平均一个声道的比特率,当比特率BR<35k时函数值为15.0,当35k≤BR<37.5k时函数值为10.0,当37.5k≤BR<40k时函数值为8.5,当40k≤BR<42.5k时函数值为7.0,当42.5k≤BR<45k时函数值为6.0,当45k≤BR<47.5k时函数值为4.8,当47.5k≤BR<50k时函数值为3.9,当50k≤BR<52.5k时函数值为3.6,当52.5k≤BR<55k时函数值为3.4,当55k≤BR<57.5k时函数值为2.2,当57.5k≤BR<60k时函数值为1.5,当60k≤BR<62.5k时函数值为1.2,当BR≥62.5k时函数值为1.1。
8一种音频编码方法,对暂态信号进行编码,包括
对输入音频的暂态信号进行时域处理;
将输入帧的采样点x1,x2,…,xN分成L段,其中N为输入帧长度,L为任意自然数且小于等于N;
计算每个段的能量Ei,其中i为1~L的自然数;
计算该输入帧各段能量的平均能量E0;
对于该输入帧的每一段,判断比特率相关函数r与E0/Ei的乘积和门限T的大小;
对乘积小于门限T的段Ai,对该段采样点乘上对应的乘性参数λi,其中λi=r(bitrate)*E0/Ei;
将这些乘性参数λi传输到码流,同时得到处理后的采样点x1’,x2’,…,xN’;
将该处理后的采样点x1’,x2’,…,xN’经时频变换编码后输出至码流。
9根据权利要求8所述的音频编码方法,其特征在于,将输入帧的采样点x1,x2,…,xN均分为32段。
10根据权利要求8所述的音频编码方法,其特征在于,将输入帧的采样点x1,x2,…,xN均分为16段。
11根据权利要求8所述的音频编码方法,其特征在于,将输入帧的采样点x1,x2,…,xN根据暂态出现的位置分成均匀或非均匀的若干段。
12根据权利要求8所述的音频编码方法,其特征在于,计算每个段能量的公式为其中Ai表示该输入帧的其中一个段。
13根据权利要求12所述的音频编码方法,其特征在于,计算输入帧各段能量的平均能量的公式为
14根据权利要求8所述的音频编码方法,其特征在于,该门限T是预设的。
15根据权利要求8所述的音频编码方法,其特征在于,比特率相关函数r(bitrate)中比特率BR为自变量,自变量BR指平均一个声道的比特率,当比特率BR<35k时函数值为15.0,当35k≤BR<37.5k时函数值为10.0,当37.5k≤BR<40k时函数值为8.5,当40k≤BR<42.5k时函数值为7.0,当42.5k≤BR<45k时函数值为6.0,当45k≤BR<47.5k时函数值为4.8,当47.5k≤BR<50k时函数值为3.9,当50k≤BR<52.5k时函数值为3.6,当52.5k≤BR<55k时函数值为3.4,当55k≤BR<57.5k时函数值为2.2,当57.5k≤BR<60k时函数值为1.5,当60k≤BR<62.5k时函数值为1.2,当BR≥62.5k时函数值为1.1。
16一种音频解码方法,对暂态信号进行解码,包括
将码流进行频时变换后得到处理后的采样点x1’,x2’,…,xN’;
从码流中得到乘性参数λi;
将采样点x1’,x2’,…,xN’各自除以对应的乘性参数λi后,得到原始的采样点x1,x2,…,xN;
时域处理,进行时域信号合成。
17一种音频编码装置,对暂态信号进行编码,包括
时域处理模块,对输入音频的暂态信号进行时域处理,得到新的时域信号;
分段模块,将输入帧的采样点x1,x2,…,xN分成L段,其中N为输入帧长度,L为任意自然数且小于等于N;
段能量计算模块,计算每个段的能量Ei,其中i为1~L的自然数;
输入帧平均能量计算模块,计算该输入帧各段能量的平均能量E0;
乘性参数计算模块,计算每个段对应的乘性参数λi=r(bitrate)*E0/Ei,其中i为1~L的自然数,r(bitrate)是一个与比特率相关的函数;
伸缩模块,将该输入帧所有段的采样点都乘上对应的乘性参数λi,得到处理后的采样点x1’,x2’,…,xN’;
乘性参数传输模块,将乘性参数λi送到码流传输;
时频变换编码模块,将该处理后的采样点x1’,x2’,…,xN’经时频变换编码后输出至码流。
18根据权利要求17所述的音频编码装置,其特征在于,该分段模块将输入帧的采样点x1,x2,…,xN均分为32段。
19根据权利要求17所述的音频编码装置,其特征在于,该分段模块将输入帧的采样点x1,x2,…,xN均分为16段。
20根据权利要求17所述的音频编码装置,其特征在于,该分段模块将输入帧的采样点x1,x2,…,xN根据暂态出现的位置分成均匀或非均匀的若干段。
21根据权利要求17所述的音频编码装置,其特征在于,该段能量计算模块计算每个段能量的公式为其中Ai表示该输入帧的其中一个段。
22根据权利要求21所述的音频编码装置,其特征在于,该输入帧各段能量的平均能量计算模块计算输入帧平均能量的公式为
23根据权利要求17所述的音频编码装置,其特征在于,该比特率相关函数r(bitrate)中比特率BR为自变量,自变量BR指平均一个声道的比特率,当比特率BR<35k时函数值为15.0,当35k≤BR<37.5k时函数值为10.0,当37.5k≤BR<40k时函数值为8.5,当40k≤BR<42.5k时函数值为7.0,当42.5k≤BR<45k时函数值为6.0,当45k≤BR<47.5k时函数值为4.8,当47.5k≤BR<50k时函数值为3.9,当50k≤BR<52.5k时函数值为3.6,当52.5k≤BR<55k时函数值为3.4,当55k≤BR<57.5k时函数值为2.2,当57.5k≤BR<60k时函数值为1.5,当60k≤BR<62.5k时函数值为1.2,当BR≥62.5k时函数值为1.1。
24一种音频编码装置,对暂态信号进行编码,包括
时域处理模块,对输入音频的暂态信号进行时域处理,得到新的时域信号;
分段模块,将输入帧的采样点x1,x2,…,xN分成L段,其中N为输入帧长度,L为任意自然数且小于等于N;
段能量计算模块,计算每个段的能量Ei,其中i为1~L的自然数;
输入帧平均能量计算模块,计算该输入帧各段能量的平均能量E0;
乘性参数计算模块,计算每个段对应的乘性参数λi=r(bitrate)*E0/Ei,其中i为1~L的自然数,r(bitrate)是一个与比特率相关的函数;
判断模块,对于该输入帧的每一段,判断比特率相关函数r(bitrate)与E0/Ei的乘积和门限T的大小;
伸缩模块,对乘积小于门限T的段Ai,对该段采样点乘上对应的乘性参数λi,得到处理后的采样点x1’,x2’,…,xN’;
乘性参数传输模块,将乘性参数λi传输到码流;
时频变换编码模块,将该处理后的采样点x1’,x2’,…,xN’经时频变换编码后输出至码流。
25根据权利要求24所述的音频编码装置,其特征在于,该分段模块将输入帧的采样点x1,x2,…,xN均分为32段。
26根据权利要求24所述的音频编码装置,其特征在于,该分段模块将输入帧的采样点x1,x2,…,xN均分为16段。
27根据权利要求24所述的音频编码装置,其特征在于,该分段模块将输入帧的采样点x1,x2,…,xN根据暂态出现的位置分成均匀或非均匀的若干段。
28根据权利要求24所述的音频编码装置,其特征在于,该段能量计算模块计算每个段能量的公式为其中Ai表示该输入帧的其中一个段。
29根据权利要求28所述的音频编码装置,其特征在于,该输入帧平均能量计算模块计算输入帧各段能量的平均能量的公式为
30根据权利要求24所述的音频编码装置,其特征在于,该判断模块的门限T是预设的。
31根据权利要求24所述的音频编码装置,其特征在于,该比特率相关函数r(bitrate)中比特率BR为自变量,自变量BR指平均一个声道的比特率,当比特率BR<35k时函数值为15.0,当35k≤BR<37.5k时函数值为10.0,当37.5k≤BR<40k时函数值为8.5,当40k≤BR<42.5k时函数值为7.0,当42.5k≤BR<45k时函数值为6.0,当45k≤BR<47.5k时函数值为4.8,当47.5k≤BR<50k时函数值为3.9,当50k≤BR<52.5k时函数值为3.6,当52.5k≤BR<55k时函数值为3.4,当55k≤BR<57.5k时函数值为2.2,当57.5k≤BR<60k时函数值为1.5,当60k≤BR<62.5k时函数值为1.2,当BR≥62.5k时函数值为1.1。
32一种音频解码装置,对暂态信号进行解码,包括
频时变换模块,将码流进行频时变换后得到处理后的采样点x1’,x2’,…,xN’;
乘性参数获得模块,从码流中得到乘性参数λi;
反伸缩模块,将采样点x1’,x2’,…,xN’各自除以对应的乘性参数λi后,得到原始的采样点x1,x2,…,xN;
时域处理模块,对采样点信号进行时域处理,时域信号合成。
全文摘要
本发明公开了一种音频编码方法与对应的解码方法,避免了暂态音频信号的预回声现象,减弱了暂态信号的失真。其技术方案为对输入音频的暂态信号进行时域处理;将输入帧的采样点x1,x2,…,xN分成L段,其中N为输入帧长度,L为任意自然数且小于等于N;计算每个段的能量Ei,其中i为1~L的自然数;计算该输入帧各段能量的平均能量E0;计算每个段对应的乘性参数λi=r(bitrate)*E0/Ei,其中i为1~L的自然数,r(bitrate)是一个与比特率相关的函数;将该输入帧所有段的采样点都乘上对应的乘性参数λi,得到处理后的采样点x1’,x2’,…,xN’,同时将乘性参数λi送到码流传输;将该处理后的采样点x1’,x2’,…,xN’经时频变换编码后输出至码流。本发明应用于移动通信领域。
文档编号G10L19/02GK101308655SQ200710040710
公开日2008年11月19日 申请日期2007年5月16日 优先权日2007年5月16日
发明者张本好, 黄鹤云, 昙 李, 林福辉 申请人:展讯通信(上海)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1