编码装置、解码装置及其方法

文档序号：2824891阅读：325来源：国知局

专利名称：编码装置、解码装置及其方法
技术领域：
本发明涉及编码装置、解码装置及其方法。
背景技术：
在语音编码中，主要存在两个类型的编码技术，即变换编码和TCXCTransform Coded excitation，变换码激励)编码(例如，参照非专利文献1)。变换编码例如包括如下步骤使用离散傅立叶变换(DFT)或改进离散余弦变换 (MDCT)，将信号从时域变换为频域。另外，变换编码中，将频谱系数量化而进行编码。几种一般的变换编码有MPEG MP3、MPEGACC (例如参照非专利文献2、、以及Dolby AC3。变换编码在音乐信号和一般的语音信号中很有效率。

图1表示变换编码系统10的简化结构。图1所示的变换编码系统10的编码装置中，时间-频率变换单元11使用离散傅立叶变换(DFT)或改进离散余弦变换(MDCT)等，将时域的信号S (η)变换为频域的信号S (f)。频谱系数量化单元12对频域的信号S (f)进行量化，从而获得量化参数。复用单元13将量化参数进行复用并传输到解码装置侧。在图1所示的变换编码系统10的解码装置中，首先，分离单元14分离所有的比特流信息而生成量化参数。频谱系数解码单元15对量化参数进行解码，生成被解码的频域信号S (f)。频率-时间变换单元16使用离散傅立叶逆变换(IDFT)或改进离散余弦逆变换 (IMDCT)等，将被解码的频域的信号S (f)变换为时域，从而生成被解码的时域的信号S (η)。相对于此，在TCX编码中，使用时域(线性预测)技术和频域(变换编码)技术的组合。TCX编码中，利用时域中的语音信号的冗余性，对输入语音信号应用线性预测，由此获得残差(激励)信号。在为语音信号的情况下，特别在为有声区间(谐振效应和较高的基音周期分量)的情况下，通过该模式，可极为高效地生成音频再现信号。在线性预测之后，将残差(激励)信号变换为频域，并高效率地进行编码。一般的几种TCX编码有AMR-WB+、 ITU. T G. 729. 1和ITU. T G. 718 (例如，参照非专利文献4)。图2表示TCX编码系统20的简化结构。在图2所示的TCX编码系统20的编码装置中，LPC分析单元21为了利用时域中的信号的冗余性，对于输入信号进行LPC分析。LPC反滤波器单元22使用来自LPC分析的LPC 系数，对输入信号S (η)适用LPC反滤波器，从而获得残差(激励)信号民(η)。时间_频率变换单元23使用例如离散傅立叶变换(DFT)或改进离散余弦变换(MDCT)等，将残差信号 Sr (η)变换为频域的信号&(f)。频谱系数量化单元M对频域的信号进行量化，复用单元25将量化参数进行复用并传输到解码装置侧。在图2所示的TCX编码系统20的解码装置中，首先，分离单元沈分离所有的比特流信息而生成量化参数。频谱系数解码单元27对量化参数进行解码，生成被解码的频域的残差信号S^(f)。频率-时间变换单元观使用离散傅立叶逆变换(IDFT)或改进离散余弦逆变换(IMDCT)等，将被解码的频域的残差信号S:(f)变换为时域，从而生成被解码的时域的残差信号S夂(n)。LPC合成滤波器单元四使用被解码的LPC参数，对被解码的时域的残差信号进行处理，获得被解码的时域的信号S (η)。变换编码和TCX编码中的变换编码部分一般都利用某种量化方法来进行。矢量量化中的一种方法称为脉冲矢量编码(pulse vector coding) 0例如，在非专利文献3中，提出了在MDCT区域中对LPC残差进行量化的阶乘脉冲编码(Factorial Pulse Coding，是一种脉冲矢量编码)(参照图4)。阶乘脉冲编码是一种脉冲矢量编码，脉冲矢量编码的编码信息是单位振幅脉冲(unit magnitude pulse)。在新标准化的语音编码ITU-T G. 718中，以在MDCT区域中对LPC残差进行量化为目的，在第五层使用阶乘脉冲编码(FPC)。在图3所示的TCX编码系统30的编码装置中，MDCT单元31通过改进离散余弦变换，将时域的信号民(η)变换为频域的信号&(f)。FPC编码单元32在MDCT区域中对LPC 残差进行量化。在该编码装置中，通过脉冲矢量编码，求出多个脉冲和其位置、振幅和极性，并且，为了将脉冲归一化为单位振幅，计算全局增益(global gain)。图4是表示FPC编码单元32的一例结构的图。如图4所示，脉冲矢量编码的编码参数是全局增益、脉冲的位置、脉冲的振幅和脉冲的极性。图5是用于说明可编码的脉冲数(表示为M)和输入信号的频谱系数之数(表示为N)的关系的图。如图5所示，在脉冲矢量编码的情况下，可编码的脉冲数M取决于输入信号的频谱系数之数N和可利用的比特数。也就是说，在可利用的比特数为固定时，N越多则M越少，N越少则M越多。在N为固定时，可利用的比特数越多则M越多，可利用的比特数越少则M越少。图6示意地表示脉冲矢量编码。在长度N的输入频谱S(f)中，将M个脉冲以及其位置、振幅和极性，与一个全局增益一起进行编码。另一方面，在解码后，在生成的频谱S (f)中，仅生成M个脉冲和其位置、振幅和极性，其外的所有频谱系数都设定为零。现有技术文献非专利文献[非专利文献 1]Lefebvre，et al, "High quality coding of wideband audio signals using transform coded excitation (TCX)，，，IEEE International Conference on Acoustics, Speech, and Signal Processing, vol. 1,pp.I/193-I/196, Apr. 1994[非专利文献 2]Karl Heinz Brandenburg, "MP3and AAC Explained”，AES17th International Conference, Florence, Italy, September 1999.[非专利文献 3]Udar Mittal, James P. Ashley and Edgardo M. Cruz_Zeno "Low complexity factorial pulse coding of MDCT coefficients using approximation of combinatorial functions",IEEE International Conference on Acoustics,Speech and Signal Processing，pp.1-289-1—292，April 2007.[非专利文献 4]T. Vaillancourt et al, "ITU-T EV-VBR :A Robust 8_32kbit/ sScalable Coder for Error Prone Telecommunication Channels", in Proc. Eusipco, Lausanne, Switzerland, August 2008

发明内容
发明要解决的问题
可是，通常在较低的比特率下，进行编码的频谱系数的数比通过脉冲矢量编码进行编码的脉冲数多得多。例如，在非专利文献3中，提出了下面的表1所示的四个条件。[表1]
权利要求
1.编码装置，包括时间频率变换单元，将编码对象信号变换为频域信号；有效范围确定单元，在所述频域信号的频带内确定有效范围；以及脉冲矢量编码单元，仅对所述有效范围内的信号分量进行脉冲矢量编码。
2.如权利要求1所述的编码装置，所述有效范围确定单元包括频谱确定单元，在所述频域信号中，从振幅的绝对值最大的频谱系数起确定多个的频谱系数；最小位置确定单元，在所述多个的频谱系数的频率位置中，检测最低频率作为所述有效范围的始点；以及最大位置确定单元，在所述多个的频谱系数的频率位置中，检测最高频率作为所述有效范围的终点。
3.如权利要求2所述的编码装置，所述最小位置确定单元和所述最大位置确定单元通过排列地存储所述多个的频谱系数的位置，并对所述排列进行排序，从而检测所述最低频率和所述最高频率。
4.如权利要求2所述的编码装置，所述有效范围确定单元输出所述最低频率和所述最高频率作为有效范围信息。
5.如权利要求1所述的编码装置，所述有效范围确定单元对所述频带被分割为多个子带的每个子带，判定是否为有效范围。
6.如权利要求1所述的编码装置，所述有效范围确定单元包括基准值确定单元，在所述频域信号中，从振幅的绝对值最大的频谱系数起确定特定的序位的频谱系数作为基准值；分割单元，将所述频域信号分割给所述频带被分割为多个子带的每个子带，从而获得子带信号；检测单元，对由所述分割单元获得的每个子带信号，检测振幅的绝对值最大的频谱系数；以及判定单元，通过比较所述检测出的频谱系数和所述基准值，判定所述检测出的频谱系数存在的子带是否为有效范围。
7.如权利要求1所述的编码装置，所述有效范围确定单元包括基准值确定单元，在所述频域信号中，从振幅的绝对值最大的频谱系数起确定特定的序位的频谱系数作为基准值；信号分类单元，对所述编码对象信号的信号特性进行分类；分割单元，将所述频域信号分割给所述频带被分割为多个子带的每个子带，从而获得子带信号；加权单元，对由所述分割单元获得的多个子带信号，分别乘以与所述分类出的信号特性对应的权重；检测单元，对每个所述加权后的子带信号，检测振幅的绝对值为最大的频谱系数；以及判定单元，通过比较所述检测出的频谱系数和所述基准值，判定所述检测出的频谱系数存在的子带是否为有效范围。
8.如权利要求5所述的编码装置，所述有效范围确定单元将表示判定为有效范围的子带的标记信号作为有效范围信息输出。
9.解码装置，包括脉冲矢量解码单元，对由权利要求1所述的编码装置编码的脉冲编码参数，进行脉冲矢量解码；频谱形成单元，将由所述脉冲矢量解码单元获得的解码信号配置到与所述有效范围对应的频带；以及频率时间变换单元，将所述配置到与有效范围对应的频带的解码信号变换为时域信号。
10.编码方法，包括将编码对象信号变换为频域信号的步骤；在所述频域信号的频带内确定有效范围的步骤；以及仅对所述有效范围内的信号分量进行脉冲矢量编码的步骤。
11.解码方法，包括解码步骤，对通过权利要求10所述的编码方法编码的脉冲编码参数进行脉冲矢量解码；频谱形成步骤，将通过所述解码步骤获得的解码信号配置到与所述有效范围对应的频带；以及变换步骤，将所述配置到与有效范围对应的频带的解码信号变换为时域信号。
全文摘要
公开了通过提高编码中的比特效率，能够改善解码后的信号的质量的编码装置、解码装置及其方法。在编码装置中，时间-频率变换单元(101)将编码对象信号变换为频域信号，自适应频谱形成编码单元(102)在频域信号的频带内确定有效范围，脉冲矢量编码单元(103)仅对有效范围内的信号分量进行脉冲矢量编码。另外，在解码装置中，脉冲矢量解码单元(106)对由上述编码装置进行了编码的脉冲编码参数进行脉冲矢量解码，自适应频谱形成解码单元(107)将由脉冲矢量解码单元(106)获得的解码信号配置到与有效范围信息对应的频带，频率-时间变换单元(108)将配置到与有效范围信息对应的频带的解码信号变换为时域信号。
文档编号G10L19/02GK102598124SQ20108004861
公开日2012年7月18日申请日期2010年10月29日优先权日2009年10月30日
发明者刘宗宪, 张国成申请人:松下电器产业株式会社

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘宗宪;张国成
技术所有人：松下电器产业株式会社
我是此专利的发明人

上一篇：增强型音频解码器的制作方法
上一篇：用于多信道信号的去除回响的系统、方法、设备和计算机可读媒体的制作方法