一种声音解码装置及其方法

文档序号：2825963阅读：171来源：国知局

一种声音解码装置及其方法
【专利摘要】本发明涉及一种声音解码方法，包括：解复用声音编码码流以获取低频波形编码数据和高频参数编码数据；对低频波形编码数据解码得到MDCT域上的低频谱数据；将MDCT域上的低频谱数据转换到MDFT域；从MDFT域上的低频谱数据中映射部分谱数据到高频部分；根据高频参数编码数据对映射的高频谱数据进行参数解码；将MDCT域上的低频谱数据和参数解码的MDFT域上的高频谱数据组合成MDFT域上的全频谱数据，最后通过IMDFT得到时域上的声音解码数据。本发明直接用MDCT低频谱计算MDFT低频谱,避免了进行IMDCT和MDFT转换，通过将低频MDCT谱与高频MDFT谱拼接成全频带MDFT谱，避免了在MDFT频时变换时引入低频MDFT估算带来的误差，在保持编码质量的前提下，降低了解码器的计算复杂度和计算误差。
【专利说明】一种声音解码装置及其方法

【技术领域】
[0001]本发明涉及音频解码，尤其涉及一种声音解码装置及其方法。

【背景技术】
[0002]一种现有技术的声音解码装置和方法，包括:
[0003]比特流解复用模块，用于对接收的声音编码码流进行解复用，得到相应数据帧的编码数据和边信息，向低频波形解码模块输出相应的编码数据和边信息，向高频参数解码模块和频时映射模块输出相应的边信息；
[0004]低频波形解码模块用于对该帧低频波形编码数据解码，并根据冗余处理边信息对解码数据进行冗余逆处理，获取低频谱解码数据；
[0005]低频谱至高频谱映射模块用于从该帧解码后的低频谱中映射部分谱数据到高频部分，得到低频谱至高频谱映射后的高频谱；
[0006]高频参数解码模块用于从低频谱至高频谱映射模块中接收低频谱至高频谱映射后的高频谱，按照比特流解复用模块输出的高频参数编码数据(包括增益调整和音调性调整边信息)调整其增益和音调性得到高频谱解码数据；
[0007]频时映射模块用于将低频谱和高频谱组合在一起进行频时映射。频时映射根据信号类型边信息采用不同阶数的变换或子带滤波，获取该帧的时域信号。频时映射的方法是编码端时频映射模块中时频映射的逆过程。包括逆离散傅立叶变换(IDFT)、逆离散余弦变换(IDCT)、逆修正离散余弦变换(MDCT)、逆修正离散傅立叶变换(MDFT)、逆余弦调制滤波器组、逆小波变换等。
[0008]重采样模块用于将频时映射模块输出的该帧时域信号的采样频率变换到适合声音回放的采样频率。
[0009]该声音编解码装置和方法引入了新的编解码框架，以充分结合声音波形编码和参数编码的特点，在较低的码率和计算复杂度约束下，对语音和音乐均能高质量编码。
[0010]根据上述现有技术的方法，当所述低频波形解码是在MDCT变换域、所述频时映射为IMDFT变换时，解码器需要进行IMDCT频时变换以得到低频时域建信号；在进行高频参数解码之前，需要对低频解码得到的低频时域重建信号进行MDFT时频变换以得到用于高频参数解码的修正离散傅立叶变换(MDFT)域低频谱数据；最后需要进行全频带的MDFT频时变化以得到重建信号。整个解码器需要进行三次时频/频时变换，这无疑增加了解码器的计算复杂度。如何能在保持对音乐信号的编码质量的前提下，进一步降低计算复杂度，是这个技术方向面临的课题。

【发明内容】

[0011]本发明的目的是提供一种能够克服上述缺陷的声音解码装置及其方法。
[0012]在第一方面，本发明提供了一种声音解码方法，包括:对声音编码码流进行解复用，以获取低频波形编码数据和高频参数编码数据；对所述低频波形编码数据进行解码，得到修正离散余弦变换MDCT域上的低频谱数据；将所述MDCT域上的低频谱数据从MDCT域转换到修正离散傅里叶变换MDFT域，得到MDFT域上的低频谱数据；从所述MDFT域上的低频谱数据中映射部分低频谱数据到高频部分，得到频谱映射后的高频谱数据；根据所述高频参数编码数据对所述频谱映射后的高频谱数据进行参数解码，得到MDFT域上的高频谱数据；将所述MDCT域上的低频谱数据和所述MDFT域上的高频谱数据进行组合，得到MDFT域上的全频谱数据；以及对所述MDFT域上的全频谱数据进行逆修正离散傅里叶变换MDFT，得到时域上的声音解码数据。
[0013]在第二方面，本发明提供了一种声音解码装置，包括:比特流解复用模块，用于对声音编码码流进行解复用，以获取低频波形编码数据和高频参数编码数据；低频波形解码模块，用于对所述低频波形编码数据进行解码，得到修正离散余弦变换MDCT域上的低频谱数据；低频MDFT转换模块，用于将所述MDCT域上的低频谱数据从MDCT域转换到修正离散傅里叶变换MDFT域，得到MDFT域上的低频谱数据；低频谱至高频谱映射模块，用于从所述MDFT域上的低频谱数据中映射部分低频谱数据到高频部分，得到频谱映射后的高频谱数据；高频参数解码模块，用于根据所述高频参数编码数据对所述频谱映射后的高频谱数据进行参数解码，得到MDFT域上的高频谱数据；高频谱与低频谱组合模块，用于将所述MDCT域上的低频谱数据和所述MDFT域上的高频谱数据进行组合，得到MDFT域上的全频谱数据；以及频时映射模块，用于对所述MDFT域上的全频谱数据进行逆修正离散傅里叶变换IMDFT,得到时域上的声音解码数据。
[0014]本发明通过由MDCT低频谱直接得到MDFT低频谱数据，避免了进行MDCT频时变换和MDFT时频变换，并且通过将低频MDCT谱与高频MDFT谱拼接得到全频带MDFT谱，避免了在MDFT频时变换时引入因低频MDFT估算所带来的误差，从而在保持对音乐信号的编码质量的前提下，有效降低了解码器的计算复杂度并降低了计算误差。

【专利附图】

【附图说明】
[0015]图1是根据本发明实施例的声音解码装置的结构框图。
[0016]图2是图1所示的低频波形解码模块的结构框图。
[0017]图3是图1所示的高频参数解码模块的结构框图。
[0018]图4是图1所示的低频MDFT转换模块的结构框图。
[0019]图5是图1所示的高频谱与低频谱组合模块的结构框图。

【具体实施方式】
[0020]下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。
[0021]为了更好地理解本发明的原理，需要对修正离散傅立叶变换(MDFT)、修正离散余弦变换(MDCT)、修正离散正弦变换(MDST)及其逆变换以及它们之间的关系进行介绍。
[0022]首先，介绍MDFT变换的情况。选取前一帧M个样本和当前帧M个样本的时域信号，再对这两帧共2M个样本的时域信号进行加窗操作，然后对经过加窗后的信号进行MDFT变换，从而获得M个频谱系数。MDFT变换的计算公式为:

【权利要求】
1.一种声音解码方法，包括: 对声音编码码流进行解复用，以获取低频波形编码数据和高频参数编码数据；对所述低频波形编码数据进行解码，得到修正离散余弦变换MDCT域上的低频谱数据；将所述MDCT域上的低频谱数据从MDCT域转换到修正离散傅里叶变换MDFT域，得到MDFT域上的低频谱数据；从所述MDFT域上的低频谱数据中映射部分低频谱数据到高频部分，得到频谱映射后的高频谱数据；根据所述高频参数编码数据对所述频谱映射后的高频谱数据进行参数解码，得到MDFT域上的高频谱数据；将所述MDCT域上的低频谱数据和所述MDFT域上的高频谱数据进行组合，得到MDFT域上的全频谱数据；以及对所述MDFT域上的全频谱数据进行逆修正离散傅里叶变换MDFT，得到时域上的声音解码数据。
2.根据权利要求1所述的方法，其中，所述将所述低频谱数据从MDCT域转换到修正离散傅里叶变换MDFT域，得到MDFT域上的低频谱数据的步骤包括: 根据当前帧及其前后帧的MDCT域上的低频谱数据和三个转换矩阵，计算出所述MDFT域上的低频谱数据，其中，所述三个转换矩阵是通过建立所述低频谱数据的当前帧及其前后帧的MDCT域系数与当前帧的MDFT域系数之间的关系，然后根据所述关系预先确定的。
3.根据权利要求1所述的方法，其中，所述将所述MDCT域上的低频谱数据和所述MDFT域上的高频谱数据进行频段拼接，得到MDFT域上的全频谱数据的步骤包括: 根据所述MDCT域上的低频谱数据的频带边界构造出所述MDCT域上的低频谱数据在MDFT域上的变体表达谱数据，其中，所述变体表达谱数据不是MDFT谱数据并且用于通过其IMDFT变换重构时域数据，所述频带边界是根据所述声音编码码流的当前帧的块类型以及在编码端确定的高低频分割频率预先确定的；对所述变体表达谱数据和所述MDFT域上的高频谱数据进行频段拼接，得到MDFT域上的全频谱数据。
4.根据权利要求3所述的方法，其中，所述构造出所述MDCT域上的低频谱数据在MDFT域上的变体表达谱数据的步骤包括: 根据所述频带边界对所述MDCT域上的低频谱数据进行分类；根据分类后的低频谱数据构造出所述MDFT域上的变体表达谱数据。
5.根据权利要求4所述的方法，其中: 所述MDCT域上的低频谱数据被分为不超过所述频带边界的第一类数据和超过所述频带边界的第二类数据；所述MDFT域上的变体表达谱数据是通过将所述第一类数据乘以2，将所述第二类数据置O而得到的。
6.根据权利要求3所述的方法，其中，所述构造出所述MDCT域上的低频谱数据在MDFT域上的变体表达谱数据的步骤包括: 根据第一频带边界范围将所述MDCT域上的低频谱数据转换到MDFT域，得到第一频带边界范围内MDFT域上的低频谱数据，其中，所述第一频带边界范围由所述频带边界和预定的第一边界处理宽度决定；根据第二频带边界范围对所述MDCT域上的低频谱数据进行分类，其中，所述第二频带边界范围由所述频带边界和预定的第二边界处理宽度决定；根据分类后的低频谱数据和所述第一频带边界范围内的MDFT域的低频谱数据，构造出所述MDFT域上的变体表达谱数据。
7.根据权利要求6所述的方法，其中: 所述MDCT域上的低频谱数据被分为不超过所述第二频带边界范围最小值的第一类数据和超过所述第二频带边界范围最大值的第二类数据；所述MDFT域上的变体表达谱数据是通过将所述第一类数据乘以2，将第二类数据置O，并且将当前帧及其前后帧的所述第一频带边界范围内的MDFT域上的低频谱数据分别与预先得到的三个转换矩阵相乘再将三个乘积相加而得到的。
8.根据权利要求3所述的方法，其中，所对所述变体表达谱数据和所述MDFT域上的高频谱数据进行频段拼接，得到MDFT域上的全频谱数据的步骤包括: 在第三频带边界范围内对所述变体表达谱数据和所述MDFT域上的高频谱数据进行频段拼接，所述第三频带边界范围由所述频带边界和预定的第二边界处理宽度决定。
9.一种声音解码装置,包括: 比特流解复用模块，用于对声音编码码流进行解复用，以获取低频波形编码数据和高频参数编码数据；低频波形解码模块，用于对所述低频波形编码数据进行解码，得到修正离散余弦变换MDCT域上的低频谱数据；低频MDFT转换模块，用于将所述MDCT域上的低频谱数据从MDCT域转换到修正离散傅里叶变换MDFT域，得到MDFT域上的低频谱数据；低频谱至高频谱映射模块，用于从所述MDFT域上的低频谱数据中映射部分低频谱数据到高频部分，得到频谱映射后的高频谱数据；高频参数解码模块，用于根据所述高频参数编码数据对所述频谱映射后的高频谱数据进行参数解码，得到MDFT域上的高频谱数据；高频谱与低频谱组合模块，用于将所述MDCT域上的低频谱数据和所述MDFT域上的高频谱数据进行组合，得到MDFT域上的全频谱数据；以及频时映射模块，用于对所述MDFT域上的全频谱数据进行逆修正离散傅里叶变换IMDFT,得到时域上的声音解码数据。
10.根据权利要求9所述的装置，其中，所述低频MDFT转换模块包括: 用于根据当前帧及其前后帧的MDCT域上的低频谱数据和三个转换矩阵，计算出所述MDFT域上的低频谱数据的模块，其中，所述三个转换矩阵是通过建立所述低频谱数据的当前帧及其前后帧的MDCT域系数与当前帧的MDFT域系数之间的关系，然后根据所述关系预先确定的。
11.根据权利要求9所述的装置，其中，所述高频谱与低频谱组合模块包括: 变体构造模块，用于根据所述MDCT域上的低频谱数据的频带边界构造出所述MDCT域上的低频谱数据在MDFT域上的变体表达谱数据，其中，所述变体表达谱数据不是MDFT谱数据并且用于通过其MDFT变换重构时域数据，所述频带边界是根据所述声音编码码流的当前帧的块类型以及在编码端确定的高低频分割频率预先确定的；频段拼接模块，用于对所述变体表达谱数据和所述MDFT域上的高频谱数据进行频段拼接，得到MDFT域上的全频谱数据。
12.根据权利要求11所述的装置，其中，所述变体构造模块用于: 根据所述频带边界对所述MDCT域上的低频谱数据进行分类；根据分类后的低频谱数据构造出所述MDFT域上的变体表达谱数据。
13.根据权利要求12所述的装置，其中，所述MDCT域上的低频谱数据被分为不超过所述频带边界的第一类数据和超过所述频带边界的第二类数据，所述MDFT域上的变体表达谱数据是通过将所述第一类数据乘以2，将所述第二类数据置O而得到的。
14.根据权利要求11所述的装置，所述变体构造模块还用于: 根据第一频带边界范围将所述MDCT域上的低频谱数据转换到MDFT域，得到第一频带边界范围内的MDFT域上的低频谱数据，其中，所述第一频带边界范围由所述频带边界和预定的第一边界处理宽度决定；根据第二频带边界范围对所述MDCT域上的低频谱数据进行分类，其中，所述第二频带边界范围由所述频带边界和预定的第二边界处理宽度决定；根据分类后的低频谱数据和所述第一频带边界范围内的MDFT域的低频谱数据，构造出所述MDFT域上的变体表达谱数据。
15.根据权利要求14所述的装置，其中: 所述MDCT域上的低频谱数据被分为不超过所述第二频带边界范围最小值的第一类数据和超过所述第二频带边界范围最大值的第二类数据；所述MDFT域上的变体表达谱数据是通过将所述第一类数据乘以2，将第二类数据置O，并且将当前帧及其前后帧的所述第一频带边界范围内的MDFT域上的低频谱数据分别与预先得到的三个转换矩阵相乘再将三个乘积相加而得到的。
16.根据权利要求15所述的装置，其中，所述频段拼接模块用于: 在第三频带边界范围内对所述变体表达谱数据和所述MDFT域上的高频谱数据进行频段拼接，所述第三频带边界范围由所述频带边界和预定的第二边界处理宽度决定。
【文档编号】G10L19/24GK104078048SQ201310109081
【公开日】2014年10月1日申请日期:2013年3月29日优先权日:2013年3月29日
【发明者】吴超刚, 潘兴德申请人:北京天籁传音数字技术有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：吴超刚;潘兴德
技术所有人：北京天籁传音数字技术有限公司
我是此专利的发明人

上一篇：一种实时语音去噪的方法和设备的制作方法
上一篇：一种人声提取方法、系统以及人声音频播放方法及装置制造方法