一种空间参数立体声编解码方法及其装置的制作方法

文档序号:7510407阅读:273来源:国知局
专利名称:一种空间参数立体声编解码方法及其装置的制作方法
技术领域
本发明属于数字音频压縮编码领域,特别涉及一种以参数表示空间信息的 立体声编解码系统和装置。
技术背景数字音频编码起源于20世纪80年代末,以MP3(MPEG-1 Layer III)和 AAC(Advanced Audio Coding)为典型代表。此时编码技术在立体声的处理方面 考虑声道间的相关性,采用和差(Mid/Side)立体声或强度立体声(Intensity Stereo) 处理技术,然后对处理后的两路完整的音频信号采用独立的编码方法,因此码 率与声道数基本成正比。2002年C. Faller等人提出了一种基于空间心理声学的参数立体声编解码系 统BCC(Binaural Cue Coding)。此系统在变换域提取声道间强度差ILD (Interchannel Level Difference),声道间时间差ITD(Interchannel Time Difference), 和声道间相关度IC(Interchannel Coherence),其解码器根据这些参数和下混声道 重建多声道的输出。2004年J. Breebaart等人提出参数立体声PS(Parametric Stereo) 编解码系统,2005年MPEG推出MPEG环绕声(MPEG Surround)系统都是以 BCC为基础发展起来的立体声/多声道编解码系统,其核心架构与BCC系统一 致。上述空间参数编解码系统相对于只采用和差立体声和强度立体声技术的 MP3/AAC等编解码系统,在性能上有明显的提升以单声道的码率达到立体声
的音质,因此在对音质和码流要求严格的音频广播和移动音频中得到应用。但 是这些空间参数编解码系统最突出的问题是延时增加,编解码端的时频分析模块引入了至少一帧的延时,通常在20ms到40ms之间,不利于双向实时通信。 因此减小空间参数立体声编解码的延时是本领域亟待解决的问题。BCC、 PS、和MPEG Surround的另一个问题是难于实现动态的时频划分。 根据空间心理声学,ILD、 ITD、和IC只有针对同一或空间上连续的声源才有明 确的意义。上述空间参数编码系统都采用子带划分的方式来区分信号中不同的 声源进而提取空间参数,为了避免传送子带划分信息带来的码率增加,这种划 分是静态的且独立于信号特性的。由于实际信号中各个声源的频谱范围是动态 的,这种方式降低了空间参数编码的效率。因此在不增加码率的情况下实现动 态的时频划分是本领域亟待解决的另 一个问题。 发明内容本发明的目的在于解决现有空间参数编解码系统的不足,提供一种无附加 延时且支持动态时频划分的空间参数立体声编解码方法及其装置,减少系统延 时并提高立体声信号压缩的效率。本发明的编码技术解决方案包括以下步骤 步骤l,对输入的左右两路时域音频信号进行下混,生成一路信号; 步骤2,对得到的下混信号进行变换音频编码,生成下混信号的编码数据; 步骤3,获得与下混信号的编码数据对应的下混信号的反量化频谱; 步骤4,分析频域反量化的下混信号,将频谱划分成若干连续且无重叠的子带;步骤5,以划分的子带为单位,提取输入的左右两路信号在频域每个子带的
空间参数信息,生成空间参数编码数据;步骤6,将下混信号的编码数据和空间参数编码数据按一定格式组合成一路 编码码流。而且,步骤1所述的下混是在时域操作,即取左右两路音频信号的时域平 均值作为下混信号,其中时域平均值是两路信号在同一时刻处的样点值之和的一半。而且,步骤1所述的下混是在频域操作,即取左右两路音频信号的频域平 均值或乘以增益系数,得到频域下混信号,其中频域平均值是两路信号在同一 频点处的谱线值之和的一半,增益系数是为了调整下混信号能量而在平均值之 上乘的一个正的实数。而且,步骤3所述的下混信号的反量化频谱,通过对下混信号的编码数据 进行解码获得;或者当变换编码过程中生成了下混信号的反量化频谱时,直接 从编码过程中获得。本发明还提供了相应的空间参数立体声解码方法,依次包含以下步骤 步骤I ,将合成码流分离成下混信号编码数据和空间参数编码数据;步骤n,对下混信号编码数据进行变换音频解码,生成频域反量化的下混信号,同时将此信号的频谱划分成若干连续且无重叠的子带;步骤m,根据空间参数编码数据和频域反量化的下混信号,以步骤II划分的 子带为单位,生成两路包含频域音频信号,这两路频域音频信号包含空间参数 编码数据给定的空间信息;步骤IV,对两路频域音频信号,进行时频逆变换或综合滤波器组滤波,生成 左右两路时域音频信号。
本发明提供了一种与空间参数立体声编码方法相应的装置,由下混模块、 核心编码模块、核心解码模块、动态时频划分模块、分析滤波器组、参数提取 模块和码流成型模块组成,左右两路时域音频信号输入下混模块和分析滤波器 组,下混模块的输出接入核心编码器,核心编码器的输出接入核心解码模块, 核心解码模块输出接入动态时频划分模块,动态时频划分模块和分析滤波器组 的输出接入参数提取模块,核心编码模块的输出和参数提取模块的输出接入码 流成型模块。而且,所述核心编码模块采用AAC编码器。本发明也提供了一种与空间参数立体声解码方法相应的装置,由码流解析 模块、核心解码模块、动态时频划分模块、参数合成模块和综合滤波器组组成, 合成码流输入码流解析模块后分离出核心解码数据和空间参数数据,核心解码 数据输入核心解码模块,核心解码模块的输出经动态时频划分模块后和空间参 数数据共同输入参数合成模块,参数合成模块的输出接入综合滤波器。本发明将输入的立体声信号直接在时域下混或利用核心编码的时频变换工 具在频域下混成一路信号作为核心编码器的输入,从而避免单独的时频正反变 换带来的附加延时;基于分析综合法,空间参数的提取位于核心编码之后,并且根据编码后反量化的数据进行动态的时频划分,然后提取每个划分单元的空 间参数,由于编码后反量化的数据在解码端可以精确复现,因此只要解码端采 用相同的时频划分方法,无需传送划分信息,就可以得到与编码端一致的时频 划分,并以每个划分单元为单位根据空间参数合成立体声左右两路信号。本发 明不仅降低了空间参数编解码系统的延时,而且可以实现在不传送频谱划分信 息条件下的动态时频划分,使空间参数立体声的编解码实时性和效率都有显著
提咼°


图l是本发明实施例空间参数编码流程,其中图la为时域下混情况,图lb 为频域下混情况;图2是本发明实施例空间参数解码流程;图3是本发明空间参数立体声编解码装置基本结构;图4是本发明实施例采用AAC为核心编码的编码装置结构图;图5是本发明实施例采用AAC为核心解码的解码装置结构图。
具体实施方式
本发明提供的空间参数立体声编码方法包括以下步骤步骤1,对输入的左 右两路时域音频信号进行下混,生成一路信号;步骤2,对得到的下混信号进行变换音频编码,生成下混信号的编码数据;步骤3,获得与下混信号的编码数据对应的下混信号的反量化频谱;步骤4,分析频域反量化的下混信号,将频谱划分成若干连续且无重叠的子带;步骤5,以划分的子带为单位,提取输入的左右两路信号在频域每个子带的 空间参数信息,生成空间参数编码数据;步骤6,将下混信号的编码数据和空间参数编码数据按一定格式组合成一路 编码码流。具体实施时一般首先对相关的左右两路时域音频信号进行可逆的时频变换 或分析滤波器组滤波,生成左右两路频域音频信号,时频变换或分析滤波器组 滤波这2种处理均可。所述变换音频编码一般采用感知音频编码,感知音频编 码是一类基于人耳听觉特性的变换域音频编码方法的统称,执行频域下混操作 时,仅需对得到的下混信号进行感知音频编码中的部分。相应进行变换解码时, 也应采用感知音频解码技术。参数立体声是一种建立在空间心理声学基础上的立体声编码方法。它最大 特点是仅对一路主信号(又称为下混信号)进行编码,同时从立体声信号中分 离出空间信息并参数化表示(又称为空间参数信息)。本发明给出了效果较好的 下混信号取得方法采用时域下混时,取左右两路音频信号的时域平均值作为 下混信号,其中时域平均值是两路信号在同一时刻处的样点值之和的一半;频 域下混操作,是指取左右两路音频信号的频域平均值或乘以增益系数,得到频 域下混信号,其中频域平均值是两路信号在同一频点处的谱线值之和的一半, 增益系数是为了调整下混信号能量而在平均值之上乘的一个正的实数;具体实施时,可以通过编程程序实现全编码过程自动化,本发明提供实施 例的空间参数编码流程以便实施,对于时域下混,参见图l(a):(101) 输入相关的左右两路时域音频信号,在时域下混成一路信号,去往 步骤(102);(102) 对时域下混信号进行完整的感知音频编码,生成下混信号的编码数 据,如果这个过程同时生成频域反量化数据,去往步骤(104),否则去往步骤 (103);(103) 对下混信号的编码数据进行部分解码,生成频域反量化数据,去往步骤(104);(104) 分析频域反量化的下混信号,将频谱划分成若干连续且无重叠的子带,去往步骤(105); (105) 对输入的两路立体声时域信号分别进行分析滤波器组滤波,生成两 路频域信号,去往步骤(106);(106) 以步骤(104)的子带划分为单位,提取两路频域信号每个子带的空间参数信息,并生成参数码流,去往步骤(107);(107) 将步骤(102)生成的下混信号编码数据和步骤(106)的生成的参 数编码数据按一定的格式组合成单一的编码码流。对于频域下混,参见图1 (b):(111) 对输入的两路立体声时域信号分别进行分析滤波器组滤波,生成两路频域信号,去往歩骤(112);(112) 对两路频域信号进行频域下混,可以采用数学平均或加权平均得到 一路频域下混信号,去往步骤(113)(113) 对频域下混信号进行感知音频编码除时频变换外的处理,包括频域 处理和量化熵编码,生成下混信号的编码数据,如果这个过程同时产生频域反量化数据,则去往步骤(115),否则去往步骤(114);(114) 对下混信号的编码数据进行解码,生成下混信号的频域反量化数据,去往步骤(115);(115) 分析频域反量化信号,将频谱划分成连续且无重叠的子带,去往步骤(116);(116) 以步骤(115)的子带划分为单位,提取两路频域信号每个子带的空间 参数信息,并生成参数码流,去往步骤(117);(117) 将步骤(113)生成的下混信号编码数据和步骤(116)的生成的参 数编码数据按一定的格式组合成单一的编码码流。 本发明实施例的空间参数编码流程,如图2所示,包含以下步骤(201) 输入为单一的包含下混信号和空间参数信息的码流,生成分离的下 混信号编码数据和空间参数编码数据;(202) 根据步骤(201)输出的下混信号的编码数据,进行感知音频解码, 生成包含量化误差的频域反量化的下混信号;(203) 分析步骤(202)输出的频域反量化的下混信号,采用空间参数立体 声编码的步骤(108)相同的方法,将频谱划分成若干连续且无重叠的子带,去 往步骤(4);(204) 根据步骤(201)输出的空间参数编码数据和步骤(202)输出的频 域反量化下混信号,以步骤(203)给出的子带为单位,生成两路包含空间参数 编码数据给定的空间信息的频域音频信号;(205) 根据步骤(204)给出的两路频域音频信号,进行时频逆变换或综合 滤波器组滤波,生成左右两路时域音频信号。在编解码领域中,可软件方法实现的过程往往固化为编解码硬件产品,以 便市场应用。本发明也提供了空间参数立体声编解码装置基本结构。如图3所 示,其中编码端包括6个模块下混模块301,核心编码模块302,核心解码模 块303,动态时频划分模块304,分析滤波器组305,参数提取模块306,和码 流成型模块307。输入的立体声左右两路信号首先经下混模块301形成一路信号 并作为核心编码模块302的输入,其生成的数据经核心解码模块303恢复为包 含量化误差的与原下混信号近似的信号,动态时频划分模块304根据这个信号 的短时特性划分频谱,参数提取模块306以每个划分单元为基本单位提取原始 左右两路信号经分析滤波器组305得到的频域两路信号间的空间参数,最后码
流成型模块307将核心编码模块302和参数提取模块306的输出按一定的格式 组合形成解码可识别的码流。下混模块301的输入是时域立体声左右两路信号,输出的一路时域信号是 左右两路信号的均值,又被称为下混信号。核心编码模块302的输入是一路下混信号,这里核心编码模块可以是现有 的单声道变换编码器,如MP3和AAC等。核心编码模块的输出包括两部分, 下混信号的编码数据和下混信号在变换域的量化索引值,这里变换域可以是子 带域,离散傅立叶DFT域或修正余弦变换MDCT域。核心解码模块303的输入是下混信号在编码数据,输出是反量化的变换域 下混信号。这里核心解码模块303是与核心编码模块302对应的单声道变换解 码器,如MP3和AAC等。与通常的单声道变换解码器不同的是,这里解码过 程只需进行到反量化,不需要在进行反变换得到时域信号。动态时频划分模块304的输入是反量化变换域下混信号,根据这个信号的 特性,将其变换域谱线划分成连续的子带,通常是不等带宽的。现有的空间参 数编码采用的频域划分通常是按人耳的听觉特性非线性划分的Bark带,与信号 的特性无关。这里以Bark带为基础,根据信号的短时时频特性,对Bark带进行 细分和合并如果一个Bark带内包含两个或多个独立声源,则将这个Bark带划 分成相应的2段或多段;如果相邻的Bark带都在通一个声源的范围内,则这些 Bark带合并成一段。独立声源的判断可以通过分析频谱包络、相位、和相关性 得到。分析滤波器组305的输入是原始左右两路时域信号,输出是左右两路的频 域信号。分析滤波器组305可以采用多相正交调制滤波器组(Polyphase Quadrature Modulated Filterbank, PQMF),离散傅立叶变换(Discrete Fourier Transform, DFT),或修正调制余弦变换(Modified Discrete Fourier Transform, MDCT)。参数提取模块306的输入是动态的时频划分以及原始的左右两路信号经分 析滤波得到的两路频域信号,输出的是针对每个划分单元提取的空间参数,包 括时间差ITD、强度差ILD、和相关度IC等。对于每个划分单元,参数提取可 以采用现有的技术,如BCC、 PS中参数提取的方法。码流成型模块306的输入是下混的声道的编码数据和空间参数的编码数据, 输出是解码器可识别的码流。根据给定码流的语法结构,码流成型模块将上述 两部分数据组合在一起并添加给定的标识信息,如特定的比特位等。解码端则包括5个模块码流解析模块311,核心解码模块312,动态时频 划分模块313,参数合成模块314和综合滤波器组315。解码端的输入是符合给 定语法结构的码流,首先码流解析模块311对输入码流进行解析,分离出核心 解码数据和空间参数数据,核心解码模块312根据核心解码数据生成量化的变 换域下混信号,这个信号与编码端对应时间段的反量化变换域下混信号是精确 一致的,然后与编码端完全一致的动态时频划分模块313对其进行动态时频划 分,得到与编码端完全一致的时频划分,最后参数合成模块314根据时频划分 和空间参数数据,重建每个划分单元左右声道的变换域信号,经综合滤波器组 模块315时频逆变换得到最终的时域立体声信号输出。码流解析模块311的输入是编码器产生的码流,输出是解析出的与解码时 间段对应的核心解码数据和空间参数数据。码流解析模块根据给定的语法结构, 通过特定的标识信息,如标识比特位,获得码流中各个比特序列段的数据含义,
进而分离出核心解码模块和参数合成模块所需的并且同步的数据。核心解码模块312的输入是解析出的核心解码数据,输出是反量化的变换 域下混信号。这里核心解码模块是与编码端核心编码模块对应的单声道变换解码器,如MP3和AAC等。与通常的单声道变换解码器不同的是,这里解码过 程只需进行到反量化,不需要在进行反变换得到时域信号。当编码码流正确传 送到解码端时,核心解码模块就可以精确恢复出编码端反量化的变换域下混信 号,这个信号与原始变换域下混信号的差异就是量化误差,而原始信号在解码 端通常是无法精确重建的。动态时频划分模块313的输入是核心解码模块获得的反量化的变换域下混 信号,输出的依据当前信号特性的变换域子带划分。这个模块与编码端的动态 时频划分模块完全一致,同时输入的反量化的变换域下混信号也是完全一致的, 因此其输出的子带划分也与编码端的子带划分完全一致。参数合成模块314的输入的反量化的变换域下混信号和子带划分以及空间 参数数据,输出是重建的立体声左右两路频域信号。与编码端的参数提取模块 一样,参数合成模块可以采用现有的技术,如BCC、 PS等的参数合成方法。以 每个动态划分的子带为单位,生成左右两个子带信号,使之具有给定的时间差 ITD、强度差ILD、和相关度IC等。综合滤波器组模块315的输入是左右两路频域信号,输出是左右两路时域 信号。综合滤波器组315是分析滤波器组305的逆变换,可以是逆多相正交调 制滤波器组(Inverse PQMF, IPQMF),逆离散傅立叶变换(Inverse DFT,工DFT), 和逆修正余弦变换(Inverse MDCT, IMDCT)。下面结合附图4、 5对本发明的具体实施方式
作进一步说明,图4给出了本 发明所述空间参数立体声编码系统以AAC为核心编码器的结构,与图5的空间参数立体声解码系统相匹配。以AAC为核心编码器的空间参数立体声编码系统包括7个模块,心理声学 分析模块401 , MDCT模块402,下混模块403, AAC频域处理及量化编码模块404, 动态时频划分模块405,参数提取模块406,和码流成型模块407。时域左右声 道信号首先经心理声学分析模块401处理得到AAC编码所需心理声学数据和 MDCT变换长度;MDCT模块402根据变换长度进行相应的时频变换得到左右声道 的频域数据;经下混模块403得到一路频域数据作为AAC频域处理及量化熵编 码模块404的输入;模块404是AAC核心编码,输出下混信号的编码码流和频 域反量化下混信号;动态时频划分模块405根据频域反量化下混信号给出一个 根据信号短时特性的频谱划分;参数提取模块406以每个划分单元为单位,提 取原始频域左右声道信号间的空间参数信息并形成空间参数码流;最后码流成 型模块407将AAC下混声道码流和空间参数码流组合成符合给定语法结构的码 流。心理声学分析模块401是AAC编码器的主要模块之一,输入是原始左右声 道时域信号,输出是AAC编码所需的心理声学参数和MDCT变换的长度。心理声 学参数包括感知熵,遮蔽门限等;MDCT变换的长度主要决定于信号的短时平稳 性,对稳态信号采用长变换,对瞬态信号采用段变换。MDCT模块402也是AAC编码器的主要模块之一,输入是原始左右声道的时 域信号,输出是左右声道的频域信号。下混模块403是本发明实施例的特有模块,输入是左右两路频域信号,输 出是一路频域信号。下混可以采用简单的数学平均,也可以在数学平均的基础上引入增益控制系数,以避免左右声道频域信号在同相或反相时带来的信号相 互加强或抵消。AAC频域处理及量化熵编码模块404是AAC编码器的核心模块,输入是一路 频域下混信号,输入是编码码流和频域反量化数据。具体的频域处理及量化熵 编码方法在MPEG组织的标准文档里有详细描述。对本发明所述的空间参数立体 声编码系统,采用AAC作为核心编码的一个重要收益就是AAC编码过程本身就 可以生成频域反量化数据,因此省去了单独的反量化模块。动态时频划分模块405是本发明实施例的特有模块,输入是频域反量化数 据,输出是根据信号短时特性的频谱划分。模块405与图3的动态时频划分模 块304的作用和处理方法一致。参数提取模块406是本发明实施例的特有模块,输入是频域左右声道信号 以及频谱的划分,输出是空间参数信号的码流。模块406与图3的参数提取模 块305的作用和处理方法一致。码流成型模块407是编码器的主要模块之一,输入是下混信号的AAC码流 和空间参数码流,输出是符合给定语法结构的完整码流。图5给出了本发明所述空间参数立体声解码系统以AAC为核心解码器的结 构,与图4的空间参数立体声编码系统相匹配。以AAC为核心解码器的空间参数立体声解码系统包括5个模块码流解析 模块501, AAC解码反量化以频域逆处理模块502,动态时频划分模块503,参 数合成504,和IMDCT 505。图4所示编码系统生成的码流传输到解码系统,首 先码流解析模块501将码流分离成两部分,下混信号的AAC码流和空间参数码 流,分别传送到AAC解码反量化及频域逆处理模块502和参数合成模块504;模 块502根据下混信号码流进行熵解码,反量化,以及与AAC编码器对应的频域 逆处理,得到频域反量化的下混信号;这个信号经动态时频划分模块503分析给出根据信号短时特性的一个频谱划分,由于反量化信号和时频划分方法与编码系统的精确一致,因此给出的划分也与编码系统的精确一致;参数合成模块 504以每个划分单元为基本单位根据空间参数信息生成左右两路频域信号;最后经IMDCT变换得到时域左右声道信号。码流解析模块501是解码系统的主要模块之一,输入是码流,输出是下混 信号的AAC编码码流和空间参数码流。码流解析的过程就是根据给定语法结构 将码流切分成基本码流单位。AAC解码反量化及频域逆处理模块502是AAC解码器的核心模块,输入下混 信号的码流,输出是频域反量化的下混信号。具体的熵解码,反量化,及频域 逆处理方法可参照MPEG组织的AAC标准文档。这里输出的反量化信号与频域反 量化信号是精确一致的。动态时频划分模块503是本发明实施例的特有模块,输入是频域反量化的 下混信号,输出是信号的频谱划分。这里模块503与模块405是精确一致的, 因此其输出的频谱划分与模块405输出的也是精确一致的。参数合成模块504是本发明实施例的特有模块,输入是空间参数码流,频 域反量化的下混信号,和频谱的划分,输出是两路频域信号。模块504与图3 所示系统的模块314的作用和处理方法一致,输入的两路信号包含了编码系统 传送的空间信息。IMDCT模块505是AAC解码器的主要模块之一,输入是两路频域信号, 输出是时域左右声道信号。模块505和MDCT模块402构成一对互逆的变换。
权利要求
1.一种空间参数立体声编码方法,其特征在于包括以下步骤步骤1,对输入的左右两路时域音频信号进行下混,生成一路信号;步骤2,对得到的下混信号进行变换音频编码,生成下混信号的编码数据;步骤3,获得与下混信号的编码数据对应的下混信号的反量化频谱;步骤4,分析频域反量化的下混信号,将频谱划分成若干连续且无重叠的子带;步骤5,以划分的子带为单位,提取输入的左右两路信号在频域每个子带的空间参数信息,生成空间参数编码数据;步骤6,将下混信号的编码数据和空间参数编码数据按一定格式组合成一路编码码流。
2. 如权利要求1所述的空间参数立体声编码方法,其特征在于步骤1所述的 下混是在时域操作,即取左右两路音频信号的时域平均值作为下混信号,其中 时域平均值是两路信号在同一时刻处的样点值之和的一半。
3. 如权利要求1所述的空间参数立体声编码方法,其特征在于步骤l所述的 下混是在频域操作,即取左右两路音频信号的频域平均值或乘以增益系数,得 到频域下混信号,其中频域平均值是两路信号在同一频点处的谱线值之和的一 半,增益系数是为了调整下混信号能量而在平均值之上乘的一个正的实数。
4. 如权利要求1或2或3所示的空间参数立体声编码方法,其特征在于步骤3 所述的下混信号的反量化频谱,通过对下混信号的编码数据进行解码获得;或 者当变换编码过程中生成了下混信号的反量化频谱时,直接从编码过程中获得。
5. —种空间参数立体声解码方法,其特征在于对包含下混信号和空间参数信 息的合成码流进行解码,包括以下步骤步骤I ,将合成码流分离成下混信号编码数据和空间参数编码数据;步骤II,对下混信号编码数据进行变换音频解码,生成频域反量化的下混信 号,同时将此信号的频谱划分成若干连续且无重叠的子带;步骤m,根据空间参数编码数据和频域反量化的下混信号,以步骤II划分的 子带为单位,生成两路包含频域音频信号,这两路频域音频信号包含空间参数 编码数据给定的空间信息;步骤IV,对两路频域音频信号,进行时频逆变换或综合滤波器组滤波,生成 左右两路时域音频信号。
6. —种空间参数立体声编码装置,其特征在于由下混模块、核心编码模块、 核心解码模块、动态时频划分模块、分析滤波器组、参数提取模块和码流成型 模块组成,左右两路时域音频信号输入下混模块和分析滤波器组,下混模块的 输出接入核心编码器,核心编码器的输出接入核心解码模块,核心解码模块输 出接入动态时频划分模块,动态时频划分模块和分析滤波器组的输出接入参数 提取模块,核心编码模块的输出和参数提取模块的输出接入码流成型模块。
7. 如权利要求6所述的空间参数立体声编码方法,其特征在于所述核心编码模块采用AAC编码器。
8. —种空间参数立体声解码装置,其特征在于由码流解析模块、核心解码模 块、动态时频划分模块、参数合成模块和综合滤波器组组成,合成码流输入码 流解析模块后分离出核心解码数据和空间参数数据,核心解码数据输入核心解 码模块,核心解码模块的输出经动态时频划分模块后和空间参数数据共同输入 参数合成模块,参数合成模块的输出接入综合滤波器。
全文摘要
本发明公开了空间参数立体声编解码方法及装置编码端首先将立体声左右声道信号在时域或频域下混,然后下混信号传送到变换编码器产生单声道编码数据,同时提取包含量化误差的下混信号,并根据其短时频谱特性将其变换域划分为连续且不重叠的子带,以子带为单位提取左右声道的空间参数。解码端根据变换编码数据,生成与编码端一致的包含量化误差的下混信号并采用同样的划分方法得到子带划分,然后根据空间参数信息重建立体声左右声道子带信号,反变换输出时域立体声信号。与现有技术相比,本发明没有正反变换带来的附加延时并且可在不传送子带划分信息的条件下实现动态的时频划分,提高了空间参数立体声编解码的实时性和效率。
文档编号H03M7/30GK101162904SQ200710053770
公开日2008年4月16日 申请日期2007年11月6日 优先权日2007年11月6日
发明者婷 周, 晟 曹, 璇 李, 涂卫平, 恒 王, 胡瑞敏, 艾浩军, 陈水仙 申请人:武汉大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1