用于对音频信号进行代码转换的方法和设备的制作方法

文档序号:2830545阅读:402来源:国知局
专利名称:用于对音频信号进行代码转换的方法和设备的制作方法
技术领域
本发明涉及一种用于对音频信号进行代码转换的方法和设备。本 发明涉及音频压缩领域,更具体地,涉及不同的感知音频编码格式间 的代码转换的领域。然而,有利地,还可以在其他音频处理应用中使 用本发明的基本概念。
背景技术
术语"音频代码转换"通常表示从另一比特流中导出比特流,该 比特流表示根据特定音频编码格式的音频信号,该另一比特流是根据 不同的音频编码格式组织而成的。在这种意义上,"代码转换"表示从
遵循MPEG 1层III (mp3)的比特流获得例如遵循MPEG AAC的比 特流的整个过程。
然而,在本文献中,在更为技术性的意义上使用术语"音频代码 转换",来描述音频信号从一个子带或变换域至另一个的转换。这就是 说,该术语仅描述从一种表示至另一种表示转换中的一个主要步骤, 而不是描述整个过程。
图1示出了从文献"T. Painter and A. Spanias (2000): Perceptual Coding of Digital Audio, /V歸W, o/ 皿E, vol. 88"中已知的一 般感知音频编码的基本原理。
现今的音频信号压縮方法和格式一般使用时间-频率分解102 (即 滤波器组或变换)来表示音频信号107的参数110。对这些参数进行 量化和编码104、熵编码105以及比特流操作106;所有这些步骤都由 输入音频信号的心理声学分析101控制。图2示出了相应的一般的感 知音频解码器,其中有比特流操作201、熵解码202、比特分配203、 解码和解量化204以及最终的时间-频率合成,该时间-频率合成根据 参数212、 213来产生时域信号214。图1和图2示出并举例说明了感知音频编解码器的基本原理。然 而,尽管特定实施方式可能在一定程度上有所不同,但它们通常采用 时间-频率分解以及与其相反的时间-频率合成。
现在集中讨论时间-频率分解和合成,不会进一步考虑中间的编码 和解码步骤。
对于时间-频率分解102,在现今的音频编解码器中使用许多不同
算法。例如,MPEG音频编解码器标准包括MPEG-1层I和II编解 码器(使用32频带伪QMF(正交镜像滤波器)滤波器组);以及MPEG-1 层III (mp3)(采用混合滤波器组,即32频带伪QMF滤波器组级联 后接MDCT (修正DCT)滤波器组)。MDCT滤波(默认为18箱(bin), 对于瞬变信号(transient)减少至6箱)分别导致576或192箱的频谱 分辨率。MPEGAAC编解码器及其衍生编解码器使用具有1024箱(对 于瞬变信号减少至256箱)默认分辨率的全频带MDCT方式。音频帧 经常在一定程度上(例如50%)时间重叠,这定义了所谓的帧前移 (frame advance): (100%-重叠部分)*帧的大小。结果,时间-频率分 解102的输出与时间-频率合成205的输入之间的域(其中编码器的输 出信号116输入206至解码器)将表示为"频域"或"参数域",而不 管特定音频编码格式是使用滤波器组还是块变换来进行时间-频率分 解。
由于现有的和新兴的音频格式不断涌现,对用于将音频内容从一 个比特流格式代码转换成另一个比特流格式的算法的需求随之增长。 图3示出了现今典型地使用的音频代码转换方式,这种方式被典型地 使用是由于其仅涉及图1和图2已描述的可用的标准模块。将以源格 式编码的输入比特流解码DEC—A为连续的时域PCM信号TD。然后, 独立的编码器ENC—B根据目标格式产生新的比特流。信号处理模块 间仅有的接口是从解码器传递到编码器的时域音频信号TD。
尽管该方式使用简单,但会出现以下问题。第一,由于两个模块 DEC—A、 ENC—B并不知道对方,因此时间-频率分解过程可能会失去 同步通常, 一系列解码(解量化)和编码(量化)操作导致信号质 量恶化,即所谓的串联差错。第二,该方式的计算复杂度较高,因此需要显著地降低计算复杂度。
如果由解码器提取且由编码器重用了源格式和目标格式在某种程
度上共同的一些辅助信息,则可以获得更好的代码转换结果。图4a) 示出了该方式的示例,例如该方式可以用于将Dolby AC-3代码转换成 BSAC (比特分片算术编码)格式(Kyoung Ho Bang, Young Cheol Park, and Dae Hee Youn (2006). Audio Transcoding Algorithm for Mobile Multimedia Application, /Voc. 。//CAS^尸,vol. 3)。在该特定示例中, AC-3比特分配可以重用于导出并控制BSAC编码器内的新比特分配 403。除了重用来自源比特流的辅助信息SI之外,时间-频率合成和分 解过程在时间上取得同步。对于这种情况,图4a)的先进概念与前述 代码转换方案相比,降低了计算复杂度,并可以使目标信号的质量变 得更好。
当(且仅当)源和目标比特流的编解码器格式在其时间-频率分解 域方面相同时,即,当分解和合成模块完全互补时(例如mp3比特流 从给定数据速率至更低数据速率的代码转换),可以如图4b)所示进 一步简化代码转换可以省略时间-频率分解和合成过程,以便例如通 过重新量化特定参数,直接在参数域PD中进行数据速率修改。重用 来自源比特流的辅助信息(例如比特分配)也是有益的。

发明内容
从以上描述中显而易见,缺少一种用于在具有不同时间-频率分解 域的编码格式间进行代码转换的简单方法和设备。本发明的一个方面 在于提供这样的方法和设备,特别用于在具有不同时间-频率分解域的 音频信号间方便地、更快速地进行代码转换。
本发明使用从源参数域至目标参数域的线性映射,其中目标参数 依赖于来自两个或更多个输入帧的源参数。这允许了不同时间-频率分 解域间的低复杂度代码转换,并防止了传统处理所造成的信号恶化问 题。
已经认识到,传统的代码转换方式中的时间-频率合成及随后的时 间-频率分解可以表示为线性操作,然而,它们通常是时变的。根据本发明的一个方面, 一种用于将音频信号从第一或输入参数 域(与时域相对)代码转换至第二或输出参数域的方法包括以下步骤: 将输入参数域的参数映射至输出参数域的参数,其中至少一个输出参 数线性依赖于两个或更多个输入参数(即该输出参数是两个或更多个 输入参数的线性组合)。这两个或更多个输入参数来自两个或更多个不 同的输入帧。
在一个实施例中,用于描述所述输出参数与所述两个或更多个输 入参数之间关系的映射或变换是时变的。然而,对于具有帧结构的输 入和/或输出格式,该映射或变换是多个时不变关系的序列。在输入参 数域的时间-频率分解与输出参数域的时间-频率合成的帧前移(用于 描述帧的时间重叠)不同的情况下,这是特别有利的。
在一个实施例中,时变映射周期性地重复,即,该映射是时不变 映射的周期性重复。
在一个实施例中,该映射包括以下子步骤对来自不同源帧的部 分输入向量进行映射,然后将这些向量相加或叠加为单个输出帧。
在一个实施例中,基于与整数个输出帧相对应的整数个输入帧来 创建超帧。该整数依赖于输入与输出格式的帧长度和帧偏移。 一个超 帧可以对应于时变映射的一个或多个重复周期。
在一个实施例中,时变关系的每个时不变阶段表示为如下线性操 作从输入格式信号的多个连续帧得到输入,并针对输出格式信号的 一个帧产生输出。因此,从该周期性重复产生了对超帧的一系列线性 操作。
在一个实施例中,时变映射被实现为采用针对预先计算的变换系 数的査找表而进行的一系列线性变换。然而,在另一个实施例中,线 性变换是应用于输入参数的预定义解析表达式(例如函数)。
本发明的一个优点在于在不传递连续时域信号的情况下,从一 个参数域至另一个参数域的直接线性变换所需的计算复杂度,显著低 于经由连续时域信号的、传统的直接代码转换过程所需的计算复杂度。
另一个优点在于代码转换质量与计算复杂度之间的权衡可以适 于时变应用的需要,即使在频率选择性方式下也是如此。另一个优点在于与经由时域信号的传统代码转换方案相比,经 由单个线性变换的直接代码转换在数值上的情况更好。由于将源域的 特定参数箱的影响限制在目标域参数箱的小范围内,因此最小化了(如 传统代码转换的定点实施方式中所共有的)量化以及不精确数值运算 的广泛影响。
在从属权利要求、以下说明书和附图中公开了本发明的有利实施例。


参考附图来说明本发明的示例性实施例,附图中
图1示出了一般的感知音频编码器的结构;
图2示出了一般的感知音频解码器的结构;
图3示出了传统的直接代码转换;
图4a)示出了重用比特分配的传统代码转换;
图4b)示出了相同音频格式间的传统代码转换;
图5示出了不同参数域间的直接代码转换;
图6示出了具有不同帧前移的不同时间-频率域间的代码转换;
图7示出了混合mp3加无损扩展音频格式的编码器;
图8示出了混合mp3加无损扩展音频格式的解码器;
图9示出了示例性变换矩阵的系数;
图IO示出了示例性变换矩阵的细节;以及
图11示出了参数域中不同音频格式间的代码转换器的结构。
具体实施例方式
图5示出了两个格式间在参数域中的直接代码转换,这两个格式 具有不同的参数域PDa、 PDb。先前已通过源格式A (例如mp3)的时 间-频率分解方案从PCM音频信号中导出了根据该源格式的多个相邻 参数帧501。每个帧m-l、 m、 m+l包括多个参数,从而可以被视为源 参数域PDa中的参数向量。线性变换矩阵tt应用于输入参数向量501, 并提供与输出格式B的输出参数域PDB中的帧相对应的输出参数向量502。
对于单个输出帧n,变换或映射是时不变的。无论是将变换矩阵 tt同时应用于多个输入帧,还是将单独的变换矩阵(同时或连续地) 分别应用于相应输入喊然后将部分结果相加,由于在两种情况下变换 步骤都是线性的,因此产生的矩阵tt相同。
原则上,变换映射tt涵盖了传统处理510的所有子步骤,其中, 通过与线性变换矩阵T^ (Sa代表根据源格式的合成)相乘,将每个 参数向量PA(m)、 PA(m+l)……变换为相应的时域分段TDs。在该示例 中,这些时间分段是重叠的,并被馈送入重叠相加过程503以获得解码 后的连续时域TDc音频信号504。然后,在传统代码转换过程中进行根 据目标格式B的时间-频率分解。将连续的时域信号504分解505为一系 列(通常)重叠的分段,其中该重叠可以不同于格式A所采用的重叠, 然后通过与矩阵1^ (Ab代表根据格式B的分解(A))相乘,将这些 分段向量变换至目标参数域PDB。由于目标格式B可以应用与源格式A 不同的帧偏移,因此使用单独的帧索引n。
以上说明以及图5涵盖了现今与音频编码实际相关的所有时间-频 率分解方案,在这种意义上,它们是一般性的。矩阵T&和T^可以 精确地描述基于线性块变换和线性前馈(FIR—一有限冲激响应)滤 波器组的任何时间-频率合成或分解方案。可以在矩阵T^和T^中组 合级联结构(例如mp3编解码器的混合滤波器组的级联结构)。也涵盖 了线性非完美重构滤波器组或变换。对于IIR (无限冲激响应)滤波器 组,可以通过使用有限冲激响应截去可忽略的值来近似无限冲激响应, 从而使用公式来表达充分精确的表示。
根据本发明的代码转换概念利用了代码转换过程中涉及的时间-频率合成和分解步骤T 、的线性以及重叠相加和分段块503、 505 的线性。使用单个线性变换TT来替代时间-频率合成T^ 、重叠相加
503、 分段505和时间-频率分解T^的序列,从而有利地,不必需产生 连续的时域信号504。
以下说明线性变换TT的一些特性。
变换矩阵TT的精确推导是可能的,但可以是非平凡的(non-trivial)。除了解析推导过程以外,还可能通过仿真和测量源参 数域的每个参数元素(例如频谱箱)对目标参数域中的目标帧的线性 贡献来训练矩阵。矩阵TT可以由例如解析表达式或查找表来表示。
由于在传统代码转换路径中的多个连续时间分段的重叠相加 503,线性变换TT通常不是一对一映射,而是多对一映射。这意味着 源域的至少两个、典型地三个或更多个帧对目标域的一个帧有影响。 反之亦然,源域的每一个帧影响目标域中的多于一个帧。
尽管将定义参数域A和B的时间-频率分解和合成过程假定为线 性,但典型地,它们是时变的。因此,直接变换TT依赖于源域的时间 分段对目标域的时间分段的时域同步。换言之,对表示A和B的帧之间 的定时差的修改通常产生另一直接变换矩阵TT。因此,如果源格式的 时间-频率合成与目标格式的时间-频率分解的帧偏移不同,则矩阵TV 是时变的。图6示出了在MPEGAAC (1024样本的帧前移)与mp3 (576 样本的帧前移)之间的代码转换的示例。时变变换包括在这种情况下 (忽略窗口切换方案)采用的十六个时不变变换矩阵TT的序列。图6 示出了AAC和mp3的频域向量的序列。由于不同的帧前移,帧间的时 间偏移随时间变化。在九个AAC帧或十六个mp3帧的时间段之后,分 别出现AAC帧与mp3帧之间的相同时间偏移。在该例中,该时间段是 超帧。在每个超帧中,使用十六个不同的预定变换矩阵(例如表)来 进行从AAC域至十六个mp3帧的代码转换。每个超帧中都重复该变换 序列。因此,(超帧内的)该变换是时变的。
通常,超帧内的周期性序列中的变换数目与目标格式的帧的数目 相对应。例如,对于从mp3至AAC的代码转换,时变变换包括九个时 不变变换,超帧9m、 9m+l、 、 9m+8中的每个帧一个时不变变换。
在这种情况下,与图6相比,帧间的关系是反之也成立,例如第二个
AAC帧9m+l依赖于五个mp3帧16m、 ......、 16m+4。然而,由于变换
的线性,还可以执行从一个源格式帧至一个目标格式帧的单独变换, 并将所需的结果向量相加来获得目标帧。对于本示例,这导致了包含 四十个变换的序列,外加每个目标帧所需的加法运算。
术语"帧前移"描述了连续的时间-频率分解帧的相互偏移。这取决于连续帧的时间重叠,且不同于帧的持续时间。
如果两个所涉及的时间-频率分解过程展示出相邻参数箱的良好分离,且如果此外频谱分辨率是相似的,则变换矩阵TT典型是稀疏矩阵而且大致是对角矩阵。这就是说,TT的大部分等于零且不需要在变换中考虑。因此,可以预期,通过使用矩阵TT的线性变换来进行的代码转换在计算上的复杂度明显小于经由连续时域信号的传统代码转换方法。
图9示出了示例性变换矩阵。灰度级指示了用于从mp3混合滤波器组代码转换至全频带MDCT (两者都具有较长的窗口)的变换矩阵TT的系数的对数幅度。示例性地,三个连续的mp3帧影响目标MDCT帧。暗区域中的系数值高于亮区域中的系数值。在该示例中,变换系数中97.7。/。的幅度低于-60dB。在代码转换中忽略这些系数,以便能以非常
低的计算代价来实现矩阵乘法。
图10示出了图9中心区域的细节,将其示为3维柱状图而不是灰度级码。在所示的41*41=1681个系数中,大多数低于-60 dB (在-80 dB处截断),也就是说大多数是可忽略的。理想地,沿着线性区域仅有几个系数具有相关水平的值。在解析推导出的该示例中,横跨十八个箱的周期性距离中线性区域的附加区域也具有不可忽略的值,这些不可忽略的值由mp3混合滤波器组中的混叠失真效应引起尽管在混合mp3滤波器组中已应用了混叠校正,但大量的混叠成分仍然存在。在全频带MDCT情况下不存在该混叠效应。
对于时变变换,根据图9和10的变换矩阵TT可能仅对一个输出帧(即每个超帧内的特定帧)有效,而对于其他输出帧,系数是不同的。
可以通过考虑频率选择性精度要求来进一步降低计算复杂度。例如,如果mp3核心比特流具有较低的比特率,则通常不对高频箱进行编码,且在解码器中将高频箱设置为零(即将其掩蔽)。在这种情况下,可以省略代码转换变换TT的高频部分。通常,可以容易地将任何频率范围掩蔽。掩蔽操作也可以是时变的和/或依赖于信号的(例如基于辅助信息中所包括的比特分配)。与经由连续时域信号的传统代码转换相比,这种容易且灵活的掩蔽操作是有利的。原则上,变换矩阵TT以概括的方式描述了目标帧的每个频率箱的变换。由于变换的线性,可以将变换矩阵分解为子矩阵,还可以忽略其中的一些子矩阵(例如当不需要特定的目标频率箱时)。因此,从全部变换中选择实际需要计算的分片或部分。例如,为此,可以计算主要频率或辅助信息(如源和/或目标帧的比特分配)。
如果代码转换所需的精度是频率选择性的,则对变换矩阵TT的利用可以是时变的。例如,在从一个压縮音频格式至另一个的代码转换过程中,依赖于频率的代码转换精度要求可以被确定为源或目标音频格式的比特分配的函数。例如,对于需要较低代码转换精度(一个可能的原因是所分配的比特的数目少)的目标频率箱,在计算代码转换变换时,必须考虑矩阵TT中较少的非零元素。因此,可以进一步降低计算复杂度。
利用所公开的代码转换方案,将源域的每个参数箱的影响限制在目标域中非常有限的参数箱集合。因此,与经由时域信号的传统代码转换的数值行为相比,所提出的方案的数值行为的情况要好得多。在传统代码转换中,频谱的一些部分处的强信号分量可能影响代码转换后的参数域中的整个频谱,这是由时间-频率合成和分解过程的数值不精确所造成的。
本发明的一个示例性实施例涉及从根据在MPEG-l层III (mp3)中
采用的混合滤波器组的参数域至目标参数域的代码转换,该目标参数域根据具有相同帧前移和相同频率箱量的全频带MDCT或整数MDCT。应用示例是在嵌入式mp3比特流上对音频PCM样本的混合无损编码。这里所公开的快速代码转换方案用于根据解码后的mp3箱来对全频带整数MDCT箱进行预测。然而,代码转换可以不仅涉及mp3箱的当前帧。
图8示出了相应的编码器信号流。该编码器信号流的下半部分表示传统mp3编码器,包括多相滤波器组和抽取(decimation) 701、分段和MDCT702、快速傅立叶变换(FFT) 704、心理声学分析705、比特分配和量化器703、辅助信息编码器706和复用器707。在混合无损编码器的上部信号路径中,应用了并行的分段和全频带整数MDCT709。全频带MDCT的分段和控制应用了与mp3核心编解码器相同的自适应窗口切换方案。此外,根据mp3滤波器组的时变频谱分辨率来控制全频带整数MDCT的频谱分辨率。对于两个并行的时间-频率分解过程的简单同步,尤其在利用涉及多于一个mp3帧(典型地三个或更多个)的代码转换变换的情况下,必须在整数MDCT和对应的分段709之前引入PCM样本的延迟708。
全频带整数MDCT 709和随后的信号处理模块的目的在于允许对时域PCM样本进行数学上无损的编码。因此,使用了可逆的整数MDCT。这个概念与在MPEG SLS (可縮放至无损)音频编解码器中应用的原理相当,然而,该原理基于从全频带MDCT箱中减去"解量化"并舍入后的mp3频率箱的操作。然而,由于mp3滤波器组与全频带MDCT之间的显著差异,仅通过从全频带MDCT箱中减去这些"解量化"并舍入后的mp3频率箱来计算残差信号,不会导致低速率无损编码所需的信号熵的充分减少。因此,在编码器和解码器中使用根据本发明所公开的代码转换方案,根据mp3箱来确定全频带MDCT箱的更精确的预测。出于这个原因,(经由矩阵TT的)代码转换变换711通常考虑至少三个mp3帧(在对其系数进行解量化(反量化710)之后)。
由于mp3滤波器组701应用了短和长分解/合成窗口之间的信号自适应切换,因此变换矩阵TT是时变的(图7未示出)。不同的变换应用于长窗口、短窗口和过渡阶段。例如,两个或更多个相邻变换可以合并为一个,或者一个变换可以分为两个或多个,因此每超帧的不同时不变变换的数目可以在流内变化。
如上所述,通过频率选择性(例如省略代码转换变换TT的高频和
/或低频部分)可以进一步降低计算复杂度。
图8示出了用于无损mp3解码的相应解码器。解码器的代码转换和舍入805与编码器的代码转换和舍入711相同。此外,在编码器和解码器中,反量化器710、 803相同。无损解码过程802与无损编码过程713互补,辅助信息解码器804与辅助信息编码器706互补。
另一实施例涵盖了不同音频格式间的快速代码转换,从而涉及对术语"代码转换"的传统理解,即音频内容从一个压縮格式至另一个的转换。通常,代码转换可以从源格式的任意帧开始。
图ll示出了所提出的在参数域中应用直接代码转换的系统的框图。与图4的传统代码转换系统相比,本发明的该实施例使用从源参数域PDA至目标参数域PDB的直接代码转换,来替代解码器DEC—A的时
间-频率合成和编码器ENC一B的时间-频率分解的序列。该方式的一个优点是具有较低的计算复杂度,从而具有更高的效率以及更好的数值行为(意味着更小的信号失真)。这尤其适用于具有通常用于代码转换的数学运算的有限精度的定点实施方式。因此,与传统代码转换方案相比,本发明实现了从源音频格式至目标音频格式的更快速的代码转换以及更好的结果质量。此外,以与传统代码转换系统中的辅助信息类似的方式来使用辅助信息SI'。
所公开的算法的使用不限于一个编码格式向另一个的完全转换,如以上一些实施例作为示例所示出的那样,还可用作与音频相关的其他算法的构造模块。
本发明的典型示例性应用是针对无损编码的时间-频率参数的预测、不同音频格式间的高质量代码转换等等。
权利要求
1.一种用于将成帧后的音频信号从第一参数域(PDA)代码转换至第二参数域(PDB)的方法,包括以下步骤-在不创建时域音频信号的情况下,将所述第一参数域(PDA)的两个或更多个参数线性变换(TT)为所述第二参数域(PDB)的至少一个参数,其中,所述第一参数域的所述两个或更多个参数来自所述第一参数域中的音频信号的不同帧,并且是通过时间-频率变换而获得的。
2. 根据权利要求l所述的方法,其中,所述将所述两个或更多个 输入参数线性变换为所述至少一个输出参数的步骤是时变的。
3. 根据权利要求2所述的方法,其中,所述时变线性变换是多个 时不变线性变换的周期性重复。
4. 根据权利要求2或3所述的方法,其中,所述第二参数域(PDb) 中实质上所有的参数都是从所述第一参数域(PDA)的线性变换后的 参数而获得的,所述线性变换是非平凡的。
5. 根据权利要求3或4所述的方法,其中,所述周期性重复的一个 周期覆盖了与所述第二参数域(PDb)的不同整数数目的帧相对应的 所述第一参数域(PDA)的整数数目的帧。
6. 根据权利要求2至5之一所述的方法,其中,所述第一和第二参 数域基于使用时间分解窗口的时间-频率分解,所述第二参数域(PDb) 的时间-频率分解使用长分解窗口和短分解窗口,而且对于长分解窗口 和短分解窗口,所述线性变换(TT)是不同的。
7. 根据前述权利要求之一所述的方法,其中,所述线性变换(TT) 的步骤包括以下步骤-将来自不同输入帧的部分输入向量映射至部分输出向量;以及 -将所述部分输出向量叠加以产生输出帧。
8. 根据前述权利要求之一所述的方法,其中,所述对所述第一参 数域的两个或更多个参数进行线性变换的步骤包括使用具有变换系 数的查找表。
9. 根据前述权利要求之一所述的方法,其中,所述对所述第一参 数域的两个或更多个参数进行线性变换的步骤包括使用预定义解析 表达式。
10. —种用于将成帧后的音频信号从第一参数域(PDA)代码转换至第二参数域(PDB)的设备,包括-用于通过对所述第一参数域(PDA)的两个或更多个参数进行 线性变换(TT)来计算所述第二参数域的至少一个参数的装置,其中, 所述第一参数域的所述两个或更多个参数来自所述第一参数域中的音 频信号的不同帧,并且是通过时间-频率变换而获得的。
11. 根据权利要求10所述的设备,其中,所述将所述两个或更多 个输入参数线性变换为所述至少一个输出参数的操作是时变的。
12. 根据权利要求10或11所述的设备,还包括 一个或多个查找表装置,用于存储和检索变换系数。
13. 根据权利要求10至12之一所述的设备,还包括用于计算预定义解析表达式的装置。
14. 根据前述权利要求之一所述的方法或设备,其中,与所述第 二参数域(PDB)的音频帧相比,所述第一参数域(PDA)的音频帧(501) 具有不同的帧前移,其中,所述帧前移描述了帧的时间重叠。
15. 根据前述权利要求之一所述的方法或设备,其中,所述第一 参数域和所述第二参数域的所述不同参数是涉及时间-频率分解和时 间-频率合成的参数,所述第一参数域和所述第二参数域使用不同的时 间-频率分解和/或不同的时间-频率合成。
16. 根据前述权利要求之一所述的方法或设备,其中,所述线性 变换至少描述了根据所述第一参数域(PDA)的时间-频率合成()、 重叠相加(503)、分段(505)以及根据所述第二参数域(PDB)的时 间-频率分解(T^ )。
17. 根据前一权利要求所述的方法或设备,其中,所述时间-频率 合成(T^ )和/或分解(T^ )与线性块变换或线性前馈滤波器组相 对应。
18. 根据前述权利要求之一所述的方法或设备,其中,所述第一参数域的每个帧(501)的参数影响所述第二参数域的多于一个帧 (502),并表示所述音频信号的波形。
19. 根据前述权利要求之一所述的方法或设备,其中,所述变换 (TT)包括省略所述音频信号的特定频率部分。
20. 根据前一权利要求所述的方法或设备,其中,所述省略所述音频信号的特定频率部分的操作是时变的,且依赖于所述第一参数域 中的所述音频信号所使用的比特分配。
全文摘要
本发明提供了一种用于在例如由MPEG-AAC和mp3使用的具有不同时间-频率分解域的音频编码格式间进行代码转换的方法和设备,特别用于在这样的音频信号间方便地、更快速地进行代码转换。一种用于将成帧后的音频信号从第一参数域(PDA)代码转换至第二参数域(PDB)的方法包括将第一参数域(PDA)的两个或更多个参数线性变换(TT)为第二参数域(PDB)的至少一个参数,其中,第一参数域的所述两个或更多个参数来自第一参数域中的音频信号的不同帧。所述线性变换(TT)可以被描述为矩阵并实现为查找表。
文档编号G10L19/022GK101563726SQ200780034487
公开日2009年10月21日 申请日期2007年9月6日 优先权日2006年9月20日
发明者彼得·杰克斯, 斯文·科登 申请人:汤姆森许可贸易公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1