用于编码和低复杂性代码转换的频谱分量转换的制作方法

文档序号:2832306阅读:341来源:国知局
专利名称:用于编码和低复杂性代码转换的频谱分量转换的制作方法
用于编码和低复杂性代码转换 的频镨分量转换本申请是申请号为200480003666.7、申请日期为2004年1月30日、发明名称为"用于编码和低复杂性代码转换的频谱分量转换"的 申请的分案申请。4支术领域本发明一般涉及音频编码方法和设备,更具体地,涉及用于编码 和代码转换音频信息的改进方法和设备。
背景技术
A.编码许多通信系统面临信息传输和记录容量的需求经常超过可用容 量的问题。因此,在广播和记录领域中,非常关注在不降低其感知质 量的情况下,降低发送或记录要由人感知的音频信号所需要的信息量。 同时还关注对于给定带宽或存储容量提高输出信号的感知质量。传统的用于降低信息容量需要的方法涉及仅发送或记录输入信 号的选定部分。丢弃其余部分。称作感知编码的技术通常将原始的音 频信号转换成频镨分量或频率子带信号,从而能够更容易地识别和丟 弃冗余或不相关的那些信号部分。如果可以根据信号的其它部分再生 某一信号部分,则将该信号部分视为冗余的。如果某一信号部分在感 知上无关紧要或听不到,则将该信号部分视为不相关的。感知解码器 可以根据编码信号重新建立丢弃的冗余部分,但是它不能建立任何并 非冗余的已丢弃的不相关信息。然而,丢弃不相关的信息在许多应用 中是可接受的,这是因为它的缺乏对于解码信号没有可感知的影响。信号编码技术在感知上是透明的,如果它仅丢弃冗余或在感知上不相关的那些信号部分的话。 一种可以丢弃信号不相关部分的方式是 用较低精确度等级表示频镨分量,这通常称作量化。将原始频镨分量 及其量化表示之间的差值称作量化噪声。较低精确度的表示具有较高 的量化噪声电平。感知编码技术试图控制量化噪声电平,以使其听不 到。如果感知上透明的技术不能实现充分地降低信息容量要求,则需 要感知上不透明的技术以丢弃非冗余和在感知上相关的附加信号部 分。不可避免的结果是降低了所发送或所记录信号的感知保真度。优 选地,感知上不透明的技术仅丟弃视为具有最低感知重要性的那些信 号部分。可以使用一种称作"耦合"的编码技术来降低信息容量要求,通常 将该技术视为感知上不透明的技术。根据这种技术,组合在两个或更 多输入音频信号内的频镨分量以形成具有这些频语分量的复合表示的 耦合声道信号。还生成边信息,它表示在被组合以形成复合表示的每 个输入音频信号内的频镨分量的频镨包络。发送或记录包括耦合声道 信号和边信息的编码倌号,用于随后由接收器解码。通过生成耦合声 道信号的复本和使用边信息定标在复制信号内的频谱分量,从而基本 上恢复原始输入信号的频镨包络,接收器生成去耦合信号,它是原始 输入信号的不精确复制品。用于两声道立体声系统的典型耦合技术组 合左右声道信号的高频分量以形成复合高频分量的单个信号,生成表 示在原始的左右声道信号内高频分量的频镨包络的边信息。在先进电视系统委员会(ATSC )标准文件A/52( 1994 )的"数字音频压缩(Digital Audio Compression ) ( AC-3 ),,(在此称作A/52文件)中描述了耦 合技术的一个例子。称作频语再生的编码技术是可以用于降低信息容量要求的感知 上不透明的技术。在许多实现方式中,将这种技术称作"高频再生" (HFR),因为仅再生高频频镨分量。根据这种技术,发送或存储仅 包含输入音频信号的低频分量的基带信号。还提供表示原始高频分量 的频镨包络的边信息。发送或记录包括基带信号和边信息的编码信号,用于随后由接收器解码。接收器基于边信息再生具有频镨电平的已省 略高频分量,组合基带信号与所再生的高频分量以生成输出信号。在1979年4月的0/幼e i7i&rfitf^mfl/ Co"/ ^4cows" 57gwfl/ /Voc * Makhoul和Berouti的"在语音编码系统内的高频再生 (High-Frequency Regeneration in Speech Coding Systems ),,中可以 发现HFR的已知方法的描述。在于2002年3月28日提交的标题为"用 于高频再生的宽带频率转换(Broadband Frequency Translation for High Frequency Regeneration )"的序列号为10/113,858的美国专利申 请、于2002年6月17日提交的标题为"使用频语孔填充的音频编码系 统(Audio Coding System Using Spectral Hole Filling),,的序歹寸号为 10/174,493的美国专利申请、于2002年9月6日提交的标题为"使用 解码信号特性适配合成频i普分量的音频编码系统(Audio CodingSystem Using Characteristics of a Decoded Signal to Adapt Synthesized Spectral Components )"的序列号为10/238,047的美国专 利申请和于2003年5月8日提交的标题为"使用频语分量耦合和频谱 分量再生的改进音频编码系统和方法(Improved Audio Coding Systems and Methods Using Spectral Component Coupling and Spectral Component Regeneration ),,的序歹寸号为10/434,449的美国专利申请中公开了适合于编码高质量音乐的改进频谱再生技术。 B.代码转换已知的编码技术已经降低了给定感知质量等级的音频信号的信 息容量要求,或者相反地,已经改善了具有规定信息容量的音频信号 的感知质量。尽管有这种成功,还需要进一步的改进,编码研究继续 发现新的编码技术,发现使用已知技术的新方式。进一步改进的一种结果是在用新编码技术编码的信号和执行旧 编码技术的现有设备之间的潜在不兼容性。尽管规格化组织和设备制 造商已经进行了大量努力来防止过早地作废,但旧的接收器不能始终 正确地解码用新编码技术编码的信号。相反地,新的接收器不能总是 正确地解码用旧编码技术编码的信号。因此,专业人士和消费者都获保与用旧编码技术和新编码技术 编码的信号的兼容性的话。
一种能够减轻或避免这一负担的方式是获得能够将编码信号从 一种格式转换成另一种格式的代码转换器。代码转换器可以用作不同 编码技术之间的桥梁。例如,代码转换器可以将用新编码技术编码的 信号转换成与仅能解码用旧技术编码的那些信号的接收器兼容的另一 种信号。
常规的代码转换实现完整的解码和编码处理。参见上面提到的代 码转换的例子,使用新的解码技术解码输入的编码信号以获得随后通 过合成滤波转换成数字音频信号的频谱分量。然后,通过分析滤波将 数字音频信号再次转换成频谱分量,然后,使用旧的编码技术编码这 些频镨分量。所获得的结果是与旧接收装置兼容的编码信号。也可以 使用代码转换从旧格式转换成新格式,在不同的现代格式之间转换和 在同一格式的不同比特率之间转换。
当使用常规的代码转换技术转换用感知编码系统编码的信号时, 这些技术具有严重的缺点。 一个缺点是常规的代码转换装置较昂贵, 因为它必需实现完整的解码和编码处理。第二个缺点是相对于输入编 码信号在解码之后的感知质量,经过代码转换的信号在解码之后的感 知质量几乎总是降低。

发明内容
本发明的目的是提供能够用于改善代码转换信号的质量和允许 较低廉地实现代码转换装置的编码技术。
通过如在权利要求中阐述的本发明实现这个目的。 一种代码转换 技术解码输入的编码信号以获得频谱分量,随后将该频谱分量编码成 输出的编码信号。避免了因为合成和分析滤波导致的实施成本和信号 劣化。通过在编码信号中提供控制参数,而不是由代码转换器为其自 身确定这些控制参数,可以进一 步降低代码转换器的实施成本。
通过参考下述讨论和附图,可以更好地理解本发明的各个特征及其优选实施例,在附图中相同的参考数字表示相同的单元。下述讨论 和附图的内容仅作为例子来阐述,不应当理解为表示在本发明保护范 围上的限制。


图l是音频编码发送器的示意图。
图2是音频解码接收器的示意图。 图3是代码转换器的示意图。
图4和图5是包含本发明各个方面的音频编码发送器的示意图。 图6是能够实现本发明各个方面的设备的示意方框图。
具体实施方式
A.概述
基本的音频编码系统包括编码发送器、解码接收器和通信路径或 记录媒体。发送器接收表示一个或多个音频声道的输入信号,并生成 表示该音频的编码信号。随后,发送器将编码信号发送给用于传输的 通信路径或用于存储的记录媒体。接收器从通信路径或记录媒体接收 编码信号,并生成可能是原始音频的精确或近似复本的输出信号。如 果输出信号并非精确的复本,则许多编码系统试图提供与原始输入音 频在感知上无法区分的复本。
任何编码系统的正确操作的内在和显然的要求是接收机必需能 够正确地解码编码信号。然而,因为在编码技术上的发展,出现希望 使用接收器解码用接收器不能正确解码的编码技术所编码的信号的情 况。例如,可能已经通过编码技术生成编码信号,该编码技术预期解 码器执行频镨再生,但是接收器不能执行频语再生。相反地,可能已 经通过编码技术生成编码信号,该编码技术并未预期解码器执行频谱 再生,但是接收器预期和要求需要频谱再生的编码信号。本发明涉及 能够在不兼容的编码技术和编码设备之间提供桥梁的代码转换。
下面描述几种编码技术,作为对可以实施本发明的若干方式的详
9细描述的介绍。
1.基本系统
a)编码发送器
图1是从路径11接收输入音频信号的分频带音频编码发送器10 的一种实施方式的示意图。分析滤波器组12将输入的音频信号分成表 示音频信号频镨内容的频语分量。编码器13执行将至少一些频镨分量 编码成编码频谱信息的处理。使用响应于从量化控制器14接收到的控 制参数而适配的量化分辨率,由量化器15量化编码器13尚未编码的 频语分量。可选择地,也可以量化一些或全部的编码频谱信息。量化 控制器14根据所检测的输入音频信号的特性导出控制参数。在所图示 的实施方式中,根据编码器13提供的信息获得所检测的特性。量化控 制器14还可以响应于音频信号的包括时间特性的其它特性来推导控 制参数。可以在由分析滤波器组12执行的处理之前、之中或之后,根 据音频信号的分析获得这些特性。由格式化器16将表示量化频谱信息 的数据、编码频镨信息和表示控制参数的数据装配在编码信号内,该 编码信号沿着路径17传送以传输或存储。格式化器16还可以将其它 数据装配在编码信号内,例如同步字、奇偶校验或错误检测码、数据 库检索关键字和辅助信号,这些与理解本发明没有关系,将不进一步 讨论。
可以通过基带或调制通信路径在包括从超声波到紫外线频率的 频镨上发送编码信号,或者可以使用任一记录技术记录在媒体上,包 括磁带、卡或盘、光卡或光盘和在诸如纸张等媒体上的可检测标记。 (1)分析滤波器组
下面讨论的分析滤波器组12和合成滤波器组25基本上可以通过 任一希望的方式来实现,包括多种数字滤波器技术、块变换和小波变 换。在一种音频编码系统中,通过改进离散余弦变换(MDCT)实现 分析滤波器组12,通过逆改进离散余弦变换(IMDCT)实现合成滤 波器组25, Princen等人在1987年5月的幼e /"/e/7i^/ow"/ CWi/ o" 5^eec/i 57gw"/ iVoc.第2161-64页的"基于时域混叠消除的使用滤波器组i殳计的子带/变换编码(Subband/Transform: Coding Using Filter Bank Designs Based on Time Domain Aliasing Cancellation)"中描述了这样的实现方式。具体的滤波器组实施方式 原则上并不重要。
通过块变换实现的分析滤波器组将输入信号的 一 个块或区间分 成表示该信号区间的频镨内容的一组变换系数。 一组一个或多个相邻 变换系数表示在特定频率子带内的频镨内容,所述频率子带的带宽与 该组内的系数个数相当。
通过诸如多相滤波器的某种类型的数字滤波器而非块变换实现 的分析滤波器组将输入信号分成一组子带信号。每个子带信号是在特 定频率子带内输入信号频语内容的基于时间的表示。优选地,抽取该 子带信号,使得每个子带信号具有与单位时长的子带信号内的抽样个 数相当的带宽。
下面的讨论更具体地涉及使用诸如上述时域混叠消除(TDAC ) 变换等块变换的实施方式。在该讨论中,术语"频谱分量"是指变换系 数,术语"频率子带"和"子带信号"涉及多组一个或多个相邻变换系数。 然而,本发明的原理也可以应用于其它类型的实施方式,所以术语"频 率子带,,和"子带信号"还涉及表示信号整个带宽的一部分的频镨内容 的信号,术语"频镨分量,,一般可以被理解为是指子带信号的抽样或成 分。感知编码系统通常实现分析滤波器组以提供带宽与人类听觉系统 的所谓临界带宽相当的频率子带。 (2)编码
编码器13可以执行所希望的基本上任一类型的编码处理。在一 种实施方式中,该编码处理将频镨分量转换成包括定标值和相关标度 因子的定标表示,如在下文中讨论的。在其它的实施方式中,也可以 使用诸如矩阵或生成用于频谱再生的边信息或耦合的编码处理。在下 文中更详细地讨论这些技术中的一些技术。
发送器IO可以包括图1未建议的其它编码处理。例如,量化频 镨分量可以经过熵编码处理,例如算术编码或霍夫曼编码。理解本发明不需要对这些编码处理的详细描述。
(3 )量化
响应于从量化控制器14接收到的控制参数,适配由量化器15提供的量化分辨率。可以以所希望的任何方式导出这些参数;然而,在感知编码器中,使用某种类型的感知模型估计通过将要编码的音频信号可以掩蔽多少量化噪声。在许多应用中,量化控制器还响应于在编码信号的信息容量上施加的限制。有时,在用于编码信号或者用于编码信号特定部分的最大容许比特率方面表示这一限制。
在感知编码系统的优选实施例中,由比特分配处理使用控制参数确定分配给每个频谱分量的比特数量和确定量化器"用于量化每个频谱分量的量化分辨率,从而使量化噪声的可听性以信息容量或比特率限制为条件而最小化。量化控制器14的具体实施方式
对于本发明并
不关键。
在A/52文件中公开了量化控制器的一个例子,该文件描述了有时称作杜比AC-3的编码系统。在这种实施方式中,用定标表示来表示音频信号的频语分量,在所述定标表示中,标度因子提供音频信号的频镨形状的估计。感知模型使用标度因子计算掩蔽曲线,该掩蔽曲线估计音频信号的掩蔽效应。随后,量化控制器确定容许的噪声阈值,它控制如何量化频镨分量,从而以某种最佳方式分布量化噪声以符合所施加的信息容量限制或比特率。容许的噪声阈值是掩蔽曲线的复本,并以由量化控制器确定的量值偏离该掩蔽曲线。在这种实施方式中,控制参数是定义容许噪声阈值的数值。这些参数可以通过多种方式表示,例如阈值本身的直接表达或者诸如可以根据其导出所允许的噪声阈值的标度因子和偏移等数值。
b)解码接收器
图2是分频带音频解码接收器20的一种实施方式的示意图,该接收器20从路径21接收表示音频信号的编码信号。去格式化器22从编码信号获得量化频镨信息、编码频谱信息和控制参数。由去量化器23使用响应于控制参数而适配的分辨率去量化所述量化频谱信息。可选择地,也可以去量化一些或全部的编码频语信息。编码频i瞽信息
由解码器24解码,并与去量化频镨分量组合,由合成滤波器组25将所述去量化频镨分量转换成音频信号后沿着路径26传送。
在接收器内执行的处理与在发送器内执行的相应处理是互补的。去格式化器22拆散由格式化器16装配的内容。解码器24执行与由编码器13执行的编码处理完全相反或拟相反的解码处理,去量化器23执行与量化器15执行的处理拟相反的处理。合成滤波器组25执行与分析滤波器组12执行的处理相反的滤波处理。将解码和去量化处理描述为拟相反的处理,因为它们可能不提供发送器内互补处理的完全逆处理。
在一些实施方式中,可以将合成或伪随机噪声插入去量化频语分量的一些最低有效比特内,或者用作一个或多个频谱分量的替代。接收器还可以执行附加的解码处理以解决在发送器内可能已经执行的任何其它编码。
c)代码转换器
图3是从路径31接收表示音频信号的编码信号的代码转换器30的一种实施方式的示意图。去格式化器32从编码信号中获得量化频语信息、编码频语信息、 一个或多个第一控制参数和一个或多个第二控制参数。由去量化器33使用响应于从编码信号接收到的一个或多个第一控制参数而适配的分辨率去量化所述量化频谱信息。可选择地,也可以去量化一些或全部的编码频谱信息。如果需要的话,可以由解码器34解码全部或一些编码频谱信息用于代码转换。
编码器35是特定代码转换应用可能不需要的可选组件。如果需要的话,编码器35执行将至少一些去量化频镨信息或编码和/或解码
频镨信息编码成重新编码频镨信息的处理。由量化器36使用响应于从编码信号接收的一个或多个笫二控制参数而适配的量化分辨率重新量
化编码器35未编码的频镨分量。可选择地,也可以量化一些或全部重新编码的频镨信息。由格式化器37将表示重新量化频语信息的数据、重新编码频镨信息和表示一个或多个第二控制参数的数据装配到编码倌号内,该信号沿着路径38传送以传输或存储。格式兆器37还可以将其它数据装配到编码信号内,如上文针对格式化器16所讨论的。
代码转换器30能够更有效地执行其操作,因为实现量化控制器以确定第 一和第二控制参数不需要计算资源。代码转换器30可以包括诸如如上所述的量化控制器14的一个或多个量化器控制器以导出一个或多个第二控制参数和/或一个或多个第一控制参数,而不是根据编码信号获得这些参数。下面讨论确定第一和第二控制参数需要的编码发送器10的特征。
2.数值的表示(l)定标
音频编码系统通常必需表示具有超过100dB的动态范围的音频信号。可以表示该动态范围的音频信号或其频谱分量的二进制表示所需要的比特数量正比于该表示的精确度。在诸如常规光盘的应用中,用16比特表示脉冲编码调制(PCM)音频。许多专业应用使用更多的比特,例如20或24比特,来表示具有更大动态范围和更高精确度的PCM音频。
音频信号或其频镨分量的整数表示是非常低效的,许多编码系统使用包括下述形式的定标值和相关标度因子的另 一种表示
s=v.f (1)
其中s-音频分量的值;
v:定标值;和
f-相关的标度因子。可以用可能希望的基本上任一方式表示定标值v,包括小数表示和整数表示。可以用各种方式表示正值和负值,包括符号数值表示和各种补码表示,例如用于二进制数的1的补码和2的补码。标度因子f可以是简单的数,或者它可以是基本上任意函数,例如指数函数gf或对数函数loggf,其中g是指数和对数函数的底数。
在适合于在许多数字计算机中使用的优选实施方式中,使用特定的浮点表示,其中"尾数"m是定标值,使用2的补码表示将其表示为
14二进制小数,"指数"x表示标度因子,它是指数函数2-x。本公开内容的其它部分涉及浮点尾数和指数;然而,应当理解这种特定的表示方式仅是本发明可以应用于用定标值和标度因子表示的音频信息的一种方式。
用这种特定的浮点表示方式将音频信号分量的值表示如下s=m.2-x ( 2 )
例如,假设频语分量的值等于0.175781251(),它等于二进制小数0.001011012。这个值可以用表I所示的多对尾数和指数表示。
表I
尾数(m )指数(X)表示
0观01101200.001011012x20=0.17578125xl=0.17578125
0.0101101210.01011012x2 ;0.3515625x0.5=0.17578125
0,101101220.1011012x2 2=0.703125x0.25=:0.17578125
1.01101231.011012x2 3=1.40625x0.125=0.17578125
在这种特定浮点表示方式中,用值为负数数值的2的补码的尾数表示负数。参见表I中的最后一行,例如,2的补码表示方式的二进制小数1.011012表示十进制值-0.59375。因此,用该表最后一行内所示的浮点数实际表示的值是-0.59375x2^二0.07421875,它不同于该表中图示的预期值。下面讨论这一方面的意义。(2 )规格化
如果"规格化,,浮点表示方式,则可以用更少的比特表示浮点数的值。如果在不丢失有关该值的任何信息的情况下已尽可能远地将尾数的二进制表示方式内的比特移到最高有效比特位置,则将非零浮点表示方式称作规格化的。在2的补码表示方式中,规格化的正尾数始终大于或等于+ 0.5并小于+ 1,而规格化的负尾数始终小于-0.5并大于或等于-1。这等同于使最高有效比特不等于符号比特。在表I中,在第三行中的浮点表示方式是规格化的。用于规格化尾数的指数x等于2,它是将'T,比特移动到最高有效比特位置需要的比特位移次数。假设频镨分量的值等于十进制小数-0.17578125,它等于二进制数1.110100112。在2的补码表示中的初始"1"比特表示该数值是负数。可以将这个数值表示为具有规格化尾数111=1.0100112的浮点数。用于这个规格化尾数的指数x等于2,它是将"0"比特移动到最高有效比特位置需要的比特位移次数。
在表I的第一、第二和最后一行内表示的浮点表示方式是未规格化的浮点表示方式。在该表的前两行内表示的表示方式是"欠规格化的",在该表的最后一行内表示的表示方式是"过规格化的"。
为了编码目的,可以使用更少的比特表示规格化浮点数的尾数的精确值。例如,可以用九个比特表示未规格化尾数m=0.001011012的值。需要八个比特表示小数值,需要一个比特表示符号。可以仅用七个比特表示规格化尾数m-0.10110l2的值。可以用更少的比特表示在表l最后一行内表示的过规格化尾数m-1.0110l2的值;然而,如上面所解释的,带有过规格化尾数的浮点数不再表示正确的数值。
这些例子有助于说明为何通常希望避免欠规格化的尾数和为何通常严格避免过规格化的尾数。欠规格化尾数的存在可能意味着在编码信号中低效地使用比特或者较不精确地表示数值,而过规格化尾数的存在通常意味着数值严重失真。(3)对规格化的其它考虑
在许多实施方式中,指数用固定数量的比特表示,或者可选择地,限制于具有规定范围内的数值。如果尾数的比特长度长于最大可能指
数值,则该尾数能够表示不能规格化的数值。例如,如果用3个比特表示指数,则它可以表示从O到7的任意值。如果用16个比特表示尾数,则它能够表示的最小非零值需要14个比特移位以规格化。3比特指数显然不能表示规格化这个尾数值需要的数值。这种情况并不影响本发明所基于的基本原理,但是实际的实施方式应当确保算术运算并不将尾数移位到超出相关指数能够表示的范围。
通常,使用其自身的尾数和指数表示在编码信号内的每个频谱分量的效率很低。如果多个尾数共享公用指数,则需要较少的指数。这种配置有时称作块浮点(BFP)表示方我。建立用于该块的指数值,从而用规格化的尾数表示在该块内具有最大数值的值。
如果使用较大的块,则需要较少的指数,和因而表示指数的较少比特。然而,使用较大的块通常导致在该块内更多的值欠规格化。因此,通常选择块的大小以平衡在传送指数需要的比特数量和表示欠规格化尾数导致的不精确性和低效性之间的折衷。
块大小的选择还可以影响编码的其它方面,例如由在量化控制器14内使用的感知模型计算出的掩蔽曲线的精确度。在一些实施方式中,感知模型使用BFP指数作为频谱形状的估计以计算掩蔽曲线。如果将很大的块用于BFP,则降低了 BFP指数的频谙分辨率,并降低了由感知模型计算出的掩蔽曲线的精确度。可以从A/52文件获得其它细节。
在下文的描述中将不讨论使用BFP表示方式的结果。应当理解,当使用BFP表示方式时,某些频语分量将很可能始终是欠规格化的。(4 )量化
用浮点形式表示的频谱分量的量化通常是指尾数的量化。指数通常并不量化,而是用固定数量的比特表示,或者可选择地,限制于具有在规定范围内的值。
如果将表I所示的规格化尾数m-0.101101量化到0.0625=0.00012的分辨率,则量化尾数q(m)等于二进制小数0.10112,它可以用5个比特表示,并等于十进制小数0.6875。在量化到这个特定分辨率之后用浮点表示方式表示的值是q(m)'2-x=0.6875x0.25=0.171875。
如果将在该表中所示的规格化尾数量化到0.25=0.012的分辨率,则已量化的尾数等于二进制小数0.102,它可以用3个比特表示,并等于十进制小数0.5。在量化到这个较粗略的分辨率之后用浮点表示方式表示的值是q(s)=0.5x0.25=0.125。
提供这些特定的例子仅仅为了便于解释。对于本发明来说,量化的具体形式和在量化的分辨率和表示量化尾数需要的比特数量之间的具体关系在原则上并不重要。(5)算术运算
许多处理器和其它硬件逻辑执行可直接应用于数的浮点表示的 一组专用算术运算。 一些处理器和处理逻辑并不执行这些运算,有时 使用这些类型的处理器是很有吸引力的,因为它们通常低廉得多。当 使用这些处理器时, 一种模拟浮点运算的方法是将浮点表示转换成扩 展精确度的定点小数表示,对已转换的值执行整数算术运算,并重新 转换回浮点表示。更有效的方法是分别对尾数和指数执行整数算术运 算。
通过考虑到这些算术运算可能对尾数的影响,编码发送器可能能 够修改其编码处理,以便可以按需要控制或防止在随后解码处理内的 过规格化和欠规格化。如果在解码处理中出现频语分量尾数的过规格 化或欠规格化,则解码器不能在不改变相关指数数值的情况下校正这 种情况。
对于代码转换器30来说,这尤其麻烦,因为指数的改变意味着 需要量化控制器的复杂处理以确定用于代码转换的控制参数。如果改 变频镨分量的指数,则在编码信号内传送的一个或多个控制参数可能 不再有效,并可能需要再次确定,除非确定这些控制参数的编码处理 能够预料到该改变。
相加、相减和相乘的影响尤其重要,因为在例如在下文中描述的 编码技术中使用这些算术运算。 (a )相力口
两个浮点数的相加可以在两个步骤中执行。在第一步骤中,如果 需要,协调这两个数的定标。如果两个数的指数不相等,则将与较大 指数相关的尾数的比特向右移动与两个指数的差值相等的次数。在第 二步骤中,通过使用2的补码运算相加两个数的尾数来计算"总尾数"。 随后,用总尾数和两个原始指数中较小的指数表示两个原始数之和。
在相加运算结束时,总尾数可能是过规格化或欠规格化的。如果 两个原始尾数之和等于或大于+1或者小于-1,则总尾数将是过规格化 的。如果两个原始尾数之和小于+ 0.5和大于或等于-0.5,则总尾数将是欠规格化的。如果两个原始^c数具有相反的符号,则会出现后一种 情况。
(b )相减
以类似于上面描述的相加的方式,可以在两个步骤中执行两个浮 点数的相减。在第二步骤中,通过使用2的补码运算从一个原始尾数 中减去另一个原始尾数计算出"差值尾数"。随后,用该差值尾数和两 个原始指数中较小的指数表示两个原始数的差值。
在相减运算结束时,差值尾数可能是过规格化或欠规格化的。如 果两个原始尾数的差值小于+0.5和大于或等于-0.5,则差值尾数将是 欠规格化的。如果两个原始尾数的差值等于或超过+1或者小于-1,则 差值尾数将是过规格化的。如果两个原始尾数具有相反的符号,则会 出现后一种情况。
(c)相乘
可以在两个步骤中执行两个浮点数的相乘。在第一步骤中,通过 相加两个原始数的指数计算出"总指数"。在第二步骤中,通过使用2 的补码运算相乘两个数的尾数计算出"乘积尾数"。随后,用乘积尾数 和总指数表示两个原始数的乘积。
在相乘运算结束时,乘积尾数可能是欠规格化的,但是有一个例 外,不可能是过规格化的,因为乘积尾数的数值不可能大于或等于+1 或者小于-1。如果两个原始尾数的乘积小于+0.5和大于或等于-0.5,则 乘积尾数将是欠规格化的。
当将要相乘的两个浮点数都具有等于-1的尾数时,出现过规格化 规则的一个例外。在这种情况下,相乘产生等于+ 1的乘积尾数,它 是过规格化的。然而,通过保证将要相乘的至少一个数值不是负值, 能够防止出现这种情况。对于下面讨论的合成技术来说,相乘仅用于 合成来自耦合声道信号的信号和频镨再生。通过要求耦合系数是非负 值,在耦合中避免了上述例外的情况,并且通过要求包络定标信息、 所转换的分量混合参数和类似噪声的分量混合参数是非负值,对于频 i普再生避免了上述例外情况。该讨论的剩余部剩艮设执行编码技术以避免这种例外的情况。如 果不能避免这种情况,则必需在使用相乘时采取步骤也避免过规格化。 (d)总结
可以将这些运算对尾数的影响总结如下
(1) 两个规格化数的相加可能产生可以是规格化、欠规格化或 过规格化的总和;
(2) 两个规格化数的相减可能产生可以是规格化、欠规格化或 过规格化的差值;以及
(3 )两个规格化数的相乘可能产生可以是规格化或欠规格化的 乘积,但是考虑到上面讨论的限制,不会是过规格化的。
如果是规格化的,则可以使用更少的比特表示从这些算术运算获 得的数值。欠规格化的尾数与小于规格化尾数的理想值的指数相关; 欠规格化尾数的整数表示将损失精确度,因为从最低有效比特位置丢 失了有效比特。过规格化的尾数与大于规格化尾数的理想值的指数相 关;过规格化的尾数的整数表示将引入失真,因为将有效比特从最高 有效比特位置移位到符号比特位置。下面讨论一些编码技术影响规格 化的方式。
3.编码纟支术
一些应用在编码信号的信息容量上施加了严格的限制,基本的感 知编码技术在解码信号内不插入不可接受的量化噪声电平的情况下不 能满足这些限制。可以使用其它的编码技术,虽然也降低解码信号的 质量,但是以某种方式将量化噪声降低到可接受的电平。下面讨论这 些编码技术中的一些技术。
a)矩阵化
可以使用矩阵化来降低在两声道编码系统内的信息容量要求,如 果在这两个声道内的信号非常相关的话。通过将两个相关信号矩阵化 成和信号和差值信号,两个矩阵化信号之一将具有与两个原始信号之
一基本上相等的信息容量要求,但是另一个矩阵化信号将具有低得多 的信息容量要求。例如,如果两个原始信号完全相关,则矩阵化信号之一的信息容量要求将接近于零。
原则上,可以从两个矩阵化和信号和差值信号完全恢复出两个原 始信号;然而,用其它编码技术插入的量化噪声将阻止完全恢复。量
化噪声可能导致的矩阵化问题与本发明的理解并不相关,将不进一步 讨论。可以从其它参考文献中获得其它的细节,例如美国专利
5,291,557以及1999年8月 Audio Eng. Soc. 17th International Conference上Vernon发表的"杜比数字用于数字电视和存储应用的 音频编石马(Dolby Digital: Audio Coding for Digital Television and Storage Applications ),,笫44至57页,尤其参见第50至51页。
下面描述用于编码两声道立体声节目的典型矩阵。优选地,仅当 认为两个原始子带信号非常相关时,才将矩阵化自适应地应用于在子 带信号内的频镨分量。该矩阵将左输入声道和右输入声道的频谱分量 组合成和声道信号和差值声道信号的频谱分量,如下
Mi-l/2(Li+Rj) (3a) D产l/2(Lj画Ri) (3b)
其中M产在矩阵的和声道输出内的频谱分量i;
D产在矩阵的差值声道输出内的频谦分量i;
L尸矩阵的左声道输入内的频语分量i;以及
Ri-矩阵的右声道输入内的频镨分量i。 以类似于用于未矩阵化的信号内的频谱分量的方式,编码在和声道信 号和差值声道信号内的频谱分量。在用于左声道和右声道的子带信号 非常相关和同相的情况下,在和声道信号内的频谱分量具有与在左声 道和右声道内的频谱分量的幅度基本上相同的幅度,在差值声道信号
内的频谱分量将基本上等于零。如果用于左声道和右声道的子带信号 非常相关并相互在相位上相反,则频谱分量幅度与和声道信号和差值 声道信号之间的关系颠倒。
如果将矩阵化自适应地应用于子带信号,将用于每个频率子带的 矩阵化的指示包括在编码信号内,以便接收器能够确定何时应当使用 互补逆矩阵。接收器为编码信号内的每个声道独立地处理和解码子带信号,除非接收到表示子带信号被矩阵化的指示。接收器能通过应用 如下的逆矩阵反转矩阵化的影响和恢复左声道子带信号和右声道子带
信号的频谱分量
<formula>formula see original document page 22</formula>
其中4-在矩阵的恢复左声道输出内的频语分量i;和 《-在矩阵的恢复右声道输出内的频语分量i。
通常,因为量化影响,所恢复的频谱分量并不精确地等于原始的频谱 分量。
:v 如果逆矩阵接收到具有规格化的尾数的频谱分量,_则在该逆矩阵 内的相加和相减运算可能会导致具有如上面所解释的欠规格化或过规 格化的尾数的恢复频镨分量。
如果接收机合成矩阵化子带信号内的一个或多个频镨分量的替 代品,则这种情况更加复杂。合成处理通常建立不确定的频谱分量值。 这种不确定性导致不可能预先确定来自逆矩阵的哪个频谱分量将是过 规格化或欠规格化的,除非预先已经知道合成处理的总体影响。
b)耦合
可以使用耦合来编码多个声道的频谱分量。在优选实施方式中,
将耦合限制于更高频率子带内的频谦分量;然而,在原理上,耦合可 以用于频镨的任一部分。
耦合将在多个声道内的信号频语分量组合成单个耦合声道信号 的频谱分量,并编码表示耦合声道信号的信息而不是编码表示原始多 个信号的信息。编码信号还包括表示原始信号的频谱形状的边信息。 该边信息使接收机能够从耦合声道信号合成多个信号,所述多个信号
具有与原始多个声道的信号基本上相同的频谱形状。在A/52文件中描 述了可以执行耦合的一种方式。
下面的讨论描述了可以执行耦合的一种简单的实施方式。#4居这
种实施方式,通过计算在多个声道内相应频镨分量的平均值形成耦合 声道的频谱分量。将表示原始信号频谱形状的边信息称作耦合坐标。根据在特定声道内的频i普分量能量与在耦合声道信号内频i昝务量能量 的比值计算出用于特定声道的耦合坐标。
在优选实施方式中,在编码信号内作为浮点数同时传送频镨分量 和耦合坐标。接收器通过相乘在耦合声道信号内的每个频镨分量与合 适的耦合坐标而从耦合声道信号合成多个声道信号。结果是具有与原 始信号相同或基本上相同的频谱形状的一组合成信号。可以将这个处 理表示如下
Si,j-Ci'ccj,j (5)
其中Si,产在声道j内的合成频谱分量i;
C产在耦合声道信号内的频语分量i;和
ccj,产用于声道j内的频i普分量i的耦合坐标。
如果用规格化的浮点数表示耦合声道频镨分量和耦合坐标,则这 两个数的乘积将生成用可能是欠规格化但是因为上面解释的原因不会 是过规格化的尾数表示的值。
如果接收器合成耦合声道信号内的一个或多个频镨分量的替代 品,则这种情况更加复杂。如上所述,合成处理通常建立不确定的频 谱分量值,这种不确定性导致不可能预先确定相乘所得到的哪个频谱 分量将是欠规格化的,除非预先已经知道合成处理的总体影响。
c)频i脊再生
在使用频谱再生的编码系统中,编码发送器仅编码输入音频信号 的基带部分,并丢弃其余部分。解码接收器生成合成信号以替代所丢 弃的部分。编码信号包括由解码处理用于控制信号合成的定标信息, 以便合成信号在一定程度上保持所丟弃的输入音频信号部分的频谱电 平。
可以通过多种方式再生频镨分量。 一些方式使用伪随机数生成器 生成或合成频语分量。其它的方式将基带信号内的频i普分量转换或复 制到需要再生的频镨部分内。具体的方式对于本发明来说并不重要; 然而,从上面引用的参考文献可以获得一些优选实施方式的描述。
下面的讨论描述了频谱分量再生的一种简单的实施方式。根据这种卖施方式,通过从基带信号复制频谱分量,组合所复制的分量与由 伪随机数生成器生成的类似噪声的分量,和根据在编码信号中传送的 定标信息定标该组合,合成频语分量。根据在编码信号内传送的混合 参数,还调整所复制的分量和类似噪声的分量的相对加权。可以用下
述表达式表示这一处理
s产er[arTi+bi'Ni] (6)
其中s产合成频镨分量i;
e尸用于频谱分量i的包络定标信息;
T尸用于频语分量i的复制频语分量;
N尸为频i脊分量i生成的类似噪声分量;
ar用于转换分量Tj的混合参数;和
b「用于类似噪声分量Ni的混合参数。
如果用规格化的浮点数表示复制频镨分量、包络定标信息、类似 噪声分量和混合参数,则生成合成频谱分量需要的相加和相乘操作将 产生用因为上面解释的原因可能是欠规格化或过规格化的尾数表示的 值。不可能预先确定哪个合成频镨分量将是欠规格化或过规格化的, 除非预先已经知道合成处理的总体影响。
B.改进技术
本发明涉及允许更高效地执行和提供更高质量的代码转换信号 的感知编码信号的代码转换的技术。这通过消除代码转换处理中的某 些功能来实现,例如消除在常规的编码发送器和解码接收器内需要的 分析和合成滤波。在其最简单的形式中,根据本发明的代码转换仅执 行去量化频镨信息所需要的部分解码处理,和它仅执行重新量化去量 化频语信息所需要的部分编码处理。如果需要的话,可以执行附加的 解码和编码。通过从编码信号中获得控制去量化和重新量化需要的控 制参数,进一步简单了该代码转换处理。下面的讨论描述了编码发送 器可用于生成代码转换需要的控制参数的两种方法。
1.最差情况假设
a )概述f 用于生成控制参数的第一种方法假设最差情况条件,并仅在确保
不可能出现过规格化所需要的程度上修改浮点指数。预期一些不必要
的欠规格化。已修改的指数由量化控制器14用于确定一个或多个第二 控制参数。已修改的指数并不需要包括在编码信号内,因为代码转换 处理在相同条件下也修改指数,它修改与已修改指数相关的尾数,以 使浮点表示方式表达正确的数值。
参见图2和图4,量化控制器14如上所述地确定一个或多个第一 控制参数,估计器43分析与解码器24的合成处理相关的频谱分量以 识别为确保在合成处理中不会出现过规格化而必需修改哪些指数。修 改这些指数,并将它们与其它未修改的指数一起传送给量化控制器 44,它确定用于将在代码转换器30内执行的重新编码处理的一个或多 个第二控制参数。估计器43仅需要考虑在合成处理中可能产生过规格 化的算术运算。因为这个原因,并不需要考虑类似于上述的用于耦合 声道信号的合成处理,因为如上面所解释的,这个特定处理并不会导 致过规格化。可能需要考虑在耦合的其它实施方式中的算术运算。
b)处理的详细情况 (1)矩阵化
在矩阵化中,不可能知道将提供给逆矩阵的每个尾数的确切值, 直到由量化器15执行了量化和已经合成由解码处理生成的任何类似 噪声分量之后。在这种实施方式中,必需为每个矩阵运算假设最差的 情况,因为尾数值是未知的。参见等式4a和4b,在逆矩阵内的最差 情况运算是符号相同和数值足够大到相加成大于1的数值的两个尾数 的相加,或者符号不同和数值足够大到相加成大于1的数值的两个尾 数的相减。通过将每个尾数向右偏移一个比特和将它们的指数减1, 在代码转换器内可以针对任一种最差情况防止过规格化;因此,估计 器43在逆矩阵计算中降低每个频语分量的指数,量化控制器44使用 这些修改后的指数确定用于代码转换器的一个或多个第二控制参数。 在此和在该讨论的其余部分中假设在修改之前的指数值大于零。
如果实际提供给逆矩阵的两个尾数符合最差情况,则结果是正确规格化的尾数。如果实际的尾数并不符合最差情况条件,则结果将是 欠规格化的尾数。
(2 )频语再生(HFR )
在频镨再生中,不可能知道将提供给再生处理的每个尾数的确切 值,直到由量化器15执行了量化和已经合成由解码处理生成的任何类 似噪声分量之后。在这种实施方式中,必需为每个算术运算假设最差 情况,因为尾数值是未知的。参见等式6,最差情况运算是用于转换 频谱分量和类似噪声频谱分量的符号相同和数值足够大到相加成大于 1的数值的尾数的相加。相乘运算不可能导致过规格化,但是它们也 不能确保不出现过规格化;因此,必需假设合成的频谱分量是过规格 化的。通过将频镨分量尾数和类似噪声分量尾数向右偏移一个比特和 将指数减l,在代码转换器内可以防止过规格化;因此,估计器43降 低用于转换分量的指数,量化控制器44使用这个已修改的指数确定用 于代码转换器的一个或多个第二控制参数。
如果实际提供给再生处理的两个尾数符合最差情况条件,则结果 是正确规格化的尾数。如果实际的尾数并不符合最差情况条件,则结 果将是欠规格化的尾数。
c)优点和缺点
这个进行最差情况假设的第一方法可以低成本地实施。然而,它 需要代码转换器强制某些频谱分量欠规格化,并较不精确地在其编码 信号内传送,除非分配更多的比特来表示它们。此外,因为降低了一 些指数的值,基于这些已修改指数的掩蔽曲线较不精确。
2.确定性处理
a )概述
用于生成控制参数的第二种方法执行允许确定过规格化和欠规 格化的具体情况的处理。修改浮点指数以防止过规格化和最小化欠规 格化的出现率。由量化控制器14使用已修改的指数来确定一个或多个 第二控制参数。已修改的指数并不需要包括在编码信号内,因为代码 转换处理在相同的条件下也修改指数,它修改与已修改指数相关的尾数,以便浮点表示方式表示正确的值。
参见图2和图5,量化控制器14如上所述地确定一个或多个第一 控制参数,合成模型53分析与解码器24的合成处理相关的频镨分量 以识别出必需修改哪些指数,以便确保在合成处理内不出现过规格化 和最小化在合成处理内出现的欠规格化的出现率。修改这些指数,并 将它们与其它未修改指数一起发送给量化控制器54,它确定用于将在 代码转换器30内执行的重新编码处理的一个或多个第二控制参数。合 成模型53执行全部或部分合成处理,或者它模拟其影响以允许预先确 定在合成处理内对所有算术运算的规格化的影响。
每个量化尾数的值和任一合成分量必需可用于在合成模型53内 执行的分析处理。如果合成处理使用伪随机数生成器或其它准随机处 理,则初始化或籽数值必需在发送器的分析处理和接收器的合成处理 之间同步。这可以通过使编码发送器10确定所有的初始化值和在编码 信号内包括这些数值的某些指示来实现。如果在独立的间隔或帧内设 置编码信号,则可能希望将这个信息包括在每个帧内以最小化在解码
时的启动延迟和便于诸如编辑等各种节目制作活动。 b)处理的详细情况 (1)矩阵化
在矩阵化中,由解码器24使用的解码处理可能将合成输入给逆 矩阵的一个或两个频镨分量。如果合成任一个分量,则由逆矩阵计算 的频语分量可能是过规格化或欠规格化的。由于在尾数内的量化误差, 由逆矩阵计算的频i普分量也可能是过规格化或欠规格化的。合成模型 53可以测定这些未规格化的条件,因为它可以确定输入给逆矩阵的尾 数和指数的确切值。
如果合成模型53确定规格化将失去,则可以降低输入给逆矩阵 的一个或两个分量的指数以防止过规格化,并可以增加该指数以防止 欠规格化。已修改的指数并未包括在编码信号内,但是它们被量化控 制器54用于确定一个或多个第二控制参数。当代码转换器30对这些 指数进行相同的修改时,也将调整相关的尾数,以便所获得的浮点数表示正确的分量值。
(2)频谦再生(HFR)
在频语再生中,由解码器24使用的解码处理可能将合成转换的 频镨分量,它也可以合成要添加给该转换分量的类似噪声分量。因此, 由频镨再生处理计算出的频镨分量可能是过规格化或欠规格化的。由 于在转换分量尾数内的量化误差,再生分量也可能是过规格化或欠规 格化的。合成模型53可以测定这些未规格化的条件,因为它可以确定 输入给再生处理的尾数和指数的确切值。
如果合成模型53确定规格化将失去,则可以降低用于输入给再 生处理的一个或两个分量的指数以防止过规格化,并可以增加该指数 以防止欠规格化。已修改的指数并未包括在编码信号内,但是它们被 量化控制器54用于确定一个或多个第二控制参数。当代码转换器30 对这些指数进行相同的修改时,也将调整相关的尾数,以便所获得的 浮点数表示正确的分量值。 (3 )耦合
在用于耦合声道信号的合成处理中,由解码器24使用的解码处 理可能将合成用于在耦合声道信号内的一个或多个频镨分量的类似噪 声分量。因此,由合成处理计算出的频语分量可能是欠规格化的。由 于在耦合声道信号内频语分量的尾数内的量化误差,合成分量也可能 是欠规格化的。合成模型53可以测定这些未规格化的条件,因为它可 以确定输入给合成处理的尾数和指数的确切值。
如果合成模型53确定规格化将失去,则可以增加用于输入给合 成处理的一个或两个分量的指数以防止欠规格化。已修改的指数并未 包括在编码信号内,但是它们被量化控制器54用于确定一个或多个第 二控制参数。当代码转换器30对这些指数进行相同的修改时,也将调 整相关的尾数,以便所获得的浮点数表示正确的分量值。
c)优点和缺点
与执行最差情况估计方法的处理相比,执行该确定性方法的处理 实施成本更高;然而,这些附加的实施成本涉及编码发送器,并允许
28以更低成本实施代码转换器。此外,可以避免或最小化因为未规格化 尾数导致的不精确度,与在最差情况估计方法内计算的掩蔽曲线相比, 基于根据该确定性方法修改的指数的掩蔽曲线更加精确。
c.实施
本发明的各个方面可以以各种方式实施,包括由计算^/L和某个其 它设备执行的软件,所述设备包括更专用的组件,例如耦合到类似于
在通用计算机内发现的组件的数字信号处理器(DSP)电路。图6是 可用于实现本发明的各个方面的设备70的方框图。DSP 72提供计算 资源。RAM 73是由DSP 72进行信号处理所用的系统随机存取存储器 (RAM) 。 ROM 74表示某种形式的持久存储器,例如只读存储器 (ROM),用于存储操作设备70和执行本发明的各个方面需要的程 序。1/0控制器75表示通过通信信道76、 77接收和发送信号的接口 电路。模数转换器和数模转换器可以根据需要包括在I/O控制器75 内以接收和/或发送模拟音频信号。在所图示的实施例中,所有的主要 系统组件都连接到总线71,该总线可以代表多个物理总线;然而,总 线结构并非本发明的实施所需要的。
在用通用计算机系统实施的实施例中,可以包括其它组件以建立 与诸如键盘或鼠标和显示器等设备的接口 ,和用于控制具有诸如磁带 或磁盘或光媒体等存储媒体的存储设备。存储媒体可以记录用于操作 系统、实用程序和应用程序的指令程序,可以包括实施本发明各个方 面的程序实施例。
的功:,所述各种方式包^ ^散逻辑组件、集l电路、 一 个或多个ASIC 和/或程控处理器。实现这些组件的方式对于本发明来说并不重要。
可以通过各种机器可读媒体传送本发明的软件实施方式,所述各 种机器可读媒体例如是在包括从超声波到紫外线频率的频谱上的基带 或调制通信路径,或"著使用任一记录技术传送信息的存储媒体,包括 磁带、磁卡或磁盘、光卡或光盘和在诸如纸张等媒体上的可检测标记。
权利要求
1.一种代码转换编码音频信息的方法,包括在第一频带中接收传送表示音频信号频谱分量的第一量化定标值和第一标度因子的第一编码信号,并且传送一个或多个第一控制参数和一个或多个第二控制参数;从所述第一编码信号获得所述第一量化定标值和所述第一标度因子,其中每个第一标度因子与一个或多个第一量化定标值相关,每个第一量化定标值根据其相关的第一标度因子被定标,并且每个第一量化定标值和相关的第一标度因子表示相应的频谱分量;从所述第一编码信号获得一个或多个第一控制参数和一个或多个第二控制参数,其中响应于所述第一编码信号的第一比特率要求导出所述一个或多个第一控制参数,并且响应于所述第二编码信号的不等于所述第一比特率的第二比特率要求导出所述一个或多个第二控制参数;响应于所述一个或多个第一控制参数根据第一比特分配处理来分配比特,并且通过根据基于由第一比特分配处理分配的比特数量的量化分辨率来去量化所述第一量化定标值,获得去量化的定标值;从所述去量化的定标值产生合成频谱分量,其中所述合成频谱分量表示所述第一频带之外的第二频带中的频谱内容;产生用于所述合成频谱分量的一个或多个第二标度因子并且产生一个或多个第二定标值,其中每个第二标度因子与一个或多个第二定标值相关,并且每个第二定标值根据其相关的第二标度因子被定标;响应于所述一个或多个第二控制参数根据第二比特分配处理来分配比特,并且通过使用基于由第二比特分配处理分配的比特数量的量化分辨率来量化所述去量化的定标值和所述第二定标值,获得第二量化定标值;以及将所述第二量化定标值、所述第二标度因子和所述一个和多个第二控制参数装配到所述第二编码信号内。
2. 根据权利要求l的方法,包括使用所述一个和多个第一控制参数来获得第一容许的量化噪声阈值;以根据所述第一容许的量化噪声阈值建立的量化分辨率来去量 化所述第一量化值;使用所述一个或多个第二控制参数来获得不同于所述第一容许 的量化噪声阈值的第二容许的量化噪声阈值;以及以根据第二容许的量化噪声阈值建立的量化分辨率来量化所述 第二定标值。
3. —种用于代码转换编码音频信息的代码转换器,其中该代码 转换器包括用于在第一频带中接收传送表示音频信号频语分量的第一量化 定标值和第 一标度因子的第 一编码信号,并且传送一个或多个第 一控 制参数和一个或多个第二控制参数的装置;用于从所述第一编码信号获得所述第一量化定标值和所述第一 标度因子的装置,其中每个第一标度因子与一个或多个第一量化定标 值相关,每个第一量化定标值根据其相关的第一标度因子被定标,并 且每个第 一量化定标值和相关的第 一标度因子表示相应的频谦分量;用于从所述第一编码信号获得一个或多个第一控制参数和一个 或多个第二控制参数的装置,其中响应于所述第一编码信号的第一比 特率要求导出所述一个或多个第一控制参数,并且响应于所述第二编码信号的不等于所述第一比特率的第二比特率要求导出所述一个或多 个第二控制参数;用于响应于所述一个或多个第一控制参数根据第一比特分配处 理来分配比特、并且通过根据基于由笫一比特分配处理分配的比特数 量的量化分辨率来去量化所述第一量化定标值而获得去量化的定标值 的装置;用于从所述去量化的定标值产生合成频谱分量的装置,其中所述 合成频语分量表示所述第一频带之外的第二频带中的频谱内容;用于产生用于所述合成频谱分量的一个或多个第二标度因子并 且产生一个或多个第二定标值的装置,其中每个第二标度因子与一个 或多个第二定标值相关,并且每个第二定标值根据其相关的第二标度因子被定标;用于响应于所述一个或多个第二控制参数根据第二比特分配处 理来分配比特、并且通过使用基于由第二比特分配处理分配的比特数 量的量化分辨率来量化所述去量化的定标值和所述第二定标值以获得 第二量化定标值的装置;以及用于将所迷第二量化定标值、所述第二标度因子和所述一个和多 个第二控制参数装配到第二编码信号内的装置。
4.根据权利要求3的代码转换器,包括用于使用所述一个和多个第一控制参数来获得第一容许的量化 噪声阈值的装置;用于以根据所述第一容许的量化噪声阈值建立的量化分辨率来 去量化所述第一量化值的装置;用于使用所述一个或多个第二控制参数来获得不等于所述第一 容许的量化噪声阈值的第二容许的量化噪声阈值的装置;以及用于以根据第二容许的量化噪声阈值建立的量化分辨率来量化 所述第二定标值的装置。
全文摘要
在音频编码系统中,编码发送器将编码频谱分量表示为规格化浮点数。发送器提供可用于代码转换编码频谱参数的第一和第二控制参数。代码转换器使用第一控制参数部分地解码编码分量和使用第二控制参数重新编码该分量。发送器通过分析在部分解码处理中的算术运算的影响以识别出浮点表示丢失规格化的情况来确定第二控制参数。修改与丢失规格化的数值相关的指数,并使用已经修改的指数计算第二控制参数。
文档编号G10L19/00GK101661750SQ20091016443
公开日2010年3月3日 申请日期2004年1月30日 优先权日2003年2月6日
发明者布赖恩·T.·兰侬, 罗伯特·L.·安德森, 迈克尔·M.·杜鲁门 申请人:杜比实验室特许公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1