用于编码和低复杂性代码转换的频谱分量转换的制作方法

文档序号:2833519阅读:249来源:国知局
专利名称:用于编码和低复杂性代码转换的频谱分量转换的制作方法
技术领域
本发明一般涉及音频编码方法和设备,更具体地,涉及用于编码和代码转换音频信息的改进方法和设备。
背景技术
A.编码许多通信系统面临信息传输和记录容量的需求经常超过可用容量的问题。因此,在广播和记录领域中,非常关注在不降低其感知质量的情况下,降低发送或记录要由人感知的音频信号所需要的信息量。同时还关注对于给定带宽或存储容量提高输出信号的感知质量。
传统的用于降低信息容量需要的方法涉及仅发送或记录输入信号的选定部分。丢弃其余部分。称作感知编码的技术通常将原始的音频信号转换成频谱分量或频率子带信号,从而能够更容易地识别和丢弃冗余或不相关的那些信号部分。如果可以根据信号的其它部分再生某一信号部分,则将该信号部分视为冗余的。如果某一信号部分在感知上无关紧要或听不到,则将该信号部分视为不相关的。感知解码器可以根据编码信号重新建立丢弃的冗余部分,但是它不能建立任何并非冗余的已丢弃的不相关信息。然而,丢弃不相关的信息在许多应用中是可接受的,这是因为它的缺乏对于解码信号没有可感知的影响。
信号编码技术在感知上是透明的,如果它仅丢弃冗余或在感知上不相关的那些信号部分的话。一种可以丢弃信号不相关部分的方式是用较低精确度等级表示频谱分量,这通常称作量化。将原始频谱分量及其量化表示之间的差值称作量化噪声。较低精确度的表示具有较高的量化噪声电平。感知编码技术试图控制量化噪声电平,以使其听不到。
如果感知上透明的技术不能实现充分地降低信息容量要求,则需要感知上不透明的技术以丢弃非冗余和在感知上相关的附加信号部分。不可避免的结果是降低了所发送或所记录信号的感知保真度。优选地,感知上不透明的技术仅丢弃视为具有最低感知重要性的那些信号部分。
可以使用一种称作“耦合”的编码技术来降低信息容量要求,通常将该技术视为感知上不透明的技术。根据这种技术,组合在两个或更多输入音频信号内的频谱分量以形成具有这些频谱分量的复合表示的耦合声道信号。还生成边信息,它表示在被组合以形成复合表示的每个输入音频信号内的频谱分量的频谱包络。发送或记录包括耦合声道信号和边信息的编码信号,用于随后由接收器解码。通过生成耦合声道信号的复本和使用边信息定标在复制信号内的频谱分量,从而基本上恢复原始输入信号的频谱包络,接收器生成去耦合信号,它是原始输入信号的不精确复制品。用于两声道立体声系统的典型耦合技术组合左右声道信号的高频分量以形成复合高频分量的单个信号,生成表示在原始的左右声道信号内高频分量的频谱包络的边信息。在先进电视系统委员会(ATSC)标准文件A/52(1994)的“数字音频压缩(DigitalAudio Compression)(AC-3)”(在此称作A/52文件)中描述了耦合技术的一个例子。
称作频谱再生的编码技术是可以用于降低信息容量要求的感知上不透明的技术。在许多实现方式中,将这种技术称作“高频再生”(HFR),因为仅再生高频频谱分量。根据这种技术,发送或存储仅包含输入音频信号的低频分量的基带信号。还提供表示原始高频分量的频谱包络的边信息。发送或记录包括基带信号和边信息的编码信号,用于随后由接收器解码。接收器基于边信息再生具有频谱电平的已省略高频分量,组合基带信号与所再生的高频分量以生成输出信号。在1979年4月的Proc.of the International Conf.on Acoust.,Speech andSignal Proc.中Makhoul和Berouti的“在语音编码系统内的高频再生(High-Frequency Regeneration in Speech Coding Systems)”中可以发现HFR的已知方法的描述。在于2002年3月28日提交的标题为“用于高频再生的宽带频率转换(Broadband Frequency Translation forHigh Frequency Regeneration)”的序列号为10/113,858的美国专利申请、于2002年6月17日提交的标题为“使用频谱孔填充的音频编码系统(Audio Coding System Using Spectral Hole Filling)”的序列号为10/174,493的美国专利申请、于2002年9月6日提交的标题为“使用解码信号特性适配合成频谱分量的音频编码系统(Audio CodingSystem Using Characteristics of a Decoded Signal to AdaptSynthesized Spectral Components)”的序列号为10/238,047的美国专利申请和于2003年5月8日提交的标题为“使用频谱分量耦合和频谱分量再生的改进音频编码系统和方法(Improved Audio CodingSystems and Methods Using Spectral Component Coupling andSpectral Component Regeneration)”的序列号为10/434,449的美国专利申请中公开了适合于编码高质量音乐的改进频谱再生技术。
B.代码转换已知的编码技术已经降低了给定感知质量等级的音频信号的信息容量要求,或者相反地,已经改善了具有规定信息容量的音频信号的感知质量。尽管有这种成功,还需要进一步的改进,编码研究继续发现新的编码技术,发现使用已知技术的新方式。
进一步改进的一种结果是在用新编码技术编码的信号和执行旧编码技术的现有设备之间的潜在不兼容性。尽管规格化组织和设备制造商已经进行了大量努力来防止过早地作废,但旧的接收器不能始终正确地解码用新编码技术编码的信号。相反地,新的接收器不能总是正确地解码用旧编码技术编码的信号。因此,专业人士和消费者都获得和维护许多设备,如果他们希望确保与用旧编码技术和新编码技术编码的信号的兼容性的话。
一种能够减轻或避免这一负担的方式是获得能够将编码信号从一种格式转换成另一种格式的代码转换器。代码转换器可以用作不同编码技术之间的桥梁。例如,代码转换器可以将用新编码技术编码的信号转换成与仅能解码用旧技术编码的那些信号的接收器兼容的另一种信号。
常规的代码转换实现完整的解码和编码处理。参见上面提到的代码转换的例子,使用新的解码技术解码输入的编码信号以获得随后通过合成滤波转换成数字音频信号的频谱分量。然后,通过分析滤波将数字音频信号再次转换成频谱分量,然后,使用旧的编码技术编码这些频谱分量。所获得的结果是与旧接收装置兼容的编码信号。也可以使用代码转换从旧格式转换成新格式,在不同的现代格式之间转换和在同一格式的不同比特率之间转换。
当使用常规的代码转换技术转换用感知编码系统编码的信号时,这些技术具有严重的缺点。一个缺点是常规的代码转换装置较昂贵,因为它必需实现完整的解码和编码处理。第二个缺点是相对于输入编码信号在解码之后的感知质量,经过代码转换的信号在解码之后的感知质量几乎总是降低。

发明内容
本发明的目的是提供能够用于改善代码转换信号的质量和允许较低廉地实现代码转换装置的编码技术。
通过如在权利要求中阐述的本发明实现这个目的。一种代码转换技术解码输入的编码信号以获得频谱分量,随后将该频谱分量编码成输出的编码信号。避免了因为合成和分析滤波导致的实施成本和信号劣化。通过在编码信号中提供控制参数,而不是由代码转换器为其自身确定这些控制参数,可以进一步降低代码转换器的实施成本。
通过参考下述讨论和附图,可以更好地理解本发明的各个特征及其优选实施例,在附图中相同的参考数字表示相同的单元。下述讨论和附图的内容仅作为例子来阐述,不应当理解为表示在本发明保护范围上的限制。


图1是音频编码发送器的示意图。
图2是音频解码接收器的示意图。
图3是代码转换器的示意图。
图4和图5是包含本发明各个方面的音频编码发送器的示意图。
图6是能够实现本发明各个方面的设备的示意方框图。
具体实施例方式
A.概述基本的音频编码系统包括编码发送器、解码接收器和通信路径或记录媒体。发送器接收表示一个或多个音频声道的输入信号,并生成表示该音频的编码信号。随后,发送器将编码信号发送给用于传输的通信路径或用于存储的记录媒体。接收器从通信路径或记录媒体接收编码信号,并生成可能是原始音频的精确或近似复本的输出信号。如果输出信号并非精确的复本,则许多编码系统试图提供与原始输入音频在感知上无法区分的复本。
任何编码系统的正确操作的内在和显然的要求是接收机必需能够正确地解码编码信号。然而,因为在编码技术上的发展,出现希望使用接收器解码用接收器不能正确解码的编码技术所编码的信号的情况。例如,可能已经通过编码技术生成编码信号,该编码技术预期解码器执行频谱再生,但是接收器不能执行频谱再生。相反地,可能已经通过编码技术生成编码信号,该编码技术并未预期解码器执行频谱再生,但是接收器预期和要求需要频谱再生的编码信号。本发明涉及能够在不兼容的编码技术和编码设备之间提供桥梁的代码转换。
下面描述几种编码技术,作为对可以实施本发明的若干方式的详细描述的介绍。
1.基本系统a)编码发送器图1是从路径11接收输入音频信号的分频带音频编码发送器10的一种实施方式的示意图。分析滤波器组12将输入的音频信号分成表示音频信号频谱内容的频谱分量。编码器13执行将至少一些频谱分量编码成编码频谱信息的处理。使用响应于从量化控制器14接收到的控制参数而适配的量化分辨率,由量化器15量化编码器13尚未编码的频谱分量。可选择地,也可以量化一些或全部的编码频谱信息。量化控制器14根据所检测的输入音频信号的特性导出控制参数。在所图示的实施方式中,根据编码器13提供的信息获得所检测的特性。量化控制器14还可以响应于音频信号的包括时间特性的其它特性来推导控制参数。可以在由分析滤波器组12执行的处理之前、之中或之后,根据音频信号的分析获得这些特性。由格式化器16将表示量化频谱信息的数据、编码频谱信息和表示控制参数的数据装配在编码信号内,该编码信号沿着路径17传送以传输或存储。格式化器16还可以将其它数据装配在编码信号内,例如同步字、奇偶校验或错误检测码、数据库检索关键字和辅助信号,这些与理解本发明没有关系,将不进一步讨论。
可以通过基带或调制通信路径在包括从超声波到紫外线频率的频谱上发送编码信号,或者可以使用任一记录技术记录在媒体上,包括磁带、卡或盘、光卡或光盘和在诸如纸张等媒体上的可检测标记。
(1)分析滤波器组下面讨论的分析滤波器组12和合成滤波器组25基本上可以通过任一希望的方式来实现,包括多种数字滤波器技术、块变换和小波变换。在一种音频编码系统中,通过改进离散余弦变换(MDCT)实现分析滤波器组12,通过逆改进离散余弦变换(IMDCT)实现合成滤波器组25,Princen等人在1987年5月的Proc.of the InternationalConf.on Acoust.,Speech and Signal Proc.第2161-64页的“基于时域混叠消除的使用滤波器组设计的子带/变换编码(Subband/TransformCoding Using Filter Bank Designs Based on Time Domain AliasingCancellation)”中描述了这样的实现方式。具体的滤波器组实施方式原则上并不重要。
通过块变换实现的分析滤波器组将输入信号的一个块或区间分成表示该信号区间的频谱内容的一组变换系数。一组一个或多个相邻变换系数表示在特定频率子带内的频谱内容,所述频率子带的带宽与该组内的系数个数相当。
通过诸如多相滤波器的某种类型的数字滤波器而非块变换实现的分析滤波器组将输入信号分成一组子带信号。每个子带信号是在特定频率子带内输入信号频谱内容的基于时间的表示。优选地,抽取该子带信号,使得每个子带信号具有与单位时长的子带信号内的抽样个数相当的带宽。
下面的讨论更具体地涉及使用诸如上述时域混叠消除(TDAC)变换等块变换的实施方式。在该讨论中,术语“频谱分量”是指变换系数,术语“频率子带”和“子带信号”涉及多组一个或多个相邻变换系数。然而,本发明的原理也可以应用于其它类型的实施方式,所以术语“频率子带”和“子带信号”还涉及表示信号整个带宽的一部分的频谱内容的信号,术语“频谱分量”一般可以被理解为是指子带信号的抽样或成分。感知编码系统通常实现分析滤波器组以提供带宽与人类听觉系统的所谓临界带宽相当的频率子带。
(2)编码编码器13可以执行所希望的基本上任一类型的编码处理。在一种实施方式中,该编码处理将频谱分量转换成包括定标值和相关标度因子的定标表示,如在下文中讨论的。在其它的实施方式中,也可以使用诸如矩阵或生成用于频谱再生的边信息或耦合的编码处理。在下文中更详细地讨论这些技术中的一些技术。
发送器10可以包括图1未建议的其它编码处理。例如,量化频谱分量可以经过熵编码处理,例如算术编码或霍夫曼编码。理解本发明不需要对这些编码处理的详细描述。
(3)量化响应于从量化控制器14接收到的控制参数,适配由量化器15提供的量化分辨率。可以以所希望的任何方式导出这些参数;然而,在感知编码器中,使用某种类型的感知模型估计通过将要编码的音频信号可以掩蔽多少量化噪声。在许多应用中,量化控制器还响应于在编码信号的信息容量上施加的限制。有时,在用于编码信号或者用于编码信号特定部分的最大容许比特率方面表示这一限制。
在感知编码系统的优选实施例中,由比特分配处理使用控制参数确定分配给每个频谱分量的比特数量和确定量化器15用于量化每个频谱分量的量化分辨率,从而使量化噪声的可听性以信息容量或比特率限制为条件而最小化。量化控制器14的具体实施方式
对于本发明并不关键。
在A/52文件中公开了量化控制器的一个例子,该文件描述了有时称作杜比AC-3的编码系统。在这种实施方式中,用定标表示来表示音频信号的频谱分量,在所述定标表示中,标度因子提供音频信号的频谱形状的估计。感知模型使用标度因子计算掩蔽曲线,该掩蔽曲线估计音频信号的掩蔽效应。随后,量化控制器确定容许的噪声阈值,它控制如何量化频谱分量,从而以某种最佳方式分布量化噪声以符合所施加的信息容量限制或比特率。容许的噪声阈值是掩蔽曲线的复本,并以由量化控制器确定的量值偏离该掩蔽曲线。在这种实施方式中,控制参数是定义容许噪声阈值的数值。这些参数可以通过多种方式表示,例如阈值本身的直接表达或者诸如可以根据其导出所允许的噪声阈值的标度因子和偏移等数值。
b)解码接收器图2是分频带音频解码接收器20的一种实施方式的示意图,该接收器20从路径21接收表示音频信号的编码信号。去格式化器22从编码信号获得量化频谱信息、编码频谱信息和控制参数。由去量化器23使用响应于控制参数而适配的分辨率去量化所述量化频谱信息。可选择地,也可以去量化一些或全部的编码频谱信息。编码频谱信息由解码器24解码,并与去量化频谱分量组合,由合成滤波器组25将所述去量化频谱分量转换成音频信号后沿着路径26传送。
在接收器内执行的处理与在发送器内执行的相应处理是互补的。去格式化器22拆散由格式化器16装配的内容。解码器24执行与由编码器13执行的编码处理完全相反或拟相反的解码处理,去量化器23执行与量化器15执行的处理拟相反的处理。合成滤波器组25执行与分析滤波器组12执行的处理相反的滤波处理。将解码和去量化处理描述为拟相反的处理,因为它们可能不提供发送器内互补处理的完全逆处理。
在一些实施方式中,可以将合成或伪随机噪声插入去量化频谱分量的一些最低有效比特内,或者用作一个或多个频谱分量的替代。接收器还可以执行附加的解码处理以解决在发送器内可能已经执行的任何其它编码。
c)代码转换器图3是从路径31接收表示音频信号的编码信号的代码转换器30的一种实施方式的示意图。去格式化器32从编码信号中获得量化频谱信息、编码频谱信息、一个或多个第一控制参数和一个或多个第二控制参数。由去量化器33使用响应于从编码信号接收到的一个或多个第一控制参数而适配的分辨率去量化所述量化频谱信息。可选择地,也可以去量化一些或全部的编码频谱信息。如果需要的话,可以由解码器34解码全部或一些编码频谱信息用于代码转换。
编码器35是特定代码转换应用可能不需要的可选组件。如果需要的话,编码器35执行将至少一些去量化频谱信息或编码和/或解码频谱信息编码成重新编码频谱信息的处理。由量化器36使用响应于从编码信号接收的一个或多个第二控制参数而适配的量化分辨率重新量化编码器35未编码的频谱分量。可选择地,也可以量化一些或全部重新编码的频谱信息。由格式化器37将表示重新量化频谱信息的数据、重新编码频谱信息和表示一个或多个第二控制参数的数据装配到编码信号内,该信号沿着路径38传送以传输或存储。格式化器37还可以将其它数据装配到编码信号内,如上文针对格式化器16所讨论的。
代码转换器30能够更有效地执行其操作,因为实现量化控制器以确定第一和第二控制参数不需要计算资源。代码转换器30可以包括诸如如上所述的量化控制器14的一个或多个量化器控制器以导出一个或多个第二控制参数和/或一个或多个第一控制参数,而不是根据编码信号获得这些参数。下面讨论确定第一和第二控制参数需要的编码发送器10的特征。
2.数值的表示(1)定标音频编码系统通常必需表示具有超过100dB的动态范围的音频信号。可以表示该动态范围的音频信号或其频谱分量的二进制表示所需要的比特数量正比于该表示的精确度。在诸如常规光盘的应用中,用16比特表示脉冲编码调制(PCM)音频。许多专业应用使用更多的比特,例如20或24比特,来表示具有更大动态范围和更高精确度的PCM音频。
音频信号或其频谱分量的整数表示是非常低效的,许多编码系统使用包括下述形式的定标值和相关标度因子的另一种表示s=v·f (1)其中s=音频分量的值;v=定标值;和f=相关的标度因子。
可以用可能希望的基本上任一方式表示定标值v,包括小数表示和整数表示。可以用各种方式表示正值和负值,包括符号数值表示和各种补码表示,例如用于二进制数的1的补码和2的补码。标度因子f可以是简单的数,或者它可以是基本上任意函数,例如指数函数gf或对数函数loggf,其中g是指数和对数函数的底数。
在适合于在许多数字计算机中使用的优选实施方式中,使用特定的浮点表示,其中“尾数”m是定标值,使用2的补码表示将其表示为二进制小数,“指数”x表示标度因子,它是指数函数2-x。本公开内容的其它部分涉及浮点尾数和指数;然而,应当理解这种特定的表示方式仅是本发明可以应用于用定标值和标度因子表示的音频信息的一种方式。
用这种特定的浮点表示方式将音频信号分量的值表示如下s=m·2-x(2)例如,假设频谱分量的值等于0.1757812510,它等于二进制小数0.001011012。这个值可以用表I所示的多对尾数和指数表示。
表I

在这种特定浮点表示方式中,用值为负数数值的2的补码的尾数表示负数。参见表I中的最后一行,例如,2的补码表示方式的二进制小数1.011012表示十进制值-0.59375。因此,用该表最后一行内所示的浮点数实际表示的值是-0.59375×2-3=-0.07421875,它不同于该表中图示的预期值。下面讨论这一方面的意义。
(2)规格化如果“规格化”浮点表示方式,则可以用更少的比特表示浮点数的值。如果在不丢失有关该值的任何信息的情况下已尽可能远地将尾数的二进制表示方式内的比特移到最高有效比特位置,则将非零浮点表示方式称作规格化的。在2的补码表示方式中,规格化的正尾数始终大于或等于+0.5并小于+1,而规格化的负尾数始终小于-0.5并大于或等于-1。这等同于使最高有效比特不等于符号比特。在表I中,在第三行中的浮点表示方式是规格化的。用于规格化尾数的指数x等于2,它是将“1”比特移动到最高有效比特位置需要的比特位移次数。
假设频谱分量的值等于十进制小数-0.17578125,它等于二进制数1.110100112。在2的补码表示中的初始“1”比特表示该数值是负数。可以将这个数值表示为具有规格化尾数m=1.0100112的浮点数。用于这个规格化尾数的指数x等于2,它是将“0”比特移动到最高有效比特位置需要的比特位移次数。
在表I的第一、第二和最后一行内表示的浮点表示方式是未规格化的浮点表示方式。在该表的前两行内表示的表示方式是“欠规格化的”,在该表的最后一行内表示的表示方式是“过规格化的”。
为了编码目的,可以使用更少的比特表示规格化浮点数的尾数的精确值。例如,可以用九个比特表示未规格化尾数m=0.001011012的值。需要八个比特表示小数值,需要一个比特表示符号。可以仅用七个比特表示规格化尾数m=0.1011012的值。可以用更少的比特表示在表I最后一行内表示的过规格化尾数m=1.011012的值;然而,如上面所解释的,带有过规格化尾数的浮点数不再表示正确的数值。
这些例子有助于说明为何通常希望避免欠规格化的尾数和为何通常严格避免过规格化的尾数。欠规格化尾数的存在可能意味着在编码信号中低效地使用比特或者较不精确地表示数值,而过规格化尾数的存在通常意味着数值严重失真。
(3)对规格化的其它考虑在许多实施方式中,指数用固定数量的比特表示,或者可选择地,限制于具有规定范围内的数值。如果尾数的比特长度长于最大可能指数值,则该尾数能够表示不能规格化的数值。例如,如果用3个比特表示指数,则它可以表示从0到7的任意值。如果用16个比特表示尾数,则它能够表示的最小非零值需要14个比特移位以规格化。3比特指数显然不能表示规格化这个尾数值需要的数值。这种情况并不影响本发明所基于的基本原理,但是实际的实施方式应当确保算术运算并不将尾数移位到超出相关指数能够表示的范围。
通常,使用其自身的尾数和指数表示在编码信号内的每个频谱分量的效率很低。如果多个尾数共享公用指数,则需要较少的指数。这种配置有时称作块浮点(BFP)表示方式。建立用于该块的指数值,从而用规格化的尾数表示在该块内具有最大数值的值。
如果使用较大的块,则需要较少的指数,和因而表示指数的较少比特。然而,使用较大的块通常导致在该块内更多的值欠规格化。因此,通常选择块的大小以平衡在传送指数需要的比特数量和表示欠规格化尾数导致的不精确性和低效性之间的折衷。
块大小的选择还可以影响编码的其它方面,例如由在量化控制器14内使用的感知模型计算出的掩蔽曲线的精确度。在一些实施方式中,感知模型使用BFP指数作为频谱形状的估计以计算掩蔽曲线。如果将很大的块用于BFP,则降低了BFP指数的频谱分辨率,并降低了由感知模型计算出的掩蔽曲线的精确度。可以从A/52文件获得其它细节。
在下文的描述中将不讨论使用BFP表示方式的结果。应当理解,当使用BFP表示方式时,某些频谱分量将很可能始终是欠规格化的。
(4)量化用浮点形式表示的频谱分量的量化通常是指尾数的量化。指数通常并不量化,而是用固定数量的比特表示,或者可选择地,限制于具有在规定范围内的值。
如果将表I所示的规格化尾数m=0.101101量化到0.0625=0.00012的分辨率,则量化尾数q(m)等于二进制小数0.10112,它可以用5个比特表示,并等于十进制小数0.6875。在量化到这个特定分辨率之后用浮点表示方式表示的值是q(m)·2-x=0.6875×0.25=0.171875。
如果将在该表中所示的规格化尾数量化到0.25=0.012的分辨率,则已量化的尾数等于二进制小数0.102,它可以用3个比特表示,并等于十进制小数0.5。在量化到这个较粗略的分辨率之后用浮点表示方式表示的值是q(s)=0.5×0.25=0.125。
提供这些特定的例子仅仅为了便于解释。对于本发明来说,量化的具体形式和在量化的分辨率和表示量化尾数需要的比特数量之间的具体关系在原则上并不重要。
(5)算术运算许多处理器和其它硬件逻辑执行可直接应用于数的浮点表示的一组专用算术运算。一些处理器和处理逻辑并不执行这些运算,有时使用这些类型的处理器是很有吸引力的,因为它们通常低廉得多。当使用这些处理器时,一种模拟浮点运算的方法是将浮点表示转换成扩展精确度的定点小数表示,对已转换的值执行整数算术运算,并重新转换回浮点表示。更有效的方法是分别对尾数和指数执行整数算术运算。
通过考虑到这些算术运算可能对尾数的影响,编码发送器可能能够修改其编码处理,以便可以按需要控制或防止在随后解码处理内的过规格化和欠规格化。如果在解码处理中出现频谱分量尾数的过规格化或欠规格化,则解码器不能在不改变相关指数数值的情况下校正这种情况。
对于代码转换器30来说,这尤其麻烦,因为指数的改变意味着需要量化控制器的复杂处理以确定用于代码转换的控制参数。如果改变频谱分量的指数,则在编码信号内传送的一个或多个控制参数可能不再有效,并可能需要再次确定,除非确定这些控制参数的编码处理能够预料到该改变。
相加、相减和相乘的影响尤其重要,因为在例如在下文中描述的编码技术中使用这些算术运算。
(a)相加两个浮点数的相加可以在两个步骤中执行。在第一步骤中,如果需要,协调这两个数的定标。如果两个数的指数不相等,则将与较大指数相关的尾数的比特向右移动与两个指数的差值相等的次数。在第二步骤中,通过使用2的补码运算相加两个数的尾数来计算“总尾数”。随后,用总尾数和两个原始指数中较小的指数表示两个原始数之和。
在相加运算结束时,总尾数可能是过规格化或欠规格化的。如果两个原始尾数之和等于或大于+1或者小于-1,则总尾数将是过规格化的。如果两个原始尾数之和小于+0.5和大于或等于-0.5,则总尾数将是欠规格化的。如果两个原始尾数具有相反的符号,则会出现后一种情况。
(b)相减以类似于上面描述的相加的方式,可以在两个步骤中执行两个浮点数的相减。在第二步骤中,通过使用2的补码运算从一个原始尾数中减去另一个原始尾数计算出“差值尾数”。随后,用该差值尾数和两个原始指数中较小的指数表示两个原始数的差值。
在相减运算结束时,差值尾数可能是过规格化或欠规格化的。如果两个原始尾数的差值小于+0.5和大于或等于-0.5,则差值尾数将是欠规格化的。如果两个原始尾数的差值等于或超过+1或者小于-1,则差值尾数将是过规格化的。如果两个原始尾数具有相反的符号,则会出现后一种情况。
(c)相乘可以在两个步骤中执行两个浮点数的相乘。在第一步骤中,通过相加两个原始数的指数计算出“总指数”。在第二步骤中,通过使用2的补码运算相乘两个数的尾数计算出“乘积尾数”。随后,用乘积尾数和总指数表示两个原始数的乘积。
在相乘运算结束时,乘积尾数可能是欠规格化的,但是有一个例外,不可能是过规格化的,因为乘积尾数的数值不可能大于或等于+1或者小于-1。如果两个原始尾数的乘积小于+0.5和大于或等于-0.5,则乘积尾数将是欠规格化的。
当将要相乘的两个浮点数都具有等于-1的尾数时,出现过规格化规则的一个例外。在这种情况下,相乘产生等于+1的乘积尾数,它是过规格化的。然而,通过保证将要相乘的至少一个数值不是负值,能够防止出现这种情况。对于下面讨论的合成技术来说,相乘仅用于合成来自耦合声道信号的信号和频谱再生。通过要求耦合系数是非负值,在耦合中避免了上述例外的情况,并且通过要求包络定标信息、所转换的分量混合参数和类似噪声的分量混合参数是非负值,对于频谱再生避免了上述例外情况。
该讨论的剩余部分假设执行编码技术以避免这种例外的情况。如果不能避免这种情况,则必需在使用相乘时采取步骤也避免过规格化。
(d)总结可以将这些运算对尾数的影响总结如下
(1)两个规格化数的相加可能产生可以是规格化、欠规格化或过规格化的总和;(2)两个规格化数的相减可能产生可以是规格化、欠规格化或过规格化的差值;以及(3)两个规格化数的相乘可能产生可以是规格化或欠规格化的乘积,但是考虑到上面讨论的限制,不会是过规格化的。
如果是规格化的,则可以使用更少的比特表示从这些算术运算获得的数值。欠规格化的尾数与小于规格化尾数的理想值的指数相关;欠规格化尾数的整数表示将损失精确度,因为从最低有效比特位置丢失了有效比特。过规格化的尾数与大于规格化尾数的理想值的指数相关;过规格化的尾数的整数表示将引入失真,因为将有效比特从最高有效比特位置移位到符号比特位置。下面讨论一些编码技术影响规格化的方式。
3.编码技术一些应用在编码信号的信息容量上施加了严格的限制,基本的感知编码技术在解码信号内不插入不可接受的量化噪声电平的情况下不能满足这些限制。可以使用其它的编码技术,虽然也降低解码信号的质量,但是以某种方式将量化噪声降低到可接受的电平。下面讨论这些编码技术中的一些技术。
a)矩阵化可以使用矩阵化来降低在两声道编码系统内的信息容量要求,如果在这两个声道内的信号非常相关的话。通过将两个相关信号矩阵化成和信号和差值信号,两个矩阵化信号之一将具有与两个原始信号之一基本上相等的信息容量要求,但是另一个矩阵化信号将具有低得多的信息容量要求。例如,如果两个原始信号完全相关,则矩阵化信号之一的信息容量要求将接近于零。
原则上,可以从两个矩阵化和信号和差值信号完全恢复出两个原始信号;然而,用其它编码技术插入的量化噪声将阻止完全恢复。量化噪声可能导致的矩阵化问题与本发明的理解并不相关,将不进一步讨论。可以从其它参考文献中获得其它的细节,例如美国专利5,291,557以及1999年8月Audio Eng.Soc.17thInternationalConference上Vernon发表的“杜比数字用于数字电视和存储应用的音频编码(Dolby DigitalAudio Coding for Digital Television andStorage Applications)”第44至57页,尤其参见第50至51页。
下面描述用于编码两声道立体声节目的典型矩阵。优选地,仅当认为两个原始子带信号非常相关时,才将矩阵化自适应地应用于在子带信号内的频谱分量。该矩阵将左输入声道和右输入声道的频谱分量组合成和声道信号和差值声道信号的频谱分量,如下Mi=1/2(Li+Ri) (3a)Di=1/2(Li-Ri) (3b)其中Mi=在矩阵的和声道输出内的频谱分量i;Di=在矩阵的差值声道输出内的频谱分量i;Li=矩阵的左声道输入内的频谱分量i;以及Ri=矩阵的右声道输入内的频谱分量i。
以类似于用于未矩阵化的信号内的频谱分量的方式,编码在和声道信号和差值声道信号内的频谱分量。在用于左声道和右声道的子带信号非常相关和同相的情况下,在和声道信号内的频谱分量具有与在左声道和右声道内的频谱分量的幅度基本上相同的幅度,在差值声道信号内的频谱分量将基本上等于零。如果用于左声道和右声道的子带信号非常相关并相互在相位上相反,则频谱分量幅度与和声道信号和差值声道信号之间的关系颠倒。
如果将矩阵化自适应地应用于子带信号,将用于每个频率子带的矩阵化的指示包括在编码信号内,以便接收器能够确定何时应当使用互补逆矩阵。接收器为编码信号内的每个声道独立地处理和解码子带信号,除非接收到表示子带信号被矩阵化的指示。接收器能通过应用如下的逆矩阵反转矩阵化的影响和恢复左声道子带信号和右声道子带信号的频谱分量L′i=Mi+Di(4a)
R′i=Mi-Di(4b)其中L′i=在矩阵的恢复左声道输出内的频谱分量i;和R′i=在矩阵的恢复右声道输出内的频谱分量i。
通常,因为量化影响,所恢复的频谱分量并不精确地等于原始的频谱分量。
如果逆矩阵接收到具有规格化的尾数的频谱分量,则在该逆矩阵内的相加和相减运算可能会导致具有如上面所解释的欠规格化或过规格化的尾数的恢复频谱分量。
如果接收机合成矩阵化子带信号内的一个或多个频谱分量的替代品,则这种情况更加复杂。合成处理通常建立不确定的频谱分量值。这种不确定性导致不可能预先确定来自逆矩阵的哪个频谱分量将是过规格化或欠规格化的,除非预先已经知道合成处理的总体影响。
b)耦合可以使用耦合来编码多个声道的频谱分量。在优选实施方式中,将耦合限制于更高频率子带内的频谱分量;然而,在原理上,耦合可以用于频谱的任一部分。
耦合将在多个声道内的信号频谱分量组合成单个耦合声道信号的频谱分量,并编码表示耦合声道信号的信息而不是编码表示原始多个信号的信息。编码信号还包括表示原始信号的频谱形状的边信息。该边信息使接收机能够从耦合声道信号合成多个信号,所述多个信号具有与原始多个声道的信号基本上相同的频谱形状。在A/52文件中描述了可以执行耦合的一种方式。
下面的讨论描述了可以执行耦合的一种简单的实施方式。根据这种实施方式,通过计算在多个声道内相应频谱分量的平均值形成耦合声道的频谱分量。将表示原始信号频谱形状的边信息称作耦合坐标。根据在特定声道内的频谱分量能量与在耦合声道信号内频谱分量能量的比值计算出用于特定声道的耦合坐标。
在优选实施方式中,在编码信号内作为浮点数同时传送频谱分量和耦合坐标。接收器通过相乘在耦合声道信号内的每个频谱分量与合适的耦合坐标而从耦合声道信号合成多个声道信号。结果是具有与原始信号相同或基本上相同的频谱形状的一组合成信号。可以将这个处理表示如下si,j=Ci·cci,j(5)其中si,j=在声道j内的合成频谱分量i;Ci=在耦合声道信号内的频谱分量i;和cci,j=用于声道j内的频谱分量i的耦合坐标。
如果用规格化的浮点数表示耦合声道频谱分量和耦合坐标,则这两个数的乘积将生成用可能是欠规格化但是因为上面解释的原因不会是过规格化的尾数表示的值。
如果接收器合成耦合声道信号内的一个或多个频谱分量的替代品,则这种情况更加复杂。如上所述,合成处理通常建立不确定的频谱分量值,这种不确定性导致不可能预先确定相乘所得到的哪个频谱分量将是欠规格化的,除非预先已经知道合成处理的总体影响。
c)频谱再生在使用频谱再生的编码系统中,编码发送器仅编码输入音频信号的基带部分,并丢弃其余部分。解码接收器生成合成信号以替代所丢弃的部分。编码信号包括由解码处理用于控制信号合成的定标信息,以便合成信号在一定程度上保持所丢弃的输入音频信号部分的频谱电平。
可以通过多种方式再生频谱分量。一些方式使用伪随机数生成器生成或合成频谱分量。其它的方式将基带信号内的频谱分量转换或复制到需要再生的频谱部分内。具体的方式对于本发明来说并不重要;然而,从上面引用的参考文献可以获得一些优选实施方式的描述。
下面的讨论描述了频谱分量再生的一种简单的实施方式。根据这种实施方式,通过从基带信号复制频谱分量,组合所复制的分量与由伪随机数生成器生成的类似噪声的分量,和根据在编码信号中传送的定标信息定标该组合,合成频谱分量。根据在编码信号内传送的混合参数,还调整所复制的分量和类似噪声的分量的相对加权。可以用下述表达式表示这一处理si=ei·[ai·Ti+bi·Ni] (6)其中si=合成频谱分量i;ei=用于频谱分量i的包络定标信息;Ti=用于频谱分量i的复制频谱分量;Ni=为频谱分量i生成的类似噪声分量;ai=用于转换分量Ti的混合参数;和bi=用于类似噪声分量Ni的混合参数。
如果用规格化的浮点数表示复制频谱分量、包络定标信息、类似噪声分量和混合参数,则生成合成频谱分量需要的相加和相乘操作将产生用因为上面解释的原因可能是欠规格化或过规格化的尾数表示的值。不可能预先确定哪个合成频谱分量将是欠规格化或过规格化的,除非预先已经知道合成处理的总体影响。
B.改进技术本发明涉及允许更高效地执行和提供更高质量的代码转换信号的感知编码信号的代码转换的技术。这通过消除代码转换处理中的某些功能来实现,例如消除在常规的编码发送器和解码接收器内需要的分析和合成滤波。在其最简单的形式中,根据本发明的代码转换仅执行去量化频谱信息所需要的部分解码处理,和它仅执行重新量化去量化频谱信息所需要的部分编码处理。如果需要的话,可以执行附加的解码和编码。通过从编码信号中获得控制去量化和重新量化需要的控制参数,进一步简单了该代码转换处理。下面的讨论描述了编码发送器可用于生成代码转换需要的控制参数的两种方法。
1.最差情况假设a)概述用于生成控制参数的第一种方法假设最差情况条件,并仅在确保不可能出现过规格化所需要的程度上修改浮点指数。预期一些不必要的欠规格化。已修改的指数由量化控制器14用于确定一个或多个第二控制参数。已修改的指数并不需要包括在编码信号内,因为代码转换处理在相同条件下也修改指数,它修改与已修改指数相关的尾数,以使浮点表示方式表达正确的数值。
参见图2和图4,量化控制器14如上所述地确定一个或多个第一控制参数,估计器43分析与解码器24的合成处理相关的频谱分量以识别为确保在合成处理中不会出现过规格化而必需修改哪些指数。修改这些指数,并将它们与其它未修改的指数一起传送给量化控制器44,它确定用于将在代码转换器30内执行的重新编码处理的一个或多个第二控制参数。估计器43仅需要考虑在合成处理中可能产生过规格化的算术运算。因为这个原因,并不需要考虑类似于上述的用于耦合声道信号的合成处理,因为如上面所解释的,这个特定处理并不会导致过规格化。可能需要考虑在耦合的其它实施方式中的算术运算。
b)处理的详细情况(1)矩阵化在矩阵化中,不可能知道将提供给逆矩阵的每个尾数的确切值,直到由量化器15执行了量化和已经合成由解码处理生成的任何类似噪声分量之后。在这种实施方式中,必需为每个矩阵运算假设最差的情况,因为尾数值是未知的。参见等式4a和4b,在逆矩阵内的最差情况运算是符号相同和数值足够大到相加成大于1的数值的两个尾数的相加,或者符号不同和数值足够大到相加成大于1的数值的两个尾数的相减。通过将每个尾数向右偏移一个比特和将它们的指数减1,在代码转换器内可以针对任一种最差情况防止过规格化;因此,估计器43在逆矩阵计算中降低每个频谱分量的指数,量化控制器44使用这些修改后的指数确定用于代码转换器的一个或多个第二控制参数。在此和在该讨论的其余部分中假设在修改之前的指数值大于零。
如果实际提供给逆矩阵的两个尾数符合最差情况,则结果是正确规格化的尾数。如果实际的尾数并不符合最差情况条件,则结果将是欠规格化的尾数。
(2)频谱再生(HFR)在频谱再生中,不可能知道将提供给再生处理的每个尾数的确切值,直到由量化器15执行了量化和已经合成由解码处理生成的任何类似噪声分量之后。在这种实施方式中,必需为每个算术运算假设最差情况,因为尾数值是未知的。参见等式6,最差情况运算是用于转换频谱分量和类似噪声频谱分量的符号相同和数值足够大到相加成大于1的数值的尾数的相加。相乘运算不可能导致过规格化,但是它们也不能确保不出现过规格化;因此,必需假设合成的频谱分量是过规格化的。通过将频谱分量尾数和类似噪声分量尾数向右偏移一个比特和将指数减1,在代码转换器内可以防止过规格化;因此,估计器43降低用于转换分量的指数,量化控制器44使用这个已修改的指数确定用于代码转换器的一个或多个第二控制参数。
如果实际提供给再生处理的两个尾数符合最差情况条件,则结果是正确规格化的尾数。如果实际的尾数并不符合最差情况条件,则结果将是欠规格化的尾数。
c)优点和缺点这个进行最差情况假设的第一方法可以低成本地实施。然而,它需要代码转换器强制某些频谱分量欠规格化,并较不精确地在其编码信号内传送,除非分配更多的比特来表示它们。此外,因为降低了一些指数的值,基于这些已修改指数的掩蔽曲线较不精确。
2.确定性处理a)概述用于生成控制参数的第二种方法执行允许确定过规格化和欠规格化的具体情况的处理。修改浮点指数以防止过规格化和最小化欠规格化的出现率。由量化控制器14使用已修改的指数来确定一个或多个第二控制参数。已修改的指数并不需要包括在编码信号内,因为代码转换处理在相同的条件下也修改指数,它修改与已修改指数相关的尾数,以便浮点表示方式表示正确的值。
参见图2和图5,量化控制器14如上所述地确定一个或多个第一控制参数,合成模型53分析与解码器24的合成处理相关的频谱分量以识别出必需修改哪些指数,以便确保在合成处理内不出现过规格化和最小化在合成处理内出现的欠规格化的出现率。修改这些指数,并将它们与其它未修改指数一起发送给量化控制器54,它确定用于将在代码转换器30内执行的重新编码处理的一个或多个第二控制参数。合成模型53执行全部或部分合成处理,或者它模拟其影响以允许预先确定在合成处理内对所有算术运算的规格化的影响。
每个量化尾数的值和任一合成分量必需可用于在合成模型53内执行的分析处理。如果合成处理使用伪随机数生成器或其它准随机处理,则初始化或籽数值必需在发送器的分析处理和接收器的合成处理之间同步。这可以通过使编码发送器10确定所有的初始化值和在编码信号内包括这些数值的某些指示来实现。如果在独立的间隔或帧内设置编码信号,则可能希望将这个信息包括在每个帧内以最小化在解码时的启动延迟和便于诸如编辑等各种节目制作活动。
b)处理的详细情况(1)矩阵化在矩阵化中,由解码器24使用的解码处理可能将合成输入给逆矩阵的一个或两个频谱分量。如果合成任一个分量,则由逆矩阵计算的频谱分量可能是过规格化或欠规格化的。由于在尾数内的量化误差,由逆矩阵计算的频谱分量也可能是过规格化或欠规格化的。合成模型53可以测定这些未规格化的条件,因为它可以确定输入给逆矩阵的尾数和指数的确切值。
如果合成模型53确定规格化将失去,则可以降低输入给逆矩阵的一个或两个分量的指数以防止过规格化,并可以增加该指数以防止欠规格化。已修改的指数并未包括在编码信号内,但是它们被量化控制器54用于确定一个或多个第二控制参数。当代码转换器30对这些指数进行相同的修改时,也将调整相关的尾数,以便所获得的浮点数表示正确的分量值。
(2)频谱再生(HFR)在频谱再生中,由解码器24使用的解码处理可能将合成转换的频谱分量,它也可以合成要添加给该转换分量的类似噪声分量。因此,由频谱再生处理计算出的频谱分量可能是过规格化或欠规格化的。由于在转换分量尾数内的量化误差,再生分量也可能是过规格化或欠规格化的。合成模型53可以测定这些未规格化的条件,因为它可以确定输入给再生处理的尾数和指数的确切值。
如果合成模型53确定规格化将失去,则可以降低用于输入给再生处理的一个或两个分量的指数以防止过规格化,并可以增加该指数以防止欠规格化。已修改的指数并未包括在编码信号内,但是它们被量化控制器54用于确定一个或多个第二控制参数。当代码转换器30对这些指数进行相同的修改时,也将调整相关的尾数,以便所获得的浮点数表示正确的分量值。
(3)耦合在用于耦合声道信号的合成处理中,由解码器24使用的解码处理可能将合成用于在耦合声道信号内的一个或多个频谱分量的类似噪声分量。因此,由合成处理计算出的频谱分量可能是欠规格化的。由于在耦合声道信号内频谱分量的尾数内的量化误差,合成分量也可能是欠规格化的。合成模型53可以测定这些未规格化的条件,因为它可以确定输入给合成处理的尾数和指数的确切值。
如果合成模型53确定规格化将失去,则可以增加用于输入给合成处理的一个或两个分量的指数以防止欠规格化。已修改的指数并未包括在编码信号内,但是它们被量化控制器54用于确定一个或多个第二控制参数。当代码转换器30对这些指数进行相同的修改时,也将调整相关的尾数,以便所获得的浮点数表示正确的分量值。
c)优点和缺点与执行最差情况估计方法的处理相比,执行该确定性方法的处理实施成本更高;然而,这些附加的实施成本涉及编码发送器,并允许以更低成本实施代码转换器。此外,可以避免或最小化因为未规格化尾数导致的不精确度,与在最差情况估计方法内计算的掩蔽曲线相比,基于根据该确定性方法修改的指数的掩蔽曲线更加精确。
C.实施本发明的各个方面可以以各种方式实施,包括由计算机和某个其它设备执行的软件,所述设备包括更专用的组件,例如耦合到类似于在通用计算机内发现的组件的数字信号处理器(DSP)电路。图6是可用于实现本发明的各个方面的设备70的方框图。DSP 72提供计算资源。RAM 73是由DSP 72进行信号处理所用的系统随机存取存储器(RAM)。ROM 74表示某种形式的持久存储器,例如只读存储器(ROM),用于存储操作设备70和执行本发明的各个方面需要的程序。I/O控制器75表示通过通信信道76、77接收和发送信号的接口电路。模数转换器和数模转换器可以根据需要包括在I/O控制器75内以接收和/或发送模拟音频信号。在所图示的实施例中,所有的主要系统组件都连接到总线71,该总线可以代表多个物理总线;然而,总线结构并非本发明的实施所需要的。
在用通用计算机系统实施的实施例中,可以包括其它组件以建立与诸如键盘或鼠标和显示器等设备的接口,和用于控制具有诸如磁带或磁盘或光媒体等存储媒体的存储设备。存储媒体可以记录用于操作系统、实用程序和应用程序的指令程序,可以包括实施本发明各个方面的程序实施例。
可以通过用各种方式实现的组件执行实施本发明各个方面需要的功能,所述各种方式包括离散逻辑组件、集成电路、一个或多个ASIC和/或程控处理器。实现这些组件的方式对于本发明来说并不重要。
可以通过各种机器可读媒体传送本发明的软件实施方式,所述各种机器可读媒体例如是在包括从超声波到紫外线频率的频谱上的基带或调制通信路径,或者使用任一记录技术传送信息的存储媒体,包括磁带、磁卡或磁盘、光卡或光盘和在诸如纸张等媒体上的可检测标记。
权利要求
1.一种处理音频信号的方法,包括接收传送表示音频信号频谱分量的初始定标值和初始标度因子的信号,其中每个初始标度因子与一个或多个初始定标值相关,每个初始定标值根据其相关初始标度因子被定标,每个初始定标值和相关初始标度因子表示相应频谱分量的值;通过执行响应于包括至少一些初始标度因子的初始频谱信息的编码处理,生成编码频谱信息;响应于初始标度因子和第一比特率要求,导出一个或多个第一控制参数;响应于一个或多个第一控制参数,根据第一比特分配处理分配比特;通过使用基于由第一比特分配处理分配的比特数量的量化分辨率来量化至少一些初始定标值,获得量化定标值;响应于至少一些初始标度因子、一个或多个修改标度因子和第二比特率要求,导出一个或多个第二控制参数,其中通过下述方式获得所述一个或多个修改标度因子对于在解码方法内要应用于所述编码频谱信息的合成处理,分析所述初始频谱信息以识别一个或多个可能未规格化的合成定标值,所述合成处理生成用合成定标值和相关的合成标度因子表示的合成频谱分量,其中该合成处理与所述编码处理拟相反;和生成所述一个或多个修改标度因子以表示在所述初始频谱信息内初始标度因子的修改值,所述修改值对应于与所述一个或多个可能未规格化的合成定标值中至少一些相关的合成标度因子,以补偿所识别的可能未规格化的合成定标值的规格化的丢失;以及将编码信息装配到编码信号内,其中该编码信息表示所述量化定标值、至少一些初始标度因子、所述编码频谱信息、一个或多个第一控制参数和一个或多个第二控制参数。
2.根据权利要求1的方法,其中编码处理执行矩阵化、耦合和用于频谱分量再生的标度因子形成中的一种或多种编码技术。
3.根据权利要求1的方法,其中编码频谱信息包括与初始标度因子相关或与由编码处理生成的编码频谱信息内的编码标度因子相关的编码定标值;还响应于至少一些编码标度因子,导出所述一个或多个控制参数;和通过使用基于由第一比特分配处理分配的比特数量的量化分辨率还量化至少一些编码定标值,获得所述量化定标值。
4.根据权利要求1的方法,其中定标值是浮点尾数,标度因子是浮点指数。
5.根据权利要求1的方法,其中对于在最差情况假设下的合成处理,分析初始频谱信息以识别出所有可能过规格化的合成定标值。
6.根据权利要求5的方法,其中生成修改标度因子以补偿所述可能规格化的合成定标值的过规格化的全部出现。
7.根据权利要求1的方法,其中第一比特率等于第二比特率。
8.根据权利要求1的方法,其中通过执行至少部分合成处理或响应于编码频谱信息和至少一些量化定标值以生成至少一些合成频谱分量的至少部分合成处理的仿真,分析初始频谱信息,其中将所述一个或多个可能未规格化的合成定标值确定为从合成处理获得的一个或多个未规格化的定标值。
9.根据权利要求8的方法,其中识别所有过规格化的合成定标值。
10.根据权利要求9的方法,其中生成修改标度因子以反映所有过规格化的合成定标值和至少一些欠规格化的合成定标值的规格化。
11.一种代码转换编码音频信息的方法,包括接收传送表示音频信号频谱分量的第一量化定标值和第一标度因子的第一编码信号,其中每个第一标度因子与一个或多个第一量化定标值相关,每个第一量化定标值根据其相关的第一标度因子被定标,每个第一量化定标值和相关的第一标度因子表示相应的频谱分量;根据第一标度因子导出第二标度因子;响应于一个或多个第一控制参数根据第一比特分配处理来分配比特,并通过根据基于由第一比特分配处理分配的比特数量的量化分辨率进行去量化,由第一量化定标值获得去量化的定标值;响应于一个或多个第二控制参数根据第二比特分配处理来分配比特,并通过使用基于由第二比特分配处理分配的比特数量的量化分辨率来量化所述去量化的定标值,获得第二量化定标值;和将第二量化定标值、第二标度因子和一个或多个第二控制参数装配到第二编码信号内。
12.根据权利要求11的方法,还包括从第一编码信号获得一个或多个第一控制参数和一个或多个第二控制参数。
13.根据权利要求12的方法,其中响应于第一编码信号的比特率要求导出一个或多个第一控制参数,和响应于第二编码信号的比特率要求导出一个或多个第二控制参数。
14.根据权利要求11的方法,还包括根据第二标度因子和根据第二编码信号的比特率要求导出一个或多个第二控制参数。
15.根据权利要求11的方法,其中一个或多个第二标度因子与相应的第一标度因子相同。
16.根据权利要求11的方法,其中根据用于第一编码信号的第一比特率执行第一比特分配处理,和根据与第一比特率相等的用于第二编码信号的第二比特率执行第二比特分配处理。
17.根据权利要求11的方法,还包括通过执行响应于一个或多个去量化的定标值的编码处理,生成编码频谱信息。
18.根据权利要求17的方法,其中该编码处理通过执行矩阵化、去矩阵化、耦合、去耦合、用于频谱分量再生的标度因子形成和频谱分量再生中的一种或多种编码技术,生成第二标度因子。
19.一种用于处理音频信号的编码器,其中该编码器包括装置,用于接收传送表示音频信号频谱分量的初始定标值和初始标度因子的信号,其中每个初始标度因子与一个或多个初始定标值相关,每个初始定标值根据其相关初始标度因子被定标,每个初始定标值和相关初始标度因子表示相应频谱分量的值;装置,用于通过执行响应于包括至少一些初始标度因子的初始频谱信息的编码处理,生成编码频谱信息;装置,用于响应于初始标度因子和第一比特率要求,导出一个或多个第一控制参数;装置,用于响应于一个或多个第一控制参数,根据第一比特分配处理分配比特;装置,用于通过使用基于由第一比特分配处理分配的比特数量的量化分辨率来量化至少一些初始定标值,获得量化定标值;装置,用于响应于至少一些初始标度因子、一个或多个修改标度因子和第二比特率要求,导出一个或多个第二控制参数,其中通过下述方式获得所述一个或多个修改标度因子对于在解码方法内要应用于所述编码频谱信息的合成处理,分析所述初始频谱信息以识别一个或多个可能未规格化的合成定标值,所述合成处理生成用合成定标值和相关的合成标度因子表示的合成频谱分量,其中该合成处理与所述编码处理拟相反;和生成所述一个或多个修改标度因子以表示在所述初始频谱信息内初始标度因子的修改值,所述修改值对应于与所述一个或多个可能未规格化的合成定标值中至少一些相关的合成标度因子,以补偿所识别的可能未规格化的合成定标值的规格化的丢失;以及装置,用于将编码信息装配到编码信号内,其中该编码信息表示所述量化定标值、至少一些初始标度因子、所述编码频谱信息、一个或多个第一控制参数和一个或多个第二控制参数。
20.根据权利要求19的编码器,其中编码处理执行矩阵化、耦合和用于频谱分量再生的标度因子形成中的一种或多种编码技术。
21.根据权利要求19的编码器,其中编码频谱信息包括与初始标度因子相关或与由编码处理生成的编码频谱信息内的编码标度因子相关的编码定标值;还响应于至少一些编码标度因子,导出所述一个或多个控制参数;和通过使用基于由第一比特分配处理分配的比特数量的量化分辨率还量化至少一些编码定标值,获得所述量化定标值。
22.根据权利要求19的编码器,其中定标值是浮点尾数,标度因子是浮点指数。
23.根据权利要求19的编码器,其中对于在最差情况假设下的合成处理,分析初始频谱信息以识别出所有可能过规格化的合成定标值。
24.根据权利要求23的编码器,其中生成修改标度因子以补偿所述可能过规格化的合成定标值的过规格化的全部出现。
25.根据权利要求19的编码器,其中第一比特率等于第二比特率。
26.根据权利要求19的编码器,其中通过执行至少部分合成处理或响应于编码频谱信息和至少一些量化定标值以生成至少一些合成频谱分量的至少部分合成处理的仿真,分析初始频谱信息,其中将所述一个或多个可能未规格化的合成定标值确定为从合成处理获得的一个或多个未规格化的定标值。
27.根据权利要求26的编码器,其中识别所有过规格化的合成定标值。
28.根据权利要求27的编码器,其中生成修改标度因子以反映所有过规格化的合成定标值和至少一些欠规格化的合成定标值的规格化。
29.一种用于代码转换编码音频信息的代码转换器,该代码转换器包括装置,用于接收传送表示音频信号频谱分量的第一量化定标值和第一标度因子的第一编码信号,其中每个第一标度因子与一个或多个第一量化定标值相关,每个第一量化定标值根据其相关的第一标度因子被定标,每个第一量化定标值和相关的第一标度因子表示相应的频谱分量;装置,用于根据第一标度因子导出第二标度因子;装置,用于响应于一个或多个第一控制参数根据第一比特分配处理分配比特,并通过根据基于由第一比特分配处理分配的比特数量的量化分辨率进行去量化,由第一量化定标值获得去量化的定标值;装置,用于响应于一个或多个第二控制参数根据第二比特分配处理分配比特,并通过使用基于由第二比特分配处理分配的比特数量的量化分辨率来量化所述去量化的定标值,获得第二量化定标值;和装置,用于将第二量化定标值、第二标度因子和一个或多个第二控制参数装配到第二编码信号内。
30.根据权利要求29的方法,还包括从第一编码信号获得一个或多个第一控制参数和一个或多个第二控制参数。
31.根据权利要求30的方法,其中响应于第一编码信号的比特率要求导出一个或多个第一控制参数,和响应于第二编码信号的比特率要求导出一个或多个第二控制参数。
32.根据权利要求29的方法,还包括根据第二标度因子和根据第二编码信号的比特率要求导出一个或多个第二控制参数。
33.根据权利要求29的方法,其中一个或多个第二标度因子与相应的第一标度因子相等。
34.根据权利要求29的方法,其中根据用于第一编码信号的第一比特率执行第一比特分配处理,和根据与第一比特率相等的用于第二编码信号的第二比特率执行第二比特分配处理。
35.根据权利要求29的方法,还包括通过执行响应于一个或多个去量化的定标值的编码处理,生成编码频谱信息。
36.根据权利要求35的方法,其中该编码处理通过执行矩阵化、去矩阵化、耦合、去耦合、用于频谱分量再生的标度因子形成和频谱分量再生中的一种或多种编码技术,生成第二标度因子。
37.一种传送设备可执行指令程序的媒体,其中指令程序的执行使该设备执行一种用于代码转换音频信息的方法,其中该方法包括接收传送表示音频信号频谱分量的初始定标值和初始标度因子的信号,其中每个初始标度因子与一个或多个初始定标值相关,每个初始定标值根据其相关初始标度因子被定标,每个初始定标值和相关初始标度因子表示相应频谱分量的值;通过执行响应于包括至少一些初始标度因子的初始频谱信息的编码处理,生成编码频谱信息;响应于初始标度因子和第一比特率要求,导出一个或多个第一控制参数;响应于一个或多个第一控制参数,根据第一比特分配处理分配比特;通过使用基于由第一比特分配处理分配的比特数量的量化分辨率来量化至少一些初始定标值,获得量化定标值;响应于至少一些初始标度因子、一个或多个修改标度因子和第二比特率要求,导出一个或多个第二控制参数,其中通过下述方式获得所述一个或多个修改标度因子对于在解码方法内要应用于所述编码频谱信息的合成处理,分析所述初始频谱信息以识别一个或多个可能未规格化的合成定标值,所述合成处理生成用合成定标值和相关的合成标度因子表示的合成频谱分量,其中该合成处理与所述编码处理拟相反;和生成所述一个或多个修改标度因子以表示在所述初始频谱信息内初始标度因子的修改值,所述修改值对应于与所述一个或多个可能未规格化的合成定标值中至少一些相关的合成标度因子,以补偿所识别的可能未规格化的合成定标值的规格化的丢失;以及将编码信息装配到编码信号内,其中该编码信息表示所述量化定标值、至少一些初始标度因子、所述编码频谱信息、一个或多个第一控制参数和一个或多个第二控制参数。
38.根据权利要求37的媒体,其中编码处理执行矩阵化、耦合和用于频谱分量再生的标度因子形成中的一种或多种编码技术。
39.根据权利要求37的媒体,其中编码频谱信息包括与初始标度因子相关或与由编码处理生成的编码频谱信息内的编码标度因子相关的编码定标值;还响应于至少一些编码标度因子,导出一个或多个控制参数;和通过使用基于由第一比特分配处理分配的比特数量的量化分辨率还量化至少一些编码定标值,获得量化定标值。
40.根据权利要求37的媒体,其中定标值是浮点尾数,标度因子是浮点指数。
41.根据权利要求37的媒体,其中对于在最差情况假设下的合成处理,分析初始频谱信息以识别出所有可能过规格化的合成定标值。
42.根据权利要求41的媒体,其中生成修改标度因子以补偿所述可能过规格化的合成定标值的过规格化的全部出现。
43.根据权利要求37的媒体,其中第一比特率等于第二比特率。
44.根据权利要求37的媒体,其中通过执行至少一部分合成处理或响应于编码频谱信息和至少一些量化定标值以生成至少一些合成频谱分量的至少一部分合成处理的仿真,分析初始频谱信息,其中将一个或多个可能未规格化的合成定标值确定为从合成处理获得的一个或多个未规格化定标值。
45.根据权利要求44的媒体,其中识别所有过规格化的合成定标值。
46.根据权利要求45的媒体,其中生成修改标度因子以反映所有过规格化的合成定标值和至少一些欠规格化的合成定标值的规格化。
47.一种传送设备可执行指令程序的媒体,其中指令程序的执行使该设备执行一种用于代码转换编码音频信息的方法,其中该方法包括接收传送表示音频信号频谱分量的第一量化定标值和第一标度因子的第一编码信号,其中每个第一标度因子与一个或多个第一量化定标值相关,每个第一量化定标值根据其相关的第一标度因子被定标,和每个第一量化定标值和相关的第一标度因子表示相应的频谱分量;根据第一标度因子导出第二标度因子;响应于一个或多个第一控制参数根据第一比特分配处理分配比特,并通过根据基于由第一比特分配处理分配的比特数量的量化分辨率进行去量化,由第一量化定标值获得去量化的定标值;响应于一个或多个第二控制参数根据第二比特分配处理分配比特,并通过使用基于由第二比特分配处理分配的比特数量的量化分辨率来量化所述去量化的定标值,获得第二量化定标值;和将第二量化定标值、第二标度因子和一个或多个第二控制参数装配在第二编码信号内。
48.根据权利要求47的媒体,还包括从第一编码信号获得一个或多个第一控制参数和一个或多个第二控制参数。
49.根据权利要求48的媒体,其中响应于第一编码信号的比特率要求导出一个或多个第一控制参数,和响应于第二编码信号的比特率要求导出一个或多个第二控制参数。
50.根据权利要求47的媒体,还包括根据第二标度因子和根据第二编码信号的比特率要求导出一个或多个第二控制参数。
51.根据权利要求47的媒体,其中一个或多个第二标度因子与相应的第一标度因子相同。
52.根据权利要求47的媒体,其中根据用于第一编码信号的第一比特率执行第一比特分配处理,和根据与第一比特率相等的用于第二编码信号的第二比特率执行第二比特分配处理。
53.根据权利要求47的媒体,还包括通过执行响应于一个或多个去量化定标值的编码处理,生成编码频谱信息。
54.根据权利要求53的媒体,其中该编码处理通过执行矩阵化、去矩阵化、耦合、去耦合、用于频谱分量再生的标度因子形成和频谱分量再生中的一种或多种编码技术,生成第二标度因子。
全文摘要
在音频编码系统中,编码发送器将编码频谱分量表示为规格化浮点数。发送器提供可用于代码转换编码频谱参数的第一和第二控制参数。代码转换器使用第一控制参数部分地解码编码分量和使用第二控制参数重新编码该分量。发送器通过分析在部分解码处理中的算术运算的影响以识别出浮点表示丢失规格化的情况来确定第二控制参数。修改与丢失规格化的数值相关的指数,并使用已经修改的指数计算第二控制参数。
文档编号G10L19/00GK1748248SQ200480003666
公开日2006年3月15日 申请日期2004年1月30日 优先权日2003年2月6日
发明者布赖恩·T.·兰侬, 迈克尔·M.·杜鲁门, 罗伯特·L.·安德森 申请人:杜比实验室特许公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1