音频编码的制作方法

文档序号:2836947阅读:264来源:国知局
专利名称:音频编码的制作方法
技术领域
本发明 一般涉及音频编码以及解码技术。
背景技术
对于音频编码,过去已经应用了不同的编码方案。这些编码方 案中的一种编码方案是应用心理声学编码。关于这些编码方案,使 用输入音频信号的频谦特性来减小冗余。分析输入音频信号的频谱 分量并且去除显然不能由人耳识别的频谱分量。为了应用这些编码 方案,获得输入音频信号的频谱系数。
诸如高级音频编码器(AAC)以及MPEG音频的心理声学编码 中的频谱系数的量化通过以下方式来执行,即先使用标量量化,接 着使用标度因子(scale factor )以及定标的频谱系数的熵编码。使用 针对频谱系数的十 一 个可能的固定霍夫曼树、以及针对标度因子的 一个树作为微分编码来执行熵编码。
理想的编码情况产生原始信号的压缩版本,这导致与原始非常 接近(至少在可感知的意义上)的信号的解码过程,同时具有高压 缩比并且压缩算法不太复杂。由于当今流传甚广的多媒体通信以及 异类网络,为了相同或者更好的质量而同时保持较低复杂度而提高 压缩比率是一项持久的挑战。

发明内容
根据一个方面,本申请提供了一种用于音频编码的方法,该方 法通过以下步骤来进行接收输入音频信号,将所述输入音频信号 划分为至少两个子带,利用第一因子对所述至少两个子带进行定标, 对所述至少两个已定标的子带的每个进行压缩扩展,以及对所述已压缩扩展的、已定标的子带进行量化。根据另一方面,本申请提供了一种编码器,该编码器包括变 换单元,适用于接收输入音频信号,并且将所述输入音频信号划分 为至少两个子带;定标单元,适用于利用第一因子对至少两个子带 进行定标;压缩扩展单元,适用于对至少两个已定标的子带的每个 子带进行压缩扩展;以及量化单元,适用于对所述已压缩扩展的、 已定标的子带进行量化。根据另 一方面,本申请提供了 一种包括与上述编码器相同组件 的电子设备。根据另 一方面,本申请提供了 一种存储软件代码的软件程序产 品,当在电子设备的处理单元中执行时,所述软件代码适用于实现 上述编码方法。根据另一方面,本申请提供了一种用于音频解码的方法,该方 法通过以下步骤来实现接收已编码的音频数据,从所述已编码的 音频数据生成至少两个已压缩扩展的子带;对每个已压缩扩展的子 带进行解压缩扩展,利用第一因子对所述至少两个已解压缩扩展的 子带进行定标;以及将所述已解压缩扩展的和已定标的子带结合到 已解码的音频信号。根据另一方面,本申请提供了一种解码器,该解码器包括解 压缩扩展单元,适用于对至少两个已压缩扩展的子带进行解压缩扩 展,其中所述已压缩扩展的子带是从所接收的已编码的音频数据生 成;定标单元,适用于利用第一因子对所述至少两个已解压缩扩展 的子带进行定标;以及变换单元,适用于将所述已解压缩扩展和已 定标的子带结合到已解码的音频信号。根据另 一方面,本申请提供了 一种存储软件代码的软件程序产 品,当在电子设备的处理单元中执行时,所述软件代码适用于实现 上述解码方法。根据另一方面,本申请提供了一种包括与上述解码器相同组件 的电子设备。根据另 一 方面,本申请提供了 一种包括上述编码器和上述解码 器的系统。
本申请在频谱数据的向量量化之前提供对输入音频信号子带的 频谱分量进行压缩扩展。根据一个方面,压缩扩展通过使用已定标 的子带来考虑输入音频数据的心理声学现象以及频谱系数的分布, 其中所述已定标的子带实现性能-复杂度有效的量化。
根据一个实施方式,定标包括利用第一定标因子对至少两个子 带进行定标。该第 一 定标因子可以例如依赖于针对已编码数据流的 总可用比特率,依赖于针对每个子带的可用比特率、和/或依赖于各 个子带的特性。第一定标因子可以包括例如基数和指数。总比特率 例如可以由用户来设置,然后可以以适合的方式向子带自动分布所 述总比特率。
然后,如果整体比特率(用户可以对其施加影响)具有较高的
值,则例如可以将针对各个子带的基数设置为较低的值;以及如果 由用户施加影响的比特率具有较低的值,则可以将该基数设置为较 高的值。
例如可以针对每个子带确定指数,使得已编码音频信号的总比 特率尽可能地接近,但可以不小于可用比特率,并且所有子带中的 整体失真是最小化的。这允许对比特率-失真测量进行优化。
可以以各种方式确定指数。例如,可以根据针对每个子带所允 许的失真来计算用于该子带的最小的所考虑的指数。
为了对已编码音频信号进行解码,关于在编码侧定标的信息还 必须在解码侧也可用。为此,可以编码所需的信息,例如熵编码。 仅提供和编码第一定标因子的一部分可以是足够的。在编码器和解 码器两侧已知由用户设置的整体比特率,因此仅编码指数而不编码 基数可以是足够的。
根据其他实施方式,定标可以包括第二因子,该第二因子是根 据用第一因子定标的子带的标准差。利用第一定标因子的定标可以
代替利用第二定标因子的定标。根据其他实施方式,利用已定标子带的概率函数来创建用于压缩扩展的累积密度函数。频谱数据可以近似为具有0.5的形状因子的 广义高斯概率密度函数。这一发现可以使得使用解析的广义高斯概 率密度函数来以传统方式计算累积密度函数以及获取压缩扩展函 数。这一经典方法称作"直方图均衡化"。其思想是变换数据,使 得结果生成的已变换数据的概率密度函数是一致的。示出了将由数 据的累积密度函数给出的变换函数。累计密度函数是最大值为1的 非下降函数。可以离线预先确定该函数并且在编码端存储该函数,根据其他实施方式,在利用第三定标因子量化之前对已压缩扩 展的子带进行定标。此第三定标因子针对较高整体比特率可以比针 对较低整体比特率较高。此第三因子可以依赖于子带系数的标准差, 由此通过这样的乘法,提供了其他装置用于针对每个子带分别调整 量化分辨率。格型量化器可以使用例如矩形截断的格型用于对已压缩扩展 的、已定标的子带进行量化,这生成针对每个子带的码向量。对于每个子带,可以计算具体范数用于包括已量化子带的格型 截断。针对每个子带,可以选择用于矩形截断的格型的范数,以便 对应于与各个码向量的范数。在解码端不能预先已知这种范数,可 以对其进行编码(例如,熵编码),使得可以将其提供作为用于已 编码音频信号的另 一 侧的信息。例如可以通过索引来编码导致量化的码向量。例如但并非排他地,可以在AAC编码框架中应用上述编码选项。根据示出可能实施方式的以下描述,本申请的其他方面将变得 清楚明了。


图1示意性地示出了根据本发明的一个实施方式的第一电子设 备的编码器的功能块;图2示意性地示出了根据实施方式的编码器组件的功能块; 图3是示出根据本发明的一个实施方式的编码操作的流程图; 图4示意性地示出了根据本发明的一个实施方式的第二电子设 备的解码器的功能块;
图5示意性地示出了根据实施方式的解码器组件的功能块。
具体实施例方式
图1是其中可以实现根据本发明的一个实施方式的低复杂度编 码的示例性电子设备1的图示。
电子设备l包括编码器2,示意性地示出了编码器2的功能块。 编码器2包括改进的离散余弦变换(MDCT)单元4、定标单元6、 压缩扩展单元8、量化单元10、索引单元以及熵编码单元13。
在MDCT单元4中,输入音频信号14经MDCT变换到频率域。 然后,在定标单元6中,利用各个定标因子来定标频率域信号的多 个频率子带的频镨分量。例如,这种定标可以是利用第一和/或第二 定标因子的下定标。
向压缩扩展单元8提供子带的这些已定标的频谱分量,在所述 压缩扩展单元8中压缩扩展该频语分量。向量化单元IO提供已压缩 扩展的频镨分量,其中利用第三定标因子乘以所述已压缩扩展的频 谱分量,并且使用格型量化器来量化。可以在量化单元IO外部实现 定标。如果使用Zn格型,则此步骤对应于四舍五入到最接近的整数 以便获得量化的频谱分量。每个子带的量化的频谱分量可以用各个 格型向量来表示。
在索引单元12中,可以针对每个子带通过适合的索引方法来将 所获得的整数格型向量进行索引。
可以以硬件(HW)和/或软件(SW)来实现编码器2。关于以 软件实现的情况,当在设备1的处理单元中执行该软件时,存储在 计算机可读介质上的软件代码实现所述功能。
现在,将参考图2来更详细地描述用于音频信号的MDCT频谙系数的非常低复杂度量化的新结构的实施方式。示出了 MDCT单元 4、改进的定标单元6以及压缩扩展格型向量量化器单元16。压缩扩 展格型向量量化器单元16包括图1的压缩扩展单元8、量化单元10 以及索引单元12。

根据实施方式,利用标度因子^、以及利用已定标子带标准差 丄
的倒数 ,在定标单元6中对由MDCT单元4提供的每个子带SBi (其中i=l至N)进行定标。由于仅可从训练集来离线估计标准差的 值,所以已定标的子带分量的方差值可以不同于1。然而,估计越好 则方差值越接近等于1。
利用第 一 定标因子已经定标的数据的标准差的分割使得已定标 数据具有"1"的方差。
用于标度因子的计算的基数b是根据可用比特率,该比特率可 以由用户来设置。对于高于或者等于48kBit/s的比特率,此基数b 可以是1.45;而对于低于48kBit/s的比特率,基数b可以是2。应 该理解,如果发现适合则还可以选择其他的值。使用不同的基数值 允许在不同比特率使用不同的量化分辨率。在下文中将进一步描述 针对每个子带的标度因子计算所使用的指数{^}的确定,其中所述指 数可以是从0至42的整数。
在编码器和解码器两侧,对于每个子带的标准差和基数b都是 已知的。根据实施方式,可以例如在训练集上,离线计算所使用的 标准差。由此,仅使得指数"}必须可用于解码端。
以传统方式使用通过定标结果生成的频谱分量的概率密度函 数,以便推断产生压缩扩展函数的累积密度函数。通过示例方式, 从训练数据集抽取累积密度函数并将其存储为700个二维点(x, f (x))的表。"x,,是部分线性的(具有3个不同斜率),从而使 用一维点(仅仅f (x))可实现函数的存储。
在压缩扩展格型向量量化器单元16中,使用产生的压缩扩展函 数来压缩扩展已定标的频谱分量。在压缩扩展之后,已压缩扩展的200680039020.3说明书第7/12页数据几乎具有一致的分布并且可以使用格型量化器来有效地得以量 化。为了增加量化分辨率,在量化之前,另外可以由另一第三定标 因子来乘以已压缩扩展的数据,这可以是相应子带的标准差乘以一个因子,其中对于大于或者等于48 kbit/s的比特率,所述因子等于3, 而对于小于48kbit/s的比特率,所述因子等于2.1。由此,在相同的编码结构中,可以通过两个参数来改变量化分 辨率,即第 一定标因子的基数b和量化之前直接应用的乘法的第三 定标因子。例如,这允许针对不同的比特率域使用相同的编解码器, 所述不同比特率域例如在44.1 kHz的从16 kbit/s至128 kbit/s。对于已压缩扩展数据的量化,压缩扩展格型向量量化器16更适 合用于针对每个频谱子带使用矩形截断的Zn格型向量量化器,例如 在每1024长度量化帧处。除Zn格型以外,其他格型也是适用的并 且在本申请的范围中。各个Zn格型的维度可以等于各个子带中频谱 分量的数目。Zn格型包括n维空间的所有整数坐标点。格型的有限截断形成 "码本,,,并且可将一个点称作"码向量"。每个码向量可以关联 于各个索引。另一方面,可以通过整数向量来表示各个子带的量化 的频谱分量,所述整数向量与Zn格型量化器的特定码向量相对应。 由此,代替对每个向量分量单独进行编码的是可以从格型生成单 个索引并将其针对向量而发送。在截断的格型中,格型的点的数目是有限的。在其中包含了向 量的矩形截断格型允许简单的索引算法。继而格型码向量是来自格 型截断的点。如果截断是矩形的,则与此截断相对应的范数可以是所考虑向 量的分量的最大绝对值JV(;c) = m'ax(|xj), x = (x!,…,;x:")e Z (1)压缩扩展格型向量量化器16的输出包括码向量的范数"^和格 型码向量索引" )h其中码向量可以是从0至141的整数。索引i表示子带并且索引j枚举在比特率最小化算法中使用的可能的指数 值。可以使用本量化,因为所述量化是针对音频信号的频谱量化、 或者适用于其他类型的数据的量化。为了给出某些示例,范数^"^ }和指数{& }可以是使用香农编码或者算术编码在熵编码器13中编码的熵。由实现所提出的频谱量化方法的编码器2所输出的比特流包括 每个子带的码向量的索引的二进制表示、以及熵编码的范数和指数。如果码向量的范数是零,则不能编码标度因子的指数,这是因 为其不再有效。可以如下计算针对各个索引所需的比特数目<formula>formula see original document page 14</formula> 其中n是量化空间的维度,即当前子带,以及「1'表示最接近朝向无限四舍五入自变量的整数。编码器具有例如可以由用户设置的可用总比特率,并且由编码 器输出的比特流应具有该比特率。为了确定适合的指数(& },定标单元6可以通过应用优化算法 来执行失真/比特率优化。为此,针对具有n维的每个子带的指数P。可以通过下式来定 <formula>formula see original document page 14</formula> 其中aD是每个子带所允许的失真。可从以下感知模式来获取允 许的失真。L」表示整数部分或者最接近于自变量的较小整数。失真测量是每个子带的量化的欧几里德失真与针对所考虑子带所允许的 失真之间的比率。针对每个子带SBj,选择上至20个(作为示例,可以是不同的 值)指数值用于评估。这些指数包括大于初始值的19个指数值和初 始值。如果不存在大于初始值的20个指数值,则仅考虑这些可用的指数值。应该注意,这些数目还可以是变化的,但是如果考虑更多 的值,则编码时间会增加。相反,考虑较少的值将使得编码时间降 低,这在编码质量方面将付出轻微的代价。
针对每个子带和指数的每个考虑的值5针对给定的帧来应用上 述定标、压缩扩展、乘法以及量化的处理。在这些情况的每个中, 针对每个子带以及每个所考虑指数来获取已量化的向量。
为了编码结果生成的向量,需要Rmax的比特数目加上编码向量 的最大范数的比特数目和编码所考虑的指数的比特数目。这三个量 的总和对应于所谓的比特率值。
率-失真测量可以是关于每个子带所允许失真的错误率。当计算
错误率时,存在两种可能途径 一种是从其定义来计算实际错误率;
而第二种是,如果所允许的失真测量大于在所考虑子带中的信号能 量,则将错误率设置为零。第一种途径可以认为是"定义",而第 二种途径可认为是"改进的定义"。
由此,针对每个子带和每个考虑的指数,可以获得比特率与错
误率的各个配对。此配对还称作率-失真测量。
对于每个子带,排序率-失真测量使得比特率是增加的。通常, 随着比特率的增加,失真将降低。如果不满足此规律,则排除具有 较高比特率的失真测量。这就是不是所有子带都具有相同数目的率-失真测量的原因。
优化算法具有两种类型的初始化
1. 由与最低错误率相对应的率-失真测量开始,该最低错误率等 效于最高比特率,或者
2. 由与针对所有子带的小于1.0的错误率相对应的率-失真测量 开始。
优化算法的目标在于针对当前帧的每个子带,从所考虑指数值 中选择指数值,使得所选择的率-失真测量的累积比特率小于或者等 于针对帧的可用比特率,并且整体错误率尽可能地小。用于此优化 的标准应该为最小的4晉误率,而比特率应该在由比特池才几制所给出的可用比特数目以内,例如在AAC中那样。
根据示例性的优化算法,率-失真测量按照沿子带i (其中i=l: N)增加的比特率的值而从1至Ri, Ni地排序,并且结果是降低的错 误率,Dj,j (其中i=l:N, j = l:Ni)。由具有最小失真的率-失真测
量来初始该算法。初始比特率是"=^《,。为了选择具有索引k的 最佳率-失真测量,可以应用如下伪代码
<formula>formula see original document page 16</formula>索引k(i)(其中i=l:N)指向率-失真测量,而且还指向应该 针对每个子带所选择的指数值,该值可以用于生成率-失真测量。 对于高的比特率,例如,>48kbit/s,可以在第5行将算法修改
为<formula>formula see original document page 16</formula>
使得如果通过降低其比特率,将所有系数设置为零,则在最大 化过程不考虑子带i,并且用于该子带的比特率变为1。
如果总比特率过高,则应降低一些,由此某些子带将具有较小 比特率。如果仅可应用于一个子带的率-失真测量是一个具有等于1 的比特率的率-失真测量,其中相应于被设置为零的子带中的所有系 数,1是针对子带比特率的最小可能值,则在该子带中,不能进一步 降低比特率。这是测试k (i)是否大于1的原因。对于每个符合条件的子带,计算对应于一个配对向左侧前进的梯度,并且选择具有 最低增加的失真并且具有最大降低的比特率的配对。然后,检查结 果生成的总比特率,等等。图3是概括上述编码的流程图。首先,对接收到的音频信号进行变换,并将其划分为多个子带 SBi,其中i=l至N (步骤101 )。然后,针对每个子带,基于在此子带中所允许的失真来确定指 数Si的初始值(步骤102)。如上所述,使用所确定的Sj的初始值, 通过第一和/或第二定标因子将子带分量进行分割(步骤103),其 中定标因子可以是标准差o'和^ ,进行压缩扩展(步骤104),进 一步利用第三定标因子进行定标(步骤105),以及进行量化(步骤 106)。针对Si的多达19个的其他值来重复相同操作,只要该值没 有超过42,则在每次重复中将Sj递增l(步骤107、步骤103至106)。 对于每个所使用的Si值,确定结果生成的比特率和结果生成的失真 (步骤108)。然后,根据增加的相关联的比特率来Si值进行排序(步 骤109)。丢弃导致比各个先前Si值更高失真的那些Si值。接着,共同估计针对所有子带的排序的Sj值。更具体地,针对 每个子带选择一个Si值,从而针对所有子带的Si值的集合(sJ导致尽可能地靠近所允许的总比特率的总比特率,并且同时将整体失真最 小化(步骤110)。最后,针对每个子带SBi,对具有所选择Si值的在步骤106的量 化中产生的码向量进行索引,以及对在此量化中使用的范数和所选 择的Sj值进行熵编码(步骤111 )。图4是其中可以实现根据本发明的实施方式的低复杂度解码的 示例性电子设备17的图示。电子设备1和17可以一起形成根据本 发明的系统的示例性实施方式。电子设备17包括解码器18,示意性地示出了其中的功能块。解 码器18包括熵解码器21、逆索引单元22、解压缩扩展单元24、逆 定标单元26以及逆MDCT单元28。在解码器18中接收已编码的比特流20。首先,通过熵解码单元 21来抽取定标因子的范数和指数。在熵解码单元21和逆索引单元 22之间存在连接器。将已解码的范数从熵解码单元21馈送至逆索引 单元22,从而通知该索引表示多少比特。从二进制字读取码向量索 引,并将其馈送至逆索引单元22,其中所述二进制字具有根据公式 (2)由已解码范数给出的长度。然后,在逆索引单元22中取回码向量。在解压缩扩展单元24 中使用码向量的分量,以便获得已解压缩扩展的值的集合。在逆定 标单元26中通过逆定标因子来定标这些值。在逆MDCT单元28中 使用已定标的值以获取期望的音频信号。解码器18可以以硬件(HW)和/或软件(SW)来实现。如果以 软件来实现,则当在设备17的处理单元中执行时,存储在计算机可读介质上的软件代码实现所描述的功能。图5示出了根据实施方式的解码器18的所选择组件。这些组件 包括逆索引单元22、定标单元33 (在图3中未示出)、解压缩扩展 单元24以及改进的逆定标单元26。已编码的比特流20包括针对每个子带SBj的码向量索引t对"h针对每个子带SBi的已编码范数仏"H以及针对每个子带SBi的已编码指数(Si〉。逆索引单元22利用从熵解码单元21接收的码向量索引WW以 及已解码范数仏"W,来取回每个子带的已压缩扩展的频谱分量。这 些已压缩扩展的频谱分量在定标单元33中通过因子来分割,在编码 器2中使用所述因子来乘以已压缩扩展的数据,即2'15^'或者" 。在解压缩扩展单元24中对结果生成的数据进行解压缩扩展。使用从熵解码单元21接收的已解码指数(Sj),随已知的基数b 一起生成针对各个子带的逆标度因子。在逆定标单元26中,针对各 个子带,使用针对各个子带的逆标度因子和已知的标准差a,'来重新 定标由解压缩扩展单元24输出的频谱分量。应该注意,所述实施方式可以以许多方式变化。
权利要求
1.一种用于音频编码的方法,该方法包括-接收输入音频信号,-将所述输入音频信号划分为至少两个子带,-利用第一因子对所述至少两个子带进行定标,-对所述至少两个已定标的子带的每个进行压缩扩展,以及-对所述已压缩扩展的、已定标的子带进行量化。
2. 根据权利要求1所述的方法,其中所述第一因子依赖于以下 项中至少一个A) 针对已编码数据流可用的总比特率,B) 针对每个子带可用的比特率,以及C) 各个子带的特性。
3. 根据权利要求1所述的方法,其中所述定标进一步包括利用 第二因子对所述至少两个子带进行定标,所述第二因子至少取决于 所述各个已定标子带的标准差。
4. 根据权利要求1所述的方法,其中量化包括使用格型量化器 进行量化。
5. 根据权利要求1所述的方法,其中所述第一因子包括基数和 指数,以及其中针对整体较高比特率将针对各个子带的所述基数设 置为较低值,并且针对整体较低比特率将针对各个子带的所述基数 设置为较高值。
6. 根据权利要求1所述的方法,其中所述第一因子包括基数和 指数,以及其中针对每个子带确定所述指数,使得所述已编码音频 信号的所述总比特率尽可能地接近于可用比特率,以及所有子带中 的整体错误率被最小化。
7. 根据权利要求1所述的方法,其中所述第一因子包括基数和 指数,以及其中至少从率-失真测量来确定所述指数。
8. 根据权利要求6所述的方法,进一步包括选择以下值作为针对每个子带的最优化的最小的所考虑的指数值其中aD是每个子带允许的失真,其从感知编码模式得出,并且 U表示整数部分、或者最接近于自变量的较小整数。
9. 根据权利要求7所述的方法,其中对针对每个子带的所述率-失真测量进行排序使得比特率增加。
10. 根据权利要求7所述的方法,进一步包括通过以下之一来初 始化一个搜索用于导致优化的指数的率-失真测量A) 由与所述最低错误率相对应的所述率-失真测量开始,所述最 低错误率等效于最高比特率,或者B) 由与针对所有子带小于1.0的错误率相对应的所述率-失真测 量开始。
11. 根据权利要求7所述的方法,其中所述率-失真测量是关于 每个子带所允许的失真的错误率,所述错误率通过以下的至少一个 来计算A) 从错误率定义计算实际错误率,或者B) 如果所述允许的失真测量大于在所述考虑的子带中的所述信 号的能量,则将所述错误率设置为零。
12. 根据权利要求1所述的方法,进一步包括使用熵编码对所述 第 一 因子的至少 一个分量进行编码。
13. 根据权利要求1所述的方法,进一步包括利用所述已定标子 带的所述概率函数,用于创建用于压缩扩展的累积密度函数。
14. 根据权利要求1所述的方法,进一步包括,在利用第三定标 因子量化之前对所述已压缩扩展的子带进行定标,其中所述第三定 标因子针对较高比特率比针对较低比特率较高。
15. 根据权利要求1所述的方法,使用矩形截断的格型用于对所 述已压缩扩展的、已定标的子带进行量化,所述量化导致用于每个 子带的码向量。
16. 根据权利要求15所述的方法,进一步包括针对每个子带计算用于包括所迷已量化子带的格型截断的范数,使用熵编码对针对 每个子带所计算的范数进行编码,以及通过索引对所述码向量进行编码。
17. —种编码器,包括-变换单元,适用于接收输入音频信号以及将所述输入音频信号划分为至少两个子带;-定标单元,适用于利用第一因子对至少两个子带进行定标; -压缩扩展单元,适用于对至少两个已定标的子带的每个进行压缩扩展;以及-量化单元,适用于对所述已压缩扩展的、已定标的子带进行量化。
18. —种电子设备,包括-变换单元,适用于接收输入音频信号以及将所述输入音频信号划分为至少两个子带;-定标单元,适用于利用第一因子对至少两个子带进行定标; -压缩扩展单元,适用于对至少两个已定标的子带的每个进行压缩扩展;以及-量化单元,适用于对所述已压缩扩展的、已定标的子带进行量化。
19. 一种软件程序产品,其中存储了用于音频编码的软件代码, 当由电子设备的处理单元执行时,所述软件代码实现以下步骤-接收输入音频信号;-将所述输入音频信号划分为至少两个子带;-利用第一因子对所述至少两个子带进行定标;-对所述至少两个已定标的子带的每个进行压缩扩展;以及-对所述已压缩扩展的、已定标的子带进行量化。
20. —种用于音频解码的方法,该方法包括 -接收已编码的音频数据,-从所述已编码的音频数据生成至少两个已压缩扩展的子带;-对每个已压缩扩展的子带进行解压缩扩展,-利用第一因子对所述至少两个已解压缩扩展的子带进行定标, 以及-将所述已解压缩扩展的和已定标的子带结合到已解码的音频 信号。
21. —种解码器,包括-解压缩扩展单元,适用于对至少两个已压缩扩展的子带进行解 压缩扩展,其中所述已压缩扩展的子带是从所接收的已编码音频数 据生成的;-定标单元,适用于利用第一因子对所述至少两个已解压缩扩展 的子带进行定标;以及-变换单元,适用于将所述已解压缩扩展和已定标的子带结合到 已解码的音频信号。
22. —种电子设备,包括-解压缩扩展单元,适用于对至少两个已压缩扩展的子带进行解 压缩扩展,其中所述已压缩扩展的子带是从所接收的已编码音频数 据生成的;-定标单元,适用于利用第一因子对所述至少两个已解压缩扩展 的子带进行定标;以及-变换单元,适用于将所述已解压缩扩展和已定标的子带结合到 已解码的音频信号。
23. —种软件程序产品,其中存储有用于音频解码的软件代码, 当由电子设备的处理单元执行时,所述软件代码实现以下步骤-接收已编码的音频数据,-从所述已编码的音频数据生成至少两个已压缩扩展的子带, -对每个已压缩扩展的子带进行解压缩扩展, -利用第 一 因子对所述至少两个已解压缩扩展的子带进行定标, 以及-将所述已解压缩扩展的和已定标的子带结合到已解码的音频信号。
24. —种包括用于对音频数据进行编码的编码器以及用于对已 编码音频数据进行解码的解码器的系统,所述编码器包括-变换单元,适用于接收输入音频信号以及将所述输入音频信号 划分为至少两个子带;-定标单元,适用于利用第一因子对至少两个子带进行定标;-压缩扩展单元,适用于对至少两个已定标的子带的每个进行压 缩扩展;以及-量化单元,适用于对已压缩扩展的、已定标的子带进行量化; 并且所述解码器包括-解压缩扩展单元,适用于对至少两个已压缩扩展的子带进行解 压缩扩展,其中所述已压缩扩展的子带是从所接收的已编码音频数 据生成的;隱定标单元,适用于利用所述第一因子对所述至少两个已解压缩 扩展的子带进行定标;以及-变换单元,适用于将所述已解压缩扩展和已定标的子带结合到 已解码的音频信号。
全文摘要
音频编码,通过以下步骤进行接收输入音频信号;将输入音频信号划分为至少两个子带;利用至少根据相应子带的标准差的因子来对所述至少两个子带进行下定标;对所述至少两个已下定标的子带的每个进行压缩扩展;以及利用格型量化器对所述已压缩扩展的、已定标的子带进行量化。
文档编号G10L19/00GK101292286SQ200680039020
公开日2008年10月22日 申请日期2006年10月9日 优先权日2005年10月21日
发明者A·瓦西拉切 申请人:诺基亚公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1