填充变换编码音频信号中的非编码子向量的制作方法

文档序号:2825352阅读:207来源:国知局
填充变换编码音频信号中的非编码子向量的制作方法
【专利摘要】一种用于填充变换编码音频信号的非编码残差子向量的频谱滤波器,包括子向量压缩器(42),被配置为压缩实际编码的残差子向量。子向量拒绝器(44)被配置为拒绝不满足预定的稀疏标准的压缩残差子向量。子向量收集器(46)被配置为级联剩余的压缩残差子向量以形成第一虚拟码本(VC1)。系数组合器(48)被配置为组合第一虚拟码本(VC1)的系数对以形成第二虚拟码本(VC2)。子向量填充器(50)被配置为使用来自第一虚拟码本(VC1)的系数填充在预定频率以下的非编码残差子向量,并且使用来自第二虚拟码本(VC2)的系数填充在预定频率以上的非编码残差子向量。
【专利说明】填充变换编码音频信号中的非编码子向量
【技术领域】
[0001]本技术涉及音频信号编码,具体地涉及填充变换编码音频信号中的非编码子向量。
【背景技术】
[0002]图1示出了典型的基于变换编码的编码器/解码器系统。
[0003]变换编码中的主要步骤是:
[0004]A、例如通过修正的离散余弦变换(MDCT)将短音频帧(20-40ms)变换到频域。
[0005]B、将MDCT向量X(k)划分到多个频带中(子向量SV1、SV2、……),如图2所示。通常,频带的宽度随着频率的增高而增加[I]。
[0006]C、计算每一个频带中的能量。这提供了频谱包络的近似,如图3所示。
[0007]D、量化频谱包络,并且将量化索引发送到解码器。
[0008]E、通过使用包络增益缩放MDCT向量来获得残差向量,例如,通过将MDCT子向量(SV1、SV2、……)缩放至单位均方根(RMS)能量来形成残差向量。
[0009]F、基于包络能量来指派用于量化不同残差子向量的比特。由于有限的比特预算,未向子向量中的一些指派任何比 特。在图4中示出了这一点,在图4中,未向与在阈值TH以下的包络增益相对应的子向量指派任何比特。
[0010]G、根据指派的比特来量化残差子向量,并且将量化索引发送到解码器。例如,可以使用阶乘脉冲编码(FPC)方案[2]来执行残差量化。
[0011]H、不对被指派零个比特的残差子向量进行编码,而是取而代之地在解码器处对被指派零个比特的残差子向量进行噪声填充。这一点是通过以级联解码频谱的感知相关系数的方式从编码子向量创建虚拟码本(VC)来实现的。VC创建非编码残差子向量中的内容。
[0012]1、在解码器处,通过使用相应的包络增益对残差子向量进行放大来重构MDCT向量,并且逆MDCT用于重构时域音频帧。
[0013]例如,如[I]中的传统的噪声填充方案的缺点是在于,当与FPC方案一起使用时,它在步骤H中在重构的音频信号中造成了可听的失真。

【发明内容】

[0014]总的目的是对变换编码音频信号的非编码残差子向量的改善的填充。
[0015]另一个目的是生成用于填充非编码残差子向量的虚拟码本。
[0016]根据所附权利要求实现这些目的。
[0017]本技术的第一方面涉及一种填充变换编码音频信号的非编码残差子向量的方法。该方法包括以下步骤:
[0018].压缩实际编码的残差子向量。
[0019].拒绝不满足预定的稀疏标准的压缩残差子向量。
[0020].级联剩余的压缩残差子向量以形成第一虚拟码本。[0021].组合所述第一虚拟码本的系数对以形成第二虚拟码本。
[0022].使用来自所述第一虚拟码本的系数来填充在预定频率以下的非编码残差子向量。
[0023].使用来自所述第二虚拟码本的系数来填充在预定频率以上的非编码残差子向量。
[0024]本技术的第二方面涉及一种生成用于填充变换编码音频信号中在预定频率以下的非编码残差子向量的虚拟码本的方法。所述方法包括以下步骤:
[0025].压缩实际编码的残差子向量。
[0026].拒绝不满足预定的稀疏标准的压缩残差子向量。
[0027].级联剩余的压缩残差子向量以形成所述虚拟码本。
[0028]本技术的第三方面涉及一种生成用于填充变换编码音频信号中在预定频率以上的非编码残差子向量的虚拟码本的方法。所述方法包括以下步骤:
[0029].根据第二方面所述生成第一虚拟码本。
[0030].组合所述第一虚拟码本的系数对。
[0031]本技术的第四方面涉及一种用于填充变换编码音频信号的非编码残差子向量的频谱填充器。所述频谱填充器包括:`
[0032].子向量压缩器,被配置为压缩实际编码的残差子向量。
[0033].子向量拒绝器,被配置为拒绝不满足预定的稀疏标准的压缩残差子向量。
[0034].子向量收集器,被配置为级联剩余的压缩残差子向量以形成第一虚拟码本。
[0035].系数组合器,被配置为组合所述第一虚拟码本的系数对以形成第二虚拟码本。
[0036].子向量填充器,被配置为使用来自所述第一虚拟码本的系数来填充在预定频率以下的非编码残差子向量,以及使用来自所述第二虚拟码本的系数来填充在预定频率以上的非编码残差子向量。
[0037]本技术的第五方面涉及一种解码器,包括根据第四方面所述的频谱填充器。
[0038]本技术的第六方面涉及一种用户设备,包括根据第五方面所述的解码器。
[0039]本技术的第七方面涉及一种用于生成用于填充变换编码音频信号中在预定频率以下的非编码残差子向量的低频虚拟码本的低频虚拟码本生成器。所述低频虚拟码本生成器包括:
[0040].子向量压缩器,被配置为压缩实际编码的残差子向量。
[0041].子向量拒绝器,被配置为拒绝不满足预定的稀疏标准的压缩残差子向量。
[0042].子向量收集器,被配置为级联剩余的压缩残差子向量以形成所述低频虚拟码本。
[0043]本技术的第八方面涉及一种用于生成用于填充变换编码音频信号中在预定频率以上的非编码残差子向量的高频虚拟码本的高频虚拟码本生成器。所述高频虚拟码本生成器包括:
[0044]?根据第七方面所述的被配置为生成低频虚拟码本的低频虚拟码本生成器。
[0045].系数组合器,被配置为组合所述低频虚拟码本的系数对以形成所述高频虚拟码本。
[0046]与传统的噪声填充相比,本频谱填充技术的优点是解码的音频信号的感知改进。【专利附图】

【附图说明】
[0047]通过参照结合附图给出的以下描述,可以最佳地理解本技术以及本技术的其它目的和优点,在附图中:
[0048]图1是示出了典型的基于变换的音频编码/解码系统的框图;
[0049]图2是示出了 MDCT向量的结构的示意图;
[0050]图3是示出了 MDCT向量的子向量的能量分布的示意图;
[0051]图4是示出了使用频谱包络来进行比特分配的示意图;
[0052]图5是示出了编码残差的示意图;
[0053]图6是示出了压缩编码残差的示意图;
[0054]图7是示出了拒绝编码残差子向量的示意图;
[0055]图8是示出了级联依然存在的残差子向量以形成第一虚拟码本的示意图;
[0056]图9A至图9B是示出了组合来自第一虚拟码本的系数以形成第二虚拟码本的示意图;
[0057]图10是示出了低频虚拟码本生成器的示例性实施例的框图;
[0058]图11是示出了高频虚 拟码本生成器的示例性实施例的框图;
[0059]图12是示出了频谱填充器的示例性实施例的框图;
[0060]图13是示出了包括频谱填充器的解码器的示例性实施例的框图;
[0061]图14是示出了低频虚拟码本生成的流程图;
[0062]图15是示出了高频虚拟码本生成的流程图;
[0063]图16是不出了频谱填充的流程图;
[0064]图17是示出了低频虚拟码本生成器的示例性实施例的框图;
[0065]图18是示出了高频虚拟码本生成器的示例性实施例的框图;
[0066]图19是示出了频谱填充器的示例性实施例的框图;以及
[0067]图20是示出了用户设备的示例性实施例的框图。
【具体实施方式】
[0068]在更详细地描述本技术之前,将参照图1至图7简短地描述基于变换的编码/解码。
[0069]图1是示出了典型的基于变换的音频编码/解码系统的框图。输入信号x(n)被转发给频率变换器,例如,MDCT变换器10,在该频率变换器处,短音频帧(20-40ms)被转换到频域。由此产生的频域信号X(k)被划分到多个频带中(子向量SV1、SV2、……),如图2所示。通常,频带的宽度随着频率的增高而增加[I]。在包络计算器和量化器12中确定每一个频带的能量。这提供了频谱包络的近似,如图3所示。在子向量归一化器14中,通过使用相应的量化包络值(增益)的倒数进行缩放来将每一个子向量归一化为残差子向量。
[0070]比特分配器16基于包络能量指派用于量化不同残差子向量的比特。由于有限的比特预算,因此未向子向量中的一些指派任何比特。在图4中示出了这一点,在图4中,未向与在阈值TH以下的包络增益相对应的子向量指派任何比特。在子向量量化器18中根据指派的比特来量化残差子向量。例如,可以使用阶乘脉冲编码(FPC)方案[2]来执行残差量化。然后,通过复用器(MUX) 20将残差子向量量化索引和包络量化索引发送到解码器。[0071]在解码器处,在解复用器(DEMUX)22中将接收的比特流解复用为残差子向量量化索引和包络量化索引。在子向量解量化器24中将残差子向量量化索引解量化为残差子向量,并且在包络解量化器26中将包络量化索引解量化为包络增益。比特分配器28使用包络增益来控制残差子向量解量化。
[0072]在编码器处不对被指派零个比特的残差子向量进行编码,而是取而代之地在解码器处由噪声填充器30对被指派零个比特的残差子向量进行噪声填充。这一点是通过以级联解码频谱的感知相关的系数的方式根据编码子向量创建虚拟码本(VC)来实现的([I]的部分8.4.1)。因此,VC创建非编码残差子向量中的内容。
[0073]在解码器处,然后通过在包络成形器32中使用相应的包络增益放大残差子向量并且在逆MDCT变换器34中对由此产生的频域向量进行变换,以重构MDCT向量
[0074]上文所描述的传统的噪声填充方案的缺点在于,当与FPC方案一起使用时,它在重构的音频信号中造成了可听的失真。主要原因是编码向量中的一些可能过于稀疏,这在噪声填充的频带中造成了能量失配的问题。此外,编码向量中的一些可能包含过多结构(颜色),当在高频执行噪声填充时,这导致感知下降。
[0075]下面的描述将集中于上面的步骤H中的虚拟码本生成的改进过程的实施例。
[0076]如图6所示,根据下式来压缩或量化图5中所示的编码残差夕:
[0077]
【权利要求】
1.一种填充变换编码音频信号的非编码残差子向量的方法,所述方法包括以下步骤: 压缩(Si)实际编码的残差子向量; 拒绝(S2)不满足预定的稀疏标准的压缩残差子向量; 级联(S3)剩余的压缩残差子向量以形成第一虚拟码本VCl ; 组合(S4)所述第一虚拟码本VCl的系数对以形成第二虚拟码本VC2 ; 使用来自所述第一虚拟码本VCl的系数来填充(S5)在预定频率以下的非编码残差子向量;以及 使用来自所述第二虚拟码本的系数来填充(S6)在所述预定频率以上的非编码残差子向量。
2.根据权利要求1所述的方法,其中,根据下式来压缩(SI)实际编码的残差子向量的分量

3.根据权利要求1或2所述的方法,其中,拒绝(S2)具有少于预定百分比的非零分量的压缩残差子向量。
4.根据权利要求1、2或3所述的方法,其中,根据下式组合(S3)所述第一虚拟码本VCl的系数对Y (k):
5.根据权利要求1、2、3或4所述的方法,包括以下步骤:调整(S7)填充的非编码残差子向量的能量,以获得感知衰减。
6.一种生成虚拟码本VCl的方法,所述虚拟码本VCl用于填充变换编码音频信号中在预定频率以下的非编码残差子向量,所述方法包括以下步骤: 压缩(Si)实际编码的残差子向量; 拒绝(S2)不满足预定的稀疏标准的压缩残差子向量; 级联(S3)剩余的压缩残差子向量以形成所述虚拟码本VC1。
7.—种生成虚拟码本VC2的方法,所述虚拟码本VC2用于填充变换编码音频信号中在预定频率以上的非编码残差子向量,所述方法包括以下步骤: 根据权利要求6生成(S1-S3)第一虚拟码本VCl ; 组合(S4)所述第一虚拟码本VCl的系数对。
8.一种用于填充变换编码音频信号的非编码残差子向量的频谱填充器(40),所述频谱填充器包括: 子向量压缩器(42),被配置为压缩实际编码的残差子向量;子向量拒绝器(44),被配置为拒绝不满足预定的稀疏标准的压缩残差子向量; 子向量收集器(46),被配置为级联剩余的压缩残差子向量以形成第一虚拟码本VCl ; 系数组合器(48),被配置为组合所述第一虚拟码本VCl的系数对以形成第二虚拟码本VC2 ; 子向量填充器(50),被配置为使用来自所述第一虚拟码本VCl的系数来填充在预定频率以下的非编码残差子向量,以及使用来自所述第二虚拟码本VC2的系数来填充在预定频率以上的非编码残差子向量。
9.根据权利要求8所述的频谱填充器,其中,所述子向量压缩器(42)被配置为根据下式来压缩实际编码的残差子向量的分量文:
10.根据权利要求8或9所述的频谱填充器,其中,所述子向量拒绝器(44)被配置为拒绝具有少于预定百分比的非零分量的压缩残差子向量。
11.根据权利要求8、9或10所述的频谱填充器,其中,所述系数组合器(48)被配置为根据下式组合所述第一虚拟码本VCl的系数对Y (k):
12.根据权利要求8、9、10或11所述的频谱填充器,包括能量调整器(52),所述能量调整器(52)被配置为调整填充的非编码残差子向量的能量以获得感知衰减。
13.—种解码器(300),包括根据前述权利要求8至12中任意一项所述的频谱填充器(40)。
14.一种用户设备UE,包括根据权利要求13所述的解码器。
15.一种低频虚拟码本生成器(60),用于生成用于填充变换编码音频信号中在预定频率以下的非编码残差子向量的低频虚拟码本,所述生成器包括: 子向量压缩器(42),被配置为压缩实际编码的残差子向量; 子向量拒绝器(44),被配置为拒绝不满足预定的稀疏标准的压缩残差子向量; 子向量收集器(46),被配置为级联剩余的压缩残差子向量以形成所述低频虚拟码本VCl。
16.一种高频虚拟码本生成器(70),用于生成用于填充变换编码音频信号中在预定频率以上的非编码残差子向量的高频虚拟码本,所述生成器包括: 根据权利要求15所述的被配置为生成低频虚拟码本VCl的低频虚拟码本生成器(60); 系数组合器(48),被配置为组合所述低频虚拟码本VCl的系数对以形成所述高频虚拟码本VC2。
【文档编号】G10L19/028GK103503063SQ201180070735
【公开日】2014年1月8日 申请日期:2011年9月14日 优先权日:2011年3月10日
【发明者】沃洛佳·格兰恰诺夫, 塞巴斯蒂安·内斯隆德, 西德格尔·思维里森 申请人:瑞典爱立信有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1