用于可伸缩声道解码的方法、介质和设备的制作方法

文档序号:2830408阅读:115来源:国知局
专利名称:用于可伸缩声道解码的方法、介质和设备的制作方法
技术领域
本申请要求2006年1月11日提交到美国专利商标局的第60/757,857号美国临时专利申请、2006年1月17日提交到美国专利商标局的第60/758,985号美国临时专利申请、2006年1月18日提交到美国专利商标局的第60/759,543号美国临时专利申请、2006年4月5日提交到美国专利商标局的第60/789,147号美国临时专利申请、2006年4月6日提交到美国专利商标局的第60/789,601号美国临时专利申请以及在2006年5月30日提交到韩国知识产权局的第10-2006-0049033号韩国专利申请的利益,这些申请全部公开于此以资参考。
本发明的一个或多个实施例涉及音频解码,更具体地讲,涉及用于对多声道信号进行编码/解码的环绕音频编码。

背景技术
发明的公开 技术问题 多声道音频编码可被分类为波形多声道音频编码和参数多声道音频编码。波形多声道音频编码可被分类为运动图像专家组(MPEG)-2MC音频编码、AAC MC音频编码和BSAC/AVS MC音频编码,其中,对5声道信号进行编码并对5声道信号进行解码。参数多声道音频编码包括MPEG环绕编码,其中,所述编码方案从6或8多声道产生1或2个编码的声道,然后从所述1或2个编码的声道解码为所述6或8多声道。这里的6或8多声道只是这种多声道环境的示例。
通常,在这种多声道音频编码中,将从解码器输出的声道的数量由编码器固定。例如,在MPEG环绕编码中,编码器可将6或8多声道信号编码为1或2个编码的声道,而解码器必须将所述1或2个编码的声道解码为6或8多声道,即,由于编码器对多声道信号进行编码的分级,在输出任何具体声道之前以相似的相反顺序的分级对所有可用声道进行解码。因此,如果在解码器中将被用于再现的扬声器的数量和与扬声器的位置相应的声道配置与在编码器中构造的声道的数量不同,则在解码器的上混合(up mix)期间,声音的质量将会降低。
根据MPEG环绕规范,可通过下混合模块的分级来对多声道信号进行编码,所述下混合模块可最终将多声道信号顺序地下混合为一个或两个编码的声道。通过上混合模块的相似的分级(树结构),所述一个或两个编码的声道可被解码为多声道信号。这里,例如,上混合分级开始接收编码的下混合信号,并使用1至2(OTT)上混合模块的结合,将编码的下混合信号上混合为左前(FL)声道、右前(FR)声道、中央(C)声道、低频增强(LFE)声道、左后(BL)声道和右后(BR)声道的多声道信号。这里,可以用编码器在对多声道信号进行编码期间产生的声道等级差(Channel Level Difference,CLD)和/或声道间的相关性(Inter-Channel Correlation,ICC)的空间信息(空间暗示)来实现OTT模块的分级的上混合,其中,CLD是关于多声道中的预定声道之间的能量比或差的信息,ICC是关于与输入的信号的时间/频率瓦(tile)相应的相关性或一致性的信息。利用各个CLD和ICC,每个分级的OTT可将单个输入信号上混合为通过每个分级的OTT的各个输出信号。请参见作为根据本发明实施例的分级的上混合树结构的示例的图4到图8。
因此,由于要求解码器必须具有反映编码器的分级的特定分级的结构,并且由于下混合的传统顺序,难于基于解码器中的将被用于再现的扬声器的数量和与扬声器的位置对应的相应的声道配置有选择地对编码的声道进行解码。
技术方案 本发明的一个或多个实施例阐述了一种用于可伸缩声道解码的方法、介质和设备,其中,识别解码器中声道或扬声器的配置以对每个通过编码器编码的多声道信号计算将被解码的等级的数量,并根据计算的等级的数量执行解码。
将在下面的描述中部分地阐述本发明的另外方面和/或优点,部分地,从下面的描述中,这些方面和/或优点将会清楚,或者通过实施本发明而被了解。
为了至少实现上述和/或其他方面和优点,本发明的实施例包括用于可伸缩信道解码的方法,所述方法包括对于至少一个编码的多声道信号设置解码等级的数量;根据设置的解码等级的数量来对所述至少一个编码的多声道信号执行有选择的解码和上混合;从而当设置的解码等级的数量被设置为表示解码等级的全部数量时,所述至少一个编码的多声道信号的所有等级被解码和上混合,当设置的解码等级的数量被设置为表示解码等级的数量不同于解码等级的全部数量时,并非所述至少一个编码的多声道信号的可用的所有解码等级被解码和上混合。
为了至少实现上述和/或其他方面和优点,本发明的实施例包括至少一种包括控制至少一种处理部件以实现本发明实施例的计算机可读代码的介质。
为了至少实现上述和/或其他方面和优点,本发明的实施例包括一种用于可伸缩声道解码的设备,所述设备包括等级设置单元,对于至少一个编码的多声道信号设置解码等级的数量;上混合单元,根据设置的解码等级的数量来对所述至少一个编码的多声道信号执行有选择的解码和上混合;从而当设置的解码等级的数量被设置为表示解码等级的全部数量时,所述至少一个编码的多声道信号的所有等级被解码和上混合,当设置的解码等级的数量被设置为表示解码等级的数量不同于解码等级的全部数量时,并非所述至少一个编码的多声道信号的可用的所有解码等级被解码和上混合。
为了至少实现上述和/或其他方面和优点,本发明的实施例包括一种用于可伸缩声道解码的方法,所述方法包括识别解码器的声道或扬声器的配置;有选择地将至少一个下混合的编码的多声道信号上混合为与识别的声道或扬声器的配置相应的多声道信号。
为了至少实现上述和/或其他方面和优点,本发明的实施例包括一种用于可伸缩声道解码的方法,所述方法包括识别解码器的声道或扬声器的配置;基于识别的声道或扬声器的配置来设置使从至少一个下混合的编码的多声道信号上混合的各个上混合信号通过的模块的数量;根据设置的模块的数量来对所述至少一个下混合的编码的多声道信号进行有选择的解码和上混合。
为了至少实现上述和/或其他方面和优点,本发明的实施例包括一种用于可伸缩声道解码的方法,所述方法包括识别解码器的声道或扬声器的配置;基于通过解码器再现声道的可用性来确定是否对由至少一个下混合的编码的多声道信号表示的多个声道的声道进行解码;确定除了由确定是否对声道进行解码的步骤被确定为不被解码的多声道之外是否存在将以相同路径被解码的多声道;根据确定除了被确定为不被解码的多声道之外是否存在以相同路径被解码的多声道的步骤,计算每个多声道信号必须通过的解码和上混合模块的数量;根据计算的解码和上混合模块的数量来执行有选择的解码和上混合。
有益效果


从下面结合附图对实施例的描述中,本发明的这些和/或其他方面和优点将变得清楚,并更容易理解,其中 图1示出根据本发明实施例的多声道解码方法; 图2示出根据本发明实施例的用于可伸缩解码的设备; 图3示出根据本发明实施例的5-2-5树结构和任意树结构的复杂结构; 图4示出根据本发明实施例的用于解释用于可伸缩声道解码的方法、介质和设备的预定的树结构; 图5示出根据本发明实施例的在5-1-51树结构中输出的4声道; 图6示出根据本发明实施例的在5-1-52树结构中输出的4声道; 图7示出根据本发明实施例的在5-1-51树结构中输出的3声道; 图8示出根据本发明实施例的在5-1-52树结构中输出的3声道; 图9示出使用根据本发明实施例的用于可伸缩声道解码的方法、介质和设备来设置Treesign(v,)的伪代码; 图10示出使用根据本发明实施例的用于可伸缩声道解码的方法、介质和设备去除与不必要的模块相应的矩阵或向量的元素的伪代码。
最佳方式 发明的方式 现在将对本发明实施例进行详细描述,本发明的示例在附图中示出,其中,相同的标号始终表示相同的部件。下面将参照附图来描述实施例以解释本发明。
图1示出根据本发明实施例的多声道解码方法。
首先,在操作100中,解析从编码器发送的环绕比特流以提取空间暗示和附加信息。在操作103,识别在解码器中提供的声道或扬声器的配置。这里,解码器中多声道的配置对应于包括在解码器中/可用于解码器的扬声器的数量(下面称作“numPlayChan”)、包括在解码器中/可用于解码器的扬声器中的可操作扬声器的位置(下面被称作“playChanPos(ch)”)和指示在编码器中编码的声道是否可用于在解码器中提供的多声道的向量(下面称作“bPlaySpk(ch)”)。
这里,例如,在下面所述的等式1中,bPlaySpk(ch)使用“1”表示在编码器中编码的声道中可用于解码器中提供的多声道的扬声器,使用“0”表示不可用于所述多声道的扬声器。
等式1
其中,0≤i≤numOutChanAT 相似地,可以用下面的等式2来计算引用的numOutChanAT。
等式2 此外,例如,可使用等式3将引用的playChanPos表示为5.1声道系统。
等式3 playChanPos=[FL FRC LFE BL BR] 在操作106,例如,可确定不对多声道中不可用的声道进行解码。
例如,如图3到图8所示的树结构中,矩阵Treesign(v,)可包括如下所述的元素,所述元素指示每个输出信号是否被输出到上级OTT模块(在这种情况下,用“1”表示元素)或者每个输出的信号是否被输出到下级OTT模块(在这种情况下,用“-1”表示元素)。在矩阵Treesign(v,)中,v大于0并小于numOutChan。下面,将使用矩阵Treesign(v,)来描述本发明的实施例,但是,本领域的技术人员应该理解,在不限于矩阵Treesign(v,)的情况下,也可实现本发明的实施例。例如,可使用通过交换矩阵Treesign(v,)的行和列而获得的矩阵,注意,可等同地利用实现本发明的替换方法。
例如,在图4所示的树结构中,在矩阵Treesign中,将被输出到来自Box0的上级、来自Box 1的上级和来自Box 2的上级的第一列被表示为[1,1,1],将被输出到来自Box 0的下级和来自Box 3的上级的第四列被表示为[-1,1,n/a]。这里,“n/a”是表示相应的声道、模块或盒子(box)不可用的标识符。这样,可用如下所示的Treesign来表示所有多声道。
在操作106,在编码器中编码的声道中与不可用于解码器中提供的多声道的声道相应的列在矩阵Treesign(v,)中均被设置为“n/a”。
例如,在图4所示的树结构中,指示在编码器中编码的声道是否可用于解码器中提供的多声道的向量bPlaySpk在第二声道和第四声道中用“0”表示。因此,在解码器中提供的多声道中的第二声道和第四声道不可用于在解码器中提供的多声道。因此,在操作106中,在矩阵Treesign中,与第二声道和第四声道相应的第二列和第四列被设置为n/a,从而产生Tree’sign。
在操作108,确定除了在操作106中确定不被解码的声道之外,是否存在将以相同路径被解码的多声道。在操作108,假定在操作106中设置的矩阵Treesign(v,i,j)中,预定的整数j和k互不相等,确定Treesign(v,0:i-1,j)和Treesign(v,0:i-1,k)是否相同以确定是否存在将以相同路径被解码的多声道。
例如,在图4所示的树结构中,由于Treesign(v,0:1,1)和Treesign(v,0:1,3)彼此不相等,所以在操作106中产生的矩阵Tree’sign中的第一声道和第三声道在操作108中被确定为不以相同的路径被解码的多声道。然而,由于Treesign(v,0:1,5)和Treesign(v,0:1,6)彼此相同,所以在操作106中产生的矩阵Tree’sign中的第五声道和第六声道在操作108中被确定为将以相同路径被解码的多声道。
在操作110,对于在操作108中被确定为不以相同路径被解码的多声道的声道减少解码等级(level)。这里,解码等级表示与OTT模块或TTT模块类似的用于解码的模块或盒子的数量,信号必须通过所述模块或盒子以从多声道中的每个声道输出。对于在操作108中被确定为不以相同路径被解码的多声道的声道,最终确定的解码等级被表示为n/a。
例如,在图4所示的树结构中,由于第一声道和第三声道在操作108中被确定为不以相同路径被解码的多声道,所以如下所示将与第一声道相应的第一列的最后行和与第三声道相应的第三列的最后行设置为n/a。
在逐一减小解码等级时,可重复操作108和110。因此,可从Tree’sign(v)的最后行到第一行逐行重复操作108和110。
在操作106到110中,如图9所示,可使用伪代码为每个子树设置Treesign(v,)。
在操作113,使用在操作110中获得的结果,可对多声道中的每个声道计算解码等级的数量。
可根据等式4计算解码等级的数量。
等式4 其中,

其中,0≤i<TreeoutChan(v),0≤v<numOutChan,abs(n/a)=0,
例如,在图4所示的树结构中,可如下所述来计算在操作110中设置的矩阵Tree’sign的解码等级的数量 DL=[2-1 2-1 3 3] 由于n/a的绝对值被假定为0,并且元素都是n/a的列被假定为-1,所以矩阵Tree’sign中的第一列的元素的绝对值的和是2,在矩阵Tree’sign中元素都是n/a的第二列被设置为-1。
通过使用如上所述计算的DL,在图4示出的虚线之前的模块执行解码,从而实现可伸缩解码。
在操作116,在操作100中提取的空间暗示可有选择地被平滑以防止在低比特率下空间暗示的急剧改变。
在操作119,为了与传统矩阵环绕技术兼容,可对于每个附加声道计算增益和预向量(pre-vector),并且在解码器中使用外部下混合的情况下,可提取用于补偿每个声道的增益的参数,从而产生矩阵R1。矩阵R1用于产生将被输入到用于去相关的去相关器的信号。
例如,在本实施例中,假定如图5所示的5-1-51树结构和如图6所示的5-1-52树结构被设置为下面的矩阵。
Treedepth(0,)=[3 3 3 3 2 2], TreeoutChan(0)=[6]. 在这种情况下,在5-1-51树结构中,在操作119中,可如下所示来计算R1。
其中
其中 和 其中 在这种情况下,在5-1-52树结构中,在操作119中,可如下所示来计算R1。
其中
,其中 和 其中 在操作120,对在操作119中产生的矩阵R1进行插值以产生矩阵M1。
在操作123,可产生用于将去相关的信号与直接信号(direct signal)混合的矩阵R2。为了使在操作106至操作113中被确定为不必要的模块的模块不执行解码,如图10所示,在操作123中产生的矩阵R2使用伪代码去除与不必要的模块相应的矩阵或向量的元素。
下面,将描述应用到5-1-51树结构和5-1-52树结构的示例。
首先,图5示出在5-1-51树结构中只输出4个声道的情况。如果对图5所示的5-1-51树结构执行操作103至操作113,则如下所示产生Tree’sign(0,,)和DL(0,) DL(0,)=[3 3 2-1 1-1]. 通过产生的DL(0,)在示出的虚线之前的模块中停止解码。因此,由于OTT2和OTT4不执行上混合,所以可在操作126中如下所示来产生矩阵R2。
其次,图6示出在5-1-52树结构中只输出4声道的情况。如果对于图6示出的5-1-52树结构执行操作103至113,则如下所示产生Tree’sign(0,,)和DL(0,) DL(0,)=[3 3 3 3 -1 -1]. 因此,通过产生的DL(0,)在虚线之前的模块中停止解码。
图7示出在5-1-51树结构中只输出3声道的情况。在这种情况下,在执行了操作103至操作113之后,如下所示产生Tree’sign(0,,)和DL(0,) DL(0,)=[3 3 2 -1 -1 -1]. 因此,通过产生的DL(0,)在虚线之前的模块中停止解码。
图8示出在5-1-52树结构中只输出3声道的情况。在这种情况下,在执行了操作103至操作113之后,如下所示产生Tree’sign(0,,)和DL(0,) DL(0,)=[2 -1 2 -1 1 -1]. 这里,通过产生的DL(0,)在虚线之前的模块中停止解码。
对于5-2-5树结构、7-2-71树结构和7-2-72树结构的示例性应用,也可定义相应的Treesign和Treedepth。
首先,在5-2-5树结构中,可如下所示定义Treesign、Treedepth和R1 Treesign(0,,)=Treesign(1,,)=Treesign(2,,)=[1 -1], Treedepth(0,)=Treedepth(1,)=Treedepth(2,)=[1 1]. 当时, 其中,3≤i<6,0≤j<3 其次,在7-2-71树结构中,可如下所示定义Treesign、Treedepth和R1 Treesign(2,,)=[1 -1] Treedepth(0,)=Treedepth(1,)=[2 2 1] Treedepth(2,)=[1 1] 当时, 其中,·3≤i<5,0≤j<3 当时, 其中,0≤j<3 当时, 其中,6≤i<8,0≤j<3 其中,对于7-2-71结构,t1=0,t2=1;对于7-2-72结构,t1=1,t2=2再次,在7-2-71树结构中,可如下所示定义Treesign、Treedepth和R1 Treesign(2,,)=[1 -1] Treedepth(0,)=Treedepth(1,)=[1 2 2],| Treedepth(2,)=[1 1] 当时, 其中,3≤i<5,0≤j<3 当时, 其中,0≤j<3 当时, 其中,6≤i<8,0≤j<3 其中,对于7-2-71结构,t1=0,t2=1;对于7-2-72结构,t1=1,t2=2 5-2-5树结构和7-2-7树结构中的每一个都可以被划分为三个子树。因此,在操作123中,可使用与应用到5-1-5树结构的技术相同的技术获得矩阵R2。
在操作126,可对在操作123中产生的矩阵R2进行插值以产生矩阵M2。
在操作129,可以对通过在编码器中使用ACC对下混合的信号和原始信号进行编码而获得的其余编码的信号进行解码。
在操作130,在操作129中解码的MDCT系数可进一步被转换到QMF域。
在操作133,可对在操作130中输出的信号执行帧之间的叠加(overlap-add)。
此外,由于只使用QMF滤波器组低频带信号具有低频率分辨率,所以可在操作136中对低频带信号执行附加滤波以提高频率分辨率。
此外,在操作140,可使用QMF混合分析滤波器组根据频带来分离输入信号。
在操作143,可使用在操作120中产生的矩阵M1来产生直接信号和将被去相关的信号。
在操作146,可以对产生的将被去相关的信号执行去相关,从而可重构产生的信号以具有空间感。
在操作148,在操作126中产生的矩阵M2可被应用到在操作146中去相关的信号和在操作143中产生的直接信号。
在操作150,时间包络线整形(temporal envelope shaping,TES)可被应用到在操作148中应用了矩阵M2的信号。
在操作153,可使用QMF混合综合滤波器组来将在操作150中应用了TES的信号转换到时域。
在操作156,时间处理(TP)可被应用到在操作153中转换的信号。
这里,可执行操作153和156以提高时间结构很重要的信号(比如掌声)的声音质量,也可有选择地执行操作153和156。
在操作158,可将直接信号与去相关的信号进行混合。
因此,可使用下面的等式来计算矩阵R3,并将R3应用到任意树结构。

其中,0≤i<TreeoutChan(v),0≤v<numOutChan (如果ioffset(v)≤i<ioffset(v)+TreeoutChan(v,), Treedepth(v,i-ioffset(v))>0) 1(如果Treedepth(v,i-ioffset(v))=0) 0(其他) 其中,0≤i<numChanOutAt并且0≤v<numOutChan,其中,
其中,
其中,并且 其中, 其中, 图2是示出根据本发明实施例的具有可伸缩声道解码的设备。
比特流解码器200可解析从编码器发送的环绕比特流以提取空间暗示和附加信息。
与上述相似,配置识别单元230可识别解码中提供的/可用于解码器的声道或扬声器的配置。解码器中多声道的配置对应于包括在解码器中的/可用于解码器的扬声器的数量(即上述的numPlayChan)、包括在解码器中的/可用于解码器的扬声器中的可操作扬声器的位置(即上述的playChanPos(Ch))和指示在编码器中编码的声道是否可用于在解码器中提供的多声道的向量(即上述的bPlaySpk(ch))。
这里,根据下面将重复的上述等式1,bPlaySpk(ch)使用“1”表示在编码器中编码的声道中可用于在解码器中提供的多声道的声道,使用“0”表示在编码器中编码的声道中不可用于所述多声道的声道。
等式1
其中,0≤i≤numOutChanAT 再次,可根据下面将重复的上述等式2计算引用的numOutChanAT。
等式2 相似地,根据下面将重复的上述等式3,引用的playChanPos可以表示为例如5.1声道系统。
等式3 playChanPos=[FL FR C LFE BL BR] 例如,等级计算单元235可使用由配置识别单元230识别的多声道的配置计算每个多声道信号的解码等级的数量。这里,例如,等级计算单元235可包括解码确定单元240和第一计算单元250。
解码确定单元240可使用配置识别单元230的识别结果来确定不对在编码器编码的声道中(例如)不可用于多声道的声道解码。
因此,例如,如图3到图8所示的树结构中,上述矩阵Treesign(v,)可包括指示每个输出信号是否被输出到上级OTT模块(在这种情况下,元素用“1”表示)或每个输出信号是否被输出到下级OTT模块(在这种情况下,元素用“-1”表示)的元素。在矩阵Treesign(v,)中,v大于0并小于numOutChan。如上所述,使用矩阵Treesign(v,)来描述本发明的实施例,但是本领域的技术人员应该理解,在不限于矩阵Treesign(v,)的情况下,可实现本发明的实施例。例如,同样可以使用通过交换矩阵Treesign(v,)的行和列而获得的矩阵。
再次,作为示例,在图4所示的树结构中,在矩阵Treesign中,将被输出到来自Box 0的上级、来自Box 1的上级和来自Box 2的上级的第一列被表示为[1,1,1],将被输出到来自Box 0的下级和来自Box 3的上级的第四列被表示为[-1,1,n/a]。这里,“n/a”是表示相应的声道、模块或盒子(box)不可用的标识符。以这种方式,可用Treesign如下所示来表示所有多声道。
因此,解码确定单元240可以在Treesign中将在编码器中编码的声道中的与不可用于例如在解码器中提供的多声道的声道相应的列设置为“n/a”。
例如,在图4所示的树结构中,指示在编码器中编码的声道是否可用于解码器中提供的多声道的向量bPlaySpk在第二声道和第四声道中用“0”表示。因此,在解码器中提供的多声道中的第二声道和第四声道不可用于在解码器中提供的多声道。因此,解码确定单元240可在矩阵Treesign中将与第二声道和第四声道相应的第二列和第四列设置为n/a,从而产生Tree’sign。
除了解码确定单元240确定的不被解码的声道之外,第一计算单元250可进一步确定是否存在将以相同路径被解码的多声道,(例如)以计算解码等级的数量。这里,解码等级表示与OTT模块或TTT模块类似的用于解码的模块或盒子的数量,信号必须通过所述模块或盒子以从多声道中的每个声道输出。
因此,例如,第一计算单元250可以包括路径确定单元252、等级减小单元254和第二计算单元256。
路径确定单元252可确定除了被解码确定单元240确定不被解码的声道之外,是否存在将以相同路径解码的多声道。假定在解码确定单元240设置的矩阵Treesign(v,i,j)中预定的整数j和k互不相等,路径确定单元252确定Treesign(v,0i-1,j)和Treesign(v,0i-1,k)是否相同以确定是否存在将以相同路径被解码的多声道。
例如,在图4所示的树结构中,由于Treesign(v,01,1)和Treesign(v,01,3)不相同,所以路径确定单元252可将矩阵Tree’sign中的第一声道和第三声道确定为不以相同的路径被解码的多声道。然而,由于Treesign(v,01,5)和Treesign(v,01,6)相同,所以路径确定单元252可将矩阵Tree’sign中的第五声道和第六声道确定为将以相同路径被解码的多声道。
对于例如被路径确定单元252确定为不以相同路径被解码的多声道的声道,等级减小单元254可减小解码等级。这里,解码等级表示与OTT模块或TTT模块类似的用于解码的模块或盒子的数量,信号必须通过所述模块或盒子以从多声道中的每个声道输出。对于被确定为不以相同路径被解码的多声道的声道,(例如)由路径确定单元252最终确定的解码等级被表示为n/a。
再次,例如,在图4所示的树结构中,由于第一声道和第三声道被确定为不以相同路径被解码的多声道,所以如下所示将与第一声道相应的第一列的最后行和与第三声道相应的第三列的最后行设置为n/a 因此,例如,在逐一减小解码等级时,路径确定单元252和等级减小单元254可重复操作。因此,例如,路径确定单元252和等级减小单元254可从Treesign(v,)的最后行到第一行逐行重复操作。
如图9所示,等级计算单元235使用伪代码为每个子树设置Treesign(v,)。
此外,第二计算单元256可(例如)使用等级减小单元254获得的结果,对多声道中的每个声道计算解码等级的数量。这里,第二计算单元256可如下面重复的上面所讨论那样,来计算解码等级的数量 其中,

其中,0≤i<TreeoutChan(v),0≤v<numOutChan,abs(n/a)=0,
例如,在图4所示的树结构中,等级减小单元254可设置矩阵Tree’sign的解码等级的数量,并根据下述重复的内容来计算解码等级的数量 DL=[2 -1 2 -1 3 3] 在本实施例中,由于n/a的绝对值可被假定为0,并且元素都是n/a的列被假定为-1,所以矩阵Tree’sign中的第一列的元素的绝对值的和是2,在矩阵Tree’sign中元素都是n/a的第二列被设置为-1。
通过使用如上所述计算的上述DL,在图4示出的虚线之前的模块可执行解码,从而实现可伸缩解码。
例如,控制单元260可使用通过第二计算单元256计算的解码等级来控制上述矩阵R1、R2和R3的产生以使不必要的模块不执行解码。
平滑单元202可有选择地对例如由比特流解码器200提取的空间暗示进行平滑,以防止在低比特率下空间暗示的急剧改变。
为了与传统矩阵环绕技术兼容,矩阵元素计算单元204可对于每个附加声道计算增益。
预向量计算单元206可进一步计算预向量。
任意下混合增益提取单元208可在解码器中使用外部下混合的情况下,提取用于补偿每个声道的增益的参数。
例如,矩阵产生单元212可使用从矩阵元素计算单元204、预向量计算单元206和任意下混合增益提取单元208输出的结果来产生矩阵R1。矩阵R1可用于产生将被输入到用于去相关的去相关器的信号。
再次,作为示例,图5所示的5-1-51树结构和图6所示的5-1-52树结构可被设置为下面重复的上述矩阵。
Treedepth(0,)=[3 3 3 3 2 2], TreeoutChan(0)=[6]. 在这种情况下,在5-1-51树结构中,例如,矩阵产生单元212可产生下面重复的上述矩阵R1。
其中
其中 和 其中 在这种情况下,在5-1-52树结构中,矩阵产生单元212可如下所示再次产生矩阵R1 其中
,其中 和 其中 插值单元214可对(例如)由矩阵产生单元212产生的矩阵R1进行插值以产生矩阵M1。
混合向量计算单元210可产生用于将去相关的信号与直接信号混合的矩阵R2。
如图10所示,由混合向量计算单元210产生的矩阵R2使用上述伪代码去除与(例如)被等级计算单元235确定的不必要的模块相应的矩阵或向量的元素。
插值单元215可对由混合向量计算单元210产生的矩阵R2进行插值以产生矩阵M2。
与上面相似,将再次描述应用到5-1-51树结构和5-1-52树结构的示例。
首先,图5示出在5-1-51树结构中只输出4个声道的情况。这里,等级计算单元235可如下所示来产生Tree’sign(0,,)和DL(0,) DL(0,)=[3 3 2 -1 1 -1]. 可通过产生的DL(0,)在虚线之前的模块中停止解码。因此,由于OTT2和OTT4不执行上混合,所以,例如混合向量计算单元210可如下所示来产生矩阵R2 其次,图6示出在5-1-52树结构中只输出4声道的情况。等级计算单元235可如下所示来产生Tree’sign(0,,)和DL(0,) DL(0,)=[3 3 3 3 -1 -1]. 通过产生的DL(0,)在虚线之前的模块中停止解码。
图7示出在5-1-51树结构中只能输出3声道的情况。这里,等级计算单元235如下所示来产生Tree’sign(0,,)和DL(0,)。
DL(0,)=[3 3 2 -1 -1 -1]. 这里,可通过产生的DL(0,)在虚线之前的模块中停止解码。
图8示出在5-1-52树结构中只输出3声道的情况。这里,等级计算单元235可如下所示来产生Tree’sign(0,,)和DL(0,)。
DL(0,)=[2 -1 2 -1 1 -1]. 这里,可通过产生的DL(0,)在虚线之前的模块中停止解码。
对于5-2-5树结构、7-2-71树结构和7-2-72树结构的上述示例性应用,也可定义相应的Treesign和Treedepth。
首先,在5-2-5树结构中,可如下所示定义Treesign、Treedepth和R1 Treesign(0,,)=Treesign(1,,)=Treesign(2,,)=[1 -1], Treedepth(0,)=Treedepth(1,)=Treedepth(2,)=[1 1]. 当时, 其中,3≤i<6,0≤j<3 其次,在7-2-71树结构中,可如下所示定义Treesign、Treedepth和R1 Treesign(2,,)=[1 -1] Treedepth(0,)=Treedepth(1,)=[2 2 1] Treedepth(2,)=[1 1] 当时, 其中,·3≤i<5,0≤j<3 当时, 其中,0≤j<3 当时, 其中,6≤i<8,0≤j<3 其中,对于7-2-71结构,t1=0,t2=1;对于7-2-72结构,t1=1,t2=2再次,在7-2-71树结构中,可如下所示定义Treesign、Treedepth和R1 Treesign(2,,)=[1 -1] Treedepth(0,)=Treedepth(1,)=[1 2 2],| Treedepth(2,)=[1 1] 当时, 其中,3≤i<5,0≤j<3 当时, 其中,0≤j<3 当时, 其中,6≤i<8,0≤j<3 其中,对于7-2-71结构,t1=0,t2=1;对于7-2-72结构,t1=1,t2=2 如上所述,5-2-5树结构和7-2-7树结构中的每一个都可以被划分为三个子树。因此,在操作123中,可使用与应用到5-1-5树结构的技术相同的技术获得矩阵R2。
AAC解码器216可对通过在编码器中使用ACC对下混合信号和原始信号进行编码而获得的其余编码的信号进行解码。
MDCT2QMF单元218可将(例如)由ACC解码器216解码的MDCT系数转换到QMF域。
叠加单元220可对MDCT2QMF单元218输出的信号执行帧之间的叠加。
由于只使用QMF滤波器组低频带信号具有低频率分辨率,所以混合分析单元222可进一步执行附加滤波以提高低频带信号的频率分辨率。
此外,混合分析单元270可使用QMF混合分析滤波器组根据频带来分离输入信号。
预矩阵应用单元273可使用(例如)插值单元214产生的矩阵M1来产生直接信号和将被去相关的信号。
去相关单元276可以对产生的将被去相关的信号执行去相关,从而可重构产生的信号以具有空间感。
混合矩阵应用单元279可将(例如)插值单元215产生的矩阵M2应用到去相关单元276去相关的信号和由预矩阵应用单元273产生的直接信号。
时间包络线整形(TES)应用单元282可进一步将TES应用到混合矩阵应用单元279应用了矩阵M2的信号。
QMF混合综合单元285可使用QMF混合综合滤波器组来将TES应用单元282应用了TES的信号转换到时域。
时间处理(TP)应用单元288可进一步将TP应用到由QMF混合综合单元285转换的信号。
这里,TES应用单元282和TP应用单元288可用于提高时间结构很重要的信号(比如掌声)的声音质量,并且它们可被有选择地使用。
混合单元290可将直接信号与去相关的信号进行混合。
因此,可使用下面重复的上述等式来计算上述的矩阵R3,并将其应用到任意树结构。

其中,0≤i<TreeoutChan(v),0≤v<numOutChan (如果ioffset(v)≤i<ioffet(v)+TreeoutChan(v,), Treedepth(v,i-ioffset(v))>0) 1(如果Treedepth(v,i-ioffset(v))=0) 0(其他) 其中,0≤i<numChanOutAt并且0≤v<numOutChan,其中,
其中,
其中,并且 其中, 其中, 除了上述的实施例,还可通过介质(例如,计算机可读介质)上的计算机可读代码/指令控制至少一个处理部件实现任何上述实施例来实现本发明的实施例。所述介质可对应于允许存储和/或发送计算机可读代码的任何介质。
可以以多种方式将所述计算机可读代码记录/发送到介质上,例如,所述介质的示例包括磁存储介质(例如,ROM、软盘、硬盘等)、光学记录介质(例如CD-ROM或DVD)、和存储/传输介质(比如通过互联网传输的载波)。这里,根据本发明实施例,所述介质还可以是信号(比如结果信号和比特流)。所述介质还可以是分布式网络,从而以分布式方式存储/传送并执行计算机可读代码。此外,只作为示例,处理部件可包括处理器或计算机处理器,并且所述处理部件可分布和/或包括在单个装置中。
根据本发明实施例,可识别在解码器中提供的/可用于解码器的声道或扬声器的配置,以对每个多声道信号计算解码等级的数量,从而可根据计算的解码等级的数量来执行解码和上混合。
这样,可减少解码器中输出声道的数量和解码的复杂性。而且,可根据用户的各种扬声器的配置来适应性地提供最佳的声音质量。
尽管已经显示和描述了本发明的一些实施例,但本领域的技术人员应该理解,在不脱离本发明的原理和精神的情况下,可对这些实施例进行各种改变,本发明的范围由权利要求及其等同物确定。
产业上的可利用性
序列表文本
权利要求
1.一种用于可伸缩声道解码的方法,所述方法包括
对于至少一个编码的多声道信号设置解码等级的数量;
根据设置的解码等级的数量来对所述至少一个编码的多声道信号执行有选择的解码和上混合。
2.如权利要求1所述的方法,还包括识别声道或扬声器的配置,并考虑识别的声道或扬声器的配置来设置解码等级的数量。
3.如权利要求2所述的方法,其中,声道的配置表示关于声道的信息,所述声道是编码器中编码的与所述至少一个编码的多声道信号相应的声道中可用于通过解码器再现的多声道的声道。
4.如权利要求3所述的方法,其中,所述关于声道的信息是可用于解码器的多声道的数量、与解码器相应的扬声器的位置、表示在编码器中编码的声道中的声道是否可用于在解码器中可用的多声道的向量和每个多声道信号必须通过的模块数量中的至少一个。
5.如权利要求1所述的方法,其中,设置解码等级的数量的步骤包括
确定不对在编码器中编码的与所述至少一个编码的多声道信号相应的声道中不可用于通过解码器再现的声道进行解码;
确定除了被确定为不被解码的多声道之外,是否存在将以相同的解码和上混合路径被解码的多声道,以设置解码等级的数量。
6.如权利要求5所述的方法,其中,设置解码等级的数量的步骤还包括
确定除了被确定为不被解码的多声道之外,是否存在将以相同的解码和上混合路径被解码的多声道;
对将不以相同解码和上混合路径被解码的多声道,减小解码等级的数量的解码等级;
基于减小的解码等级对多声道设置解码等级的数量。
7.如权利要求5所述的方法,其中,设置解码等级的数量的步骤还包括将表示不可用于再现的声道的解码路径的矩阵的行或列转换为表示解码不可用的标识符,所述矩阵表示每个多声道的各个解码声道,并表示在所述至少一个多声道信号的编码的声道中的各个声道是否可用于多声道。
8.如权利要求7所述的方法,其中,设置解码等级的数量的步骤还包括确定除了被转换为表示解码不可用的标识符的矩阵中的行或列之外,是否存在表示将以相同解码和上混合路径被解码的声道的行或列。
9.如权利要求8所述的方法,其中,减小解码等级的步骤包括将表示对于下述声道最终确定的解码等级的矩阵的元素转换为表示解码不可用的标识符,所述声道被确定为不具有表示将以相同的解码和上混合路径被解码的声道的行或列;并且设置解码等级的数量的步骤包括有选择地重复逐一减小解码等级。
10.如权利要求9所述的方法,其中,设置解码等级的数量的步骤包括除了用标识符表示的矩阵的元素之外,对每个声道设置解码等级的数量。
11.至少一种包括控制至少一种处理部件以实现权利要求1的方法的计算机可读代码的介质。
12.一种用于可伸缩声道解码的设备,所述设备包括
等级设置单元,对于至少一个编码的多声道信号设置解码等级的数量;
上混合单元,根据设置的解码等级的数量来对所述至少一个编码的多声道信号执行有选择的解码和上混合。
13.如权利要求12所述的设备,还包括配置识别单元,识别声道或扬声器的配置;
所述等级设置单元考虑识别的声道或扬声器的配置来设置解码等级的数量。
14.如权利要求13所述的设备,其中,声道的配置表示关于声道的信息,所述声道是编码器中编码的与所述至少一个编码的多声道信号相应的声道中可用于通过解码器再现的多声道的声道。
15.如权利要求14所述的设备,其中,所述关于声道的信息是可用于解码器的多声道的数量、与解码器相应的扬声器的位置、表示在编码器中编码的声道中的声道是否可用于在解码器中可用的多声道的向量和每个多声道信号必须通过的模块的数量中的至少一个。
16.如权利要求12所述的设备,其中,等级设置单元包括
解码确定单元,确定不对在编码器中编码的与所述至少一个编码的多声道信号相应的声道中不可用于通过解码器再现的声道进行解码;
第一设置单元,确定除了被确定为不被解码的多声道之外,是否存在将以相同的解码和上混合路径被解码的多声道,以设置解码等级的数量。
17.如权利要求16所述的设备,其中,等级设置单元还包括
路径确定单元,确定除了被确定为不被解码的多声道之外,是否存在将以相同的解码和上混合路径被解码的多声道;
等级减小单元,对将不以相同解码和上混合路径被解码的多声道减小解码等级的数量的解码等级;
第二设置单元,基于减小的解码等级对多声道设置解码等级的数量。
18.如权利要求16所述的设备,其中,解码确定单元将表示不可用于再现的声道的解码路径的矩阵的行或列转换为表示解码不可用的标识符,所述矩阵表示每个多声道的各个解码声道并表示在所述至少一个多声道信号的编码的声道中的各个声道是否可用于多声道。
19.如权利要求18所述的设备,其中,路径确定单元确定除了被转换到表示解码不可用的标识符的矩阵中的行或列之外,是否存在表示将以相同解码和上混合路径解码的声道的行或列。
20.如权利要求19所述的设备,其中,等级减小单元将表示对于声道最终确定的解码等级的矩阵的元素转换为表示解码不可用的标识符,所述声道被确定为不具有表示以相同的解码和上混合路径被解码的声道的行或列;路径确定单元有选择地重复逐一减小解码等级。
21.如权利要求20所述的设备,其中,除了用标识符表示的矩阵的元素之外,第二设置单元对每个声道设置解码等级的数量。
22.一种用于可伸缩声道解码的方法,所述方法包括
识别解码器的声道或扬声器的配置;
有选择地将至少一个下混合的编码的多声道信号上混合为与识别的声道或扬声器的配置相应的多声道信号。
23.一种用于可伸缩声道解码的方法,所述方法包括
识别解码器的声道或扬声器的配置;
基于识别的声道或扬声器的配置来设置从至少一个下混合的编码的多声道信号上混合的各个上混合信号所通过的模块的数量;
根据设置的模块的数量来对所述至少一个下混合的编码的多声道信号进行有选择的解码和上混合。
24.一种用于可伸缩声道解码的方法,所述方法包括
识别解码器的声道或扬声器的配置;
基于通过解码器再现声道的可用性来确定是否对由至少一个下混合的编码的多声道信号表示的多个声道中的声道进行解码;
确定除了由确定是否对声道进行解码的步骤确定为不被解码的多声道之外是否存在将以相同路径被解码的多声道;
根据确定除了被确定为不被解码的多声道之外是否存在将以相同路径被解码的多声道的步骤,计算每个多声道信号必须通过的解码和上混合模块的数量;
根据计算的解码和上混合模块的数量来执行有选择的解码和上混合。
全文摘要
一种用于可伸缩性声道解码的方法、介质和设备。所述方法包括识别声道或扬声器的配置;使用识别的声道或扬声器的配置来对每个多声道信号计算解码等级的数量;根据计算的解码等级的数量来执行解码和上混合。
文档编号G10L19/00GK101371300SQ200780002329
公开日2009年2月18日 申请日期2007年1月11日 优先权日2006年1月11日
发明者金重会, 吴殷美, 磊 苗 申请人:三星电子株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1