立体声音频编/解码方法及编/解码器的制作方法

文档序号:2837335阅读:474来源:国知局
专利名称:立体声音频编/解码方法及编/解码器的制作方法
技术领域
本发明涉及音频处理技术领域,具体涉及数字立体声音频编/解码方法及 编/解码器。
背景技术
立体声是指能使听者有声源在空间分布的感觉的声音信号。立体声音频在
录制时通常被分配到两个独立的声道左声道和右声道,在重放时人耳通过分 辨来自左右声道的音频信号的强度差、延时等产生听觉的空间感。
通常立体声信号主要有两个来源 一是采用双麦克风或多麦克风自然录 音,此时左右声道音频来自同一音频场景,除了由于麦克风摆位造成的时间差、 强度差等不同,他们记录的音频信息基本一致; 一是采用音频工作室人工混音, 由于在大多数情况下力求营造具有真实感的音频场景,因此这种方式下左右声 道间 一般也具有较强的相关性。
在处理立体声音频信号时, 一般先对左右声道进行模/数(A/D: Analog/ Digital)采样得到数字立体声信号,本文中将左右声道的对应的数字信号表示 为两个矢量语音信号Xl和Xr,矢量的维数与采样数据点数相关;然后对XL和 XR进行编码。如何在尽可能低的编码码率下获得尽可能好的重现音质是始终 追求的目标之一。目前主要有两种立体声音频编码方法
一、 和差立体声(Sum-difference Stereo)
如图1所示,该方法将XL和XR在频域对应频率处进行相加和相减处理,
分別得到和矢量信号Xs与差矢量信号Xd,然后分别对Xs和XD进行量化编码。 由图l可以看出,在较为理想的情况下,由于Xl和Xr差別不大,使得Xd能量 非O但明显小于Xs。因此可对与XL和XR类似的Xs以常规的码率进行编码,而 对Xo则以较小的码率进行编码。
二、 强度立体声(Intensity Stereo )
为了使码率进一步下降,在强度立体声方法中引入心理声学以去除声道间 的主观冗余。该方法中只编码一个声道的信号,例如Xl或Xr,以及另一个声
道与之的能量比。在解码端重现出一个声道的信号,以及仅体现能量差异的另 一个信号。
在对现有技术的研究和实践过程中,发明人发现实际的立体声信号由于受 环境噪音,墙体、地面的多次反射、折射和吸收,以及多声源的影响,在很多 时候并不接近图1所示的模型,而是表现为图2所示的情况,即差矢量信号
Xo的能量并不明显小于原始的矢量语音信号XL和XR。此时,现有和差立体声 编码方法无法带来码率降低的效果,而强度立体声编码方法则会引入明显的失真。

发明内容
本发明提供一种能够有效提高编码增益的立体声音频编码方法以及相应 的解码方法和编/解码器。
一种立体声音频编码方法,包括获取分别属于左声道和右声道的两个对 应的矢量语音信号;对所述两个矢量语音信号进行正交旋转变换,获得两个旋 转矢量信号;所述两个旋转矢量信号之间的相关度大于或等于所述两个矢量语 音信号之间的相关度;对所述旋转矢量信号进行编码;在编码结果中放入所述 正交旋转变换的旋转角度的信息。
一种立体声音频解码方法,包括获取立体声音频编码码流;从所述编码 码流中获取旋转角度的信息;从所述编码码流中获取两个旋转矢量信号;按照 所述旋转角度对所述两个旋转矢量信号进行反向正交旋转变换,获得两个矢量 语音信号。
一种立体声音频编码器,包括信号分析单元,用于输出分别属于左声道 和右声道的两个对应的矢量语音信号;旋转变换单元,用于对所述两个矢量语 音信号进行正交旋转变换,输出两个旋转矢量信号以及所述正交旋转变换的旋 转角度;所述两个旋转矢量信号之间的相关度大于或等于所述两个矢量语音信 号之间的相关度;编码单元,用于对输入的两个矢量信号进行编码,输出编码 结果;当输入的矢量信号为所述旋转变换单元输出的旋转矢量信号时,在输出 的编码结果中放入所述旋转变换单元输出的旋转角度的信息。
一种立体声音频解码器,包括码流接收单元,用于获取立体声音频编码
码流;解码单元,用于从所述编码码流中获取旋转角度的信息以及两个旋转矢 量信号并输出;反旋转变换单元,用于按照所述解码单元输出的旋转角度的信 息对所述解码单元输出的两个旋转矢量信号进行反向正交旋转变换,输出两个 矢量语音信号。
本发明实施例采用对左右声道的矢量语音信号进行旋转正交变换,提高两 个矢量之间的相关度的方法;由于变换后的两个矢量具有较好的相关性,使得 后续的编码过程能够以低码率实现较高的音质,确保了编码增益的提高。与传 统方法相比,能够在相同的码率下获得更高的音质,或者在同等音质下实现更 低的码率。


图l是一种现有左右声道矢量声音信号和差示意图; 图2是另一种现有左右声道矢量声音信号和差示意图; 图3是本发明实施例一立体声音频编码方法流程示意图; 图4是本发明实施例一中正交旋转变换示意图; 图5是本发明实施例二立体声音频解码方法流程示意图; 图6是本发明实施例三立体声音频编码方法流程示意图; 图7是本发明实施例四立体声音频编码方法流程示意图; 图8是本发明实施例五立体声音频编码方法流程示意图; 图9是本发明实施例六立体声音频解码方法流程示意图; 图IO是本发明实施例七立体声音频编码器逻辑结构示意图; 图ll是本发明实施例八立体声音频解码器逻辑结构示意图; 图12是本发明实施例九立体声音频编码器逻辑结构示意图; 图13是本发明实施例十立体声音频编码器逻辑结构示意图; 图14是本发明实施例十一立体声音频编码器逻辑结构示意图; 图15是本发明实施例十二立体声音频解码器逻辑结构示意图。
具体实施例方式
本发明实施例提供了 一种立体声音频编码方法,对左右声道的矢量语音信 号进行旋转正交变换,提高两个矢量之间的相关度。本发明实施例还提供相应
的立体声音频解码方法和立体声音频编/解码器。以下分别进行详细说明。
实施例一、 一种立体声音频编码方法,如图3所示,包括 Al 、获取分别属于左声道和右声道的两个对应的矢量语音信号。 对左右声道矢量语音信号的采集可参照现有方式进行。基于人耳的听觉特 性,可将左声道和右声道按频率划分为若干子带,获取分别属于左声道和右声 道的相同子带的两个矢量语音信号作为对应的矢量语音信号。以子带为单位进 行立体声音频处理的依据在于
人的听觉可以用一个非均匀带宽的滤波器组描述,每个滤波器组通道被称 为一个子带。子带的带宽与人的听觉特性匹配,人耳对立体声的空间感主要来 自左右声道对应子带信号的整体特性,如强度差、延时等,而对子带信号的细 节不敏感。从低频到高频,子带的带宽不断增大,在理想的情况下与心理声学 中的关键带(Critical Band)或等效矩形带宽(Equivalent Rectangular Bandwidth, ERB)—致。因此根据心理声学,子带是最小的听觉单位,每个子带可以作为 一个独立的听觉单元,即可以以子带为单位进行立体声音频处理操作。
获取子带的矢量语音信号可采用两类方法1、基于可重建滤波器组,如 滤波器多相滤波器组(PQMF: Polyphase Quadrature Mirror Filterbank); 2 、基 于时频变换,如快速傅立叶变换(FFT: Fast Fourier Transform )、离散余弦变 换(DCT: Discrete Cosine Transform)和修正离散余弦变换(MDCT: Modified Discrete Cosine Transform )等。将左右声道相同子带的采样数据按时间(基于
滤波器组)或频率(基于时频变换)排列形成矢量语音信号对XL和XR。例如,
若左右声道划分为4个子带,每个子带包含12个数据点,则有4组12维的X^和 XR向量对,每个向量对均可按照本实施例后续提供的方法进行处理。
A2、对所述两个矢量语音信号进行正交旋转变换,获得两个旋转矢量信 号;所述两个旋转矢量信号之间的相关度大于或等于所述两个矢量语音信号之 间的相关度。
对矢量语音信号XL和XR执行的正交旋转变换如图4所示,可用公式表示
为<formula>formula see original document page 10</formula><formula>formula see original document page 10</formula>(1)
其中,XL和XR表示左右声道相同子带的两个矢量语音信号;Y。和Yi表示变换
后的两个旋转语音信号;e表示旋转角度。本实施例中仅要求e是使得相关度
增大的旋转角度,对其带来的相关度增量以及获取方式不作限定,例如可在中随机或按某种规律搜索获取。由于矢量对的相关度越高后续的编 码过程就可能获得更大的编码增益,因此使得相关度极大化的旋转角度是希望 被采用的。
下面给出极大化相关度旋转角的推理过程
由(1)式得到旋转语音信号Yo和^的代数表达式为,
Y0 :cos0Xjl +sin0XR
A = —sin0Xt + cos0XR 假定矢量对a、 b的相关度corr(a,b)采用如下归一化的度量计算方式,
(2)
corr(a,b)=
a,b
ab
其中〈xl,x2〉表示矢量xl和x2的标量积;I l表示矢量的模。则由(2)式,相关 度corr(Y。 , ^)可以表示为,
Yo Y
sin 20
2
+ cos2e(XL,XR
(3)

9n 二丄arctan
Xr,Xr〉 一 〈XL,XL
(4)
2 2〈XL,X 则使(3)式corr(Yo,Y!)有最大值的旋转角度e的值在[-7i/2,7i/2]之间表示为,
<formula>formula see original document page 11</formula>此时,旋转语音信号Yo和Yt有最大的相关度,
<formula>formula see original document page 11</formula> (6) 其中,E虹和ExR分别为XL和XR的能量,等于其模的平方。
由于采用正交旋转变换,变换前后矢量能量之和不变。在极大化相关度的 旋转变换下,Yo和Y,的能量EYo和E^有下述重要而简单的关系,
EY0 =EY1 ="^(EXL十Exr) (7)
圉4中Yo和Y一差矢量信号Yd =(YQ -X)/2的能量Eyd,与X^和Xr的差矢 量信号XD = (XL - XR)/2的能量Exo关系如下,
<formula>formula see original document page 11</formula> (8) A3、对所述旋转矢量信号进行编码。
对Y。和Y]编码的过程可参照现有方式进行,例如采用现有的和差立体声或 强度立体声编码方式。
1、 采用和差立体声方式。编码步骤包括计算两个旋转矢量信号Yo和Yj的 和与差,获得和矢量信号Ys = (YQ + Y, )/2与差矢量信号YD = (YQ - ;
对所述和矢量信号Ys与差矢量信号YD分别进行量化编码, 一般对Ys采用 通常的编码方式,对YD则可根据码率、频带和信号特性等采用不同精度的编 码方式。在采用极大化相关度旋转变换的情况下,由(8)式可以看出变换后
的差矢量信号Yd的能量Eyd小于原差矢量信号Xd的能量Exd,因此和差立体声 编码的效率将提高。
2、 采用强度立体声方式。编码步骤包括对两个旋转矢量信号Yo和Yi中
的任意一个进行量化编码。在采用极大化相关度旋转变换的情况下,由(7)
式可以看出,Yo和Y,的能量比例因子恒为l,因此不需要在码流中记录这个参 数。由于Yo和Y!的相关度corr(Y。,Y,)大于XL和XR的相关度corr(XL,XK),因此 强度立体声编码引入的失真将减小。
A4、在编码结果中放入所述正交旋转变换的旋转角度的信息。 为使解码端能根据Yo和Y,重建原始的矢量语音信号X^和XR,需要将正交
旋转变换的旋转角度e放入编码结果中,具体放置的字段以及码流成型格式等
可根据实际应用需要确定,本实施例中不予限定。
本实施例采用对左右声道的矢量语音信号进行旋转正交变换,提高两个矢 量之间的相关度的方法;由于变换后的两个矢量具有较好的相关性,使得后续 的编码过程能够以低码率实现较高的音质,确保了编码增益的提高。与传统方 法相比,能够在相同的码率下获得更高的音质,或者在同等音质下实现更低的 码率。本实施例还进一步给出计算极大化相关度旋转角的方法,可获得具有最 大相关度的旋转语音信号,使得后续编码过程能够获得更高的编码增益。
实施例二、 一种立体声音频解码方法,提供与实施例一编码方法相应的解 码方法,流程如图5所示,包括 Bl、获取立体声音频编码码流。
该编码码流为采用实施例一编码方法获得的编码码流。 B2 、从所述编码码流中获取旋转角度的信息。
解码方可按照与编码方共同采用的约定,从某个字段中读取并解码出旋转
角度e。
B3、从所述编码码流中获取两个旋转矢量信号;
解码得到两个旋转矢量信号Yo和Y!的过程,可对应于Yo和Y,的编码方式进行。
B4、按照所述旋转角度对所述两个旋转矢量信号进行反向正交旋转变换, 获得两个矢量语音信号。
即相当于对Yo和Yi进行旋转角度为-e的正交旋转变换,从而重建原始左右
声道的矢量语音信号XL和XR。
实施例三、 一种立体声音频编码方法,本实施例方法与实施例一的区别之 处在于在进行正交旋转变换前,增加了对该变换的编码增益进行评估判断的过 程。方法流程如图6所示,包括
Cl 、获取分别属于左声道和右声道的两个对应的矢量语音信号。
此步骤可参照实施例一中的步骤A1进行。
C2、判断需要对所述两个矢量语音信号进行正交旋转变换。
由于进行正交旋转变换的目的是为了提高矢量的相关度,因此可以利用当 前矢量语音信号的相关度作为判断的依据,例如可以计算所述两个矢量语音信 号的相关度,当相关度小于设定阈值时,确定需要进行所述正交旋转变换。
当然,若相关度大于设定阈值,说明当前矢量语音信号具有良好的相关性, 则可直接按照现有方式进行编码,不在本实施例讨论之列。
C3、对所述两个矢量语音信号进行正交旋转变换,获得相关度增加的两 个旋转矢量信号。
C4、对所述旋转矢量信号进行编码。
上述步骤C3、 C4可参照实施例一中的步骤A2、 A3进行。
C5、在编码结果中放入所述正交旋转变换的旋转角度的信息,并且在所 述编码结果中设置已进行正交旋转变换的标识;这两个操作的执行不分先后。
为使得解码端能够识别编码码流是否采用了旋转正交变换,可以在码流中 放入一个标志位,用来标识是否进行了正交旋转变换。在进行了正交旋转变换 的情况下,需要将该标志位设置成已进行正交旋转变换的标识,例如设置为l。
本实施例在进行正交旋转变换前,增加了对该变换的编码增益进行评估判 断的过程,使得正交旋转变换的应用更加有效,提高了编码的效率。
实施例四、 一种立体声音频编码方法,本实施例方法与实施例一的区别之 处在于在进行正交旋转变换后,增加了对该变换的编码增益进行评估判断的过 程。方法流程如图7所示,包括
Dl、获取分别属于左声道和右声道的两个对应的矢量语音信号。 D2、对所述两个矢量语音信号进行正交旋转变换,获得相关度增加的两 个旋转矢量信号。
上述步骤D1、 D2可参照实施例一中的步骤A1、 A2进行。
D3、比较所述两个旋转矢量信号之间的相关度相对所述两个矢量语音信
号之间的相关度的增加量,根据所述增加量判断需要对所述旋转矢量信号进行
后续的编码操作。
由于进行正交旋转变换的目的是为了提高矢量的相关度,因此可以通过变 换前后相关度的增加量来判断变换是否有效,例如可设置相关度增加量的阈 值,当相关度增加量超过阈值时,认为所进行的正交旋转变换是有效的,确定 需要对旋转矢量信号进行后续的编码操作。
当然,若相关度增加量未达到阈值,则可认为正交旋转变换效果不大,可 直接对原始的矢量语音信号按照现有方式进行编码,不在本实施例讨论之列。
D4、对所述旋转矢量信号进行编码。
此步骤可参照实施例一中的步骤A3进行。
D5、在编码结果中放入所述正交旋转变换的旋转角度的信息,并且在所 述编码结果中设置已进行正交旋转变换的标识;这两个操作的执行不分先后。
本实施例在进行正交旋转变换后,增加了对该变换的编码增益进行评估判 断的过程,在评估通过时才对正交旋转变换的结果进行编码,使得正交旋转变 换的应用更加有效,提高了编码的效率。
实施例五、 一种立体声音频编码方法,本实施例方法与实施例一的区别之 处在于在对正交旋转变换的结果进行编码后,增加了对该编码结果的编码增益 进行评估判断的过程。方法流程如图8所示,包括
El 、获取分别属于左声道和右声道的两个对应的矢量语音信号。
E2、对所述两个矢量语音信号进行正交旋转变换,获得相关度增加的两个 旋转矢量信号。
E3、对所述旋转矢量信号进行编码。
上述步骤E1、 E2、 E3可参照实施例一中的步骤A1、 A2、 A3进行。 E4、将在未采用所述正交旋转变换的情况下对所述两个矢量语音信号进行
编码的结果,与所述对旋转矢量信号进行编码的结果进行比较,根据比较结果
判断需要采用所述对旋转矢量信号进行编码的结果。
此步骤综合评价不进行和进行正交旋转变换的编码结果,通常可选择码流 长度、失真度等作为评价参数,注意在考虑码流长度时需要加上旋转角度对应 的编码长度。例如可设置编码长度减少量的阈值,当采用正交旋转变换的编码 结果带来的编码长度减少量超过阈值时,确定需要采用所述对旋转矢量信号进 行编码的结果。
当然,若通过编码结果的比较评价确定选择不进行正交旋转变换的编码结 果,则可直接采用对原始的矢量语音信号进行编码的结果。
E5、在编码结果中放入所述正交旋转变换的旋转角度的信息,并且在所述
编码结果中设置已进行正交旋转变换的标识;这两个操作的执行不分先后。
本实施例在对正交旋转变换的结果进行编码后,增加了对该编码结果的编 码增益进行评估判断的过程,使得正交旋转变换的应用更加有效,确保编码结 果的最优性。
实施例六、 一种立体声音频解码方法,提供与实施例三-五编码方法相应 的解码方法,流程如图9所示,包括 Fl、获取立体声音频编码码流。
该编码码流为采用实施例三~五编码方法获得的编码码流。 F2、判断所述编码码流中包括已进行正交旋转变换的标识。 例如解码方可按照与编码方共同采用的约定,读取作为标识的某个标志位
的值,然后根据该值判断当前编码码流是否已进行正交旋转变换,若确定已进 行正交旋转变换则按下述解码过程执行,若判断未进行正交旋转变换则可按照 现有解码方式进行解码操作,不在本实施例讨论之列。
F3、从所述编码码流中获取旋转角度的信息。
F4、从所述编码码流中获取两个旋转矢量信号;
F5、按照所述旋转角度对所述两个旋转矢量信号进行反向正交旋转变换,
获得两个矢量语音信号。
上述步骤F3、 F4、 F5可参照实施例二中的步骤B2、 B3、 B4进行。
应当理解,实现本发明立体声音频编码方法和解码方法的软件可以存储于
计算机可读介质中。该软件的编码方法在执行时,包括如下步骤获取分别属
于左声道和右声道的两个对应的矢量语音信号;对所述两个矢量语音信号进行 正交旋转变换,获得两个旋转矢量信号;所述两个旋转矢量信号之间的相关度 大于或等于所述两个矢量语音信号之间的相关度;对所述旋转矢量信号进行编 码;在编码结果中放入所述正交旋转变换的旋转角度的信息。该软件的解码方 法在^^行时,包括如下步骤获取立体声音频编码码流;从所述编码码流中获 取旋转角度的信息;从所述编码码流中获取两个旋转矢量信号;按照所述旋转 角度对所述两个旋转矢量信号进行反向正交旋转变换,获得两个矢量语音信 号。所述的可读介质,如ROM/RAM、磁碟、光盘等。
为更好的理解上述实施例,以下给出实施例一编码方法的一个数据应用例。
1、 假定左右声道矢量语音信号的获取采用MDCT变换方式,变换后左右 声道的每个语音帧分别包含32个频谱数据。根据人耳的非线性频率分辨率将频 谱数据从低到高分成4个子带子带l,谱线1 谱线4;子带2,谱线5-谱线8; 子带3,谱线9~语线20;子带4,谱线21-谱线32。以子带l为例,假定子带l 对应的4维矢量语音信号对为,
XL = (-0.4513, -0.0091, -0.5363, -0.3011),
XR= (0.1739, 0.3309, 0.9390, -0.7371), 可得,Xl的能量Exl- 0.5821, Xr的能量Exr: 1.5646; XL和XR的标量积为 〈X^XR〉 =-0.3632,归一化相关度为,
corr(XL,XR) = -0.3632/(0.5821 x1.5646)05 = -0.3806
2、 由(4)、 (5)两式可计算得到此时的极大化相关度旋转角e (弧度)
0 = 6G +兀/2 = 0.5xarctan[(1.5646-0.5821)/(2x陽0.3632)] + 1.5708 = 1.1037
cos6 = 0.4503, sin9 = 0.8929 再由(1)、 (2)两式得到极大化相关度正交旋转变换后的旋转语音信号,
Yo = 0.4503 XL + 0.8929 XR = (-0.0480, 0.2914, 0.5968, -0.7937), = -0.8929 XL + 0.4503 XR = (0.4813, 0.1571, 0.9017, -0.0630), 可得,Yo和Y!的能量Eyo = EY1 = 1.0734; Yo和Y!的标量积为〈Y。,Yi〉 = 0.6109, 归一化相关度为,
corr(Yo,Y!) = 0.6109/1.0734 = 0.5691 显然变换后相关度由-0.3806提高到0.5691 。
3、对Yo和Y!采用和差或强度立体声的方式进行编码,并在编码结果中放 入旋转角度6= 1.1037。
对于左右声道的其他子带,可以同样方式进行处理。
下面对本发明实施例的立体声音频编/解码器进行详细说明。 实施例七、 一种立体声音频编码器IO,如图10所示,包括 信号分析单元11 ,用于输出分别属于左声道和右声道的两个对应的矢量语 音信号Xl和Xk。
旋转变换单元12,用于对信号分析单元ll输出的两个矢量语音信号Xt和 XR进行正交旋转变换,输出两个旋转矢量信号Yo和Y!以及所述正交旋转变换 的旋转角度e;所述两个旋转矢量信号Yo和Yi之间的相关度大于或等于所述两
个矢量语音信号XL和XR之间的相关度。
编码单元13,用于对输入的两个矢量信号进行编码,输出编码结果;当输 入的矢量信号为旋转变换单元12输出的旋转矢量信号Yo和Y,时,在输出的编码 结果中放入旋转变换单元12输出的旋转角度e的信息。
本实施例立体声音频编码器可用于执行实施例一中描述的立体声音频编 码方法。
实施例八、 一种立体声音频解码器20,如图ll所示,包括
码流接收单元21 ,用于获取立体声音频编码码流。
解码单元22,用于从码流接收单元21获取的编码码流中获取旋转角度e的 信息以及两个旋转矢量信号Yo和Yi并输出。
反旋转变换单元23,用于按照解码单元22输出的旋转角度e的信息对解码 单元22输出的两个旋转矢量信号Yo和Y!进行反向正交旋转变换,输出两个矢量
语音信号XL和XR。
本实施例立体声音频解码器可用于执行实施例二中描述的立体声音频解 码方法。
实施例九、 一种立体声音频编码器30,如图12所示,包括 信号分析单元31,用于输出分别属于左声道和右声道的两个对应的矢量语 音信号Xl和Xr。
第一判断单元32,用于判断信号分析单元31输出的两个矢量语音信号XL 和XR是否需要进行正交旋转变换;若是,则将所述两个矢量语音信号Xt和XR输 出到旋转变换单元32,若否,则将所述两个矢量语音信号Xt和XR输出到编码 单元34。
旋转变换单元33,用于对第一判断单元32输出的两个矢量语音信号X^和 XR进行正交旋转变换,输出两个旋转矢量信号Yo和Yi以及所述正交旋转变换 的旋转角度e;所述两个旋转矢量信号Yo和Y,之间的相关度大于或等于所述两 个矢量语音信号Xt和XR之间的相关度。
编码单元34,用于对输入的两个矢量信号(XL、 Xr或者Yo、 Y!)进行编 码,输出编码结果;当输入的矢量信号为旋转变换单元33输出的旋转矢量信号 Yo和Yi时,在输出的编码结果中放入旋转变换单元33输出的旋转角度e的信息。
第一填充单元35,用于根据第一判断单元32的判断结果,在编码单元34 输出的编码结果中设置已进行或未进行正交旋转变换的标识。
本实施例立体声音频编码器可用于执行实施例三中描述的立体声音频编 码方法。
实施例十、 一种立体声音频编码器40,如图13所示,包括 信号分析单元41,用于输出分别属于左声道和右声道的两个对应的矢量语 音信号Xl和Xr。
旋转变换单元42,用于对信号分析单元41输出的两个矢量语音信号X^和 XR进行正交旋转变换,输出两个旋转矢量信号Yo和Y!以及所述正交旋转变换 的旋转角度0;所述两个旋转矢量信号Yo和Y!之间的相关度大于或等于所述两
个矢量语音信号XL和XR之间的相关度。
第二判断单元43 ,用于比较旋转变换单元42输出的两个旋转矢量信号Yo和 Y!之间的相关度,相对信号分析单元41输出的两个矢量语音信号XL和XR之间 的相关度的增加量,根据所述增加量判断是否需要对所述旋转矢量信号Yo和
Y,进行后续的编码操作;若是,则将所述两个旋转矢量信号Yo和Y!输出到编 码单元44,若否,则将所述两个矢量语音信号XL和XR输出到编码单元44。
编码单元44,用于对第二判断单元43输入的两个矢量信号(XL、 Xr或者 Y0、 YJ进行编码,输出编码结果;当输入的矢量信号为旋转矢量信号Yo和 Yt时,在输出的编码结果中放入旋转变换单元42输出的旋转角度e的信息。
第二填充单元45,用于根据第二判断单元43的判断结果,在编码单元44 输出的编码结果中设置已进行或未进行正交旋转变换的标识。
本实施例立体声音频编码器可用于执行实施例四中描述的立体声音频编 码方法。
实施例十一、 一种立体声音频编码器50,如图14所示,包括 信号分析单元51,用于输出分别属于左声道和右声道的两个对应的矢量语 音信号Xl和Xk。
旋转变换单元52,用于对信号分析单元51输出的两个矢量语音信号X^和 XR进行正交旋转变换,输出两个旋转矢量信号Yo和Y!以及所述正交旋转变换 的旋转角度e;所述两个旋转矢量信号Yo和Yi之间的相关度大于或等于所述两
个矢量语音信号XL和XR之间的相关度。
编码单元53,用于分别对信号分析单元51和旋转变换单元52输入的两个矢 量信号(X^ Xr和Yo、 Y。进行编码,输出编码结果;当输入的矢量信号为 旋转矢量信号Yo和Yi时,在输出的编码结果中放入旋转变换单元52输出的旋转
角度e的信息。
第三判断单元54,用于对编码单元53输出的两种编码结果进行比较,根据 比较结果选择输出所述两种编码结果之一;
第三填充单元55,用于根据第三判断单元54的选择,在第三判断单元54 选择的编码结果中设置已进行或未进行正交旋转变换的标识。
本实施例立体声音频编码器可用于执行实施例五中描述的立体声音频编 码方法。
实施例十二、 一种立体声音频解码器60,如图15所示,包括
码流接收单元61,用于获取立体声音频编码码流。
第四判断单元62,用于判断码流接收单元61获取的编码码流中包括已进行 正交旋转变换的标识,触发解码单元62的操作。
解码单元63,用于从码流接收单元61获取的编码码流中获取旋转角度e的 信息以及两个旋转矢量信号Yo和Yi并输出。
反旋转变换单元64,用于按照解码单元63输出的旋转角度e的信息对解码 单元63输出的两个旋转矢量信号Yo和Yi进行反向正交旋转变换,输出两个矢量 语音信号Xi和XR。
本实施例立体声音频解码器可用于执行实施例六中描述的立体声音频解 码方法。
通过上述实施例可以看出,本发明实施例采用对左右声道的矢量语音信号 进行旋转正交变换,提高两个矢量之间的相关度的方法;由于变换后的两个矢 量具有较好的相关性,使得后续的编码过程能够以低码率实现较高的音质,确 保了编码增益的提高。与传统方法相比,能够在相同的码率下获得更高的音质, 或者在同等音质下实现更低的码率。采用本发明实施例进一步给出的计算极大 化相关度旋转角的方法,可获得具有最大相关度的旋转语音信号,使得后续编 码过程能够获得更高的编码增益。并且若进一步增加对正交旋转变换的编码增 益进行评估判断的过程,能够使得正交旋转变换的应用更加有效,确保编码结 果的优选性。
以上对本发明实施例所提供的立体声音频编/解码方法及编/解码器进行了
上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本 领域的一般技术人员,依据本发明的思想,在具体实施方式
及应用范围上均会 有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
权利要求
1、一种立体声音频编码方法,其特征在于,包括获取分别属于左声道和右声道的两个对应的矢量语音信号;对所述两个矢量语音信号进行正交旋转变换,获得两个旋转矢量信号;所述两个旋转矢量信号之间的相关度大于或等于所述两个矢量语音信号之间的相关度;对所述旋转矢量信号进行编码;在编码结果中放入所述正交旋转变换的旋转角度的信息。
2、 根据权利要求l所述的立体声音频编码方法,其特征在于,所述左声道 和右声道按频率划分为若干子带,所述获取分别属于左声道和右声道的两个对 应的矢量语音信号的步骤具体为获取分别属于左声道和右声道的相同子带的 两个矢量语音信号。
3、 根据权利要求l所述的立体声音频编码方法,其特征在于,在所述对两 个矢量语音信号进行正交旋转变换的步骤之前还包括判断需要对所述两个矢 量语音信号进行正交旋转变换;在所述对旋转矢量信号进行编码的步骤之后还包括在所述编码结果中设 置已进行正交旋转变换的标识。
4、 根据权利要求3所述的立体声音频编码方法,其特征在于,所述判断需 要对两个矢量语音信号进行正交旋转变换的步骤具体为计算所述两个矢量语 音信号的相关度,当相关度小于设定阈值时,确定需要进行所述正交旋转变换。
5、 根据权利要求l所述的立体声音频编码方法,其特征在于,在所述对两 个矢量语音信号进行正交旋转变换的步骤之后还包括比较所述两个旋转矢量 信号之间的相关度相对所述两个矢量语音信号之间的相关度的增加量,根据所 述增加量判断需要对所述旋转矢量信号进行后续的编码操作;在所述对旋转矢量信号进行编码的步骤之后还包括在所述编码结果中设 置已进行正交旋转变换的标识。
6、 根据权利要求l所述的立体声音频编码方法,其特征在于,在所述对旋 转矢量信号进行编码的步骤之后还包括将在未采用所述正交旋转变换的情况下对所述两个矢量语音信号进行编 码的结果,与所述对旋转矢量信号进行编码的结果进行比较,根据比较结果判断需要采用所述对旋转矢量信号进行编码的结果;在所采用的编码结果中设置已进行正交旋转变换的标识。
7、根据权利要求1 6任意一项所述的立体声音频编码方法,其特征在于, 所述对两个矢量语音信号进行正交旋转变换的步骤具体为按照旋转角度e执 行所述正交旋转变换,cos 9 sin0 一sin9 cos 9,其中,e的值在[-7i/2,V2]之间表示为,<formula>formula see original document page 3</formula>X^和XR表示所述两个矢量语音信号;Yo和Yi表示所述两个旋转语音信号; 〈xl, x2〉表示矢量xl和x2的标量积。
8、 根据权利要求7所述的立体声音频编码方法,其特征在于,所述对旋转 矢量信号进行编码的步骤包括计算所述两个旋转矢量信号的和与差,获得和矢量信号与差矢量信号; 对所述和矢量信号与差矢量信号分别进行量化编码。
9、 根据权利要求7所述的立体声音频编码方法,其特征在于,所述对旋转 矢量信号进行编码的步骤具体为对所述两个旋转矢量信号中的任意一个进行 量化编码。
10、 一种立体声音频解码方法,其特征在于,包括 获取立体声音频编码码流; 从所述编码码流中获取旋转角度的信息; 从所述编码码流中获取两个旋转矢量信号;按照所述旋转角度对所述两个旋转矢量信号进行反向正交旋转变换,获得 两个矢量语音信号。
11、 根据权利要求10所述的立体声音频解码方法,其特征在于,在所述从编码码流中获取旋转角度的信息的步骤之前还包括判断所述编码码流中包括 已进行正交旋转变换的标识。
12、 一种立体声音频编码器,其特征在于,包括信号分析单元,用于输出分别属于左声道和右声道的两个对应的矢量语音 信号;旋转变换单元,用于对所述两个矢量语音信号进行正交旋转变换,输出两 个旋转矢量信号以及所述正交旋转变换的旋转角度;所述两个旋转矢量信号之 间的相关度大于或等于所述两个矢量语音信号之间的相关度;编码单元,用于对输入的两个矢量信号进行编码,输出编码结果;当输入 的矢量信号为所述旋转变换单元输出的旋转矢量信号时,在输出的编码结果中 放入所述旋转变换单元输出的旋转角度的信息。
13、 根据权利要求12所述的立体声音频编码器,其特征在于,还包括第 一判断单元,用于判断所述信号分析单元输出的两个矢量语音信号是否 需要进行正交旋转变换;若是,则将所述两个矢量语音信号输出到所述旋转变 换单元,若否,则将所述两个矢量语音信号输出到所述编码单元;第一填充单元,用于根据所述第一判断单元的判断结果,在所述编码单元 输出的编码结果中设置已进行或未进行正交旋转变换的标识。
14、 根据权利要求12所述的立体声音频编码器,其特征在于,还包括 第二判断单元,用于比较所述旋转变换单元输出的两个旋转矢量信号之间的相关度,相对所述信号分析单元输出的两个矢量语音信号之间的相关度的增 加量,根据所述相关度的增加量判断是否需要对所述旋转矢量信号进行后续的 编码操作;若是,则将所述两个旋转矢量信号输出到所述编码单元,若否,则 将所述两个矢量语音信号输出到所述编码单元;第二填充单元,用于根据所述第二判断单元的判断结果,在所述编码单元 输出的编码结果中设置已进行或未进行正交旋转变换的标识。
15、 根据权利要求12所述的立体声音频编码器,其特征在于,所述编码单 元分别对所述信号分析单元和旋转变换单元的输出进行编码;所述编码器还包 括第三判断单元,用于对所述编码单元输出的两种编码结果进行比较,根据比较结果选择输出所述两种编码结果之一 ;第三填充单元,用于根据所述第三判断单元的选择,在所述第三判断单元 选择的编码结果中设置已进行或未进行正交旋转变换的标识。
16、 一种立体声音频解码器,其特征在于,包括 码流接收单元,用于获取立体声音频编码码流;解码单元,用于从所述编码码流中获取旋转角度的信息以及两个旋转矢量 信号并输出;反旋转变换单元,用于按照所述解码单元输出的旋转角度的信息对所述解 码单元输出的两个旋转矢量信号进行反向正交旋转变换,输出两个矢量语音信—;一
17、 根据权利要求16所述的立体声音频解码器,其特征在于,还包括第四判断单元,用于判断所述编码码流中包括已进行正交旋转变换的标 识,触发所述解码单元的操作。
全文摘要
本发明公开了一种立体声音频编码方法,对左右声道的矢量语音信号进行旋转正交变换,提高两个矢量之间的相关度。本发明还提供相应的立体声音频解码方法以及立体声音频编/解码器。由于变换后的两个矢量具有较好的相关性,本发明使得后续的编码过程能够以低码率实现较高的音质,确保了编码增益的提高。与传统方法相比,能够在相同的码率下获得更高的音质,或者在同等音质下实现更低的码率。
文档编号G10L19/00GK101350197SQ20071013583
公开日2009年1月21日 申请日期2007年7月16日 优先权日2007年7月16日
发明者欢 侯, 斌 张, 张树华, 王庭红, 窦维蓓, 玮 肖, 郭利斌 申请人:华为技术有限公司;清华大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1