立体声解码方法及装置的制作方法

文档序号：2823345阅读：206来源：国知局

专利名称：立体声解码方法及装置的制作方法
技术领域：
本发明实施例涉及通信技术领域，尤其涉及一种立体声解码方法及装置。
背景技术：
目前立体声编码方法主要包括强度立体声、BCC(Binaual Cure Coding)和 PS(Parametric-Stereo coding)等编码方法，在中高码率的通信场景下，通常的编码方法是提取两声道(如左右声道)信号间的电平差(InterChannel LevelDifference，简称 ILD)(也可简称CLD)和两声道信号间的相位差(InterChannel Phase Difference，简称 IPD)，在某些情况下也可以提取两声道互相关参数以及其中一声道与下混信号的相位差参数，将这些参数作为边信息进行编码并发送到解码端，以恢复立体声信号。然而在低码率的通信场景下，不能同时传输ILD和IPD，优先需要传输的是ILD，将该ILD进行编码并发送到解码端，以恢复立体声信号。根据以上立体声编码方法，对应的立体声解码方法即为从码流中提取单声道比特信号，解码后得到单声道信号，将单声道信号进行时频变换得到单声道频域信号；在中高码率的通信场景下，从码流中提取ILD和IPD，根据单声道频域信号以及ILD和IPD，得到左声道频域信号和右声道频域信号；在低码率的通信场景下，从码流中提取ILD，根据单声道频域信号以及ILD，得到左声道频域信号和右声道频域信号；将左声道频域信号和右声道频域信号分别进行频时变换得到左声道信号和右声道信号。上述低码率通信场景的立体声解码方法达到声场效果所参考的参数仅为ILD，也就是说，该解码方法得到的信号仅包含两声道信号间的能量大小信息，导致得到的左声道信号和右声道信号的立体声声场效果较差。

发明内容
本发明实施例提供了一种立体声解码方法及装置，使解码得到的第一声道信号和第二声道信号的立体声声场效果较优。本发明实施例提供的立体声解码方法，包括从接收到的码流中解码恢复出单声道信号；从所述接收到的码流中解码恢复出两声道信号间的电平差、群延时和群相位；根据所述两声道信号间的电平差、群延时和群相位，对所述单声道信号进行处理得到第一声道信号和第二声道信号。本发明实施例提供的立体声解码装置，包括信号解码模块，用于从接收到的码流中解码恢复出单声道信号；参数解码模块，用于从所述接收到的码流中解码恢复出两声道信号间的电平差、群延时和群相位；信号获取模块，用于根据所述两声道信号间的电平差、群延时和群相位，对所述单声道信号进行处理得到第一声道信号和第二声道信号。
本发明实施例提供的立体声解码方法及装置适用于低码率的通信场景，其中接收到的码流中包括编码的单声道信号，并且至少包括编码的ILD、群延时和群相位，群延时和群相位所占用的带宽资源较少，用两个全局的相位和相似信息来增强声场效果，达到在较小的码率下，提升声场效果；本发明实施例提供的立体声解码方法及装置根据单声道信号、 ILD、群延时和群相位，得到第一声道信号和第二声道信号，不仅参考ILD，还参考了群延时和群相位，也就是说，本发明实施例得到的信号不仅包含两声道信号间的能量大小信息，还包含两声道信号间的全局时间延时信息和全局波形相似性信息，这样得到的第一声道信号和第二声道信号的立体声声场效果较优。

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。图1为本发明实施例一提供的立体声解码方法的流程图；图2为本发明实施例二提供的立体声解码方法的流程图；图3为本发明实施例三提供的立体声解码方法的流程图；图4为本发明实施例四提供的立体声解码方法的流程图；图5为本发明实施例五提供的立体声解码方法的流程图；图6为本发明实施例六提供的立体声解码装置的结构示意图；图7为本发明实施例七提供的立体声解码装置的结构示意图；图8为本发明实施例八提供的立体声解码装置的结构示意图；图9为本发明实施例九提供的立体声解码装置的结构示意图；图10为本发明实施例十提供的立体声解码装置的结构示意图。
具体实施例方式下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。图1为本发明实施例一提供的立体声解码方法的流程图。如图1所示，本实施例包括如下步骤步骤100、从接收到的码流中解码恢复出单声道信号；步骤101、从接收到的码流中解码恢复出ILD、群延时(group delay)和群相位 (group phase)；其中，群延时表示两声道信号间包络的时间延时的全局方位信息，群相位表示两声道信号在时间对齐后的波形相似性的全局信息。步骤102、根据ILD、群延时和群相位，对单声道信号进行处理得到第一声道信号
和第二声道信号。
本实施例提供的立体声解码方法适用于低码率的通信场景，其中接收到的码流中包括编码的单声道信号，并且至少包括编码的ILD、群延时和群相位，群延时和群相位所占用的带宽资源较少，用两个全局的相位和相似信息来增强声场效果，达到在较小的码率下，提升声场效果；本实施例提供的立体声解码方法根据单声道信号、ILD、群延时和群相位，得到第一声道信号和第二声道信号，通过参考ILD使得得到的信号包含两声道信号间的能量大小信息，通过参考群延时和群相位使得得到的信号包含两声道信号间的全局时间延时信息和全局波形相似性信息，进而使得得到的第一声道信号和第二声道信号的立体声声场效果较优。
本发明实施例可以适用于低码率的通信场景。具体地，在上述实施例一的基础上，步骤102可以包括将单声道信号进行时频变换处理，得到单声道频域信号；根据群延时和群相位，得出IPD估计值；根据ILD和IPD估计值，对单声道频域信号进行处理得到第一声道频域信号和第二声道频域信号；将第一声道频域信号和第二声道频域信号分别进行频时变换处理，得到第一声道信号和第二声道信号。下面通过实施例二和实施三对该技术方案进行进一步说明。图2为本发明实施例二提供的立体声解码方法的流程图。本实施例中，第一声道为左声道，第二声道为右声道，如图2所示，本实施例包括如下步骤步骤200、从接收到的码流中解码恢复出单声道信号。具体地，从码流中提取单声道比特信号，经过单声道信号(Mono)解码器将单声道比特信号进行解码恢复出单声道信号，该单声道信号也称为下混信号。步骤201、从接收到的码流中解码恢复出ILD、群延时和群相位。其中群延时表示为dg'，群相位表示为θ/。一个正弦信号Sin(Wt),经过群相位后为 sin(wt-Q)。在 sin(wt-Q) = sin (w (t-Q/w))中，Q/w 就是群相位(group phase)。群延时(group delay)称为包络时延，信号传输时，总相移随角频率而变化的速度，亦即相位一频率特性曲线的斜率。对于一般的传输系统，传输函数可以写成H(jw) =A(w)-B(w)，其中，A(W)为幅度一频率特性，B(W)为相位一频率特性B(w)对w的一次导数，t(w) =dB(w)/ dw即为传输系统的群延时。步骤202、将单声道信号进行时频变换处理，得到单声道频域信号。将该单声道信号进行时频变换处理，得到单声道频域信号。单声道频域信号表示为 M' (k)。步骤203、根据群延时和群相位，得出IPD估计值。从码流中解码恢复出群延时dg'和群相位e g'，采用如下公式(1. 1)估计出IPD 估计值
-2nd kIPD\k) =-1~ + Θ'(1.1)
N κ将频域信号分成若干个频带，设将频域信号分成M个频带，k为频率点索引，b为频带索引，N为时频变换的长度，其中k = 0，...，N-I, b = 0，...，M-I0公式(1. 1)中， IPD' (k)为索引为k的频率点的IPD估计值。步骤204、根据ILD，对单声道频域信号的能量进行处理，得到左声道频域信号的能量和右声道频域信号的能量。
具体地，采用如下公式(1. 2)和(1. 3)得到左声道频域信号的能量IX' Jk) I和右声道频域信号的能量IX' 2(k) I \X\(k)\=\M\k)\*-^-( 1.2)\X\(k)HMXk)r—^-(1.3)
l + c(b)其中，c(b)= IOild' (b)/1°, ILD' (b)为索引为 b 的频带的 ILD，|M' (k) | 为单声道频域信号的能量。步骤205、根据ILD和IPD估计值，对单声道频域信号的相位进行处理，得到左声道频域信号的相位和右声道频域信号的相位。具体地，采用如下公式(1. 4)和(1. 5)得到左声道频域信号的相位Z X' Jk)和右声道频域信号的相位Z X' 2(k)ZX \ (k) = ZM \k) + -^--IPD \k)(1.4)
1 + c(b)ZX \ (k) = ZM \k) — ~IPD \k)(1.5)
\ + c(b)
其中，Z M' (k)为单声道频域信号的相位。本步骤采用由群延时dg'和群相位Qg'得到的IPD' (k)代替IPD来计算得到左右声道频域信号的相位。步骤206、根据左声道频域信号的能量和右声道频域信号的能量，以及左声道频域信号的相位和右声道频域信号的相位，得到左声道频域信号和右声道频域信号。具体地，采用如下公式(1. 6)和(1. 7)得到左声道频域信号X/ (k)和右声道频域信号X2' (k)X1' (k) = IX1' (k) |*eJZX1' (k)(1.6)X2 \k) =| X2 \k) I =Vz^W(1.7)步骤207、将左声道频域信号和右声道频域信号分别进行频时变换处理，得到左声道输出信号和右声道输出信号。本实施例提供的立体声解码方法适用于低码率的通信场景，其中接收到的码流包括编码的单声道信号，并且至少包括编码的ILD、群延时和群相位，群延时和群相位所占用的带宽资源较少，不会影响码率；本实施例提供的立体声解码方法根据ILD，通过对单声道频域信号的能量进行处理，得到左右声道信号的能量，根据由群延时和群相位得出的IPD 估计值和ILD，通过对单声道频域信号的能量进行处理，得到左右声道信号的相位，使得得到的信号不仅包含两声道信号间的能量大小信息，还包含两声道信号间的时间延时信息和波形相似性信息，进而使得得到的左声道信号和右声道信号的立体声声场效果较优。图3为本发明实施例三提供的立体声解码方法的流程图。本实施例中，第一声道为左声道，第二声道为右声道，如图3所示，本实施例包括如下步骤步骤300、从接收到的码流中解码恢复出单声道信号。具体地，从码流中提取单声道比特信号，经过单声道信号(Mono)解码器将单声道比特信号进行解码恢复出单声道信号，该单声道信号也称为下混信号。
步骤301、从接收到的码流中解码恢复出ILD、群延时和群相位。其中群延时表示为dg'，群相位表示为。步骤302、将单声道信号进行时频变换处理，得到单声道频域信号。将该单声道信号进行时频变换处理，得到单声道频域信号。单声道频域信号表示为 M' (k)。步骤303、根据群延时和群相位，得出IPD估计值。从码流中解码恢复出群延时dg'和群相位e g'，采用如下公式(2. 1)估计出IPD 估计值
权利要求
1.一种立体声解码方法，其特征在于包括从接收到的码流中解码恢复出单声道信号；从所述接收到的码流中解码恢复出两声道信号间的电平差、群延时和群相位；根据所述两声道信号间的电平差、群延时和群相位，对所述单声道信号进行处理得到第一声道信号和第二声道信号。
2.根据权利要求1所述的立体声解码方法，其特征在于，所述根据所述两声道信号间的电平差、群延时和群相位，对所述单声道信号进行处理得到第一声道信号和第二声道信号包括将所述单声道信号进行时频变换处理，得到单声道频域信号；根据所述群延时和群相位，得出两声道信号间的相位差估计值；根据所述两声道信号间的电平差和所述两声道信号间的相位差估计值，对所述单声道频域信号进行处理得到第一声道频域信号和第二声道频域信号；将所述第一声道频域信号和第二声道频域信号分别进行频时变换处理，得到所述第一声道信号和第二声道信号。
3.根据权利要求2所述的立体声解码方法，其特征在于，所述根据所述两声道信号间的电平差和所述两声道信号间的相位差估计值，对所述单声道频域信号进行处理得到第一声道频域信号和第二声道频域信号包括根据所述两声道信号间的电平差，对所述单声道频域信号的能量进行处理，得到第一声道频域信号的能量和第二声道频域信号的能量；根据所述两声道信号间的电平差和所述两声道信号间的相位差估计值，对所述单声道频域信号的相位进行处理，得到第一声道频域信号的相位和第二声道频域信号的相位。
4.根据权利要求2所述的立体声解码方法，其特征在于，所述根据所述两声道信号间的电平差和所述两声道信号间的相位差估计值，对所述单声道频域信号进行处理得到第一声道频域信号和第二声道频域信号包括根据所述两声道信号间的电平差，对所述单声道频域信号的能量进行处理，得到第一声道频域信号的能量和第二声道频域信号的能量；当所述群延时为0时，根据所述两声道信号间的相位差估计值，对所述单声道频域信号的相位进行处理，得到第一声道频域信号的相位和第二声道频域信号的相位；当所述群延时不为0时，根据所述两声道信号间的电平差和所述两声道信号间的相位差估计值，对所述单声道频域信号的相位进行处理，得到第一声道频域信号的相位和第二声道频域信号的相位。
5.根据权利要求1所述的立体声解码方法，其特征在于还包括从所述接收到的码流中解码恢复出两声道信号间的相位差的差分值；所述根据所述两声道信号间的电平差、群延时和群相位，对所述单声道信号进行处理得到第一声道信号和第二声道信号包括根据所述两声道信号间的电平差、两声道信号间的相位差的差分值、群延时和群相位，对所述单声道信号进行处理得到第一声道信号和第二声道信号。
6.根据权利要求5所述的立体声解码方法，其特征在于，所述根据所述两声道信号间的电平差、两声道信号间的相位差的差分值、群延时和群相位，对所述单声道信号进行处理得到第一声道信号和第二声道信号包括将所述单声道信号进行时频变换处理，得到单声道频域信号；根据所述群延时和群相位，得出两声道信号间的相位差估计值；根据所述两声道信号间的相位差估计值和所述两声道信号间的相位差的差分值，得到两声道信号间的相位差；根据所述两声道信号间的电平差和所述两声道信号间的相位差，对所述单声道频域信号进行处理得到第一声道频域信号和第二声道频域信号；将所述第一声道频域信号和第二声道频域信号分别进行频时变换处理，得到所述第一声道信号和第二声道信号。
7.根据权利要求6所述的立体声解码方法，其特征在于，所述根据所述两声道信号间的电平差和所述两声道信号间的相位差，对所述单声道频域信号进行处理得到第一声道频域信号和第二声道频域信号包括根据所述两声道信号间的电平差，对所述单声道频域信号的能量进行处理，得到第一声道频域信号的能量和第二声道频域信号的能量；根据所述两声道信号间的电平差和所述两声道信号间的相位差，对所述单声道频域信号的相位进行处理，得到第一声道频域信号的相位和第二声道频域信号的相位。
8.根据权利要求6所述的立体声解码方法，其特征在于，所述根据所述两声道信号间的电平差和所述两声道信号间的相位差，对所述单声道频域信号进行处理得到第一声道频域信号和第二声道频域信号包括根据所述两声道信号间的电平差，对所述单声道频域信号的能量进行处理，得到第一声道频域信号的能量和第二声道频域信号的能量；当所述群延时为0时，根据所述两声道信号间的电平差、所述两声道信号间的相位差和群相位，对所述单声道频域信号的相位进行处理，得到第一声道频域信号的相位和第二声道频域信号的相位；当所述群延时不为0时，根据所述两声道信号间的电平差和所述两声道信号间的相位差，对所述单声道频域信号的相位进行处理，得到第一声道频域信号的相位和第二声道频域信号的相位。
9.一种立体声解码装置，其特征在于包括信号解码模块，用于从接收到的码流中解码恢复出单声道信号；参数解码模块，用于从所述接收到的码流中解码恢复出两声道信号间的电平差、群延时和群相位；信号获取模块，用于根据所述两声道信号间的电平差、群延时和群相位，对所述单声道信号进行处理得到第一声道信号和第二声道信号。
10.根据权利要求9所述的立体声解码装置，其特征在于，所述信号获取模块包括第一处理子模块，用于将所述单声道信号进行时频变换处理，得到单声道频域信号；第一相位差获取子模块，用于根据所述群延时和群相位，得出两声道信号间的相位差估计值；第一频域信号获取子模块，用于根据所述两声道信号间的电平差和所述两声道信号间的相位差估计值，对所述单声道频域信号进行处理得到第一声道频域信号和第二声道频域信号；第一信号获取子模块，用于将所述第一声道频域信号和第二声道频域信号分别进行频时变换处理，得到所述第一声道信号和第二声道信号。
11.根据权利要求10所述的立体声解码装置，其特征在于，所述第一频域信号获取子模块包括第一能量获取单元，用于根据所述两声道信号间的电平差，对所述单声道频域信号的能量进行处理，得到第一声道频域信号的能量和第二声道频域信号的能量；第一相位获取单元，用于根据所述两声道信号间的电平差和所述两声道信号间的相位差估计值，对所述单声道频域信号的相位进行处理，得到第一声道频域信号的相位和第二声道频域信号的相位。
12.根据权利要求10所述的立体声解码装置，其特征在于，第一频域信号获取子模块包括第二能量获取单元，用于根据所述两声道信号间的电平差，对所述单声道频域信号的能量进行处理，得到第一声道频域信号的能量和第二声道频域信号的能量；第二相位获取单元，用于当所述群延时为0时，根据所述两声道信号间的相位差估计值，对所述单声道频域信号的相位进行处理，得到第一声道频域信号的相位和第二声道频域信号的相位；当所述群延时不为0时，根据所述两声道信号间的电平差和所述两声道信号间的相位差估计值，对所述单声道频域信号的相位进行处理，得到第一声道频域信号的相位和第二声道频域信号的相位。
13.根据权利要求9所述的立体声解码装置，其特征在于，所述参数解码模块还用于从所述接收到的码流中解码恢复出两声道信号间的相位差的差分值；所述信号获取模块具体用于根据所述两声道信号间的电平差、两声道信号间的相位差的差分值、群延时和群相位，对所述单声道信号进行处理得到第一声道信号和第二声道信号。
14.根据权利要求13所述的立体声解码装置，其特征在于，所述信号获取模块包括第二处理子模块，用于将所述单声道信号进行时频变换处理，得到单声道频域信号；第二相位差获取子模块，用于根据所述群延时和群相位，得出两声道信号间的相位差估计值；第三相位差获取子模块，用于根据所述两声道信号间的相位差估计值和所述两声道信号间的相位差的差分值，得到两声道信号间的相位差；第二频域信号获取子模块，用于根据所述两声道信号间的电平差和所述两声道信号间的相位差，对所述单声道频域信号进行处理得到第一声道频域信号和第二声道频域信号；第二信号获取子模块，用于将所述第一声道频域信号和第二声道频域信号分别进行频时变换处理，得到所述第一声道信号和第二声道信号。
15.根据权利要求14所述的立体声解码装置，其特征在于，所述第二频域信号获取子模块包括第三能量获取单元，用于根据所述两声道信号间的电平差，对所述单声道频域信号的能量进行处理，得到第一声道频域信号的能量和第二声道频域信号的能量；第三相位获取单元，用于根据所述两声道信号间的电平差和所述两声道信号间的相位差，对所述单声道频域信号的相位进行处理，得到第一声道频域信号的相位和第二声道频域信号的相位。
16.根据权利要求14所述的立体声解码装置，其特征在于，所述第二频域信号获取子模块包括第四能量获取单元，用于根据所述两声道信号间的电平差，对所述单声道频域信号的能量进行处理，得到第一声道频域信号的能量和第二声道频域信号的能量；第四相位获取单元，用于当所述群延时为0时，根据所述两声道信号间的电平差、所述两声道信号间的相位差和群相位，对所述单声道频域信号的相位进行处理，得到第一声道频域信号的相位和第二声道频域信号的相位；当所述群延时不为0时，根据所述两声道信号间的电平差和所述两声道信号间的相位差，对所述单声道频域信号的相位进行处理，得到第一声道频域信号的相位和第二声道频域信号的相位。
全文摘要
本发明实施例涉及一种立体声解码方法及装置，其中方法包括从接收到的码流中解码恢复出单声道信号；从所述接收到的码流中解码恢复出两声道信号间的电平差、群延时和群相位；根据所述两声道信号间的电平差、群延时和群相位，对所述单声道信号进行处理得到第一声道信号和第二声道信号。本发明实施例提供的立体声解码方法及装置根据单声道信号、ILD、群延时和群相位，得到第一声道信号和第二声道信号，不仅参考ILD，还参考了群延时和群相位，这样得到的第一声道信号和第二声道信号的立体声声场效果较优。
文档编号G10L19/00GK102157150SQ20101011143
公开日2011年8月17日申请日期2010年2月12日优先权日2010年2月12日
发明者吴文海, 张琦, 苗磊, 郎玥申请人:华为技术有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：吴文海;苗磊;郎玥;张琦
技术所有人：华为技术有限公司
我是此专利的发明人