一种下混信号生成、还原的方法和装置的制作方法

文档序号：2835918阅读：226来源：国知局

专利名称：一种下混信号生成、还原的方法和装置的制作方法
技术领域：
本发明涉及立体声编码解码领域，具体涉及一种下混信号生成、还原的方法和装置。
背景技术：
在现有立体声编码方法中，绝大多数方法都是将左右两路声道信号下混得到一个单声道信号，而将左右声道的声场信息作为边带信号传输。左右声道的声场信息通常包括左右声道的能量比、左右声道的相位差、左右声道的互相关参数，及第一声道或第二声道与下混信号的相位差参数。现有方法将这些参数作为边信息进行编码并发送到解码端，以恢复立体声信号。在这类方法中，下混方法、左右声道的声场信息提取及合成都属于核心技术，目前业界也有许多研究成果。现有的立体声下混方法可以分为被动下混和主动下混两种。被动下混算法比较简单、延时较低，下混因子一般采用0. 5来计算。m(n) =0.5· (X1 (η) +χ2 (η))。其中X1 (η)、& (η)分别表示左声道信号、右声道信号，m(n)表示下混信号。当左右声道完全反相且幅度相同时，下混信号为0，解码端根本没有办法恢复左右两路声道。即使不完全反相，也会带来下混信号能量缺失。为了解决被动算法造成的下混信号能量缺失问题，主动下混算法首先将左右两路信号进行时频变换，在频域调整信号的幅度和或相位，从而最大程度的保持下混信号的能量。以下是一个调整相位的例子首先对左信号、右信号进行时频变换得到& (k)、X2 (k)，在频域计算每个子带内的相位差；再根据相位差对右路信号进行相位旋转，得到相位旋转后的信号j^(A),旋转后右声道信号的相位和左路信号相位保持一致。然后根据如下公式将相位调整后的夂丨(幻与 X^k)相加并乘以0.5后得到频域的下混信号，MO) = Q+5e(^^) + 4@));最后通过时频
逆变换得到时域的下混信号。这种方法能解决左右声道信号反相的能量缺失问题。但现有的下混方法存在左右声道反相且经常跳变以及左右声道相位差别变换较快的立体声信号的下混性能问题，降低了立体声编解码的主观质量。

发明内容
本发明实施例提供了一种下混信号生成、还原的方法和装置，以提高立体声编解码的质量。本发明实施例提供了一种下混信号的生成方法，方法包括对左声道信号和右声道信号进行时频变换得到频域信号，将所述频域信号划分成若干频带；计算每个频带的声道能量比和声道相位差，所述声道能量比反映了左声道信号和右声道信号在每个频带的能量比信息，所述声道相位差反映了左声道信号和右声道信号在每个频带的相位差信息；根据所述声道能量比和所述声道相位差计算所述下混信号和第一声道信号在每个频带的相位差，所述第一声道信号是所述左声道信号或所述右声道信号；根据所述左声道信号、右声道信号、以及所述下混信号和第一声道信号在每个频带的相位差计算频域下混信号。本发明实施例提供了下混信号的生成装置，包括时频变换单元，用于对接收的左声道信号和右声道信号进行时频变换得到频域信号，将所述频域信号划分成若干频带；频带计算单元，用于计算每个频带的声道能量比和声道相位差，所述声道能量比反映了左声道信号和右声道信号在每个频带的能量比信息，所述声道相位差反映了左声道信号和右声道信号在每个频带的相位差信息；相位差计算单元，用于根据声道能量比和声道相位差计算所述下混信号和第一声道信号在每个频带的相位差，所述第一声道信号是所述左声道信号或所述右声道信号；频域下混信号计算单元下混信号计算单元，用于根据所述左声道信号、右声道信号、以及所述下混信号和第一声道信号在每个频带的相位差计算频域下混信号。本发明实施例提供了一种下混信号的还原方法，包括根据下混信号的频域信号幅度、接收到的声道能量比分别计算左声道信号的频域信号幅度、右声道信号的频域信号幅度，所述声道能量比反映了左声道信号和右声道信号在每个频带的能量比信息；根据所述下混信号的频域信号相位、所述声道能量比和接收到的声道相位差分别计算左声道信号的频域信号相位、右声道信号的频域信号相位，所述声道相位差反映了左声道信号和右声道信号在每个频带的相位差信息；根据左声道信号的频域信号幅度、频域信号相位合成左声道信号的频域信号，根据右声道信号的频域信号幅度、频域信号相位合成右声道信号的频域信号。本发明实施例提供了一种下混信号的还原装置，其特征在于，包括信号幅度计算单元用于根据所述下混信号的频域信号幅度、接收的声道能量比分别计算左声道信号的频域信号幅度、右声道信号的频域信号幅度，所述声道量比反映了左声道信号和右声道信号在每个频带的能量比信息；信号相位计算单元用于根据所述下混信号的频域信号相位、所述声道能量比和接收到的声道相位差分别计算左声道信号的频域信号相位、右声道信号的频域信号相位，所述声道相位差反映了左声道信号和右声道信号在每个频带的相位差信息；频域信号计算单元用于根据左声道信号的频域信号幅度、频域信号相位合成左声道信号的频域信号，根据右声道信号的频域信号幅度、频域信号相位合成右声道信号的频域信号。本发明实施例的方法和装置，减少左右声道反相、跳变及左右声道相位差别变换较快等因素对下混性能的干扰，有效的提高了立体声编解码的质量。

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。图1为本发明下混信号的生成方法的一个实施例的流程图；图2为本发明下混信号的生成装置的一个实施例的结构图；图3为本发明下混信号的还原方法的一个实施例的流程8
图4为本发明下混信号的还原装置的一个实施例的结构图。本领域技术人员可以理解附图只是一个优选实施例的示意图，附图中的模块或流程并不一定是实施本发明所必须的。
具体实施例方式为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。本发明实施例提供了一种下混信号的生成方法，方法包括对接收的左声道信号和右声道信号进行时频变换得到频域信号，将所述频域信号划分成若干频带；计算每个频带的声道能量比(Channel Level Difference, CLD)和声道相位差 (Internal Phase Difference, IPD)，所述声道能量比反映了左声道信号和右声道信号在每个频带的能量比信息，所述声道相位差反映了左声道信号和右声道信号在每个频带的相位差信息；根据声道能量比和声道相位差计算下混信号和第一声道信号在每个频带的相位差，所述第一声道信号是所述左声道信号或所述右声道信号；根据所述左声道信号、右声道信号、所述下混信号和第一声道信号在每个频带的相位差计算频域下混信号。请参考附图1，图1为由左声道信号和右声道信号生成下混信号方法的一个实施例的流程图，步骤包括SlOl对接收的左声道信号和右声道信号进行时频变换得到频域信号，将所述频域信号划分成若干频带；S103计算每个频带的声道能量比和声道相位差；S105计算下混信号和第一声道信号在每个频带的相位差；S107计算频域下混信号。SlOl对左声道信号和右声道信号进行时频变换，在具体的实施方法中，可以使用傅立叶变换(Fourier Transform，FT)、快速傅立叶变换(Fast Fourier Transform, FFT) > 正交镜像变换(Quadrature Mirror Filterbanks,QMF)等变换方法。左声道信号和右声道信号变换到频域，分别得到L (k)和R(k)。将频域信号分成若干频带，在本发明的一个实施例中，频带宽度为1。设k为频率点索引，b为频带索引，1Λ为第b个频带的起始频率点索引。S103计算每个频带的CLD和IPD，包括根据如下公式计算

权利要求
1.一种下混信号的生成方法，其特征在于，方法包括对左声道信号和右声道信号进行时频变换得到频域信号，将所述频域信号划分成若干频带；计算每个频带的声道能量比和声道相位差，所述声道能量比反映了左声道信号和右声道信号在每个频带的能量比信息，所述声道相位差反映了左声道信号和右声道信号在每个频带的相位差信息；根据所述声道能量比和所述声道相位差计算所述下混信号和第一声道信号在每个频带的相位差，所述第一声道信号是所述左声道信号或所述右声道信号；根据所述左声道信号、右声道信号、以及所述下混信号和第一声道信号在每个频带的相位差计算频域下混信号。
2.根据权利要求1所述的方法，其特征在于，所述第一声道信号是左声道信号、右声道信号中信号幅度更大的信号，所述根据所述声道能量比和所述声道相位差计算所述下混信号和第一声道信号在每个频带的相位差包括根据声道能量比和声道相位差计算所述下混信号和左声道信号、右声道信号中信号幅度更大的信号在每个频带的相位差。
3.根据权利要求1或2所述的方法，其特征在于，所述第一声道是所述左声道，所述根据声道能量比和声道相位差计算所述下混信号和第一声道信号在每个频带的相位差包括，根据如下公式计算c(b) = 10CLD(b)/1° ；
4.根据权利要求3所述的方法，其特征在于，所述第一声道是所述左声道，所述根据所述左声道信号、右声道信号、所述下混信号和第一声道信号在每个频带的相位差计算频域下混信号包括，根据如下公式计算
5.根据权利要求1或2所述的方法，其特征在于，所述第一声道是所述右声道，所述根据所述声道能量比和所述声道相位差计算下混信号和第一声道信号在每个频带的相位差包括，根据如下公式计算c(b) = 10CLD(b)/1° ；
6.根据权利要求5所述的方法，其特征在于，所述第一声道是所述右声道，所述根据所述左声道信号、右声道信号、所述下混信号和第一声道信号在每个频带的相位差计算频域下混信号包括，根据如下公式计算
7.根据权利要求4或6所述的方法，其特征在于，在所述根据声道能量比和声道相位差计算下混信号和第一声道信号在每个频带的相位差之后，还包括所述下混信号和第一声道在每个频带的相位差根据群相位更新，所述群相位反映了左声道信号和右声道信号的频域包络相似性，根据所述左声道信号、右声道信号、以及所述下混信号和第一声道信号在每个频带的相位差计算频域下混信号包括根据所述左声道信号、右声道信号、以及更新后的所述下混信号和第一声道信号在每个频带的相位差计算频域下混信号。
8.—种下混信号的生成装置，其特征在于，包括时频变换单元，用于对接收的左声道信号和右声道信号进行时频变换得到频域信号，将所述频域信号划分成若干频带；频带计算单元，用于计算每个频带的声道能量比和声道相位差，所述声道能量比反映了左声道信号和右声道信号在每个频带的能量比信息，所述声道相位差反映了左声道信号和右声道信号在每个频带的相位差信息；相位差计算单元，用于根据所述声道能量比和所述声道相位差计算所述下混信号和第一声道信号在每个频带的相位差，所述第一声道信号是所述左声道信号或所述右声道信号；下混信号计算单元，用于根据所述左声道信号、右声道信号、以及所述下混信号和第一声道信号在每个频带的相位差计算频域下混信号。
9.根据权利要求8所述的装置，其特征在于，所述相位差计算单元用于根据所述声道能量比和所述声道相位差计算所述下混信号和左声道信号、右声道信号中幅度更大的声道信号在每个频带的相位差。
10.根据权利要求8或9所述的装置，其特征在于，所述第一声道是所述右声道，所述相位差计算单元用于根据如下公式计算下混信号和第一声道信号在每个频带的相位差；
11.根据权利要求10所述的装置，其特征在于，所述第一声道是所述左声道，所述下混信号计算单元用于根据如下公式计算频域下混信号
12.根据权利要求8或9所述的装置，其特征在于，所述第一声道是所述左声道，所述相位差计算单元用于根据如下公式计算所述下混信号和第一声道信号在每个频带的相位差c(b) = 10_10;
13.根据权利要求12所述的装置，其特征在于，所述第一声道是所述右声道，所述述下混信号计算单元，用于根据如下公式计算频域下混信号
14.根据权利要求11或13所述的装置，其特征在于，所述相位差计算单元在用于根据声道能量比和声道相位差计算下混信号和第一声道信号在每个频带的相位差之后，还用于将所述下混信号和第一声道的相位差根据群相位更新，所述群相位反映了左声道信号和右声道信号的频域包络相似性。
15.一种下混信号的还原方法，其特征在于，包括根据下混信号的频域信号幅度、接收到的声道能量比分别计算左声道信号的频域信号幅度、右声道信号的频域信号幅度，所述声道能量比反映了左声道信号和右声道信号在每个频带的能量比信息；根据所述下混信号的频域信号相位、所述声道能量比和接收到的声道相位差分别计算左声道信号的频域信号相位、右声道信号的频域信号相位，所述声道相位差反映了左声道信号和右声道信号在每个频带的相位差信息；根据左声道信号的频域信号幅度、频域信号相位合成左声道信号的频域信号，根据右声道信号的频域信号幅度、频域信号相位合成右声道信号的频域信号。
16.根据权利要求15所述的方法，其特征在于，所述根据所述下混信号的频域信号幅度、接收的声道能量比分别计算左声道信号的频域信号幅度、右声道信号的频域信号幅度具体包括，根据如下公式计算
17.根据权利要求15所述的方法，其特征在于，所述根据下混信号的频域信号相位、声道能量比和声道相位差分别计算左声道信号的频域信号相位、右声道信号的频域信号相位具体包括，根据如下公式计算
18.—种下混信号的还原装置，其特征在于，包括信号幅度计算单元用于根据所述下混信号的频域信号幅度、接收的声道能量比分别计算左声道信号的频域信号幅度、右声道信号的频域信号幅度，所述声道量比反映了左声道信号和右声道信号在每个频带的能量比信息；信号相位计算单元用于根据所述下混信号的频域信号相位、所述声道能量比和接收到的声道相位差分别计算左声道信号的频域信号相位、右声道信号的频域信号相位，所述声道相位差反映了左声道信号和右声道信号在每个频带的相位差信息；频域信号计算单元用于根据左声道信号的频域信号幅度、频域信号相位合成左声道信号的频域信号，根据右声道信号的频域信号幅度、频域信号相位合成右声道信号的频域信号。
19.根据权利要求18所述的装置，其特征在于，所述信号幅度计算单元用于根据如下公式计算左声道信号的频域信号幅度、右声道信号的频域信号幅度
20.根据权利要求18所述的装置，其特征在于，所述信号相位计算单元用于根据如下公式计算左声道信号的频域信号相位、右声道信号的频域信号相位c(b) = 10CLD(b)/1°
全文摘要
本发明实施例提供了一种下混信号的生成方法，包括对接收的左声道信号和右声道信号进行时频变换得到频域信号，将所述频域信号划分成若干频带；计算每个频带的声道能量比和声道相位差；根据声道能量比和声道相位差计算所述下混信号和第一声道信号在每个频带的相位差；根据所述左声道信号、右声道信号、所述下混信号和第一声道信号在每个频带的相位差计算频域下混信号。该方法有效的提高了立体声编解码的质量。
文档编号G10L19/02GK102446507SQ20111028939
公开日2012年5月9日申请日期2011年9月27日优先权日2011年9月27日
发明者吴文海, 大卫·维雷特, 苗磊, 郎玥申请人:华为技术有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：吴文海;苗磊;郎玥;大卫·维雷特
技术所有人：华为技术有限公司
我是此专利的发明人