立体声信号下混方法、编解码装置和编解码系统的制作方法

文档序号：2823341阅读：219来源：国知局

专利名称：立体声信号下混方法、编解码装置和编解码系统的制作方法
技术领域：
本发明涉及音频编解码技术领域，具体涉及立体声信号下混技术。
背景技术：
在立体声编码技术中，通常需要将左L和右R两路声道信号下混(downmix)，获得单声道M信号，并将M信号和作为边带信号的左右声道的声场信息传输至解码端。上述左右声道的声场信息如左右声道信号电平差以及左右声道信号相位差等。左右声道信号电平差具体可以为ICLDanterChannelLevel Difference，立体声声道间电平差)或CLD (Channel Level Difference，声道间电平差)等。左右声道信号相位差具体可以为IPD (Hiterchannel PhaseDifference,立体声声道相位差)等。目前的立体声信号下混方法主要包括如下两种方法一利用m(n) = 0. 5 · (X1 (η)+ (η))来获得单声道信号m(n)，其中的η为时间索引，X1(Ii)和分别为时间索引为η时的左右两路时域声道信号，0. 5为下混因子，该下混因子也可以采用其它数值。方法二将左右两路声道信号进行时频变换，在频域调整声道信号的幅度和/或相位，利用调整后的声道信号进行下混获得频域单声道信号，并将频域单声道信号转换为时域单声道信号。上述调整声道信号的相位即以一路声道信号的相位为基准，旋转另一路声道信号的相位，使两路声道信号的相位相同。在实现本发明的过程中，发明人发现在方法一中，当左右两路声道信号完全反相且幅度相同时，获得的下混信号为0，从而解码端无法恢复出左右两路声道信号；另外，在左右两路声道信号不完全反相的情况下，获得的下混信号会出现能量缺失现象。在方法二中，如果在频域只调整声道信号的幅度而不进行相位调整，则仍然会存在下混信号为0以及能量缺失的现象；如果在频域进行了声道信号相位的调整，则在基准声道信号为噪声的情况下，会出现另一路声道信号基本上被噪声掩盖的现象，而且，在基准声道信号相位变化大的情况下，下混信号相位会出现较大的跳变。

发明内容
本发明实施方式提供的立体声信号下混方法、编解码装置和编解码系统，可以避免在左右两路声道信号完全反相且幅度相同的情况下，解码端无法恢复出左右两路声道信号的现象；而且，可以避免下混信号的能量缺失现象；另外本发明实施例获得的下混信号能够充分反映立体声信号的声场特点。本发明实施方式提供的立体声信号下混方法，包括将立体声信号中的第一路时域声道信号和第二路时域声道信号转换为第一路频域声道信号和第二路频域声道信号；获得所述第一路频域声道信号和第二路频域声道信号的频域声道信号电平差和频域声道信号相位差；
针对各频带中的各频率点，利用基于所述频域声道信号电平差和频域声道信号相位差的函数计算获得相位位于第一路频域声道信号相位和第二路频域声道信号相位之间的下混信号相位；针对各频带中的各频率点，计算获得下混信号幅度；根据所述下混信号相位和所述下混信号幅度获得频域下混信号。本发明实施方式提供的获得立体声信号的方法，包括获取解码后的频域下混信号、每个频带的频域声道信号电平差和每个频带的频域声道信号相位差；根据所述频域下混信号、基于所述频域声道信号电平差和频域声道信号相位差的函数、所述频域声道信号电平差和所述频域声道信号相位差获得第一路和第二路频域声道信号幅度和相位；根据所述第一路和第二路频域声道信号幅度和相位合成第一路频域声道信号和第二路频域声道信号；将所述第一路频域声道信号和第二路频域声道信号转换为第一路时域声道信号和第二路时域声道信号。本发明实施方式提供的编码装置，包括时频变换模块，用于将立体声第一路时域声道信号和第二路时域声道信号转换为第一路频域声道信号和第二路频域声道信号；第一获取模块，用于获得所述第一路频域声道信号和第二路频域声道信号的频域声道信号电平差和频域声道信号相位差；第二获取模块，用于针对各频带中的各频率点，利用基于所述频域声道信号电平差和频域声道信号相位差的函数计算获得相位位于第一路频域声道信号相位和第二路频域声道信号相位之间的下混信号相位；第三获取模块，用于针对各频带中的各频率点，计算获得下混信号幅度；下混模块，用于根据所述下混信号相位和所述下混信号幅度获得频域下混信号。本发明实施方式提供的解码装置，包括第四获取模块，用于获取解码后的频域下混信号、每个频带的频域声道信号电平差和每个频带的频域声道信号相位差；重建模块，用于根据所述频域下混信号、基于所述频域声道信号电平差和频域声道信号相位差的函数、所述频域声道信号电平差和所述频域声道信号相位差获得第一路和第二路频域声道信号幅度和相位；合成模块，用于根据所述第一路和第二路频域声道信号幅度和相位合成第一路频域声道信号和第二路频域声道信号；频时变换模块，用于将所述第一路频域声道信号和第二路频域声道信号转换为第一路时域声道信号和第二路时域声道信号。本发明实施方式提供的编解码系统，包括编码装置，用于将立体声第一路时域声道信号和第二路时域声道信号转换为第一路频域声道信号和第二路频域声道信号，获得所述第一路频域声道信号和第二路频域声道信号的频域声道信号电平差和频域声道信号相位差，针对各频带中的各频率点，利用基于所述频域声道信号电平差和频域声道信号相位差的函数计算获得相位位于第一路频域声道信号相位和第二路频域声道信号相位之间的下混信号相位；针对各频带中的各频率点，计算获得下混信号幅度；根据所述下混信号相位和所述下混信号幅度获得频域下混信号；对所述频域下混信号进行编码或者将所述频域下混信号转换为时域下混信号并对所述时域下混信号进行编码获得下混单声道信号；对每个频带的频域声道信号电平差和频域声道信号相位差进行量化编码，发送所述下混单声道信号和所述量化编码；解码装置，用于根据接收的所述下混单声道信号获取解码后的频域下混信号，根据接收的所述量化编码获取每个频带的频域声道信号电平差和每个频带的频域声道信号相位差，根据所述频域下混信号、所述函数、所述频域声道信号电平差和所述频域声道信号相位差获得第一路和第二路频域声道信号幅度和相位，根据所述第一路和第二路频域声道信号幅度和相位合成第一路频域声道信号和第二路频域声道信号；将所述第一路频域声道信号和第二路频域声道信号转换为第一路时域声道信号和第二路时域声道信号。通过上述技术方案的描述可知，通过利用基于频域声道信号电平差和频域声道信号相位差的函数使下混信号相位位于第一路频域声道信号相位和第二路频域声道信号相位之间，避免了在左右两路声道信号完全反相且幅度相同的情况下，下混信号为0的现象，从而避免了解码端无法恢复出左右两路声道信号的现象，而且，还可以避免下混信号的能量缺失现象；由于下混信号位于第一路频域声道信号相位和第二路频域声道信号相位之间，因此，本发明实施例获得的下混信号能够充分反映立体声信号的声场特点，最终提高了立体声编解码的主观质量。

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。图IA是本发明实施例一的立体声信号下混方法框图；图IB是本发明实施例一的下混信号相位和左右声道信号相位关系示意图；图IC是本发明实施例一的编码端对下混信号进行编码的框图；图2是本发明实施例二的获得立体声信号的方法框图；图3A是本发明实施例三的立体声信号下混方法框图；图;3B是本发明实施例三的下混信号相位和左右声道信号相位关系示意图；图4是本发明实施例五的立体声信号下混方法框图；图5是本发明实施例七的编码装置示意图；图6是本发明实施例八的解码装置示意图；图7是本发明实施例九的编解码系统示意图。
具体实施例方式下面通过实施例对本发明的具体实现过程进行例举说明。显然，下面所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。实施例一、立体声信号下混方法。下面结合附图1A、附图IB和附图1C，以左声道信号为第一路声道信号，右声道信号为第二路声道信号为例对本实施例进行说明。明显的，以右声道信号为第一路声道信号，以左声道信号为第二路声道信号的情况，本实施例也是可以完全可行的。实施例一的实现框图如附图IA所示。在图IA中，S100、在编码端，对接收到的立体声时域左声道信号和时域右声道信号分别进行时频变换，这样，时域左声道信号被变换为频域左声道信号，时域右声道信号被变换为频域右声道信号。本实施例可以采用FFTpast FourierTransform，快速傅立叶变换)或者QMF(Quadrature Mirror Filter，正交镜像滤波器)等方式进行立体声信号的时频变换。本实施例不限制对时域左声道信号和时域右声道信号进行时频变换的具体实现过程。S110、获得频域左声道信号和频域右声道信号的频域声道信号电平差和频域声道信号相位差。本实施例中的频域左声道信号和频域右声道信号均被划分为若干个频带(频域左声道信号和频域右声道信号的频带划分相同)，频带宽度可以根据实际应用来设置，如频带宽度可以设置为1 (即一个频率点表示一个频带)，再如针对高频信号频带宽度可以设置的宽一些，而针对低频信号频带宽度可以设置的窄一些等。如果使用k表示频率点索引且使用b表示频带索引，则^c1GO表示频域左声道信号，)(2(k)表示频域右声道信号，kb表示第 b个频带的起始频率点索引。在本实施例中，获得频域左声道信号和频域右声道信号的频域声道信号电平差和频域声道信号相位差为获得频域左声道信号和频域右声道信号的基于频带或频率点的频域声道信号电平差和频域声道信号相位差。获取频域声道信号电平差和频域声道信号相位差的方式可以包括多种，例如、获取各频带的频域声道信号电平差和各频带的频域声道信号相位差；再例如、获取各频带中各频率点的频域声道信号电平差和各频带中各频率点的频域声道信号相位差；再例如，针对部分频带(如对立体声参数较敏感的声道信号所在的频带)，获取频带的频域声道信号电平差和频带的频域声道信号相位差，针对另一部分频带 (如对立体声参数较不敏感的声道信号所在的频带)，获取频带中各频率点的频域声道信号电平差和频带中各频率点的频域声道信号相位差。一个具体例子为如果一个频带中的声道信号为低频信号，则可以获取该频带的频域声道信号电平差和频域声道信号相位差，如果一个频带中的声道信号为高频信号，则可以获取该频带中的各频率点的频域声道信号电平差和频域声道信号相位差。利用频率点的频域声道信号电平差和频域声道信号相位差来获得下混信号相位能够更加准确的反映出立体声信号的声场特点。上述每个频带的声道信号电平差可以根据每个频带的频域左声道信号能量与频域右声道信号能量的比值获得，上述每个频率点的声道信号电平差可以根据每个频率点的频域左声道信号能量与频域右声道信号能量的比值获得。上述每个频带的频域声道信号相位差可以利用每个频带的频域左声道信号与频域右声道信号的互相关相位来表示，上述每个频率点的频域声道信号相位差可以利用每个频率点的频域左声道信号与频域右声道信号的互相关相位来表示，当然，也可以采用其它方式来表示每个频带或每个频率点的频域声道信号相位差，本实施例不限制每个频带或每个频率点的频域声道信号相位差的具体表不方式。获取每个频带的频域声道信号电平差和频域声道信号相位差的一个具体的例子为
权利要求
1.一种立体声信号下混方法，其特征在于，包括将立体声信号中的第一路时域声道信号和第二路时域声道信号转换为第一路频域声道信号和第二路频域声道信号；获得所述第一路频域声道信号和第二路频域声道信号的频域声道信号电平差和频域声道信号相位差；针对各频带中的各频率点，利用基于所述频域声道信号电平差和频域声道信号相位差的函数计算获得相位位于第一路频域声道信号相位和第二路频域声道信号相位之间的下混信号相位；针对各频带中的各频率点，计算获得下混信号幅度；根据所述下混信号相位和所述下混信号幅度获得频域下混信号。
2.如权利要求1所述的方法，其特征在于，所述获得所述第一路频域声道信号和第二路频域声道信号的频域声道信号电平差和频域声道信号相位差包括获得所述第一路频域声道信号和第二路频域声道信号的每个频带的频域声道信号电平差和频域声道信号相位差；或者获得所述第一路频域声道信号和第二路频域声道信号的每个频率点的频域声道信号电平差和频域声道信号相位差；或者获得所述第一路频域声道信号和第二路频域声道信号的部分频带的频域声道信号电平差和频域声道信号相位差、以及所述第一路频域声道信号和第二路频域声道信号的另一部分频带中的每个频率点的频域声道信号电平差和频域声道信号相位差。
3.如权利要求1所述的方法，其特征在于所述函数使下混信号相位与能量高的一路频域声道信号相位的夹角小于下混信号相位与能量低的一路频域声道信号相位的夹角。
4.如权利要求1所述的方法，其特征在于，所述基于频域声道信号电平差和频域声道信号相位差的函数包括利用一路频域声道信号相位、第一路频域声道信号与第二路频域声道信号电平差以及第一路频域声道信号与第二路频域声道信号相位差构建的第一函数。
5.如权利要求4所述的方法，其特征在于所述第一函数包括
6.如权利要求1所述的方法，其特征在于，所述基于频域声道信号电平差和频域声道信号相位差的函数包括利用一路频域声道信号相位、群相位、第一路频域声道信号与第二路频域声道信号电平差以及第一路频域声道信号与第二路频域声道信号相位差构建的第二函数。
7.如权利要求6所述的方法，其特征在于第二函数包括
8.如权利要求1所述的方法，其特征在于，所述基于频域声道信号电平差和频域声道信号相位差的函数包括利用一路频域声道信号相位、第一路频域声道信号与第二路频域声道信号电平差以及第一路频域声道信号与第二路频域声道信号相位差构建的第一函数；和，利用一路频域声道信号相位、群相位、第一路频域声道信号与第二路频域声道信号电平差以及第一路频域声道信号与第二路频域声道信号相位差构建的第二函数；且所述利用基于频域声道信号电平差和频域声道信号相位差的函数计算获得相位位于第一路频域声道信号相位和第二路频域声道信号相位之间的下混信号相位包括获取群延时，如果群延时为0，则利用第二函数计算获得相位位于第一路频域声道信号相位和第二路频域声道信号相位之间的下混信号相位，否则，利用第一函数计算获得相位位于第一路频域声道信号相位和第二路频域声道信号相位之间的下混信号相位。
9.如权利要求1至8中任一权利要求所述的方法，其特征在于，所述方法还包括对所述频域下混信号进行编码获得频域下混单声道比特流，并向解码端发送所述频域下混单声道比特流；或者将所述频域下混信号转换为时域下混信号，对所述时域下混信号进行编码获得时域下混单声道比特流，并向解码端发送所述时域下混单声道比特流。
10.一种获得立体声信号的方法，其特征在于，所述方法包括获取解码后的频域下混信号、每个频带的频域声道信号电平差和每个频带的频域声道信号相位差；根据所述频域下混信号、基于所述频域声道信号电平差和频域声道信号相位差的函数、所述频域声道信号电平差和所述频域声道信号相位差获得第一路和第二路频域声道信号幅度和相位；根据所述第一路和第二路频域声道信号幅度和相位合成第一路频域声道信号和第二路频域声道信号；将所述第一路频域声道信号和第二路频域声道信号转换为第一路时域声道信号和第二路时域声道信号。
11.一种编码装置，其特征在于，包括时频变换模块，用于将立体声第一路时域声道信号和第二路时域声道信号转换为第一路频域声道信号和第二路频域声道信号；第一获取模块，用于获得所述第一路频域声道信号和第二路频域声道信号的频域声道信号电平差和频域声道信号相位差；第二获取模块，用于针对各频带中的各频率点，利用基于所述频域声道信号电平差和频域声道信号相位差的函数计算获得相位位于第一路频域声道信号相位和第二路频域声道信号相位之间的下混信号相位；第三获取模块，用于针对各频带中的各频率点，计算获得下混信号幅度；下混模块，用于根据所述下混信号相位和所述下混信号幅度获得频域下混信号。
12.如权利要求11所述的装置，其特征在于，所述第二获取模块包括第一子模块，用于存储有利用一路频域声道信号相位、第一路频域声道信号与第二路频域声道信号电平差以及第一路频域声道信号与第二路频域声道信号相位差构建的第一函数，利用所述第一函数计算获得下混信号相位；或者第二子模块，用于存储有利用一路频域声道信号相位、群相位、第一路频域声道信号与第二路频域声道信号电平差以及第一路频域声道信号与第二路频域声道信号相位差构建的第二函数，利用第二函数计算获得下混信号相位。
13.如权利要求11所述的装置，其特征在于，所述第二获取模块包括第一子模块，用于存储有利用一路频域声道信号相位、第一路频域声道信号与第二路频域声道信号电平差以及第一路频域声道信号与第二路频域声道信号相位差构建的第一函数，利用所述第一函数计算获得下混信号相位；第二子模块，用于存储有利用一路频域声道信号相位、群相位、第一路频域声道信号与第二路频域声道信号电平差以及第一路频域声道信号与第二路频域声道信号相位差构建的第二函数，利用第二函数计算获得下混信号相位；第三子模块，用于获取群延时，如果群延时为0，则通知第二子模块计算获得下混信号相位，否则，通知第一子模块计算获得下混信号相位。
14.如权利要求11或12或13所述的装置，其特征在于，所述装置还包括频域单声道编码器，用于对所述频域下混信号进行编码获得频域下混单声道比特流，并向解码端发送所述频域下混单声道比特流；或者所述装置还包括频时变换模块，用于将所述频域下混信号转换为时域下混信号；时域单声道编码器，用于对所述时域下混信号进行编码获得时域下混单声道比特流，并向解码端发送所述时域下混单声道比特流。
15.一种解码装置，其特征在于，所述装置包括第四获取模块，用于获取解码后的频域下混信号、每个频带的频域声道信号电平差和每个频带的频域声道信号相位差；重建模块，用于根据所述频域下混信号、基于所述频域声道信号电平差和频域声道信号相位差的函数、所述频域声道信号电平差和所述频域声道信号相位差获得第一路和第二路频域声道信号幅度和相位；合成模块，用于根据所述第一路和第二路频域声道信号幅度和相位合成第一路频域声道信号和第二路频域声道信号；频时变换模块，用于将所述第一路频域声道信号和第二路频域声道信号转换为第一路时域声道信号和第二路时域声道信号。
16.一种编解码系统，其特征在于，包括编码装置，用于将立体声第一路时域声道信号和第二路时域声道信号转换为第一路频域声道信号和第二路频域声道信号，获得所述第一路频域声道信号和第二路频域声道信号的频域声道信号电平差和频域声道信号相位差，针对各频带中的各频率点，利用基于所述频域声道信号电平差和频域声道信号相位差的函数计算获得相位位于第一路频域声道信号相位和第二路频域声道信号相位之间的下混信号相位；针对各频带中的各频率点，计算获得下混信号幅度；根据所述下混信号相位和所述下混信号幅度获得频域下混信号；对所述频域下混信号进行编码或者将所述频域下混信号转换为时域下混信号并对所述时域下混信号进行编码获得下混单声道信号；对每个频带的频域声道信号电平差和频域声道信号相位差进行量化编码，发送所述下混单声道信号和所述量化编码；解码装置，用于根据接收的所述下混单声道信号获取解码后的频域下混信号，根据接收的所述量化编码获取每个频带的频域声道信号电平差和每个频带的频域声道信号相位差，根据所述频域下混信号、所述函数、所述频域声道信号电平差和所述频域声道信号相位差获得第一路和第二路频域声道信号幅度和相位，根据所述第一路和第二路频域声道信号幅度和相位合成第一路频域声道信号和第二路频域声道信号；将所述第一路频域声道信号和第二路频域声道信号转换为第一路时域声道信号和第二路时域声道信号。
全文摘要
公开了立体声信号下混方法、编解码装置和编解码系统。其中下混方法包括将第一路时域声道信号和第二路时域声道信号转换为第一路频域声道信号和第二路频域声道信号，获得上述两路频域声道信号的频域声道信号电平差和频域声道信号相位差；针对各频带中的各频率点，利用基于上述电平差和相位差的函数计算获得相位位于两路频域声道信号相位之间的下混信号相位，并计算获得下混信号幅度；根据上述相位和幅度获得频域下混信号。上述技术方案可以避免在左右两路声道信号完全反相且幅度相同的情况下，解码端无法恢复出左右两路声道信号的现象；而且，还可以改善下混信号的能量缺失的现象，同时，获得的下混信号能够充分反映立体声信号的声场特点。
文档编号G10L19/00GK102157149SQ20101011065
公开日2011年8月17日申请日期2010年2月12日优先权日2010年2月12日
发明者吴文海, 苗磊, 郎玥申请人:华为技术有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：苗磊;吴文海;郎玥
技术所有人：华为技术有限公司
我是此专利的发明人

上一篇：便携式听音设备中的音频处理的制作方法
上一篇：一种基于语音分段的孤立词识别方法