立体声音频编码的方法及装置制造方法

文档序号：2825531阅读：202来源：国知局

立体声音频编码的方法及装置制造方法
【专利摘要】本发明公开了一种立体声音频编码的方法及装置，其中，该方法包括：获取立体声信号；根据上述立体声信号的相关性特征选择立体声压缩编码的输入信号；对上述输入信号进行编码。通过本发明，采用根据立体声信号的相关性特征选择立体声压缩编码的输入信号，对选择的输入信号进行编码，提高了立体声压缩编码的效率。
【专利说明】立体声音频编码的方法及装置【技术领域】
[0001]本发明涉及通信领域，具体而言，涉及一种立体声音频编码的方法及装置。
【背景技术】
[0002]近年来，随着通讯网络的宽带化，人们越来越需要具有亲临其境的现场感的通信语音，以及高质量的音乐。为了对应该需求，基于立体声的编码技术逐步应用于通讯系统中。
[0003]和差立体声编码(Mid-Side Coding)是对立体声进行编码的常用技术，该技术不是直接编码立体声的左右声道信号，而是先将左右声道信号变换成和差声道信号再进行编码，这样如果左右声道相关性很强，则可以非常有效地去除左右声道信号间的冗余以提高编码效率。
[0004]然而，即使左右声道信号的主分量(主要频率成分)相同，在声源激励位置不同的情况下，相同时刻的左右声道信号间相关性也较低。此时如果也简单地采用和差立体声编码，在声源激励位置差异很大的情况下，和差立体声编码方式反而会降低编码的效率。
[0005]针对相关技术中立体声压缩编码的效率低的问题，目前尚未提出有效的解决方案。

【发明内容】

[0006]针对相关技术中立体声压缩编码效率低的问题，本发明提供了一种立体声音频编码的方法及装置，以至少解决上述问题。
[0007]根据本发明的一个方面，提供了一种立体声音频编码的方法，包括:获取立体声信号；根据所述立体声信号的相关性特征选择立体声压缩编码的输入信号；对所述输入信号进行编码。
[0008]优选地，根据所述立体声信号的相关性特征选择所述立体声压缩编码的输入信号，包括:将所述立体声信号划分为高频信号和低频信号，其中，所述高频信号的频率大于等于第一预设值，所述低频信号的频率小于所述第一预设值；选择所述低频信号的和声道信号与差声道信号作为所述输入信号的低频部分；根据所述高频信号的相关性特征选择所述输入信号的高频部分；利用所述低频部分和所述高频部分合成所述输入信号。
[0009]优选地，根据所述高频信号的相关性特征选择所述输入信号的高频部分，包括:确定所述高频信号的相关性特征，其中，所述相关性特征包括两个或两个以上的特征参数；根据所述高频信号的相关性特征，判断并选择所述输入信号的所述高频部分；如果所述特征参数满足预设条件，选择高频信号的左声道和右声道作为所述输入信号的高频部分；如果所述特征参数不满足所述预设条件，选择高频信号的和声道与差声道作为所述输入信号的高频部分。
`[0010]优选地，确定所述高频信号的所述相关性特征，包括:确定所述高频信号的左声道和右声道的互相关系数以及第一特征，其中，所述第一特征为所述高频信号的左声道和右声道的能量中的最大值，与所述高频信号的左声道和右声道的能量中的最小值的比值；根据所述高频信号的相关性特征选择所述输入信号的高频部分，包括:如果所述互相关系数小于第二预设值且所述第一特征大于第三预设值，则选择所述高频信号的左声道和右声道作为所述输入信号的高频部分；否则，选择所述高频信号的和声道与差声道作为所述输入信号的高频部分。
[0011]优选地，确定所述高频信号的所述相关性特征，还包括:确定所述高频信号的左声道和右声道的互相关系数、第一特征以及第二特征，其中，所述第一特征为所述高频信号的左声道和右声道的能量中的最大值，与所述高频信号的左声道和右声道的能量中的最小值的比值；所述第二特征为所述高频信号的左声道信号与右声道信号的能量中的最小值，与所述高频信号的和声道信号和差声道信号的能量中的最小值的比值；根据所述高频信号的相关性特征选择所述输入信号的高频部分，包括:如果所述互相关系数小于第二预设值且所述第一特征大于第三预设值，或者所述第二特征小于第四预设值，选择所述高频信号的左声道和右声道作为所述输入信号的高频部分；否则，选择所述高频信号的和声道与差声道作为所述输入信号的高频部分。
[0012]根据本发明的另一个方面，提供了一种立体声音频编码的装置，包括:获取模块，用于获取立体声信号；选择模块，用于根据所述立体声信号的相关性特征选择立体声压缩编码的输入信号；编码模块，用于对所述输入信号进行编码。
[0013]优选地，所述选择模块包括:划分单元，用于将所述立体声信号划分为高频信号和低频信号，其中，所述高频信号的频率大于等于第一预设值，所述低频信号的频率小于所述第一预设值；低频输出单元，用于输出所述低频信号的和声道信号与差声道信号作为所述输入信号的低频部分；高频输出单元，用于根据所述高频信号的相关性特征选择并输出所述输入信号的高频部分；数据合成单元，用于利用所述输入信号的低频部分和高频部分，合成所述输入信号。
[0014]优选地，所述高频输出单元包括:特征计算单元，用于确定所述高频信号的所述相关性特征，其中，所述相关性特征包括两个或两个以上的特征参数；判断单元，根据所述高频信号的相关性特征，判断并选择所述输入信号的所述高频部分；第一输出单元，用于在所述特征参数满足预设条件的情况下，输出所述高频信号的左声道和右声道作为所述输入信号的高频部分；第二输出单元，用于在所述特征参数不满足所述预设条件的情况下，输出所述高频信号的和声道与差声道作为所述输入信号的高频部分。
[0015]优选地，所述特征计算单元，用于确定所述高频信号的左声道和右声道的互相关系数以及第一特征，其中，所述第一特征为所述高频信号的左声道和右声道的能量中的最大值，与所述高频信号的左声道和右声道的能量中的最小值的比值；所述判断单元，用于在所述互相关系数小于第二预设值且所述第一特征大于第三预设值的情况下，选择所述第一输出单元；否则，选择所述第二输出单元。
[0016]优选地，所述特征计算单元，还用于确定所述高频信号的左声道和右声道的互相关系数、第一特征以及第二特征，其中，所述第一特征为所述高频信号的左声道和右声道的能量中的最大值，与所述高频信号的左声道和右声道的能量中的最小值的比值；所述第二特征为所述高频信号的左声道和右声道的能量中的最小值，与所述高频信号的和声道与差声道的能量中的最小值的比值；所述判断单元，还用于在所述互相关系数小于第二预设值且所述第一特征大于第三预设值，或者所述第二特征小于第四预设值的情况下，选择所述第一输出单元；否则，选择所述第二输出单元。
[0017]通过本发明，采用获取立体声信号，根据立体声信号的相关性特征选择立体声压缩编码的输入信号，对选择的输入信号进行编码的技术方案，解决了相关技术中立体声压缩编码的效率低的问题，进而达到了提高立体声压缩编码效率的效果。
【专利附图】

【附图说明】
[0018]此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中:
[0019]图1是根据本发明实施例的立体声音频编码装置的结构框图；
[0020]图2是根据本发明实施例优选的选择模块的结构框图；
[0021]图3是根据本发明实施例优选的高频输出单元的结构框图；
[0022]图4是根据本发明实施例的立体声音频编码方法的流程图；
[0023]图5是根据本发明实施例实施方式一输入信号确定方法的流程图；以及
[0024]图6是根据本发明实施例实施方式二输入信号确定方法的流程图。
【具体实施方式】
[0025]下文中将参考附图并结合实施例来详细说明本发明。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。
[0026]根据本发明实施例，提供了一种可根据立体声的左右声道信号间的相关性特征来动态判决和选择更合适于立体声压缩编码的输入数据的装置及其方法，在立体声左右两个声道相关性较低的情况下，通过选择冗余性少的线性变换的信号，提高立体声压缩编码效率，获得高质量的立体声音质。
[0027]在本发明实施例中，以立体声信号的采样率是48kHz，编码码率是64kbps，编码帧长为20ms为例，分别对本发明实施例的装置和方法进行描述。
[0028]图1是根据本发明实施例的立体声音频编码的装置的结构框图。如图1所示，该装置主要包括:获取模块10、选择模块20和编码模块30。
[0029]获取模块10,用于获取立体声信号；
[0030]选择模块20，与获取模块10相连接，用于根据立体声信号的相关性特征选择立体声压缩编码的输入信号；
[0031]编码模块30，与选择模块20相连接，用于对选择的输入信号进行编码。
[0032]通过本发明实施例，根据立体声信号的相关性特征动态选择立体声压缩编码的输入信号，提高了立体声信号压缩编码的效率。
[0033]图2是根据本发明实施例优选的选择模块的结构框图。如图2所示，选择模块20主要包括:
[0034]划分单元202，用于将立体声信号划分为高频信号和低频信号，其中，高频信号的频率大于等于第一预设值，低频信号的频率小于第一预设值。优选地，本实施例中的高低频划分界限是2kHz，即第一预设值取值为2kHz。在实际应用中，还可以将所述输入信号的高频频段进行扩展到全频带，即第一预设值取零值的情况。此时，全频带的信号均根据所述相关性特征来选择所述输入信号。
[0035]在本发明实施例中，以改进离散余弦变换(Modified Discrete CosineTransform，简称为MDCT)域的划分为例进行说明，每个声道信号按照统一规则划分为低频和高频两个频带，分别将左声道频域信号表示为XS右声道频域信号表示为Xk，高频信号的左声道表示为低频信号的左声道表示为X/，高频信号的右声道表示为Xa'低频信号的右声道表示为，其中,Xi = [Xf Xt] ’XR = [Xf Xf] c
[0036]进一步地对Xf , Xi , Xf , JTf 的定义如下:Xf = {# |0</S80),Xf ={Xl；\0<i< SOj -X；； = {X!?\S0<i< 960} ,x；! = {Xll |80< /< 960!,其中，下标 I 表示 MDCT
系数的序号。
[0037]进一步地定义和声道信号ΧΜ=Χι+Χκ，差声道信号Xs=X1-Xk ；
[0038]优选地，和差声道也按照划分单元202进行频带划分，划分为高频信号的和声道与低频信号的和声道X高频信号的差声道与低频信号的差声道Xf=[xr Xf]，
Is? l.[0039]低频输出单元204，与划分单元202相连接，用于输出低频信号的和声道与低频信号的差声道作为输入信号的低频部分；
[0040]高频输出单元206，与划分单元202相连接，用于根据高频信号的相关性特征选择并输出输入信号的高频部分。
[0041]数据合成单元208，与低频输出单元204和高频输出单元206相连接，用于利用所述输入信号的低频部分和高频部分，合成所述输入信号。
[0042]图3是根据本发明实施例优选的高频输出单元的结构框图，如图3所示，高频输出单元206可以包括:
[0043]特征计算单元2062，用于确定所述高频信号的所述相关性特征，其中，所述相关性特征包括两个或两个以上的特征参数；
[0044]判断单元2064，与特征计算单元2062相连接，用于根据所述高频信号的相关性特征，判断并选择输入信号的高频部分；
[0045]第一输出单元2066，与判断单元2064相连接，用于在所述特征参数满足预设条件的情况下，输出所述高频信号的左声道和右声道作为所述输入信号的高频部分；
[0046]第二输出单元2068，与判断单元2064相连接，用于在所述特征参数不满足所述预设条件的情况下，输出所述高频信号的和声道与差声道作为所述输入信号的高频部分。
[0047]通过本优选实施方式，对于相关性大的立体声信号，选择高频信号的和声道与高频信号的差声道作为立体声压缩编码的输入信号的高频部分，可以降低输入信号的冗余性，对于相关性小的立体声信号，选择高频信号的左声道和高频信号的右声道作为立体声压缩编码的输入信号的高频部分，避免了采用和差编码时编码效率低的问题。
[0048]下面对根据不同特征参数确定相关性来选择输入信号的实施方式进行描述。
[0049]方式一
[0050]在本发明实施例实施方式一中，特征计算单元2062，用于确定高频信号的左声道和右声道的互相关系数以及第一特征，其中，第一特征为高频信号的左声道和右声道的能量比值，在本发明实施例中可以是能量的最大值与最小值的比值；判断单元2064，用于在所述互相关系数小于第二预设值且所述第一特征大于第三预设值的情况下，选择第一输出单元2066 ;否则，选择第二输出单元2068。
[0051]在本发明实施例实施方式一中，优选地，第二预设值取0.7，第三预设值取0.9。
[0052]优选地，特征计算单元2062可以按照以下方式确定高频信号的左声道的能量和高频信号的右声道的能量:
[0053]高频信号的左声道的能量
【权利要求】
1.一种立体声音频编码的方法，其特征在于，包括: 获取立体声信号；根据所述立体声信号的相关性特征选择立体声压缩编码的输入信号；对所述输入信号进行编码。
2.根据权利要求1所述的方法，其特征在于，根据所述立体声信号的相关性特征选择所述立体声压缩编码的输入信号，包括: 将所述立体声信号划分为高频信号和低频信号，其中，所述高频信号的频率大于等于第一预设值，所述低频信号的频率小于所述第一预设值；选择所述低频信号的和声道信号与差声道信号作为所述输入信号的低频部分；根据所述高频信号的相关性特征选择所述输入信号的高频部分；利用所述低频部分和所述高频部分合成所述输入信号。
3.根据权利要求2所述的方法，其特征在于，根据所述高频信号的相关性特征选择所述输入信号的高频部分，包括: 确定所述高频信号的相关性特征，其中，所述相关性特征包括两个或两个以上的特征参数；根据所述高频信号的相关性特征，判断并选择所述输入信号的所述高频部分；如果所述特征参数满足预设条件，选择高频信号的左声道和右声道作为所述输入信号的闻频部分；如果所述特征参数不满足所述预设条件，选择高频信号的和声道与差声道作为所述输入信号的高频部分。
4.根据权利要求3所述的方法，其特征在于，确定所述高频信号的所述相关性特征，包括:确定所述高频信号的左声道和右声道的互相关系数以及第一特征，其中，所述第一特征为所述高频信号的左声道和右声道的能量中的最大值，与所述高频信号的左声道和右声道的能量中的最小值的比值；根据所述高频信号的相关性特征选择所述输入信号的高频部分，包括:如果所述互相关系数小于第二预设值且所述第一特征大于第三预设值，则选择所述高频信号的左声道和右声道作为所述输入信号的高频部分；否则，选择所述高频信号的和声道与差声道作为所述输入信号的高频部分。
5.根据权利要求3所述的方法，其特征在于，确定所述高频信号的所述相关性特征，还包括:确定所述高频信号的左声道和右声道的互相关系数、第一特征以及第二特征，其中，所述第一特征为所述高频信号的左声道和右声道的能量中的最大值，与所述高频信号的左声道和右声道的能量中的最小值的比值；所述第二特征为所述高频信号的左声道信号与右声道信号的能量中的最小值，与所述高频信号的和声道信号和差声道信号的能量中的最小值的比值；根据所述高频信号的相关性特征选择所述输入信号的高频部分，包括:如果所述互相关系数小于第二预设值且所述第一特征大于第三预设值，或者所述第二特征小于第四预设值，选择所述高频信号的左声道和右声道作为所述输入信号的高频部分；否则，选择所述高频信号的和声道与差声道作为所述输入信号的高频部分。
6.一种立体声音频编码的装置，其特征在于，包括:获取模块，用于获取立体声信号；选择模块，用于根据所述立体声信号的相关性特征选择立体声压缩编码的输入信号；编码模块，用于对所述输入信号进行编码。
7.根据权利要求6所述的装置，其特征在于，所述选择模块包括: 划分单元，用于将所述立体声信号划分为高频信号和低频信号，其中，所述高频信号的频率大于等于第一预设值，所述低频信号的频率小于所述第一预设值；低频输出单元，用于输出所述低频信号的和声道信号与差声道信号作为所述输入信号的低频部分；高频输出单元，用于根据所述高频信号的相关性特征选择并输出所述输入信号的高频部分；数据合成单元，用于利用所述输入信号的低频部分和高频部分，合成所述输入信号。
8.根据权利要求7所述的装置，其特征在于，所述高频输出单元包括: 特征计算单元，用于确定所述高频信号的所述相关性特征，其中，所述相关性特征包括两个或两个以上的特征参数；判断单元，根据所述高频信号的相关性特征，判断并选择所述输入信号的所述高频部分；第一输出单元，用于在所·述特征参数满足预设条件的情况下，输出所述高频信号的左声道和右声道作为所述输入信号的高频部分；第二输出单元，用于在所述特征参数不满足所述预设条件的情况下，输出所述高频信号的和声道与差声道作为所述输入信号的高频部分。
9.根据权利要求8所述的装置，其特征在于，所述特征计算单元，用于确定所述高频信号的左声道和右声道的互相关系数以及第一特征，其中，所述第一特征为所述高频信号的左声道和右声道的能量中的最大值，与所述高频信号的左声道和右声道的能量中的最小值的比值；所述判断单元，用于在所述互相关系数小于第二预设值且所述第一特征大于第三预设值的情况下，选择所述第一输出单元；否则，选择所述第二输出单元。
10.根据权利要求8所述的装置，其特征在于，所述特征计算单元，用于确定所述高频信号的左声道和右声道的互相关系数、第一特征以及第二特征，其中，所述第一特征为所述高频信号的左声道和右声道的能量中的最大值，与所述高频信号的左声道和右声道的能量中的最小值的比值；所述第二特征为所述高频信号的左声道和右声道的能量中的最小值，与所述高频信号的和声道与差声道的能量中的最小值的比值；所述判断单元，还用于在所述互相关系数小于第二预设值且所述第一特征大于第三预设值，或者所述第二特征小于第四预设值的情况下，选择所述第一输出单元；否则，选择所述第二输出单元。
【文档编号】G10L19/008GK103854650SQ201210504521
【公开日】2014年6月11日申请日期:2012年11月30日优先权日:2012年11月30日
【发明者】王杨忠, 白雪, 袁浩申请人:中兴通讯股份有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王杨忠;白雪;袁浩
技术所有人：中兴通讯股份有限公司
我是此专利的发明人

上一篇：集群通信中的声音信号处理方法和装置制造方法
上一篇：用于合成语音的方法和装置制造方法