对多声道信号的声道延迟参数进行修正的方法

文档序号:7729176阅读:373来源:国知局
专利名称:对多声道信号的声道延迟参数进行修正的方法
技术领域
本发明涉及通信技术领域,尤其涉及一种对多声道信号的声道延迟参数进行修正的方法。
背景技术
多声道信号有着广泛的应用场景,如电话会议,游戏等,多声道信号的编解码也越来越受到重视。基于波形编码的传统的编码器,如MPEG (Moving Pictures Experts Group, 动态图像专家组)-LII,mp3 (Moving Picture Experts Group Audio Layer III,动态景i像专家压缩标准音频层面3)和AAC (Advanced Audio Coding,高级音频编码),在对多声道信号进行编码时,都是对每一个声道进行独立编码。这种编码方法虽然能较好的恢复出多声道信号,但是需要的带宽、编码码率是单声道信号的数倍。立体声或多声道编码技术是参数立体声编码,其利用很少的带宽就可以重建出听觉感受完全和原始信号相同的多声道信号。参数立体声编码的基本思路是在编码端,将多声道信号下混成一个单声道信号,并对该单声道信号进行独立编码,同时提取各声道间的声道参数,再对这些声道参数进行编码。在解码端,首先解码出下混后的单声道信号,然后解码出各个声道间的声道参数,最后利用这些声道参数与下混后的单声道信号一起合成出多声道信号。在参数立体声编码中,通常用来描述各声道间相互关系的声道参数有声道间时间差参数(即声道延迟参数)、声道间幅度差参数及声道间相关性参数等。上述声道延迟参数代表了声道间的延时关系,对说话人的位置定位有着重要的作用。以立体声信号为例,现有技术中的一种传输多声道信号的方案为利用立体声的左右声道信号的相关性来提取左右声道之间的声道延迟参数,利用该声道延迟参数,在编码端对需要传输的立体声信号的左/右声道信号进行延时调整,消除两个声道之间的延时差别。然后,对延时调整后的左/右声道信号在时域相加得到下混后的M信号(和信号), 对延时调整后的左/右声道信号在时域相减得到下混后的S信号(边信号)。然后,根据上述M信号和S信号,提取其它声道参数,如左右声道之间的能量比率或者声道间幅度差参数等,在编码端,对上述声道参数进行编码传输,并对M信号按照单声道方式进行编码传输。在解码端首先重构出M信号,然后根据接收到的上述声道延迟参数, 对M信号的各声道进行和编码端相逆的延时操作,重构出上述传输的立体声信号。从而实现在传输单声道信号的基础上,只需要少量的码率资源传输声道参数,就可以在解码端重构出立体声信号。在实现本发明过程中,发明人发现现有技术中至少存在如下问题现有技术中下混处理后得到的处理信号(包括M信号、S信号)可能出现梳状滤波效应,即M信号和S信号中至少一个信号的某些特定频带内的信号频域幅值会被很大地衰减,某些特定频带内的信号频域幅值会被加强。上述梳状滤波效应将使得处理信号的质量下降,进而影响到重构的多声道信号的质量。

发明内容
本发明的实施例提供了一种对多声道信号的声道延迟参数进行修正的方法,以减弱由于梳状滤波效应导致的处理信号的质量不好的现象。本发明实施例提出了一种对多声道信号的声道延迟参数进行修正的方法,包括对多声道信号进行下混处理获得处理信号;计算所述处理信号的能量分布;根据所述处理信号的能量分布,判断所述处理信号是否出现了梳状滤波效应,如果是,则对所述多声道信号的声道延迟参数进行修正。由上述本发明的实施例提供的技术方案可以看出,本发明实施例根据多声道信号下混处理后获得的处理信号的能量分布,判断是否出现了梳状滤波效应,当确定出现了梳状滤波效应后,则对所述多声道信号的声道延迟参数进行修正,从而可以减弱梳状滤波效应,进而提高重构的多声道信号的声像质量和清晰度。


为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本发明实施例一提供的一种对多声道信号的声道延迟参数进行修正的方法的处理流程图;图2为本发明实施例一提供的另一种对多声道信号的声道延迟参数进行修正的方法的处理流程图;图3为本发明实施例一提供的一种对多声道信号的声道延迟参数进行修正的装置的具体实现结构图。
具体实施例方式为便于对本发明实施例的理解,下面将结合附图以几个具体实施例为例做进一步的解释说明,且各个实施例并不构成对本发明实施例的限定。本发明实施例提供了一种对多声道信号的声道延迟参数进行修正的方法,如图1 所示,所述方法包括步骤101 对多声道信号进行下混处理获得处理信号;步骤102 计算所述处理信号的能量分布;步骤103 根据所述处理信号的能量分布,判断所述处理信号是否出现了梳状滤波效应,如果是,则对所述多声道信号的声道延迟参数进行修正。在本发明实施例具体实施时,对多声道信号进行下混处理获得处理信号,所述处理信号包括M信号、S信号。本领域技术人员可以理解的是,处理信号出现梳状滤波效应包括以下任意一种M信号出现梳状滤波效应;S信号出现梳状滤波效应;M信号和S信号都出现梳状滤波效应。
本发明实施例根据多声道信号下混处理后获得的处理信号的能量分布,判断是否出现了梳状滤波效应,当确定出现了梳状滤波效应后,则对所述多声道信号的声道延迟参数进行修正,从而可以减弱梳状滤波效应,进而提高重构的多声道信号的声像质量和清晰度。需要说明的是,具体实施本发明时,在一般的情况下,采用本发明的方案可以消除梳状滤波效应。下面以具体的应用场景实施例进行说明,为了方便描述,下面统一用立体声(左右两个声道)来描述本发明实施例,但需要明确的是本发明实施例并不局限于立体声,也同样适应于其他多声道。当输入信号不是只有左右两个声道的立体声信号时,而是包含多于两个声道的多声道信号时,可以将该多声道信号转换为立体声信号,具体转换公式如下
权利要求
1.一种对多声道信号的声道延迟参数进行修正的方法,其特征在于,包括 对多声道信号进行下混处理获得处理信号;计算所述处理信号的能量分布;根据所述处理信号的能量分布,判断所述处理信号是否出现了梳状滤波效应,如果是, 则对所述多声道信号的声道延迟参数进行修正。
2.根据权利要求1所述的方法,其特征在于,所述对多声道信号进行下混处理获得处理信号包括对所述多声道信号的当前帧信号进行下混处理获得和信号和边信号; 或者,对所述多声道信号的当前帧信号进行下采样,对下采样后的下采样信号进行下混处理获得和信号和边信号。
3.根据权利要求1或2任一项所述的方法,其特征在于, 所述对多声道信号进行下混处理获得处理信号包括获取所述多声道信号的当前帧的声道延迟参数,根据该当前帧的声道延迟参数对所述多声道信号进行下混,得到下混后的和信号和边信号; 所述计算所述处理信号的能量分布包括将所述边信号中的每个采样点的能量参数的叠加值除以所述和信号中的每个采样点的能量参数的叠加值,得到第一能量参数比值。
4.根据权利要求3所述的方法,其特征在于,所述根据所述处理信号的能量分布,判断所述处理信号是否出现了梳状滤波效应包括当所述第一能量参数比值大于预定的第一门限值时,则判定所述处理信号出现了梳状滤波效应;或者,当长时平滑处理后的第一能量参数比值大于预定的第二门限值时,则判定所述处理信号出现了梳状滤波效应。
5.根据权利要求3所述的方法,其特征在于, 所述计算所述处理信号的能量分布还包括计算所述多声道信号的零延时对应的互相关系数,并进行长时平滑处理,得到长时平滑处理后的互相关系数;所述根据所述处理信号的能量分布,判断所述处理信号是否出现了梳状滤波效应包括当所述长时平滑处理后的互相关系数大于预定的第五门限值,并且,所述第一能量参数比值大于预定的第一门限值,则判定所述处理信号出现了梳状滤波效应;或,当所述长时平滑处理后的互相关系数大于预定的第五门限值,并且,长时平滑处理后的所述第一能量参数比值大于预定的第二门限值,则判定所述处理信号出现了梳状滤波效应。
6.根据权利要求3所述的方法,其特征在于,所述对多声道信号进行下混处理获得处理信号还包括根据为零值的声道延迟参数对所述多声道信号进行下混,得到下混后的第二和信号和第二边信号;所述计算所述处理信号的能量分布还包括将所述第二边信号中的每个采样点的能量参数的叠加值除以所述第二和信号中的每个采样点的能量参数的叠加值,得到第二能量参数比值;将所述第一能量参数比值除以所述第二能量参数比值,得到第三能量参数比值;或者, 对所述第一能量参数比值、第二能量参数比值分别进行长时平滑处理,将长时平滑处理后的第一能量参数比值除以长时平滑处理后的第二能量参数比值,得到第三能量参数比值。
7.根据权利要求6所述的方法,其特征在于,所述根据所述处理信号的能量分布,判断所述处理信号是否出现了梳状滤波效应包括当所述第三能量参数比值大于预定的第三门限值时,则判定所述处理信号出现了梳状滤波效应。
8.根据权利要求6所述的方法,其特征在于, 所述计算所述处理信号的能量分布还包括对所述第三能量参数比值进行去除基底处理后,得到第四能量参数比值,对所述第四能量参数比值进行长时平滑处理,得到长时平滑处理后的第四能量参数比值。
9.根据权利要求8所述的方法,其特征在于,所述根据所述处理信号的能量分布,判断所述处理信号是否出现了梳状滤波效应包括当长时平滑处理后的第四能量参数比值大于预定的第四门限值时,则判定所述处理信号出现了梳状滤波效应。
10.根据权利要求6所述的方法,其特征在于, 所述计算所述处理信号的能量分布还包括计算所述多声道信号的零延时对应的互相关系数,并进行长时平滑处理,得到长时平滑处理后的互相关系数;所述根据所述处理信号的能量分布,判断所述处理信号是否出现了梳状滤波效应包括当所述长时平滑处理后的互相关系数大于预定的第五门限值,并且,所述第三能量参数比值大于预定的第三门限值,则判定所述处理信号出现了梳状滤波效应。
11.根据权利要求8所述的方法,其特征在于, 所述计算所述处理信号的能量分布还包括计算所述多声道信号的零延时对应的互相关系数,并进行长时平滑处理,得到长时平滑处理后的互相关系数;所述根据所述处理信号的能量分布,判断所述处理信号是否出现了梳状滤波效应包括当所述长时平滑处理后的互相关系数大于预定的第五门限值,并且,所述长时平滑处理后的第四能量参数比值大于预定的第四门限值时,则判定所述处理信号出现了梳状滤波效应。
12.根据权利要求1所述的方法,其特征在于,所述对所述多声道信号的声道延迟参数进行修正,具体包括将所述多声道信号的当前帧的声道延迟参数置为零值;或,计算出所述多声道信号的零延时对应的互相关系数,增大所述零延时对应的互相关系数;或,计算出所述多声道信号的零延时对应的归一化互相关系数,增大所述零延时对应的归一化互相关系数。
13.根据权利要求12所述的方法,其特征在于,所述增大所述零延时对应的互相关系数,具体包括将所述零延时对应的互相关系数加上一个常量;或者,将所述零延时对应的互相关系数乘以一个常量;或者,将所述零延时对应的互相关系数乘以一个放大因子,该放大因子根据所述处理信号的能量分布得到。
14.根据权利要求1所述的方法,其特征在于,所述方法还包括在将所述多声道信号的当前帧信号的声道延迟参数进行修正后,修正所述当前帧之后拖尾范围内的帧的声道延迟参数。
全文摘要
本发明实施例提供了一种对多声道信号的声道延迟参数进行修正的方法。该方法主要包括对多声道信号进行下混处理获得处理信号;计算所述处理信号的能量分布;根据所述处理信号的能量分布,判断所述处理信号是否出现了梳状滤波效应,如果是,则对所述多声道信号的声道延迟参数进行修正。本发明根据对多声道信号进行下混处理后获得的处理信号的能量分布,判断是否出现了梳状滤波效应,从而判断是否需要对声道延迟参数进行修正,以消除梳状滤波效应,进而提供较好的重构立体声等多声道信号的声像及清晰度。
文档编号H04R5/04GK102307323SQ20111020495
公开日2012年1月4日 申请日期2009年4月20日 优先权日2009年4月20日
发明者张琦, 张立斌 申请人:华为技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1