对多声道信号的声道延迟参数进行修正的方法和装置的制作方法

文档序号:2832099研发日期:2009年阅读:559来源:国知局
技术简介:
本专利针对多声道信号处理中因声道延迟参数不当引发的梳状滤波效应问题,提出通过下混处理获取信号能量分布,结合互相关系数分析判断滤波效应存在性,并采用置零延迟参数或调整互相关系数等方法进行修正,有效提升重构信号的声像定位与清晰度。
关键词:梳状滤波修正,声道延迟参数,下混处理
专利名称:对多声道信号的声道延迟参数进行修正的方法和装置的制作方法
技术领域
本发明涉及通信技术领域,尤其涉及一种对多声道信号的声道延迟参数 进行修正的方法和装置。
背景4支术
多声道信号有着广泛的应用场景,如电话会议,游戏等,多声道信号的
编解码也越来越受到重视。基于波形编码的传统的编码器,如MPEG (Moving Pictures Experts Group,动态图4象专家组)-LII, mp3 (Moving Picture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3) 和AAC (Advanced Audio Coding,高级音频编码),在对多声道信号进行编 码时,都是对每一个声道进行独立编码。这种编码方法虽然能较好的恢复出 多声道信号,但是需要的带宽、编码码率是单声道信号的数倍。
立体声或多声道编码技术是参数立体声编码,其利用很少的带宽就可以 重建出听觉感受完全和原始信号相同的多声道信号。参数立体声编码的基本 思路是在编码端,将多声道信号下混成一个单声道信号,并对该单声道信 号进行独立编码,同时提取各声道间的声道参数,再对这些声道参数进行编 码。在解码端,首先解码出下混后的单声道信号,然后解码出各个声道间的 声道参数,最后利用这些声道参数与下混后的单声道信号一起合成出多声道 信号。
在参数立体声编码中,通常用来描述各声道间相互关系的声道参数有声 道间时间差参数(即声道延迟参数)、声道间幅度差参数及声道间相关性参数等。上述声道延迟参数代表了声道间的延时关系,对说话人的位置定位有 着重要的作用。
以立体声信号为例,现有技术中的一种传输多声道信号的方案为利用
立体声的左右声道信号的相关性来提取左右声道之间的声道延迟参数,利用 该声道延迟参数,在编码端对需要传输的立体声信号的左/右声道信号进行延 时调整,消除两个声道之间的延时差别。然后,对延时调整后的左/右声道信
号在时域相加得到下混后的M信号(和信号),对延时调整后的左/右声道信 号在时域相减得到下混后的S信号(边信号)。
然后,根据上述M信号和S信号,提取其它声道参数,如左右声道之间的 能量比率或者声道间幅度差参数等,在编码端,对上述声道参数进行编码传 输,并对M信号按照单声道方式进行编码传输。在解码端首先重构出M信号, 然后根据接收到的上述声道延迟参数,对M信号的各声道进行和编码端相逆 的延时操作,重构出上述传输的立体声信号。从而实现在传输单声道信号的 基础上,只需要少量的码率资源传输声道参数,就可以在解码端重构出立体 声信号。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题现有 技术中下混处理后得到的处理信号(包括M信号、S信号)可能出现梳状滤 波效应,即M信号和S信号中至少一个信号的某些特定频带内的信号频域幅值 会被很大地衰减,某些特定频带内的信号频域幅值会被加强。上述梳状滤波 效应将使得处理信号的质量下降,进而影响到重构的多声道信号的质量。

发明内容
本发明的实施例提供了 一种对多声道信号的声道延迟参数进行修正的方 法和装置,以减弱由于梳状滤波效应导致的处理信号的质量不好的现象。
本发明实施例提出了一种对多声道信号的声道延迟参数进行修正的方 法,包括对多声道信号进行下混处理获得处理信号; 计算所述处理信号的能量分布;
根据所述处理信号的能量分布,判断所述处理信号是否出现了梳状滤波 效应,如果是,则对所述多声道信号的声道延迟参数进行修正。
本发明实施例提出了一种对多声道信号的声道延迟参数进行修正的装 置,包括
下混处理模块,用于对多声道信号进行下混处理获得处理信号; 能量分布获取模块,用于计算所述处理信号的能量分布; 判断模块,用于根据所述处理信号的能量分布,判断所述处理信号是否 出现了^f危状滤波效应;
声道延迟参数修正模块,用于当所述判断模块判定所述处理信号出现了 梳状滤波效应时,对所述多声道信号的声道延迟参数进行修正。
由上述本发明的实施例提供的技术方案可以看出,本发明实施例根据多 声道信号下混处理后获得的处理信号的能量分布,判断是否出现了梳状滤波 效应,当确定出现了梳状滤波效应后,则对所述多声道信号的声道延迟参数 进行修正,从而可以减弱梳状滤波效应,进而提高重构的多声道信号的声像 质量和清晰度。


为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所 需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发 明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的 前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例一提供的一种对多声道信号的声道延迟参数进行修正 的方法的处理流程图;图2为本发明实施例一提供的另 一种对多声道信号的声道延迟参数进行修
正的方法的处理流程图3为本发明实施例一提供的一种对多声道信号的声道延迟参数进行修正 的装置的具体实现结构图。
具体实施例方式
为便于对本发明实施例的理解,下面将结合附图以几个具体实施例为例 做进一步的解释说明,且各个实施例并不构成对本发明实施例的限定。
本发明实施例提供了 一种对多声道信号的声道延迟参数进行修正的方 法,如图1所示,所述方法包括
步骤101:对多声道信号进行下混处理获得处理信号;
步骤102:计算所述处理信号的能量分布;
步骤103:根据所述处理信号的能量分布,判断所述处理信号是否出现了 梳状滤波效应,如果是,则对所述多声道信号的声道延迟参数进行修正。
在本发明实施例具体实施时,对多声道信号进行下混处理获得处理信 号,所述处理信号包括M信号、S信号。本领域技术人员可以理解的是,处理 信号出现梳状滤波效应包括以下任意一种M信号出现梳状滤波效应;S信号 出现梳状滤波效应;M信号和S信号都出现梳状滤波效应。
本发明实施例根据多声道信号下混处理后获得的处理信号的能量分布, 判断是否出现了梳状滤波效应,当确定出现了梳状滤波效应后,则对所述多 声道信号的声道延迟参数进行修正,从而可以减弱梳状滤波效应,进而提高 重构的多声道信号的声像质量和清晰度。需要说明的是,具体实施本发明 时,在一般的情况下,采用本发明的方案可以消除梳状滤波效应。
下面以具体的应用场景实施例进行说明,为了方^更描述,下面统一用立 体声(左右两个声道)来描述本发明实施例,但需要明确的是本发明实施例并不局限于立体声,也同样适应于其他多声道。
当输入信号不是只有左右两个声道的立体声信号时,而是包含多于两个 声道的多声道信号时,可以将该多声道信号转换为立体声信号,具体转换公 式如下
上述~、 ^、 c、 "、 ^为5.1声道信号,、G为经过转换后的立体声信
该实施例提供的 一 种对多声道信号的声道延迟参数进行修正的方法的处
理流程如图2所示,包括如下处理步骤
在该实施例中,输入信号是立体声的左声道时域信号A仏A,…W和右声 道时域信号其中k表示第k帧,N表示一帧信号有N个采样点。
步骤201、根据立体声的左右声道信号之间的相关性,计算出当前帧对应 的左右声道之间的声道延迟参凄史channel—delay 。
步骤202、根据上述声道延迟参数channeLdelay对上述左右声道信号L、 R的当前帧信号进行下混,得到处理信号(M、 S信号),进而分别计算出第 一S/M比率ratio—1、第二S/M比率ratio—2、第三S/M比率ratio—3、第四S/M比 率ratio—4和长时平滑互相关系数long—corr。
根据上述声道延迟参数channeLdelay,通过下述公式1对上述左右声道 信号L、 R的每帧信号进行下混,得到下混后的M、 S信号,具体计算方法如 下
实施例<formula>formula see original document page 14</formula>
上述公式1中的必砂-channel—delay, k表示第k巾贞。
由于上述当前帧的M、 S信号中包括各个采样点,因此,上述Mw和S"可
在获取了上述M、 S信号后,本发明实施例需要获取上述M、 S信号之间 的能量分布特性,根据该能量分布特性来判断下混处理得到的处理信号是否 出现了梳状滤波效应。需要说明的是,发明人在实施本发明过程中发现,梳 状滤波效应可能出现在M信号或S信号,也可能在M信号和S信号上同时出现。
在实际应用中,上述M、 S信号之间的能量分布特性可以通过M、 S信号 之间的能量参数比值来表示。于是,根据上述M("和S(w,计算得到第一S/M
比率ratio一1 (第一能量参数比值),具体计算方法如下
上述|>,2表示所述S信号中的每个采样点的能量参数的叠加值,Sm,2表
示所述M信号中的每个采样点的能量参数的叠加值,计算出的ratio一1表示了 S 信号和M信号之间的能量参数比值。
对上述ratio_1进行长时平滑,得到长时平滑后的第一 S/M比率 long_ratio_1,具体计算方法如下
上述7>式右边的ra"'。—l'表示上一帧只十应的long—ratio_1,上述wa/ei 的数值在0到1之间,即o^c"M",若""^ = 0则表示不对这些参数进行平
"表示为似Jmi,w2'…附w〉 ,
<formula>formula see original document page 14</formula>滑,本实施例中取值为0.5 。
然后,令delay = 0 ,根据上述公式1计算得到 一 组处理信号
M; {附、,附'2 ,…附'w }即第二和信号,& W ,A ,…。即第二边信号。
根据上述M:和&',计算得到第二S/M比率ratio—2 (第二能量参数比 值),具体计算方法如下
ra//o — 2 = ^^f / S附'
对上述ratio_2进行长时平滑,得到长时平滑后的第二 S/M比率 long_ratio—2,具体计算方法如下
/owg _ — 2 = /cwg — ra"o — 2 x sca/el + _ 2 x (1 — sca/el)
上述乂>式右边的/朋g _ ra"'o—2'表示上 一 帧3十应的long—ratio—2 。
之后,根据上述longjatioJ和longjatio—2,计算出第三S/M比率ratio—3
(第三能量参数比值),具体计算方法如下 rato _ 3 = fo/ g—— 1//cwg—raf/o—2
在实际应用中,还可以直接根据ratio—1和ratic^2计算出ratio_3,具体计
算方法如下
raf/o _ 3 = ra//o — 1 /rato _ 2 。
计算ratio一3的基底参数ratio一floor,具体计算方法如下
rario — yfoor = Z — 3(/), C = < ra o—3 < = /7/r 2}
上述^l和^2是比较门限,其中^l的取值范围为o到3之间,其中*2的 取值范围为0到10之间,若*1=1, *2=1则表示不对ratio—3去除基底(因为 这时rato — y/ow的值永远为1),本实施例中*1=0 ,//^2=1 。对上述ratio—3进行去除基底的处理,得到信号能量分布特性更突出的能 量比率参数ratio—4 (第四能量参^t比值),具体计算方法如下
ra"o — 4 = ra"o — 3/ra"o _ y7oor
对ratio一4进行长时平滑,得到长时平滑后的第四S/M比率long—ratio一4,
具体计算方法如下
/owg _ _ 4 = /cwg _ rario _ 4' x sca/el + ra,z'o — 4 x (1 — sca/el)
上述乂i^式右边的/o"g—ra,/o—4'表示上一帧^f应的longj-atio—4。
步骤203、根据上述获取的各个S/M比率值和预先设定的门限值,判断是 否出现了梳状滤波效应,如果是,则对声道延迟参数channeLdelay进行修正。
计算出在delay二0时的左右声道之间的长时平滑互相关系数long一corr,具
体计算方法如下
/owg _ co厅=/o"g _ co r' x sca/e2 + # (0) x (1 - scfl/e2)
上述公式右边的""g -COTT'为上 一 帧对应的long_ _corr, W为左右声道之 间的残差互相关系数,具体计算方法如下
户0 /乂=0 _/=0
上述公式中的MAX—OFFSET为常量,为预先设定的最大可能的声道延迟 参数, 一般的,MAX_OFFSET=48; T表示一帧残差信号有T个采样点。式中 为左声道残差时域信号丄,(r,,尸2,…/,) ,K,为右声道残差时域信号
对上述cc/还可以进行归一化处理,得到归一化互相关系数"o削-cc,,具 体计算方法如下<formula>formula see original document page 17</formula>
w"/e2的数值在0到1之间,本实施例中其取值为0.8。
冲艮才居上述获取的ratio—1 、 long—ratio—1 、 ratio_3 、 long—ratio—4禾口 long_corr,以及预先设定的各个判决门限值thr3 (第一门限值)、thr4 (第二 门限值)、thr5 (第三门限值)、thr6 (第四门限值)和thr7 (第五门限
值),判断是否出现了梳状滤波效应,具体的判断条件包括如下的4种
条件1 、 ratio—1> thr3或long—ratio_1>thr4,
条件2、 ratio—3> thr5或long—ratio—4>thr6
条件3、 (ratio—1> thr3或long—ratio_1>thr4)&&( long_corr>thr7)
条件4、 (ratio_3>討5或10门9_^0_4>討6)&&( long_corr>thr7)
上述4个条件中thr3、 thr4、 thr5、 thr6和thr7分别是判决门限,取值范围 各不相同,其中thr3和thr4的取值范围在1到100之间,比如,取值5; thr5和 thr6的取值范围在1到100之间,比如,取值10; thr7的取值范围在0到1之 间,比如,取<直0.35。
如果满足以上4个条件中的任意一个,均可认为检测到了梳状滤波效应。 在本实施例中,当出现了梳状滤波效应时,便认为下混M信号会比正常情况 下偏小,而S信号相对会偏大,或者左右声道在没有声道延时的情况下相关性 比较大。于是,需要对声道延迟参数channeLdelay进行修正,令延时修正指
示标志_ c/wwge—yZag = 1,否贝ij tfe— 一 c/zawge — = 0
若延时修正指示标志为1,即y^g = i,贝寸
可以通过以下4种修正方法来间接修正声道延迟参数。该修正方法主要是 通过对归一化互相关系数"o^—cc/在delay:0处的函数值(即"。^-Cc/(0))进行增大,使其大于或尽可能大于所有delay-O处的函数值。由于搜索"°^-", 中的最大值,该值对应的延时i即为声道延迟channel—delay , 即
cfe/(^y = arg(max("oracc/(/))) "n、
' — 。因此,增大"o削—"/(o)时,可使channel delay修
正为O。
修正方法1、 —cc/(0) = "Ora_CC/(0) + M,其中M为一常量,M的取值范
围在0到10之间,比如,取值为3。
4奮正方法2、"o"n_cc/(0) = "WT _cc/(0)xe ,其中Q为一常量,Q的取值范
围在1到10000之间,比如,取值为1000。
修正方法3 、 — cc/(0)=朋r附—cc/(0) x gl(/o"g __ 4), 其中放大因子
4)是|0叩—ratio—4的一个正比例函数,long—ratio—4越大函数值
也越大。
上述函数2i(fe"g—w》-4)的表达式为
gl(/o"g _ ra"o — 4)=《1 x /cwg — rato _ 4 + cl
变量^的取值范围为1到1000之间,比如,取值为100。 cl的取值范围在
0到10之间,比如,取值为o。
修正方法4 、 "orw — cc/(0) = "orw _ cc/(0) x 02(/owg — ra".o — 1), 其中》文大因子
22(/。"g _rato—l)是iong—ratioj的 一 个正比例函数,|ong_ratio_1越大函数值
也越大。
函数02(/o"g — ra"o —1)的表达式为 g2(/cwg _ ra/i'c_ 1)=《2 x /cwg __ 1 + c2
其中变量^的取值范围为1到1000之间,比如,取值为100。"的取值范 围在0到10之间,比如,取值为o。上述修正方法1、 2、 3和4中的等式两端norm—ccf(0)代表相同意思,是对
该数值的更新。
需要说明的是,优选地,可以釆用对归一化互相关系数"^"-c"进行上 述处理,达到间接修正声道延迟参数的目的,同样,也可以通过对互相关系 数cc/进行同样处理,达到间接修正声道延迟参数的目的,具体处理方式与对 归一化互相关系数"。,-Cc/的处理方式相同,在此不在赘述。
在实际应用中,还可以在上述延时修正指示标志为1 ,即 _ y^g = l时,直接对声道延迟参数进行修正,直接将声延迟参数置
零,即令channel delay:0。 ^"delay参凄t进4亍直4妄》务 夂会景》响到禾口delay参凄史 相关的一些参数,从而对编码端其他部分性能产生影响。对delay参数进行间 接修改不会产生上述影响,效果比直接修改好。
该实施例可以判断出当前帧的下混后的处理信号是否出现了梳状滤波效 应时,并在出现了梳状滤波效应时,可以及时对声道延迟参数channel—delay 进行相应的修正,从而消除梳状滤波效应,保证重构的立体声信号等多声道 信号的声像质量及清晰度。
实施例二
该实施例与实施例一的不同在于计算下混M信号和S信号时所采用的输入 信号为原始左右声道信号经过简单抽取之后的信号。
在该实施例中,对原始输入的立体声的左右声道时域信号A仏,^…W和 A化,&…W进行简单的抽取处理,即进行下采样处理,得到下采样信号 丄'a/'p/'2,…/'J, i ' '2,...,M},其中M为抽取之后一帧信号采样点数,k表 示第k帧。上述下采样处理的方法如下然后,利用下采样信号"Wi"'2,…^),化 '2,■;},按照上述实施例 一提供的处理流程,判断是否出现了梳状滤波效应时,并对声道延迟参数 channel—delayii^f亍相应的》务正。
该实施例通过对原始输入的立体声的左右声道时域信号进行下采样,使 样本信号的数量减少,计算量减少,从而可以提高上述第一S/M比率 ratio—1、第二S/M比率ratio—2、第三S/M比率ratio—3、第四S/M比率ratio—4和 长时平滑互相关系数longjorr的计算速度。
实施例三
在本实施例中,若检测到需要对声道延迟参数进行修正,即在该帧检测 到&—-C/^^_yfeg = i,则设置拖尾范围,令该帧之后的拖尾范围的帧都进行
声道延迟参数修正,而不管这些帧是否真正满足出现梳状滤波效应的条件, 即强制这些帧的延时修正指示标志为1。然后,按照上述实施例一中的四种间 接修正方法或直接修正方法,对这些帧声道延迟参数进行修正。
上述拖尾范围的帧可以根据实际情况来设定,比如,设置该帧之后的100 帧都进行声道延迟参数修正。
由于当前帧出现了梳状滤波效应后,后续帧继续出现梳状滤波效应的可 能性也很大。该实施例相当于设置了一个声道延迟参数的修正拖尾,设置修 正拖尾的好处是尽量地保证这种延时修正的有效性及持续性,可以避免后续 帧继续出现梳状滤波效应。
本发明实施例还提供了 一种对多声道信号的声道延迟参数进行修正的装 置,其具体实现结构如图3所示,所述装置包括
下混处理;漠块301,用于对多声道信号进行下混处理获得处理信号;能量分布获取模块302,用于计算所述处理信号的能量分布;
判断模块303,用于根据所述处理信号的能量分布,判断所述处理信号是 否出现了梳状滤波效应;
声道延迟参数修正模块304,用于当所述判断模块判定所述处理信号出现 了梳状滤波效应时,对所述多声道信号的声道延迟参数进行修正。
进一步的,所述下混处理模块301具体用于对所述多声道信号的当前帧信 号进行下混处理获得和信号和边信号;
或者,
所述下混处理模块301具体用于对所述多声道信号的当前帧信号进行下采 样,对下采样后的下采样信号进行下混处理获得和信号和边信号。
更进一步的,所述下混处理模块301具体用于获取所述多声道信号的当前 帧的声道延迟参数,根据该当前帧的声道延时参数对所述多声道信号进行下 混,得到下混后的和信号和边信号;
所述能量分布获取模块302具体用于将所述边信号中的每个采样点的能量 参数的叠加值除以所述和信号中的每个采样点的能量参数的叠加值,得到第 一能量参数比值。
所述判断模块303具体用于当所述第 一能量参数比值大于预定的第 一 门限 值时,则判定所述处理信号出现了梳状滤波效应;或者,
所述判断模块303具体用于当长时平滑处理后的第一能量参数比值大于预 定的第二门限值时,则判定所述处理信号出现了梳状滤波效应。
更进一步的,所述所述所述能量分布获取模块302还用于计算所述多声道 信号的零延时对应的互相关系数,并进行长时平滑处理,得到长时平滑处理 后的互相关系数;
所述判断模块303具体用于当所述长时平滑处理后的互相关系数大于预定 的第五门限值,并且,所述第一能量参数比值大于预定的第一门限值,则判 定所述处理信号出现了梳状滤波效应;或,所述判断模块具体用于当所述长时平滑处理后的互相关系数大于预定的第五门限值,并且,长时平滑处理后 的所述第 一能量参数比值大于预定的第二门限值,则判定所述处理信号出现
了冲JM犬滤波岁支应。
更进一步的,所述下混处理模块301还用于根据为零值的声道延迟参数对 所述多声道信号进行下混,得到下混后的第二和信号和第二边信号;
能量分布获取模块302还用于将所述第二边信号中的每个采样点的能量参 数的叠加值除以所述第二和信号中的每个采样点的能量参数的叠加值,得到 第二能量参数比值,将所述第一能量参数比值除以所述第二能量参数比值, 得到第三能量参数比值;或者,对所述第一能量参数比值、第二能量参数比 值分别进行长时平滑处理,将长时平滑处理后的第一能量参数比值除以长时 平滑处理后的第二能量参数比值,得到第三能量参数比值。
所述判断模块303具体用于当所述第三能量参数比值大于预定的第三门限 值时,则判定所述处理信号出现了梳状滤波效应。
更进一步的,所述能量分布获取模块302还用于对所述第三能量参数比值 进行去除基底处理后,得到第四能量参数比值,对所述第四能量参数比值进 行长时平滑处理,得到长时平滑处理后的第四能量参数比值。
所述判断模块303具体用于当长时平滑处理后的第四能量参数比值大于预 定的第四门限值时,则判定所述处理信号出现了梳状滤波效应。
更进一步的,所述能量分布获取模块302还用于计算所述多声道信号的零 延时对应的互相关系数,并进行长时平滑处理,得到长时平滑处理后的互相 关系数;
所述判断模块303具体用于当所述长时平滑处理后的互相关系数大于预定 的第五门限值,并且,所述第三能量参数比值大于预定的第三门限值,则判 定所述处理信号出现了梳状滤波效应;
所述判断模块303具体用于当所述长时平滑处理后的互相关系数大于预定 的第五门限值,并且,所述长时平滑处理后的第四能量参数比值大于预定的第四门限值时,则判定所述处理信号出现了梳状滤波效应。
具体的,所述声道延迟参数修正模块304具体用于将所述多声道信号的当
前帧的声道延迟参数置为零值;或,所述声道延迟参数修正;f莫块304具体用于 计算出所述多声道信号的零延时对应的互相关系数,增大所述零延时对应的 互相关系数;或,所述声道延迟参数修正模块304具体用于计算出所述多声道 信号的零延时对应的归一化互相关系数,增大所述零延时对应的归一化互相 关系数。
进一步的,所述声道延迟参数修正模块304还用于在将所述多声道信号的 当前帧信号的声道延迟参数进行修正后,修正所述当前帧之后拖尾范围内的 帧的声道延迟参数。
综上所述,本发明实施例根据下混处理得到的处理信号的能量分布,判 断是否出现了梳状滤波效应,上述能量分布可以通过S信号和M信号的之间的 能量参数比值来表示。如果出现了梳状滤波效应,则通过直接及间接等多种 途径对多声道信号的声道延迟参数进行修正,从而消除梳状滤波效应,保证 重构的立体声信号等多声道信号的声像质量及清晰度。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流 程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于 一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施 例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory, ROM)或F逭才几存l诸i己'I"乙体(Random Access Memory, RAM )等。
以上所述,仅为本发明较佳的具体实施方式
,但本发明的保护范围并不 局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可 轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明 的保护范围应该以权利要求的保护范围为准。
权利要求
1、一种对多声道信号的声道延迟参数进行修正的方法,其特征在于,包括对多声道信号进行下混处理获得处理信号;计算所述处理信号的能量分布;根据所述处理信号的能量分布,判断所述处理信号是否出现了梳状滤波效应,如果是,则对所述多声道信号的声道延迟参数进行修正。
2、 根据权利要求1所述的方法,其特征在于,所述处理信号包括和信 号、边信号。
3、 根据权利要求1所述的方法,其特征在于,所述对多声道信号进行下 混处理获得处理信号包括对所述多声道信号的当前帧信号进行下混处理获得和信号和边信号; 或者,对所述多声道信号的当前帧信号进行下采样,对下采样后的下采样信号 进^f亍下混处理获得和信号和边信号。
4、 根据权利要求1-3任一所述的方法,其特征在于, 所述对多声道信号进行下混处理获得处理信号包括 获取所述多声道信号的当前帧的声道延迟参数,根据该当前帧的声道延时参凄t对所述多声道信号进行下混,得到下混后的和信号和边信号; 所述计算所述处理信号的能量分布包括将所述边信号中的每个采样点的能量参数的叠加值除以所述和信号中的 每个采样点的能量参数的叠加值,得到第一能量参数比值。
5、 根据权利要求4所述的方法,其特征在于,所述根据所述处理信号的 能量分布,判断所述处理信号是否出现了梳状滤波效应包括当所述第 一能量参数比值大于预定的第 一 门限值时,则判定所述处理信 号出现了梳状滤波效应;或者,当长时平滑处理后的第一能量参数比值大于预定的第二门限值时,则判 定所述处理信号出现了梳状滤波效应。
6、 如权要求4所述的方法,其特征在于, 所述计算所述处理信号的能量分布还包括计算所述多声道信号的零延时对应的互相关系数,并进行长时平滑处 理,得到长时平滑处理后的互相关系数;所述根据所述处理信号的能量分布,判断所述处理信号是否出现了梳状 滤波效应包4舌当所述长时平滑处理后的互相关系数大于预定的第五门限值,并且,所 述第一能量参数比值大于预定的第 一 门限值,则判定所述处理信号出现了梳 状滤波效应;或,当所述长时平滑处理后的互相关系数大于预定的第五门限值,并且,长 时平滑处理后的所述第一能量参数比值大于预定的第二门限值,则判定所述 处理信号出现了梳状滤波效应。
7、 根据权利要求4所述的方法,其特征在于, 所述对多声道信号进行下混处理获得处理信号还包括 根据为零值的声道延迟参数对所述多声道信号进行下混,得到下混后的第二和信号和第二边信号;所述计算所述处理信号的能量分布还包括将所述第二边信号中的每个采样点的能量参数的叠加值除以所述第二和 信号中的每个采样点的能量参数的叠加值,得到第二能量参数比值;将所述第一能量参数比值除以所述第二能量参数比值,得到第三能量参 数比值;或者,对所述第一能量参数比值、第二能量参数比值分别进行长时平滑处理,将长时平滑处理后的第一能量参数比值除以长时平滑处理后的第 二能量参数比值,得到第三能量参数比值。
8、 根据权利要求7所述的方法,其特征在于,所述根据所述处理信号的能量分布,判断所述处理信号是否出现了梳状滤波效应包括当所述第三能量参数比值大于预定的第三门限值时,则判定所述处理信 号出现了梳状滤波效应。
9、 根据权利要求7所述的方法,其特征在于, 所述计算所述处理信号的能量分布还包括对所述第三能量参数比值进行去除基底处理后,得到第四能量参数比 值,对所述第四能量参数比值进行长时平滑处理,得到长时平滑处理后的第 四能量参数比值。
10、 根据权利要求9所述的方法,其特征在于,所述根据所述处理信号的 能量分布,判断所述处理信号是否出现了梳状滤波效应包括当长时平滑处理后的第四能量参数比值大于预定的第四门限值时,则判 定所述处理信号出现了梳状滤波效应。
11、 根据权利要求7所述的方法,其特征在于, 所述计算所述处理信号的能量分布还包括计算所述多声道信号的零延时对应的互相关系数,并进行长时平滑处 理,得到长时平滑处理后的互相关系数;所述根据所述处理信号的能量分布,判断所述处理信号是否出现了梳状 滤波效应包4舌当所述长时平滑处理后的互相关系数大于预定的第五门限值,并且,所 述第三能量参数比值大于预定的第三门限值,则判定所述处理信号出现了梳 状滤波效应。
12、 根据权利要求9所述的方法,其特征在于,所述计算所述处理信号的能量分布还包括计算所述多声道信号的零延时对应的互相关系数,并进行长时平滑处理,得到长时平滑处理后的互相关系数;所述根据所述处理信号的能量分布,判断所述处理信号是否出现了梳状 滤波步文应包4舌当所述长时平滑处理后的互相关系数大于预定的第五门限值,并且,所 述长时平滑处理后的第四能量参数比值大于预定的第四门限值时,则判定所 述处理信号出现了梳状滤波效应。
13、 根据权利要求1所述的方法,其特征在于,所述对所述多声道信号的 声道延迟参数进行修正,具体包括将所述多声道信号的当前帧的声道延迟参数置为零值;或, 计算出所述多声道信号的零延时对应的互相关系数,增大所述零延时对应的互相关系it;或,计算出所述多声道信号的零延时对应的归一化互相关系数,增大所述零延时对应的归 一化互相关系凄t。
14、 根据权利要求13所述的方法,其特征在于,所述增大所述零延时对 应的互相关系数,具体包括将所述零延时对应的互相关系数加上一个常量;或者,将所述零延时对 应的互相关系数乘以一个常量;或者,将所述零延时对应的互相关系数乘以一个放大因子,该放大因子根据所述处理信号的能量分布得到。
15、 根据权利要求1所述的方法,其特征在于,所述方法还包括 在将所述多声道信号的当前帧信号的声道延迟参数进行修正后,修正所述当前帧之后拖尾范围内的帧的声道延迟参数。
16、 一种对多声道信号的声道延迟参数进行修正的装置,其特征在于,包括:下混处理^^莫块,用于对多声道信号进行下混处理获得处理信号;能量分布获取模块,用于计算所述处理信号的能量分布;判断模块,用于根据所述处理信号的能量分布,判断所述处理信号是否出现了梳状滤波效应;声道延迟参数修正模块,用于当所述判断模块判定所述处理信号出现了梳状滤波效应时,对所述多声道信号的声道延迟参数进行修正。
17、 根据权利要求16所述的装置,其特征在于,所述下混处理模块具体用于对所述多声道信号的当前帧信号进行下混处 理获得和信号和边信号; 或者,所述下混处理模块具体用于对所述多声道信号的当前帧信号进行下采 样,对下采样后的下采样信号进行下混处理获得和信号和边信号。
18、 根据权利要求16或17所述的装置,其特征在于, 所述下混处理模块具体用于获取所述多声道信号的当前帧的声道延迟参数,根据该当前帧的声道延时参数对所述多声道信号进行下混,得到下混后 的和信号和边信号;所述能量分布获取模块具体用于将所述边信号中的每个采样点的能量参 数的叠加值除以所述和信号中的每个采样点的能量参数的叠加值,得到第一 能量参数比值。
19、 根据权利要求18所述的装置,其特征在于,所述判断模块具体用于当所述第一能量参数比值大于预定的第一门限值 时,则判定所述处理信号出现了梳状滤波效应;或者,所述判断模块具体用于当长时平滑处理后的第一能量参数比值大于预定 的第二门限值时,则判定所述处理信号出现了梳状滤波效应。
20、 根据权利要求18所述的装置,其特征在于,所述能量分布获取模块还用于计算所述多声道信号的零延时对应的互相关系数,并进行长时平滑处 理,得到长时平滑处理后的互相关系数;所述判断模块具体用于当所述长时平滑处理后的互相关系数大于预定的 第五门限值,并且,所述第一能量参数比值大于预定的第一门限值,则判定所述处理信号出现了梳状滤波效应;或,所述判断模块具体用于当所述长时 平滑处理后的互相关系数大于预定的第五门限值,并且,长时平滑处理后的 所述第一能量参数比值大于预定的第二门限值,则判定所述处理信号出现了 才危状滤波效应。
21、 根据权利要求18所述的装置,其特征在于,所述下混处理模块还用于根据为零值的声道延迟参数对所述多声道信号 进行下混,得到下混后的第二和信号和第二边信号;所述能量分布获取模块还用于将所述第二边信号中的每个采样点的能量 参数的叠加值除以所述第二和信号中的每个采样点的能量参数的叠加值,得 到第二能量参数比值,将所述第一能量参数比值除以所述第二能量参数比 值,得到第三能量参数比值;或者,对所述第一能量参数比值、第二能量参 数比值分别进行长时平滑处理,将长时平滑处理后的第一能量参数比值除以 长时平滑处理后的第二能量参数比值,得到第三能量参数比值。
22、 根据权利要求21所述的装置,其特征在于,所述判断模块具体用于 当所述第三能量参数比值大于预定的第三门限值时,则判定所述处理信号出现了桥u状滤波效应。
23、 根据权利要求21所述的装置,其特征在于,所述能量分布获取模块 还用于对所述第三能量参数比值进行去除基底处理后,得到第四能量参数比 值,对所述第四能量参数比值进行长时平滑处理,得到长时平滑处理后的第 四能量参数比值。
24、 根据权利要求23所述的装置,其特征在于,所述判断模块具体用于当长时平滑处理后的第四能量参数比值大于预定的第四门限值时,则判定所 述处理信号出现了梳状滤波效应。
25、 根据权利要求21所述的装置,其特征在于,所述能量分布获取模块还用于计算所述多声道信号的零延时对应的互相关系数,并进行长时平滑处理,得到长时平滑处理后的互相关系数;所述判断模块具体用于当所述长时平滑处理后的互相关系数大于预定的 第五门限值,并且,所述第三能量参数比值大于预定的第三门限值,则判定 所述处理信号出现了梳状滤波效应。
26、 根据权利要求23所述的装置,其特征在于,所述能量分布获取模块 还用于计算所述多声道信号的零延时对应的互相关系数,并进行长时平滑处理,得到长时平滑处理后的互相关系数;所述判断模块具体用于当所述长时平滑处理后的互相关系数大于预定的 第五门限值,并且,所述长时平滑处理后的第四能量参数比值大于预定的第 四门限值时,则判定所述处理信号出现了梳状滤波效应。
27、 根据权利要求16所述的装置,其特征在于,所述声道延迟参数修正 模块具体用于将所述多声道信号的当前帧的声道延迟参数置为零值;或,所 述声道延迟参数修正模块具体用于计算出所述多声道信号的零延时对应的互 相关系数,增大所述零延时对应的互相关系数;或,所述声道延迟参数修正 模块具体用于计算出所述多声道信号的零延时对应的归一化互相关系数,增 大所述零延时对应的归 一化互相关系数。
28、 根据权利要求16所述的装置,其特征在于,所述声道延迟参数修正 模块还用于在将所述多声道信号的当前帧信号的声道延迟参数进行修正后, 修正所述当前帧之后拖尾范围内的帧的声道延迟参数。
全文摘要
本发明实施例提供了一种对多声道信号的声道延迟参数进行修正的方法和装置。该方法主要包括对多声道信号进行下混处理获得处理信号;计算所述处理信号的能量分布;根据所述处理信号的能量分布,判断所述处理信号是否出现了梳状滤波效应,如果是,则对所述多声道信号的声道延迟参数进行修正。本发明根据对多声道信号进行下混处理后获得的处理信号的能量分布,判断是否出现了梳状滤波效应,从而判断是否需要对声道延迟参数进行修正,以消除梳状滤波效应,进而提供较好的重构立体声等多声道信号的声像及清晰度。
文档编号G10L19/00GK101533641SQ200910082270
公开日2009年9月16日 申请日期2009年4月20日 优先权日2009年4月20日
发明者琦 张, 张立斌 申请人:华为技术有限公司
网友询问留言 留言:0条
  • 还没有人留言评论。精彩留言会获得点赞!