立体声编码的方法、装置的制作方法

文档序号:2823349阅读:264来源:国知局
专利名称:立体声编码的方法、装置的制作方法
技术领域
本发明实施例涉及多媒体领域,尤其涉及一种立体声处理技术,具体为立体声编码的方法、装置。
背景技术
现有的立体声编码方法,有强度立体声,BCC(Binaual Cure Coding)和 PS (Parametric-stereo coding)编码方法,通常情况,采用强度编码需要提取左右声道间的能量比ILD(InterChannel Level Difference)参数,将ILD参数作为边信息进行编码, 并优先传送到解码端以帮助恢复立体声信号。ILD是个普遍存在并反映声场信号的信号特性参数,ILD能对声场能量较好的体现,然而立体声往往存在背景空间和左右方向的声场, 仅采用传送ILD恢复还原立体声的方式已经不能满足恢复原始立体声信号的要求,于是提出了传送更多参数以更好恢复立体声信号的方案,除了提取最基本的ILD参数外,还提出传送左右声道的相位差(IPD =InterChannel Phase Difference)及左右声道的互相关ICC 参数,有时也会包含左声道与下混信号的相位差(OPD)参数,将这些反应立体声信号背景空间和左右方向声场信息的参数和ILD参数共同作为边信息进行编码并发送到解码端以还原立体声信号。编码码率是多媒体信号编码性能的重要评判因素之一,对低码率的采用是业界共同追求的目标,现有的立体声编码技术在传送ILD的同时传送LPD、ICC和OPD参数势必需要提高编码码率,因为LPD、ICC以及OPD参数都是信号的局部特性参数,用于反应立体声信号的分带信息,编码立体声信号的LPD、ICC以及OPD参数,需要对立体声信号的每一个分带编码LPD、ICC以及OPD参数,对立体声信号的每一个分带而言,每个分带IPD编码需要多个比特,每个分带ICC编码需要多个比特,依此类推,则立体声编码参数需要大量的比特数才能增强声场的信息,在较低码率要求下则只能增强部分分带,达不到逼真还原的效果,导致低码率下恢复出的立体声信息和原输入信号之间有较大的差距,从听觉效果来说,会给收听者带来极不舒适的听觉感受。

发明内容
本发明实施例提供一种立体声编码方法、装置和系统,增强低码率下声场信息,提升编码效率。本发明实施例提供了一种立体声编码的方法,所述方法包括变换时域立体声左声道信号和右声道信号到频域形成频域上的左声道信号和右声道信号;频域上的左声道信号和右声道信号经过下混生成单声道下混信号,传送所述下混信号进行编码量化后的比特;提取频域上左声道信号和右声道信号的空间参数;利用频域上左右声道信号估计立体声左右声道间的群延时以及群相位;量化编码所述群延时和群相位以及所述空间参数。本发明实施例提供了一种估计立体声信号的方法,所述方法包括
确定关于频域立体声左右声道信号间的加权的互相关函数;对加权的所述互相关函数进行预处理;根据预处理结果估计得到立体声左右声道信号间的群延时以及群相位。本发明实施例提供了一种估计立体声信号的装置,所述装置包括加权互相关单元,用于确定关于频域立体声左右声道信号间的加权的互相关函数;预处理单元,用于对加权的所述互相关函数进行预处理;估计单元,根据预处理结果估计得到立体声左右声道信号间的群延时以及群相位。本发明实施例提供了一种立体声信号编码的设备,所述设备包括变换装置,用于变换时域立体声左声道信号和右声道信号到频域形成频域上的左声道信号和右声道信号;下混装置,用于频域上的左声道信号和右声道信号经过下混生成单声道下混信号;参数提取装置,用于提取频域上左声道信号和右声道信号的空间参数; 估计立体声信号装置,用于利用频域上左右声道信号估计立体声左右声道间的群延时以及群相位;编码装置,用于量化编码所述群延时和群相位,所述空间参数和所述单声道下混信号。本发明实施例提供了一种立体声信号编码的系统,所述系统包括如上所述立体声信号编码的设备、接收设备以及传送设备,接收设备用于接收立体声输入信号用于立体声编码设备;传送设备52,用于传送所述立体声编码设备51的结^ ο因此,通过引入本发明实施例,群延时和群相位被估计并被应用到立体声编码中来,使得通过全局的方位信息估计方法在低码率下能得到更为准确的声场信息,增强了声场效果,极大的提升编码效率。


为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为一立体声编码方法实施示意图2为又--立体声编码方法实施示意图3为又--立体声编码方法实施示意图4a为又一立体声编码方法实施示意图4b为又一立体声编码方法实施例示意图5为又--立体声编码方法实施示意图6为一估计立体声信号装置实施示意图7为又--估计立体声信号装置实施示意图8为又--估计立体声信号装置实施示意图9为又--估计立体声信号装置实施示意图10为又一估计立体声信号装置实施示意图
图11为一立体声信号编码设备实施示意图12为一立体声信号编码系统实施示意具体实施例方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。实施例一图1为一立体声编码方法实施的示意图,包括步骤101 变换时域立体声左声道信号和右声道信号到频域形成频域上的左声道信号和右声道信号。步骤102 频域上的左声道频域信号和右声道频域信号经过下混生成单声道下混信号(DMX),传送DMX信号进行编码量化后的比特,以及将提取的频域上左声道信号和右声道信号的空间参数进行量化编码。空间参数为代表立体声信号空间特性的参数,如ILD参数。步骤103 利用频域上左右声道信号估计频域上的左声道信号和右声道信号间的群延时(Group Delay)以及群相位(Group Phase)。群延时反映出立体声左右声道之间的包络的时间延时的全局方位信息,群相位反映立体声左右声道在时间对齐后的波形的相似性的全局信息。步骤104 量化编码所述估计得到的群延时和群相位。群延时和群相位经过量化编码形成待传送边信息码流的内容。本发明实施例立体声编码的方法中,在提取立体声信号空间特性参数的同时估计群延时和群相位,估计得到群延时和群相位被应用到立体声编码中,使得空间参数和全局的方位信息有效的结合,通过全局的方位信息估计方法在低码率下能得到更为准确的声场信息,增强了声场效果,极大的提升编码效率。实施例二图2为另一立体声编码方法实施例的示意图,包括步骤201,变换时域立体声左声道信号和右声道信号到频域形成在频域上的立体声左声道信号& (k)和右声道信号)(2(k),其中k为频率信号的频率点的索引值。步骤202,对频域上的左声道信号和右声道信号进行下混操作,编码量化下混信号并传送,以及编码立体声空间参数,量化形成边信息并传送,可以包括如下步骤步骤2021,频域上的左声道信号和右声道信号进行下混,生成合成后的单声道下混信号DMX。步骤2022,编码量化单声道下混信号DMX,并传送量化的信息。步骤2023,提取频域上的左声道信号和右声道信号的ILD参数。步骤20 ,对所述ILD参数进行量化编码形成边信息并传送。2021,2022步骤和2023、20M步骤相互不影响,可独立执行,前者形成的边信息可与后者形成的边信息进行复用后传送。在另一实施方案中,经过下混得到的单声道下混信号可以再进行频时变换得到单声道下混信号DMX的时域信号,将单声道下混信号DMX的时域信号进行编码量化后的比特进行传送。步骤203,估计频域上的左右声道信号间的群延时以及群相位。利用频域上左右声道信号估计左右声道信号间的群延时以及群相位包括确定关于立体声左右声道频域信号的互相关函数,根据互相关函数的信号估计得到立体声信号的群延时以及群相位,如图3所示,具体可以包括如下步骤步骤2031,确定关于频域上立体声左右声道信号间的互相关函数。立体声左右声道频域信号的互相关函数可以为加权的互相关函数,在确定互相关函数的过程中对估计群延时和群相位的互相关函数进行加权操作相比与其他操作而言使得立体声信号编码结果更加倾于稳定,加权的互相关函数即左声道频域信号与右声道频域信号的共轭的乘积的加权,所述加权的互相关函数在立体声信号时频变换的长度N —半的频点上的值为0。立体声左右声道频域信号的互相关函数的形式可以如下表示
Γ π 广“、W(R)X^XMk) 0<k<N/2C'.⑷=0 k>N/2其中w(k)表示加权函数,X*2(k)表示)(2(k)的共轭函数,或者也可以表示为(;(k) =X1 (k)X*2(k)0彡k彡N/2+1。在另一互相关函数的形式中,结合不同的加权形式,立体声左右声道频域信号的互相关函数可以如下表示
权利要求
1.一种立体声编码的方法,其特征在于,所述方法包括变换时域立体声左声道信号和右声道信号到频域形成频域上的左声道信号和右声道信号;频域上的左声道信号和右声道信号经过下混生成单声道下混信号,传送所述下混信号进行编码量化后的比特;提取频域上左声道信号和右声道信号的空间参数; 利用频域上左右声道信号估计立体声左右声道间的群延时以及群相位; 量化编码所述群延时和群相位以及所述空间参数。
2.如权利要求1所述的方法,其特征在于所述利用频域上左右声道信号估计立体声左右声道间的群延时以及群相位之前包括确定关于频域上立体声左右声道信号间的互相关函数,所述互相关函数包括频域上左声道信号与右声道信号的共轭的乘积的加权的互相关。
3.如权利要求2所述的方法,其特征在于频域立体声左右声道信号间的加权的互相关可以表示为
4.如权利要求3所述的方法,其特征在于所述方法还包括对所述互相关函数进行逆时频变换得到互相关函数时域信号,或对所述互相关函数进行逆时频变换得到互相关函数时域信号,对所述时域信号进行预处理。
5.如权利要求4所述的方法,其特征在于根据互相关函数时域信号,所述利用频域上左右声道信号估计立体声左右声道间的群延时以及群相位,包括根据互相关函数时域信号或基于处理后的互相关函数时域信号中幅度最大的值对应的索引估计得到群延时,获得群延时对应的互相关函数对应的相角,估计得到群相位。
6.如权利要求3所述的方法,其特征在于根据所述互相关函数,所述利用频域上左右声道信号估计立体声左右声道间的群延时以及群相位,包括提取所述互相关函数的相位,根据相位差和变换长度的乘积与频率信息的比值关系确定群延时;根据加权的互相关函数当前频点的相位与频点索引和相位差均值乘积的差值得到群相位信息。
7.如权利要求5或6所述的方法,其特征在于,所述方法还包括根据所述群相位和群延时估计得到立体声分带信息,量化编码所述分带信息,所述分带信息包括左右声道间的相位差参数,互相关参数和/或左声道与下混信号的相位差参数。
8.一种估计立体声信号的方法,其特征在于,所述方法包括 确定关于频域立体声左右声道信号间的加权的互相关函数; 对所述加权互相关函数进行预处理;根据预处理结果估计得到立体声左右声道信号间的群延时以及群相位。
9.如权利要求8所述的方法,其特征在于频域立体声左右声道信号的加权的互相关函数可以表示为
10.如权利要求9所述的方法,其特征在于,所述方法还包括对关于频域立体声左右声道信号的加权的互相关函数进行逆时频变换得到互相关函数时域信号。
11.如权利要求10所述的方法,其特征在于,对所述互相关函数时域信号进行预处理包括对互相关函数时域信号进行归一化处理和平滑处理,其中所述平滑处理包括
12.如权利要求11所述的方法,其特征在于,根据预处理结果估计得到立体声信号的群延时以及群相位包括判断时域信号互相关函数中幅度最大的值对应的索引和与立体声信号时频变换长度N 相关的对称区间的关系,如果时域信号互相关函数中幅度最大的值对应的索引位于第一对称区间,那么群延时等于该时域信号互相关函数中幅度最大的值对应的索引,如果相关函数中幅度最大的值对应的索引位于第二对称区间,群延时为该索引减去N ;根据群延时对应的互相关函数对应的相角,当群延时dg大于等于零,通过确定dg对应的互相关值对应的相角估计得到群相位;当dg小于零时,群相位为dg+N索引上对应的互相关值对应的相角。
13.如权利要求12所述的方法,其特征在于,根据预处理结果估计得到立体声信号的群延时以及群相位包括
14.如权利要求8所述的方法,其特征在于,根据预处理结果估计得到立体声左右声道信号间的群延时以及群相位包括对所述互相关函数,或基于处理后的互相关函数,提取其相位4)㈨=ZCr(幻,其中函数Z Cr(k用于提取复数Cr(k)的相角;在低带一个频率内求取相位差的均值α ”根据相位差和变换长度的乘积与频率信息的比值关系确定群延时,根据所述互相关函数当前频点的相位与频点索引和相位差均值乘积的差值得到群相位。
15.如权利要求14所述的方法,其特征在于,根据预处理结果估计得到立体声左右声道信号间的群延时以及群相位包括
16.一种估计立体声信号的装置,其特征在于,所述装置包括加权互相关单元,用于确定关于频域立体声左右声道信号间的加权的互相关函数;预处理单元,用于对所述加权的互相关函数进行预处理;估计单元,根据预处理结果估计得到立体声左右声道信号间的群延时以及群相位。
17.如权利要求16所述的装置,其特征在于,所述装置还包括频时变换单元,对关于频域立体声左右声道信号的加权的互相关函数进行逆时频变换得到互相关函数时域信号。
18.如权利要求17所述的装置,其特征在于,所述根据预处理结果估计得到立体声信号的群延时以及群相位的估计单元包括判断单元,用于判断时域信号互相关函数中幅度最大的值对应的索引和与立体声信号时频变换长度N相关的对称区间的关系;群延时单元,如果时域信号互相关函数中幅度最大的值对应的索引位于第一对称区间,那么群延时等于该时域信号互相关函数中幅度最大的值对应的索引,如果相关函数中幅度最大的值对应的索引位于第二对称区间,群延时为该索引减去N;群相位单元,用于根据群延时对应的互相关函数对应的相角,当群延时dg大于等于零, 通过确定dg对应的互相关值对应的相角估计得到群相位;当dg小于零时,群相位为dg+N索引上对应的互相关值对应的相角。
19.如权利要求16所述的装置,其特征在于,所述根据预处理结果估计得到立体声左右声道信号间的群延时以及群相位的估计单元包括相位提取单元,用于对所述互相关函数,或基于处理后的互相关函数,提取其相位
20.如权利要求16所述的装置,其特征在于,所述装置还包括参数特性单元,用于根据所述群相位和群延时估计得到立体声参数IPD。
21.—种立体声信号编码的设备,其特征在于,所述设备包括变换装置,用于变换时域立体声左声道信号和右声道信号到频域形成频域上的左声道信号和右声道信号;下混装置,用于频域上的左声道信号和右声道信号经过下混生成单声道下混信号;参数提取装置,用于提取频域上左声道信号和右声道信号的空间参数;估计立体声信号装置,用于利用频域上左右声道信号估计立体声左右声道间的群延时以及群相位;编码装置,用于量化编码所述群延时和群相位,所述空间参数和所述单声道下混信号。
22.如权利要求21所述的设备,其特征在于所述估计立体声信号装置利用频域上左右声道信号估计立体声左右声道间的群延时以及群相位之前还包括确定关于频域上立体声左右声道信号间的互相关函数,所述互相关函数包括频域上左声道信号与右声道信号的共轭的乘积的加权的互相关。
23.如权利要求20或22所述的设备,其特征在于所述估计立体声信号装置确定的关于频域上立体声左右声道信号间的加权的互相关函数可以表示为
24.如权利要求23所述的装置,其特征在于所述估计立体声信号装置包括频时变换单元,用于对所述互相关函数进行逆时频变换得到互相关函数的时域信号。
25.如权利要求M所述的装置,其特征在于所述估计立体声信号装置包括估计单元, 用于根据互相关函数时域信号或基于处理后的互相关函数时域信号中幅度最大的值对应的索引估计得到群延时,获得群延时对应的互相关函数对应的相角,估计得到群相位。
26.如权利要求M所述的装置,其特征在于所述估计立体声信号装置包括估计单元, 用于提取所述互相关函数的相位,根据相位差和变换长度的乘积与频率信息的比值关系确定群延时;根据互相关函数当前频点的相位与频点索引和相位差均值乘积的差值得到群相位信息。
27.—种立体声编码的系统,其特征在于,所述系统包括如权利要求2116任一所述的立体声编码设备、接收设备以及传送设备,接收设备用于接收立体声输入信号用于立体声编码设备;传送设备52,用于传送所述立体声编码设备51的结果。
全文摘要
本发明实施例涉及一种立体声编码的方法,变换时域立体声左声道信号和右声道信号到频域形成频域上的左声道信号和右声道信号;频域上的左声道信号和右声道信号经过下混生成单声道下混信号,传送所述下混信号进行编码量化后的比特;提取频域上左声道信号和右声道信号的空间参数;利用频域上左右声道信号估计立体声左右声道间的群延时以及群相位;量化编码所述群延时和群相位以及所述空间参数以得到低码率下优质的立体声编码性能。
文档编号G10L19/00GK102157152SQ20101011380
公开日2011年8月17日 申请日期2010年2月12日 优先权日2010年2月12日
发明者吴文海, 张琦, 苗磊, 郎玥 申请人:华为技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1