用于对已解码多通道音频信号或已解码立体声信号进行后处理的装置和方法

文档序号：2818929阅读：184来源：国知局

专利名称：用于对已解码多通道音频信号或已解码立体声信号进行后处理的装置和方法
技术领域：
本发明涉及与已解码多通道音频信号和已解码立体声音频信号的后处理，已解码立体声音频信号的后处理代表对已解码多声道音频信号进行后处理的具体情况。
背景技术：
在传统的语音编解码器中，通常会对语音信号进行分类，以提高语音信号的编码效率。在解码器中，会根据所传输的语音信号的分类使用不同类型的语音处理工具。其中一个分类是区分正常语音信号和瞬态语音信号。瞬态信号是短时信号，其特点是信号功率和信号幅度变化很快。瞬态信号相对于“正常”信号或非瞬态信号，“正常”信号或非瞬态信号是指持续时间较长的信号和/或信号功率和信号幅度变化很小的信号。这种分类不仅适用于语音信号，也适用于一般的音频信号。对于瞬态信号，一种常用方法是在编码器中提取输入信号的时间包络，然后传输所提取的时间包络并在解码器中对其进行后处理。对于立体声信号，这种后处理通常是必须的，但常常会不够比特来编码两个声道的时间包络。参考引文[I]，低比特率立体声编码以提取和量化立体声声像的参数表示为基础。然后，这些参数会被作为边信息与由核心编码器编码的单声道下混信号一起传输。在解码器中，可以根据单声道下混信号和边信息(即，包含立体声信号的空间[左侧和右侧]信息的立体声参数)重新构建立体声信号。对于立体声编解码器，如果单声道下混信号被归类为瞬态信号，则重新构建的立体声信号中可能会有预回声膺象。进行后处理可以提高两个声道都是瞬态声道或只有一个声道是瞬态声道的信号的质量。但对于参数立体声编解码器，通常会不够比特来编码两个声道的时间包络。根据引文[2]和[3]，单声道输入信号在编码器中被分类为瞬态信号和正常信号。然后，在解码器中，根据所传输的分类信息，会使用时标合成算法来提高质量。上述各种算法都适用于单声道下混信号。可用于传输信号的带宽受限这个问题不仅在传输立体声语音信号或音频信号时会遇到，而且是传输多声道音频信号时会遇到的一个常见问题，立体声音频编码代表多声道音频编码的具体情况。

发明内容
本发明实施例提供了一种多入多出信号的检测方法和装置，用于在与并行干扰抵消法的计算复杂度保持同一量级的情况下，误码率性能优于并行干扰抵消法，并对降秩的MIMO信号进行解调的误码率性能优于并行干扰抵消法。本发明的目的是提供一种更好的低比特率参数多声道编码方法或参数立体声编码方法，以便以高带宽效率方式减少瞬态音频信号中的预回声失真。根据第一方面，建议使用一种适用于对由低比特率音频编码系统处理的已解码立体声信号进行后处理的装置，其中所述装置包含一个接收器和一个后处理器。该装置用于对以下信号进行后处理立体声信号的左声道信号和右声道信号当中的至少一个，正由低比特率音频编码/解码系统从已解码下混信号生成的左声道信号和右声道信号，以及代表立体声信号的下混信号或已解码下混信号。接收器可用于接收立体声信号的左声道信号和右声道信号、正从已解码下混信号生成的左声道信号和右声道信号、已解码下混信号的时间包络以及指示立体声信号的瞬态类型的分类指示。后处理器可用于根据已解码下混信号的时间包络(通过相应的加权因子以依赖于分类指示的方式进行加权)对左声道信号和右声道信号当中的至少一个进行后处理。根据分类指示，可以有选择性地决定要对哪个或哪些左声道信号和右声道信号进行后处理。可以通过已解码下混信号的加权时间包络的方式进行后处理，而已解码下混信号可以通过加权因子进行加权。如果是进行立体声音频编码，下混信号又可称为单声道下混信号或单声道信号，这种信号可以在编码器中从左声道信号和右声道信号生成。生成的已编码下混信号可以通过音频声道传输(但一般是通过传输链路)传输到装置以进行后处理。这种用于进行后处理的装置可以是解码器的一个组成部分。另外，编码器中可以有一个瞬态检测模型或实体，用于针对后处理为装置提供指示，以指示下混信号是不是瞬态信号。特别是，如果下混信号被瞬态检测模型归类为瞬态信号，则可以提取下混信号的时间包络并将其传输到解码器，该解码器可以带有所述用于进行后处理的装置。根据第一方面的第一种实施形式，该装置还可以带有用于决定要对哪个或哪些左声道信号和右声道信号进行后处理的判定器。判定器可以根据指示立体声信号的瞬态类型的分类指示做出决定。根据第一方面的第二种实施形式，该装置还可以带有用于决定要对哪个或哪些左声道信号和右声道信号进行后处理的判定器，该判定器可以根据指示立体声信号的瞬态类型的分类指示和指示已解码下混信号的瞬态类型的分类指示做出决定。指示立体声信号的瞬态类型的分类指示和指示已解码下混信号的瞬态类型的分类指示可以由编码器提供。除了这两个分类指示，判定器还可以接收并使用声道间电平差(CLD)及其它立体声参数。CLD及其它立体声参数可以由编码器提供。根据第一方面的第三种实施形式，该装置还可以带有用于决定要对哪个或哪些左声道信号和右声道信号进行后处理的判定器，该判定器可以根据指示立体声信号的瞬态类型的分类指示做出决定，其中所述判定器在分类指示指示立体声信号的非瞬态类型的情况下可以决定要对左声道信号和右声道信号进行后处理。因此，如果下混信号是瞬态信号，而立体声信号是非瞬态信号，那么，左声道信号和右声道信号都可以进行后处理。如果是对左声道信号和右声道信号都进行后处理，则可以使用已解码下混信号的时间包络(又称为单声道时间包络)；已解码下混信号通过不同的加权因子进行加权，而用于各个声道信号的加权因子又称为特定于声道信号的加权因子。根据第一方面的第四种实施形式，该装置还可以带有用于决定要对哪个或哪些左声道信号和右声道信号进行后处理的判定器，该判定器可以根据指示立体声信号的瞬态类型的分类指示做出决定，其中所述判定器在分类指示指示立体声信号的非瞬态类型的情况下可以决定要对哪一个(唯个)左声道信号和右声道信号进行后处理。根据第一方面的第五种实施形式，该装置还可以带有用于决定要对哪个或哪些左声道信号和右声道信号进行后处理的判定器，该判定器可以根据指示立体声信号的瞬态类型的分类指示做出决定，其中所述判定器在分类指示指示立体声信号的非瞬态类型的情况下可以决定要对其中一个信号能量较高的左声道信号和右声道信号进行后处理。根据第一方面的第六种实施形式，后处理器还可以带有第一后处理实体，该实体可以使用接收到的已解码下混信号(通过第一加权因子加权)的时间包络来对左声道信号进行后处理。根据第一方面的第七种实施形式，后处理器还可以带有第二后处理实体，该实体可以使用接收到的已解码下混信号(通过第二加权因子加权)的时间包络来对右声道信号进行后处理。根据第一方面的第八种实施形式，该装置还可以带有一个判定器、第一后处理实体和第二后处理实体。该判定器可以决定要对哪个或哪些左声道信号和右声道信号进行后处理，可以根据分类指示做出决定。第一后处理实体可以使用接收到的已解码下混信号(通过第一加权因子加权)的时间包络来对左声道信号进行后处理。第二后处理实体可以使用接收到的已解码下混信号(通过第二加权因子加权)的时间包络来对右声道信号进行后处理。判定器可用于控制第一后处理实体和第二后处理实体。根据第一方面的第九种实施形式，该装置还可以带有一个判定器、第一后处理实体和第二后处理实体。该判定器可以决定要对哪个或哪些左声道信号和右声道信号进行后处理，可以根据分类指示做出决定。第一后处理实体可以使用接收到的已解码下混信号(通过第一加权因子加权)的时间包络来对左声道信号进行后处理。第二后处理实体可以使用接收到的已解码下混信号(通过第二加权因子加权)的时间包络来对右声道信号进行后处理。判定器可用于根据接收到的立体声信号的左声道信号和右声道信号的声道间电平差(CLD)或者根据接收到的其它参数或信息计算第一加权因子和第二加权因子。CLD或其它参数/信息可以由编码器提供。这些其它参数可以是与左声道信号和右声道信号相关的(即，不与CLD相关的)其它能量指标，甚至可以是特定于声道的加权因子。根据第一方面的第十种实施形式，该装置还可以带有一个判定器、第一后处理实体和第二后处理实体。该判定器可以决定要对哪个或哪些左声道信号和右声道信号进行后处理，可以根据分类指示做出决定。第一后处理实体可以使用接收到的已解码下混信号(通过第一加权因子加权)的时间包络来对左声道信号进行后处理。第二后处理实体可以
使用接收到的已解码下混信号(通过第二加权因子加权)的时间包络来对右声道信号进行后处理。判定器可以用aleft=2c/(1+c)计算第一加权因子，用aright=2/(1+c)计算第二加权因子，其中
所述c = 10 to the power of cld/20,
权利要求
1.装置(101，201，713;101’ ；201’ )用于对多声道信号的多个声道信号当中的至少一个声道信号进行后处理，其中要接受后处理的所述至少一个声道信号由低比特率音频编码 /解码系统从已解码下混信号生成，该装置(101，201，713 ;101’ ；201’ )包括接收器(103 ;103’)，用于接收从已解码下混信号生成的至少一个声道信号、已解码下混信号的时间包络以及指示至少一个声道信号的瞬态类型的分类指示，该分类指示与至少一个声道信号相关；以及后处理器(105,213,215,717,719 ; 105’，213’，215’)，用于根据已解码下混信号的时间包络对至少一个声道信号进行后处理，所述时间包络经过基于分类指示的方法产生的加权因子进行加权。
2.根据权利要求1所述的装置，其中所述接收器(103;103’ )用于接收多个声道信号和多个分类指示，其中每个分类指示与所述声道信号的声道信号相关，且每个分类指示指示相关的声道信号的瞬态类型；该装置还包括判定器(211 ；715 ;211’)，用于确定所述多个声道信号当中进行后处理的声道信号，其中所述判定器根据指示对应声道信号的瞬态类型的分类指示进行确定。
3.根据权利要求1或2所述的装置，该装置包括用于确定所述多个声道信号当中进行后处理的声道信号的判定器(211 ；715 ;211’)，该判定器可以根据指示声道信号的瞬态类型的分类指示和指示下混信号的瞬态类型的分类指示进行确定。
4.根据权利要求3所述的装置，如果分类指示指示下混信号是瞬态下混信号，且与至少一个多声道信号相关的声道的分类指示指示至少有一条声道不是瞬态声道，则可以将其中所述判定器(211’ )配置为能够控制后处理器对至少一个声道信号进行后处理。
5.根据权利要求3或4所述的装置，如果分类指示指示下混信号是瞬态下混信号，与至少一个多声道信号相关的声道的分类指示指示至少一个声道信号是瞬态声道信号，且至少一个声道信号的能量指标大于对应的参考信号的能量指标，则所述判定器(211’ )配置为能够控制后处理器对至少一个声道信号进行后处理。
6.根据权利要求3至5中的任一个所述的装置，如果分类指示指示下混信号是瞬态下混信号，与至少一个多声道信号相关的声道的分类指示指示至少一个声道信号是瞬态声道信号，且参考信号与至少一个声道信号之间的声道的声道间电平差CLDm小于预定的阈值，则所述判定器(211’ )配置为能够控制后处理器对至少一个声道信号进行后处理。
7.根据权利要求3至6中的任一个所述的装置，如果分类指示指示下混信号是瞬态下混信号，与至少一个多声道信号相关的声道的分类指示指示至少一个声道信号是瞬态声道信号，且至少一个声道信号的能量指标小于对应的参考信号的能量指标，则所述判定器 (211’ )配置为能够控制后处理器不对至少一个声道信号进行后处理。
8.根据权利要求3至7中的任一个所述的装置，如果分类指示指示下混信号是瞬态下混信号，与至少一个多声道信号相关的声道的分类指示指示至少一个声道信号是瞬态声道信号，且参考信号与至少一个声道信号之间的声道的声道间电平差CLDm大于预定的阈值，则所述判定器(211’ )配置为能够通过使用加权时间包络控制后处理器不对至少一个声道信号进行后处理。
9.根据权利要求3至8中的任一个所述的装置，其中所述判定器(211’)用于确定加权因子，根据接收到的至少一个声道信号与参考信号之间的声道间电平差CLDm，使用该加权因子对下混信号的时间包络进行加权，以便对至少一个声道信号进行后处理。
10.根据权利要求1至9中的任一个所述的装置，其中所述下混信号形成参考信号。
11.根据权利要求1至10中的任一个所述的装置，其中所述多声道信号是立体声信号，该立体声信号包括第一声道信号和第二声道信号。
12.一种用于进行多声道音频解码的解码器(201’)，该解码器包括下混信号解码器 (205’ )、上混器(207’ )以及根据权利要求1至11当中的任意一个所述的装置(209’)，其中，下混信号解码器(205’ )用于接收表示多声道信号的已编码下混信号，以及解码已编码下混信号以生成已解码下混信号，上混器(207’)用于接收来自下混信号解码器(205’)的已解码下混信号和与该下混信号相关的多声道参数，以及根据接收到的多声道参数对已解码下混信号进行上混来生成多声道信号的多个声道信号。
13.一种用于对多声道信号的多个声道信号当中的至少一个声道信号进行后处理的方法，其中所述进行后处理的声道信号由低比特率音频编码/解码系统从已解码下混信号生成，该方法包括以下步骤接收从已解码下混信号生成的至少一个声道信号、已解码下混信号的时间包络以及指示至少一个声道信号的瞬态类型的分类指示，该分类指示与至少一个声道信号相关(步骤 401 ;401，);以及根据已解码下混信号的时间包络对至少一个声道信号进行后处理，所述时间包络经过基于分类指示的方法生成的加权因子进行加权(步骤403 ;403’ )。
14.一种装置(101，201，713)，该装置用于对立体声信号的左声道信号和右声道信号当中的至少一个进行后处理，其中由低比特率音频编码/解码系统从已解码下混信号生成所述左声道信号和右声道信号；该装置(101，201，713)包括接收器(103)，用于接收从已解码下混信号生成的所述左声道信号和右声道信号、已解码下混信号的时间包络以及指示立体声信号的瞬态类型的分类指示；以及后处理器(105，213，215，717，719)，用于根据所述已解码下混信号的时间包络对所述左声道信号和右声道信号当中的至少一个进行后处理，所述时间包络经过基于分类指示的方法的加权因子进行加权。
15.根据权利要求14所述的装置还包括判定器(211，715)，该判定器用于根据指示立体声信号的瞬态类型的分类指示确定所述多个声道信号当中进行后处理的声道信号。
16.根据权利要求14或15所述的装置还包括判定器(211，715)，该判定器用于确定所述左声道信号和右声道信号当中进行后处理的声道信号，其中根据指示立体声信号的瞬态类型的分类指示和指示已解码下混信号的瞬态类型的分类指示进行确定。
17.一个用于解码由低比特率音频编码系统从立体声信号处理的下混信号的解码器，该解码器(201，701)包括一个用于解码通过音频声道接收的下混信号的单声道解码器 (205,705)，以及一个用于对根据权利要求14至16当中的任一个所述的已解码下混信号进行后处理的装置(213，215，717，719)，其中所述下混信号是瞬态信号。
18.一种用于对立体声信号的左声道信号和右声道信号当中的至少一个进行后处理的方法，其中由低比特率音频编码/解码系统从已解码下混信号生成所述左声道信号和右声道信号；该方法包括接收从已解码下混信号生成的左声道信号和右声道信号、已解码下混信号的时间包络以及指示立体声信号的瞬态类型的分类指示(步骤401);以及根据已解码下混信号的时间包络对左声道信号和右声道信号当中的至少一个进行后处理(步骤403)，所述时间包络经过基于分类指示的方法产生的加权因子进行加权。
19.一种计算机程序，当在计算机上运行时，该程序可用于执行根据权利要求13或18 所述的方法。
全文摘要
用于对已解码多声道音频信号或已解码立体声信号进行后处理的装置和方法根据本发明，介绍了一种用于对多声道信号的多个声道信号当中的至少一个进行后处理的装置(101，101’)，要接受后处理的声道信号由低比特率音频编码/解码系统从已解码下混信号生成；该装置包括一个接收器(103；103’)，用于接收从已解码下混信号生成的至少一个声道信号、已解码下混信号的时间包络以及指示至少一个声道信号的瞬态类型的分类指示，其中所述分类指示与至少一个声道信号相关；以及一个后处理器(105；105’)，用于根据已解码下混信号的时间包络(通过相应的加权因子以依赖于分类指示的方式进行加权)对至少一个声道信号进行后处理。
文档编号G10L19/00GK103026406SQ201080022195
公开日2013年4月3日申请日期2010年9月28日优先权日2010年9月28日
发明者大卫·维雷特, 郎玥, 苗磊, 吴文海申请人:华为技术有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：大卫·维雷特;郎玥;苗磊;吴文海
技术所有人：华为技术有限公司
我是此专利的发明人

上一篇：具有声音衰减性质的可硫化组合物的制作方法
上一篇：锥形矢量音频编码的制作方法