立体声声音解码方法和立体声声音解码系统与流程

文档序号:34642817发布日期:2023-06-29 17:19阅读:54来源:国知局
立体声声音解码方法和立体声声音解码系统与流程

本公开涉及立体声声音编码,具体但不排他地涉及能够按照低比特率和低延迟在复杂音频场景中产生好的立体声质量的立体声话音(speech)和/或音频编码。


背景技术:

1、历史上,已利用仅具有一个换能器以仅向用户的一只耳朵输出声音的电话听筒(handset)来实现对话电话。最近十来年,用户已开始使用他们的便携式电话听筒结合头戴式受话器,来接收越过他们的双耳的声音,以主要收听音乐,并且有时收听话音。然而,当使用便携式电话听筒来传送和接收对话话音时,内容仍然是单声道的,但是当使用头戴式受话器时内容被呈现到用户的双耳。

2、利用参考文献[1](其全部内容通过引用合并在这里)中描述的最新3gpp话音编码标准,已显著改进了编码的声音的质量,例如通过便携式电话听筒传送和接收的话音和/或音频。下一自然步骤是传送立体声信息,使得接收机尽可能接近在通信链路的另一侧捕获的真实生活音频场景。

3、在音频编解码器中,例如如同参考文献[2](其全部内容通过引用合并在这里)中描述的,正常使用立体声信息的传送。

4、对于对话话音编解码器,单声道信号是规范。当传送单声道信号时,比特率通常需要加倍,因为使用单声道编解码器来编码左和右声道两者。这在大多数情景下工作良好,但是呈现了以下缺点,比特率加倍,并且不能充分利用两个声道(左和右声道)之间的任何潜在冗余。此外,为了在合理水平保持整体比特率,使用用于每一声道的非常低的比特率,由此影响整体声音质量。

5、可能的替换方案是使用参考文献[6](其全部内容通过引用合并在这里)中描述的所谓参数化立体声。参数化立体声发送诸如双耳时间差(itd)或双耳强度差(iid)的信息。后一信息是按每个频带发送的,并且按照低比特率,与立体声传送相关联的比特预算不足够高到允许这些参数有效地工作。

6、传送平移因子(panning factor)可能有助于以低比特率创建基本的立体声效果,但这种技术无法保持周围环境并呈现固有的局限性。太快的平移因子的调节(adaptation)变得干扰听众,而太慢的平移因子的调节并不能反映说话者的真实位置,这使得在干扰说话者的情况下或者当背景噪声的波动重要时,难以获得良好的质量。当前,对于所有可能的音频场景编码具有适当(decent)质量的对话立体声话音需要用于宽带(wb)信号的约24kb/s的最小比特率;低于该比特率时,话音质量开始受损。

7、随着劳动力日益增长的全球化和工作团队在全球的分裂,存在改进通信的需求。例如,电话会议的参与者可能处于不同且遥远的位置。有些参与者可能会在他们的汽车中,其他人可能在大的消声室中或甚至在他们的客厅中。事实上,所有参与者都希望感觉好像他们进行面对面的讨论。在便携式设备中实现立体声话音(更一般的立体声声音),将是朝这个方向迈出的一大步。


技术实现思路

1、根据第一方面,本公开涉及一种用于对立体声声音信号的左声道和右声道进行解码的立体声声音解码方法,包括:接收编码参数,所述编码参数包括主声道的编码参数、辅声道的编码参数和因子β,其中主声道编码参数包括主声道的lp滤波系数;响应于主声道编码参数对主声道进行解码;使用多个编码模型之一对所述辅声道进行解码,其中,所述编码模型中的至少一个使用所述主声道lp滤波系数对所述辅声道进行解码;和使用因子β对解码的主声道和辅声道进行时域上混合,以产生解码的立体声声音信号的左声道和右声道,其中该因子β确定在所述左和右声道的产生时、所述主和辅声道的相应贡献。

2、根据第二方面,提供了一种用于解码立体声声音信号的左和右声道的立体声声音解码系统,包括:用于接收包括主声道的编码参数、辅声道的编码参数、和因子β的编码参数的部件,其中该主声道编码参数包括该主声道的lp滤波系数;响应于该主声道编码参数的该主声道的解码器;使用多个编码模型之一的该辅声道的解码器,其中所述编码模型的至少一个使用所述主声道lp滤波系数来解码该辅声道;和使用因子β以产生所解码的立体声声音信号的左和右声道的所解码的主和辅声道的时域上混合器,其中该因子β确定在所述左和右声道的产生时所述主和辅声道的相应贡献。

3、根据第三方面,提供了一种用于解码立体声声音信号的左和右声道的立体声声音解码系统,包括:至少一个处理器;和存储器,耦接到该处理器,并且包括非瞬时指令,所述指令当运行时促使该处理器实现:用于接收包括主声道的编码参数、辅声道的编码参数、和因子β的编码参数的部件,其中该主声道编码参数包括该主声道的lp滤波系数;响应于该主声道编码参数的该主声道的解码器;使用多个编码模型之一的该辅声道的解码器,其中所述编码模型的至少一个使用所述主声道lp滤波系数来解码该辅声道;和使用因子β以产生所解码的立体声声音信号的左和右声道的所解码的主和辅声道的时域上混合器,其中该因子β确定在所述左和右声道的产生时所述主和辅声道的相应贡献。

4、另一方面涉及一种用于解码立体声声音信号的左和右声道的立体声声音解码系统,包括:至少一个处理器;和存储器,耦接到该处理器,并且包括非瞬时指令,所述指令当运行时促使该处理器:接收包括主声道的编码参数、辅声道的编码参数、和因子β的编码参数,其中该主声道编码参数包括该主声道的lp滤波系数;响应于该主声道编码参数解码该主声道;使用多个编码模型之一解码该辅声道,其中所述编码模型的至少一个使用所述主声道lp滤波系数来解码该辅声道;和使用因子β对所解码的主和辅声道进行时域上混合,以产生所解码的立体声声音信号的左和右声道,其中该因子β确定在所述左和右声道的产生时所述主和辅声道的相应贡献。

5、本公开还涉及一种处理器可读存储器,包括非瞬时指令,所述指令当运行时,促使处理器实现上述方法的操作。

6、本公开还涉及一种立体声声音解码方法,包括:接收包括主声道的编码参数和辅声道的编码参数的编码参数,其中所述主声道编码参数包括该主声道的lp滤波系数;响应于该主声道编码参数解码该主声道;和使用多个编码模型之一来解码该辅声道,其中(a)所述编码模型的至少一个使用所述主声道lp滤波系数来解码该辅声道,和(b)所述编码模型中的至少一个使用除了所述lp滤波系数之外的主声道编码参数来解码该辅声道。

7、本公开还涉及一种立体声声音解码系统,包括:用于接收包括主声道的编码参数和辅声道的编码参数的编码参数的部件,其中所述主声道编码参数包括该主声道的lp滤波系数;响应于该主声道编码参数的该主声道的解码器;和使用多个编码模型之一的该辅声道的解码器,其中(a)所述编码模型的至少一个使用所述主声道lp滤波系数来解码该辅声道,和(b)所述编码模型中的至少一个使用除了所述lp滤波系数之外的主声道编码参数来解码该辅声道。

8、通过阅读参考附图仅作为示例给出的其示意性实施例的以下非限制性描述,用于解码立体声声音信号的左和右声道的立体声声音解码方法和系统的前述和其他目的、优点和特征将变得更清楚。



技术特征:

1.一种立体声声音解码方法,包括:

2.根据权利要求1所述的立体声声音解码方法,其中所述编码模型包括通用编码模型、无声编码模型和不活动编码模型。

3.根据权利要求1所述的立体声声音解码方法,其中所述辅声道编码参数包括标识在解码辅声道时要使用的编码模型之一的信息。

4.根据权利要求1至3中任一项所述的立体声声音解码方法,其中:

5.根据权利要求4所述的立体声声音解码方法,对于解码立体声声音信号的左声道和右声道,包括:

6.根据权利要求4或5所述的立体声声音解码方法,其中接收编码参数包括:从立体声声音编码器接收比特流,并从该比特流提取所述编码参数。

7.一种立体声声音解码系统,包括:

8.根据权利要求7所述的立体声声音解码系统,其中所述辅声道解码器包括使用通用编码模型的第一解码器、以及使用通用编码模型、无声编码模型和不活动编码模型之一的第二解码器。

9.根据权利要求7所述的立体声声音解码系统,其中所述辅声道编码参数包括标识在解码辅声道时要使用的编码模型之一的信息,并且其中所述立体声声音解码系统包括判断模块,用于向所述第一和第二解码器指示在解码辅声道时要使用的编码模型。

10.根据权利要求7至9中任一项所述的立体声声音解码系统,其中:

11.根据权利要求10所述的立体声声音解码系统,对于解码立体声声音信号的左声道和右声道,包括:

12.根据权利要求10或11所述的立体声声音解码系统,其中所述编码参数接收部件从立体声声音编码器接收比特流,并从该比特流提取所述编码参数。

13.根据权利要求12所述的立体声声音解码系统,其中所述编码参数接收部件包括解多路复用器。


技术总结
本公开涉及一种立体声声音解码方法和立体声声音解码系统。所述立体声声音解码方法包括:接收包括主声道的编码参数和辅声道的编码参数的编码参数,其中所述主声道编码参数包括该主声道的LP滤波系数;响应于该主声道编码参数解码该主声道;和使用多个编码模型之一来解码该辅声道,其中(a)所述编码模型的至少一个使用所述主声道LP滤波系数来解码该辅声道,和(b)所述编码模型中的至少一个使用除了所述LP滤波系数之外的主声道编码参数来解码该辅声道。

技术研发人员:T·瓦尔兰科特,M·杰利内克
受保护的技术使用者:沃伊斯亚吉公司
技术研发日:
技术公布日:2024/1/13
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1