多个音频信号的解码的制作方法

文档序号:34971107发布日期:2023-08-01 16:30阅读:86来源:国知局

本发明大体上涉及多个音频信号的编码。


背景技术:

1、技术的进步已带来了更小且更强大的计算装置。举例来说,当前存在多种便携式个人计算装置,包含无线电话(例如移动及智能电话)、平板计算机及膝上型计算机,所述便携式个人计算装置小而轻质且容易由用户携带。这些装置可经由无线网络传达语音及数据包。另外,许多此类装置结合额外功能性,例如数字静态相机、数字视频相机、数字记录器及音频文件播放器。此外,此类装置可处理可执行指令,包含软件应用程序,例如可用以存取互联网的网络浏览器应用程序。因而,这些装置可包含显著的计算能力。

2、计算装置可包含接收音频信号的多个麦克风。一般来说,与多个麦克风中的第二麦克风相比,声源更接近于第一麦克风。因此,由于麦克风距声源的相应距离,从第二麦克风接收的第二音频信号可相对于从第一麦克风接收的第一音频信号延迟。在其它实施方案中,第一音频信号可相对于第二音频信号延迟。在立体声编码中,来自麦克风的音频信号可经编码以产生中间声道信号及一或多个旁声道信号。中间声道可对应于第一音频信号及第二音频信号的总和。旁声道信号可对应于第一音频信号与第二音频信号之间的差。由于接收第二音频信号相对于第一音频信号的延迟,第一音频信号可能不与第二音频信号对准。第一音频信号相对于第二音频信号的未对准可增加两种音频信号之间的差。由于差增加,所以可能会使用较高数目的位来编码旁声道信号。


技术实现思路

1、在特定实施方案中,一种装置包含接收器,其经配置以从第二装置接收经编码位流。所述经编码位流包含时间失配值及立体声参数。所述时间失配值及所述立体声参数是基于在所述第二装置处捕获的参考声道及在所述第二装置处捕获的目标声道而确定。所述装置还包含解码器,其经配置以解码所述经编码位流以产生第一频域输出信号及第二频域输出信号。所述解码器还经配置以对所述第一频域输出信号执行第一逆变换操作以产生第一时域信号。所述解码器经进一步配置以对所述第二频域输出信号执行第二逆变换操作以产生第二时域信号。所述解码器还经配置以基于所述时间失配值将所述第一时域信号或所述第二时域信号中的一者映射为经解码目标声道。所述解码器经进一步配置以将所述第一时域信号或所述第二时域信号中的另一者映射为经解码参考声道。所述解码器还经配置以基于所述时间失配值对所述经解码目标声道执行因果时域移位操作以产生经调整解码目标声道。所述装置还包含输出装置,其经配置以输出第一输出信号及第二输出信号。所述第一输出信号是基于所述经解码参考声道且所述第二输出信号是基于所述经调整解码目标声道。

2、所述装置还包含立体声解码器,其经配置以解码所述经编码位流以产生经解码中间信号。所述装置进一步包含变换单元,其经配置以对所述经解码中间信号执行变换操作以产生频域经解码中间信号。所述装置还包含升混器,其经配置以对所述频域经解码中间信号执行升混操作以产生所述第一频域输出信号及所述第二频域输出信号。所述立体声参数在所述升混操作期间应用于所述频域经解码中间信号。

3、在另一特定实施方案中,一种方法包含在装置的接收器处从第二装置接收经编码位流。所述经编码位流包含时间失配值及立体声参数。所述时间失配值及所述立体声参数是基于在所述第二装置处捕获的参考声道及在所述第二装置处捕获的目标声道而确定。所述方法还包含在所述装置的解码器处解码所述经编码位流以产生第一频域输出信号及第二频域输出信号。所述方法还包含对所述第一频域输出信号执行第一逆变换操作以产生第一时域信号。所述方法进一步包含对所述第二频域输出信号执行第二逆变换操作以产生第二时域信号。所述方法还包含基于所述时间失配值将所述第一时域信号或所述第二时域信号中的一者映射为经解码目标声道。所述方法进一步包含将所述第一时域信号或所述第二时域信号中的另一者映射为经解码参考声道。所述方法还包含输出第一输出信号及第二输出信号。所述第一输出信号是基于所述经解码参考声道且所述第二输出信号是基于所述经调整解码目标声道。

4、所述方法还包含解码所述经编码位流以产生经解码中间信号。所述方法进一步包含对所述经解码中间信号执行变换操作以产生频域经解码中间信号。所述方法还包含对所述频域经解码中间信号执行升混操作以产生所述第一频域输出信号及所述第二频域输出信号。所述立体声参数在所述升混操作期间应用于所述频域经解码中间信号。

5、在另一特定实施方案中,一种非暂时性计算机可读媒体包含指令,所述指令在由解码器内的处理器执行时致使所述解码器执行操作,所述操作包含解码从第二装置接收的经编码位流以产生第一频域输出信号及第二频域输出信号。所述经编码位流包含时间失配值及立体声参数。所述时间失配值及所述立体声参数是基于在所述第二装置处捕获的参考声道及在所述第二装置处捕获的目标声道而确定。所述操作还包含对所述第一频域输出信号执行第一逆变换操作以产生第一时域信号。所述操作还包含对所述第二频域输出信号执行第二逆变换操作以产生第二时域信号。所述操作还包含基于所述时间失配值将所述第一时域信号或所述第二时域信号中的一者映射为经解码目标声道。所述操作还包含将所述第一时域信号或所述第二时域信号中的另一者映射为经解码参考声道。所述操作还包含输出第一输出信号及第二输出信号。所述第一输出信号是基于所述经解码参考声道且所述第二输出信号是基于所述经调整解码目标声道。

6、所述操作还包含解码所述经编码位流以产生经解码中间信号。所述操作进一步包含对所述经解码中间信号执行变换操作以产生频域经解码中间信号。所述操作还包含对所述频域经解码中间信号执行升混操作以产生所述第一频域输出信号及所述第二频域输出信号。所述立体声参数在所述升混操作期间应用于所述频域经解码中间信号。

7、在另一特定实施方案中,一种设备包含用于从第二装置接收经编码位流的装置。所述经编码位流包含时间失配值及立体声参数。所述时间失配值及所述立体声参数是基于在所述第二装置处捕获的参考声道及在所述第二装置处捕获的目标声道而确定。所述设备还包含用于解码所述经编码位流以产生第一频域输出信号及第二频域输出信号的装置。所述设备进一步包含用于对所述第一频域输出信号执行第一逆变换操作以产生第一时域信号的装置。所述设备还包含用于对所述第二频域输出信号执行第二逆变换操作以产生第二时域信号的装置。所述设备进一步包含用于基于所述时间失配值将所述第一时域信号或所述第二时域信号中的一者映射为经解码目标声道的装置。所述设备还包含用于将所述第一时域信号或所述第二时域信号中的另一者映射为经解码参考声道的装置。所述设备进一步包含用于基于所述时间失配值对所述经解码目标声道执行因果时域移位操作以产生经调整解码目标声道的装置。所述设备还包含用于输出第一输出信号及第二输出信号的装置。所述第一输出信号是基于所述经解码参考声道且所述第二输出信号是基于所述经调整解码目标声道。

8、本发明的其它实施方案、优势及特征将在审阅整个申请案之后变得显而易见,所述整个申请案包含以下章节:附图说明、具体实施方式及权利要求书。



技术特征:

1.一种用于处理音频信号的装置,其包括:

2.根据权利要求1所述的装置,其中在所述第二装置处,所述时间失配值及所述立体声参数是使用编码器侧窗口化方案而确定。

3.根据权利要求2所述的装置,其中所述编码器侧窗口化方案使用具有第一重叠大小的第一窗口,且其中在所述解码器处的解码器侧窗口化方案使用具有第二重叠大小的第二窗口。

4.根据权利要求3所述的装置,其中所述第一重叠大小不同于所述第二重叠大小。

5.根据权利要求4所述的装置,其中所述第二重叠大小小于所述第一重叠大小。

6.根据权利要求2所述的装置,其中所述编码器侧窗口化方案使用具有第一补零量的第一窗口,且其中在所述解码器处的解码器侧窗口化方案使用具有第二补零量的第二窗口。

7.根据权利要求6所述的装置,其中所述第一补零量不同于所述第二补零量。

8.根据权利要求7所述的装置,其中所述第二补零量小于所述第一补零量。

9.根据权利要求1所述的装置,其中所述立体声参数包含基于所述第二装置处的所述参考声道及所述目标声道估计的声道间声级差ild值的集合及声道间相位差ipd值的集合。

10.根据权利要求9所述的装置,其中ild值的所述集合及ipd值的所述集合被传输至所述接收器。

11.根据权利要求1所述的装置,其中对所述解码目标声道执行的所述时域移位操作是基于所述时间失配值的绝对值。

12.根据权利要求1所述的装置,其进一步包括:

13.根据权利要求1所述的装置,其中所述接收器、所述解码器及所述输出装置集成至移动装置中。

14.根据权利要求1所述的装置,其中所述接收器、所述解码器及所述输出装置集成至基站中。

15.一种用于处理音频信号的方法,其包括:

16.根据权利要求15所述的方法,其中在所述第二装置处,所述时间失配值及所述立体声参数是使用编码器侧窗口化方案而确定。

17.根据权利要求16所述的方法,其中所述编码器侧窗口化方案使用具有第一重叠大小的第一窗口,且其中在所述解码器处的解码器侧窗口化方案使用具有第二重叠大小的第二窗口。

18.根据权利要求17所述的方法,其中所述第一重叠大小不同于所述第二重叠大小。

19.根据权利要求18所述的方法,其中所述第二重叠大小小于所述第一重叠大小。

20.根据权利要求16所述的方法,其中所述编码器侧窗口化方案使用具有第一补零量的第一窗口,且其中在所述解码器处的解码器侧窗口化方案使用具有第二补零量的第二窗口。

21.根据权利要求15所述的方法,其进一步包括:

22.根据权利要求15所述的方法,其中对所述经解码目标声道的所述时域移位操作是在移动装置处执行。

23.根据权利要求15所述的方法,其中对所述解码目标声道的所述时域移位操作是在基站处执行。

24.一种非暂时性计算机可读媒体,其包括指令,所述指令在由解码器内的处理器执行时致使所述处理器执行包括以下各者的操作:

25.根据权利要求24所述的非暂时性计算机可读媒体,其中在所述第二装置处,所述时间失配值及所述立体声参数是使用编码器侧窗口化方案而确定。

26.根据权利要求25所述的非暂时性计算机可读媒体,其中所述编码器侧窗口化方案使用具有第一重叠大小的第一窗口,且其中在所述解码器处的解码器侧窗口化方案使用具有第二重叠大小的第二窗口。

27.根据权利要求26所述的非暂时性计算机可读媒体,其中所述第一重叠大小不同于所述第二重叠大小。

28.一种用于处理音频信号的设备,其包括:

29.根据权利要求28所述的设备,其中所述用于执行所述时域移位操作的装置集成至移动装置中。

30.根据权利要求28所述的设备,其中所述用于执行所述时域移位操作的装置集成至基站中。


技术总结
本发明提供一种装置,其包含经配置以从第二装置接收经编码位流的接收器。所述经编码位流包含基于在所述第二装置处捕获的参考声道及在所述第二装置处捕获的目标声道而确定的时间失配值。所述装置还包含经配置以解码所述经编码位流以产生第一频域输出信号及第二频域输出信号的解码器。所述解码器经配置以对所述频域输出信号执行逆变换操作以产生第一时域信号及第二时域信号。基于所述时间失配值,所述解码器经配置以将所述时域信号映射至经解码目标声道及经解码参考声道。所述解码器还经配置以基于所述时间失配值对所述经解码目标声道执行因果时域移位操作以产生经调整解码目标声道。

技术研发人员:V·S·C·S·奇比亚姆,V·阿提
受保护的技术使用者:高通股份有限公司
技术研发日:
技术公布日:2024/1/13
网友询问留言 留言:0条
  • 还没有人留言评论。精彩留言会获得点赞!