用于音频数据的压缩的方法、装置及计算机可读存储媒体与流程

文档序号：18932879发布日期：2019-10-22 20:54阅读：来源：国知局

技术特征：

1.一种用于音频数据的压缩的方法，其包括：

通过装置获得描述球谐域中的声场的多个球谐系数；

通过所述装置相对于所述多个球谐系数执行线性分解以产生所述声场的空间分量和所述声场的主要声信号，所述空间分量在所述球谐域中定义且表示所述主要声信号的形状、宽度和方向；

通过所述装置确定用于表示所述空间分量的位数目的估计值；以及

通过所述装置基于所述估计值与目标位速率之间的差确定将在压缩所述空间分量时使用的量化步长；

通过所述装置基于所确定的量化步长来压缩所述空间分量以获得所述空间分量的经压缩版本；

通过所述装置压缩所述主要声信号以获得所述主要声信号的经压缩版本；

通过所述装置产生位流以包括所述空间分量的经压缩版本和所述主要声信号的经压缩版本。

2.根据权利要求1所述的方法，其中确定所述量化步长包括：

确定所述估计值与所述目标位速率之间的所述差；以及

通过将所述差相加到所述目标位速率而确定所述量化步长。

3.根据权利要求1所述的方法，其中确定所述位数目的所述估计值包括计算在给定对应于所述目标位速率的码簿的情况下将针对所述空间分量产生的所述位数目的所述估计值。

4.根据权利要求1所述的方法，其中确定所述位数目的所述估计值包括计算在给定压缩所述空间分量时使用的译码模式的情况下将针对所述空间分量产生的所述位数目的所述估计值。

5.根据权利要求1所述的方法，其中确定所述位数目的所述估计值包括：

计算在给定压缩所述空间分量时将使用的第一译码模式的情况下将针对所述空间分量产生的所述位数目的第一估计值；

计算在给定压缩所述空间分量时将使用的第二译码模式的情况下将针对所述空间分量产生的所述位数目的第二估计值；

选择所述第一估计值和所述第二估计值中的具有最少位数目的一者以用作所述位数目的所确定的估计值。

6.根据权利要求1所述的方法，其中确定所述位数目的所述估计值包括：

识别识别所述空间分量所对应的类别的类别识别符；

识别在压缩对应于所述类别的所述空间分量时将产生的所述空间分量的残余值的位长度；以及

通过至少部分地将用于表示所述类别识别符的位数目相加到所述残余值的所述位长度而确定所述位数目的所述估计值。

7.根据权利要求1所述的方法，其进一步包括选择多个码簿中的将在压缩所述空间分量时使用的一者。

8.根据权利要求7所述的方法，其中

确定所述估计值包括使用所述多个码簿中的每一者确定用于表示所述空间分量的所述位数目的相应估计值；以及

选择所述多个码簿中的一者包括选择所述多个码簿中的产生具有最少位数目的所确定的估计值的所述一者。

9.根据权利要求7所述的方法，其中确定所述估计值包括使用所述多个码簿中的一或多者确定用于表示所述空间分量的位数目的所述估计值，所述多个码簿中的所述一或多者是基于所述空间分量的待压缩的元素相对于所述空间分量的其它元素的阶数而选择。

10.根据权利要求7所述的方法，其中确定所述估计值包括使用所述多个码簿中的经设计以在所述空间分量并非从后续空间分量预测时将使用的一者来确定用于表示所述空间分量的位数目的估计值。

11.根据权利要求7所述的方法，其中确定所述估计值包括使用所述多个码簿中的经设计以在所述空间分量是从后续空间分量预测时将使用的一者来确定用于表示所述空间分量的位数目的所述估计值。

12.根据权利要求7所述的方法，其中确定所述估计值包括使用所述多个码簿中的经设计以在所述空间分量表示所述声场中的合成音频对象时将使用的一者来确定用于表示所述空间分量的位数目的所述估计值。

13.根据权利要求7所述的方法，其中确定所述估计值包括使用所述多个码簿中的经设计以在所述空间分量表示所述声场中的经记录音频对象时使用的一者来确定用于表示所述空间分量的位数目的所述估计值。

14.根据权利要求1所述的方法，进一步包括通过一或多个麦克风来捕获表示所述多个球谐系数的音频信号。

15.一种用于音频数据的压缩的装置，其包括：

一或多个处理器，其经配置以：

获得描述球谐域中的声场的多个球谐系数；

相对于所述多个球谐系数执行线性分解以产生所述声场的空间分量和所述声场的主要声信号，所述空间分量在所述球谐域中定义且表示所述主要声信号的形状、宽度和方向；

确定用于表示所述空间分量的位数目的估计值；

基于所述估计值与目标位速率之间的差确定将在压缩所述空间分量时使用的量化步长；

基于所确定的量化步长来压缩所述空间分量以获得所述空间分量的经压缩版本；

压缩所述主要声信号以获得所述主要声信号的经压缩版本；

产生位流以包括所述空间分量的经压缩版本和所述主要声信号的经压缩版本；以及

存储器，其耦合到所述一或多个处理器且经配置以存储所述空间分量的经压缩版本。

16.根据权利要求15所述的装置，其中所述一或多个处理器经配置以确定所述估计值与所述目标位速率之间的差，且通过将所述差相加到所述目标位速率而确定所述量化步长。

17.根据权利要求15所述的装置，其中所述一或多个处理器经配置以计算在给定对应于所述目标位速率的码簿的情况下将针对所述空间分量产生的所述位数目的所述估计值。

18.根据权利要求15所述的装置，其中所述一或多个处理器经配置以计算在给定压缩所述空间分量时使用的译码模式的情况下将针对所述空间分量产生的所述位数目的所述估计值。

19.根据权利要求15所述的装置，其中所述一或多个处理器经配置以计算在给定压缩所述空间分量时将使用的第一译码模式的情况下将针对所述空间分量产生的所述位数目的第一估计值，计算在给定压缩所述空间分量时将使用的第二译码模式的情况下将针对所述空间分量产生的所述位数目的第二估计值，选择所述第一估计值和所述第二估计值中的具有最少位数目的一者以用作所述位数目的所述所确定的估计值。

20.根据权利要求15所述的装置，其中所述一或多个处理器经配置以：识别识别所述空间分量所对应的类别的类别识别符；识别在压缩对应于所述类别的所述空间分量时将产生的所述空间分量的残余值的位长度；且通过至少部分地将用于表示所述类别识别符的位数目相加到所述残余值的所述位长度来确定所述位数目的所述估计值。

21.根据权利要求15所述的装置，其中所述一或多个处理器进一步经配置以选择多个码簿中的将在压缩所述空间分量时使用的一者。

22.根据权利要求21所述的装置，其中所述一或多个处理器经配置以使用所述多个码簿中的每一者确定用于表示所述空间分量的位数目的相应估计值，且进一步经配置以选择所述多个码簿中的产生具有最少位数目的所述所确定的估计值的所述一者。

23.根据权利要求21所述的装置，其中所述一或多个处理器经配置以使用所述多个码簿中的一或多者确定所述估计值，所述多个码簿中的所述一或多者是基于所述空间分量的待压缩的元素相对于所述空间分量的其它元素的阶数而选择。

24.根据权利要求21所述的装置，其中所述一或多个处理器经配置以使用所述多个码簿中的经设计以在所述空间分量并非从后续空间分量预测时将使用的一者来确定所述估计值。

25.根据权利要求21所述的装置，其中所述一或多个处理器经配置以使用所述多个码簿中的经设计以在所述空间分量是从后续空间分量预测时将使用的一者来确定所述估计值。

26.根据权利要求21所述的装置，其中所述一或多个处理器经配置以使用所述多个码簿中的经设计以在所述空间分量表示所述声场中的合成音频对象时将使用的一者来确定所述估计值。

27.根据权利要求21所述的装置，其中所述一或多个处理器经配置以使用所述多个码簿中的经设计以在所述空间分量表示所述声场中的经记录音频对象时将使用的一者来确定所述估计值。

28.根据权利要求15所述的装置，进一步包括一或多个麦克风，所述一或多个麦克风经配置以捕获表示所述多个球谐系数的音频信号。

29.一种用于音频数据的压缩的装置，其包括：

用于获得描述球谐域中的声场的多个球谐系数的装置；

用于相对于所述多个球谐系数执行线性分解以产生所述声场的空间分量和所述声场的主要声信号的装置，所述空间分量在所述球谐域中定义且表示所述主要声信号的形状、宽度和方向；

用于确定用于表示所述空间分量的位数目的估计值的装置；

用于基于所述估计值与目标位速率之间的差确定将在压缩所述空间分量时使用的量化步长的装置；

用于压缩所述主要声信号以获得所述主要声信号的经压缩版本的装置；以及

用于基于所确定的量化步长来压缩所述空间分量以获得所述空间分量的经压缩版本和所述主要声信号的经压缩版本的装置。

30.一种非暂时性计算机可读存储媒体，其具有存储于其上的指令，所述指令在被执行时致使一或多个处理器：

获得描述球谐域中的声场的多个球谐系数；相对于所述多个球谐系数执行线性分解以产生所述声场的空间分量和所述声场的主要声信号，所述空间分量在所述球谐域中定义且表示所述主要声信号的形状、宽度和方向；

确定用于表示所述空间分量的位数目的估计值；

基于所述估计值与目标位速率之间的差确定将在压缩所述空间分量时使用的量化步长；

基于所确定的量化步长来压缩所述空间分量以获得所述空间分量的经压缩版本；

压缩所述主要声信号以获得所述主要声信号的经压缩版本；以及

产生位流以包括所述空间分量的经压缩版本和所述主要声信号的经压缩版本。

完整全部详细技术资料下载

当前第2页1 2 3