信号处理装置、方法及程序与流程

文档序号:33764280发布日期:2023-04-18 19:01阅读:50来源:国知局
信号处理装置、方法及程序与流程

本技术涉及信号处理装置、信号处理方法和程序,并且更具体地,涉及能够提高编码效率的信号处理装置、信号处理方法和程序。


背景技术:

1、在现有技术中,已知作为国际标准的运动图像专家组(mpeg)-d统一语音和音频编码(usac)标准或使用mpeg-d usac标准作为核心编码器的mpeg-h 3d音频标准的编码等(例如,参见npl1至npl3)。

2、[引用列表]

3、[非专利文献]

4、[npl 1]

5、iso/iec 23003-3,mpeg-d usac

6、[npl 2]

7、iso/iec 23008-3,mpeg-h 3d audio

8、[npl 3]

9、iso/iec 23008-3:2015/amendment3,mpeg-h 3d audio phase 2。


技术实现思路

1、[技术问题]

2、在mpeg-h 3d音频标准等中处理的3d音频中,可利用每个对象的元数据(例如,表示声音材料(对象)的位置、距离和对象的增益的水平和垂直角度)再现三维声音的方向、距离、传播等。为此,在3d音频中,与现有技术的立体再现相比,能够以更大的存在感再现音频。

3、然而,为了传输由3d音频实现的大量对象的数据,需要能够以更高的压缩效率以高速解码大量音频信道的编码技术。即,需要改善编码效率。

4、鉴于这种情况设计本技术并且能够提高编码效率。

5、[问题的解决方案]

6、根据本技术的第一方面的信号处理装置包括:校正单元,被配置为基于音频对象的元数据中包括的增益值校正音频对象的音频信号;以及量化单元,被配置为基于通过校正获得的信号计算听觉心理参数并且量化音频信号。

7、根据本技术的第一方面的信号处理方法或程序包括:基于包括在音频对象的元数据中的增益值校正音频对象的音频信号;基于通过校正获得的信号计算听觉心理参数;以及量化音频信号。

8、在本技术的第一方面中,基于音频对象的元数据中包括的增益值来校正音频对象的音频信号,基于通过校正获得的信号来计算听觉心理参数,并且对音频信号进行量化。

9、根据本技术的第二方面的信号处理装置包括:修改单元,被配置为基于音频对象的元数据中包括的增益值来修改音频对象的增益值和音频信号;以及量化单元,被配置为量化通过修改获得的经修改的音频信号。

10、根据本技术的第二方面的信号处理方法或程序包括基于包括在音频对象的元数据中的增益值修改音频对象的增益值和音频信号,并量化通过修改获得的经修改的音频信号。

11、在本技术的第二方面,基于包括在音频对象的元数据中的增益值修改音频对象的增益值和音频信号,并量化通过修改获得的经修改的音频信号。

12、根据本技术的第三方面的信号处理装置包括:量化单元,被配置为基于包括音频对象的增益值和位置信息中的至少一项的元数据、音频对象的音频信号以及与多个音频对象之间的听觉掩模相关的听觉心理模型来计算听觉心理参数,并基于听觉心理参数对音频信号进行量化。

13、根据本技术的第三方面的信号处理方法或程序包括:基于包括音频对象的增益值和位置信息中的至少一项的元数据、音频对象的音频信号、以及与多个音频对象之间的听觉掩模相关的听觉心理模型,计算听觉心理参数,以及基于听觉心理参数对音频信号进行量化。

14、在本技术的第三方面中,基于,包括音频对象的增益值和位置信息中的至少一项的元数据、所述音频对象的音频信号、以及与多个音频对象之间的听觉掩模相关的听觉心理模型,计算听觉心理参数,并且基于听觉心理参数对音频信号进行量化。

15、根据本技术的第四方面的信号处理装置包括:量化单元,被配置为基于音频对象的音频信号和指示音频对象的声源的类型的标记信息,使用针对标记信息指示的声源的类型确定的调整参数和算法中的至少一项,对音频对象的音频信号进行量化。

16、根据本技术的第四方面的信号处理方法或程序包括:基于音频对象的音频信号和指示音频对象的声源的类型的标记信息,使用针对标记信息指示的声源的类型确定的调整参数和算法中的至少一项对音频对象的音频信号进行量化。

17、在本技术的第四方面,基于音频对象的音频信号和指示音频对象的声源的类型的标记信息,使用针对标记信息指示的声源的类型确定的调整参数和算法中的至少一项对音频对象的音频信号进行量化。



技术特征:

1.一种信号处理装置,包括:

2.根据权利要求1所述的信号处理装置,其中,所述校正单元基于所述增益值在时域中校正所述音频信号。

3.根据权利要求2所述的信号处理装置,进一步包括:

4.根据权利要求1所述的信号处理装置,进一步包括:

5.根据权利要求1所述的信号处理装置,进一步包括:

6.根据权利要求5所述的信号处理装置,其中,所述增益校正单元基于针对由所述元数据中包括的位置信息指示的位置的听觉特性,校正所述增益值。

7.根据权利要求6所述的信号处理装置,进一步包括:

8.根据权利要求7所述的信号处理装置,其中,在与所述位置信息指示的位置对应的所述增益校正值不在所述听觉特性表中的情况下,所述增益校正单元基于与所述位置信息指示的位置附近的多个位置相关联的增益校正值执行插值处理,获得所述位置信息指示的位置的增益校正值,将与所述位置信息指示的位置最近的位置相关联的增益校正值设定为所述位置信息指示的位置的增益校正值,或者将与所述位置信息指示的位置附近的多个位置相关联的增益校正值的平均值设定为所述位置信息指示的位置的增益校正值。

9.根据权利要求8所述的信号处理装置,其中,所述插值处理是使用vbap的插值处理。

10.一种信号处理方法,包括:

11.一种程序,使计算机执行包括以下步骤的处理:

12.一种信号处理装置,包括:

13.根据权利要求12所述的信号处理装置,其中,在所述增益值是落在预定范围之外的值的情况下,所述修改单元执行修改。

14.根据权利要求12所述的信号处理装置,进一步包括:

15.根据权利要求12所述的信号处理装置,进一步包括:

16.根据权利要求12所述的信号处理装置,其中,所述修改单元基于所述增益值与通过修改获得的修改的增益值之间的差值,修改所述音频信号。

17.一种信号处理方法,包括:使信号处理装置基于包括在音频对象的元数据中的增益值,修改音频信号和所述音频对象的增益值,并量化通过修改获得的修改的音频信号。

18.一种程序,使计算机执行包括以下步骤的处理:

19.一种信号处理装置,包括:

20.根据权利要求19所述的信号处理装置,进一步包括:

21.根据权利要求19所述的信号处理装置,其中,所述量化单元基于待处理的所述音频对象的所述元数据和所述音频信号、其他音频对象的元数据和音频信号、以及所述听觉心理模型,计算所述听觉心理参数。

22.根据权利要求19所述的信号处理装置,其中,所述元数据包括编辑许可信息,所述编辑许可信息指示对编辑包括所述元数据中的所述增益值和所述位置信息的多个参数中的一些或全部的许可,以及所述量化单元基于所述编辑许可信息不允许编辑的参数、所述音频信号和所述听觉心理模型,计算所述听觉心理参数。

23.一种信号处理方法,包括:

24.一种程序,使计算机执行包括以下步骤的处理:

25.一种信号处理装置,包括:

26.根据权利要求25所述的信号处理装置,其中,所述量化单元基于所述音频信号和所述标签信息计算听觉心理参数,并且基于所述听觉心理参数量化所述音频信号。

27.根据权利要求25所述的信号处理装置,其中,所述量化单元基于所述标签信息来执行所述音频信号的比特分配和量化。

28.根据权利要求25所述的信号处理装置,进一步包括:

29.根据权利要求25所述的信号处理装置,其中,所述标签信息进一步包括指示基于所述音频信号的声音收听环境的收听环境信息,并且所述量化单元使用针对由所述标签信息指示的所述声源的类型和收听环境确定的调整参数和算法中的至少一项,量化所述音频信号。

30.根据权利要求25所述的信号处理装置,其中,所述量化单元基于所述音频对象的优先级,对所述标签信息指示的所述声源的类型确定的所述调整参数进行调整。

31.根据权利要求25所述的信号处理装置,其中,所述量化单元基于用户的位置信息、所述音频对象的位置信息、所述音频信号和所述标签信息,量化所述音频信号。

32.一种信号处理方法,包括:

33.一种程序,使计算机执行包括以下步骤的处理:


技术总结
本技术涉及能够提高编码效率的信号处理装置、方法及程序。信号处理装置包括:校正单元,被配置为基于包括在音频对象的元数据中的增益值校正音频对象的音频信号;以及量化单元,被配置为基于校正的信号计算听觉心理参数并量化音频信号。本技术可应用于编码装置。

技术研发人员:河野明文,知念徹,本间弘幸,辻实,及川芳明
受保护的技术使用者:索尼集团公司
技术研发日:
技术公布日:2024/1/13
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1