利用元数据进行音频扩展的制作方法

文档序号：44197432发布日期：2025-12-26 23:42阅读：14来源：国知局

技术简介：
本专利针对传统音频扩展技术在存储和处理资源上的高成本问题，提出通过修改压缩音频比特流中的元数据参数（如电平差、互相关等）来实现音频感知优化。该方法在解码前直接调整元数据，无需复杂信号处理步骤，显著降低计算负担，适用于资源受限的音响系统，提升沉浸式音频体验的效率。
关键词：元数据音频参数,沉浸式音频扩展

本申请涉及一种在音频解码器处执行的方法，并且涉及音频解码器。此外，还提供了包括程序代码的计算机程序和包含所述计算机程序的载体。

背景技术：

1、在音频信号的混合期间，创造沉浸式聆听体验是一个重要方面。沉浸式聆听体验的目标是为听众创造一种完全沉浸式和逼真的音频体验，让听众感觉到声音来自不同的方向。获得沉浸式聆听体验的一种可能性包括扩展过程，其旨在增强立体声图像或感知到的声音的空间分布，使其对听众来说显得更宽或更具包围感。为了获得音频信号扩展，已知有不同的方法，诸如中/侧处理，其涉及将立体声信号分成两个分量：中，即左右声道(单声道)的总和，以及侧，即左右声道之间的差。通过操纵这些分量(通常通过增加侧分量相对于中分量的水平)，可以在立体声场中创造更大的宽度感。此外，还设计了专门的软件工具或硬件工具来操纵立体声通道之间的相位和电平差。可以进行调整以增强或减弱音频信号的宽度。一些工具还允许特定频率的扩展。此外，还可以为左右声道添加不同类型或量的混响，从而创造出空间多样性和宽度的感觉。

2、然而，所有这些方法在存储器和处理能力方面都很昂贵，因为需要不同的处理步骤，诸如将音频信号转换为频域，应用各种信号处理方法，然后将其转换回时域。

3、因此，需要克服上述缺点并提供一种提供改善的音频体验的处理选项，尤其是对于存储器和功率有限的音响系统。

技术实现思路

1、这种需要是由独立权利要求的特征来满足。此外，在从属权利要求中描述各方面。

2、根据第一方面，提供了一种在音频解码器处执行的方法，其中音频解码器接收包括元数据的压缩音频数据的比特流。在元数据中，确定至少一个音频参数，所述至少一个音频参数影响基于比特流生成并由多个扬声器播放的音频信号的感知。修正所述至少一个音频参数以便生成修正的比特流，其中基于修正的比特流生成的修正的音频信号导致与基于未修正的比特流由扬声器播放音频信号时的感知相比修正的感知。此外，修正的比特流被解码以供多个扬声器播放。

3、此外，对应的音频解码器被配置为按照上面讨论的方式或者下面详细讨论的方式进行操作。

4、所提出的方法和所提出的解码器提供了一种有效的方法来获得修正的感知，诸如感知音频信号的扩展，诸如立体声图像的扩展。与用于修正感知或扩展感知的其他方法相比，修正比特流的元数据中的音频参数是一种实现这种修正的感知的计算效率非常高的方法，因为所述其他方法不是在压缩比特流上执行的，而是在扬声器输出之前的后期阶段执行的，其中需要更复杂的处理步骤，诸如傅里叶变换或其他复杂的信号处理步骤。

5、此外，提供了一种包括程序代码的计算机程序，所述程序代码在由音频解码器的至少一个处理单元执行时致使所述至少一个处理单元执行如上面讨论的或如下文进一步详细讨论的方法。

6、最后，提供一种包括所述计算机程序的载体，其中所述载体是电子信号、光信号、无线电信号和计算机可读存储介质中的一种。

7、应当理解，上文所提及的特征和下文将阐释的特征不仅可以所指示的相应组合使用，而且可以其他组合使用或单独地使用，而此并不脱离本发明的范围。除非另有明确提及，否则上文提及的各方面和下面描述的实施方案的特征可以在其他实施方案中彼此组合。

技术特征：

1.一种在音频解码器处执行的方法，所述方法包括：

2.根据权利要求1所述的方法，其中与基于所述未修正的比特流由所述多个扬声器播放所述音频信号时的宽度感知相比，所述修正的比特流在由所述多个扬声器播放时导致增加的宽度感知。

3.根据权利要求2所述的方法，其中所述音频信号是多通道音频信号，并且所述至少一个音频参数包括所述多通道音频信号的2个通道之间的与一个或多个频带相对应的电平间差，其中修正所述音频参数包括增加所述一个或多个频带下的所述电平间差以便获得所述增加的宽度感知。

4.根据权利要求2所述的方法，其中所述音频信号是多通道音频信号，并且所述至少一个音频参数包括所述多通道音频信号的2个通道之间的互相关参数，其中修正所述音频参数包括增加所述互相关参数以便获得所述增加的宽度感知。

5.根据权利要求2所述的方法，其中所述音频信号是多通道音频信号，并且所述至少一个音频参数包括所述多通道音频信号的2个通道之间的相位差，其中修正所述音频参数包括增加所述相位差以便获得所述增加的宽度感知。

6.根据权利要求1所述的方法，其中基于由最小和最大参数值定义的参数范围内的基于百分比的修正来修正所述至少一个音频参数。

7.根据权利要求1所述的方法，其中修正所述至少一个音频参数包括将所述至少一个音频参数线性增加直至最大值。

8.根据权利要求1所述的方法，其中压缩音频数据的所述比特流包括k个不同的频率仓，其中针对所述k个频率仓中的每一个修正所述至少一个音频参数，其中k>1。

9.根据权利要求1所述的方法，其中所述音频信号是立体声信号，并且所述比特流包括所述音频信号的立体声特性。

10.根据权利要求1所述的方法，其中在所述比特流经过比特流解析单元之后并且在所述比特流被解码单元转换成电压值以供播放之前修正所述至少一个音频参数。

11.一种音频解码器，其包括：

12.根据权利要求11所述的音频解码器，其中所述音频信号是多通道音频信号，并且所述至少一个音频参数包括所述多通道音频信号的2个通道之间的与一个或多个频带相对应的电平间差，其中所述修改单元被配置为针对修改所述音频参数执行以下中的至少一个：

13.根据权利要求11所述的音频解码器，其中压缩音频数据的所述比特流包括k个不同的频率仓，其中所述修改单元被配置为针对所述k个频率仓中的每一个修正所述至少一个音频参数，其中k>1。

14.一种计算机程序，其包括程序代码，所述程序代码在由音频解码器的至少一个处理单元执行时致使所述至少一个处理单元执行以下步骤：

15.一种载体，其包括根据权利要求14所述的计算机程序，其中所述载体是电子信号、光信号、无线电信号和计算机可读存储介质中的一种。

技术总结
本申请涉及一种在音频解码器处执行的方法，其中音频解码器接收包括元数据的压缩音频数据的比特流。在元数据中，确定至少一个音频参数，所述至少一个音频参数影响基于比特流生成并由多个扬声器播放的音频信号的感知。修正所述至少一个音频参数以便生成修正的比特流，其中基于修正的比特流生成的修正的音频信号导致与基于未修正的比特流由扬声器播放音频信号时的感知相比修正的感知。此外，修正的比特流被解码以供多个扬声器播放。

技术研发人员：C·奥茨,A·特拉瓦里尼
受保护的技术使用者：哈曼贝克自动系统股份有限公司
技术研发日：
技术公布日：2025/12/25

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：C·奥茨,A·特拉瓦里尼
技术所有人：哈曼贝克自动系统股份有限公司
我是此专利的发明人

网友询问留言留言:0条

还没有人留言评论。精彩留言会获得点赞！

文明留言，给您点赞！