本发明涉及对高保真立体声信号、特别是高阶高保真立体声(hoa)信号执行动态范围压缩(drc)的方法和设备。
背景技术:
1、动态范围压缩(drc)的目的是减小音频信号的动态范围。时变增益因子被应用到音频信号。通常,这个增益因子依赖于用于控制该增益的信号的振幅包络。映射通常是非线性的。大的振幅被映射到较小的振幅,同时微弱的声音经常被放大。场景是噪声环境、深夜收听、小扬声器或移动耳机收听。
2、流传输或广播音频的一般理念是在发送之前生成drc增益,并在接收和解码之后应用这些增益。使用drc的原理(即,drc通常怎样应用到音频信号)在图1a)中示出。信号水平(通常是信号包络)被检测到,且相关的时变增益gdrc被计算。该增益用于改变音频信号的振幅。图1b)示出了使用drc来编码/解码的原理,其中增益因子与编码的音频信号一起被发送。在解码侧,增益被应用到解码的音频信号,用以减小它的动态范围。
3、对于3d音频,不同的增益可以被应用到代表不同空间位置的扩音器通道。然后,这些位置需要在发出侧被知晓,以能够生成匹配的增益集合。这通常只对理想的条件是可能的,而在实际情况下扬声器的数目和它们的放置以许多方式变化。与受规定的影响相比,这更多地受到实际考虑的影响。高阶高保真立体声(hoa)是允许灵活渲染的音频格式。hoa信号包含不直接代表声音水平的系数通道。因此,drc不能被简单地应用到基于hoa的信号。
技术实现思路
1、本发明至少解决drc可以怎样应用到hoa信号的问题。hoa信号被分析以获得一个或多个增益系数。在一个实施例中,至少两个增益系数被获得,且hoa信号的分析包括到空间域的变换(idsht)。一个或多个增益系数与原始的hoa信号一起被发送。特殊的指示标志(indication)可以被发送以指示出是否所有的增益系数均相等。这是在所谓的简化模式中的情况,但是在非简化模式中,至少两个不同的增益系数被使用。在解码器处,该一个或多个增益可以(但不一定)被应用到hoa信号。用户可选择是否应用该一个或多个增益。简化模式的优点是它需要少得多的计算,因为只有一个增益因子被使用,且因为增益因子可以在hoa域被直接应用到hoa信号的系数通道,所以,变换到空间域以及随后变换回到hoa域可以被略过。在简化模式中,通过仅对hoa信号的第零阶系数通道的分析获得增益因子。
2、根据本发明的一个实施例,对hoa信号执行drc的方法包括将该hoa信号变换到空间域(通过逆dsht),分析该变换的hoa信号,并从所述分析的结果获得可用于动态范围压缩的增益因子。在另外的步骤中,获得的增益因子与变换的hoa信号相乘(在空间域),其中,增益压缩的变换的hoa信号被获得。最后,增益压缩的变换的hoa信号被变换回到hoa域(通过dsht),即系数域,其中,增益压缩的hoa信号被获得。另外,根据本发明的一个实施例,在简化模式中对hoa信号执行drc的方法包括分析hoa信号和从所述分析的结果获得可以用于动态范围压缩的增益因子。在另外的步骤中,根据指示标志的评估,获得的增益因子与hoa信号的系数通道相乘(在hoa域),其中,增益压缩的hoa信号被获得。同样根据指示标志的评估,可以确定,hoa信号的变换可以被略过。指示简化模式(即,只有一个增益因子被使用)的指示标志可以被隐含地设置,例如,如果由于硬件或其他限制只有简化模式可以被使用,或指示简化模式的指示标志可以被显式地设置,例如根据用户选择简化或者非简化模式。
3、另外,根据本发明的一个实施例,将drc增益因子应用到hoa信号的方法包括接收hoa信号、指示标志和增益因子,确定该指示标志指示非简化模式,将hoa信号变换到空间域(使用逆dsht),其中,变换的hoa信号被获得,将增益因子乘以变换的hoa信号,其中,动态范围压缩的、变换的hoa信号被获得,以及将动态范围压缩的、变换的hoa信号变换回hoa域(即系数域)(使用dsht),其中,动态范围压缩的hoa信号被获得。增益因子可以与hoa信号一起被接收,或分开接收。
4、另外,根据本发明的一个实施例,将drc增益因子应用到hoa信号的方法包括接收hoa信号、指示标志和增益因子,确定该指示标志指示简化模式,及根据所述的确定,将增益因子乘以hoa信号,其中,动态范围压缩的hoa信号被获得。该增益因子可以与hoa信号一起被接收,或分开接收。
5、在一些实施例中,公开了一种用于将drc增益因子应用到hoa信号的设备。
6、在一个实施例中,本发明提供了具有可执行指令的计算机可读介质,该可执行指令使计算机执行将drc增益因子应用到hoa信号的方法,该方法包括上述步骤。
7、在一个实施例中,本发明提供了具有可执行指令的计算机可读介质,该可执行指令使计算机执行对hoa信号执行drc的方法,该方法包括上述步骤。
8、本发明的有利的实施例在从属权利要求、下面的描述和图中公开。
1.一种用于动态范围压缩drc的方法,该方法包括
2.根据权利要求1所述的方法,其中,hoa音频表示被划分为频率子带,并且该增益值分别应用于每个子带。
3.根据权利要求1所述的方法,其中,至少如果(n+1)2<τ,其中n是hoa阶次,并且τ为drc块大小,那么该方法还包括:
4.一种用于动态范围压缩drc的设备,所述设备包括:
5.根据权利要求4所述的设备,其中,hoa音频表示被划分为频率子带,并且该增益值分别应用于每个子带。
6.根据权利要求4所述的设备,其中,至少如果(n+1)2<τ,其中n是hoa阶次,并且τ为drc块大小,那么该音频解码器进一步配置为:
7.一种设备,包括:
8.一种计算机可读存储介质,存储指令,所述指令在被一个或多个处理器执行时使得执行根据权利要求1-3中任一项所述的方法。
9.一种用于将动态范围压缩增益因子应用于高阶高保真立体声hoa信号的方法,所述方法包括:
10.一种用于将动态范围压缩增益因子应用于高阶高保真立体声hoa信号的设备,所述设备包括一个或多个处理器,被配置用于: