本发明涉及一种计算机实现的音频信号处理方法,该方法用于将输入音频立体声信号(s)上混成一组多通道输出信号(o)。
背景技术:
1、在许多应用中,希望生成能够模拟嵌入多个定向声源的现实的三维音景,以增强用户的感知。然而,现有技术中的大多数方法仅依赖于规则的立体声馈送来尝试创建清晰的多维音景。由于音景中散布的伪影的固有存在,这些尝试往往会导致音质受损和用户体验下降。因为立体声的到来,音乐和媒体制作往往在馈送中分配侧信息,以促进歌曲/录音的空间特性的提高。然而,现有技术中的大多数方法依赖于规则的立体声馈送来创建清晰的音景。现有的上混方法通常会损害用户体验的质量。就这个程度而言,用户将体验到由于高度层中包含的过多信息而产生的显著的空间方向差异,这导致用户体验下降。
2、现有技术中提出的大多数方法依赖于在频域中不提供线性相位响应的处理滤波器,导致音景中的定向声音伪影,最终降低用户体验并损害馈送的多维性。就这个程度而言,非线性相位响应会导致最终用户听到过度处理的音景。另外,现有技术中提出的大多数方法依赖于在跨人类可听频率支持之外的宽频率范围内操作的处理滤波器。这导致部分频谱就给定方向的振幅而言变得不相等,从而由于声音被感知为在空间中不均匀分布而导致用户体验下降。
3、现有技术中提出的大多数方法依赖于左立体声通道与右立体声通道之间的关系来提供中心通道的表示,然而这导致用户对左侧和右侧的不同感知。更特别地,利用这种方法,重要的声音项目可能无法准确地定位在音景内,也无法保留音调特色,从而导致给用户带来过度处理的感觉。最终,诸如人声之类的重要声音对象会导致较差的用户体验。
4、现有的上混音方法通常使用混响来创建空间感。这是通过向原始信号添加人工信息来实现的,这又会导致原始声音失去其清晰度并不自然地改变声音空间存在,从而阻碍用户体验。另外,混响只能在有限的空间中使用,并且不适合大型现场设置。
5、因此,需要一种用于将输入音频立体声信号呈现为多个在空间上分布的伪环绕通道以增强用户体验的方法。
技术实现思路
1、发明人惊奇地发现,这些问题中的一个或更多个可以通过本发明及本发明的实施方式来解决。本方法允许详细的预设,该预设包括符合所需的高环绕声标准的新见解和新特征。本发明尊重声音设计的创作过程。本发明不需要混响来创建空间感,从而保持了音乐的原始特色。不需要向音乐添加任何效果,音乐只是在空间上(且等同地)分布。
2、本发明提供了一种计算机实现的音频信号处理方法,该方法用于将输入音频立体声信号(s)上混在多个在空间上分布的伪环绕通道中以限定高度层。所述方法优选地包括以下步骤:
3、-接收至少一个输入音频立体声信号(s);
4、-对输入音频立体声信号(s)执行预处理阶段,该预处理阶段包括以下步骤:
5、·执行中侧解码,以产生至少一个和(sum)信号和至少一个差(diff)信号;
6、·对至少一个差(diff)信号执行极性反转;
7、·借助于至少2个滤波器组(pf)对至少一个差(diff)信号执行滤波,优选地借助于至少4个滤波器组(pf)对至少一个差(diff)信号执行滤波;
8、-根据滤波器组(pf)重建至少2个信号从而获得经上混的输出信号(o),优选地,根据滤波器组(pf)重建至少4个信号从而获得经上混的输出信号(o);
9、-对至少一个经上混的输出信号(o)执行高通滤波;优选地对所有经上混的输出信号(o)执行高通滤波;
10、-对至少一个经上混的输出信号(o)执行电平调整;优选地对所有经上混的输出信号(o)进行电平调整;以及,
11、-将经上混的重建的音频信号(o)路由至音频扬声器通道(c)
12、以馈送顶部通道,从而限定形成高度层的在空间上分布的通道的矩阵,该顶部通道例如为至少顶部左前置通道(tfl)、顶部右前置通道(tfr)、顶部左后置通道(trl)和顶部右后置通道(trr)。
13、在一些实施方式中,滤波器组(pf)被配置成在频域中具有线性相位响应。
14、在一些实施方式中,滤波器组(pf)被配置成围绕滤波器子带(psb)进行操作,这些子带(psb)中的每个子带具有中心频率fsb-c,并且这些子带(psb)中的每个子带被配置成围绕高于下截止频率fsb-l的低频声波范围和低于上截止频率fsb-u的高频声波的范围进行操作。
15、在一些实施方式中,滤波器子带(psb)中的每个子带被配置成具有在子带中心频率fsb-c附近的振幅,所述子带中心频率在跨-3db至-15db的范围中选择,优选地在跨-6db至-12db的范围中选择,并且更优选地为-9db。
16、在一些实施方式中,滤波器组(pf)被配置成具有在1/9倍频程与1倍频程之间的宽度。
17、在一些实施方式中,滤波器子带(psb)的操作频率范围被配置成在跨fl和fu的频率范围内进行操作,其中,fl和fu为从350hz至20khz,优选地为400hz至10khz,更优选地为500hz至9khz。
18、在一些实施方式中,在滤波器组(pf)的频率支持之外执行振幅补偿,其中,与fl和fu处的振幅电平相关地执行该振幅补偿,并且其中,该振幅补偿使所得到的振幅电平在fl和fu附近,该fl和fu在跨-3db至-12db的范围内选择,优选地在跨-6db至-9db的范围内选择,并且更优选地为-6db。
19、在一些实施方式中,使用高通滤波器(hpf)对高度通道中的每个高度通道执行高通滤波(hpf),其中,这样的高通滤波器(hpf)被配置成以中心频率fhfc=500hz进行操作。
20、在一些实施方式中,高通滤波器是高架滤波器并且该高通滤波器在频域中具有线性相位响应。
21、在一些实施方式中,对经上混的输出音频信号中的每个经上混的输出音频信号执行电平调整。
22、在一些实施方式中,处理时间为毫秒量级,优选地该处理时间短于5ms,更优选地该处理时间短于3ms,并且更优选地该处理时间短于1ms。
23、在一些实施方式中,在中侧解码步骤处执行同步,并且对未经过中侧解码步骤的输入通道执行延迟补偿。
24、在一些实施方式中,该方法还包括以下步骤:
25、-对至少一个(sum)信号执行延迟调整(d–adj);
26、-将经上混的重建的音频信号(o)路由至音频扬声器通道(c)
27、以馈送至少中心通道(ce)和低频效果(lfe)通道,从而限定形成中心层的在空间上分布的通道的矩阵;以及,
28、-对lfe通道执行低通滤波(lpf)。
29、在一些实施方式中,所述方法还被配置成对获得的经上混的输出信号(o)执行补偿滤波。
30、在一些实施方式中,补偿滤波器是低架滤波器和/或高架滤波器并且在频域中具有线性相位响应。
1.一种计算机实现的音频信号处理方法,所述方法用于将输入音频立体声信号(s)上混在多个在空间上分布的伪环绕通道中以限定高度层,所述方法包括以下步骤:
2.根据权利要求1所述的方法,其中,所述滤波器组(pf)被配置成在频域中具有线性相位响应。
3.根据权利要求1或2中的任一项所述的方法,其中,所述滤波器组(pf)被配置成围绕滤波器子带(psb)进行操作,这些子带(psb)中的每个子带具有中心频率fsb-c,并且这些子带(psb)中的每个子带被配置成围绕高于下截止频率fsb-l的低频声波范围和低于上截止频率fsb-u的高频声波范围进行操作。
4.根据权利要求3所述的方法,其中,所述滤波器子带(psb)中的每个子带被配置成具有在子带中心频率fsb-c附近的振幅,所述子带中心频率在跨-3db至-15db的范围中选择,优选地在跨-6db至-12db的范围中选择,并且更优选地为-9db。
5.根据权利要求1至4中的任一项所述的方法,其中,所述滤波器组(pf)中的每个滤波器组被配置成具有在1/9倍频程与1倍频程之间的宽度。
6.根据权利要求1至5中的任一项所述的方法,其中,所述滤波器子带(psb)的操作频率范围被配置成在跨fl和fu的频率范围内进行操作,其中,fl至fu为从350hz至20khz,优选地从400hz至10khz,更优选地从500hz至9khz。
7.根据权利要求1至6中的任一项所述的方法,其中,在所述滤波器组(pf)的频率支持之外执行振幅补偿,并且其中,与fl和fu处的振幅电平相关地执行所述振幅补偿,并且其中,所述振幅补偿使所得到的振幅电平在fl和fu附近,所述fl和fu在跨-3db至-12db的范围内选择,优选地在跨6db至-9db的范围内选择,并且更优选地为-6db。
8.根据权利要求1至7中的任一项所述的方法,其中,使用高通滤波器(hpf)对所述高度通道中的每个高度通道执行高通滤波(hpf),并且其中,这样的高通滤波器(hpf)被配置成以中心频率fhfc=500hz进行操作。
9.根据权利要求8所述的方法,其中,所述高通滤波器是高架滤波器并且所述高通滤波器在频域中具有线性相位响应。
10.根据权利要求1至9中的任一项所述的方法,其中,对经上混的输出音频信号中的每个经上混的输出音频信号执行电平调整。
11.根据权利要求1至10中的任一项所述的方法,其中,所述处理时间为毫秒量级,优选地所述处理时间短于5ms,更优选地所述处理时间短于3ms,并且更优选地所述处理时间短于1ms。
12.根据权利要求1至11中的任一项所述的方法,其中,在所述中侧解码步骤处执行时间同步,并且对未经过中侧解码步骤的输入通道执行延迟补偿。
13.根据权利要求1至12中的任一项所述的方法,其中,所述方法还包括以下步骤:
14.根据权利要求1至13中的任一项所述的方法,其中,所述方法还被配置成对获得的经上混的输出信号(o)执行补偿滤波。
15.根据权利要求14所述的方法,其中,补偿滤波器是低架滤波器和/或高架滤波器,并且所述补偿滤波器在频域中具有线性相位响应。