本公开涉及用于头盔中的声音再现和有源噪声控制的系统和方法(一般称作“系统”)。
背景技术:
遗憾的是,摩托车手的听力尤其会受到发动机噪声、风噪声和头盔设计的阻碍。诸如摩托车手体验到的这些高噪声级可使得在头盔中收听音乐或谈话不舒服或甚至不可能。此外,相应地要求高强度的语音和音乐信号来满足收听体验的高强度噪声可对摩托车手的听力能力具有长期后果。影响摩托车手的噪声可具有许多源头,诸如发动机噪声、道路噪声、其它车辆噪声和风噪声。随着摩托车的速度增加,通常来说最突出的噪声源是风噪声。该效果随着速度增加而急剧增加。在公路行驶速度下,穿戴传统头盔时的噪声级可容易地超100db。这对于诸如警察等日常摩托车手以及职业摩托车手特别麻烦。为了对抗噪声,一些摩托车头盔环绕耳朵区域使用隔音材料。其他摩托车手可选择使用耳塞来降低噪声以及防止噪声诱发的听力损伤。降低噪声的另一种方法是嵌入式有源噪声消除系统,然而所述系统可对语音或音乐具有破坏效果。
技术实现要素:
示例性声音再现降噪系统包括:头盔;安置在头盔中相对位置处的两个扬声器;以及安置在所述两个扬声器附近的位置处的两个麦克风。系统还包括耦接至两个扬声器的两个有源噪声控制模块。有源噪声控制模块被配置来向对应扬声器供应有用信号,其表示将被再现的声音,和抗噪信号,其在由对应扬声器再现时,降低在对应麦克风附近的噪声。系统还包括连接至有源噪声控制模块的上游的音频信号增强模块,所述音频信号增强模块被配置来接收音频输入信号以及对音频输入信号进行处理以提供有用信号,以使得所述有用信号为穿戴头盔的收听者提供比音频输入信号更加逼真的声音印象。
示例性声音再现降噪方法包括向对应扬声器供应有用信号,其表示将被再现的声音,和抗噪信号,其在由对应扬声器再现时,降低在对应麦克风附近的噪声。所述方法还包括接收音频输入信号以及对音频输入信号进行处理以提供有用信号,以使得所述有用信号为穿戴头盔的收听者提供比音频输入信号更加逼真的声音印象。
本领域技术人员将在查阅以下附图和详细描述之后了解或更加明白其它系统、方法、特征和优点。
附图说明
参考以下附图和描述可更好地理解所述系统。附图中的组件不一定按比例绘制,而是着重说明本发明的原理。此外,在附图中,相同参考数字指定全部不同视图中的对应部分。
图1是具有有源噪声控制系统的摩托车头盔的透视图;
图2是说明图1中示出的头盔中的信号流的信号流程图;
图3是一般反馈型有源降噪系统的信号流程图,在所述系统中有用信号被供应至扬声器信号路径;
图4是一般反馈型有源降噪系统的信号流程图,在所述系统中有用信号被供应至麦克风信号路径;
图5是一般反馈型有源降噪系统的信号流程图,在所述系统中有用信号被供应至扬声器和麦克风信号路径;
图6是图5的有源降噪系统的信号流程图,在所述系统中有用信号经由频谱整形滤波器供应至扬声器路径。
图7是图5的有源降噪系统的信号流程图,在所述系统中有用信号经由频谱整形滤波器供应至麦克风路径;
图8是图7的有源降噪系统的信号流程图,在所述系统中有用信号经由两个频谱整形滤波器供应至麦克风路径;
图9是图示具有直达路径和交叉路径的立体声展宽的一般结构的信号流程图;
图10示出图示直达路径中的滤波器的适当响应特征的实例的幅值频率图,以及图示交叉路径中的过滤器的适当响应特征的实例的幅值频率图;
图11是包括结合感知音频编码器和解码器一起使用的示例性信号增强器的信号流程图;
图12是包括集成到信号增强器中的感知音频解码器的实例的信号流程图;
图13是信号增强器系统的实例的信号流程图;并且
图14是多通道声音分级模块的实例的信号流程图。
具体实施方式
示例性头盔可包括若干层,所述若干层包括外壳、减震层和舒适层。头盔的外壳是最外层,并且通常由诸如塑料和纤维复合材料等弹性、防水材料制成。头盔的减震层是其主要安全层,可由诸如可膨胀聚苯乙烯泡沫等刚性但减震的材料制成。另外,该层可具有隔音和隔热品质,并且可替代地可被称作声学层。最后,头盔的舒适层可由将会与摩托车手的皮肤接触的软材料制成,所述软材料诸如本领域中已知的棉或其它混纺织物。也可存在其它层,并且上面提及的层中的一些可能被省略或组合。
图1是摩托车头盔100的透视图。头盔100包括外部外壳101、声学层102、泡沫层103、舒适层104和任选地无源降噪系统(未图示)。头盔100还包括安装在头盔100的每一内侧上的耳杯105和106,当使用者穿戴头盔100时使用者的耳朵将位于所述耳杯105和106处。在图1中应注意的是,仅一个耳杯105是可见的。然而,以虚线示出的相同耳杯106也存在于头盔100的相对侧上。
如图1中所示,耳杯105(且因此耳杯106)通过隔振悬置107与头盔100的外壳101隔离。隔振悬置107可由减振材料制成。减振材料可防止外壳振动抵达使用者的耳朵,并且因此可降低使用者将这些振动感知为噪声的可能性。因此,通过将耳杯105安装至头盔的外壳101以外的部分,并且将耳杯105从容易传递振动的刚性材料分离,可减低传递至耳杯105的噪声。
每一耳杯105、106包围例如嵌入耳杯105、106中的扬声器108、109或者任何其它类型的声音驱动程序或电声变换器或一组扬声器。另外,头盔100可包括诸如麦克风110和111等声传感器,所述声传感器感测噪声并且连同每一耳杯105、106中的扬声器108和109一起积极地降低或消除的噪声。麦克风110和111安置在扬声器108和109的附近(例如,在耳杯105和106中),这意味着在本实例中其与相应扬声器108、109安置在头盔100的同一侧上,因为扬声器108和109安置在头盔100内侧的相对位置处。麦克风110和111可与诸如扬声器108和109等辅助源安置在头盔100内侧的同一曲面处。
扬声器108和109以及麦克风110和111连接至音频信号处理模块112。音频信号处理模块112可部分或完全安装在头盔100的外壳101内,并且可通过减振材料与外壳101隔离。可替代地,音频信号处理模块112部分或完全安置在头盔100的外侧,并且扬声器108、109和麦克风110、111经由有线或无线连接链接至音频信号处理模块112。另外,音频信号处理模块112不论安置在何处均可经由有线或无线连接链接至音频信号总线系统和/或数据总线系统(二者均未在图1中示出)。
图2示出图1中示出的头盔100中使用的音频信号处理模块112。麦克风110和111向音频信号处理模块112提供电气信号,所述电气信号表示由麦克风110和111在其相应位置处采撷的声音。音频信号处理模块112对来自麦克风110、111的信号进行处理,并且从所述麦克风110、111产生供应至扬声器108和109的信号。音频信号处理模块112从音频信号源203接收(例如,立体声或其它多通道)音频信号201和202(也称作有用信号)。示例性音频信号处理模块112可包括双通道音频增强(子)模块204,所述模块204接收音频信号201和202,并且输出两个增强的立体声信号205和206。增强的立体声信号205和206各自供应至自动噪声控制(anc)(子)模块207、208。anc(子)模块207和208提供驱动扬声器108和109的输出信号209和210,并且从麦克风110和111进一步接收麦克风输出信号211和212。
现在参考图3,其是图示一般反馈型anc模块300的信号流程图,可以采用所述模块300作为图2中示出的音频信号处理模块112中的(子)模块207和208。在anc模块300中,也称作噪声信号的干扰信号d[n]经由主路径301传递(传播)至收听位点,例如收听者的耳朵。主路径301具有传递特征p(z)。另外,输入信号v[n]经由次级路径302从扬声器108或109传递(传播)至收听位点。次级路径302具有传递特征s(z)。定位于或定位靠近收听位点处的麦克风110或111与主路径一起接收过滤的干扰信号、产生于扬声器108或109的信号、并且因此来自由次级路径过滤的扬声器驱动信号v[n]。麦克风110或111提供表示这些接收的信号的和的麦克风输出信号y[n](诸如图2中示出的音频信号处理模块112中的麦克风输出信号211和212)。麦克风输出信号y[n]作为滤波器输入信号u[n]供应至anc滤波器303,所述anc滤波器303向加法器304输出错误信号e[n]。可是自适应或非自适应滤波器的anc滤波器303具有传递特征w(z)。加法器304还例如使用频谱整形滤波器(附图中未示出)接收诸如音乐或语音等任选地预过滤的有用信号x[n]并且将输入信号v[n]提供至扬声器108或109。
信号x[n]、y[n]、e[n]、u[n]和v[n]例如在离散时间域中。出于下述考虑,使用其谱表示x(z)、y(z)、e(z)、u(z)和v(z)。从有用信号的角度描述图3中图示的系统的微分方程式如下所示:
y(z)=s(z)·v(z)=s(z)·(e(z)+x(z))(1)
e(z)=w(z)·u(z)=w(z)·y(z)(2)
在图3的系统中,有用信号传递特征m(z)=y(z)/x(z)因此为
m(z)=s(z)/(1-w(z)·s(z))(3)
假定w(z)=1,则
假定w(z)=∞,则
如可从方程式(4)至(7)看出,有用信号传递特征m(z)当anc滤波器303的传递特征w(z)增加时接近0,而次级路径传递函数s(z)保持中性,即处于1左右的等级,即0[db]。为此,必须相应地对有用信号x[n]进行适应,以确保当anc打开或关闭时收听者同样地理解有用信号x[n]。另外,有用信号传递特征m(z)还取决于次级路径302的传递特征s(z),以便有用信号x[n]的适应也取决于传递特征s(z)及其由于时效、温度、收听者的变更等产生的波动,以使得“打开”与“关闭”之间的特定差异将明显。
虽然在图3中示出的anc模块300中,有用信号x[n]被供应至连接在扬声器108或109上游的加法器304处的声学子系统(扬声器、房间、麦克风),但是在图4中示出的anc模块400中,有用信号x[n]被供应至麦克风110或111处的声学子系统。因此,在图4中示出的anc模块400中,加法器304被省略(例如,可由直接连接进行代替),并且加法器401连接在麦克风110或111的下游,以对例如预过滤的有用信号x[n]和麦克风输出信号y[n]进行求和。因此,扬声器输入信号v[n]是错误信号[e],即v[n]=[e],并且滤波器输入信号u[n]是有用信号x[n]和麦克风输出信号y[n]的和,即u[n]=x[n]+y[n]。
从有用信号的角度描述图4中图示的系统的微分方程式如下所示:
y(z)=s(z)·v(z)=s(z)·e(z)(8)
e(z)=w(z)·u(z)=w(z)·(x(z)+y(z))(9)
在不考虑干扰信号d[n]的情况下,图4的系统中的有用信号传递特征m(z)因此是
m(z)=(w(z)·s(z))/(1-w(z)·s(z))(10)
如可从方程式(11)至(13)看出,有用信号传递特征m(z)当开路传递特征(w(z)·s(z))增加或降低时接近1,并且当开路传递特征(w(z)·s(z))接近0时接近0。为此,必须另外在较高频谱范围中对有用信号x[n]进行适应,以确保当anc打开或关闭时收听者同样地理解有用信号x[n]。然而,在较高频谱范围中的补偿相当困难,以使得“打开”与“关闭”之间的特定差异将明显。另一方面,有用信号传递特征m(z)并不取决于次级路径302的传递特征s(z)及其由于时效、温度、收听者的变更等产生的波动。
图5是图示一般反馈型有源降噪系统的信号流程图,在所述系统中有用信号被供应至扬声器和麦克风信号路径二者。为简单起见,下面将主路径301省略,尽管噪声(干扰信号d[n])仍然存在。确切地说,图5的系统基于图3的系统,但是具有额外的减法器501,所述减法器501从麦克风输出信号y[n]减去有用信号x[n]以形成anc滤波器输入信号u[n];并且具有加法器502,所述加法器502代替图3中示出的加法器304并且将有用信号x[n]和错误信号e[n]相加。
从有用信号的角度描述图5中图示的系统的微分方程式如下所示:
y(z)=s(z)·v(z)=s(z)·(e(z)+x(z))(14)
e(z)=w(z)·u(z)=w(z)·(y(z)-x(z))(15)
图5的系统中的有用信号传递特征m(z)因此是
m(z)=(s(z)-w(z)·s(z))/(1-w(z)·s(z))(16)
可从方程式(17)至(19)看出的是,图5的系统的特征与图4的系统的特性类似。唯一的差异在于,有用信号传递特征m(z)当开路传递特征(w(z)·s(z))接近0时接近s(z)。与图3的系统一样,图5的系统取决于次级路径302的传递特征s(z)及其由于时效、温度、收听者的变更等产生的波动。
在图6中,示出基于图5的系统的系统,并且所述系统另外包括连接至减法器602的上游以便使用逆次级路径传递函数1/s(z)或传递函数1/s(z)的近似法过滤有用信号x[n]的均衡滤波器601。从有用信号的角度描述图6中图示的系统的微分方程式如下所示:
y(z)=s(z)·v(z)=s(z)·(e(z)-x(z)/s(z))(20)
e(z)=w(z)·u(z)=w(z)·(y(z)-x(z))(21)
图6的系统中的有用信号传递特征m(z)因此是
m(z)=(1-w(z)·s(z))/(1-w(z)·s(z))=1(22)
如可从方程式(22)看出,麦克风输出信号y[n]与有用信号x[n]相同,这意味着如果均衡器滤波器正好是次级路径传递特征s(z)的逆,则信号x[n]不会被系统改变。均衡器滤波器601可是用于最优结果的最小相位滤波器,所述最优结果即其理想的最小相位、次级路径传递特征s(z)的逆的实际传递特征,并且因此y[n]=x[n]。该配置充当理想线性化电路,即所述配置对由于有用信号从扬声器108或109传递至表示收听者的耳朵的麦克风110或111而产生的任何退化进行补偿。因此,其对次级路径s(z)对有用信号x[n]的干扰影响进行补偿或线性化以使得有用信号抵达如由源头所提供的收听者,而不会由于声音再现降噪头盔的声学性质而产生任何不利影响,即y[z]=x[z]。为此,在此种线性化滤波器的帮助下,能够使得粗劣设计的声音再现降噪头盔听起来像经过完美声学调整的头盔,即线性头盔。
在图7中,示出基于图5的系统的系统,并且所述系统另外包括连接至减法器501的上游以便使用次级路径传递函数s(z)过滤有用信号x[n]的次级路径建模滤波器701。
从有用信号的角度描述图7中图示的系统的微分方程式如下所示:
y(z)=s(z)·v(z)=s(z)·(e(z)+x(z))(23)
e(z)=w(z)·u(z)=w(z)·(y(z)-s(z)·x(z))(24)
图7的系统中的有用信号传递特征m(z)因此是
m(z)=s(z)·(1+w(z)·s(z))/(1+w(z)·s(z))=s(z)(25)
从方程式(25)可以看出,当anc系统有源时,有用信号传递特征m(z)与次级路径传递特征s(z)相同。当anc系统无源时,有用信号传递特征m(z)也与次级路径传递特征s(z)相同。因此,无论降噪是否有源,对于位于靠近麦克风110或111的位置处的收听者来说,有用信号的听觉印象是相同的。
anc滤波器303以及滤波器601和701可是具有恒定传递特征的固定滤波器或者具有可控传递特征的自适应滤波器。在附图中,滤波器本身的自适应结构由相应块下方的箭头指示,并且自适应结构的任选性由虚线指示。
图7中示出的系统例如在声音再现降噪头盔中适用,在所述头盔中诸如音乐或语音等有用信号在不同噪声条件下再现,并且收听者可能够关掉anc系统,尤其当不存在噪声时,而不会察觉到anc系统的有源状态与无源状态之间的任何可听到的差异。然而,本文所呈现的系统并不是仅在声音再现降噪头盔中适用,而是在需要临时降噪的所有其它领域中也适用。
图8示出采用(至少)两个滤波器801和802(子滤波器)而不是采用如图7的系统中的单个滤波器701的示例性anc模块。举例来说,具有传递特征s1(z)的高音衰减坡型滤波器(例如,滤波器801)以及具有传递特征s2(z)的高音衰减均衡滤波器(例如,滤波器802),其中s(z)=s1(z)·s2(z)。可替代地,高音提升均衡滤波器可实现为例如滤波器801,和/或高音衰减均衡滤波器可实现为例如滤波器802。如果有用信号传递特征m(z)展示出更加复杂的结构,则可采用三个滤波器,例如一个高音衰减坡型滤波器和一个高音提升/衰减滤波器和一个均衡滤波器。所使用的滤波器数量可取决于许多其它方面,诸如成本、滤波器的噪声特性、声音再现降噪头盔的声学性质、系统的延时、可用于实现系统的空间等。
参考图9,图1中示出的音频信号增强器(子)模块204可包括立体声展宽功能。在过去的四十年里录制的音乐几乎全是双通道立体声格式,所述格式由两个独立的音轨组成,一个音轨用于左侧通道l且另一个音轨用于右侧通道r。两个音轨意在用于在两个扬声器上进行播放,并且所述两个音轨被混合,以向穿戴头盔的收听者提供所需的更加逼真的印象。更加逼真的声音印象包括:收听者体验到的声音与由声音源提供的声音相同或近乎相同,这意味着音频源与收听者的耳朵之间的音频路径(几乎)未展示破坏效应。
在许多情况下,有利的是能够修改至两个扬声器的输入,以使得收听者随着声级扩展超过两侧处的扬声器位置而察觉到所述声级。这当收听者希望在彼此定位相当接近的两个扬声器上播放立体声录音时特别有用。立体声展宽处理机制一般通过以下方式运作:从左侧输入引入串音至右侧扬声器以及从右侧输入引入串音至左侧扬声器。沿直达路径从左侧输入传输至左侧扬声器以及从右侧输入传输至右侧扬声器的音频信号在从左侧扬声器和右侧扬声器输出之前通常也会被修改。
例如,和差处理器可被用作立体声展宽处理机制,主要通过对差异信号l-r的一部分进行升压以便使得声级的最左侧和最右侧部分显得更加突出。因此,和差处理器不会提供高空间保真度,因为所述处理器趋向于大大弱化中心图像。然而,所述处理器非常易于实现,因为其不依赖于准确的频率选择性。一些简单的和差处理器可以甚至使用模拟电子器件实现,无需进行数字信号处理。
另一种类型的立体声展宽处理机制是基于逆的实施方式,所述实施方式大体上分为两种伪装:串音消除网络和虚拟源成像系统。好的串音消除系统可以使收听者的一只耳朵听到声音,而另一只耳朵处是静音;而好的虚拟源成像系统可以使得收听者听到来自空间中某处距离所述收听者特定距离的位置的声音。两种类型的系统基本上通过在收听者的耳朵处再现正确的声压来运作,并且为了能够控制收听者的耳朵处的声压,有必要了解人类收听者的存在对于传入的声波的影响。例如,基于逆向的实施方式可设计成基于自由场模型的简单串音消除网络,其中不存在来自障碍物、边界或反射表面对声音传播的显著影响。其它实施方式可使用复杂的数字滤波器设计方法,所述方法也可以补偿收听者的头部、躯干和耳廓(外耳)对于传入的声波的影响。
作为对通常需要基于逆的实施方式的严格滤波器设计技术的替代方案,可采用根据实验和经验知识的一组合适的滤波器。因此,该实施方式基于表格,所述表格的内容是听力测试的结果。虽然上面结合安置在房间中的扬声器描述立体声展宽功能性,但是下文中将所述功能性应用至安装在头盔中的扬声器。
图9以框图形式示出立体声展宽网络900的示例性结构,所述结构包括左侧扬声器和右侧扬声器,例如安装在图1和图2中示出的头盔100中的扬声器108和109。(模拟或数字)音频源203具有分别传输音频信号201和202的分开的左侧音频通道l和右侧音频通道r。例如,音频信号源可提供呈任何格式(例如,mp3)的数字音频流,并且可以由任何媒体(例如,cd)提供。音频信号201(左侧通道l)由具有传递函数hd的滤波器901过滤,在加法器902处被增加至音频信号202(右侧通道r),所述音频信号202由具有传递函数hx的滤波器906过滤并且输出至扬声器108。类似地,音频信号202(右侧通道r)由具有传递函数hd的滤波器904过滤,在加法器905处被增加至音频信号201(左侧通道l),所述音频信号201由具有传递函数hx的滤波器903过滤并且输出至扬声器109。
传递函数hd和hx的选择受到在不降低原始音频源材料的品质的情况下实现良好空间效应的需要刺激。在本实例中,用于滤波器901、904二者的传递函数hd是具有平缓幅值响应的滤波器,因此当引入群延迟时信号输入的幅值不会改变(应注意,群延迟和延迟可以随着频率的改变而改变)。因此,明显的是,传递函数hd容许来自音频信号源203的相应通道在直达路径上传递通过抵达该通道的相应扬声器108、109而幅值不存在任何改变。用于滤波器903、906二者的传递函数hx是一种滤波器,所述滤波器的幅值响应在大约2khz或以上的频率下大致为零,并且所述滤波器的幅值响应在低于大约2khz的任何频率下不大于传递函数hd的幅值响应。除此以外,群延迟由滤波器903和906(各自具有传递函数hx)引入,所述群延迟大体上比由滤波器901和904(各自具有传递函数hd)引入的群延迟更大。
图10分别示出hd和hx的适当幅值响应的实例。传递函数hx的幅值响应被传递函数hd的幅值限定在垂直方向上,并且被大约2khz限定在水平方向上。大约2khz以上的频率的幅值被设计成不受传递函数hx影响,因为改变这些大约2khz以上的频率的幅值会产生不合乎需要的频谱显色。
另外地或可替代地,图1中示出的音频信号增强器(子)模块204可包括恢复数据压缩型音频信号即增强数据压缩型音频信号的功能性。数据压缩型音频信号是包含音频内容的信号,所述信号已经诸如通过感知音频编码解码器经受某种形式的数据压缩。常见类型的感知音频编码解码器包括mp3、aac、dolbydigital和dts。这些感知音频编码解码器通过丢弃很大一部分的音频信号来缩减音频信号的大小。可以将感知音频编码解码器用于降低存储音频信号所需要的空间(存储器)量,或者用于降低传输或传递音频信号所需要的带宽的量。常见的是将音频信号压缩90%或更多。感知音频编码解码器可以采用人耳听觉系统如何感知声音的模型。以此方式,感知音频编码解码器可以丢弃音频信号的被视为听不见或与收听者对声音的感知最不相关的那些部分。因此,感知音频编码解码器能够缩减音频信号的大小,同时仍然维持剩余信号的相对良好的感知的音频品质。一般而言,数据压缩型音频信号的感知的品质可以取决于数据压缩型信号的比特率。较低的比特率可以指示原始音频信号的较大一部分被丢弃,并且因此一般而言数据压缩型音频信号的感知的品质可以较差。
存在多种类型的感知音频编码解码器,并且每一类型可以使用一组不同的标准来确定在压缩过程中原始音频信号的哪些部分将被丢弃。感知音频编码解码器可以包括编码和解码过程。编码器接收原始音频信号,并且可以确定信号的哪些部分将被丢弃。编码器然后可以将剩余信号放置在适合于数据压缩型存储和/或传输的格式中。解码器可以接收数据压缩型音频信号,将其解码,并且然后将解码的音频信号转换成适合于音频播放的格式。在大多数感知音频编码解码器中,可以包括感知模型的使用的编码过程可以确定数据压缩型音频信号的最终品质。在这些情况下,解码器可以充当格式转换器,所述格式转换器将信号从数据压缩型格式(通常是某种形式的频域表示法)转换成适合于音频播放的格式。
音频信号增强器模块可以修改已被被感知音频编码解码器处理的数据压缩型音频信号,以使得对可已经在压缩过程中被丢弃或改变的信号分量和特征进行感知,以在处理的输出信号中进行恢复。如本文所使用,术语音频信号可指代表示音频内容的电气信号或可听声音,除非另有描述。
当音频信号是使用感知音频编码解码器压缩的数据时,无法检索被丢弃的信号分量。然而,音频信号增强器模块可以分析数据压缩型音频信号中的剩余信号分量,并且生成新的信号分量以感知地大体丢弃的分量。
图11是包括音频信号增强器模块1100的实例的信号流程图,所述音频信号增强器模块1100可用作、用于或结合音频信号增强器(子)模块204一起使用。音频信号增强器模块1100包括感知音频信号解码器1101和音频信号增强器1102,并且可以在频域或时域中操作。音频信号增强器1102可包括取样器1103(包括域转换器),所述取样器1103可接收实时输入信号x,并且将输入信号x分成样本。在频域中的操作期间,取样器1103可收集顺序时域样本,采用合适的窗口函数(诸如根-汉宁窗口),并且窗口化样本被使用诸如fft(快速傅里叶变换)转换成频域中的顺序块。类似地,在音频信号增强器1102中,增强的频域块可以由取样器1104(包括域转换器)使用逆fft(快速傅里叶逆变换)转换成时域,并且采用合适的互补窗(诸如,根-汉宁窗口)以产生一批增强的时域样本。例如通过采用重叠相加或重叠保存,短期频谱分析可以提供诸如至少50%等预定量的重叠。可替代地,音频信号增强器1102可以使用时域样本的顺序块在时域中的操作,并且可以将域转换器从取样器1103和1104排除。为了将讨论和附图简化,省略了对取样器1103和1104以及时间-频率和频率-时间转换的进一步讨论和说明。因此,如本文所描述,顺序样本或一连串样本可可互换地指代时域样本的时间序列顺序,或者对应于已经被取样器1103取样的输入信号x的时间序列接收的频域块的时间序列顺序。
在图11中,音频信号增强器1102被图示成结合感知音频信号解码器1101一起使用。数据压缩型音频比特流q由音频信号源203供应至数据压缩型比特流线路1106上的感知音频信号解码器1101。感知音频解码器1101可对数据压缩型音频比特流q进行解码,以在输入信号线路1107上产生输入信号x。输入信号x可是呈适合于音频播放的格式的音频信号。音频信号增强器1102可操作以将输入信号x分成一连串样本,以便增强输入信号x,从而在输出信号线路1105上产生输出信号y。侧链数据可包含与输入信号x的处理相关的信息,所述信息诸如对以下的指示:所使用的音频编码解码器的类型、编码解码器制造商、比特率、立体声与联合立体声编码、取样率、独特输入通道的数量、编码块大小和歌曲/音轨标识符。在其它实例中,可包括与音频信号x或编码/解码过程有关的任何其它信息作为侧链数据的一部分。侧链数据可从侧链数据线路1108上的感知音频解码器1101提供至音频信号增强器1102。可替代地或除此以外,可包括侧链数据作为输入信号x的部分。
图12是音频信号增强器1102的实例的信号流程图,其中感知音频解码器1101可以被并入作为音频信号增强器1102的一部分。因此,音频信号增强器1102可在数据压缩型比特流线路1106上接收的数据压缩型音频比特流q上直接操作。可替代地,在其它实例中,可将音频信号增强器1102包括在感知音频解码器1101中。在该配置中,音频信号增强器1102可访问线路1106上的数据压缩型音频比特流q的细节。
图13是音频信号增强器1102的实例的信号流程图。在图13中,音频信号增强器1102包括信号处理模块1300,所述信号处理模块1300可接收输入信号线路1107上的输入信号x。信号处理模块1300可在对应信号处理线路1310上产生若干个别且独特的信号处理st1、st2、st3、st4、st5、st6和st7。虽然图示了七个信号处理,但是在其它实例中,更少或更多数量n个信号处理是可能的。在第一求和块1321处被加在一起以在线路1323上产生总信号处理stt之前,增益级1315中的处理增益g1、g2、g3、g4、g5、g6和g7可单独地调整信号处理stn中的每一个的相对能级。在第二求和块1322处被增加至线路1107上的输入信号x之前,线路1320上的总处理增益gt可调整线路1323上的总信号处理stt的级别。
信号处理模块1300可包括一个或多个处理模块1301、1302、1303、1304、1305、1306和1307,所述模块在输入信号x的顺序样本的个别样本分量上操作,以逐样本顺序地产生有关相应分量中的每一个的信号处理1310。顺序样本的个别样本分量可与音频信号的不同特征有关。可替代地或除此以外,信号处理模块1300可包括额外的或更少的处理模块1300。图示的模块可是独立的,或者可是形成在各种组合的任何一个中以创建模块的子模块。
当尝试再现来自多个声音源的声音时遇到的另一影响是:音频系统不能再造声音分级。声音分级是允许收听者感知音乐呈现的明显物理大小和位置的现象。声级包括深度和宽度的物理性质。这些性质促成例如收听管弦乐队的能力,并且能够分辨不同声音源(例如,乐器)的相对位置。然而,当对多个声音源进行录音时,许多录音系统无法精确地捕捉声音分级效果。关于此的一个原因就是许多系统所使用的方法。例如,所述系统通常使用一个或多个麦克风来接收由多个声音源产生的声波,并且将所述声波转换成电气音频信号。当使用一个麦克风时,来自所述声音源中的每一个的声波通常被混合(即,彼此叠置)以形成复合信号。当使用多个麦克风时,所述多个音频信号通常被混合(即,彼此叠置)以形成复合信号。在任何一种情况下,然后将所述复合信号存储在存储媒体上。随后,可以从存储媒体读取复合信号,并且对所述复合信号进行再现,以尝试再造由声音源产生的原始声音。然而,信号的混合尤其会限制对多个声音源的声音分级进行再造的能力。因此,当将信号混合时,再现的声音无法精确地再造原始声音。这就是与听录音相比,现场听管弦乐队会不同的一个原因。
例如,在一些情况下,复合信号包括两个分开的通道(例如,左侧和右侧),以尝试在空间上将所述复合信号分开。在一些情况下,使用第三个(例如,中心)或三个以上通道(例如,前方和后方),以实现对由多个声音源产生的原始声音的更大的空间分离。然而,不论通道的数量是多少,所述系统通常涉及对音频信号进行混合,以形成一个或多个复合信号。即使是被吹捧为“离散多通道”的系统也将每一通道的离散性建立在“方向性分量”的基础上。“方向性分量”有助于建立更加席卷性的声学效果,但是无法解决音频信号本身内的关键精确性损耗。常常使用其它分离技术以尝试增强声音的再造。例如,每一扬声器通常包括多个扬声器组件,其中每一组件专用于特定频带以实现再现的声音的频率分布。常见地,所述扬声器组件包括低音扬声器或低音部(较低频率)、中音部(中等频率)和高音扬声器(较高频率)。针对其它特定频带的组件也是已知的,并且可使用。当将频率分布式组件用于多个通道(例如,左侧和右侧)中的每一个时,输出信号可以展示出一定程度的空间分布和频率分布二者,以尝试再现由多个声音源产生的声音。
由将由声音源产生的声音或对应音频信号进行混合产生的另一个问题是,该混合通常要求这些复合声音或复合音频信号在相同的扬声器上进行播放。众所周知的是,诸如掩蔽等效应妨碍原始声音的精确再造。例如,当伴随有更响的声音时,掩蔽可以呈递一个听不到的声音。例如,当存在声音放大的音乐时无法听到交谈是掩蔽的实例。当用于掩蔽的声音具有与被掩蔽的声音类似的频率时,掩蔽就特别成问题。其它类型的掩蔽包括扬声器掩蔽,其当扬声器纸盆由复合信号而不是对应于单个声音源的音频信号驱动时发生。因此,在后一种情况下,扬声器纸盆将其所有能量用于再现一个隔离的声音;而在前一种情况下,扬声器纸盆必须将其能量“分时”以同时再现复合声音。
图14是描绘多输入音频增强(子)模块1400的实例的信号流程图,所述模块1400具有声音分级功能性和具有音频输入信号l、r、ls、rslrs和rrs的多个输入通道。可用作、用于或结合音频增强(子)模块204一起使用的(子)模块1400包括六个块1401至1406。块1401至1406的基本结构包括和滤波器1407和十字滤波器1408,所述滤波器用于将作为输入信号l、r、ls、rslrs或rrs输入的音频信号变换成在相应滤波器输出处输出的直接和间接头部相关传递函数(hrtf)。从和滤波器1407的输出减去十字滤波器1408的输出,以提供第一块输出信号。通过借助于耳间延迟1409延迟十字滤波器1408的输出信号来生成其它块输出信号。示例性块1401至1406执行将音频输入信号变换成直接和间接hrtf的功能。另外,在将十字滤波器输出从乘积减去之前,可将来自和滤波器1407的输出信号乘以例如系数2。这样产生直接hrtf。由十字滤波器输出的信号表示间接hrtf。
就和滤波器1407而言,当应用于音频信号时,所述和滤波器1407可以提供频谱修正,以使得信号的此种品质对于收听者的双耳大致上类似。和滤波器1407也可以消除可能会包括在音频信号的频率响应中的不希望的共振和/或不希望的峰化。对于十字滤波器1408,当应用至音频信号时,所述十字滤波器1408提供频谱修正,以使得收听者听觉上感知信号来自预定的方向或位置。该功能性通过对头部遮蔽的调整实现。在两种情况下,可能需要所述修正对于个别收听者的特定特征而言是特有的。为了满足此种需要,对和滤波器1407和十字滤波器1408二者进行设计,以使得过滤的音频信号的频率响应对于收听者特定特征敏感度低。在块1401和1402中,和滤波器具有为“1”的传递函数,以使得和滤波器可以被直接连接取代。如已经提及的,块1401至块1406还包括针对45度、90度和135度(分别标记成“t45”、“t90”和“t135”)的源角度的耳间延迟1409。在48khz的取样率下,延迟滤波器1409可以分别具有17个样本、34个样本和21个样本的典型取样。延迟滤波器1409对声波在首先抵达一只耳朵后抵达另一只耳朵所需要的时间进行模拟。
模块1400的其它分量可以将来自一个或多个源的音频信号变换成双耳格式,诸如直接和间接hrtf。具体地说,音频增强(子)模块1400借助于直接和间接hrtf将来自6通道环绕声系统的音频信号变换成由头盔中的右侧扬声器和左侧扬声器(未图示)输出的输出信号hl和hr。由头盔中的扬声器输出的这些信号将包括6通道环绕声的一般感知的增强,无不希望的伪像。同样就头盔中的扬声器的每一输出而言,包括相应的求和操作的集合以对6通道环绕声的三个输入对进行求和。六个音频信号输入包括左侧、右侧、左侧环绕、右侧环绕、左后环绕和右后环绕(分别标记成“l”、“r”、“ls”、“rs”、“lrs”和“rrs”)。图14还描绘针对45度、90度和135度(分别标记成“hc90”、“hc135”、“hc45”、“hc90”和“hc135”)的源角度的和滤波器和十字滤波器。如上面所指出,和滤波器未参与来自具有45度源角度的源的音频信号的变换。可替代地,等于恒定值1的和滤波器可添加至图14中描绘的实施方式,并且类似的输出将在输出hl和hr处发生。而且,可替代地,实施方式可为具有诸如30度、80度和145度等其它源角度的源采用其它滤波器。另外,一些实施方式可例如在存储器中存储有关不同源角度的各种和滤波器系数和十字滤波器系数,以使得终端使用者可以选择所述滤波器。在所述实施方式中,收听者可以对其感知声音的角度和模拟定位进行调整。可替代地,除了声音分级之外,例如二维音频和三维音频等任何(其它)空间音频处理也适用。
实施方案的描述已经被呈现用于说明和描述的目的。可根据以上描述执行实施方案的合适的修改和变化形式。所描述的系统具有示例性性质,并且可包括额外元素和/或省略元素。如本申请中所使用,以单数形式阐述并且使用措词“一个”或“一种”修饰的元素或步骤应理解为不排除多个所述元素或步骤,除非明确指出所述排除。另外,对本公开的“一个实施方案”或“一个实例”的引用并非意在被解释成排除存在也合并所阐述的特征的额外实施方案。术语“第一”、“第二”和“第三”等仅用于标识,而并非意在对其客体施加数值要求或特定位置次序。信号流程图可描述一种系统、方法或软件,所述系统、方法或软件根据例如硬件、软件或其组合的实现类型实现所述方法。