声校正装置的制作方法

文档序号:7609789阅读:618来源:国知局
专利名称:声校正装置的制作方法
技术领域
本发明一般涉及音频增强系统,尤其是为提高立体声再现的真实感而设计的一些系统和方法。更具体地说,本发明涉及用来克服听者所感觉到的音响系统的声成像和频率响应缺陷的装置。
背景技术
在声音再现环境中,有各种各样的因素可起作用而降低收听者所感觉的再现声音的质量。这些因素致使再现声音与原声场(soundstage)的声音截然不同。一个此类因素是声场中扬声器的位置,如果位置设置得不合适,可能导致音频频谱上的声压响应特性失真。扬声器的布置还影响声场的感觉宽度。例如,扬声器作为点声源,限制了它们再现现场声舞台中易于感觉到的混响声的能力。实际上,许多音频再现系统中所感觉的声场宽度仅限于置于听者前方的一对扬声器分开的距离。另一个降低再现声音质量的因素可能来自于传声器,它以与人的听觉系统感觉声音的方式不同的方式记录声音。在为了克服这些降低再现声音质量的因素的尝试中,人们付出了无数努力,不断修改声音再现环境的特征来模拟听者在现场声舞台中听到的声音。
在增强立体声成像方面的某些努力已经集中于人耳的听觉能力和局限上。人耳的听觉反应对声强、某些声音之间的相差、声音本身的频率以及发出声音的方向很敏感。尽管人的听觉系统很复杂,但是人与人之间,人耳的频率反应是相对稳定的。
当在所有频率上具有稳定声压电平的声波从单一位置指向听者时,人耳对于该声音的各个频率分量将有不同反应。例如,当等声压的声音从听者前方传向该听者时,1000赫兹的声音在该听者耳中所产生的声压级将不同于2000赫兹声音产生的声压级。
除对频率的敏感性之外,人的听觉系统对从不同角度冲击人耳的声音反应不同。具体来说,人耳内的声压电平将随声音的方向而变化。外耳或耳廓以及内耳道的形状大部分负责随方向而改变的声音的频率仿形(contouring)。
人的听觉响应对声源的方位和高度变化都很敏感。对于复杂的声音信号,即,具有多个频率分量的信号尤其如此,一般对于较高频率的分量较为敏感。耳内频率分量中的声压变化通过大脑解释,提供对声音源头的指示。因此当再现录制的声音时,如耳根据声压信息所解释的,对声音源头的方向指示将取决于再现该声音的扬声器的实际位置。
听者的耳朵可以从直接设置在该听者前方的扬声器获得稳定的声压电平,即“平坦”的声压-频率响应特性。这种响应特性常常是达到逼真声像所需要的。但是,一组扬声器的质量可能比理想的稍逊,而且它们可能没有被设置在最理想的声学位置。这两种因素都常常导致破坏的声压特性。现有技术的音响系统已公开一些方法,用于“校正”从扬声器发出的声压,而产生空间上校正的响应,从而改进所产生的声像。
为了对给定音响系统实现更佳空间上校正的响应,已知的是,对音频信号选择和运用头部相关传递函数(HRTF)。HRTF是基于人听觉系统的声学效果的。HRTF的应用被用于调整音频信号的各部分的振幅,从而补偿空间性的失真。基于HRTF的原理还可用于重新定位从非最优化放置的扬声器产生的立体声像。
第二种缺点也常常出现,因为充分地再现低频声音、如低音较难。提高低频声音的输出的各种常规方法包括采用具有更大纸盆面积、更大磁体、更大箱体或更大纸盆振动能力的较高品质的扬声器。此外,常规系统尝试利用共振腔和喇叭再现低频声音,使扬声器的声阻抗与环绕扬声器的空闲空间的声阻抗匹配。
但是,不是所有的系统都可以简单地利用更昂贵或功能更强大的扬声器来再现低频声音。例如,某些常规音响系统、如小型音频系统和多媒体计算机系统都采用小型的扬声器。此外,为了节省成本,许多音频系统采用精度较差的扬声器。此类扬声器通常不具有良好地再现低频声音的能力,因此此类音响通常比不上更精确再现低频声音的系统强劲或欣赏效果好。
某些常规增强型系统尝试通过在信号输入扬声器之前放大低频信号来补偿低频声音的不良再现。放大低频信号把大量的能量送到扬声器,从而以更大的力驱动扬声器。但是,这种放大低频信号的尝试会导致过度驱动扬声器。不幸的是,过度驱动扬声器会增加背景噪声,产生令人心烦的失真,以及损坏扬声器。
再一种常规系统,在尝试补偿低频的不足时,因添加了不期望的声染色而令高频再现失真。
第三种困难产生是因为从多个位置发出的声音常常无法适当地在音频系统中再现。一种改善声音再现的方法包括具有多个记录轨迹的环绕声系统。利用多个记录轨迹来记录与从多个位置发出的声音相关联的空间信息。
例如,在环绕声系统中,某些记录轨迹包含来源于听者前方的声音,同时另一些记录轨道包含从该听者背后发出的声音。当在听者周围设置多个扬声器时,记录轨迹中所含的音频信息就会使再现的声音让听者觉得更逼真。但是,这种系统通常比不采用多个记录轨迹和多个扬声器设置的系统昂贵。
为了节省成本,许多常规的双扬声器系统尝试通过在左右信号源之间引入非自然的时延或相移来模拟环绕声效果。遗憾的是,这种系统常常在再现声音中会遇到不真实的效果。
另一种常用的音效增强技术作用于所谓“和”和“差”信号上。和信号也称为单声道信号,是左右信号之和。这可以概念化为叠加或组合左右信号(L+R)。
另一方面,差信号表示左右音频信号之差。它最恰当地被概念化为从左信号减去右信号(L-R)。差信号也常常被称为环境信号。
众所周知,修改差信号中的某些频率可以拓宽所感觉的从左右扬声器投射出的声音。所拓宽的声像通常通过改变存在于差信号中的混响声音获得。
但是,产生和信号和差信号的电路通过处理左右输入信号来产生所述和信号和差信号。再者,一旦电路产生和信号和差信号,附加电路就分别处理和重新组合和信号和差信号,以便产生实现增强的音效。
通常,和信号和差信号的生成和处理是利用数字信号处理器以及运算放大器等来实现的。这种实现一般需要复杂的电路,从而增加了这种系统的成本。因此,尽管现有技术有种种改善,但是仍存在对简化的、降低与产生增强的听觉效果有关的成本的音频增强系统的需要。
发明概要本发明通过提供一种信号处理技术来解决这些和其它问题,所述技术显著地改善了音频系统的声像大小、低音性能以及动态特性,使听者置身于音频表演的动人和震撼的表现中。它改善了对各种应用、包括计算机、多媒体、电视、轻便型收录机、汽车、家庭音响系统以及便携式音频系统的听觉体验。在一个实施例中,声音校正系统对扬声器的外在布置、扬声器所生成的声像以及扬声器所产生的低频响应特性进行校正。在一个实施例中,声音校正系统增强由两个或两个以上的扬声器再现的声音的空间和频率响应特性。所述声音校正系统包括声像校正模块,校正扬声器所再现的声音的听者所感觉到的垂直声像;低音增强模块,改善听者所感觉到的扬声器的低音响应特性;以及声像增强模块,增强听者所感觉的视在声场的水平声像。
在一个实施例中,采用三种处理技术。采用头部相关传递函数(HRTF)来均衡用于定位扬声器边界外的声音的空间信号。这些HRTF校正曲线说明大脑如何感觉声音到听者各侧的位置,甚至在通过听者前方的扬声器播放时。因此,外加包围该空间的间接和反射的声音,乐器和歌手的表现出现在适当的位置。第二组HRTF校正曲线扩展和提升立体声像的视在尺寸,使得声场宽度比扬声器的位置呈现巨大比例。最后,通过心理声学技术增强低音性能,该技术通过动态地增大扬声器可更易于再现的和声来修复对低频基音的感觉。
声校正系统和相关的操作方法提供一种尖端而有效的系统,用以改善不良再现环境中的垂直、水平和频谱声像。在一个实施例中,所述系统首先校正扬声器产生的垂直声像,然后增强低音,最后校正水平声像。垂直声像增强通常包括声音的较低频率部分的某些增强,而由此在低音增强之前提供的垂直增强对低音增强处理的整体效果产生影响。低音增强对立体声信号中低频信息的左右部分的共有部分(共模)提供某种混合。相反,水平声像增强对左右部分之间的差(差模)提供某种增强和整形。由此,在一个实施例中,在水平声像增强之前有利地提供低音增强,以便平衡立体声信号的共模和差模部分,从而产生对听者而言悦耳的效果。
为了在垂直面上实现改善的立体声像,声像校正装置将输入信号分成共同包含基本所有音频频谱的第一和第二频率范围。第一和第二频率范围内的输入信号的频率响应特性被分别校正和组合,从而产生具有对听者而言相对平滑的频率响应特性的输出信号。频率校正、即声能校正的电平取决于再现环境,而且适用于克服这种环境的声学限制。声校正装置的设计使得在各个频率范围内可以容易地和独立地进行输入信号的校正,从而实现空间校正和重定位的声像。
在音频再现环境内,扬声器可能处于不合适的位置,从而不利地影响了听者所感觉到的声像。例如,耳机常常产生不悦耳的声像,因为换能器紧靠着听者的耳朵。本发明的声校正装置重新将声像定位于更合意的视在位置。
通过应用声校正装置,可以在空间上校正由音频信号的播放所产生的立体声像,从而传送其垂直和/或水平位置不同于扬声器位置的感觉来源。听者所感觉到的确切来源将取决于空间校正的程度。
一旦通过空间失真的校正获得感觉到的声源,就可以增强校正的音频信号以提供扩展的立体声像。根据一个实施例,重新定位的声像的立体声像增强考虑到人听觉的声学原理,从而使听者置身于逼真的舞台中。在聆听位置相对固定的那些声音再现环境(如汽车内部、多媒体计算机系统、书架扬声器系统等)中,施加于音频信号的立体声像增强的量部分是由扬声器相对于听者的实际位置来确定的。
在不再现某些低频声音的扬声器中,本发明创造出确实存在丢失的低频声音的错觉。因此,听者感觉到比该扬声器实际可以准确再现的频率低的低频。这种错觉效果是通过以独特的方式利用人的听觉系统处理声音的方式来实现的。
本发明的一个实施例利用听者在心理上感觉音乐或其它声音的方式。声音再现的处理并非仅限于扬声器所产生的声能,而是还包括听者的耳朵、听觉神经、大脑以及思维过程。听觉开始于耳朵和听觉神经系统的动作。人耳可以被看作一个精密翻译系统,它接收声学振动,将这些振动转换为神经冲动,最后转换为声音的“感觉”或感知。
本发明的一些实施例有利地利用了人耳处理低频声音的泛音和和声的方式,从而创造出从扬声器正发出并不存在的低频声音的感觉。在一些实施例中,较高频带中的频率被选择性地处理,从而创造低频信号的错觉,而在另一些实施例中,利用多个滤波器功能对某些较高频带进行了修改。
此外,本发明的一些实施例被设计成提高流行音频节目素材(如音乐)的低频增强。大多数音乐在和声上较为丰富。因此,这些实施例可以修改各种各样的音乐类型,以便利用人耳处理低频声音的方式。有利的是,可以处理现有格式的音乐以产生期望的效果。
此新方法产生许多明显的优点。因为听者感觉到并非实际存在的低频声音,所以减少了对大型扬声器、更大纸盆摆动幅度或增加喇叭的需要。因此,在一个实施例中,小扬声器可以让人觉得它们象是发出较大扬声器的低频声音。如所能预期的,本实施例在对于大扬声器而言太小的声音环境中产生低频音的感觉、如低音。通过创造大扬声器产生增强的低频声音的感觉,使大扬声器同样受益。
此外,利用本发明的一个实施例,手持和便携式音响系统中的小扬声器可以创造低频声音的更具欣赏性的感觉。因此,听者不需要为便携性而牺牲低频声音的质量。
在本发明的一个实施例中,低成本的扬声器创造低频声音的错觉。许多低成本扬声器不能充分再现低频声音。取代采用昂贵的扬声器机箱、高性能的元件和大磁体来实际地再现低频声音,一个实施例采用较高频率的声音来创造低频声音的错觉。因此,可以采用低成本的扬声器来创造更逼真和强劲的视听体验。
再者,在一个实施例中,低频声音的错觉创造了一种增加声音的逼真感的更高视听体验。因此,取代许多低成本的现有技术的系统中存在的模糊不清或摇晃的低频声音的再现,本发明的一个实施例再现感觉更准确和清晰的声音。这种低成本音频和视听装置可以包括例如收音机、移动音频系统、计算机游戏、扬声器、小型光盘(CD)播放器、数字万能光盘(DVD)播放器、多媒体显示装置、计算机声卡等。
在一个实施例中,创造低频声音的错觉需要的能量比实际再现低频声音要少。因此,使用电池工作、运行于低功率环境、小扬声器、多媒体扬声器、耳机等的系统可以创造低频声音的错觉,而不会象仅仅放大或升高低频声音的系统那样消耗那么多的宝贵能量。
本发明的另一些实施例利用专门的电路创造低频信号的错觉。这些电路比现有技术的低频放大器简单,因此降低了制造成本。有利的是,这些花费的成本低于增加复杂电路的现有技术的声音增强装置。
本发明的再一个实施例依靠实现所公开的低频增强技术的微处理器。在某些情况中,现有的处理音频的元件可以被重新编程,以便实现本发明的一个或多个实施例所公开的独特的低频信号增强技术。因此,显著降低了将低频增强添加到现有系统的成本。
在一个实施例中,声音增强装置从主机系统接收一个或多个输入信号,而产生一个或多个增强的输出信号。具体来说,两个输入信号经处理而提供一对频谱上增强的输出信号,当通过扬声器播放和被听者听到时,会产生扩展的低音感。在一个实施例中,低频音频信息以不同于高频音频信息的方式被修改。
在一个实施例中,声音增强装置接收一个或多个输入信号,而产生一个或多个增强的输出信号。具体来说,输入信号包括具有第一频率范围和第二频率范围的波形。输入信号经处理而提供增强的输出信号,这样,当通过扬声器播放和被听者听到时,产生扩展的低音感。此外,该实施例可以不同于第二频率范围中的信息的方式修改第一频率范围中的信息。在一些实施例中,第一频率范围可以是对于所需的扬声器来说太低而无法再现的低音频率,而第二频率范围可以是该扬声器可以再现的中低音频率。
一个实施例以不同于两个声道所不共有的能量的方式,修改两个立体声通道所共有的音频信息。两个输入信号所共有的音频信息被称为组合信号。在一个实施例中,增强系统在频谱上对组合信号的相位和频率的振幅进行整形,以便降低可能由高振幅输入信号引起的削波,而不会消除音频信息的立体声感。
如以下更详细讨论的,声音增强系统的一个实施例利用各种滤波器在频谱上对组合信号整形以产生增强的信号。通过增强组合信号内的所选频带,该实施例提供比实际扬声器带宽更宽的感觉的扬声器带宽。
声音增强装置的一个实施例包括用于两个立体声声道的前馈信号路径和用于组合信号路径的三个并联的滤波器。四个并联滤波器中的每一个都包括由三个串联的双二次滤波器组成的六阶带通滤波器。这四个滤波器的传递函数是专门选择的,提供对音频信号的低频内容的各种和声的相位和/或振幅整形。这种整形意外地增加了通过扬声器播放时感觉的音频信号带宽。在另一个实施例中,六阶滤波器被较低阶的Chebychev滤波器代替。
因为频谱整形是对组合信号进行的,然后后者与前馈路径中的立体声信息组合,所以组合信号中的频率可以被改变,从而影响两个立体声通道,某些频率范围中的一些信号从一个立体声通道耦合到另一个立体声通道。由此,各种实施例以完全独特、新颖以及意外的方式创造增强的音频声音。
而声音增强装置又可以连接到一个或多个后续的信号处理级。这些后续级可以实现改善的声场或空间处理。输出信号还可以被导入其它音频装置,如记录装置、功率放大器、扬声器等,而不会影响声音增强装置的操作。
本发明还提供一种独特的差动透视校正系统以改善声场的水平方面。差动透视校正系统以完全不同于其它声音增强装置的方式增强声音。这种透视校正系统实施例可以有利地用于在各种低成本音频和视听装置中增强声音,例如,这些装置可以包括收音机、移动音频系统、计算机游戏、多媒体显示装置等。
一般地说,这种差动透视校正装置从主机系统接收两个输入信号,然后产生两个增强的输出信号。具体来讲,两个输入信号经统一处理而提供一对在空间上校正的输出信号。此外,一个实施例以不同于两个输入信号所不共有的音频信息的方式修改两个输入信号共有的音频信息。
两个输入信号共有的音频信息称为共模信息或共模信号。共模音频信息与和信号不同之处在于,它不是包含输入信号之和,而是只包含在任何给定时刻两个输入信号中都存在的音频信息。
相反,并非两个输入信号共有的音频信息称为差动信息或差动信号。虽然以不同于共模信息的方式处理差动信息,但是差动信息不是离散信号。如以下要详细讨论的,差动透视校正装置利用各种滤波器在频谱上对差动信号进行整形,从而产生均衡的差动信号。通过均衡差动信号内的所选频带,差动透视校正装置拓宽了从设在听者前方的一对扬声器投射的感觉的声像。
因为分频阻抗网络均衡差动输入中的频率范围,可以改变差动信号中的频率,而不影响共模信号中的频率。因此,以完全独特和新颖的方式增强了音频声音。
附图简介结合以下附图,通过下面给出的本发明的特定描述,本发明的上述和其它方面、特点和优点会变得显而易见。


图1是立体声像校正系统的框图,它以可操作方式连接到用于根据一对输入立体声信号产生逼真立体声像的立体声增强系统和低音增强系统。
图2是包括立体声接收器和两个扬声器的立体声系统的示意图。
图3是典型的多媒体计算机系统的示意图。
图4A是音频再现系统的期望声压-频率特性的图形表示。
图4B是对应于第一音频再现环境的声压-频率特性的图形表示。
图4C是对应于第二音频再现环境的声压-频率特性的图形表示。
图4D是对应于第三音频再现环境的声压-频率特性的图形表示。
图5是能量校正系统的示意性框图,它以可操作方式连接到用于根据一对输入立体声信号产生逼真立体声像的立体声像增强系统。
图6A是根据一个实施例的低频校正系统所提供的各级信号修改的图形表示。
图6B是根据一个实施例的用于提升音频信号的高频分量的高频校正系统所提供的各级信号修改的图形表示。
图6C是根据一个实施例的用于减弱音频信号的高频分量的高频校正系统所提供的各级信号修改的图形表示。
图6D是复合能量校正曲线的图形表示,它说明用于重新定位立体声像的声压校正的可能范围。
图7是施加于音频差信号以实现变化的立体声像增强量的各级均衡的图形表示。
图8A是说明听者从设在第一位置的扬声器听到的声音感觉的和实际的源头的示意图。
图8B是说明听者从设在第二位置的扬声器听到的声音感觉的和实际的源头的示意图。
图9是典型小扬声器系统的频率响应特性的曲线图。
图10说明由两个离散的频率表示的实际的信号频谱和感觉的信号频谱。
图11说明由连续频谱表示的实际的信号频谱和感觉的信号频谱。
图12A说明调制载波的时间波形。
图12B说明检波器进行检波之后图12A的时间波形。
图13A是具有低音增强处理功能的声音系统的框图。
图13B是将多个通道组合成单个低音通道的低音增强处理器的框图。
图13C是单独处理多个通道的低音增强处理器的框图。
图14是为低音增强功能提供可选频率响应特性的系统的信号处理框图。
图15是图14所示的信号处理示意图中所用的带通滤波器的传递函数的曲线图。
图16是表示穿通(punch)系统的时间振幅响应特性的时域曲线图。
图17是表示乐器演奏的典型低音音符的信号和包络部分的时域曲线图,其中所述包络示出增高部分、衰减部分、持续部分和释放部分。
图18是利用峰值压缩器和低音穿通系统提供低音增强的系统的信号处理框图。
图19是说明峰值压缩器对具有快速增高的包络的影响的时域曲线图。
图20是立体声像(差动透视)校正系统的概念框图。
图21是不导出明确的和信号和差信号的立体声像(差动透视)校正系统的框图。
图22说明差动透视校正系统的共模增益的图形表示。
图23是差动透视校正系统的整体差动信号均衡曲线的图形表示。
图24是可以在单个芯片上实施的音效增强系统的一个实施例的框图。
图25A是适用于图24中所示系统的垂直声像增强块的左声道的示意图。
图25B是适用于图24中所示系统的垂直声像增强块的右声道的示意图。
图26A和图26B是适用于图24中所示的系统的低音增强块的示意图。
图27是适用于图26中所示的低音增强系统的滤波器系统的示意图。
图28是适用于图26A和图26B中所示的低音增强系统的压缩器系统的示意图。
图29是适用于图24中所示系统的水平声像增强块的示意图。
图30是可以用作立体声像增强系统的差动透视校正系统的示意图。
图31表示利用一个分频网络的差动透视校正系统。
图32是利用两个分频网络的差动透视校正装置的示意图。
图33表示允许用户改变整体差动增益量的差动透视校正装置。
图34说明允许用户改变共模增益量的差动透视校正装置。
图35说明差动透视校正装置,它具有位于差分对的晶体管的发射极之间的第一分频网络和位于差分对的集电级之间的第二分频网络。
图36说明具有输出缓冲器的差动透视校正装置。
图37说明声像增强系统的六运算放大器形式。
图38是声校正系统的软件实施例的框图。
图39是图38所示框图所用的40赫兹带通滤波器的传递函数的曲线图。
图40是图38所示框图所用的60赫兹带通滤波器的传递函数的曲线图。
图41是图38所示框图所用的100赫兹带通滤波器的传递函数的曲线图。
图42是图38所示框图所用的150赫兹带通滤波器的传递函数的曲线图。
图43是图38所示框图所用的200赫兹带通滤波器的传递函数的曲线图。
图44是图38所示框图所用的低通滤波器的传递函数的曲线图。
详细描述图1是声校正装置120的方框图,它包括串联的立体声像校正系统122、低音增强系统101以及立体声像增强系统124。声像校正系统122向低音增强单元101提供左立体声信号和右立体声信号。低音增强单元将左右立体声信号输出到立体声像增强装置124的各左右输入端。立体声像增强系统124处理这些信号并提供左输出信号130和右输出信号132。输出信号130和132又可以被连接到某些其他形式的信号调节系统,或者它们可以被直接连接到扬声器或耳机(未示出)。
当连接到扬声器时,校正系统120对扬声器的放置、扬声器所生成的声像以及扬声器所产生的低频响应特性的缺陷进行校正。声校正系统120增强扬声器所再现的声音的空间和频率响应特性。在音频校正系统120中,声像校正模块122校正扬声器所再现的视在声场的听者所感觉的垂直声像,低音增强模块101改善声音的听者所感觉到的低音响应特性,以及声像增强模块124增强视在声场的听者所感觉的水平声像。
校正装置120通过对声音再现环境中的缺陷和扬声器的缺陷进行补偿来改善扬声器再现的声音。装置120通过对再现环境中的扬声器的定位进行补偿来改善原声场的再现。声场再现以如下方式来进行改善同时增强声频频谱上水平方面和垂直方面的视在(即再现的)声场。装置120对在现场舞台中易于感受到的混响声有利地进行修改,使得再现环境中听者也感受到混响声,即使扬声器只起到能力有限的点声源的作用。装置120还对传声器常以不同于人的听觉系统感受声音的方式记录声音的情况进行补偿。装置120利用滤波器和模拟人的听觉的传递函数来校正传声器所生成的声音。
声音系统120利用人的听觉响应的特征来调整复杂声音的视在方位和高程点。这种校正为听者的大脑所利用,从而提供声源的指示。校正装置120还对放置得不是太理想的扬声器、如不在最佳音效位置上的扬声器进行校正。
为了使给定声音系统达到更佳空间上的校正响应特性,声校正装置120利用头部相关传递函数(HRTF)的某些方面,并配合声音信息的频率响应特性整形来校正两个扬声器的位置设置,校正声场的视在宽度和高度,以及校正扬声器的低频响应的不足。
因此,即使扬声器的位置稍稍不理想,以及扬声器本身不足以良好地再现期望的声音,声校正装置120也为听者提供更自然和更逼真的声场。
该校正装置所提供的各种声音校正被以这样的次序提供,使得后续的校正不干扰前面的校正。在一个实施例中,以所期望的次序提供这些校正,使得装置120所提供的前期校正增强和协助了装置120所提供的后续校正。
在一个实施例中,校正装置120利用改善的低音响应特性模拟环绕声系统。校正装置120创造多个扬声器围绕听者设置的错觉,并为多个扬声器布置提供多个记录轨迹中所含的音频信息。
声校正系统120提供一种尖端而有效的系统,用以改善有缺陷的再现环境中的垂直、水平和频谱声像。声像校正系统122首先校正扬声器所产生的垂直声像,然后低音增强系统101以这样的方式调整声音信号的低频分量,即增强不具有足够低频再现能力的小扬声器的低频输出,最后,声像增强系统124校正水平声像。
声像校正系统122所提供的垂直声像增强通常包括声音较低频率部分的一些加重,并由此在低音增强系统101影响低音增强处理的整体效果之前提供垂直增强。低音增强系统101提供立体声信号中低频信息的左右部分的公共部分(共模)的某种混合。相比之下,声像增强系统124所提供的水平声像增强提供对该信号左右部分之间的差(差模)的增强和整形。由此,在校正系统120中,最好在水平声像增强之前提供低音增强,以使平衡立体声信号的共模部分和差模部分,从而得到令听者愉悦的效果。
如上所公开的,立体声像校正系统122、低音增强系统101以及立体声声像增强系统124相配合以克服声音再现环境的声学缺陷。声音再现环境可能象剧院设施一样大,也可能如便携式电子键盘一样小。声校正装置还为多媒体计算机系统(参见例如附图3)、家庭音响、电视机、耳机、便携收录机、汽车等提供极大益处。
图2表示具有接收器220的立体声音频系统。接收器220向左扬声器246提供左声道信号而且向右扬声器247提供右声道信号。或者,接收器220可以替换为电视机、便携式立体声系统(例如便携式收录机)、收音机闹钟等。接收器220还向耳机250提供左右声道信号。听者(用户)248可以利用耳机250或扬声器246和247听左右声道信号。声校正装置120可以利用接收器220中的模拟器件来实现,或者通过在接收器220中的数字信号处理器(DSP)上运行的软件来实现。
扬声器246和247常常并未设置在最佳的位置上来为用户提供所期望的立体声像,因此,降低了听者的收听愉悦度。同样地,耳机、如耳机250常常会产生不悦耳的声音,因为耳机靠近耳朵,而不是位于听者的前方。再者,许多小型书架扬声器、多媒体扬声器以及耳机的低频响应特性都不好,从而进一步降低听者的收听愉悦度。接收器220内的声校正装置(或软件)120校正左右信号以便在通过扬声器246和247或耳机250再现时产生更悦耳的声音。在一个实施例中,接收器220包括控制器(如图38中的宽度控制器3846和/或图38中的低音控制器3827),从而使听者248可以根据听者248所听的是扬声器246和247还是耳机250来调整左右声道中产生的声音。
图3表示典型的计算机音频系统300,它可以利用本发明的实施例来改善扬声器246和247所产生的音频性能。扬声器246和247通常与计算机装置304中的声卡(未示出)连接。声卡可以是任何产生音频输出的计算机接口卡,包括收音机卡、电视频道选择卡、PCMCIA(个为计算机存储卡国际协会)卡、内置调制解调器、插式数字信号处理器(DSP)卡等。计算机304使声卡生成由扬声器246转换成声波的音频信号。
图4A说明在音频再现环境内听者外耳处出现的期望的频率响应特性的图形表示。曲线460是以分贝为单位测得的声压电平(SPL)对频率的变化。如图4A所示,声压电平对所有声频是相对恒定的。曲线460可以由直接布置在听者前方、大约与耳朵持平的位置的一对理想的扬声器对粉红噪声的再现来得到。粉红噪声指的是在每倍频程有相等能量的音频频谱上发出的声音。实际上,曲线460的平滑频率响应可能随扬声器系统的固有声学限制而波动。
曲线460表示经听者的耳朵处理之前所存在的声压电平。再次参考图2,当扬声器分开且通常放置在听者248前方时,曲线460所表示的平滑频率响应特性与向听者248发出的声音一致。人耳通过将其自己的听觉响应特性运用于声音信号来处理,如曲线460所表示的这种声音。人的听觉响应特性由耳朵的外耳廓和内耳道决定。
遗憾的是,许多家庭和汽车声音再现系统的频率响应特性并不提供图4A所示的期望特征。相反,扬声器可能被布置在音效不理想的位置以适应其它人机工程方面的需求。可能仅仅扬声器246和247相对于听者248的位置就可能在频谱上使从扬声器246和247发出的声音失真。再者,视听环境中的物体和表面可能导致最终的声音信号被吸收或振幅失真。这种吸收作用往往在较高频率中是常见的。
由于频谱和振幅都失真,听者248所感受的立体声像在空间上失真,从而产生非期望的听觉体验。图4B-4D通过图形说明各种声音再现系统和听音环境的空间上失真的程度。图4B-4D所说明的失真特性表示位于听者耳朵附近的以分贝为单位测得的声压电平。
图4B的频率响应曲线464在约100Hz以上频率处声压电平下降。曲线464表示由安装于听者下方的、含有高低音喇叭的扬声器产生的可能的声压特性。例如,假定图2的扬声器246含有高音喇叭,只通过这种扬声器246播放的音频信号可能呈现图4B的响应。
与下降曲线464相关的具体斜率会变化,可能不完全是直线,这随视听区域、扬声器的质量以及视听区域内扬声器的具体放置而定。例如,具有相对较硬表面的视听环境会比具有相对较软表面(例如布、地毯、吸音瓦等)的视听环境更多地反射音频信号,特别是较高的频率。频谱失真的程度将随扬声器布置得远离听者而变化。
图4C是声压-频率特性468的图形表示,其中音频信号的第一频率范围已在频谱上失真,但是这些信号的较高频率范围没有失真。特征曲线468可以由如下扬声器布置来实现中低频扬声器布置在听者下方,高频扬声器布置在听者耳朵水平线附近。由特征曲线468得到的声像将具有位于图2的听者248之下的低频分量和位于听者耳朵水平线附近的高频分量。
图4D是声压-频率的特性470的图形表示,该特性在较低频率中声压电平降低而在较高频率中声压电平升高。特性470是如下实现的中低频扬声器设置在听者下方,高频扬声器设置在听者上方。如图4D的曲线470所示,1000Hz以上频率的声压电平会显著高于较低频率,导致对附近听者来讲并不理想的音效。由特性曲线470得到的声像将具有位于图2的听者248下方的低频分量和位于听者248上方的高频分量。
图4B-4D的音频特性表示可在通常的听者环境中获得的且被听者248听到的各种声压电平。图4B-4D的音频响应曲线仅仅是少数说明位于听者耳朵附近的音频信号如何因各种音频再现系统而失真的实例。任何给定频率上的频谱失真的确切程度变化很大,要视再现系统和再现环境而定。可以为视在仰角和方位坐标定义的扬声器系统生成视在位置,所述视在仰角和方位坐标是相对于固定的听者而言的,不同于实际扬声器位置。
图5是立体声像校正系统122的框图,它输入左右立体声信号126和128。声像校正系统122通过有利地将声频频谱分成包含相对较低频率的第一频率分量和包含相对较高频率的第二频率分量来校正各种声音系统的失真的频谱密度。各左右信号126和128由相应的低频校正系统580和582和高频校正系统584和586分开处理。应该指出,在一个实施例中,校正系统580和582将在约100至1000赫兹的相对“低”的频率范围内工作,而校正系统584和586将在约1000至10000赫兹的相对“高”的频率范围内工作。这不是要与常用音频术语混淆,一般说来,低频指最高100赫兹的频率,中频指100至4千赫兹之间的频率,而高频指4千赫兹以上的频率。
通过将输入音频信号的较低频和较高频分量分离,可以在一个彼此独立的频率范围上进行声压电平的校正。校正系统580、582、584和586对输入信号126和128进行修改,以便对扬声器再现时输入信号的频谱和振幅失真进行校正。所得到的信号以及原始输入信号126和128在各自的求和节点590和592进行组合。所校正的左立体声信号Lc和校正的右立体声信号Rc沿输出端提供给低音增强单元101。
提供给低音单元101的校正的立体声信号具有出现在听者248的耳朵处(如图2和图3所示)的平滑、即均匀的频率响应。这种在空间上校正的响应创造一个当通过图2或图3的扬声器246播放时似乎位于听者248正前方的视在声源。
一旦该声源通过音频信号的能量校正来适当定位之后,低音增强单元101就对扬声器246中的低频缺陷进行校正,并将校正低音后的左右声道信号提供给立体声增强系统124。立体声增强系统124对立体声信号进行调节,拓宽水平从视在声源发出的立体声像。正如参考图8A和8B所讨论的,立体声像增强系统124可以通过立体声定向装置进行调整,从而对该声源的实际位置进行补偿。
在一个实施例中,该立体声增强系统124对左右立体声信号中存在的不同信号信息进行均衡。
从低音增强单元101提供的左右信号是通过增强系统124输入的并被提供给差信号生成器501与和信号生成器504。表示校正的左右输入信号的立体声内容的差信号(Lc-Rc)被在差信号生成器501的输出端502处提供,而表示校正的左右输入立体声信号的和的和信号(Lc+Rc)是在和信号生成器504的输出端506产生的。
在输出端502和506的和信号与差信号分别被提供给可选的电平调整装置508和510。装置508和510通常是电位器或类似的可变阻抗装置。装置508和510的调整通常以手动方式进行,控制输出信号中的和信号与差信号的基准电平。这使得用户可以根据再现声音的类型和依据用户的个人喜好定制立体声增强的级别和方面。增加和信号的基准电平强调了设在一对扬声器之间的中央声场的音频信息。相反,增加差信号的基准电平强调了创造更宽的声像感受的环境声音信息。在已知音乐类型和系统配置参数或者不能进行手动调整的某些音频设置中,调整装置508和510可以免除要预定和固定和信号与差信号电平的要求。
装置510的输出被在输入端522馈送到立体声增强均衡器520。均衡器520在频谱上对输入端522上的差信号进行整形,如图7所示。
整形的差信号提供给混合器542,后者也从装置506接收和信号。在一个实施例中,立体声信号594和596还提供给混合器542。所有的这些信号都在混合器542中进行组合,从而产生增强的且经空间校正的左输出信号530和右输出信号532。
虽然输入信号126和128通常表示已校正的立体声信号,但是它们还可以由单声道声源以合成的方式生成。
声像校正特性图6A-6C是为了获得根据一对立体声信号生成的重定位声像的“低”和“高”频校正系统580、582、584、586提供的空间校正电平的图形表示。
先参考图6A,校正系统580和582所提供的可能的空间校正电平由具有不同振幅-频率特性的曲线来说明。系统580和582所提供的校正或提升(boost)的最大电平(以dB为单位测得的)由校正曲线650表示。曲线650给出在约100Hz和1000Hz的第一频率范围内提升的增加电平。在1000Hz以上的频率,提升电平保持在适当恒定的电平。曲线652表示接近于零的校正电平。
对于本专业的技术人员来说,典型的滤波器通常是由被截止频率分隔的频率的通带和阻带来特征化。图6A-6C的校正曲线虽然表示典型信号滤波器,但是可以按照通带、阻带和过渡带来特征化。根据图6A的特性设计的滤波器具有在大约1000Hz以上的通带、在大约100和1000Hz之间的过渡带以及约100Hz以下的阻带。根据图6B和6C的滤波器具有在大约10kHz以上的通带、约1kHz与10kHz之间的过渡带以及约1kHz以下的阻带。在一个实施例中,滤波器是一阶滤波器。
正如从图6A-6C所见的,系统580、582、584和586所完成的音频信号的空间校正基本上在通带内是均匀的,但是在过渡带内很大程度上与频率相关。通过立体声像校正系统622的调整施加于音频信号的声校正量可以按照一个频率函数来改变,所述系统改变图6A-6C的过滤带斜率。由此,频率相关的校正被施加于100和1000赫兹之间的第一频率范围,并且施加于1000至10,000赫兹的第二频率范围。通过校正系统580、662、584和586的独立调整,出现无穷大数目的校正曲线是可能的。
根据一个实施例,高频立体声信号分量的空间校正出现在约1000Hz和10000Hz之间。这些信号分量的能量校正可以是正值、即提升,如图6B所示,也可以是负值、即衰减,如图6C所示。校正系统584和586所提供的提升范围的特征由最大提升曲线660和最小提升曲线162表示。曲线664、666和668表示另外一些提升电平,可能是对从不同声音再现系统发出的声音进行空间校正所需要的。图6C说明基本与图6B相反的能量校正曲线。
因为图6A-6C的曲线所表示的较低频和较高频校正因素被加在一起,存在各种各样的可能的空间校正曲线可适用于100至10000Hz的频率之间。图6D是说明立体声像校正系统522所提供的复合空间校正特性的范围的图形表示。具体来说,实线曲线680表示包括曲线650(图6A所示)和曲线660(图6B所示)的空间校正的最大电平。较低频率的校正可以根据通过θ1所指定的范围的实曲线680来改变。同样地,高频的校正可以根据通过θ2所指定的范围的实曲线680来改变。因此,施加于100至1000赫兹的第一频率范围的量在约0和15dB之间变化,而施加于1000至10000赫兹的第二频率范围的校正可以在约13dB至-15dB之间变化。
声像增强特性现在转到本发明的立体声像增强方面,图7中通过图形表示一系列的透视增强或归一化曲线。上面公式1和2中的信号(Lc-Rc)表示根据图7的频率响应特性已作了频谱整形的已处理差信号。这些频率响应特性被图5所示的均衡器520采用,而且部分地基于HRTF原理。
一般,差信号的选择性放大增强了可能出现在差信号中、但是被更强的直接声场的声音所掩蔽的任何环境声或混响声效果。在适当的程度下,在现场的声场中很容易感受到这些环境声。但是,在记录的表演中,环境声相对于现场表演被衰减。通过提升由一对左右立体声信号导出的差信号的电平,当从设在听者前方的一对扬声器发出声像时,可以显著拓宽所投射的声像。
图7的透视曲线790、792、794、796和798显示为以对数格式显示的增益-声频的函数。考虑到各种音频再现系统,图7的曲线之间均衡的不同电平是需要的。在一个实施例中,不同信号均衡的电平是音频再现系统内、相对于听者的扬声器实际布置的函数。曲线790、792、794、796和798一般显示频率仿形特性,其中较低和较高的差信号频率相对于频率的中频带是提升的。
根据一个实施例,图7的透视曲线的范围是由位于约125至150Hz的大约10-15dB的最大增益来定义的。最大增益值表示图7曲线的转折点,从该点曲线790、792、794、796和798的斜率从正值变为负值。在图7中,这种转折点由点A、B、C、D和E标出。透视曲线的增益在125Hz以下以每倍频程大约6dB的速率减小。在125Hz以上,图7的曲线的增益也下降,但是以可变速率向大约-2至+10dB的最小增益转折点下降。曲线790、792、794、796和798之间,最小增益转折点明显不同。最小增益转折点分别标为点A′、B′、C′、D′和E′。这些最小增益转折点出现处的频率从曲线790的大约2.1kHz到曲线798的大约5kHz地变化。曲线790、792、794、796和798的增益从其各自的最小增益频率起、直到大约10KHz一直在增加。在10KHz以上,透视曲线所用的增益趋于平整。但是,达到大约120KHz、即大约为人耳可听见的最高频率时,所有曲线的增益将继续增大。
上述增益和频率数字仅仅出于设计目的,而实际的数字会因系统而异。此外,信号电平装置508和510的调整会影响最大和最小增益值、以及最大增益频率和最小增益频率之间的增益间隔。
根据图7曲线的差信号的均衡的目的在于,提升统计上较低强度的差信号分量,而不过度增强较高强度的差信号分量。在约1至4kHz之间的中等范围的频率中会见到典型的立体声信号的较高强度的差信号分量。人耳对这些相同中等范围的频率更加敏感。因此,增强后的左右输出信号530和532产生改善很多的音效,因为环境声被选择性地加重,从而充分地将听者包围在再现的声场内。
如图7所示,125Hz以下的差信号频率通过透视曲线的运用(如果有的话)得到下降的提升量。这种下降目的在于避免极低频率、即低音被过度放大。在许多音频再现系统中,放大这种低频范围中的音频差信号可能产生具有太多低音响应的不悦耳和失真的声像。这种音频再现系统的实例包括近场或低功率音频系统,如多媒体计算机系统以及家庭立体声系统。这些系统中的巨大功率抽取(draw)可能导致高提升期间放大器“削波”,或者可能损坏音频系统的部件,包括扬声器。限制差信号的低音响应还有助于避免大多数近场音频增强应用中的这些问题。
根据一个实施例,有固定听者的音频环境中的差信号均衡的电平取决于实际扬声器的类型和它们相对于听者的位置。配合图8A和8B可以更好地说明基于这种决定的声学原理。图8A和8B旨在说明这种关于扬声器系统的方位变化的声学原理。
图8A说明具有放置得稍比听者804靠前、并朝向该听者两侧的扬声器800和802的声音再现环境的俯视图。扬声器800和802还放置在听者804下方,在类似于图2中所示扬声器246的高度位置上。参考面A和B与听者804的耳朵806和808对齐。如图所示,面A和B与听者视线平行。
扬声器的位置最好对应于扬声器810和812的位置。在一个实施例中,当扬声器无法放置在理想的位置时,可以通过选择性地均衡差信号来实现视在声像的增强,也就是说差信号的增益会随频率而变动。图7的曲线790表示实际扬声器位置对应于虚幻扬声器810和812的差信号均衡的理想电平。
低音增强本发明还提供一种用于增强音频信号的方法和系统。该声音增强系统用独特的声音增强处理来改善声音的逼真性。一般来说,声音增强处理接收两个输入信号、即左输入信号和右输入信号,然后产生两个增强后的输出信号、即左输出信号和右输出信号。
左右输入信号经共同处理而提供一对左右输出信号。具体来讲,所述增强系统实施例以拓宽和增强声音的感受带宽的方式,均衡两输入信号之间存在的差异。此外,许多实施例调整两个输入信号所共有的声音的电平,以便减少削波。有利的是,一些实施例通过不需要数字信号处理的、简化的、低成本且易于制造的模拟系统来实现声音增强。
虽然本文中这些实施例是参考一种声音增强系统来描述的,但是本发明不限于此,而是可以用在各种其它场合中,其中最好是使声音增强系统的不同实施例适合于不同情况。
典型的用于多媒体计算机、汽车、小型立体声系统、便携式立体声系统、耳机等的小型扬声器系统会具有在大约150Hz滚降的声学输出响应。图9表示近似对应于人耳的频率响应的曲线906。图9还表示典型的小型计算机扬声器系统的测量响应908,该系统采用高频驱动器(高音扬声器)来再现高频,四英寸中等范围-低音驱动器(低音扬声器)来再现中等范围和低音频率。这种采用两个驱动器的系统通常称为双路系统。采用两个以上驱动器的扬声器系统在本领域中也是常见的,也可用于本发明的实施例。单驱动器的扬声器系统也是常见的,也可用于本发明。响应特性908绘制在矩形坐标上,X轴表示从20Hz到20kHz的频率。该频带对应于正常人听觉的范围。图9的Y轴表示从0dB至-50dB的归一化幅度响应。曲线908在大约2kHz至10kHz的中等范围频带中相对平滑,而在10kHz以上表现出一些滚降。在低频范围内,曲线908呈现在大约150Hz与2kHz之间的中低音频带中开始、一直到150Hz以下的低频滚降,扬声器系统产生非常小的声音输出。
图9所示频带的位置仅用作举例而不作为限制。超低音频带、中低音频带和中等范围频带的实际频率范围根据扬声器和该扬声器使用的场合而不同。术语超低音一般用于指扬声器产生与在较高频率、如中低音频带中的扬声器输出相比、不很准确的输出的频带内的频率。术语中低音频带一般用来指超低音频带以上的频率。术语中等范围一般用来指中低音频带以上的频率。
许多纸盆型驱动器在低频产生声能时效率很低,其中纸盆直径小于声学声波的波长。当纸盆直径小于波长时,要保持从纸盆发出的声音输出的声压电平均匀,需要纸盆摆幅对于频率降低的每个倍频程按4的因子(2的因子)来增大。如果尝试通过单纯增大供给驱动器的电功率来提高低频响应,则很快就会达到驱动器纸盆的最大允许摆幅。
因此,驱动器的低频输出不能被增加得超过某个限度,这说明大多数小扬声器系统的低频声音质量不好。曲线908是大多数采用直径约4英寸的低频驱动器的小型扬声器系统的典型特征。具有较大驱动器的扬声器系统往往产生可感觉到的、低至比曲线908中所示那些还低的频率的声音输出,而具有较小低频驱动器的系统通常不产生如曲线908所示那样低的输出。
如上所述,到目前为止,系统设计人员在设计具有扩展的低频响应的扬声器系统时已经没有多少选择。先前已知的解决方案是对桌面而言太大的昂贵和伸长的扬声器。对低频问题的一个流行的解决方案是采用超低音扬声器,通常放置在靠近计算机系统的地板上。超低音扬声器可提供充分的低频输出,但是它们很昂贵,因此与廉价的桌面扬声器相比较不流行。
本发明的实施例不采用大直接纸盆的驱动器或超低音扬声器,而是利用人听觉系统的特征来产生低频声能的感觉(即使这种能量不是由扬声器系统产生的),从而克服小型系统的低频局限。
众所周知,人的听觉系统是非线性的。简单地讲,非线性系统表示输入的增加不跟随着输出的成比例增加的系统。因此,例如,在耳朵里,双倍的声压电平不产生声源的音量翻倍的感觉。实际上,人耳相当近似于平方律装置,它不是对声能的强度、而是对功率作出响应。这种听觉机构的非线性产生听上去如声波的实际频率的泛音或谐波的互调频率。
人耳的非线性的互调效应如图10所示,它说明两个纯音的理想化的幅度谱。图10中的频谱图表示对应于扬声器驱动器(例如超低音扬声器)在50Hz所产生的声能的第一谱线1004。第二谱线1002表示在60Hz处。线1004和1002是与驱动器产生的真实声能对应的实际谱线,假定不存在其它声能。然而,由于人耳固有的非线性,它会产生与两个实际谱频率之和和两个谱频率之差对应的互调产物。
例如,倾听谱线1004和1002所表示的声能的人会感受到50Hz上的声能,如谱线1006所示,60Hz上的声能如谱线1008所示,以及110Hz上的声能如谱线1010所示。谱线1010不对应于扬声器所产生的真实声能,而是对应于人耳内因人耳的非线性所产生的谱线。谱线1010出现在频率110Hz,它是两个实际谱线之和(110Hz=50Hz+60Hz)。注意,人耳的非线性还会产生在另一个频率10Hz上的谱线(10Hz=60Hz-50Hz),但是该谱线不会被感觉到,因为它低于人的听觉范围。
图10说明人耳内的互调处理,但是它比真实的节目素材、如音乐有一定的简化。典型的节目素材、如音乐的谐波很丰富,所以大多数音乐都呈现出几乎连续的频谱,如图11所示。图11表示实际声能和感觉到的声能之间的与图10所示同类的比较,只是图11中的曲线表示的是连续频谱。图11表示实际声能曲线1120和对应的感觉到的频谱1130。
对大多数非线性系统而言,当系统产生很大摆幅(例如大信号电平)而非小摆幅时,人耳的非线性更明显。因此,对于人耳来说,非线性在低频更明显,其中人耳的耳膜和其它部分产生相对较大的机械摆幅,甚至在较低音量电平下。因此,图11表示实际声能1120和感觉到的声能1130之间的差往往在较低频率范围内最大,而在较高频率范围相对较小。
如图10和图11所示,包含多个音调或频率的低频声能会在听者中产生中低音范围内的声能包含的频谱内容比实际存在的更多的感觉。人脑在面对认为丢失信息的情形下,会潜意识地尝试“填补”丢失的信息。这种填补现象是许多错觉的基础。在本发明的实施例中,可以通过向大脑提供这种低频信息的中低音效果来欺骗大脑填补并非真正存在的低频信息。
换言之,如果大脑得到要由耳朵产生的谐波,如果存在低频声能(例如谱线1010),则在适当情况下,大脑会潜意识地填补它认为“必须”存在的低频谱线1006和1008。这种填补处理通过人耳的另一种非线性效应、即所说的检波器效应得以放大。
人耳的非线性还使耳朵起检波器的作用,类似于调幅(AM)接收器中的二极管检波器。如果中低音谐音是由超低音调制的调幅波,则耳朵将对调制的中低音载波解调以再现超低音包络。图12A和图12B以图形说明调制和解调的信号。图12A在时间轴上表示包含由超低音信号调制的较高频率的载波信号(例如中低音载波)的调制信号。
较高频率信号的振幅由较低频率声音来调制,由此,较高频率信号的振幅随较低频率声音的频率而变化。耳朵的非线性会部分地解调该信号,使得耳朵检测到较高频率信号的低频包络,从而产生低频音的感觉,即使在较低频率上没有产生任何实际声能。对于上述的互调效应来说,检波器效应可以通过对中低音频率范围内的信号进行适当的信号处理来增强。利用适当的信号处理,可以设计产生低频声能的感觉的声音增强系统,即使该系统使用无法或效率低地产生这种能量的扬声器也是如此。
扬声器所产生的声能中存在的实际频率的感觉可以被认为是第一阶效应。实际声频中不存在的额外和音的感觉,无论是由互调失真还是由检波产生这种和音,都可以被认为是第二阶效应。
低音增强扩展器图13A是一种声音系统的框图,其中低音增强单元1304提供声音增强功能。低音增强单元1304从信号源1302接收音频信号。信号源1302可以是任何信号源,包括图1所示的信号处理块122。低音增强单元1304执行信号处理,修改所接收的音频信号,从而产生音频输出信号。音频输出信号可以被提供给扬声器、放大器或其它信号处理装置。
图13B是双声道低音增强单元1304的拓扑结构的框图,该单元具有第一输入端1309、第二输入端1311、第一输出端1317和第二输出端1319。第一输入端1309和第一输出端1317对应于第一声道。第二输入端1311和第二输出端1319对应于第二声道。第一输入端1309连接到组合器1310的第一输入端和信号处理块1313的输入端。信号处理块1313的输出被提供给组合器1314的第一输入端。第二输入端1311连接到组合器1310的第二输入端和信号处理块1315的输入端。信号处理块1615的输出被提供给组合器1316的第一输入端。组合器1310的输出被提供给信号处理块1312的输入端。信号处理块1312的输出被提供给组合器1314的第二输入端和组合器1316的第二输入端。组合器1314的输出被提供给第一输出端1317。第二组合器1316的输出被提供给第二输出端1319。
来自第一和第二输入端1309和1311的信号被信号处理块1312组合并处理。信号处理块1312的输出是一种信号,当该信号分别与信号处理块1313和1315的输出组合时,产生低音增强输出1317和1319。
图13C是双声道低音增强单元1344的另一种拓扑结构的框图。在图13C中,第一输入1309被提供给信号处理块1321的输入端和信号处理块1322的输入端。信号处理块1321的输出被提供给组合器1325的第一输入端,信号处理块1322的输出被提供给组合器1325的第二输入端。第二输入1311被提供给信号处理块1323的输入端和信号处理块1324的输入端。信号处理块1323的输出被提供给组合器1326的第一输入端而信号处理块1324的输出被提供给组合器1326的第二输入端。组合器1325的输出被提供给第一输出端1317而第二组合器1326的输出被提供给第二输出端1319。
不象图13B所示的拓扑结构,图13C所示的拓扑结构不组合两个输入信号1309和1311,而是保持两个声道的分离,并对各个声道执行低音增强处理。
图14是图13A所示的低音增强系统1304的一个实施例的框图1400。低音增强系统1400采用低音穿通单元1420来产生与时间相关的增强因子。图14还可以用作流程图,描述在DSP或其它实现本发明实施例的信号处理操作的处理器上运行的程序。图14表示出两个输入、即左声道输入1402和右声道输入1404。如先前的实施例一样,左右是为了方便而使用的,并非限制。输入1402和1404都被提供给加法器1406,加法器产生两输入的组合的输出。
加法器1406的输出被提供给低通滤波器1409的输入端。低通滤波器1409的输出被提供给第一带通滤波器1412、第二带通滤波器1413、第三带通滤波器1415、第四带通滤波器1411以及第五带通滤波器1414。带通滤波器1413的输出被提供给加法器1418的输入端。
带通滤波器1415的输出被提供给单刀双掷(SPDT)开关1416的第一掷向端。带通滤波器1411的输出被提供给SPDT开关1416的第二掷向端。开关1416的单刀连接到加法器1418的输入端。
带通滤波器1412的输出被提供给单刀双掷(SPDT)开关1419的第一掷向端。带通滤波器1414的输出被提供给SPDT开关1419的第二掷向端。开关1419的单刀连接到加法器1418的输入端。
加法器1418的输出连接到低音穿通单元1420的输入端。低音穿通单元1420的输出被提供给(SPDT)开关1422的第一掷向端。SPDT开关1422的第二掷向端设置成接地。SPDT开关1422的掷向端连接到左声道加法器1424的第一输入端和右声道加法器1432的第一输入端。左声道输入1402被提供给左声道加法器1424的第二输入端,而右声道输入1404被提供给右声道加法器1432的第二输入端。左声道加法器1424和右声道加法器1432的输出分别是信号处理块1400的左声道输出1430和右声道输出1433。开关1422和1416是可选的,可以由固定连接来代替。
开关1416和1419使滤波器1411-1415可以配置成三种不同的频率范围,即40-100、60-150和100-200。
滤波器1411-1415所提供的滤波操作和组合器1418可以被组合成图14所示的组合滤波器1407。例如,在另一个实施例中,滤波器1411-1415被组合成具有从约40Hz扩展到250Hz的通带的单带通滤波器。对于处理低音频率,组合滤波器1407的通带最好在低端从约20扩展到100Hz,而高端从约150扩展到350Hz。组合滤波器1407可具有其它滤波器传递函数,包括例如高通滤波器、倾斜(shelving)滤波器等。组合滤波器还可以这样配置,以类似于图形均衡器的方式工作,并且减弱与其通带内其它频率有关的其通带内的一些频率。
如图所示,图14近似地对应于图13B中所示的拓扑结构,其中信号处理块1313和1315具有的传递函数为一,信号处理块1312包括组合滤波器1407和低音穿通单元1420。但是,图14中所示的信号处理不限于图13B中所示的拓扑结构。图14的部件也可以用在图13C所示的拓扑结构中,其中信号处理块1321和1323的传递函数为一,信号处理块1322和1324包括组合滤波器1407和低音穿通单元1420。虽然图14中未示出,但是信号处理块1313、1315、1321和1323可以设置附加的信号处理、例如高通滤波用以除去低音频率,高通滤波用以除去低音穿通单元1402所处理的频率,高频加重用以增强高频声音,附加中低音处理用以补充低音穿通系统等。也可设想其它的组合。
图15是表示带通滤波器1411-1413、1415的传递函数的一般形状的频域曲线。图15表示带通传递函数1501-1505,它们分别对应于带通滤波器1411-1416。传递函数1501-1505分别表示为中央位于40、60、100、150和200Hz的带通函数。
在一个实施例中,带通滤波器1411被调到100Hz以下的频率,如40Hz。当开关1416在对应于第一掷向端的第一位置时,它选择带通滤波器1411而不选择带通滤波器1415,从而提供40、60和100Hz处的带通滤波器。当开关1416在对应于第二掷向端的第二位置时,它不选择带通滤波器1411而选择带通滤波器1415,从而提供60、100和150Hz上的带通滤波器。
因此,开关1416最好允许用户选择要增强的频率范围。具有提供小低音扬声器、如约3至4英寸直径的低音扬声器的扬声器系统的用户通常选择分别调到40、60、100和150Hz的带通滤波器1412-1413、1415所提供的较高频率范围。具有设置稍大低音扬声器、如约5英寸直径的低音扬声器的扬声器系统的用户通常选择分别调到40、60、100和150Hz的带通滤波器1411-1413、1515所提供的较低频率范围。本专业的技术人员应当认识到,可以设置更多开关来实现更多带通滤波器和更多频率范围的选择。选择不同带通滤波器提供不同频率范围是一种理想的技术,因为带通滤波器并不昂贵,而且不同的带通滤波器可以用单掷开关来选择。
在一个实施例中,低音穿通单元1420采用自动增益控制(AGC),它包括具有内部伺服反馈回路的线性放大器。伺服机构自动调整输出信号的平均振幅,以匹配控制输入的信号的平均振幅。控制输入的平均振幅一般通过检测控制信号的包络来获取。控制信号还可以通过其它方法获取,包括例如低通滤波、带通滤波、峰值检测、RMS(均方根)平均、平均数平均等。
响应提供给低音穿通单元1420输入端的信号的包络振幅的增大,伺服回路会提高低音穿通单元1420的正向增益。相反,响应提供给低音穿通单元1420输入端的信号的包络振幅的减小,伺服回路会降低低音穿通单元1420的正向增益。在一个实施例中,低音穿通单元1420的增益提高比增益降低快。图16是说明响应单位阶跃输入的低音穿通单元1420的增益的时域曲线。本领域的技术人员会知道图16是作为时间的函数的增益的曲线图,而不是作为时间的函数的输出信号。大多数放大器具有固定的增益,所以很少绘制增益的曲线图。但是,低音穿通单元1420中的自动增益控制(AGC)会响应输入信号的包络而改变低音穿通单元1420的增益。
单位阶跃输入被绘制为曲线1609,而增益被绘制为曲线1602。响应输入脉冲1609的前沿,在对应于增高时间常数的时段1604内,增益上升。在时段1604结尾,增益1602达到稳态增益A0。响应输入脉冲1609的后沿,在对应于衰减时间常数1606的时段内,增益回落到零。
增高时间常数1604和衰减时间常数1606最好这样选择,从而提供低音频率的增强,而不会过度驱动系统的其它部件、如放大器和扬声器。图17是乐器(低音吉他、低音鼓、电子合成器等)所演奏的典型低音符的时域曲线1700。曲线1700表示其振幅是由具有调制包络1742的较低频率部分所调制的较高频率部分1740。包络1742具有增高部分1746,然后是衰减部分1747,然后是持续部分1748,随后是释放部分1749。曲线1700的最大振幅在峰值1750,出现在增高部分1746和衰减部分1747之间的时间点。
正如所述,波形1744若不是大多数、也是许多乐器的典型波形。例如,当拉动并释放吉它的弦线时,起初产生若干大幅度的振动,然后稳定在更大或更小的稳定状态的振动,并慢慢地经过长时间衰减。吉它的弦线初始大振幅振动对应于增高部分1746和衰减部分1747。慢慢衰减的振动对应于持续部分1748和释放部分1749。钢琴琴弦被弹击钢琴键的锤体撞击时也以类似的方式动作。
钢琴琴弦可能具有更明显的从持续部分1748到释放部分1749的过渡,因为在钢琴键被释放之前,锤体不返回而停留在琴弦上。当按下琴键时,在持续时段1748内,琴弦自由振动,且有相对较小的衰减。在释放时段1749内,当钢琴键被释放时,毛毡覆盖的锤体停留在钢琴键上并迅速使琴弦振动衰减掉。
同样地,当鼓膜被撞击时,会产生一组初始大振幅的振动,对应于增高部分1746和衰减部分1747。在大振幅振动逐渐减弱(对应于衰减部分1717的结尾)之后,鼓膜继续振动一段对应于持续部分1748和释放部分1749的时间。许多乐器声音只要通过控制时段1746-2049的长度就可以创造。
如结合图12A所描述的,较高频信号的振幅由较低频音(包络)来调制,由此较高频信号的振幅随较低频音的频率而变化。耳朵的非线性将部分地解调该信号,所以耳朵会检测到较高频信号的低频包络,从而产生低频音的感觉,即使在低频上并没有任何实际声能产生。这种检波器效应可以通过对中低音频率范围内的信号进行适当的信号处理来增强,通常在该范围的低端上是50-150Hz和在范围的高端上是200-500Hz。利用适当的信号处理,可以设计一种声音增强系统,即使使用的是无法产生这种能量的扬声器,也产生低频声能的感觉。
扬声器所产生的声能中存在的实际频率的感觉可以被认为是第一阶效应。实际声频中不存在的额外谐音的感觉,无论是互调失真所产生的还是检波所产生的这种谐音可以被认为是第二阶效应。
但是,如果峰值1750的振幅太高,则扬声器(和可能是功率放大器)将被过度驱动。过度驱动的扬声器将导致相当大的失真,且可能损坏扬声器。
低音穿通单元1420最好在中低音区提供增强的低音,同时降低峰值1750的过度驱动效应。由低音穿通单元1420提供的增高时间常数1604限制了通过低音穿通单元1420的增益的上升时间。低音穿通单元1420的增高时间常数对长的增高时段1746(慢包络上升时间)的波长的影响相对较小,而对短增高时段1746(快包络上升时间)的波长的影响相对较大。
具有峰值压缩的低音穿通低音乐器(例如低音吉它)演奏出的音符的增高部分通常以相对较高振幅的初始脉冲开始。某些情况下,这种峰值可能过度驱动放大器或扬声器,导致失真的声音,且可能损坏扬声器或放大器。低音增强处理器在低音信号中提供峰值的展平,同时增加低音信号的能量,从而增强整体低音感。
信号中的能量是信号的振幅与信号的持续时间的函数。换言之,能量与信号包络下的面积成正比。虽然低音音苻的初始脉冲可能具有相对较大的振幅,但是该脉冲往往包含较小的能量,因为它的持续时间短。因此,能量小的初始脉冲常常产生不了明显的低音感。因此,通常可降低初始脉冲的振幅,而不会明显地影响低音感。
图16是低音增强系统1800的信号处理块示意图,该系统利用峰值压缩器控制脉冲幅度、如初始脉冲、低音符来提供低音增强。在系统1800中,峰值压缩器1802介于组合器1418和穿通单元1420之间。组合器1418的输出被提供给峰值压缩器1802的输入端,峰值压缩器1802的输出被提供给低音穿通单元1420的输入端。
涉及图14至图13B和图13C的上述说明也适用于图18所示的拓扑结构。例如,如图所示,图18近似地对应于图13B中所示的拓扑结构,其中信号处理块1313和1315具有为一的传递函数,信号处理块1312包括组合滤波器1407、峰值压缩器1802和低音穿通单元1420。但是,图18所示的信号处理并不局限于图13B中所示的拓扑结构。图18的部件也可以用在图13C所示的拓扑结构中。虽然图18中未示出,但是信号处理块1313、1315、1321和1323可以设置附加的信号处理,例如,高通滤波用以除去低音频率,高通滤波用以除去低音穿通装置1402和压缩器1802所处理的频率,高频加重用以增强高频声音,附加中低音处理用以补充低音穿通系统1420和峰值压缩器1802等。也可以设想其它组合。
峰值压缩器1802“展平”在其输入端提供的信号的包络。对于大振幅的输入信号,降低压缩装置1802的视在增益。对于小振幅的输入信号,升高压缩装置1802的视在增益。因此,压缩装置降低输入信号包络的峰值(填充输入信号包络中的凹进部分)。无论在压缩器装置1802的输入端提供什么信号,从压缩装置1802输出的信号的包络(例如平均振幅)都具有相对均匀的振幅。
图19是说明峰值压缩器对具有相对较高振幅的初始脉冲的包络的影响的时域曲线图。图19表示输入包络1914的时域曲线图,它具有初始大振幅的脉冲,随后是较长时间的较低振幅的信号。输出包络1916表示低音穿通单元1420对输入包络1914的影响(不使用峰值压缩器1802的情况)。输出包络1917表示使输入信号1914通过峰值压缩器1802和穿通单元1420的影响。
如图19所示,假定输入信号1914的振幅足以导致过度驱动放大器或扬声器,低音穿通装置不限制输入信号1914的最大振幅,因此输出信号1916也足以过度驱动放大器或扬声器。
但是,引脚对信号1917使用的脉冲压缩装置1802压缩大的振幅脉冲(降低大振幅脉冲的振幅)。压缩装置1802检测输入信号1914的大振幅幅度并压缩(降低)最大振幅,使得输出信号1917过度驱动放大器或扬声器的可能性很小。
因为压缩装置1802降低信号的最大振幅,所以可能增加穿通单元1420提供的增益,而不会明显降低输出信号1917过度驱动放大器或扬声器的可能性。信号1917对应于已增加了低音穿通单元1420的增益的实施例。因此,在较长的衰减部分期间,信号1917具有比曲线1916大的振幅。
如上所述,信号1914、1916和1917中的能量与表示各个信号的曲线下的面积成正比。信号1917具有更多能量,因为即使它具有较小的最大振幅,但是表示信号1917的曲线下的面积比起信号1914或1916来大一些。因为信号1917包含更多的能量,所以听者将感觉到信号1917中的更多低音。
因此,将峰值压缩器与低音穿通单元1420组合使用使低音增强系统可以在低音信号中提供更多的能量,同时降低增强的低音信号过度驱动放大器或扬声器的可能性。
立体声像增强本发明还提供一种利用独特的差动透视校正系统提高声音的逼真感(尤其在声场的水平方面)的方法和系统。一般来说,差动透视校正装置接收两个输入信号,左输入信号和右输入信号,然后产生两个增强的输出信号,图5所示的左输出信号和右输出信号。
共同处理左右输入信号,提供一对空间校正后的左右输出信号。具体来说,一个实施例以拓宽和增强听者感觉的声音的方式均衡两个输入信号之间存在的差。此外,一个实施例还调整两个输入信号所共有的声音的电平,以便减少削波。有利的是,一个实施例利用简化、低成本和易于制造的电路来实现声音增强,而不需要处理图5所示的共有信号和差信号的分立电路。
虽然这些实施例在此处是参考各种声音增强系统来说明的,但是本发明不限于此,而是可以用于各种其它场合,其中最好使声音增强系统的不同实施例适合于不同情况。为了便于本发明的全面理解,详细描述的其余部分编排成下列章节和小节图20是根据第一输入信号2010和第二输入信号2012的差动透视校正装置2002的框图。在一个实施例中,第一和第二输入信号2010和2012是立体声信号;但是第一和第二输入信号2010和2012不必是立体声信号,也可包括各种音频信号。正如下面的详细说明,差动透视校正装置2002以不同于第一和第二输入信号2010和2012不共有的音频声信息的方式,修改第一和第二输入信号2010和2012所共有的音频声信息。
第一和第二输入信号2010和2012所共有的音频信息称为共模信息或共模信号(未示出)。在一个实施例中,共模信息不以离散信号的形式存在。因此,术语共模信号通用于本详细说明,在概念上指任何瞬间同时存在于第一和第二输入信号2010和2012中的音频信息。例如,如果1伏信号同时被施加到第一和第二输入信号2010和2012,则共模信号包括1伏。
共模特性块2020中在概念上说明了共模信号的调整。共模特性块2020表示共模信号的变化。一个实施例降低共模信号的频率的振幅,以便降低可能因高振幅输入信号而导致的削波。
相反,第一和第二输入信号2010和2012所不共有的音频信息称为差动信息或差动信号(未示出)。在一个实施例中,差动信号不是离散的信号,而在本详细说明中,差动信号指表示第一和第二输入信息2010和2012之间的差的音频信息。例如,如果第一输入信号2010为0伏而第二输入信号2012为2伏,则差动信号是2伏(两个输入信号2010和2012之差)。
在差模特性块2022中在概念上说明了对差动信号的修改。正如下面详细描述的,差动透视校正装置2002均衡差动信号中所选择的频带。即,一个实施例以不同于共模信号中的音频信息的方式均衡差动信号中的音频信息。
差动透视校正装置2002利用各种滤波器在频谱上对差模特性块2022中的差动信号进行整形,产生均衡的差动信号。通过均衡差动信号内的所选频带,差动透视校正装置2002拓宽从设在听者前方的一对扬声器投射的感觉声像。
再者,虽然共模特性块2020和差模特性块2022在概念上表示为分离的块,但是一个实施例利用单个的专门适合的系统来完成这些功能。因此,一个实施例同时处理共模和差动音频信息。有利的是,一个实施例不需要复杂的电路来将音频输入信号分离成共模信号和差动信号。此外,一个实施例无需混合器来重新组合处理后的共模信号和处理后的差动信号,而产生一组增强的输出信号。
然后,差动透视校正装置2002连接到一个或多个输出缓冲器2006。输出缓冲器2006输出增强的第一输出信号2030和第二输出信号2032。正如下面详细讨论的,输出缓冲器2006将差动透视校正装置2002与连接到第一和第二输出信号2030和2032的其它元件隔离。例如,第一和第二输出信号2030和2032可以接入其它音频装置,如记录装置、功率放大器、一对扬声器等,而不改变差动透视校正装置2002的操作。
图21是利用差动放大器提供图20所示的差动透视校正的系统的框图。在图21中,第一输入2010被提供给第一差动放大器2102的非反相输入端和分频阻抗块2106的第一输入端。第二输入端2012连接到第二差动放大器2104的非反相输入端和分频阻抗块2106的第二端子。第一差动放大器2102的非反相输入连接到分频阻抗块2107的第一端子和第一反馈阻抗2108的第一端子。第一差动放大器2102的输出被提供给第一输出端2030和第一反馈阻抗2108的第二端子。第二差动放大器2104的非反相输入连接到分频阻抗块2107的第二端子和第二反馈阻抗2108的第一端子。第二差动放大器2104的输出被提供给第二输出端2032和第二反馈阻抗2109的第二端子。
各个块2106、2107、2108和2109的阻抗通常是与频率相关的,可以利用例如电阻、电容和/或电感构成滤波器。在一个实施例中,阻抗2108和2106不是与频率相关的。
图22是振幅-频率图表,说明左右输出端2030和2032上的共模增益。共模增益用第一共模增益曲线2200表示。如共模增益曲线2200所示,约130赫兹(Hz)以下的频率比大约130Hz以上的频率被去加重得更多。对于约130Hz以上的频率,频率按约6分贝均匀地减小。
图23说明第一和第二分频网络2106和2107的组合产生的整体校正曲线2300。整体校正曲线2300内各种频率的近似相关增益值可以参考零(0)dB来测量。
借助此参考,整体校正曲线2300由两个转折点(标为点A和点B)来定义。在点A上(一个实施例中约为2125Hz),校正曲线的斜率从正值变为负值。在点B上(在一个实施例中约为21.8kHz),校正曲线的斜率从负值变为正值。
因此,约2125Hz以下的频率相对于2125Hz附近的频率被去加重。具体来讲,在2125Hz以下,整体校正曲线2300的增益以每个倍频程约6dB的速率降低。对2125Hz以下的信号频率的去加重防止了很低频率(即低音)被过度加重。在许多音频再现系统中,相对于较高频率过度加重这种低频范围中的音频信号可能产生低音响应太强的不悦耳和失真的声像。再者,过度加重这些频率可能损坏各种音频部件,包括扬声器。
在点A和B之间,一个整体校正曲线的斜率是负值。即,约2125Hz与约21.8kHz之间的频率相对于2125Hz附近的频率被去加重。由此,与点A与点B之间的频率相关的增益以可变速率向约21.8kHz处的最大均衡点-8dB降低。
在21.8kHz以上,增益以可变速率增大,直到大约120kHz,即约为人耳可听见的最高频率。也就是说,约21.8kHz以上的频率相对于21.8kHz附近的频率被加重。因此,与点B以上的频率相关的增益向着120kHz以可变速率升高。
这些相对增益和频率值仅仅为了设计目的,而实际的数字可能会随系统改变而改变。再者,在不违背本发明精神的前提下,增益和频率值可以随声音的类型或用户喜好而改变。例如,改变分频网络的数量和改变各个分频网络内的电阻和电容值,使整体透视校正曲线2300可以适合于再现声音的类型。
差动信号的选择性均衡增强了差动信号中存在的环境音或混响音效果。如上所述,差动信号中的频率易于在现场声场中在适当电平被感觉到。愦憾的是,在播放记录的表演时,声像并不提供相同的现场表演的360度效果。但是,利用差动透视校正装置2002均衡差动信号的频率,可以显著地拓宽所投射的声像,从而通过一对设在听者前方的扬声器再现现场表演的体验。
根据整体校正曲线2300的差动信号的均衡是为了去加重相对于较高强度信号分量、在统计上较低强度的信号分量。典型音频信号的较高强度差动信号分量出现在约2至4kHz之间的中等范围频率上。在此频率范围中,人耳具有提高的灵敏性。因此,增强的左右输出信号产生更为改善的音频效果。
在其他实施例中,分频网络的数量和分频网络内的元件可以改变,以便模拟所谓的头部传递函数(HRTF)。头部传递函数描述用于调整一对扬声器产生的声音的不同信号均衡技术,以便考虑到声音被左右耳朵感觉到所花的时间。有利的是,可以将基于HRTF的传递函数运用于差动信号来定位渗透音效,以便创造充分渗透的定位声场。
在1974年12月第56卷第6期的J.Acoust.Soc.Am.中E.A.B.Shaw的题为”水平面上从自由场到耳膜的声压电平的转换”的文章、以及1977年6月第61卷第6期的J,Acoust.Soc.Am.中由S.Mehrgardt和V.Mellert所著的题为”人外耳的转换特性”的文章中,描述了可用于实现某种感觉到的方位角的HRTF传递函数的实例,就象完整地给出一样,将二者通过引用结合于此。
单芯片实现图24是可以在单芯片上实现的声音增强系统2400的一个实施例的框图。如结合以上图1-23所描述的,系统2400包括垂直声像增强块2402、低音增强块2404和垂直声像增强块2406。至系统2400的外部连接是通过连接引脚P1-P27来提供的。正电源电压提供给引脚P25,负电源电压提供给引脚P26,以及地线接到引脚P27。压缩耦合电容2421的第一端子提供给引脚P10而压缩耦合电容2421的第二端子提供给引脚P11。压缩延迟电容2420的第一端子提供给引脚P13,压缩延迟电容2420的第二端子提供给引脚P14。宽度控制电阻2430的第一端子提供给引脚P19,宽度控制电阻2430的第二端子提供给引脚P20。宽度控制电阻2431的第一端子提供给引脚P21,宽度控制电阻2431的第二端子提供给引脚P22。在一个实施例中,宽度控制电阻2430和2431是可变电阻。
图25A是垂直声像增强块2402的左声道的示意图。图25B是垂直声像增强块2402的右声道的示意图。在图25A中,左声道输入提供给引脚P2,而左声道旁路输入提供给引脚P1。引脚P1提供给电阻2501的第一端子。电阻2501的第二端子提供给电阻2502的第一端子和电容2503的第一端子。引脚P2提供给电阻2504的第一端子和电容2505的第一端子。电容2505的第二端子提供给电阻2506的第一端子和电阻2507的第一端子。电阻2506的第二端子接地。
电阻2502的第二端子连接到电容2503的第二端子、电阻2504的第二端子、电阻2507的第二端子、电阻2508的第一端子以及运算放大器(opamp)2510的反相输入端。opamp 2510的非反相输入端接地。电阻2508的第二端子连接到电阻2509的第一端子和电容2612的第一端子。电阻2509的第二端子连接到电容2512的第二端子,opamp 2510的输出端和左声道输出端2511。
在一个实施例中,电阻2501为9.09k欧姆,电阻2502为27.4k欧姆,电容2503为0.1μf,电阻2504为22.6k欧姆,电容2505为0.1μf,电阻2506为3.01k欧姆,电阻2507为4.99k欧姆,电阻2508为9.09k欧姆,电阻2509为27.4k欧姆,电容2512为0.1μf以及opamp 2510为TL074型或等效物。
图25B所示的左声道类似于图25A所示的右声道,具有来自引脚P3的旁路输入、来自P4的右声道输入和右声道输出2514。
图26是低音增强块2404的示意图。来自图25A的左声道输出2511连接到电阻2601的第一端子和电阻2611的第一端子。来自图25B的右声道输出2514连接到电阻2602的第一端子和电阻2614的第一端子。
电阻2601的第二端子提供给电阻2602的第二端子、电阻2625的第一端子以及电容2603的第一端子。电容2603的第二端子接地。电阻2625的第二端子提供给opamp 2606的反相输入端、电容2605的第一端子以及电阻2604的第一端子。opamp 2606的非反相输入端接地。opamp 2606的输出端连接到电阻2604的第二端子、电容2605的第二端子以及滤波器块2607的输入端(细节如图27所示)。滤波器块2607的第一、第二和第三输出连接到opamp 2608的反相输入端和电阻2609的第一端子。opamp 2608的非反相输入端接地。opamp2608的输出连接到电阻2609的第二端子以及引脚P10。
引脚P19也接到压缩器2610的输入端(细节如图28所示)。压缩器2610的输出连接到引脚P12。引脚P12被接到引脚P16。引脚P16被接到电阻2612的第一端子和电阻2613的第一端子。
电阻2612的第二端子被接到电阻2611的第二端子、opamp 2620的反相输入端以及电阻2619的第一端子。opamp 2620的非反相输入端接地。opamp 2620的输出连接到电阻2619的第二端子和电阻2621的第一端子。电阻2621的第二端子连接到引脚P17。opamp 2620的输出也被作为左声道输出2630提供。
电阻2613的第二端子连接到电阻2614的第二端子、opamp 2615的反相输入端以及电阻2617的第一端子。opamp 2615的非反相输入端接地。opamp 2615的输出连接到电阻2617的第二端子和电阻2618的第一端子。电阻2618的第二端子连接到引脚P18。opamp 2615的输出也被作为右声道输出2631提供。
在一个实施例中,电阻2601、2602以及2604为43.2k欧姆,电容2603为0.022μf,电阻2625为21.5k欧姆,电容2605为0.01μf。在一个实施例中,电阻2609为100k欧姆,电阻2611、2612、2613、2614、2617以及2619为10k欧姆,以及电阻2618和2621为200欧姆。在一个实施例中,opamp 2606、2608、2615以及2620为TL074型或等效物。
图27是滤波器系统2607的示意图。在图27中,输入被提供给电阻2701-2704的第一端子。电阻2701的第二端子连接到电阻2710的第一端子、电容2721的第一端子以及电容2720的第一端子。电容2721的第二端子连接到电阻2722的第一端子和opamp 2732的反相输入端。opamp 2732的非反相输入端接地。opamp 2732的输出连接到电容2720的第二端子、电阻2722的第二端子以及电阻2723的第一端子。电阻2723的第二端子连接到第一滤波器输出端。
电阻2702的第二端子连接到电阻2712的第一端子和引脚P5。电阻2712的第二端子接地。
电阻2703的第二端子连接到电阻2713的第一端子和引脚P7。电阻2713的第二端子接地。
引脚P6接到电容2724的第一端子和电容2728的第一端子。电容2728的第二端子连接到电阻2725的第一端子、电阻2726的第一端以及opamp 2729的反相输入端。opamp 2729的非反相输入端接地。opamp 2729的输出连接到电容2724的第二端子、电阻2726的第二端子以及电阻2730的第一端子。电容2724的第二端子连接到引脚P8。电阻2725的第二端子连接到引脚P9。电阻2730的第二端子连接到第二滤波器输出端。
当引脚P5短接到引脚P6而引脚P8与P9断开时,第二滤波器输出端是低频输出端(例如40Hz)。当引脚P7短接到引脚P6而引脚P8短接到P9时,第二滤波器输出端是高频输出端(例如150Hz)。
电阻2704的第二端子连接到电阻2714的第一端子、电容2731的第一端子以及电容2735的第一端子。电容2735的第二端子连接到电阻2734的第一端子和opamp 2736的反相输入端。opamp 2736的非反相输入端接地。opamp 2736的输出连接到电容2731的第二端子、电阻2734的第二端子以及电阻2737的第一端子。电阻2737的第二端子连接到第三滤波器输出端。
在一个实施例中,第一滤波器输出端是中心位于100Hz的带通滤波器,第三滤波器输出端是中心位于60Hz的带通滤波器,以及第二滤波器输出端是中心位于40Hz或150Hz的带通滤波器(如上所述)。
在一个实施例中,电阻2701为31.6kΩ,电阻2702为56.2kΩ,电阻2703为21kΩ,电阻2704为37.4kΩ,电阻2710为4.53kΩ,电阻2712为13kΩ,电阻2713为3.09kΩ,电阻2714为8.87kΩ,电阻2722为63.4kΩ,电阻2723为100kΩ、电阻2725为57.6kΩ,电阻2726为158kΩ,电阻2730为100kΩ,电阻2734为107kΩ以及电阻2737为100kΩ。在一个实施例中,电容2720、2721、2724、2728、2731以及2735为0.1μf。在一个实施例中,opamp 2732、2729以及2736为TL074型或等效物。
图28是压缩器2610的示意图。压缩器2610包括峰值检波器2804、偏置电路2802、增益控制块2806以及输出缓冲器2810。峰值检波器构建于二极管2810和二极管2811周围。偏置电路构建于晶体管2820和齐纳二极管2816周围。增益控制电路构建于FET(场效应晶体管)2814周围。输出缓冲器构建于opamp 2824周围。
至压缩器2610的输入设在引脚P10。引脚P10接到电阻2827的第一端子。电阻2827的第二端子连接到FET 2814的漏极和电阻2822的第一端子。电阻2822的第二端子连接到opamp 2824的反相输入端和电阻2823的第一端子。opamp 2824的非反相输入端接地。opamp 2824的输出连接到电阻2823的第二端子和引脚P12。引脚P12是压缩器2616的输出端。
FET 2814的源极接地。FET 2814的栅极接到电阻2813的第一端子、电阻2815的第一端子以及引脚P13。引脚P14接到电阻2815的第二端子。
电阻2813的第二端子接到二极管2811的阴极。二极管2811的阳极接到二极管2810的阴极和引脚P11。二极管2810的阳极接到电阻2812的第一端。电阻2812的第二端子接到引脚P14。
引脚P14也接到电阻2818的第一端子和PNP晶体管2820的发射极。电阻2818的第二端子接地。PNP晶体管2820的基极接到电阻2817的第一端子和电阻2819的第一端子。电阻2817的第二端子接地。PNP晶体管2820的集电极接到电阻2819的第二端子、齐纳二极管2816的阳极和引脚P15。齐纳二极管2816的阴极接地。引脚P15被这样设置,从而使限流偏置电阻可以连接在齐纳二极管与负电源电压之间。
连接在P10与P11之间的电容2421把输入交流耦合到峰值检波器电路。连在P13和P14之间的电容2420为压缩器的启动提供延迟时间常数。
在一个实施例中,二极管2810和2811是1N4148型或等效物。在一个实施例中,FET 2814是2N3819型或等效物,PNP晶体管2820是2N2907型或等效物,而齐纳二极管2816是3.3伏齐纳二极管(1N746A或等效物)。在一个实施例中,opamp 2824是TL074型或等效物。电容2420是DC块,电容2421设定压缩延迟。在一个实施例中,电阻2812为1kΩ,电阻2813为10kΩ,电阻2815为100kΩ,电阻2817为4.12kΩ,电阻2818为1.2kΩ,电阻2819为806Ω,电阻2822为10kΩ,电阻2827为1kΩ以及电阻2823为100kΩ。
增益控制块2806作为电压受控的分压器。该分压器由电阻2827和FET 2814的漏极-源极电阻构成。FET 2814的漏极-源极电阻由施加于FET 2814的栅极的电压控制。输出缓冲器2810放大电压受控分压器所产生的电压(即FET 2814的漏极上的电压),并在引脚P12上提供输出电压。偏置电路2802使FET 2814偏置到线性运算区。峰值检波电路2804检测引脚P10处提供的信号的峰值振幅,并降低增益控制2806的“增益”(通过改变FET 2814的漏极-源极电阻),作为对峰值振幅增加的响应。
图29是水平声像增强块2406的示意图。在块2406中,来自低音模块2404的左声道信号2630连接到电阻2903的第一端子和电阻2901的第一端子。电阻2901的第二端子接地。来自低音模块2404的右声道信号2631被提供给电阻2904的第一端子和电阻2902的第一端子。电阻2902的第二端子接地。
电阻2903的第二端子连接到电阻2905的第一端子和opamp 2914的非反相输入端。电阻2904的第二端子连接到电容2906的第一端子和opamp 2912的非反相输入端。电容2906的第二端子连接到电阻2905的第二端子。
opamp 2912的反相输入端连接到电容2911的第一端子、电容2907的第一端子、电容2910的第一端子以及引脚P21。opamp 2912的输出端连接到电阻2913的第一端子、引脚P22以及电容2911的第二端子。
opamp 2914的反相输入端连接到电容2915的第一端子、引脚P19、电阻2908的第一端子以及电阻2909的第一端子。电阻2909的第二端子连接到电容2910的第二端子。电阻2908的第二端子连接到电容2907的第二端子。opamp 2914的输出端连接到电阻2917的第一端子、引脚P20以及电容2915的第二端子。
电阻2913的第二端子连接到引脚P24作为右声道输出。电阻2917的第二端子连接到引脚P23作为左声道输出。连在引脚P19和P20之间的可变电阻2430控制左声道的视在空间声像宽度。连在引脚P21和P22之间的可变电阻2431控制右声道的视在空间声像宽度。在一个实施例中,可变电阻2930和2931以机械方式连接,使得改变一个电阻也会改变另一个。
在一个实施例中,电阻2901和2902为100kΩ,电阻2903和2904为10kΩ,电阻2905为8.66kΩ,电阻2908为15kΩ,电阻2909为30.1kΩ,以及电阻2917和2913为200Ω。在一个实施例中,电容2906为O.018μf,电容2907为0.001μf,电容2910为0.082μf以及电容2915和2911为22pf。在一个实施例中,可变电阻2430和2431具有100k欧姆的最大电阻。在一个实施例中,opamp为TL074型或等效物。
图30是校正系统3000的示意图,可以用作立体声像增强系统124。系统3000包括差动放大器,它提供共模特性3020和差模特性3022。
系统3000包括两个晶体管3010和3012;多个电容3020、3022、3024、3026和3028;以及多个电阻3040、3042、3044、3046、3048、3050、3052、3054、3056、3058、3060、3062和3064。位于晶体管3010和3012之间的是三个分频网络3070、3072和3074。第一分频网络3070包括电阻3060和电容3024。第二分频网络3072包括电阻3062和电容3026,第三分频网络3074包括电阻3064和电容3028。
左输入端3000(LEFT IN)通过电容3020和电阻3040向晶体管3010的基极提供左输入信号。电源Vcc3040通过电阻3046连接到晶体管3010的基极。电源Vcc3040还通过电阻3046连接到晶体管3010的集电极。晶体管3010的基极还通过电阻3044连接到地3041,同时晶体管3010的发射极通过电阻3048连接到地3041。
电容3020是去耦电容,它提供左输入端3000上的输入信号的直流(DC)隔离。另一方面,电阻3042、3044、3046和3048构成提供晶体管3010稳定操作的偏置电路。具体来说,电阻3042和3044设置晶体管3010的基极电压。电阻3046与第三分频网络3074组合在一起,设置晶体管3010的集电极至发射极电压的直流值。电阻3048与第一和第二分频网络3070和3072组合在一起,设置晶体管3010的发射极的DC电流。
在一个实施例中,晶体管3010是NPN 2N2222A晶体管,它通常从各种晶体管制造商处都可得到。电容3020为0.22微法。电阻3040为22千欧(kΩ),电阻3042为41.2kΩ,电阻3046为10kΩ以及电阻3048为6.8kΩ。但是,本领域的技术人员应当知道可以采用具有不同值的各种晶体管、电容和电阻。
右输入端3002通过电容3022和电阻3050向晶体管3012的基极提供右输入信号。电源Vcc3040通过电阻3052连接到晶体管3012的基极。电源Vcc3040还通过电阻3056连接到晶体管3012的集电极。晶体管3012的基极还通过电阻3054连接到地3041,而晶体管3012的发射极通过电阻3058连接到地线3041。
电容3022是去耦电容,它提供右输入端3002处输入信号的直流(DC)隔离。另一方面,电阻3052、3054、3056和3058构成提供晶体管3012稳定操作的偏置电路。具体来说,电阻3052和3054设定晶体管3012的基极电压。电阻3056与第三分频网络3074组合在一起设定晶体管3012的集电极至发射极电压的直流值。电阻3058与第一和第二分频网络3070和3072组合在一起设定晶体管3012的发射极的DC电流。
在一个实施例中,晶体管3012是NPN 2N2222A晶体管,它通常可从各种晶体管制造商处获得。电容3022为0.22微法。电阻3050为22千欧(kΩ),电阻3052为41.2kΩ,电阻3056为10kΩ以及电阻3048为6.8kΩ。但是,本领域的技术人员会知道可以采用具有不同值的各种晶体管、电容和电阻。
系统3000产生两种电压增益共模电压增益和差动电压增益。共模电压增益是左右输入端3000和3002所共有的电压的变化。差动增益是因施加于左右输入端3000和3002的电压之差而引起的输出电压的变化。
在系统3000中,共模增益被这样设计,以便降低可能由高振幅输入信号导致的削波。在一个实施例中,左输出端3004上的共模增益主要由电阻3040、3042、3044、3046和3048定义。在一个实施例中,共模增益约为6分贝。
约30赫兹(Hz)以下的频率比约30Hz以上的频率被去加重得更多。对于约30Hz以上的频率,各频率按约6分贝均匀地减小。
但是,对于给定的实施方案,共模增益可以因改变电阻3040、3042、3044、3050、3052和3054的值而改变。
左右输出端3004和3006之间的差动增益主要由电阻3046和3048之比、电阻3056和3058之比、以及三个分频网络3070、3072和3074来定义。如以下更详细讨论的,一个实施例均衡差动输入中的某些频率范围。因此,差动增益是根据左右输入信号的频率而变化的。
因为分频网络3070、3072和3074均衡差动输入中的各频率范围,可改变差动信号中的频率,而不影响共模信号中的各频率。因此,一个实施例可以完全独特和新颖的方式创建增强的音频声音。此外,差动透视校正装置102可以更简单和成本更低地实现许多其它的音频增强系统。
现在讨论三个分频网络3070、3072和3074,分频网络3070、3072和3074充当在频谱上对差动信号整形的滤波器。通常滤波器的特征就是具有截止频率,它将频率的通带与频率的阻带分隔开。截止频率是标记通带的边缘和向阻带过渡的开始的频率。通常,截止频率是相对于通带中其它频率去加重三个分贝的频率。频率的通带是通过滤波器而基本上没有均衡或衰减的那些频率。另一方面,频率的阻带是滤波器均衡或衰减了的那些频率。
图31表示只具有第一分频网络3070的本发明的一个实施例。第一分频网络3070包括电阻3060和电容3024,它将晶体管3010和3012的发射极互连。因为第一分频网络3070均衡频谱的较低部分中的频率,所以称为高通滤波器。在一个实施例中,电阻3060的值约为27.01kΩ而电容3024的值约为0.68微法。
电阻3060和电容3024的值经选择以定义低频范围中的截止频率。在一个实施例中,截止频率约为78Hz,阻带在约78Hz以下,通带在约78Hz以上。约78Hz以下的频率被相对于约78Hz以上的频率去加重。但是,因为第一分频网络3070只是一阶滤波器,所以定义截止频率的各频率是设计目标。对于给定的实施方案,实际的特征频率可以改变。此外,可以为电阻3060和电容3024选择其它值来改变截止频率,以便去加重其它期望的频率。
图32是具有第二和第三分频网络的差动透视校正装置3200的示意图。和第一分频网络3070一样,第二分频网络3072最好也是一种均衡差动信号中某些频率的滤波器。但是,不同于第一分频网络3070的是,第二分频网络3072是高通滤波器,它相对于差动信号中的较高频率去加重差动信号中的较低频率。
如图32所示,第二分频网络3072将晶体管3010和3012的发射极互连。此外,第二分频网络3072包括电阻3062和电容3026。最好是,电阻3062的值约为1kΩ而电容3026的值约为0.01微法。
选择这些值以定义高频范围中的截止频率。在一个实施例中,截止频率为大约15.9千赫(kHz)。约15.9kHz以下的阻带中的频率被相对于15.9kHz以上的通带中的频率去加重。
但是,因为第二分频网络3072与第一分频网络3070一样,是一阶滤波器,所以定义通带的各频率才是设计目的。对于给定的实施方案,实际的特征频率可以改变。再者,可以为电阻3062和电容3026选择其它的值来去加重其它所需的频率。
现在参考图27,第三分频网络3074将晶体管3010和3012的集电极互连。第三分频网络3074包括电阻3064和电容3028,它们经选择以构成对中等范围频率以上的频率去加重的低通滤波器。在一个实施例中,低通滤波器的截止频率约为795Hz。最好是,电阻3064的值约为9.09kΩ而电容3028的值约为0.022微法。
在由第三分频网络3074产生的校正中,约795Hz以上的阻带中的频率被相对于约795Hz以下的通带中的频率去加重。如上所述,因为第三分频网络3074只是一阶滤波器,在第三分频网络3074中定义低通滤波器的频率才是设计目的。对于给定的实施方案,这些频率可以改变。再者,可以为电阻3064和电容3028选择其它值来改变截止频率,以便去加重其它所需的频率。
在操作中,第一、第二和第三分频网络3070、3072和3074组合起来对差动信号在频谱上整形。
整体校正曲线2300(如图23所示)由两个转折点(标为点A和点B)来定义。在点A上(一个实施例中约为125Hz),校正曲线的斜率从正值变为负值。在点B上(在一个实施例中约为1.8kHz),校正曲线从负值变为正值。
因此,约125Hz以下的频率相对于125Hz附近的频率被去加重。具体来讲,在125Hz以下,整体校正曲线800的增益以每个倍频程约6dB的速率降低。对125Hz以下的信号频率的去加重防止了很低频率(即低音)被过度加重。在许多音频再现系统中,相对于较高频率过度加重这种低频范围中的音频信号可能产生具有太强低音响应的不悦耳和失真的声像。再者,过度加重这些频率可能损坏各种音频部件,包括扬声器。
在点A和B之间,一个整体校正曲线的斜率是负值。即,约125Hz与约1.8kHz之间的频率相对于125Hz附近的频率被去加重。因此,与点A和点B之间频率相关的增益以可变速率降低到在约1.8kHz的最大均衡点-8dB。
在1.8kHz以上,增益以可变的速率升高,直到约20kHz,即约为人耳可听见的最高频率。也就是说,约1.8kHz以上的频率相对于1.8kHz附近的频率被加重。由此,与点B以上的频率相关的增益向着20kHz以可变速率增加。
这些相对增益和频率值仅仅出于设计目标,而实际的数字可能会因系统的不同而不同。再者,在不违背本发明精神的前提下,增益和频率值可以根据声音类型或用户喜好而改变。例如,改变分频网络的数量和改变各个分频网络内的电阻和电容值,使整体透视校正曲线2300适合于再现声音的类型。
差动信号的选择性均衡增强了差动信号中存在的环境音或混响音效果。如上所述,差动信号中的频率易于在现场声场中在适当电平下感觉到。遗憾的是,在播放记录的表演时,声像并不提供与现场表演相同的360度效果。但是,通过均衡差动信号的频率,可以显著地拓宽所投射的声像,以便通过一对设在听者前方的扬声器再现现场表演的体验。
根据整体校正曲线2300的差动信号的均衡是为了去加重相对于较高强度信号分量、统计上较低强度的信号分量。在约1至4kHz之间的中等范围的频率中会见到典型音频信号的较高强度差动信号分量。在此频率范围中,人耳具有被加强的敏感性。因此,增强的左右输出信号产生更为改善的音频效果。
分频网络的数目和分频网络内的分量在另一个实施例中可以改变,以便模拟头部传递函数(HRTF)。有利的是,可以将基于HRTF的传递函数运用于差动信号以定位渗透音效(immersive sound),以便创造充分渗透定位的声场。
图33表示允许用户改变整体差动增益量的差动透视校正装置3300。在此实施例中,第四分频网络3301将晶体管3010和3012的发射极互连。在此实施例中,第四分频网络3301包括可变电阻3302。
可变电阻3302充当电平调整装置,最好是电位器或类似可变电阻的装置。改变可变电阻3302的电阻值升高和降低整个透视校正电路的相关均衡。可变电阻的调整通常是人工方式进行,使得用户可以根据再现声音的类型和依据用户的个人喜好改变差动增益的电平和方面(aspect)。通常,差动信号的整体电平的降低会减少环境声音信息,从而创造变窄的声像感。
图34说明使用户可以改变共模增益量的差动透视校正装置3400。差动透视校正装置3400包含第四分频网络3401。第四分频网络3401包括电阻3402、电阻3404、电容3406以及可变电阻3408。电容3406除去差动信息,并使可变电阻3402和电阻3404可以改变共模增益。
电阻3402和3404可以是随所需的共模增益范围而定的各种各样的值。另一方面,可变电阻3408充当电平调整装置,在所需范围内调整共模增益。理想的是,可变电阻3408是电位器或类似的可变电阻的装置。改变可变电阻3408的电阻会相同程度地影响晶体管3010和3012,从而升高和降低整体共模增益的相对均衡。
可变电阻的调整通常以人工方式进行,使得用户可以定制共模增益的电平和特征。共模增益的增加加重了输入信号3002和3004所共有的音频信息。例如,在声音系统中增加共模增益将加重一对扬声器之间的中央舞台处的音频信息。
图35说明差动透视校正装置3500,它具有位于晶体管3010和3012的发射极之间的第一分频网络3501和位于晶体管3010和3012的集电级之间的第二分频网络3502。
第一分频网络3501是去加重频谱的较低部分中的频率的高通滤波器。在此实施例中,第一分频网络3501包括电阻3510和电容3512。电阻3510和电容3512的值经选择以定义截止频率约为350Hz的高通滤波器。因此,电阻3510的值约为27.01kΩ而电容3512的值约为0.15微法。在操作中,30Hz以下的频率相对于350Hz以上的频率被去加重。
第二分频网络3502将晶体管3010和3012的集电极互连。第二分频网络3502是去加重频谱的较低部分中的频率的低通滤波器。在此实施例中,第二分频网络3502包括电阻3520和电容3522。
电阻3520和电容3522的值经选择,以定义截止频率约27.3kHz的低通滤波器。因此,电阻3520的值约为9.09kΩ而电容3522的值约为0.0075微法。在工作中,27.3kHz以上的频率被相对于27.3kHz以下的频率去加重。
第一和第二分频网络3501和3502进行组合,在频谱上对差动信号整形。约5kHz以下的频率相对于5kHz附近的频率被去加重。具体来讲,在5kHz以下,整体校正的增益以每个倍频程约5dB的速率增加。再者,在5kHz以上,整体校正曲线1400的增益也以每个倍频程约5dB的速率减小。
差动透视校正装置的上述实施例还可以包括如图36所示的输出缓冲器3630。输出缓冲器3600被这样设计,以便将透视校正差动装置与连接到左右输出端3004和3006的电路中存在的负载变化隔离开。例如,当左右输出端3004和3006连接到一对扬声器时,扬声器的阻抗负载不会改变差动透视校正装置均衡差动信号的方式。因此,没有输出缓冲器3630,电路、扬声器以及其它元件会影响差动透视校正装置102均衡差动信号的方式。
在一个实施例中,左输出缓冲器3630A包括左输出晶体管3601、电阻3604以及电容3604。电源Vcc 3040直接连接到晶体管3601的集电极。晶体管3601的集电极通过电阻3604连接到地3041和通过电容3602连接到左输出端3004。此外,晶体管3601的基极连接到晶体管3010的集电极。
在一个实施例中,晶体管3601是NPN 2N2222A晶体管,电阻3604为1kΩ,而电容3602为0.22微法。电阻3604、电容3602和晶体管3601构成单位增益。也就是说,左输出缓冲器3630A主要将增强的声音信号传送到左输出端3004,而不进一步均衡所增强的声音信号。
同样地,一个右输出缓冲器3630B包括右输出晶体管3610、电阻3612和电容3614。电源Vcc 3040直接连接到晶体管3610的集电极。晶体管3610的集电极通过电阻3612连接到地3041和通过电容3614连接到右输出端。此外,晶体管3610的基极与晶体管3012的集电极连接。
在一个实施例中,晶体管3610是NPN 2N2222A晶体管,电阻3612为1kΩ,而电容3614为0.22微法。电阻3612、电容3614和晶体管3610产生单位增益。也就是说,右输出缓冲器3630B主要将增强的声音信号传送到右输出端3006,而不均衡所增强的声音信号。
本领域的技术人员应当明白,输出缓冲器3630还可以利用其它放大器、例如opamp等来实现。
图37表示立体声像增强处理器124的另一个实施例。在图37中,左输入2630被提供给电阻3710的第一端子、电阻3716的第一端子以及电阻3740的第一端子。电阻3710的第二端子连接到电阻3711的第一端子和opamp 3712的非反相输入端。右输入2631被提供给电阻3713的第一端子、电阻3741的第一端子以及电阻3746的第一端子。电阻3713的第二端子连接到电阻3714的第一端子和opamp3712的非反相输入端。电阻3714的第二端子接地。电阻3740的第二端子和电阻3741的第二端子连接到opamp 3744的非反相输入端、电阻3742的第一端子。电阻3742的第二端子接地。
opamp 3744的输出被提供给电阻3761的第一端子。电阻3761的第二端子连接到opamp 3744的反相输入端。电阻3743的第二端子接地。回到opamp 3712,opamp 3712的输出被提供给电阻3711的第二端子。opamp 3712的输出还被提供给电阻3715的第一端子。电阻3715的第二端子连接到电容3717的第一端子。电容3717的第二端子连接到电阻3718的第一端子、电阻3719的第一端子、电容3721的第一端子以及电阻3722的第一端子。电阻3718的第二端子接地。电阻3719的第二端子连接到电阻3720的第二端子以及电阻3725的第二端子。电阻3721的第二端子连接到电阻3720的第一端子和电阻3723的第一端子。电阻3722的第二端子连接到电阻3725的第一端子和电容3724的第一端子。电阻3723的第二端子和电容3724的第二端子都接地。
电阻3719的第二端子也提供给电阻3726的第一端子和opamp3727的反相输入端。opamp 3727的非反相输入端接地。电阻3726的第二端子连接到opamp 3727的输出端。opamp 3727的输出端连接到电位器3728的第一固定端。电位器3728的第二固定端接地。电位器3728的滑动片连接到电阻3747的第一端子和电阻3720的第一端子。
opamp 3744的输出端连接到电位器3745的第一固定端。电位器3745的第二固定端接地。电位器3745的滑动片连接到电阻3730的第一端子和电阻3751的第一端子。电阻3747的第二端子连接到电阻3748的第一端子和opamp 3749的反相输入端。
opamp 3749的非反相输入端接地。opamp 3749的输出端连接到电阻3748的第二端子和电阻3750的第一端子。电阻3750的第二端子连接到电阻3729的第二端子。电阻3730的第二端子连接到opamp3753的非反相输入端。电阻3731的第一端子还连接到opamp 3735的非反相输入端。电阻3731的第二端子接地。opamp 3735的非反相输入端连接到电阻3734的第一端子和电阻3732的第一端子。电阻3732的第二端子接地。opamp 3735的输出端连接到电阻3734的第二端子。电阻3750的第二端子、电阻3751的第二端子、电阻3746的第二端子以及电阻3752的第一端子都连接到opamp 3755的非反相输入端。电阻3752的第二端子接地。opamp 3755的非反相输入端连接到电阻3753的第一端子和电阻3754的第一端子。opamp 3755的输出端连接到电阻3754的第二端子。
opamp 3735的输出作为左声道输出提供,opamp 3755的输出作为右声道输出提供。
电阻3710、3711、3713、3714、3740、3741、3742、3743、37和3761均为33.2kΩ的电阻。电阻3716和3746均为80.6kΩ。电位器3745和3728均为10.0K线性电位器。电阻3715为1.0K,电容3717为0.47μf,电阻3718为4.42K,电阻3719为121K,电容3721为0.0047μf,电阻3720为47.5K,电阻3722为1.5K,电阻3723为3.74K,电阻3725为33.2K以及电容3724为0.47μf。电阻3726为121K。电阻3747和3748均为16.2K。电阻3729和3750均为11.5K。电阻3730和3751均为37.9K。电阻3731、3732、3752和3753均为16.2K。电阻3734和3754均为38.3K。opamp 3712、3744、3727、3749、3735和3755均为TL074型或等效物。
数字信号处理器的实现声校正系统还可以容易地在如结合图3所描述的软件中实现。适当的处理器包括通用处理器、数字信号处理器(DSP)等。
图38是声校正系统120的软件实施例的框图。在图38中,左声道输入3801设在10db衰减器3803的输入端。衰减器3803的输出被提供给滤波器3804的输入端和DPDT(双刀双掷)开关3805的第一掷向端。滤波器3804的输出被提供给开关3806的第二掷向端。右声道输入3802被提供给10db衰减器3806的输入端。衰减器3806的输出被提供给滤波器3807的输入端和开关3805的第一掷向端。滤波器3807的输出被提供给开关3805的第二掷向端。
开关3805的第一刀(pole)连接到加法器3828的第一输入端和加法器3808的第一输入端。开关3805的第二刀连接到加法器3829的第一输入端和加法器3808的第二输入端。加法器3808的输出被提供给低通滤波器3809的输入端。低通滤波器3809的输出被提供给双带带通滤波器3810的输入端、双带带通滤波器3811的输入端以及100Hz带通滤波器3812的输入端。
滤波器3810的输出被提供给加法器3821的第一输入端,滤波器3811的输出被提供给加法器3821的第二输入端,滤波器3812的输出被提供给加法器3812的第三输入端。加法器3821的输出被提供给2.75dB放大器3863的输入端、乘法器3824的第一输入端以及绝对值块3822的输入端。绝对值块3822的输出被提供给“快速增高慢速衰减(FASD)压缩器3823的输入端。FASD压缩器3823的输出被提供给乘法器3824的第二输入端。
放大器3863的输出被提供给减法器3825的正输入端。乘法器3824的输出被提供给减法器3825的负输入端。减法器3825的输出被提供给乘法器3826的第一输入端。低音控制3827的输出被提供给乘法器3826的第二输入端。乘法器3826的输出通过SPDT开关3860连接到加法器3828的第二输入端和加法器3829的第二输入端。
加法器3828的输出被提供给加法器3830的第一输入端、9dB衰减器3833的输入端、减法器3837的正输入端以及DPDT开关3836的第一掷向端。加法器3829的输出被提供给减法器3837的负输入端、加法器3830的第二输入端、9dB衰减器3834的输入端以及开关3836的第一掷向端。
加法器3838的输出被提供给5dB衰减器3832的输入端。衰减器3832的输出被提供给加法器3835的第一输入端和加法器3866的第一输入端。衰减器3833的输出被提供给加法器3835的第二输入端。衰减器3834的输出被提供给加法器3866的第二输入端。加法器3835的输出被提供给开关3836的第二掷向端。加法器3866的输出被提供给开关3836的第二掷向端。
减法器3837的输出被提供给48Hz高通滤波器3838的输入端。高通滤波器3838的输出被提供给6dB衰减器3840的输入端、7kHz高通滤波器3841的输入端和200Hz低通滤波器3842的输入端。衰减器3840的输出被提供给加法器3844的第一输入端,高通滤波器3841的输出被提供给加法器3844的第二输入端,低通滤波器3842的输出通过3db衰减器3843被提供给加法器3844的第三输入端。加法器3844的输出被提供给乘法器3845的第一输入端。宽度控制3846的输出被提供给乘法器3845的第二输入端。乘法器3845的输出被提供给加法器3835的第三输入端,以及通过反相器(即,-1的增益)被提供给加法器3866的第三输入端。
开关3836的第一刀连接到左声道输出3850。开关3836的第二刀连接到右输出3851。
如图38所示,左右立体声输入信号分别被提供给左右输入3803和3802。对于处理的低音增强部分(对应于图1所示的低音增强块101),左右声道通过加法器3808加在一起,被处理为单声道信号,然后通过加法器3828和3829加回到左右声道,从而形成增强的立体声信号。低音信息被处理为单声道信号,因为低音频率信号中通常立体声分离很少,所以很少需要重复处理两个声道。
图38说明软件用户控制包括软件控制3827,用于控制低音增强的量;软件控制3846,用于控制视在声场的宽度;以及软件开关3805、3260和3836,用于分别启动或关闭垂直、低音和宽度声像增强。根据应用的不同,这些用户控制可以或者动态地更改或者固定为特定配置。用户控制可以被“连接”到诸如对话框中的滑动块、复选框等的控件,使用户可以控制声校正系统的操作。
在图38中,左右输入3801和3802首先利用-10dB的增益进行处理,从而设置旁路电平和防止信号在以后的处理过程中饱和。然后,各声道被通过提升滤波器(分别用于左右声道的滤波器3804和3807)进行处理,所述滤波器执行结合图4-6所描述的声场的提升和扩展。
在提升滤波器之后,左右声道被混合在一起,并通过低通滤波器3809,随后通过带通滤波器组3810-3112。低通滤波器3809具有284Hz的截止频率。随后的四个滤波器3810-3112都是二阶带通滤波器。滤波器3810可选择为40Hz或150Hz。滤波器3811可选择为60Hz或200Hz。因此,对于扬声器的规格有三种可用配置小、中和大。所有三种配置采用三个带通滤波器,但是滤波器3810和3811的中心频率不同。
然后三个有源滤波器的输出被加法器3821加在一起,和被提供给低音控制级。
低音控制级包括具有绝对值检波器3822的扩展器电路、快速增高慢速衰减峰值检波器3823以及乘法器3824。峰值检波器3823的输出被用作扩展器输入信号的乘数,以便扩展信号的动态范围。
低音控制级的第二部分从放大器3863所施加的具有2.75dB增益的相同输入信号中减去该级的输入信号的扩展形式。这具有限制高振幅信号的电平的效果,同时将小的恒定增益加到较低振幅的信号上。
低音控制级的输出分别通过加法器3828和3829被加到左右声道信号中。混合到左右声道中的增强的低音信号的量由低音控制3827来确定。
然后通过加法器3830将所得到的左右声道信号加在一起,形成L+R信号,再通过减法器3837相减,形成L-R信号。将L-R信号通过透视曲线(见图7)进行处理以在频谱上对其整形,所述曲线是用如下的滤波器网络和增益调整来实现的。首先,信号通过48Hz高通滤波器3838。然后,此滤波器的输出被分割并通过7kHz高通滤波器3841和200Hz低通滤波器3842。然后三个滤波器输出通过加法器3844相加,利用如下增益调整形成透视曲线信号-6dB用于48Hz高通滤波器3838、0dB(不调整)用于7kHz高通滤波器3841以及+3dB用于200Hz低通滤波器3842。宽度控制3846确定通过最后的加法器3835和3866的透视曲线信号的量。
最后,左声道、右声道、L+R和L-R信号通过加法器3835和3866混合,分别产生最终的左和右声道输出。左声道输出是通过将-5dB增益调整的L+R信号、-9dB增益调整的左声道信号以及没有增益调整(除宽度控制3846提供的增益调整之外)的透视曲线信号混合而形成的。右声道输出是通过将-5dB增益调整的L+R信号、-9dB增益调整的右声道以及没有增益调整(除宽度控制之外)的反相透视曲线信号混合而形成的。
快速增高慢速衰减(FASD)峰值检波器3823的算法用伪码表示如下if[in>out(previous)]thenout=in-{[in-out(previous)]*attack}elseout=in+{[out(previous)-in]*decay}endif其中out(previous)表示来自前一抽样周期的输出。
增高和衰减的值与抽样率相关,因为转换速率必定与实际时间相关。它们各自的公式如下增高=1-(1/(0.01*抽样率))衰减=1-(1/(0.1*抽样率))其中抽样率以样值数/秒为单位。
至FASD峰值检波器3123的输入总是大于或等于零,因为它来自绝对值函数3122的输出。
滤波器3809-3812以无穷脉冲响应(IIR)滤波器的形式在44.1kHz的抽样频率下实现。这些滤波器是采用双线性变换法设计的。每个滤波器是具有一个区间(section)的二阶滤波器。这些滤波器是采用32位小数定点算法实现的。各个滤波器的特定信息在如下表1中给出。此外,滤波器3810至3812的传递函数分别如图32至35所示。附加的200Hz带通滤波器(图31中未示出)的传递函数如图36所示。低通滤波器3809的传递函数如图37所示。带通滤波器
表1低音控制3827确定施加到音频信号的低音增强量,并向乘法器3826提供0到1之间的值。
宽度控制3846确定施加到最终输出的立体声宽度增强量。宽度控制向乘法器3845提供0到2.82(9dB)之间的值。
其它实施例此处公开的整个声校正系统可以容易地通过运行在DSP或个人计算机上的软件、通过分立电路元件来实现,如混合电路结构或者在具有用于调整适当外部元件的端子的半导体衬底内。由用户完成的调整目前包括低频和高频能量校正的电平、包括和信号与差信号的电平的各种信号电平的调整以及取向调整。
通过前面的描述和附图,已经说明本发明具有超过当前声校正和立体声增强系统的重要优点。虽然上述详细描述已表明、描述和指出了本发明的主要的新颖特征,但是应当理解,本领域的技术人员在不违背本发明精神的前提下,可以对所述装置的形式和细节进行各种修改、替换和更改。因此,本发明应该仅由以下权利要求书来限定其范围。
权利要求
1.一种音频校正系统,它用于增强由两个或两个以上扬声器再现的声音的空间和频率响应特性,所述音频校正系统包括声像校正模块,它被配置成当多个扬声器再现声音时、校正所述声音的感觉的垂直声像;低音增强模块,它被配置成当多个扬声器再现所述声音时、增强所述声音的感觉的低音响应;以及声像增强模块,它被配置成当多个扬声器再现声音时、增强所述声音的水平声像。
2.如权利要求1所述的音频校正系统,其特征在于所述声像校正模块所提供的校正先于所述低音增强模块所提供的增强。
3.如权利要求1所述的音频校正系统,其特征在于所述低音增强模块所提供的低音增强先于所述声像增强模块所提供的声像增强。
4.如权利要求1所述的音频校正系统,其特征在于所述低音增强模块所提供的低音增强先于所述声像增强模块所提供的声像增强。
5.一种声像增强系统,它包括至少两个音频信号,所述音频信号具有所述各音频信号共有的共模信息和所述各音频信号不共有的差动信息;与所述音频信号之一联系的第一放大器,所述第一放大器具有反相输入端和非反相输入端;与所述音频信号之一联系的第二放大器,所述第二放大器具有反相输入端和非反相输入端;与所述第一放大器的所述非反相输入端和所述第二放大器的所述非反相输入端联系的第一滤波器,所述第一滤波器被配置成在所述差动信息中的第一组频率上进行修改;与所述第一放大器的所述反相输入端和所述第二放大器的所述反相输入端联系的第二滤波器,所述第二滤波器被配置成修改第二组频率;与所述第一放大器的所述反相输入端和所述第一放大器的输出端联系的第三滤波器,所述第三滤波器被配置成修改第三组频率,其中把所述第一、第二和第三组频率组合而形成第一增强输出信号;以及与所述第二放大器的所述反相输入端和所述第二放大器的输出端联系的第四滤波器,所述第四滤波器被配置成修改第四组频率,其中把所述第一、第二和第四组频率组合而形成第二增强输出信号。
6.一种声音增强系统,它包括第一声音增强模块,它被配置成校正由多个扬声器再现的视在声场的感觉的高度;第二声音增强模块,它被配置成校正所述扬声器的感觉的低音响应;以及第三声音增强模块,它被配置成校正所述视在声场的感觉的宽度。
7.如权利要求6所述的声音增强系统,其特征在于所述第一声音增强模块还被配置成校正所述视在声场的感觉的垂直位置。
8.如权利要求6所述的声音增强系统,其特征在于所述第一声音增强模块包括左声道滤波器和右声道滤波器,前者用以对左信号通道中的声音进行滤波,后者被配置成对右信号通道中的声音进行滤波。
9.如权利要求8所述的声音增强系统,其特征在于所述左声道滤波器和所述右声道滤波器被这样配置,以便根据与声源的垂直位置有函数关系的人听觉系统的频率响应的变化,对所述左右声道进行滤波。
10.如权利要求8所述的声音增强系统,其特征在于所述左声道滤波器和所述右声道滤波器被配置成相对于较高频率、加重较低频率。
11.如权利要求6所述的声音增强系统,其特征在于所述第二声音增强模块被配置成相对于较高频率、加重较低频率的部分。
12.如权利要求6所述的声音增强系统,其特征在于所述第二声音增强模块被配置成接收多个输入信号,并且相对于所述输入信号的较高频率,加重所述输入信号的较低频率的共模部分。
13.如权利要求6所述的声音增强系统,其特征在于所述第二声音增强模块包括第一组合器,它被配置成将左声道信号的至少一部分与右声道信号的至少一部分组合,从而产生组合信号;滤波器,它被配置成选择所述组合信号的一部分而产生滤波信号;可变增益模块,它被配置成响应所述滤波信号的包络,调整所述滤波信号,从而产生低音增强信号;第二组合器,它被配置成将所述低音增强信号的至少一部分与所述左声道信号组合;以及第三组合器,它被配置成将所述低音增强信号的至少一部分与所述右声道信号组合。
14.如权利要求10所述的声音增强系统,其特征在于所述可变增益模块包括扩展器。
15.如权利要求10所述的声音增强系统,其特征在于所述可变增益模块包括压缩器。
16.如权利要求6所述的声音增强系统,其特征在于所述第三声音增强模块被配置成接收包括左声道输入和右声道输入的输入信号,所述第三声音增强模块还被配置成响应所述输入信号的共模部分、提供共模特性,以及响应所述输入信号的差模部分、提供差模特性。
17.如权利要求6所述的声音增强系统,其特征在于所述第三声音增强模块被配置成提供共模传递函数和差模传递函数。
18.如权利要求17所述的声音增强系统,其特征在于所述差模传递函数相对于较高频率加重较低频率。
19.如权利要求17所述的声音增强系统,其特征在于所述差模传递函数被配置成对第一频带中的频率分量提供第一去加重,对第二频带中的频率分量提供第二去加重,对第三频带中的频率分量提供第三去加重,以及对第四频带中的频率分量提供第四去加重,所述第一频带低于所述第二频带,所述第二频带低于所述第三频带,所述第三频带低于所述第四频带,所述第二去加重小于所述第一去加重和所述第三去加重。
20.一种增强音频声音、从而改善所感觉的声场和改善所感觉的所述声音的低音分量的方法,它包括如下操作对声音信号进行高度校正,从而提高由多个扬声器再现的视在声场的感觉的高度;对声音信号进行低音增强,增强所感觉的所述扬声器的低音响应;对多声道声音信号进行宽度校正,拓宽所述多声道声音信号产生的视在声场的感觉的宽度。
21.如权利要求21所述的方法,其特征在于所述高度校正操作包括对所述声音信号进行滤波,从而改变听者所听到的所述视在声场的感觉的垂直位置。
22.如权利要求21所述的方法,其特征在于所述高度校正操作包括对左信号通道中的信号进行滤波和对右信号通道中的信号进行滤波的操作。
23.如权利要求22所述的方法,其特征在于所述滤波操作包括根据人听觉的垂直空间频率响应的变化、调整所述左信号通道和所述右信号通道的频率分量。
24.如权利要求22所述的方法,其特征在于所述滤波操作包括相对于较高频率加重较低频率。
25.如权利要求20所述的方法,其特征在于所述低音增强操作包括相对于较高频率加重较低频率的部分。
26.如权利要求20所述的方法,其特征在于所述低音增强操作包括相对于多声道输入信号的较高频率、加重所述多声道输入信号的较低频率的共模部分。
27.如权利要求20所述的方法,其特征在于,所述低音增强操作包括如下操作将左声道信号的至少一部分与右声道信号的至少一部分组合,从而产生组合信号;对所述组合信号进行滤波,从而产生滤波信号;根据所述滤波信号的包络放大所述滤波信号,从而产生低音增强信号;将所述低音增强信号的至少一部分与所述左声道信号组合;以及将所述低音增强信号的至少一部分与所述右声道信号组合。
28.如权利要求27所述的方法,其特征在于所述放大操作包括压缩增高时段内的所述滤波信号。
29.如权利要求27所述的方法,其特征在于所述放大操作包括扩展衰减时段内的所述滤波信号。
30.如权利要求20所述的方法,其特征在于,所述宽度增强操作包括以下的操作识别所述多声道声音信号的共模部分,并根据共模特性调整所述共模部分;以及识别所述多声道声音信号的差模部分,并根据差模特性调整所述差模部分。
31.如权利要求20所述的方法,其特征在于所述宽度增强操作包括对所述多声道声音信号运用共模传递函数和应用差模传递函数。
32.如权利要求31所述的声音增强系统,其特征在于所述运用差模传递函数的操作包括相对于较高频率加重较低频率的操作。
33.如权利要求31所述的声音增强系统,其特征在于所述运用差模传递函数的操作包括根据第一去加重值去加重第一频带中的频率分量;根据第二去加重值去加重第二频带中的频率分量,所述第二频带的频率高于所述第一频带的频率;根据第三去加重值去加重第三频带中的频率分量,所述第三频带的频率高于所述第二频带的频率,所述第二去加重值相对小于所述第一去加重值和所述第三去加重值;以及根据第四去加重值去加重第四频带中的频率分量,所述第四频带的频率高于所述第三频带的频率,所述第四去加重值相对小于所述第一去加重值和所述第三去加重值。
34.一种声音增强系统,它包括高度校正器,用于校正视在声场的感觉的高度;低音增强器,用于增强声音信号的低音响应;宽度校正器,用于校正所述视在声场的感觉的宽度。
35.一种声音增强系统,它包括高度校正器,用于校正视在声场的感觉的高度;用于增强声音信号的低音响应的装置;宽度校正器,用于校正所述视在声场的感觉的宽度。
36.一种声音增强系统,它包括高度校正器,用于校正视在声场的感觉的高度;低音增强器,用于增强低音响应;用于校正所述视在声场的感觉的宽度的装置。
全文摘要
声校正装置(120)处理一对左右输入信号(126,128),以便补偿当所述输入信号(126,128)通过声音系统中的扬声器(246,247)再现时的作为频率的函数的空间失真。左右输入信号(126,128)的声能被分离到第一低频范围和第二高频范围中并在其中进行校正。所得的信号再重新组合而产生声像校正的音频信号(130、132),它们在通过声音系统的扬声器(246,247)再现时具有所期望的声压响应。所期望的声压响应产生相对于听者(250)的视在声像位置。还可在空间上增强声像校正信号(130,132),从而拓宽通过小扬声器播放时的视在声像和改善声音的低频特性。
文档编号H04R5/00GK1402956SQ00816594
公开日2003年3月12日 申请日期2000年10月4日 优先权日1999年10月4日
发明者T·C·K·袁, A·D·克雷默, R·奥利弗 申请人:Srs实验室公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1