用于增强声音的方法和系统的制作方法

文档序号:6362223阅读:243来源:国知局
专利名称:用于增强声音的方法和系统的制作方法
技术领域
本发明涉及一种增强由听众听到的声音的方法,并且更具体地,涉及用于通过在紧邻他或她的耳朵处添加与通常源于主表演区附近的主声音信号同步的补充声学信号,来增强在表演时由观众成员(在此也被称为“听众”)听到的主声音信号的质量的系统和方法。
背景技术
音频事件如音乐会、演讲等经常在大型场所如体育场、公园、竞技场等中举行。由于场所的大小及其声学特性,因此在这样的事件下将音频递送给听众是一项挑战。在大型场所中,对音频进行广播的扬声器可以布置在理想的位置以将音频递送给观众成员。其他的场所可以简单地将多排扬声器布置在舞台上或者舞台附近。尽管仔细地布置了扬声器,但是被观众成员听到的声音的质量可能不如期望的好。已经提出了许多用于增强观众成员在音频事件中听到的声音的质量的传统的设备和系统。例如,Saliterman的美国专利第7,110,552号描述了一种被设计成收集在事件中产生的声学信号、无线传输这些声学信号并且将这些声学信号再现给在事件中戴着耳机的多个听众的系统,但是该系统没有尝试来补偿声音的传播延迟。Oltman等人的美国专利第5,619,582号和第5,822,440号二者以及Simon的美国专利第7,995,770号描述了确实经由耳机在听众的耳朵处增加了无线传输的补充声学信号的系统,其中,补充信号还被延迟以补偿还直接到达听众的耳朵处的主声学信号的传播延迟。

发明内容
根据本发明的一个示例性方面,提供有一种增强声学信号的方法。该方法包括通过使用电子设备中的麦克风来感测声学信号。声学信号响应于主声音信号而被发出并且作为音波通过空间传输。该方法还包括通过使用电子设备中的天线来接收编码有主声音信号的无线信号。基于感测到的声学信号和被编码在接收到的无线信号中的主声音信号来估计空间的脉冲响应。基于估计出的脉冲响应来计算被感测到的声学信号与被编码在接收到的无线信号中的主声音信号之间的延迟。通过使用计算出的延迟对被编码在接收到的无线信号中的主声音信号进行延迟以及再现,以增强被电子设备的用户听到的声学信号。根据本发明的另一个示例性方面,提供有一种用于增强声学信号的设备。该设备包括麦克风、天线、处理器、延迟线和输出端。麦克风 被配置成用于感测声学信号,该声学信号响应于主声音信号而被发出并且作为声波通过空间传输。天线被配置成用于接收编码有主声音信号的无线信号。处理器被配置成用于基于感测到的声学信号和被编码在接收到的无线信号中的主声音信号来估计空间的脉冲响应。处理器还被配置成用于基于估计出的脉冲响应来计算感测到的声学信号与被编码在接收到的无线信号中的主声音信号之间的延迟。延迟线通过使用计算出的延迟来延迟被编码在接收到的无线信号中的主声音信号。经由输出端输出经延迟的主声音信号。根据本发明的又一个示例性方面,提供有一种被编程有软件指令的计算机可读介质。软件指令在由处理器执行时使得处理器基于感测到的声学信号和被编码在接收到的无线信号中的主声音信号来估计空间的脉冲响应。软件指令还使得处理器基于估计出的脉冲响应来计算感测到的声学信号与被编码在接收到的无线信号中的主声音信号之间的延迟并且输出所计算出的延迟以用于延迟被编码在接收到的无线信号中的主声音信号。


为了图示,在附图中示出了本发明的某些实施方式。在附图中,贯穿附图,同样的数字始终指示同样的元素。然而,应该理解的是,发明不限于示出的确切布置、尺寸和乐器。在附图中:图1示出了根据本发明的示例性实施方式的用于将音频递送给听众的示例性系统,该系统包括一个或更多个音频源、用于混合和处理一个或更多个音频源的混声器、一个或更多个主扬声器以及用于增强通过一个或更多个主扬声器广播的音频的声音增强设备;图2示出 了图1中的根据本发明的示例性实施方式的声音增强设备的示例性实施方式,该声音增强设备使用下述延迟搜索方法进行编程,该延迟搜索算法计算要针对干音频信号施加的延迟,使得干音频信号与湿音频信号同步;图3示出了根据本发明的示例性实施方式的大的声学空间的期望脉冲响应的示例性对数曲线;图4A和图4B示出了根据本发明的示例性实施方式的图2的延迟搜索算法的示例性实施方式;图5A示出了根据本发明的示例性实施方式的图3的期望脉冲响应的示例性线形曲线;图5B示出了根据本发明的示例性实施方式的测量出的脉冲响应的示例性曲线;图5C示出了根据本发明的示例性实施方式图5B的测量出的脉冲响应在通过高通滤波器之后的示例性曲线;以及图示出了根据本发明的示例性实施方式图5B的测量出的脉冲响应在通过低通滤波器之后的示例性曲线。
具体实施例方式上述的用于增强声音的质量的传统的设备和系统具有各种缺点。Saliterman的系统限于在其中收集到的原始声音信号不够大得足以经由直接声学传播通过空气到达每一个听众的耳朵的情况下使用。否则,可能受到显著的传播延迟的直达声学声音和在耳机中再现的无延迟的声音当在听众的耳朵混合时会感知不好。以上讨论的由Oltman等人和由Simon描述的系统依赖于使用无线定位测量方法来测量和/或计算从主声学源到听众的物理距离。根据该物理距离,系统使用声音通过空气的传播速度的某个假定值来计算传播延迟的估计。这样的无线定位测量方法实际上实现起来是困难且昂贵的,并且其精确度较低。不少见的是无线定位测量方法仅精确到被定位的目标的约10英尺的半径范围内,这会仅由于这一个误差源而产生所计算的传播延迟的大约+/-9毫秒的误差。发出主声音的主声学源的位置对于由Oltman等人和Simon描述的系统的类型的精确度来说也是重要的。典型的大型音乐会声音系统可以包含50个或者更多个单独的扬声器,每一个扬声器以特定的方式被定位且定向成以足够的声级在大的观众区域上精确地再现声音。上述基于位置的系统应该以某种方式测量和存储这些扬声器中的每一个扬声器的位置并且设法确定哪一个扬声器或哪些扬声器正在对给定的听众正在听的大部分声音进行广播。仅选出与听众在物理上距离最近的扬声器不是问题,这是因为大多数扩声扬声器不是全向的。它们特意地尤其是在人耳最敏感的3kHz附近的频率处具有高定向性,以使得扩音器的声音可以对准特定的收听区域处,以设法减小来自预期的收听区域的外部的物体如墙、天花板、玻璃窗等的使声音衰减的回响和回声。在这些基于位置的系统中,听众有可能在正对听众的距离听众100英尺的扬声器提供被听众感知到的大部分直达声音的情况下可以定位成距离不对准听众的扬声器仅30英尺。在这样的条件下,距离扬声器100英尺的传播延迟是用来补偿正在耳机中播放的补充声学信号的适当的延迟。为了适当地工作,这样的基于位置的系统会需要了解关于所有的扬声器在主声音系统中的位置、这些扬声器的声学特性以及这些扬声器的当前定向。使用该信息,基于位置的系统然后会需要应用复杂的算法来确定哪个扬声器正在提供给定的听众正在听的大部分声音。还可以确信声音在空气中的传播速度受到空气的大气状态尤其是空气的温度的影响。在户外事件下,不少见的是空气的温度在事件的持续期间如当太阳落山时始终是变化的。这样的基于位置的发明可以测量场所内的某点处的大气状态并且使用该信息来在事件期间不时地计算对声音在场所 内的空气中的传播速度的更精确的估计。然而,该声速仅在其中感测到大气状态的位置处是确实精确的,并且这样的系统通常假设声速在场所内的空气中处处都是均匀的,这也可能未必如此。在事件中一大群人体通常产生许多热量和水分,这些热量和水分被传给周围的空气,尤其是主声学声音传播必须经过的身体附近的空气。因此,主声音的传播速度在整个行进的距离上可能不是恒定的,导致了计算出的传递延迟时间的进一步的误差。鉴于以上所述,理想的是直接测量被听众感知到的主声学声音的传递延迟,从而消除所有这样的与在设法估计传播延迟时测量物理位置或者距离有关的误差。现在参照图1,示出了总体上表示为100的根据本发明的示例性实施方式的用于增强被听众听到的声音的系统。系统100包括一个或更多个声音源。这样的声音源可以包括一个或更多个乐器如吉他110、键盘(未示出)等以及其歌唱被一个或更多个麦克风120感测到的一个或更多个歌唱者。虽然理解的是系统100可以与任何数目的乐器和麦克风一起使用,但是以下参照吉他110和麦克风120对系统100进行讨论。此外,理解的是系统100可以与期望为观众产生或者再现的任何声音源一起使用。系统100还包括对通过吉他110产生的和通过麦克风120感测的作为分别通过电缆115和电缆125传输的电子音频信号的声音进行接收的混音器130。如技术领域中期望和已知的那样,混音器130混合音频信号并且改变等级、音质和动态特性。混音器130将经处理的音频信号(主声音信号)输出给主声音系统140,主声音系统140将经处理的音频信号(主声音信号)通过声学空间190进行广播以作为可听声学信号145(也称为“声音145”),该声音145被位于声学空间中的观众成员或者听众150听到。这组成了通过其声音被递送给听众150的第一路径。在示例性实施方式中,主声音系统140为一个或更多个音频扬声器。在大型场所中,听众150可能距离主声音系统100英尺远。因为距离主声音系统140较远的距离,可听声学信号145在行进通过声学空间190时可能受到许多畸变和衰减,该畸变和衰减可能破坏观众成员150对表演的欣赏。为了提高被观众成员150听到的音频的质量,声音增强系统100还包括声音增强设备200,声音增强设备200将增强的音频信号输出给由观众成员150佩戴的一副耳机180。耳机180将增强的音频信号再现为增强的或者补充的可听声学信号185,该增强的或者补充的可听声学信号185通过声音增强设备200与可听声学信号145同步。预期的是声音增强设备200可以用于各种应用中。理解的是系统100是声音增强设备200可以用于其中的系统的不例。在系统100的不例性实施方式中,声音源110和声音源120可以是现场的声音源,并且主声音系统140可以是位于声音源110和声音源120附近的主扬声器。系统100可以是在竞技场中、在体育场处、在大的户外空间处等的具有剧场、舞台或乐队指挥台的现场音乐会,其中,主声音系统140 (主扬声器)位于剧场、舞台或乐队指挥台上。在系统100的另一个不例性实施方式中,声音源110和声音源120可以是通过使用主声音系统140再现的再现声音,如之前记录的声音。在这样的系统100中,混音器130可以不存在,但是会使用用于对再现声音进行放大和均衡的其他装置。系统100的该示例性实施方式的示例是具有声学信号145通过其传输的大的观众空间190的剧场。该剧场可以是电影院或者具有用预先记录的声音进行现场表演的剧场。在系统100的又一示例性实施方式中,声音源110和声音源120可以是再现声音和现场声音的组合并且可以在再现声音和现场声音之间交替,如可能发生在现场音乐会中的间歇期间。为了给观众成员150提供这样的增强声学信号185,声音增强系统100将经处理的音频信号(主声音信号)经由第二路径递送给观众成员150。具体地,混音器130将经处理的音频信号(主声音信号)经由连接器135输出给计算机160。计算机160接收经处理的音频信号(主声音信号),对经处理的音频信号进行编码,并且将该经编码的经处理的音频信号(主声音信号)经由天线170无线地转播为无线信号175。在示例性实施方式中,天线170为W1-Fi发射器。理解的是在系统100的每一个示例性实施方式中,被编码在无线信号175中的主声音信号应该与驱动主声音系统140的主声音信号显著地类似。然而,理解的是预期在被提供给主声音系统140的主声音信号与被提供给计算机160的主声音信号之间会存在有细微的差别。

还理解的是,尽管在图1中将计算机160示出为个人电脑,但是计算机160不限于是个人电脑。预期的是能够接收经处理的音频信号并且对该音频信号进行编码以用于经由天线170的传输的任何电子设备。还理解的是天线170不限于是W1-Fi发射器。例如,天线170可以是WiMAX发射器。此外,在示例性的替代实施方式中,计算机160连同天线170一起可以是传统的频率调制(FM)无线电发射器或者能够传输主声音信号的任何其他形式的无线发射器/编码器。通过天线170无线地传输音频信号以在广阔的区域如在声学信号145行进通过其的声学空间190提供信号175。这样做使得听众150能够在声学空间190自由地走来走去。此外,这样做使得任何数目的听众都能够使用系统100。因此,虽然此处系统100示出有听众150并且此处参照听众150来进行描述,但是理解的是声学空间190中的任何数目的听众都可以各自使用提供增强的或者补充的声学信号185的声音增强设备200。无线信号175和可听声学信号145在到达用户150时是不同步的。可听声学信号145滞后于无线信号175,这主要是因为声音通过空气的传播延迟远高于无线电波通过其中含有空气的相同的空间190的传播延迟。虽然与源110、源120与主声音系统140之间相t匕,在源110、源120与天线170之间存在有更多的使得延迟增加的点,但是实际上,对于位于距离主声音系统140大于几英尺远的任何听众如听众150来说,由可听声学信号145通过空气的传播引起的延迟 大于所有其他的延迟。因此,可听声学信号145滞后于无线信号175。声音增强设备200接收无线信号175。通过使用延迟搜索算法,声音增强设备200计算经编码的声音(经编码的主声音信号)的延迟,通过该计算出的延迟来延迟经编码的声音并且经由耳机180将其播放为补充声学信号185。因此,在听众150处,补充声学信号185与可听声学信号145同步,以增强听众的音频体验。因为编码在无线信号175中的声音信号受到由于传输引起的最小的衰减,所以补充声学信号185增强了被听众150听到的可听声学信号145。在图2中所示出的是根据本发明的示例性实施方式的声音增强设备200的示例性实施方式。该设备200包括用于接收无线信号175的天线210。如以上参照图1描述的那样,无线信号175包括经编码的主声音信号,经编码的主声音信号在此还可以被称为“干信号”。该干信号的源是被提供给主声音系统140和计算机160的主声音信号。因此,在此还可以将经处理的音频信号和主声音信号称为“干信号”。为了在此讨论,术语“干信号”指的是下述参考音频信号,该参考音频信号没有施加可能改变其可听感知方式的额外处理。相比之下,术语“湿信号”在此指的是在表演事件处(例如,位于音乐厅中的舞台、教堂的舞台或者讲道坛、电影院中的投影屏、体育事件的场地区域或者扬声器被用来放大语音或音乐的任何地方的附近)在一个或更多个声音系统的扬声器处发出的音频(声学)信号,其中,该音频(声学)信号被设计为被许多人同时听到。天线210将接收到的无线信号175输出作为电子信号212,该电子信号212被输入到无线立体声接收器/解码器220中。无线立体声接收器/解码器220解码电子信号212以产生经解码的干信号222,并且输出经解码的干信号222。在图2示出的声音增强设备200的示例性实施方式中,干信号222是包括左信号或者信道222A和右信号或者信道222B的立体声信号。理解的是干信号222可以包含任何数目的信道,例如,一个、两个或者三个或者更多个。如下所述,声音增强设备200使用干信号222来补充主声音信号,诸如被例如声音增强设备100中的用户如听众150听到的可听声学信号145。
设备200还包括用于接收可听声学信号145的麦克风260。意在于设备200以及因此其麦克风260被定位成接近听众150以便于被麦克风260感测到的声学信号145基本上受到与被听众150的耳朵感测到的声学信号145相同的传播延迟。在示例性实施方式中,声音增强设备200是被听众150手持或者被听众150佩戴例如被夹到听众150的腰部等的小的便携式设备。麦克风260输出接收到的可听声学信号145作为电子信号262,在此电子信号262在以下被称为湿信号262。湿信号262是已经通过空气190传播到听众150的耳朵的可听声学信号145的电再现(并且因此按照声音在空气中的传播速度以每行进一英尺大约0.9毫秒而被延迟),并且湿信号262被声音增强设备200上的麦克风262接收。湿信号262包括直接从主声音系统140接收到的可听声学信号145以及还有通常例如来自在围绕主声音系统140和听众150的环境中的墙、柱子或者其他目标的许多回响或回声,这些回响或者回声使得信号262被称为“湿”。传递函数(“TF”)是信号在从系统的输入端传送到系统的输出端时如何被改变的频域特性。脉冲响应(“I·R”)是下述时间波形,该时间波形表征了在输入端施加理想脉冲(枪响声是脉冲的声学近似)的情况下系统的从系统的输入端到系统的输出端的响应。系统的IR和TF是系统的等价表示并且可以通过使用傅里叶变换的数学处理来彼此之间相互转换。在声音增强设备200的情况下,关心的IR/TF是从干信号175到湿信号145或者更具体地从干信号222到湿信号262的IR/TF。这样的IR/TF限定了主声音系统140和声学场所190如何改变被提供给主声音系统140的原始信号。湿信号262和干信号222之间的区别包括:Ca)组成了主声音系统140的一个或更多个扬声器的非恒定的幅度频率响应和非恒定的定向性响应;(b)由于当声音远距离行进时的空气吸收而造成的高频损耗;(c)来自于围绕主声音系统140和听众150的声学环境190的混响;(d)不是主声音系统140所发出的任何声音(人群嘈杂声等);(e)由于当信号145通过空气传播时的声速而给声学信号145增加的延迟;以及(f)声音增强设备200中的麦克风260的非恒定的幅度频率响应和非全向响应。通过使用在此描述的方法和处理,声音增强设备200通过增加补充声学信号来减小以上(a)至(d)的声音衰减效应,同时还针对(e)补偿不能被改变的补充声学信号。具体地,使用干信号222或者更具体地左干信号222A和右干信号222B以及湿信号262,声音增强设备200计算湿信号262与干信号222之间的延迟。声音增强设备200还包括接收湿信号262、将其放大并且转换为数字信号272的前置放大器和A/D转换器270。因此,湿信号262是模拟湿信号262,并且信号272是数字湿信号272。数字湿信号272被提供给延迟搜索算法280,延迟搜索算法280还接收是左干信号222A和右干信号222B的干信号222。延迟搜索算法280计算湿信号272与干信号222之间的延迟282并且将计算出的延迟282输出给立体声可编程延迟线230。除了被提供给延迟搜索算法以外,左湿信号222A和右湿信号222B还被提供给立体声可编程延迟线230作为输入,立体声可编程延迟线230根据从延迟搜索算法280接收到的计算出的延迟282来延迟左干信号222A和右干信号222B。立体声可编程延迟线230输出经延迟的信号作为信号232A和信号232B,信号232A和信号232B被传递至立体声耳机放大器240,立体声耳机放大器240包括将信号232A和信号232B转换为模拟信号的D/A转换器。放大器240对模拟信号进行放大并且将其经由输出端250输出给耳机180。在示例性实施方式中,耳机180是数字耳机,并且立体声耳机放大器240将信号232A和信号232B输出给耳机。在示例性实施方式中,声音增强设备200是个人或者便携式设备,如个人数据助理(PDA)或者“智能手机”。理解的是声音增强设备200不限于此。在其他的示例性实施方式中,个人声音增强设备200可以是平板个人电脑、笔记本或者亚笔记本(subnotebook)电脑、手持式电脑或者仅为本发明设计的专用硬件设备等。在示例性实施方式中,放大器240是用户可调节的以调节在输出端250处的信号的音量。例如,声音增强设备200还可以包括音量控制装置245,音量控制装置245控制立体声耳机放大器240的增益以调节经增强的声学信号185的音量。补充声学信号185的音量的可调节性使得听众150能够针对最佳的个人偏好将声学信号145和补充声学信号185进行混合。各种类型的耳机180预期与声音增强设备200 —起使用。使用的耳机180的类型可以根据听众150的偏好而有所不同。在非常喧闹的摇滚音乐会上,例如,为了尽可能多地阻挡来自主声音系统140的喧闹的和混响的声音,听众150可以选择佩戴封闭式耳机(在耳上或者在耳内)。然后听众150可以调节声音增强设备200中的耳机放大器240的等级以在他或她的耳膜处有效地产生较低的声压级(SPL)。尽管这样的耳机180对于听众的耳朵来说是封闭的,但来自主声音系统的较低频率的声音仍可以到达听众的耳膜。因此,对于听众150来说仍然希望声音145的传播延迟得到补偿。或者,替代地,听众150可以选择佩戴非封闭式耳机,该非封闭式耳机使得更多来自主声音系统140的声音145能够到达他或她的耳膜。非封闭式耳机还可以使得听众150能够听到附近讲话的人,由此使得听众150能够在参与和该人的对话同时仍然享受到声音增强设备200的好处。根据本发明的示例性实施方式,示例性IR300在图3中被示出为根据由测量系统进行的测量而估计的对数幅值与时间的曲线。该示例性IR300是典型的对于声音145通过其行进的任何大的声学空间190的IR的相当`精确的估计。IR300的时间轴被分为三个时间段,T1 (从时间tQ至时间ti)、T2 (从时间^至时间t2)以及T3 (从时间〖2至时间t3)。在图3中,时间段T1的特征在于很低的信号电平(测量噪声)。时间段T1的长度对应于声学信号145的传播延迟(t1-tj。时间段T2的特征在于在时间h处到IR300的非常高的峰310的急剧的转变,该转变对应于声学信号145的到达。在峰310之后,IR300中在时间段T2内存在有一段时间的衰退,该衰退散布有对应于声学空间190中的强烈回响的峰320和峰330。截止到时间t2,混响已经衰减到测量系统的本底噪声(noise floor)。时间段丁3的特征在于声学空间190中的回响衰减到了测量系统的本底噪声之后的测量噪声。在估计出的IR300中的最大幅值峰的时间h经常为寻求的传播延迟时间的修正值并且可以被用作为延迟搜索算法280中的第一估值。然而,存在为何会难以取得精确的IR的若干个原因,并且下面会讨论这些原因。
现在参照图4A和图4B,示出有根据本发明的示例性实施方式由个人声音增强设备200执行以计算湿信号272与干信号222之间的延迟的延迟搜索方法400。延迟搜索方法400被声音增强设备200中的延迟搜索算法280采用以计算延迟282。图4A和图4B示出了延迟搜索方法400的一定的步骤410至步骤475。理解的是延迟搜索方法400可以如下所述的那样包括另外的示例性的步骤如步骤446和/或步骤456,或者可以如下所述的那样步骤410至步骤475中的一定步骤可以执行另外的或者替代性的处理。延迟搜索方法400在步骤410中开始。延迟搜索方法400可以在声音增强设备200的听众150做出命令时开始。例如,听众150可以打开声音增强设备200中的软件应用,该软件应用执行延迟搜索算法280以初始化延迟搜索方法400。当这样的软件应用打开时,延迟搜索方法400可以自动启动或者可以在由听众150做出选择时启动。在另一个示例性实施方式中,延迟搜索算法280可以在如被计算机160远程激活时开始。在步骤410中延迟搜索方法400的初始化之后,方法400接收左干信号222A和右干信号222B并且求和并且将其采集作为单声道干信号,步骤415。然后方法400采集单声道干信号的有限时间序列并且接收且采集湿信号272的有限时间序列,步骤420。然后单声道干序列和湿序列在步骤420中被缓存。理想地,每一个序列的开头对应于在声音增强设备200中使用了某个参考时间基准的相同的接收时间。然而,每一个序列的开头可以不对应于相同的接收时间。因此,在示例性实施方式中,在步骤420中,方法400给每一个有限时间序列提供时间戳以表示每一个时间序列在何时被采集。时间戳给方法400提供了下述能力:相对于因为由于处理或缓存滞后而在不同时刻被采集到的序列而造成的已经建立在采集到的有限时间序列中任何延迟,来参考任何计算出的针对时间序列的延迟。在替代性的示例性实施方式中,在步骤420中,方法400确定干序列的开头与湿序列的开头之间的时间差,因此可以稍后在调节立体声可编程延迟线230时考虑干序列和湿序列的采集滞后或者由于不同处理而造成的相对滞后。基于听众15 0预期的最大传播延迟时间、基于听众150可能距离主声音系统140最远的距离以及还基于期望方法400多快地计算延迟时间282来确定这些采集到的序列的长度。理想地,延迟搜索范围长于所预期的最大传播延迟时间,以便于保证可以找到正确的延迟时间,但是声音增强设备200中所需的计算能力强烈地受到延迟搜索范围的大小的影响。因此,理想的是不在比所需范围更长的范围中进行搜索。在示例性实施方式中,将延迟搜索范围选择为比最大的预期的传播延迟大50%。所选择的该搜索范围的长度提供了针对所采集的湿序列和单声道干序列的长度的最小边界。序列长度的上边界由下述来限定:声音增强设备200中可用的存记忆储器量,以及听众150愿意等待多久来让延迟搜索方法400采集序列并且提供延迟值282给立体声可编程延迟线230。例如,对于其中最远的观众座位区距离靠近舞台的扬声器140约为300英尺(约对应于270毫秒的传播延迟)的音乐厅的内部的情况,期望的会是将延迟搜索限制于0与400毫秒之间的范围,以使得搜索范围超过最大的预期的传播延迟约50%。因此,理想地,采集到的湿序列和单声道干序列的长度为至少400毫秒。然而,所述湿序列和单声道干序列可以长于400毫秒,增加的长度理论上增大了找到精确的延迟时间的机会。对于400毫秒的搜索范围,可以将3秒的示例性值用于采集到的湿序列和单声道干序列的长度。理解的是声音增强设备200和方法400可以用于具有不同的最大传播延迟的情况。因此,延迟搜索范围和序列长度会根据情况不同基于预期的座位区域而变化。可以如在初始化步骤410中将从主声音系统140到最远的座位区域的距离传输给声音增强设备200以作为被编码于在步骤420中采集到的干信号175 (272)中的辅助数据。在示例性实施方式中,处理继续到步骤425,在步骤425中出于计算效率的目的对湿序列和单声道序列进行低通滤波和下采样。下采样减少了需要进行的计算的量。通常来说,这是在声音增强设备200的计算能力、最终计算出的延迟时间的时间分辨率以及在其上确定出延迟的频带宽度之间权衡的结果。如果对原始干信号212和湿信号262以标准的48kHz的速率采样,则在步骤425中以因数8下采样到6kHz的采样速率将使得分析带宽能够上升到3kHz的奈奎斯特频率,同时将计算复杂度降低为原来的24至64分之一。理解的是在步骤425中预期使用其他因数如2、4、12等的下采样。还理解的是如果声音增强设备200具有足够的计算能力,则可以跳过步骤425中的下采样。继续方法400,处理继续到步骤430,其中,计算并检查单声道干序列的功率谱。如果方法400确定出单声道干序列在所选的带宽(理想地,带宽的上端由在步骤425中选择的下采样频率的一半限定)上不包含主要功率,则方法400确定主声音系统140没有发出很多声音。这可以是下述情况:可听声学信号145减弱了,或者源110和源120处于活跃的声音产生之间,例如,在歌曲之间(在音乐会上),在演讲人之间(在演讲),在场景或者节目之间(在电影、音乐剧或者戏剧中)。如果方法确定出主声音系统140没有正在发出很多声音,贝U进一步的计算仅会产生极其嘈杂的结果并且可能导致IR的不精确的计算和不精确的选择的延迟时间。取得精确的IR估计结果的另一个困难是由于由声音源110和声音源120产生的频谱内容所引起的。该频谱内容被包含在干信号222中和在湿信号272中,这是因为干信号222和湿信号272 二者均来源于声音源110和声音源120。如果干信号222的频谱为宽带噪声,则延迟搜索方法400产 生最精确的IR/TF结果。然而,在执行延迟搜索方法400时,由声音源110和声音源120产生的声音可能仅为单独的乐器、语音、声音效果等,其会具有有限的频谱并且还会包含主要的谐波相关的频谱分量。在频谱中具有大部分谐波相关的分量意味着在干信号222的时间波形中的一定水平的周期性,而这样的周期性会直接转化为估计出的IR的周期性误差。不同于明显可识别的、尖锐的、与干信号222与湿信号272之间在传播延迟上的差对应的单个峰,假峰可能遍布IR分散,假峰中有些最后会在幅度上大于与真实传播延迟时间对应的峰,尤其是在在湿信号272中还包括室外噪音和其他误差源的情况下。因此,当步骤430确定出单声道干序列在选择的带宽上不包含足够的频谱功率水平或者密度时,方法400返回到步骤420以采集单声道干信号和湿信号的另一对有限时间序列。处理在步骤420中继续,如以上所述。方法400可以循环执行步骤420、步骤425以及步骤430直到找到具有足够的功率谱的干序列为止。如果找到了具有足够的功率谱的干序列,则方法400通过使用互相关或者去卷积算法如最小均方(LMS)自适应滤波、双通道FFT分析或者类似的算法来计算湿序列与单声道干序列之间的IR/TF的估计,步骤435。在示例性实施方式中,将估计出的IR/TF的长度选为与所选择的延迟搜索范围的长度相同,如以上提及的示例的400毫秒。在步骤435中使用的去卷积算法可以固有地包括与信噪比有关的误差因子(例如,如果使用LMS滤波器,则为预测误差,或者如果使用双通道FFT处理,则为相干谱)。在步骤440中,如果方法确定出误差因子指示出差的信噪比(SNR),则处理返回到步骤420以采集单声道干信号和湿信号的另一对有限时序。处理在步骤420中继续,如以上所述。方法400可以循环执行步骤420、步骤425、步骤430、步骤435以及步骤440直到获得具有指示出合理的SNR的满意的误差因子的干序列为止。如果获得了合理的SNR,则处理继续到步骤445,在步骤445中将高通滤波器应用于在步骤435中估计出的IR/TF。当创建被设计成在大的声学空间190中如在音乐厅的舞台附近或者在大型剧院或体育场中的视频显示设备的屏幕附近使用的扬声器系统时,理想的是使得扬声器在所有频率处都具有非常高的且恒定的定向性,以便于使得发出的声音可以对准听众区域,以使从墙、天花板、支承结构以及其他物体弹回的回响或者回声最小化。回响可以到达听众区域处,因此衰减了由这些区域中的听众感知到的声音。然而,理解的是,随着发出的声音的频率变低,用作为主声音系统的扬声器系统由于物理声学中的固有限制而失去了定向性控制。因此,预期声音增强设备200中的麦克风260在较低频率处会比在较高频率处接收更多的混响。由于人类的听觉不是在较低的频率处而是在3kHz附近最敏感,因此搜索延迟方法400理想地集中在3kHz左右的频率上。为了这样做,将高通滤波器应用于在步骤445中估计出的IR。高通滤波器理想地为零相位滤波器以便于不破坏IR中固有的时间信息。IR的峰的时间发生偏移会将误差引入至延迟计算并且导致在可编程延迟线230中应用于干信号222的不希望的延迟。在示例性实施方式中,高通滤波器具有500Hz左右的截止频率。现在参照图5A,示出有根据本发明的示例性实施方式的理想的IR300的幅值与时间的示例性线性曲线,在步骤435中理想地会估计出该IR。可以认为图5A中的曲线是脉冲响应的理想曲线,但是预期这样清晰的脉冲响应不会产生于步骤435。如图所示,峰幅值310在约145毫秒时是清晰地可识别的。图5B中所示出的是根据本发明的示例性实施方式的IR的幅值与时间的示例性线形曲线,预期会在步骤435中估计出该IR。从该图可以看出,在145毫秒、207毫秒、224毫秒、253毫秒以及286毫秒处存在强的峰,在图中分别标记为510、520、530、540以及550。最高的峰幅值在图上不是很明显,并且,事实上,分别在253毫秒和286毫秒处的峰540和峰550高于在145毫秒处的真实峰510,这会导致对延迟的不正确的计算。在图5C中,示出有根据本发明的示例性实施方式图5B中的估计出的IR在通过步骤445中的高通滤波器之后的曲线。如该图所示,在145毫秒处的峰510相比于曲线的剩余部分是清晰地可识别的。峰520、峰530、峰540以及峰550已经极大地降低以至于在图5C中不再可见。图示出了根据本发明的示例性实施方式从图5C中示出的估计出的IR中移除的数据。在该图中,峰530、峰540以及峰550仍可见,由此表明了图5B的曲线中的假峰主要贡献了在人类的听觉最敏感的范围以下的声音频率。在步骤445中应用了高通滤波器之后,延迟搜索方法400对估计出的IR进行扫描以得到具有最大幅值的时间,步骤450。该时间是估计出的延迟。因此,方法400现在具有对从主扬声器系统140到听众150的真实IR的最佳估计和对延迟的估计,如由与经高通滤波的IR估计中的峰对应的时间所标识的那样。 此时,延迟搜索方法400可以将估计出的延迟传递到立体声可编程延迟线230作为计算出的延迟282,立体声可编程延迟线230会延迟左干信号222A和右干信号222B并且输出经延迟的左干信号和右干信号作为232A和232B。然后经延迟的左干信号232A和右干信号232B会经由放大器240中的D/A转换器转换为模拟的、被立体声耳机放大器240放大并且被提供给耳机180以用于被发射作为补充声学信号 185。然而,在步骤450中,可能会确定了错误的估计出的延迟值或者可能无法确定延迟值。对于第一点,如果估计出的延迟值是不正确的,如果使用的估计延迟时间由于某种原因而出现错误,则将通过耳机180发出的补充声学信号185与来自主扬声器140的可听声学信号145在听众的耳朵150处结合会使得感知到的音质更差而非更好。对于第二点,对于精确的IR估计的另一个障碍是通过麦克风260接收到的任何噪声,该噪声与由主声音系统140发出的可听声学信号145无关。这样的噪声可以源自喧哗噪声(背景讲话)、交通噪声、HVAC系统噪声等。该噪声可以使得麦克风260的测量噪声增力口。因为测量噪声在步骤435中估计出的IR的开头和结尾处可能具有显著的影响,所以测量噪声是成问题的,由此可能掩盖了在IR中与可听声学信号145到达听众150的耳朵的点对应的急剧的转变。在某些情况下,噪声的统计随机性会使得IR中的假峰在幅值上大于与可听声学信号145的传播延迟对应的峰。

因此,在示例性实施方式中,因为估计虚假的延迟时间的可能性或者因为不能估计出延迟时间,所以方法400中的处理继续经由A到步骤455以及其后另外的步骤以确定是否存在有太多的噪声以至于不能做出精确的延迟值决策以及增加在步骤450中找到正确的延迟时间的可信度。在步骤455中,方法400计算整个估计出的IR的平均幅值并且将其与步骤450中确定的且被假定成与可听声学信号145对应的峰幅值进行比较以获得总体峰值与平均值之比。如果该比值表示指示了良好的IR估计,则方法400中的处理继续到步骤460。否则,该处理经由B返回到步骤420以采集单声道干信号和湿信号的另一对有限时间序列。处理在步骤420中继续,如以上所述。之前计算出的并且应用于立体声可编程延迟线230的任何延迟282是不变的,从而应用于左干信号222A和右干信号222B的任何延迟是不变的。在示例性实施方式中,指示了良好的IR估计的峰值与平均值之比为20db。因此,如果峰值与平均值之比等于或者大于20db,则方法400中的处理继续到步骤460。在示例性实施方式中,如果声音增强设备200的计算能力足以计算比求平均更加复杂的整个IR的均方根(RMS),则在步骤455中计算整个IR的RMS而不是平均值。步骤455将峰值与计算出的RMS进行比较以确定峰值与RMS之比。如果该比值指示了良好的IR估计,则方法400中的处理继续到步骤460。否则,该处理经由B返回到步骤420,并且之前计算出的且应用于立体声可编程延迟线230的任何延迟282是不变的,从而应用于左干信号222A和右干信号222B的任何延迟是不变的。在示例性实施方式中,指示良好IR估计的峰值与RMS之比为20db。因此,如果峰值与RMS之比等于或者大于20db,则方法400中的处理继续到步骤460。在示例性实施方式中,在步骤455中,还仅计算开头和结尾本底噪声的平均值或者RMS并且与峰幅值进行比较。如果步骤455确定出该峰值与平均值之比或者峰值与RMS之比不够高得足以指示出良好的IR估计,则方法400返回到步骤420。理解的是可以将开头和结尾本底噪声选为IR中的第一个10毫秒和最后一个10毫秒。或者,可以将开头和结尾本底噪声选为IR的第一个2.5%和最后一个2.5%。在系统的传播延迟在系统的IR幅值与时间曲线中最容易可见的同时,例如如图3所示,传播延迟还固有地包含在系统的TF的相位响应中。通常更加难以从系统的TF中提取出有意义的延迟时间。在步骤455中的IR的峰值与平均值之比或者峰值与RMS之比的情况下,如果比值不如优选的那样大并且声音增强设备100的处理能力是足够的,则然后在示例性实施方式中方法400继续到步骤460以得到估计出的延迟时间的额外的可信度,尤其是因为根据TF计算出的延迟值对于特定的频率范围是容易指出的。否则,方法400跳到以下描述的步骤470并且输出来自步骤450的估计出的延迟值作为延迟282。在步骤460中,如果TF还未已知,则使用常用的傅里叶变换技术根据估计出的IR来计算TF,步骤460。然而,截止到方法460到达步骤460时,TF可以是已知的,这是因为TF可以是步骤435中执行 的处理的自然的一部分。步骤460通过计算在选择的频带上的多个频率中的每一个频率的TF的群延迟来估计可听声学信号145的传播时间。然后步骤460在选择的频带上对TF的群延迟求平均。在步骤460的示例性实施方式中,选择的频带包括3kHz附近的频率,人耳在选择的频带中是最敏感的。在步骤460的又一个示例性实施方式中,如果声音增强设备200具有足够的计算能力,则步骤460在计算群延迟并且在选择的频带上对群延迟求平均之前将解缠(unwrap)函数应用于TF的相位响应。在步骤460的替代性的示例性实施方式中,根据该解缠的相位响应来计算平均相位延迟可以提供比平均群延迟更精确的答案。然后将根据TF计算出的平均群延迟或者平均相位延迟与根据在步骤450中确定的IR的最高峰搜索而估计出的延迟时间比较,步骤465。如果两个值在一定范围内不匹配,则步骤465确定出在步骤460中执行的延迟搜索是无效的并且处理经由B返回到步骤420以继续处理,如以上所述。如果步骤465确定各个延迟时间以可接受的程度相匹配因此满足可信度准则,则延迟搜索方法400输出与在步骤450中确定的IR的最高峰对应的延迟作为延迟时间282,步骤470。方法400完成,步骤475。例如,如果步骤465确定各个延迟时间在5毫秒内匹配,则延迟搜索方法400输出与在步骤450中确定的IR的最高峰对应的延迟作为步骤470中的延迟时间282。在示例性实施方式中,方法400以及因此声音增强设备200可以通常以相对于真实的传播延迟来说小于I毫秒的误差以内来计算出延迟282。如图2所示,将延迟时间282输入给立体声可编程延迟线230。立体声可编程延迟线230接收延迟时间282并且将延迟时间282用于延迟左干信号222A和右干信号222B并且将它们输出给立体声耳机放大器240作为经延迟的左干信号232A和右干信号232B。立体声耳机放大器240放大信号232A和信号232B,将信号232A和信号232B转换为模拟的,并且将信号232A和信号232B经由输出端250输出给耳机180。耳机180将模拟的经放大的信号再现为增强的或者补充的可听声学信号185,该可听声学信号185与可听声学信号145同步。在示例性实施方式中,延迟线230将新延迟时间282和在方法400的最近的迭代的完成之前由延迟线230使用的之前的延迟时间282进行比较。如果新延迟值282显著地不同于之前的延迟时间282,则立体声可编程延迟线230可以立即切换到新延迟值282,这是因为旧值282的大的误差对于听众150来说明显地听起来不正确。另一方面,如果新延迟值282接近于之前的延迟值,也许在30毫秒内,则之前的延迟时间282会以非常慢的速率也许约3ms/s斜坡变化(ramp)到新延迟时间282,以使得延迟282的变化对于听众150不是明显可听见的。取决于声音增强设备200的硬件,延迟值282会需要被调节以补偿麦克风前置放大器和A/D转换器270中、立体声耳机放大器240的D/A转换器中以及被延迟搜索算法200采用的延迟搜索方法400中的任何额外的固有等待时间。因此,在示例性实施方式中,在接收到延迟时间282之后,立体声可编程延迟线230对延迟时间282进行调节以引起声音增强设备200中的额外的固有等待时间。以上的方法400的描述涉及之前的延迟时间282。之前的延迟时间282可以是之前执行的方法400的结果或者可以是初始最佳估值的结果。在声音增强设备200的启动时并且在执行方法400之前,延迟时间282没有值。在示例性实施方式中,立体声可编程延迟线230可以在用延迟时间282的第一值第一次延迟左干信号222A和右干信号222B之前等待由方法400计算出的延迟时间282的第一值。在另一个示例性实施方式中,通过声音增强设备200提示听众180输入到主声音系统140的距离或者到听众150的当前位置,例如,座位区、座位号等。使用到主声音系统140的距离或者基于听众150的当前位置和声音通过空气的传播速度对这样的距离的估计,声音增强设备200计算对延迟时间282的初始估计并且使用其来初始地延迟左干信号222k和右干信号222B。在又一个示例性实施方式中,左干信号222k和右干信号222B可以包括提供了建议的初始延迟时间282的经编码的数据。立体声可编程延迟线230可以使用这样的延迟时间282来延迟左干信号222A和右干信号222B直到方法400计算出延迟时间282的值为止。

周期性地重复方法400以确保延迟时间282是有效的。当将新延迟时间282应用于延迟线282时,声音增强设备200会持续使用延迟时间282直到由听众150手动地提示来重新计算延迟时间282为止,或者声音增强设备200可以立即(或者在延迟之后)重新运行延迟搜索方法400。当听众150正在移动时,认为延迟搜索方法400的自动重新运行是有用的,但是由于方法400的计算强度,因此会消耗额外的电池能量。另一种可能性是延迟搜索方法400以规律的间隔(例如2分钟)自行重启以自动地补偿由于声速的变化而引起的传播延迟的变化,声速的变化取决于空气温度并且因此可以随时间而不同。如以上所述,听众150能够在声学信号145通过其传输的声学空间190到处移动的同时使用声音增强设备200。在示例性实施方式中,到无线信号175中的声音数据的访问通过对无线信号175的加密而被限制。如果听众150已经为访问付费,则系统100可以仅给声音增强设备200提供访问即可。因此,还可以通过声音增强设备200来提示听众150输入密码来访问无线信号175并且开始声音增强。在替代性实施方式中,系统100可以远程解锁设备200。如以上所述,声音增强设备200的计算能力,以及声音增强设备200的硬件固有的其他资源如可用存储量,都影响声音增强设备200以及具体地方法400的特定实现。以上还提及,声音增强设备200的计算能力可以确定:在步骤420中采集到的湿序列和单声道干序列的长度、在步骤425中是否进行下采样或者低通滤波、在步骤425中使用的下采样因子、在步骤440中是否执行SNR确定、在步骤445中是否执行高通滤波、在步骤455中是否采用平均或者RMS、在步骤460和步骤465中是否计算群或相位延迟、以及方法400被运行的频率。这样的功能可以取决于所使用的特定的声音增强设备200的计算能力而被执行或者省略。声音增强设备200的计算能力还可以允许执行方法400的附加步骤446和附加步骤456,在图4A和图4B中用虚线框和虚线示出。此外,在方法400的步骤中的一些步骤中,方法400可以执行附加处理,如下所述。例如,如果湿序列和干序列在步骤425中被下采样,则步骤435中确定的估计出的IR的量化样本之间的时间间隔变得比通过立体声可编程延迟线230馈送的干信号222的样本之间的间隔更大。因此,可能的是理想的延迟时间将落在估计出的IR中的样本之间的时间值上。为了获得更精确的延迟时间,在执行步骤440之后但是在执行步骤450之前,方法400可以前进至步骤446,在步骤446中,对IR进行内插(上采样)以找到估计出的IR的样本之间的幅度值。虽然理解的是步骤446可以在步骤440与步骤445之间执行,但是出于计算效率的目的图4A示出了在步骤445与步骤450之间执行的示例性的替代性的步骤446。附加处理的另一个示例涉及使用根据估计出的IR计算出的能量时间曲线(ETC)。当声学工作者检查大的声学空间的IR时(通常以量化延迟时间),使用希尔伯特变换来根据IR创建ETC不是不常见的。ETC在特性上与根据其创建ETC的IR类似,但是通常表现了 IR的波形的包络。取决于声学信号145的声学环境的性质,扫描ETC而不是扫描IR以得到合适的延迟时间可以或者不可以提供精确度方面的小优点。因此,在示例性实施方式中,步骤450还包括:将希尔伯特变换应用于来自步骤435的估计出的IR以产生ETC,以及扫描ETC而不是扫描估计出的IR以识别具有最大幅值的时间样本从而提供延迟时间的估计。附加处理的又一个示例涉及可信度准则。在方法400的示例性实施方式中,存在有其中可信度准则被测试的若干步骤,并且如果不符合一定的准则,那么方法400重启。例如,可能的是:因为外部噪声,所以步骤420至`步骤455会重复多次但是在步骤455中峰值与平均值之比或者峰值与RMS之比从未指示出良好的IR估计。如果这样的情况发生,则方法400将陷入循环中。因此,在示例性实施方式中,延迟搜索算法400维护计数器来对方法400循环执行步骤420至步骤455而不传到步骤460的循环次数进行计数。每一次步骤455确定了估计出的IR的峰值与平均值之比或者峰值与RMS之比不够高得足以指示出良好的IR估计,那么计数器就加一,步骤456。如果,在步骤456中,方法400确定出计数器等于或者超过预定的循环数目,则在步骤455后方法400不返回到步骤420而是前进至步骤460以看看是否尽管这样的延迟时间是精确的可信度将降低但也仍可以确定有效的延迟时间。否则,方法400从步骤456返回到步骤420。基于以该示例性实施方式,在进一步的示例性实施方式中,在步骤455或者步骤456中临时存储步骤450中估计出的延迟时间。当步骤420至步骤456的循环重复时,在步骤456中对每一个估计出的延迟时间与从之前的各个循环中估计出的延迟时间进行比较,以确定估计出的延迟时间有多一致。如果步骤456确定在到达或者超过其预定的循环数目之后估计出的各个延迟时间是一致的,也就是说,各个估计出的延迟时间满足可信度准则,则方法400中的处理从步骤456继续到步骤460,并且将步骤420至步骤456之间的循环期间存储的估计出的延迟时间的平均值用作为方法400中的剩余步骤中的估计出的延迟时间。例如,在5次循环执行步骤420至步骤455之后,在去掉异一个常值的情况下,如果步骤420至步骤456之间的循环期间存储的各个估计出的延迟时间彼此相距5毫秒以内,则方法400将从步骤456继续到步骤460并且将平均延迟时间用作为用于方法400的剩余步骤的估计出的延迟时间。附加处理的另一个示例涉及对采集到的关心的单声道干序列进行调节。可能需要的最大延迟时间将限定应该在其上估计IR/TF的时间范围。该时间范围根据事件而不同。在大型室外事件中,听众150会位于下述位置,所述位置使得来自主声音系统140的可听声学信号145的声学传播延迟为I秒或者更长的位置。这样长的延迟会是例外而不是常规。因此,方法400通常不被初始化成在步骤435中估计比这样长的延迟还长的IR,这尤其因为方法400中的计算的数目与在步骤435中估计出的IR的长度有关。例如,使得在步骤435中估计出的IR的长度加倍会在一些情况下使得所需的计算的数目变为4倍。因此,在方法400的示例性实施方式中,为了计算效率,方法400第一遍可以以延迟时间可能小于某个值例如400毫秒的假设开始,并且将延迟搜索范围和因此估计出的IR限制于该长度。如果当前IR估计的可信度准则在步骤465中不满足,则方法400返回到步骤420,在步骤420中湿序列保持相同但是关心的单声道干序列偏移了 300毫秒,有效地将搜索隔离在单声道干序列的300毫秒到700毫秒的范围。如果该IR估计的可信度准则在步骤465中仍不满足,则然后关心的单声道干序列再偏移300毫秒以将搜索隔离在600毫秒与I秒之间,如此下去直到某个预定的限制,例如5秒。注意的是,在每一个循环中给单声道干序列的时间增加的偏移量应该小于总IR估计长度,以便于保持各个延迟搜索窗的一定的交叠来避免其中真实的传播延迟时间落在边界时间上即接近一个序列的最结尾或者下一个序列的最开头的情况下的问题。在示例性实施方式中,序列之间的交叠可以为序列长度的25%。在该技术中,如果声音增强设备200和听众150定位成远离主声音系统140,则声音增强设备200可能需要一段时间来较快地获得精确的时间延迟值。然而,如果听众150和声音增强设备200在主声音系统140的400毫秒以内,则可以在低计算量的情况下找到快速答案。如果听众150远离舞台,则他或她将可能更可以忍受长的延迟搜索时间。附加处理的再一个示例 涉及调节在步骤435中估计出的IR的长度以及用于在步骤425中使用的下采样因子连同在示例性步骤456中对估计出的延迟时间进行存储和比较/精化的特征。如以上所述,在方法400的一个实施方式中,在步骤425中对步骤420中采集到的湿序列和单声道干序列以8为因数进行下采样,以降对低声音增强设备200的计算要求,并且以400毫秒的长度来确定IR。在替代性的示例性实施方式中,为了降低对具有预期的长延迟时间的声学信号145的计算需求,步骤425中对湿序列和单声道干序列以较高的因子(高于8)进行下采样,并且在更长的长度上确定IR以包括预期的长延迟时间。然而,以较高的因子进行下采样的缺点在于使得包括在延迟搜索方法400中的最高频率降低了,由此增加了估计出的延迟时间的误差的可能性,但是由较低频率的混响和其他因素导致的估计出的延迟时间的误差量有很大可能为大约200毫秒或更小。一旦在长的时间窗的情况下找到了初始估计,处理就继续进行通过步骤456,在步骤456中计数器加一并且初始估计被存储。处理继续返回到步骤420,并且步骤420到步骤456的循环可以在下述情况下第二次重复:在步骤425中更少限制性的下采样速率、步骤435中更短的估计出的IR时间长度以及步骤420中被适当延迟的干信号,以使得步骤450中的初始的估计出的延迟时间落在估计出的IR的较小的时间窗的中间。步骤420至步骤456的循环可以继续直到计数器达到或者超过预定的循环数为止或者直到步骤456确定出所估计出的延迟满足可信度准则为止。这可以在所需的计算能力上、所需的存储器资源以及用来找到估计出的延迟时间的平均时间长度方面具有良好权衡的情况下产生所估计出的延迟时间的精确答案。如之前所述,为了使得IR/TF估计并且因此所计算出的延迟时间282尽可能的精确,用于延迟搜索方法400以作为参考输入信号的干信号222应该与用来驱动主声音系统140的原始声学信号基本相同。否则,由主声音系统140发出的可听声学信号145中包含的(并且因此在测量到的湿信号272中接收到的)不包括在干信号222内的信息,以及干信号222中包含的不包括在可听声学信号145内的信息,对于延迟搜索方法400来说将表现为增加的噪声,从而妨碍方法400的找到精确的传播延迟时间282的能力。在目前为止讨论的示例中,假设了干信号222和驱动主声音系统140的主声学信号是立体声,换言之两个不同的信号,通常表示为左和右。例如,在音乐会事件上,将立体声扬声器集群用于主声音系统140是常规的。然而,延迟搜索方法400每次仅可以使用一个干信号,在步骤420中输入,以与湿信号272比较。在给定的示例中,将左信号242A和右信号242B在步骤415中加在一起来创建该单独的单声道干输入信号以在延迟搜索方法400中的步骤420和后续的步骤中使用。然而,听众150可能就座于非常接近主声音系统140的左扬声器并且非常远离主声音系统140的右扬声器。因此,通过声音增强设备200内部的麦克风260接收并且被前置放大器和A/D转换器270数字化的湿信号272将受控于左干信号的信息,该左干信号的信息会不同于右干信号的信息。因此,在不例性实施方式中,如果在声音增强设备200中存在足够的计算能力,则可以 通过运行延迟搜索方法400若干次来获得所计算出的延迟时间282的精确度的更高的可信度:一次仅使用左干信号作为参考信号,一次仅使用右干信号,以及一次使用左信号和右信号二者的单声道总和。求和步骤415将被用来计算单声道干信号,而对于单独关于左干信号和右干信号的延迟搜索,求和步骤415会被旁路。这些搜索中任何一个产生了估计出的IR的最佳的峰值与平均之比(或者峰值与均方根之比)(或者关于TF的相位响应的平均群延迟计算中的最小平均值或者均方偏差)的搜索就是其延迟答案可能是最精确的并且应该被应用于立体声可编程延迟线230的搜索。在声音增强设备200的某些应用中,听众150可能会希望通过耳机180听到与由主声音系统140发出的声学信号145不同的一个信号或者多个信号。例如,在音乐会上,表演的艺术家可能想通过使用声音增强设备200来专门地给他们的粉丝演奏特别的声音或者信息。在将无线信号175传输到声音增强设备200之前将声学信号145中不存在的该额外的音频信息增加到干信号中,使得干信号222像是包括了延迟搜索方法400不想要的噪声。该额外的音频信息可以改为被编码到无线信号175中,以使得该额外的音频信息可以在声音增强设备200的内部被解码以作为单独的一个信号或者多个信号。在示例性实施方式中,声音增强设备还包括补充音频解码器225,补充音频解码器225对嵌入在干信号212中的额外的音频信息进行解码。补充音频解码器225将经解码的额外的音频信息输出给立体声可编程延迟线230,立体声可编程延迟线230先将经解码的额外的音频信息与干信号222混合然后延迟并输出经组合的信号作为信号232。无线立体声接收器/解码器220从提供给延迟搜索算法280的干信号222中移除额外的音频信息。
在某些应用中,可能希望使用被提供给主声音系统140和给计算机160的干信号在声音增强设备200内部仅用于延迟搜索处理400,而替代信号在无线立体声接收器/解码器220中被解码并且仅被发送至立体声可编程延迟线230以用于输出给耳机180。在该应用中,干信号222被提供给延迟搜索算法仅为了计算延迟282。干信号222不被提供给立体声可编程延迟线230。仅仅替代信号被提供给立体声可编程延迟线230。例如,在音乐会上这些替代信号可以是增强的立体声混音,其中,歌唱更加清晰和/或某些乐器的声相(pan)比在干信号中更加强制在左或者右边,另外也许其中混合了某些环境声。作为另一个音乐会示例,这些替代信号可以是与干信号一起传输的茎混音(stemmix),其中,示例茎是鼓、低音电吉他、主音吉他、钢琴以及歌唱。然后听众150可以选择调节在声音增强设备200内部的每一个茎的等级来创建他的或她的在耳机180中听到的自己的独特的最终混音。与其他茎相比,一个听众会优选地更大声听到歌唱;同时另一个听众会优选地更大声地听到鼓或者其他茎中之一。由听众150创建的最终立体声混音仍应该基于从主声音系统140到听众150的位置和声音增强设备200的传播延迟而被延迟适量的时间,因此就是为什么这些替代信号应该通过立体声可编程延迟线230,而未修改的干信号222即使不通过耳机180播放也仍必须被用在延迟搜索算法280中。注意的是,干信号与替代信号之间的相对时间偏移必须在音频混合、编码、无线传输以及解码处理期间一直被保持以便于使用干信号222通过延迟搜索算法280计算出的延迟282精确地应用于替代信号。

在其他的应用中,会希望将视频包括在无线信号175中。这样的视频可以是与声音源110和声音源120有关的表演。在这样的实施方式中,声音增强设备200还包括视频解码器、视频播放装置以及用于播放视频的显示屏。视频解码器从干信号222中移除视频以使得视频不会好像噪声一样出现在干信号222中。视频解码器将视频提供给视频播放装置,视频播放装置还接收延迟282作为输入。视频播放装置用延迟282来延迟视频并且将视频提供给视频显示屏以用于显示给听众150。在这样的情况下,听众150也是观众150。在对本实施方式的示例性变化中,声音增强设备200可以使得听众/观众150能够向声音增强设备200请求购买和下载包括声音和视频二者的现场版本的表演。听众/观众150可以选择声音增强设备200的界面上的链接,这使得声音增强设备200向计算机160传输购买的请求。然后计算机160可以向声音增强设备200传输所请求的音频和/或视频或者进行布置使得这样的音频和/或视频通过其他的电子手段例如经由网站下载来传输给听众/观众150。在本示例性实施方式的另一个变化中,会希望的是将文本包括在无线信号175中。这样的文本可以包括与正被传输的声音或者视频有关的信息,如命名正播放的音乐的现场安排列表,或者与正在播放的(源于声音源110和声音源120的)音乐有关的其他文本信息如文字叙述。或者,文本可以经由独立于无线信息175的无线信号来广播。在这些实施方式中的每一个实施方式中,声音增强设备200包括被配置成对文本进行解码并且将文本从干信号222中移除的解码器。另一个需求会是混合、编码以及无线传输表示了在主声音系统140外播放的增强双声道3D版本的音频信号145的两个不同的信号。对于使用了位于大的声学场所的不同位置处的大扬声器的3D或者环绕声的效果存在显著的限制,主要是因为每一个听众处于场所中的不同位置处从而以非常不同的方式感知3D/环绕效果的事实。如果改为使用头部相关的传递函数来创建并且通过个人耳机来播放3D或者环绕效果,则每一个听众最佳地感知3D/环绕效果。然而,不是事件中的每一个听众都会有声音增强设备200和耳机180,因此仍将存在发出将被听众150感知到的声音的主扬声器系统140,并且双声道3D增强信号仍将需要被适当地延迟以引起传播延迟,以使得主声音145和补充声音基本地时间上同步地到达听众的耳朵。在这样的情况下,可以将被发送到主扬声器系统未修改的左干信号和右干信号二者连同双声道3D增强左信号和右信号二者一起编码在无线信号175中并且无线传输,而声音增强设备200中的解码器对未修改的干信号222进行解码并且将它们专门地发送给延迟搜索算法280并且对双声道3D增强信号进行解码并且将它们专门地发送给立体声可编程延迟线230 (并且因此给耳机)。如果,事件是在电影院里的电影而不是音乐会,则可以将被发送到电影院(作为示例)中的中央扬声器的干信号用作为到延迟搜索算法280的参考输入222,而同时将表示了电影的环绕声轨的双声道3D增强信号发送到立体声可编程延迟线230,以通过使用声音增强设备200为电影院中的任何观众成员(无论他们坐在哪里)提供了最优环绕声,该最优环绕声还个人地与被电影院中的未使用个人声音增强设备200的并且其对环绕效果的感知受到他们的相对于环绕扬声器的位置的座位位置的影响的其他人听到相同的声音在时间上对准。理解的是图4A至图4B示出的并且上述的延迟搜索方法400的步骤可以在声音增强设备200的通用微处理器中执行。对于之前提及的其中个人声音增强设备200是智能手机或者是包括了能够运行软件指令的微处理器的设备的示例,延迟搜索方法400的步骤被编程为软件指令,即,该软件指令是软件应用(也叫做“app”)的一部分,该软件指令在由智能手机的微处理器运行时执行上述方法400的步骤。还理解的是在此描述的其他的附加的、替代性的 以及补充的功能可以在声音增强设备200的通用微处理器中执行。可以将这样的附加的、替代性的以及补充的功能编程为软件指令,即,该软件指令是软件应用(也叫做“app”)的一部分,该软件指令在由声音增强设备200的微处理器运行时执行这样的功倉泛。这样的应用不仅可以包含与在耳机180外播放的补充听觉信息185有关的特征,还可以包含其他特征。例如,可以存在其中有利的是具有补充的视频信号的情况,如以上所述。视频信号可以无线传输,也许与干信号一样被编码在同一无线传输信号175中。在将补充频信号发送到智能手机的显示屏之前,可以将找到的并且被应用于干音频信号222的相同的延迟时间应用于该视频信号,因此确保了听众150基本地时间上同步地听到并且看到补充的音频信号和视频信号。在音乐会的示例中,智能手机的显示器可以示出正在表演的艺术家演唱和演奏他们的乐器的视频信号。替代地或者除此之外,标题和关于当前播放的歌曲的其他信息(或者音乐会的全部歌曲安排列表)可以显示在智能手机的显示器上,所述信息可能包括了随着歌曲被听众150听到而时间上同步地出现的歌曲歌词中的每一个词。软件应用还可以向听众150示出购买当前听到的歌曲或者整场音乐会的记录或者与艺术家有关的其他商品的出价。如上文所述,对包括在声音增强设备200中的通用微处理器可以编程有软件指令,该软件指令在由微处理器运行时使得微处理器执行延迟搜索方法400的功能。例如且非限制,图4A和图4B中示出的延迟搜索方法400被编程在软件中,该软件在由微处理器运行时执行以上描述的步骤410至步骤475以及可选地步骤446和/或步骤456以及上述方法400中的步骤的附加的或者替代性的处理的功能性,如分析上述的可信度准则和在此描述的附加的功能。理解的是在替代示例性实施方式中,不是方法400中的所有的步骤都被执行。例如,在示例性实施方式中,步骤425、步骤430、步骤440、步骤445、步骤450、步骤455、步骤460以及步骤465中的任何一个或者所有都可以被跳过。理解的是由声音增强设备200的微处理器运行的软件指令被有形实施在声音增强设备200中的有形的计算机可读介质中。如在此使用的那样,“计算机可读介质”可以包括磁介质如在个人声音增强设备200中的计算机硬盘驱动器、磁光介质如磁光驱动器、固态存储器如闪存等。计算机可读介质还可以包括从声音增强设备200可移除的存储器设备,如现有技术中已知的可移除存储器设备一样。软件指令由声音增强设备200中的微处理器从以上提及的有形的计算机可读介质下载并且由微处理器运行,以执行在此描述的延迟搜索方法400及其附加和变体的功能。对于本技术领域的技术人员来说,根据前述的说明书,本发明的这些和其他的优点是明显的。因此,本技术领域的技术人员理解的是,可以在不违背本发明的广泛的发明构思的情况下对上述的实施方式做出变化和修改。因此应该理解的是,本发明不限于在此描述的特定的实施方式·,而是意在包括在本发明的范围和精神内的所有变化和修改。
权利要求
1.一种增强声学信号的方法,包括: 通过使用电子设备中的麦克风来感测声学信号,所述声学信号响应于主声音信号而被发出并且通过空间传输; 通过使用所述电子设备中的天线来接收编码有所述主声音信号的无线信号; 基于所述感测到的声学信号和被编码在所述接收到的无线信号中的所述主声音信号来估计所述空间的脉冲响应; 基于所述估计出的脉冲响应来计算所述感测到的声学信号与被编码在所述接收到的无线信号中的所述主声音信号之间的延迟; 通过使用所述计算出的延迟来延迟被编码在所述接收到的无线信号中的所述主声音信号;以及 再现经延迟的所述主声音信号以增强被所述电子设备的用户听到的所述声学信号。
2.根据权利要求1所述的方法,还包括将所述感测到的声学信号转换为数字化的声学信号, 其中,被编码在所述无线信号中的所述主声音信号是数字的,以及其中,所述估计的步 骤包括基于所述数字化的声学信号和被编码在所述无线信号中的所述主声音信号来估计所述空间的所述脉冲响应。
3.根据权利要求2所述的方法,其中,计算所述延迟的步骤包括:通过扫描所述估计出的所述脉冲响应来识别所述估计出的脉冲响应的峰幅值,从而计算所述数字化的声学信号与被编码在所述无线信号中的所述主声音信号之间的延迟。
4.根据权利要求3所述的方法,还包括: 计算所述估计出的脉冲响应的平均幅值;以及 将所述估计出的脉冲响应的平均幅值与所述估计出的脉冲响应的峰幅值进行比较以确定峰值与平均值之比, 其中,延迟被编码在所述无线信号中的所述主声音信号的步骤包括:如果所述峰值与平均值之比超过预定值,则通过使用所述计算出的延迟来延迟被编码在所述接收到的无线信号中的所述主声音信号。
5.根据权利要求3所述的方法,还包括: 计算所述估计出的脉冲响应的幅值的均方根(RMS);以及 将所述估计出的脉冲响应的幅值的RMS与所述估计出的脉冲响应的峰幅值进行比较以确定峰值与RMS之比, 其中,延迟被编码在所述无线信号中的所述主声音信号的步骤包括:如果所述峰值与RMS之比超过预定值,则通过使用所述计算出的延迟来延迟被编码在所述接收到的无线信号中的所述主声音信号。
6.根据权利要求2所述的方法,还包括对所述估计出的脉冲响应进行高通滤波。
7.根据权利要求6所述的方法,其中,计算所述延迟的步骤包括:通过扫描经高通滤波的所述估计出的脉冲响应来识别经高通滤波的所述估计出的脉冲响应的峰幅值,从而计算所述数字化的声学信号与被编码在所述无线信号中的所述主声音信号之间的延迟。
8.根据权利要求2所述的方法,还包括对所述数字化的声学信号和被编码在所述无线信号中的所述主声音信号进行低通滤波,其中,估计所述脉冲响应的步骤包括:基于经低通滤波的所述数字化的声学信号和经低通滤波的被编码在所述无线信号中的所述主声音信号来估计所述空间的所述脉冲响应。
9.根据权利要求8所述的方法,还包括: 下采样经低通滤波的所述数字化的声学信号;以及 下采样经低通滤波的被编码在所述无线信号中的所述主声音信号, 其中,估计所述脉冲响应的步骤包括:基于经下采样的经低通滤波的所述数字化的声学信号以及经下采样的经低通滤波的被编码在所述无线信号中的所述主声音信号来估计所述空间的所述脉冲响应。
10.根据权利要求2所述的方法,还包括: 计算被编码在所述无线信号中的所述主声音信号的功率谱;以及 确定被编码在所述无线信号中的所述主声音信号的功率谱是否指示出被编码在所述无线信号中的所述主声音信号具有足够的功率, 其中,估计所述脉冲响应的步骤包括:如果被编码在所述无线信号中的所述主声音信号的功率谱指示出所述主声音信号具有足够的功率,则估计所述脉冲响应。
11.根据权利要求2所述的方法,其中: 估计所述脉冲响应的步骤还包括计算误差因子,并且 计算所述延迟的步骤包括 :如果所述误差因子指示出所述估计出的脉冲响应的良好的信噪比,则基于所述估计出的脉冲响应来计算所述数字化的声学信号与被编码在所述接收到的无线信号中的所述主声音信号之间的延迟。
12.根据权利要求11所述的方法,还包括:如果所述误差因子指示出所述估计出的脉冲响应的良好的信噪比,则对所述估计出的脉冲响应进行高通滤波。
13.根据权利要求12所述的方法,其中,计算所述延迟的步骤包括:如果所述误差因子指示出所述估计出的脉冲响应的良好的信噪比,则通过扫描经高通滤波的所述估计出的脉冲响应来识别经高通滤波的所述估计出的脉冲响应的峰幅值,从而计算所述数字化的声学信号与被编码在所述无线信号中的所述主声音信号之间的延迟。
14.根据权利要求2所述的方法,还包括: 根据所述估计出的脉冲响应来计算传递函数;以及 计算所述传递函数的平均群延迟, 其中,计算所述延迟的步骤包括:通过扫描所述估计出的脉冲响应来识别所述估计出的脉冲响应的峰幅值,以及将与所述估计出的脉冲响应的峰幅值对应的时间和所述传递函数的所述平均群延迟进行比较,从而计算所述数字化的声学信号与被编码在所述无线信号中的所述主声音信号之间的延迟,以及 其中,延迟被编码在所述接收到的无线信号中的所述主声音信号的步骤包括:如果与所述估计出的脉冲响应的峰幅值对应的时间和所述平均群延迟之间的差小于预定值,则用所述计算出的延迟来延迟被编码在所述接收到的无线信号中的所述主声音信号。
15.根据权利要求1所述的方法,还包括循环执行所述感测步骤、所述接收步骤、所述估计步骤和所述计算步骤以计算多个延迟时间,其中,延迟所述主声音信号的步骤包括:如果所述多个延迟时间是一致的,则通过使用所述多个延迟时间的平均值来延迟被编码在所述接收到的无线信号中的所述主声音信号。
16.根据权利要求15所述的方法,还包括: 将所述感测到的声学信号转换为数字化的声学信号;以及 采集所述数字化的声学信号的序列和被编码在所述无线信号中的所述主声音信号的序列, 其中,被编码在所述无线信号中的所述主声音信号是数字的,以及 其中,所述估计步骤包括:基于所述采集到的所述数字化的声学信号的序列和所述采集到的被编码在所述无线信号中的所述主声音信号的序列来估计所述空间的所述脉冲响应,以及 其中,所述感测步骤、所述接收步骤、所述估计步骤以及所述计算步骤每循环执行一次,所述采集到的所述主声音信号的序列就偏移。
17.根据权利要求1所述的方法,其中,估计所述脉冲响应的步骤包括:对所述感测到的声学信号和被编码在所述接收到的无线信号中的所述主声音信号执行去卷积,以估计所述空间的所述脉冲响应。
18.根据权利要求1所述的方法,其中,估计所述脉冲响应的步骤包括:对所述感测到的声学信号和被编码在所述接收到的无线信号中的所述主声音信号执行互相关算法,以估计所述空间的所述脉冲响应。
19.一种用于增强声音的设备,所述设备包括: 麦克风,所述麦克风被配置成用于感测声学信号,所述声学信号响应于主声音信号而被发出并且通过空间传输; 天线,所述天线被配置成用于接收编码有所述主声音信号的无线信号; 处理器,所述处理器被配置成用于: 基于所述感测到的声学信号和被编码在所述接收到的无线信号中的所述主声音信号来估计所述空间的脉冲响应;以及 基于所述估计出的脉冲响应来计算所述感测到的声学信号与被编码在所述接收到的无线信号中的所述主声音信号之间的延迟; 延迟线,所述延迟线被配置成用于通过使用所述计算出的延迟来延迟被编码在所述接收到的无线信号中的所述主声音信号;以及 输出端,所述输出端被配置成用于输出经延迟的所述主声音信号。
20.根据权利要求19所述的设备,还包括: 模拟数字转换器,所述模拟数字转换器用于将所述感测到的声学信号转换为数字化的声学信号;以及 接收器,所述接收器用于接收并且解码被编码在所述无线信号中的所述主声音信号作为数字主声音信号, 其中,估计所述脉冲响应包括基于所述数字化的声学信号和所述数字主声音信号来估计所述空间的所述脉冲响应。
21.根据权利要求20所述的设备,其中,计算所述延迟包括:通过扫描所述估计出的脉冲响应来识别所述 估计出的脉冲响应的峰幅值,从而计算所述数字化的声学信号与所述数字主声音信号之间的延迟。
22.根据权利要求21所述的设备,其中,所述处理器还被配置成用于:计算所述估计出的脉冲响应的平均幅值;以及 将所述估计出的脉冲响应的平均幅值与所述估计出的脉冲响应的峰幅值进行比较以确定峰值与平均值之比, 其中,所述延迟线被配置成用于:如果所述峰值与平均值之比超过预定值,则通过使用所述计算出的延迟来延迟所述数字主声音信号。
23.根据权利要求21所述的设备,其中,所述处理器还被配置成用于: 计算所述估计出的脉冲响 应的幅值的均方根(RMS);以及 将所述估计出的脉冲响应的幅值的RMS与所述估计出的脉冲响应的峰幅值进行比较以确定峰值与RMS之比, 其中,所述延迟线被配置成用于:如果所述峰值与RMS之比超过预定值,则通过使用所述计算出的延迟来延迟所述数字主声音信号。
24.根据权利要求20所述的设备,其中,所述处理器还被配置成用于对所述估计出的脉冲响应进行高通滤波。
25.根据权利要求24所述的设备,其中,计算所述延迟包括:通过扫描经高通滤波的所述估计出的脉冲响应来识别经高通滤波的所述估计出的脉冲响应的峰幅值,从而计算所述数字化的声学信号与所述数字主声音信号之间的延迟。
26.根据权利要求20所述的设备,其中,所述处理器还被配置成用于对所述数字化的声学信号和所述数字主声音信号进行低通滤波,其中,估计所述脉冲响应包括:基于经低通滤波的所述数字化的声学信号和经低通滤波的所述数字主声音信号来估计所述空间的所述脉冲响应。
27.根据权利要求26所述的设备,其中,所述处理器还被配置成用于: 下采样经低通滤波的所述数字化的声学信号;以及 下采样经低通滤波的所述数字主声音信号, 其中,估计所述脉冲响应包括:基于经下采样的经低通滤波的所述数字化的声学信号以及经下采样的经低通滤波的所述数字主声音信号来估计所述空间的所述脉冲响应。
28.根据权利要求20所述的设备,其中,所述处理器还被配置成用于: 计算所述数字主声音信号的功率谱;以及 确定所述数字主声音信号的功率谱是否指示出所述数字主声音信号具有足够的功率,其中,估计所述脉冲响应包括:如果所述数字主声音信号的功率谱指示出所述数字主声音信号具有足够的功率,则估计所述脉冲响应。
29.根据权利要求20所述的设备,其中: 估计所述脉冲响应还包括计算误差因子,并且 计算所述延迟包括:如果所述误差因子指示出所述估计出的脉冲响应的良好的信噪t匕,则基于所述估计出的脉冲响应来计算所述数字化的感测到的声学信号与所述数字主声音信号之间的延迟。
30.根据权利要求29所述的设备,其中,所述处理器还被配置成用于:如果所述误差因子指示出所述估计出的脉冲响应的良好的信噪比,则对所述估计出的脉冲响应进行高通滤波。
31.根据权利要求30所述的设备,其中,计算所述延迟包括:如果所述误差因子指示出所述估计出的脉冲响应的良好的信噪比,则通过扫描经高通滤波的所述估计出的脉冲响应来识别经高通滤波的所述估计出的脉冲响应的峰幅值,从而计算所述数字化的声学信号与所述数字主声音信号之间的延迟。
32.根据权利要 求20所述的设备,其中,所述处理器还被配置成用于: 根据所述估计出的脉冲响应来计算传递函数;以及 计算所述传递函数的平均群延迟, 其中,计算所述延迟包括:通过扫描所述估计出的脉冲响应来识别所述估计出的脉冲响应的峰幅值,以及将与所述估计出的脉冲响应的峰幅值对应的时间和所述传递函数的所述平均群延迟进行比较,从而计算所述数字化的声学信号与所述数字主声音信号之间的延迟,以及 其中,所述延迟线被配置成用于:如果与所述估计出的脉冲响应的峰幅值对应的时间和所述平均群延迟之间的差小于预定值,则用所述计算出的延迟来延迟所述数字主声音信号。
33.根据权利要求19所述的设备,其中,所述处理器被配置成用于计算多个延迟时间,并且其中,所述延迟线被配置成用于:如果所述多个延迟时间是一致的,则通过使用所述多个延迟时间的平均值来延迟被编码在所述接收到的无线信号中的所述主声音信号。
34.根据权利要求33所述的设备,还包括: 模拟数字转换器,所述模拟数字转换器用于将所述感测到的声学信号转换为数字化的声学信号, 接收器,所述接收器用于接收并且解码被编码在所述无线信号中的所述主声音信号作为数字主声音信号, 其中,所述处理器还被配置成用于采集所述数字化的声学信号的序列和所述数字主声音信号的序列, 其中,估计所述脉冲响应包括:基于所述采集到的所述数字化的声学信号的序列和所述采集到的所述数字主声音信号的序列来估计所述空间的所述脉冲响应,以及 其中,所述处理器还被配置成用于在计算所述多个延迟时间中的每一个延迟时间之间偏移所述采集到的所述主声音信号的序列。
35.根据权利要求19所述的设备,其中,估计所述脉冲响应包括:对所述感测到的声学信号和被编码在所述接收到的无线信号中的所述主声音信号执行去卷积,以估计所述空间的所述脉冲响应。
36.根据权利要求19所述的设备,其中,估计所述脉冲响应包括:对所述感测到的声学信号和被编码在所述接收到的无线信号中的所述主声音信号执行互相关算法,以估计所述空间的所述脉冲响应。
37.一种被编程有软件指令的计算机可读介质,所述软件指令在由处理器运行时使得所述处理器执行以下步骤: 基于感测到的声学信号和被编码在接收到的无线信号中的主声音信号来估计空间的脉冲响应; 基于所述估计出的脉冲响应来计算所述感测到的声学信号与被编码在所述接收到的无线信号中的所述主声音信号之间的延迟;以及输出所述计算出的延迟以用于延迟被编码在所述接收到的无线信号中的所述主声音信号 。
全文摘要
一种增强声音的方法。该方法包括通过使用电子设备中的麦克风来感测声学信号。声学信号响应于主声音信号而被发出并且作为声波通过空间传输。该方法还包括通过使用电子设备中的天线来接收编码有主声音信号的无线信号。基于感测到的声学信号和被编码在接收到的无线信号中的主声音信号来估计空间的脉冲响应。基于估计出的脉冲响应来计算感测到的声学信号与被编码在接收到的无线信号中的主声音信号之间的延迟。通过使用计算出的延迟对被编码在接收到的无线信号中的主声音信号进行延迟以及再现,以增强被电子设备的用户听到的声学信号。
文档编号G06F15/00GK103229160SQ201180053625
公开日2013年7月31日 申请日期2011年10月7日 优先权日2010年10月7日
发明者詹姆斯·E·梅耶 申请人:孔塞尔特松尼奇有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1