用于测定声学信号起源的可安装的声音捕捉和重现装置的制作方法

文档序号:11291473阅读:275来源:国知局
用于测定声学信号起源的可安装的声音捕捉和重现装置的制造方法
本说明书涉及可安装在听力保护耳机上的声音捕捉和重现装置,以及从两个麦克风获取一个或多个声学信号的组合的起源的方法。
背景技术
:包括听力保护器(包括佩戴在用户耳朵上的保护耳罩)的听力保护装置是众所周知的,并且具有多种应用,包括工业应用和军事应用。听力保护装置、听力保护耳机和耳机在通篇中可互换使用。听力保护装置的一个常见缺点是:此类装置减弱了用户辨别声源起始位置的能力。这种概念可被理解为空间情境意识。外耳(即,耳廓)改善双耳听力的空间线索,并增强大脑处理这些线索以及定位声音的能力。当佩戴耳机时,外耳被覆盖,导致外耳功能失真。无论是在工业应用中还是军事应用中,对声源空间位置的这类测定对于用户的情境意识都很重要。对听力保护装置佩戴者而言,需要增强对声学信号的性质和位置的测定。技术实现要素:在一个方面,本说明书涉及声音捕捉和重现装置。声音捕捉和重现装置包括定位于两个区域处的两个麦克风和处理器。处理器被配置成接收来自定位于两个区域处的两个麦克风的一个或多个声学信号,在两个麦克风之间比较所述一个或多个声学信号,并相对于装置取向定量地测定所述一个或多个声学信号的起源。处理器可被配置成同步接收来自两个麦克风的一个或多个信号。处理器还可被配置成对所述一个或多个声学信号进行分类。声音捕捉和重现装置还可包括能够提供输出以用于测定装置取向的方向传感器。处理器还可被配置成从方向传感器接收输出以测定装置取向。另外,装置可包括分别在三个或四个区域处的三个或可能四个麦克风。在另一个实施方案中,装置可包括多于四个麦克风。在一个实施方案中,装置将佩戴在用户的头上。在另一方面,本说明书涉及从两个麦克风获取一个或多个声学信号的组合的起源的方法。该方法包括以下步骤:捕捉一个或多个声学信号,在两个麦克风之间比较一个或多个声学信号,以及相对于装置取向定量地测定所述一个或多个声学信号的起源。该方法还可包括对所述一个或多个声学信号进行分类和/或测定装置取向的步骤。附图说明图1为根据本说明书的声音捕捉和重现装置的透视图。图2为根据本说明书的装置的框图。图3a至图3c为根据本说明书的声音捕捉和重现装置的透视图。图4为从两个麦克风获取一个或多个声学信号的组合的起源的方法的流程图。图5示出了用于表征波矢量的坐标系。图6为示出了获取声学信号的起源的方法的流程图。图7为实现用于测定声学信号位置的广义互相关函数估计的子系统的框图。图8为基于波达时间差的输入估计声学信号的来波方向角的互相关函数的框图。图9为示出了不同麦克风组合的实际与估计的来波角的曲线图。附图未必按照比例绘制。附图中使用的相似数字指示相似的部件。然而,应当理解,在给定附图中使用数字指示部件并非旨在限制另一附图中用相同数字标记的部件。具体实施方式在以下优选实施方案的具体描述中参考了附图,这些附图示出了可实践本发明的具体实施方案。示出的实施方案并非旨在囊括根据本发明的所有实施方案。应当理解,在不脱离本发明范围的情况下,可利用其他实施方案,并且可进行结构性或逻辑性的修改。因此不能认为以下的具体实施方式具有限制意义,并且本发明的范围由所附的权利要求限定。除非另外指出,否则说明书和权利要求书中使用的表达特征尺寸、数量和物理特性的所有数字均应理解为在所有情况下均由术语“约”修饰。因此,除非有相反的说明,否则在前述说明书和所附权利要求书中列出的数值参数均为近似值,这些近似值可根据本领域的技术人员利用本文所公开的教导内容来寻求获得的期望性能而变化。除非本文内容以其它方式明确指定,否则本说明书和所附权利要求中使用的单数形式“一个”、“一种”和“所述”涵盖具有多个指代物的实施方案。除非本文内容以其它方式明确指定,否则本说明书和所附权利要求书中使用的术语“或”一般以其包括“和/或”的意义使用。若在本文使用空间相关的术语,包括但不限于“近侧”、“远侧”、“下部”、“上部”、“下方”、“下面”、“上面”、和“在顶部上”,则用于方便描述一个或多个元件相对于另一个元件的空间关系。除了图中示出的或本文所述的具体取向外,此类空间相关术语还涵盖装置在使用或操作时的不同取向。例如,如果图中所描绘的对象翻转或倒转,则先前描述为在其他元件下面或下方的部分就应当在这些其他元件上面或在其顶部上。如本文所用,例如当元件、部件或层被描述为与另一元件、部件或层形成“一致界面”,或在“其上”、“连接到其”、“与其耦合”、“堆叠其上”或“与其接触”,则可为直接在其上、直接连接到其、直接与其耦合、直接堆叠其上或直接与其接触,或者例如居间的元件、部件或层可在特定元件、部件或层上,或连接到、耦合到或接触特定元件、部件或层。例如,当元件、部件或层例如被称为“直接位于”另一元件“上”、“直接连接到”另一元件、“直接与”另一元件“耦合”或“直接与”另一元件“接触”时,不存在居间的元件、部件或层。如上所述,由于覆盖了外耳和其帮助大脑处理声音定位的空间线索的能力,目前使用的耳机存在减弱用户辨别声源起始位置的能力的常见缺点。因此,对听力保护装置的佩戴者而言,需要增强对声学信号测定和定位。本说明书提供对该需求的解决方案和增强听力保护装置用户的空间情境意识的装置。图1提供根据本说明书的声音捕捉和重现装置100的透视图。如图1所示,在一个实施方案中,声音捕捉和重现装置可佩戴在用户的头上,例如,作为具有提供在用户耳朵上的保护耳罩的听力保护装置的一部分。如在本公开通篇中所用,重现可指声源位置信息(诸如,听觉、视觉和触觉反馈)的重现。声音捕捉和重现装置100包括至少两个麦克风。该装置包括定位在装置112的第一区域中的第一麦克风102。另外,该装置包括定位在装置114的第二区域中的第二麦克风104。第一麦克风102和第二麦克风104通常定位在两个区域(112,114)处,这两个区域对于精确地测定一个或多个声学信号的起源是最佳的。可用作第一麦克风102和第二麦克风104的示例性麦克风为来自加利福尼亚州圣何塞市的应美盛公司(invensenseofsanjose,ca)的inmp401mems麦克风。声音捕捉和重现装置100还包括处理器106,该处理器可定位于保护耳罩内、装置的头环中或者另一适当位置中。处理器106被配置成使用从麦克风102,104获取的输入来执行多种功能。处理器被配置成接收来自两个麦克风(第一麦克风102和第二麦克风104)的一个或多个声学信号,并且在两个麦克风之间比较所述一个或多个声学信号。利用这种比较,处理器106能够相对于装置取向定量地测定关于所述一个或多个声学信号的起源的信息。对声学信号的这种定量测定(包括计算起源)可包括例如测量信号的方位角、仰角、距离或空间坐标。可通过参考图2中的框图获得对系统的更好理解。处理器106可包括例如一个或多个通用微处理器、专门设计的处理器、专用集成电路(asic)、现场可编程门阵列(fpga)、离散逻辑的集合和/或能够执行本文所述技术的任何类型的处理装置。在一些实施方案中,处理器106(或本文所述的任何其他处理器)可被描述为计算装置。在一些实施方案中,存储器108可被配置成存储程序指令(例如,软件指令),所述程序指令也由处理器106执行,以实现本文所述的过程或方法。在其他实施方案中,本文所述的过程或方法可由处理器106的专门编程的电路执行。在一些实施方案中,处理器106因此可被配置成执行用于获取本文所述一个或多个声学信号的组合的起源的技术。处理器106(或本文所述的任何其他处理器)可包括一个或多个处理器。处理器还可包括存储器108。存储器108存储信息。在一些实施方案中,存储器108可存储用于执行本文所述的方法或过程的指令。在一些实施方案中,声音信号数据可预先存储在存储器108中。来自声音信号的一种或多种特性,例如类别、相位、幅度等,可存储为材料特性数据。存储器108可包括任何易失性或非易失性存储元件。示例可包括随机存取存储器(ram)(诸如同步动态随机存取存储器(sdram))、只读存储器(rom)、非易失性随机存取存储器(nvram)、电可擦可编程只读存储器(eeprom)和闪存。示例还可包括硬盘、磁带、磁性或光学数据存储介质以及全息数据存储介质。在一些实施方案中,处理器106可被配置成同步接收来自两个麦克风的一个或多个声学信号。采集同步的声学信号允许准确快速的分析,因为处理器106在测定声源起源之前使数据对齐或相关所需的时间和资源被最小化。同步化维护数据完整性、一致性和格式,从而允许进行可重复得采集、获得一致的比较结果以及进行精确的计算。所述一个或多个声学信号可在频率、幅度、相位或波长方面同步。在一些实施方案中,在处理器106同步接收声学信号的情况下,该处理器可同时接收这些信号,而在其他实施方案中,该处理器将依次接收信号。同时接收的优点在于,可在采集和传送到处理器106时立即开始用于测定声源起源的方法。在至少一个实施方案中,处理器106还可被配置成对所接收的一个或多个声学信号进行分类。对声学信号或信号进行分类可包括辨别信号是否属于一种或多种类别,包括:背景噪声、语音和脉冲声音。在一个实施方案中,处理器可被配置成以成对方式基于分类在两个麦克风之间比较一个或多个声学信号,如图7中进一步所述。本说明书的声音捕捉和重现装置100还可包括输入/输出装置112和用户界面114,以提供关于声源位置的视觉反馈、听觉反馈、触觉反馈或触感反馈。在反馈为听觉反馈的情况下,提供关于声源位置的视觉反馈、听觉反馈、触觉反馈或触感反馈的装置可为扬声器。在反馈为视觉的情况下,反馈可为例如位于用户视野中的闪烁的灯。输入/输出装置112可包括被配置成从用户或其他装置输入信息或者输出信息到用户或其他装置的一个或多个装置。在一些实施方案中,输入/输出装置112可呈现用户界面114,其中用户可为声音捕捉和重现装置定义操作并设置类别。例如,用户界面114可包括用于向用户呈现视觉信息的显示屏幕。在一些实施方案中,显示屏幕包括触敏显示器。在一些实施方案中,用户界面114可包括用于向用户呈现信息的一种或多种不同类型的装置。用户界面114可包括例如任何数量的视觉(例如,显示装置、灯等)、听觉(例如,一个或多个扬声器)和/或触感(例如,键盘、触摸屏或鼠标)反馈装置。在一些实施方案中,输入/输出装置112可表示显示屏幕(例如,液晶显示器或发光二极管显示器)和/或打印机(例如,印刷装置或用于输出指令到印刷装置的部件)中的一者或多者。在一些实施方案中,输入/输出装置112可被配置成接受或接收程序指令(例如,软件指令),所述程序指令由处理器106执行,以实现本文所述的实施方案。声音捕捉和重现装置100还可包括其他部件以及所示部件(包括处理器106、存储器108)中任一者的功能,并且输入/输出装置112可跨多个部件和单独的装置(例如,计算机)分布。声音捕捉和重现装置100可连接为工作站、台式计算装置、笔记本计算机、平板计算机,移动计算装置或任何其他合适的计算装置或计算装置的集合。声音捕捉和重现装置100可在本地网络上操作或者托管在云计算环境中。声音捕捉和重现装置可另外包括方向传感器110。方向传感器110能够提供输出,用于测定相对于操作装置所处的环境的装置取向。尽管方向传感器110可安装在保护耳罩上,但也可安装在声音捕捉和重现装置上的任何适当位置处(例如,在保护耳罩之间的头环上),该位置使该方向传感器可正确地测定装置取向。在一个实施方案中,方向传感器110可包括加速度计。在另一个实施方案中,方向传感器110可包括陀螺仪。另选地,方向传感器110可包括指南针。在一些实施方案中,这些元件的组合或全部三个可构成取向。在一些实施方案中,方向传感器110将能够提供用于定位的参考点。方向传感器110的示例可包括来自加利福尼亚州圣何塞市的应美盛公司(invensenseofsanjose,ca)的itg-3200三轴数字输出陀螺仪(itg-3200triple-axisdigital-outputgyroscope)、来自马萨诸塞州诺伍德的亚德诺半导体公司(analogdevicesofnorwood,ma)的adxl345三轴加速度计(adxl345triple-axisaccelerometer)或者来自新泽西州莫里斯维尔的霍尼韦尔公司(honeywellofmorrisville,nj)的hmc5883l三轴数字式磁力计(hmc5883ltripleaxisdigitalmagnetometer)。通信接口116可为网络接口卡,诸如以太网卡、光收发器、射频收发器或者可发送和接收信息的任何其他类型的装置。此类通信接口的其他示例可包括移动计算装置中的蓝牙、3g、4g和wifi无线电,以及usb。在一些示例中,声音捕捉和记录装置100利用通信接口116与外部装置诸如移动计算装置、移动电话、工作站、服务器或者其他联网的计算装置进行无线通信。如本文所述,通信接口116可被配置成接收如处理器106所指示的声音信号类别、更新和配置设定。在本说明书的声音捕捉和重现装置100定位于具有保护耳罩的耳机上的情况下,麦克风102,104(以及,在适用情况下,可能的其他麦克风)可集成有声音控制能力。声音控制能力可包括对由麦克风102和104接收的声音进行滤波、放大、衰减的能力。另外,保护耳罩可具有至少一定的无源降噪或消音能力,以及从外部设置在听力保护装置上的麦克风、设置在保护耳罩中的扬声器和用于放大由麦克风接收的声学信号并将信号传递到扬声器上的放大器,诸如在共同拥有和转让的pct公开no.wo2006/058319中所述,该公开据此全文以引用方式并入本文中。在此类实施方案中,扬声器能够不传输由麦克风接收的高于一定分贝级或声压级或者对应于脉冲事件(例如,枪声或嘈杂的机械噪声)的信号。声音捕捉和重现装置100可包括将信息馈送到处理器106的多于两个麦克风。例如,装置可包括位于第三区域118处的第三麦克风107,其中这三个区域112、114和118中的每一者得到了最佳定位,以最有效地测定声学信号定位。在此类情况下,处理器106将接收并在所有三个麦克风之间比较声学信号。另选地,装置可包括最佳定位在四个区域处的四个麦克风,其中处理器接收并在所有四个麦克风之间比较声学信号。事实上,该装置可包括任何其他合适数量的麦克风,例如五个、六个、七个、八个或更多个,因为更大数量的麦克风将有助于更准确地定位声音的位置。在一些实施方案中,本文所述的麦克风可包括全向性麦克风(即,从所有方向获取声音的麦克风)。然而,为了有助于声源定位和改善麦克风之间的信号差异,可使用定向麦克风,或者可在给定麦克风区域附近添加机械特征结构以集中或者扩散来自特定方向的声音。图3a至图3c表示一种实施方案,其具有在第一保护耳罩109上的第一麦克风102、第二麦克风104和第三麦克风107,在第二保护耳罩119上的第四麦克风122、第五麦克风124和第六麦克风127,以及在连接第一保护耳罩和第二保护耳罩的头环上的第七麦克风128。在另一方面,本说明书涉及从两个麦克风获取一个或多个声学信号的组合的起源的方法。如图4中的流程图所示,该方法包括以下步骤:捕捉一个或多个声学信号(301)、比较来自两个麦克风的一个或多个声学信号(302),以及相对于装置取向定量地测定所述一个或多个声学信号的起源(303)。在一些实施方案中,可使用处理器(诸如,上述处理器106)来执行比较信号和定量测定其起源的步骤。尽管在图4中未示出,但是该方法可包括对所述一个或多个声学信号进行分类的另一步骤,诸如以上述方式和参考图7。该方法还可包括使用例如方向传感器110来测定装置取向的步骤。另外,该方法可为从三个、四个、五个或更多个麦克风获取一个或多个声学信号的组合的起源的方法,在这种情况下,由处理器比较来自麦克风中每一个的声音信号。处理器凭其能够通过比较来自不同位置处的不同麦克风的声学信号或信号来定位声音的数学方法涉及使用处理器比较从两个或更多个麦克风接收的声学信号的相移。为了进一步详细地用数学方法描述系统的功能,我们可引入以下表1中定义的元素:表1符号定义r[x,y,z]a(r,t)声波幅度k波矢量ri[kx,ky,kz]a(ri,t)位置ri处的声波幅度xi(t)麦克风i处的声波的时间序列τij麦克风i和麦克风j之间的波达时间差f傅里叶变换算符d麦克风位置差异从位于球面坐标处的源以任意方向进入的波的公式由公式1给出,公式1:a(r,t)=a0e-i(kr+ωt)其中k为波矢量,其为波数到在空间中以任意方向传播的波的延伸。让每个麦克风(以i标记)的位置由表示其笛卡尔坐标的矢量ri=[xi,yi,zi]表示。图5中提供了此类坐标系的图示。然后,每个麦克风所测量的波由公式2给出,公式2:到达不同麦克风的声波相对于彼此延迟。两个麦克风(以i和j标记)之间的相位差由公式3给出,公式3:τij=kt(ri-rj)如果我们有n麦克风阵列,就有n(n-1)/2个麦克风对。公式4:r(τ)=∫xi(t+τ)xi(t)dt公式5:公式6:τij=argmaxτ|r(τ)|公式7:公式8:τ12=kt(r1-r2)公式9:τn(n-1)=kt(rn-rn-1)公式10:τ=dk公式11:k=(dtd)-1dtτ公式12:公式13:公式14:公式15:方位角:公式16:仰角:如果两个或更多个麦克风共线,则公式10简化为标量方程,其解为:公式17:声源的模糊角度将为:公式18:如果麦克风非共面,则观察到唯一k。三个麦克风总是共面。也可存在多于三个麦克风,但是它们都位于单个平面上。在此类情况下,该系统可解,但是将得到变量k的多个解。那么,该解将意味着声源位于由麦克风限定的平面的任一侧上的特定角度处。解将为:公式19:k=(dtd)-1dtτ公式20:公式21:公式22:公式23:方位角:公式24:仰角:θ不确定。由至少4个麦克风和至少一个与其他麦克风不在同一平面内的麦克风组成的系统将导致公式中存在三个变量。然而,任意三个麦克风限定一个平面。为了克服这个问题,需要来自第四非平面麦克风的信息,使得det(dtd)≠0,这就是说d为非奇异的。这样,在数学上,用于明确地鲁棒计算3d角度的优选模式将包括至少四个麦克风,如公式10至公式16所示。图6中示出了流程图,该流程图示出了如上所述获取声学信号的起源的方法。实施例实施例1:申请人创造了作为听力保护装置的一部分的声音捕捉和重现装置,该听力保护装置包括两个保护耳罩和连接保护耳罩的头环。分别在两个保护耳罩上以三角形布置排列三个来自加利福尼亚州圣何塞市的应美盛公司(invensenseofsanjose,ca)的inmp401mems麦克风。另外,将两个来自加利福尼亚州圣何塞市的应美盛公司(invensenseofsanjose,ca)的inmp401mems麦克风定位在头环上。每个麦克风的坐标和位置提供于表2中:表2:麦克风坐标其中:lf=左前,lt=左上,lb=左后,rf=右前,rt=右上,rb=右后,tf=顶前,tb=顶后。八麦克风阵列提供了执行测量子集和确定哪些麦克风配置具有良好定位性能的灵活性。将麦克风阵列耳机布置在来自丹麦霍特的g.r.a.s声音与振动公司(g.r.a.ssoundandvibrationofholte,denmark)的45bbkemar头和躯干非装配人体模型(45bbkemarhead&torso,non-configuredmanikin)上。将来自马萨诸塞州弗雷明汉的博士公司(offramingham,ma)的soundlink无线扬声器定位于距离约5m处以用作声源。保持45bbkemar头和躯干非装配人体模型(45bbkemarhead&torso,non-configuredmanikin)和声源之间的仰角恒定在0度或者接近0度。在测试期间,45bbkemar头和躯干非装配人体模型(45bbkemarhead&torso,non-configuredmanikin)的头沿着0至360度的方位角旋转。麦克风连接到来自德克萨斯州奥斯汀的美国国家仪器公司(nationalinstrumentsofaustin,tx)的niusb-6366daq模块。使用八个不同的麦克风通道同时进行声音信号的采集,每个通道具有100khz的采样率。labview(来自德克萨斯州奥斯汀的美国国家仪器公司(nationalinstruments,austin,tx))软件被用作用从通道采集和后处理声学信号的接口。在后处理期间,labview软件计算了成对的广义互相关函数(gcc)并确定了gcc的全局最大峰值,以确定波达时间差(tdoa)。然后,将tdoa传递到过程块中,该过程块实现了用于估计声波在麦克风阵列处的来波角的方法。图6提供用于测定声学信号的起源的方法的更详细示例的框图。该示例的输入由记录在多个麦克风处的空气声波引起的声压变化组成。通过使用同步的模数转换器(adc)将模拟信号转换成数字信号。adc可集成到麦克风中或者在麦克风换能器系统外部。adc均通过同步信号同步。来自这些多个通道的信号被多路复用以在嵌入式处理器、数字信号处理器或计算系统上进行处理。同步信号和多路复用信号被成对处理,以便例如计算角度广义互相关函数。图7中示出了广义互相关函数。将广义互相关函数(gcc)输入到发现gcc的全局最大峰值的子系统中以计算波达时间差。然后将信号的到达时差传递到处理器中,该处理器实现用于估计在麦克风阵列处的声波的来波角的方法,如图8中所示。最后阶段涉及实现听觉或视觉显示系统的处理器,用于提醒用户声源的方向。图8示出了使用广义互相关函数的框图,该函数将波达时间差作为输入并估计来波方向角。将成对的波达时间差和麦克风坐标输入到使用诸如图8所示的算法计算声波的来波角的子系统中。基于n(n-1)/2个成对的波达时间差构建波达时间距离的矩阵,其中n为麦克风的数量。实施例2:按照实施例1和上文所公开的方法,申请人测试了多种不同的麦克风数量和位置组合。在图9中以曲线图示出了测试的结果,该曲线图绘出了使用不同麦克风组合的情况下实际来波角与估计来波角的关系。基于所示的结果,与八个麦克风的情况相比,在耳机的每一侧(lf-lt和rf-rb)上具有非对称布置的四麦克风配置提供了良好的结果。确定的是,用于方位定位的另一种良好布置包括在耳机的一侧上(例如,在一个保护耳罩上)布置三个麦克风并在耳机的头环顶部上或相对侧上布置一个麦克风。这种布置在最小化几何校准(即,麦克风之间的固定距离)方面提供了优势,因为大多数麦克风定位在一侧上。虽然本文已举例说明并描述了具体实施方案,但本领域的普通技术人员应当理解,在不脱离本公开的范围的情况下,可用各种替代形式和/或等同形式的具体实施来代替所示出的和所描述的具体实施方案。本申请旨在涵盖本文所讨论的具体实施方案的任何改型或变型。因此,本公开旨在仅受权利要求及其等同形式的限制。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1