用于检测目标声音的系统和方法与流程

文档序号:19079232发布日期:2019-11-08 22:03阅读:454来源:国知局
用于检测目标声音的系统和方法与流程

本申请要求以下美国临时专利申请的优先权:2017年3月1日提交的us62/465,548;2017年7月7日提交的us62/529,657;和2017年8月21日提交的us62/548,337。

本发明涉及用于检测目标声音的音频传感器系统和信号处理,例如可以在车辆应用中用于检测目标声音,例如汽笛的声音。



背景技术:

大多数辖区的公路交通法规要求车辆向紧急车辆让行。然而,现代车辆的车厢与外界噪音隔绝良好,并且对汽笛的使用和汽笛的音量有所限制以防止噪声污染。这些和其它因素使司机难以察觉到由紧急车辆发出的汽笛声。此外,半自动或全自动车辆必须能够检测到紧急车辆,以便在法律范围内安全运行。

汽车应用中的传感系统可能使用各种类型的传感器,但是每种都有缺陷。使用相机捕获图像的光学系统或用于捕获反射光(激光雷达)的光学传感器,受限于“视线(line-of-sight)”、相对昂贵,并且需要功能强大的处理器来处理大量的数据。检测反射无线电波的雷达系统数据密集程度较低,但提供的信息要少得多。检测反射超声波的系统仅在短距离内有用,并且仅限于诸如停车辅助传感器的应用。

使用音频传感器的系统面临着挑战。首先,这样的系统需要足够灵敏,使得能够在远处检测和辨别微弱的噪声,而不会被近距离的噪声淹没。其次,可检测到的声音在不同的环境和操作条件下的差异很大。例如,北美紧急车辆的汽笛通常具有的音调(pitch)在约500hz至约2000hz之间的频带内呈周期性变化,但是不同汽笛之间的频率范围和循环周期仍然变化很大,而欧洲的汽笛通常在两个不连续的频率之间交替。此外,由紧急车辆和感应汽车之间的相对运动而引起的多普勒效应(dopplereffect),使感知到的汽笛音调可能显著地更高或更低。

本领域需要一种用于检测紧急车辆汽笛的有效的汽车音频检测系统。



技术实现要素:

在一个方面,本发明包括用于检测目标声音的系统,所述系统包括至少一个音频传感器,其用于产生样本声音信号以响应于样本声波,以及非暂时性计算机可读存储器,其可操作地连接到计算机处理器的并且存储多个数字目标声音模板,该多个数字目标声音模板根据转换参数通过转换目标声音的多个样本而产生,以及可由计算机处理器执行的一组指令,以实现包含下列步骤的方法:

(a)从音频传感器接收样本声音信号;

(b)根据转换参数将样本声音信号转换为数字样本向量(digitalsamplevector);

(c)将样本向量与每个模板进行比较,以确定向量和任何一个模板的相似程度是否超过预定的阈值;以及

(d)如果超过阈值则产生输出信号。

在一个实施例中,该系统包括至少三个音频传感器,且该方法包括,对于至少三个音频传感器中的每一个,执行权利要求1中的步骤(a)至(c),确定超过阈值的时间指标(timeindex);并且基于所确定的时间指标确定样本声波的方向角。

在一个实施例中,目标声音是在频率下限和频率上限之间扫描(sweep)的汽笛,模板既可以表示限制在频率下限和频率上限范围内的窄频带的数据;或者也可以表示在窄频带内的至少一个特定频率。

在另一实施例中,目标声音是在一个较低频率和一个较高频率之间交替的汽笛,且模板既可以表示受限于以较低频率为中心的较低窄频带以及以较高频率为中心的较高窄频带的数据;或者也可以表示在每个较低窄频带和较高窄频带内的至少一个特定频率。

在一个实施例中,该系统还包括对数放大器(logarithmicamplifier),其可操作地连接到音频传感器,用于在样本声音信号转换为向量之前放大样本声音信号。该对数放大器可以包括从对数放大器的输出端到输入端的反馈回路,其中该反馈回路包括并联的第一和第二电路路径,其中第一电路路径包括第一二极管,第二电路路径包括第二二极管,其中,第一二极管和第二二极管相对于对数放大器的输入和输出端具有不同的极性,这使得对数放大器为正负输入电压提供对称的输出电压。

在一个实施例中,转换参数包括声音信号的n位编码,其中n小于或等于8,且优选为1、1.5或2。在一个示例性实施例中,n为1,且转换参数是电压水平交叉(voltagelevelcrossing)。

在一个实施例中,样本向量和目标声音模板中的一个或二者小于约10000位长(bitslong)、或5000位长、或1000位长或100位长。

在一个实施例中,系统包括两个或多个音频传感器,并且来自每个音频传感器的声音信号分别通过步骤(a)至(d)处理。如果存在三个或多个音频传感器,并且来自每个音频传感器的声音信号用时间指标组件分别处理,则时间指标的差用于确定目标声音的相对方向。可周期性地确定目标声音的方向,以确定目标声音的相对运动。

在一个实施例中,该系统可以包括通知子系统(notificationsubsystem),以向人类用户或自动系统提供声音检测信息,其中该信息可包括一个或多个目标声音的身份、目标声音的相对位置或目标声音的相对运动。

在另一方面,本发明可以包括一种用于检测目标声音的方法,该方法包括以下步骤:

(a)提供至少一个数字目标声音模板,该数字目标声音模板根据转换参数转换目标声音的至少一个样本而产生;

(b)接收由至少一个音频传感器产生的样本声音信号以响应于样本声波;

(c)根据相同的转换参数将样本声音信号转换为数字样本向量。

(d)将样本向量与至少一个模板进行比较,以确定向量与至少一个模板的相似程度是否超过预定的阈值;以及

(e)如果超过阈值则产生输出信号。

在一个实施例中,至少两个样本声音信号由至少两个音频传感器产生,且所述方法还包括以下步骤:对至少两个音频传感器中的每一个执行步骤(b)至(d),且确定超过所述阈值的时间指标;并基于所确定的时间指标之间的差来确定目标声音的方向。

在一个实施例中,该方法可进一步包括在转换为样本向量之前,对样本声音信号以对数的方式(logarithmically)放大的步骤。

在一个实施例中,转换参数包括声音信号的n位编码,其中n小于或等于8,且优选为1、1.5或2。在一个示例性实施例中,n为1,转换参数是电压水平交叉。

在一个实施例中,样本向量和目标声音模板中的一个或二者小于约10000位长、5000位长、1000位长或100位长。

在一个实施例中,该方法的步骤(b)至(e)在车辆上实时执行,并且目标声音由汽笛产生。

在一个实施例中,该方法的步骤(c)和(d)仅涉及整数数学(integermath)。

在另一方面,本发明可包括实时检测目标声音的连续方法,包括步骤:(a)接收由至少一个音频传感器产生的样本声音信号以响应于样本声波;(b)根据转换参数以对数的方式放大样本声音信号,并将放大的声音信号转换为数字样本向量;(c)将样本向量与从使用相同转换参数的汽笛中产生的至少一个模板进行比较,以确定向量与至少一个模板的相似程度是否超过预定的阈值;以及(d)如果超过阈值则产生输出信号。优选地,步骤(c)仅涉及整数数学。

附图说明

在说明书所示的附图中,相同的元件可以被赋予相同的附图标记。附图不一定按比例绘制,而应将重点放在本发明的原理上。另外,所示实施例中的每一个仅是利用本发明的基本概念的许多可能布置中的一个。

图1示出了在道路上行驶时,配备有本发明系统的实施例的车辆,以及发出汽笛声的紧急车辆。

图2为本发明系统的实施例的示意图。

图3为本发明方法的实施例的流程图。

图4a和图4b分别为表示在一定输入电压范围内,非对数放大器和对数放大器的输出电压的图表。

图5为本发明的对数放大器的实施例的示意图。

图6为本发明要处理的模拟样本声音信号随时间的振幅变化图。

图7为示出了汽笛扫描的频率随时间的变化,其较低和较高的多普勒频移的变化,以及三个检测频率的示例的图表。

图8为示出了不同周期性的两个汽笛扫描的频率随时间的变化,以及三个检测频率的示例的图表。

图9为示出了本发明具有相关峰值(correlationspike)的相关器(correlator)随时间输出的示例的图表。

图10a为示出了本发明具有周期相关峰值(periodiccorrelationpeaks)的相关器随时间输出的示例的图表。

图10b为示出了图10a的图表中已计算的相关包络(correlationenvelope)的示例的图表。

图11为本发明用于检测汽笛声的方法的实施例的流程图,包括对由多个扬声器产生的样本声音信号的并行处理,对检测到的汽笛声的确认,以及对检测到的汽笛声的方向确定。

具体实施方式

定义本文未明确定义的任何术语或表述应具有本领域技术人员理解的其通常接受的定义。如本文所用,以下术语具有以下含义。

“音频传感器(audiosensor)”指的是检测声波并将其转换为电信号的设备。在一个实施例中,音频传感器可以是扬声器。

“计算机处理器(computerprocessor)”指的是能够处理输入电子信号以产生输出电子信号的电子设备。在实施例中,计算机处理器可以包括通常被称为可编程逻辑控制器、印刷电路板以及集成电路等的一个或多个设备。“计算设备”包括至少一个计算机处理器。

“非暂时性计算机可读存储器(non-transitorycomputer-readablememory)”是指能够以计算机处理器的可读格式存储数据和/或指令的有形介质(tangiblemedium)。在实施例中,非暂时性计算机可读存储器可包括磁性介质、光学介质或固态介质。

“目标声音(targetsound)”指的是意在待检测的特定声音。目标声音可以在人类可听频谱内,或者在人类可听频谱之外(例如,超过20khz的超声波声音)。作为非限制性示例,目标声音可以是由紧急车辆汽笛产生的声音、另一车辆的喇叭声、用于视力受损的行人的人行横道辅助声音、指示车辆失控的打滑轮胎(skiddingtires),车辆与其它车辆或物体碰撞、动物噪音或人类的声音。

“车辆(vehicle)”是指用于运输人员和货物的装置。作为非限制性实施例,车辆可以是汽车、摩托车、卡车或公共汽车。车辆可以是非自动的、半自动的或完全自动的。

“车辆控制系统(vehiclecontrolsystem)”指的是控制车辆动力的任何方面的系统,或者是提供与车辆动力的任何方面的相关信息的系统。车辆控制系统不同于用于娱乐车辆驾驶员或乘员的车辆娱乐系统。例如,gps导航系统可以被认为是车辆控制系统的一部分,因为它向驾驶员提供关于车辆行进方向的有用信息,即使gps导航系统可以与通常被称为“信息娱乐(infotainment)”的系统结合在一起。

概述图1示出了道路(12)上的车辆(10),其中接近的紧急车辆(14)发出如声波(16)所示的汽笛声。车辆(10)配备有本发明的系统(100)的实施例,用于检测作为目标声音的汽笛声,其具有由区域(18)表示的检测范围。在该示例中,车辆(10)还配备有光学传感系统、雷达传感系统和超声波传感系统,其具有分别由区域(20)、(22)和(24)表示的检测范围。系统(100)可以在原有制造期间安装在车辆(10)中或者在改装操作期间作为售后系统。多个系统(100)可以由车辆上的计算设备进行同步,或者可以由车辆网络自行同步,或者通过点对点(peer-to-peer)进行同步。

图2是本发明的系统(100)的实施例的示意图,且图3是本发明的方法的实施例的流程图。在这些实施例中,至少一个音频传感器(102)产生样本声音信号以响应于检测到的样本声波(步骤300)。可选地,滤波器(104)按频率对信号进行过滤(步骤302)。可选地,对数放大器电路(“对数放大器”)(106)放大过滤后的信号(步骤304),如下所述。之后由分析模块(110)接收模拟信号,且在电压水平检测器(108)中将样本声音信号从模拟形式转换为数字样本向量(步骤306),其有效地起到了模数(a/d)转换器的作用。

将样本向量存储在缓冲器中(步骤308)以进行处理。分析模块(110)包括比较器(112),其将样本向量与存储的数字目标声音模板进行比较。相关器(114)确定向量和模板之间相似度的度量(metric)以检测目标声音(步骤310至316)。可选地,分析模块(110)包括能量检测器(116),其使用振幅测量来确认检测到的目标声音具有足够的能量作为接近车辆(10)的目标声音(步骤318至320)。如果分析模块(110)检测到目标声音,则它产生输出信号以通知车辆控制系统(步骤322)。在实施例中,分析模块(110)还可确定并输出关于目标声音源的信息,诸如其相对于车辆(10)的距离、方向和速度。

在实施例中,系统(100)连续地且实时地处理信号以提供目标声音的检测通知。“连续地”是指以周期性的频率处理信号。“实时”是指在产生信号之后处理信号而没有实质延迟。在实施例中,实时处理发生在信号产生的一分钟内,优选地,在小于1秒内发生。在实施例中,在车辆(10)上至少每隔几秒执行一次处理,至少每隔几秒生成一次输出。

下文更详细地描述系统(100)的组件和方法的步骤。

音频传感器至少一个音频传感器(102)检测车辆(10)的环境中的声波,并将它们转换成电子样本声音信号,以供系统(100)处理(图3,步骤300)。在实施例中,音频传感器(102)是扬声器。优选地,扬声器在车辆(10)行驶的道路平面中是全方向的,然而,在使用多个扬声器的情况下,扬声器可以是单独定向的,但是当组合在一起时是全方向的。

在图1所示的一个示例中,系统(100)具有以扬声器形式形成的三个音频传感器(102a、102b、102c)。一个扬声器附接到车辆(10)的每个侧视镜上,且一个扬声器附接到车辆(10)的顶部,靠近许多现代车辆车顶上提供的“鱼鳍”式天线。

使用多个空间分离的音频传感器(102)能够确定目标声音源的方向(定位),例如,通过三角定位(triangulation)。多个音频传感器(102)还可以通过减少声学环境中的杂波、多径和其它损伤的影响来增强和更精确地识别目标声音。通常,音频传感器(102)越远,三角定位越佳。在干净的环境中,需要至少两个传感器来获得一些定位信息,并且三角定位需要三个音频传感器(102)。然而,在具有损伤和外部噪声源的现实世界中,更多数量的音频传感器(102)可以提供更稳妥的解决方案。例如,在一个实施例中,系统具有四个或多个音频传感器(102)以在车辆(10)周围提供360°的覆盖范围。

在实施例中,音频传感器(102)可以以各种方式和位置附接至车辆(10)。例如,扬声器可以方便地安装在围绕车辆(10)周边的灯组件中,诸如前灯、雾灯或驾驶灯、尾灯、侧标记或信号灯组件。作为另一个示例,扬声器可以位于附接至车辆(10)的壳体中。壳体可以包括其它传感装置,诸如照相机、雷达、激光雷达和超声波传感器,或车辆(10)外部的其它装置,诸如侧视镜、车顶天线、前灯、尾灯、保险杠或闪光灯。虽然扬声器可以与壳体中的其它传感器物理集成,但是可以使用不同的车辆网络从不同的传感器发送数据。

滤波器滤波器(104)可以是物理设备,其将由音频传感器(102)接收的样本声音信号过滤到期望频带,或者可以是电子设备,其过滤由音频传感器产生的样本声音信号(图3,步骤302),或可以是其两者。过滤可以减少下游的计算需求。可提供低通(low-pass)和高通(high-pass)带滤波器。

例如,许多紧急汽笛以重复模式在约500hz到约2000hz之间的频率范围内扫过。在这样的示例中,滤波器(104)可用于将样本声音信号过滤到约500hz和约1.5khz范围内的频率。作为非限制性示例,滤波器(104)可以是噪声消除设备,诸如在2017年5月3日提交的共同未决的共同拥有的美国临时专利申请no.62/500,987中描述的噪声消除设备,并且用于将声音衰减低于约500hz。

对数放大器电路对数放大器(106)在具有相对高振幅的背景噪声的情况下,以对数方式放大输入的低振幅样本声音信号,同时将高振幅的样本声音信号抑制到用于低振幅声音的可比范围(图3,步骤304)。通过抑制高振幅(响亮)噪声,同时保持对极低振幅(微弱)噪声的信号的灵敏度,系统(100)可处理由音频传感器(102)产生的以数量级变化(varybyordersofmagnitude)的样本声音信号。

在通信技术中,已知的对数放大器用于计算输入信号包络的对数。对数放大器(和对数放大)可以通过其输出电压vout和输入电压vin之间的关系区别于非对数放大器(“non-logamp”)。图4a和4b分别使出了输入电压为50uv至500mv范围内的非对数放大器输出和对数放大器输出的示例。非对数放大器产生输出电压vout,其幅度随输入电压vin线性变化。因此,系统(100)可能无法识别较小的电压,而较大的电压可能超过系统容量。相反地,对数放大电路产生的输出电压vout随输入电压vin与以伏特表示的标准化常数(normalizationconstant)vref之比的自然对数乘以比例系数k而变化,如下面的公式所示:

图5示出了本发明对数放大器(106)实施例的简化示意图。对数放大器(106)的这一实施例与典型的自动增益控制(automaticgaincontrol)(agc)不同,其通常用于处理信号的大的变化。agc类型的方法较慢,并且需要许多信号周期来调整其增益。相反,对数放大器(106)的合适实施例对信号几乎是瞬时响应而没有影响的延迟,因此几乎立即响应信号变化。

在图5所示的实施例中,二极管(d2,d3)用于运算放大器的反馈回路中,以便为给定的输入电压vin提供对称的对数输出电压vout。由于来自扬声器的电压将在正方向和负方向上产生偏移,因此所希望的是放大器的对称性。可以使用其它非线性元件,但这里说明了对于线性输入产生对数响应的一个实施例。

虽然运算放大器反馈回路中带有单个二极管的对数放大器会产生正负输入的非对称输出,但在放大器的反馈回路中使用背对背二极管(back-to-backdiodes)会产生输入的双曲线函数(hyperbolicfunction),其在零点或偏置点(vb)周围对称。在低信号水平时,增益非常高并且与输入电阻rm和(二极管阻抗(diodeimpedance)(d2,d3)+串联电阻(rfx))相除的比例成比例。在高输入水平时,二极管允许更多电流,动态反馈电阻下降,且增益按比例下降。这在较高信号水平下足够接近对数响应,并且在较低信号水平下产生线性的但是很高的增益。

a/d转换器从音频传感器(102)接收的样本声音信号为模拟形式,如图6中的示例所示。a/d转换器(108)以预定的样本率将模拟样本声音信号转换并减少为适当长度的数字样本向量(图3,步骤306)。将样本向量存储并更新到缓冲器中进行处理(图3,步骤308)。

一般来说,数字样本向量越大,检测系统可能越精确,但需要耗费处理时间和精力。在一个示例中,向量可包括单个位(singlebit)的数据串,其包括多个(n个)位(bit)。在实施例中,n可以在约1000位到约10000位之间变化。优选地,n小于约5,000位,但仍提供比较匹配和不匹配的识别能力。在一个示范性实施例中,n约为4,000位。

更高的样本率可以提高检测系统的准确度,但同样耗费处理时间和精力。在实施例中,样本率可以从大约1khz到大约20khz变化。在一个示例中,样本率可以是10khz。

在一个实施例中,转换包括信号的至少一个方面的n位相关性,其中n<12,优选n<8。例如,转换可包括信号相移(signalphaseshifts)的1位(2级编码)或1.5位(3级编码)的转换。在一个示例中,a/d转换器(108)是电压水平检测器,其检测信号是否已经越过零到正或负区域中,或者是否越过可能不为零的水平,但是仍然提供特征样本向量。使用1位或1.5位相关性减小了提取的数字化表现的大小,从而允许在比较步骤中进行快速处理。在可替代的示例中,可以使用多级编码,最终文件大小仍然是可管理的。这种向低级编码的转换减少了处理音频数据所需的计算资源和时间,特别是与现有的快速傅里叶变换(fouriertransform)(fft)(其基于需要更高级别编码(例如,16位,甚至24位)的方法)相比。因此,本文提出的方法更适合使用功耗更低的更小且更低成本的组件实时地实现。

因此,样本向量将包括一串位,或由一串位组成,其数量取决于样本率和时间。例如,例如,在10khz采样的4000位样本向量表示400ms的音频样本长度。

数字目标声音模板数字目标声音模板可使用转换方法由已知目标声音(例如,紧急车辆汽笛声或信号)预先生成,包括与数字样本向量相同的向量大小和样本率,并存储在非暂时性计算机可读存储器中。

经典的信号处理理论表明,以目标声音最高预期频率的两倍进行数据采样,将足以在不损失保真度或信息的情况下完全表征信息内容。典型的系统以此速率进行采样以获得一定的稳健性。例如,如果汽笛的最高预期声音是2khz,则可以以4khz对汽笛的目标声音样本进行采样。汽笛的时间也很重要。例如,以4khz采样存储的持续两秒的汽笛模式将导致位级总共8k样本的模板向量,或模板中的1kb数据。这与一个典型的2秒的数字录音的声音文件相比是有利的,其如果以44khz,24位进行采样,则会产生约2.1兆位或264kb的文件。

如果模板比样本向量(n)的尺寸长得多,以完全捕获汽笛的特征,可以将它们分解成多个n位长模板,以与n位长样本向量并行比较。例如,在n=4000的情况下,上述提到的8000位模板可以被分解为多个4000个连续位模板以进行比较(即,1至4000位、1001至5000位、2001至6000位等)。这将允许系统(100)识别较长周期的声音,而无需等待整个周期完成。

由于在处理位操作数据(bit-wisedata)时计算效率有利,多个模板可与输入声音并行匹配,这将允许存储和比较大量不同的目标声音模板。例如,模板可包括多普勒频移变体和目标声音的其它已知变体。

如果使用的模板代表特定的目标声音,例如特定类型的汽笛,那么检测系统将特定于那种类型的汽笛,并且可能对检测多普勒频移变体没有作用。具有不同频率范围和/或周期,或甚至大的多普勒频移的其它汽笛类型将不会被识别为汽笛。

为了检测具有不同频率范围和/或周期类型的其它类型汽笛,和/或为了解决大的多普勒频移的影响,可使用附加模板。虽然包含更多模板可以使系统在可检测到的汽笛类型方面更加通用,但它也可能使系统更容易出现误报,触发其它未被检测的声音。

作为增加模板数量的替代方案,模板可以限于大致以汽笛扫描范围为中心的许多特定频率或窄频率范围。在实施例中,频率范围可以是大约900hz或更小。因为模板限于窄频带或有限数量的特定频率,所以它们的尺寸可以大大减小。在一个实施例中,模板可以是64位(n=64),更进一步地大大减少了计算要求和时间。而且,滤波器(104)可以用于将音频传感器(102)检测到的输入声音过滤到期望的频率或频率范围,以进一步减少计算要求和时间。

例如,图7示出了汽笛在短时间内扫过其频域的频率变化,以及同一汽笛的更高和更低的多普勒频移形式。在500到1500赫兹之间的汽笛声以相对200千米/小时的速度向听者移动时,将呈现大约600至1800赫兹的声波,频率增加20%。声源以相对200千米/小时的速度远离听者移动的影响将导致频率从大约400hz移到大约1200hz。作为另一个例子,图8显示了两个汽笛扫过其范围的频率变化,其中两个汽笛具有不同的周期性。

在一个优选实施例中,检测的频率为1049hz,如图7和图8的中间虚线所示。更优选地,系统将查找多个特定检测频率,例如,三个或多个特定频率,其中的一些或全部是在约600hz至约1200hz之间的中心范围内的质数(primenumbers)。例如,系统可以调整为专门查找997hz,1049hz和1097hz的频率,如图7和8所示。因此,图7中的多普勒频移的影响和图8中的不同周期性的影响可以被忽略,这是因为汽笛每次向上或向下通过频率范围扫描,从而通过由上下虚线界定的频率检测范围,且窄频率范围将包括交变汽笛的任何多普勒频移变化。

在这种情况下,模板对特定频率的特异性(specificity)取决于系统的样本率和模板的长度。例如,在样本率为10khz且使用64位的样本模板的情况下,发现系统(100)将在模板的特定频率周围约±50hz的带宽内检测频率。因此,在一个示例中,在系统被配置为检测在两个频率之间交替的汽笛的情况下,模板可以在以匹配频率为中心的窄频率范围内,以小于约50hz的间隔隔开的特定频率导出。优选地,特定频率为质数,以减少由非汽笛噪声的谐波(harmonicovertones)引起误报的可能性。

模板的使用数量和其代表的频率可以进行调整,以最佳地匹配待检测的声音的频率范围。例如,如果已知预期的汽笛将扫过给定的范围,则模板的选择应该包括靠近该范围中心的频率,使得汽笛的多普勒频移形式仍然通过它们。对于具有长周期的汽笛,具有分布在更大范围内的多个频率模板将增加其中一个模板的交叉次数,从而允许方向计算更频繁。对于在不同频率之间离散地切换(而不是扫频)的交变汽笛,模板可选择在两个音调附近紧密间隔排列,这样系统将始终检测到至少两个模板之间的切换,即使汽笛是多普勒频移。

比较器比较器(112)使用逻辑门(图3,步骤312)将存储的数字样本向量与多个数字目标声音模板中的至少一个,优选的是大多数或全部进行比较(图3,步骤310)。作为示例,逻辑门可以是同(exclusivenor)(xnor)门。样本声音与模板声音的比较是主要的识别方法。

相关器相关器(114)将比较器(112)的逻辑门的输出求和,以确定输入样本数字样本向量与数字目标模板匹配的程度(图3,步骤314)。总和是指示样本向量与模板之间相似程度的值。可以选择一个阈值,当超过该阈值时,指示样本向量与模板匹配,且因此检测到目标声音。如果样本向量的最大总和超过预定的阈值(图3,步骤316),则系统(100)将(受限于任何确定策略,如下文所描述的)提供通知,说明检测到与存储模板匹配的目标声音(图3,步骤322)。

例如,图9示出了相关器(114)的输出的示例,该输出包括高于阈值的相关峰值。优选地,这些总和是以预先设定的样本率为每个音频传感器(102)随时间计算且连续测定的,同时还有用于样本的时间指标的计数器。例如,当比较采用一位转换产生的样本向量和模板向量时,50%的值将表示随机噪声。可以使用表示匹配具有一定置信度的相似程度,例如,51%或更多,优选55%或更多,例如,可以表示匹配。因此,在使用4000位长的向量的示例性系统中,阈值可以是与向量匹配的2200位。

图10a示出了相关器(104)的逻辑门输出的另一个示例。当相关性与模板进入和离开相位时,逻辑门的输出显示出许多紧密间隔的峰值,这些峰值的振幅随时间上下变化。为了降低噪声,可选的包络检测步骤(类似于运行平均值),优选地使用平方函数,将相关性转换为单个峰值,如图10b所示。最大可能的包络峰值取决于模板的长度以及汽笛在模板频率上耗费的时间。例如,已经发现,对于64位长的模板,测试的大多数扫频汽笛将产生高达约40000到50000的相关总和包络峰值。当包络计算器输出越过检测阈值时,如图10b中的虚线所示,样本频率在样本向量中检测。检测阈值应设置为包络计算器输出快速通过的值,从而减小时间误差。例如,根据经验发现,合适的检测阈值应设置为理论最大包络值峰值的约50%至约70%。

确认策略如果目标声音具有预期声源(如汽笛)之外的声源生成的频率,那么系统可生成目标声音的误报检测。另外,如上所述,随着样本向量的大小减小和/或模板的数量增加,系统可能更容易出现误报。因此,使用可用信息的附加算法和数据处理,即二级模式,可用于将所需声音与误报区分开,并提供对检测声音的确认。可采用这种确认策略的各种组合。

在一个实施例中,能量检测器(116)用于测量音频信号的能量级(振幅),通过确认检测到的目标信号具有足够的能量作为靠近车辆(10)的目标声音,以提供正向的目标声音检测的确认。也就是说,可以使用目标频率处的声波中的能量度量,因为可以预期诸如汽笛的目标声音将比环境中的其它声音更响亮。在一个实施例中,模拟对数放大器(106)的输出与声能成正比。该对数变换类似于生物听觉系统,其中声音以分贝(db)来定义。分贝是声压或声能的对数度量。通过简单的比例缩放,对数放大器(106)读数可以在能量检测器(116)中缩放到压力db或声能db。这可以通过简单的数学运算或合适的查找表来实现。查找表在计算上可以更简便,其中声音由对数放大器(106)缩放。具有来自a/d转换器(108)的db水平或其双水平(dualofit)允许进一步处理,例如确定近处和远处汽笛的阈值水平。这可以借助于对数放大器(106)完成,而不需要浮点或扩展的数学计算,因为对数放大器(106)产生类似于生物系统的水平,其非常敏感又具有高动态范围。

能量或振幅的检测可以以多种不同的方式使用。例如,在车辆周围放置多个扬声器,并且通过设计或放置进行定向,则能量差可提供对误报的确认或否定。

在另一个实施例中,在汽笛扫过如图7所示的频率范围的情况下,可按特定顺序检测多个特定频率:从低到高,然后从高到低反转。在有限时间内,按顺序对目标频率的检测可用来确认汽笛事实上已被检测。在一个示范性实施例中,在每个频率级处使用较小的样本向量(例如,n=64位)进行频率扫描的检测模式,提供了对正命中(positivehits)的非常准确的识别。

在另一个实施例中,系统(100)可配置为要求来自多于一个音频传感器(102)的确认匹配,以减少误报报告。

如图11所示,每个扬声器可与一个分析模块封装在一起,当信号向量与模板匹配时,该分析模块将输出正信号。每个扬声器系统的输出由中央处理器聚合,该中央处理器使用至少一个如本文所述的确认算法,优选地使用如本文所述的确认算法的组合。

目标声音方向分析图11示出了包括方向计算器的系统的示意图,该系统在具有多个扬声器的系统中使用音频样本声音信号的并行处理。由于扬声器的间距是有限且已知的,一个真正的汽笛将为每个扬声器在稍微不同的时间指标处产生一个基本匹配。如果检测到目标声音,则系统(100)可继续使用表示检测到最大总和的时间指标,以确定信号在各个扬声器之间到达的时间差。时间差可用于三角计算,以推导出输入声音相对于扬声器的方向角。该计算需要至少两个扬声器提供基本信息,但是如上所述,可以使用至少三个,优选四个或多个扬声器,以提高系统(100)的安全性、可靠性和稳健性。

在一个实施例中,关于输入声音的方向和速度的信息可以从两个扬声器中推导出,其中,在两个扬声器之间检测时间差和振幅差。在更基本的实施方式中,至少两个扬声器仍然可以提供基本的定位信息,例如简单的“左或右”或“前进或后退”的信息。

因此,每当处理了合适数量的样本向量时,系统(100)将报告目标声音是否存在和声音的方向。样本数量越多,样本向量的大小越大,该方法在识别接收到的声音是否是目标声音时可能更稳健和更准确,但是以信号处理的时间和资源以及系统识别汽笛信号的相应时间为代价。

然而,发明人已经发现,使用位编码,例如1位编码的小样本向量产生的准确性的推定损失可通过检测或识别二级模式,实时或接近实时地处理大量模板的信号的能力来克服。这些二级模式包括信号能量和随时间变化的能量,上述到达的时间差,通过频率范围的上升或下降扫描,或其组合。

目标声源运动分析在实施例中,可以确定关于紧急车辆(14)的相对运动的信息。

在一个实施例中,输入声音的方向角可随时间的推移而被追踪,这可以指示紧急车辆(14)的行进方向。另外,相关度可作为输入声音距离的函数而增加。此外,如果模板包括多普勒频移变化,则与多普勒频移变化的特定匹配也将提供关于紧急车辆(14)的相对速度和运动方向的信息。例如,与已知汽笛的更高音调变化的匹配将指示紧急车辆声源(14)正朝向车辆(10)移动。

在另一个实施例中,如果声音的数字转换包括振幅导出的数据,或者在数字转换之前使用模拟信号的分离式能量转换器,则能量或振幅的测量可与输入声音的方向和/或速度相关。例如,随着时间变得越来越响的声音可能在朝向扬声器的方向移动。

输出通知在实施例中,系统(100)可以可操作地连接到车辆控制系统,该车辆控制系统可以控制车辆(10),或者指示驾驶员采取适当的动作来控制车辆(10)的动态。因此,系统(100)可减少或消除在车辆操作方面对人类驾驶员交互的需求。本发明可用于任何sae级别的自动驾驶。

在实施例中,系统(100)可以可操作地连接到车辆控制系统,该车辆控制系统在车辆内或在远程定位的实体处生成视觉、听觉或触觉通知。因此,系统(100)可以为人类驾驶员提供感官支持。

例如,系统(100)可以重载车辆音频系统以提供通知。另外,或可替代地,系统(100)可以在仪表板或车辆的仪表显示器上提供警示灯。通知可以包括诸如相对于车辆的方向、输入声音的速度和行进方向的信息。附加地或可替代地,系统(100)可操作地连接到显示车辆周围环境的数字地图的车载导航系统。可以在主车辆的地图上示出紧急车辆的位置,速度和运动方向。在一个实施例中,紧急车辆的存在和/或紧急车辆在某个方向上的移动可以通过众包高清地图与其它车辆共享。当汽笛关闭或距离太远而无法引起注意时,导航系统中的紧急车辆通知将消失。

说明可以参考根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图图示和/或框图来本描述发明的各个方面。可以理解的是,每个流程图图示和/或框图的每个框,以及流程图图示和/或框图中的框的组合都可以由计算机程序指令实现。这些计算机程序指令可提供给通用计算机、专用计算机的处理器或其它可编程的数据处理装置以产生一台机器,使得通过计算机处理器或其它可编程的数据处理装置执行的指令创建用于实现流程图和/或框图块中指定的功能/动作的装置。

附图中的流程图和框图显示了根据本发明的各种实施例的系统,方法和计算机程序产品的可能实现的体系结构,功能和操作。在这方面,流程图或框图中的每个框可以表示代码的模块,片段或部分,其包括用于实现指定的逻辑功能的一个或多个可执行指令。还应注意的是,在一些可替代实施方式中,框中提到的功能可以不按图中所示的顺序发生。例如,连续示出的两个方框实际上可以基本上同时执行,或者这些方框有时可以以相反的顺序执行,这取决于所涉及到的功能。还应注意的是,框图和/或流程图图示的每个框,以及框图和/或流程图图示中的框的组合可以由执行特定功能或动作的基于专用硬件的系统来实现,或专用硬件和计算机指令的组合来实现。

本说明书所附的权利要求中的所有装置或步骤以及功能元件的相应结构、材料、动作和等效物旨在包括与其它特别要求保护的元素结合执行功能的任何结构、材料或动作。

说明书中对“一个实施例”、“实施例”等的引用指示了所描述的实施例可以包含特定方面、特征、结构或特性,但并非每个实施例都必须包括该方面、特征、结构或特性。此外,这些短语可以但不一定是指在说明书的其它部分中提到的相同实施例。另外,当结合实施例描述特定方面、特征、结构或特性时,无论是否明确描述,在本领域技术人员的知识范围内,可以将这些模块、方面、特征、结构或特性与其它实施例互相影响或组合。换句话说,任何模块,元件或特征可以与不同实施例中的任何其它元件或特征组合,除非存在明显或固有的不兼容性,或者特别排除掉。

还应注意的是,可以起草权利要求以排除任何可选元素。因此,该陈述旨在用作与权利要求要素的陈述或“否定”限制的使用相关的排他性术语的前提基础,例如“单独”、“仅”等。术语“优选地”、“优选的”、“优选”、“可选地”、“可以”和类似的术语用于表示所提及的项目,条件或步骤是本发明的可选(非必需)特征。

除非上下文另有明确规定,否则单数形式“一”、“一个”和“该”包括复数指代。术语“和/或”表示项目中的任何一个,项目的任何组合,或与该术语相关联的所有项目。本领域技术人员容易理解短语“一个或多个”,特别是在其使用的上下文中阅读时。

术语“约”可以指特定值的±5%、±10%、±20%或±25%的变化。例如,在一些实施方案中,“约50%”可以带有45%至55%的变化。对于整数范围,术语“约”可以包括在该范围的每一端大于和/或小于所述整数的一个或两个整数。除非本文另有说明,否则术语“约”旨在包括在所述范围附近的值和范围,其在组成或实施方案的功能方面是等同的。

如本领域技术人员将理解的,出于任何和所有目的,特别是在提供书面描述方面,本文所述的所有范围还包括任何和所有可能的子范围及其子范围的组合,以及构成范围的各个值,尤其是整数值。所述范围包括该范围内的每个特定值、整数、小数或标识。任何列出的范围都可以很容易地被识别为充分描述并且使相同的范围至少被分解为相等的一半、三分之一、四分之一、五分之一或十分之一。作为非限制性示例,这里讨论的每个范围可以容易地分解为下三分之一、中三分之一和上三分之一等。

如本领域技术人员还将理解的,所有语句诸如“至多”、“至少”、“大于”、“小于”、“大于”、“或更多”等,包括所述的数字,并且这些术语指的是随后可以分解成如上所述的子范围的范围。以同样的方式,本文所述的所有比例还包括属于更广泛比例的所有子比例。

权利要求书(按照条约第19条的修改)

1.一种用于检测目标声音的系统,所述系统包括:

至少一个音频传感器,用于产生样本声音信号以响应于样本声波;

计算机处理器;和

非暂时性计算机可读存储器,其可操作地连接到所述计算机处理器,并存储多个数字目标声音模板,该多个数字目标声音模板根据转换参数通过转换所述目标声音的多个样本而产生,以及由所述计算机处理器执行的一组指令,以实现包含下列步骤的方法:

(a)从所述音频传感器接收所述样本声音信号;

(b)根据所述转换参数将所述样本声音信号转换为数字样本向量;

(c)将所述向量与已存储的模板中的每一个进行比较,以确定所述向量和已存储的模板中任意一个的相似程度是否超过预定的阈值;以及

(d)如果超过所述阈值则产生输出信号。

2.根据权利要求1所述的系统,其中,所述至少一个音频传感器包括至少三个音频传感器,所述方法包括:

(a)对于所述至少三个音频传感器中的每一个,执行权利要求1中的步骤(a)至(c),并且确定超过所述阈值的时间指标;以及

(b)基于已确定的时间指标确定所述样本声波的方向角。

3.根据权利要求1所述的系统,其中,所述目标声音是在频率下限和频率上限之间扫描的汽笛,且所述模板表示限于以下任何一种情况的数据:

(a)限制在所述频率下限和所述频率上限范围内的窄频带;或

(b)在所述窄频带内的至少一个特定频率。

4.根据权利要求3所述的系统,其中,所述窄频带为从约600hz到约1400hz。

5.根据权利要求3所述的系统,其中,所述至少一个特定频率包括多个特定频率,其中所述至少一个特定频率为质数。

6.根据权利要求5所述的系统,其中,所述多个特定频率全部为质数。

7.根据权利要求1所述的系统,其中,所述目标声音是在较低频率和较高频率之间交替的汽笛,且所述模板表示限于以下任何一种情况的数据:

(a)以较低频率为中心的较低窄频带和以较高频率为中心的较高窄频带;或

(b)在每个较低窄频带和较高窄频带内的至少一个特定频率。

8.根据权利要求7所述的系统,其中,所述较低频带和所述较高频带分别提供低于所述较低频率的约20%至高于所述较高频率约20%的范围。

9.根据权利要求7所述的系统,其中,所述特定频率中的至少一个、部分或全部为质数。

10.根据权利要求3至7中任一项所述的系统,其中,已实现的方法还包括模式识别步骤,其中,对所述目标声音检测的确认是对于特定顺序的多个特定频率的每一个都超过所述阈值的结果。

11.根据权利要求1至10中任一项所述的系统,还包括对数放大器,所述对数放大器可操作地连接到所述音频传感器,用于在转换为所述向量之前放大所述样本声音信号。

12.根据权利要求11所述的系统,其中,所述对数放大器包括从所述对数放大器的输出端到输入端的反馈回路,其中所述反馈回路包括并联的第一电路路径和第二电路路径,其中所述第一电路路径包括第一二极管,且所述第二电路路径包括第二二极管,其中所述第一二极管和所述第二二极管相对于所述对数放大器的所述输入端和所述输出端具有不同的极性,这使得所述对数放大器为正负输入电压提供对称的输出电压。

13.根据权利要求1至12中任一项所述的系统,其中,所述转换参数包括所述声音信号的n位编码,其中n小于或等于8。

14.根据权利要求13所述的系统,其中,n为1、1.5或2。

15.根据权利要求14所述的系统,其中,n为1,并且所述转换参数是电压水平交叉。

16.根据权利要求1至15中任一项所述的系统,其中,所述样本向量和所述目标声音模板中的一个或二者小于约10000位长、5000位长、1000位长或100位长。

17.根据权利要求1至16中任一项所述的系统,其中,所述系统包括两个或多个音频传感器,且来自每个音频传感器的所述声音信号分别通过步骤(a)至(d)处理。

18.根据权利要求17所述的系统,其中,所述系统包括三个或多个音频传感器,其中来自每个音频传感器的所述声音信号用时间指标组件分别处理,且时间指标的差用于确定所述目标声音的方向。

19.根据权利要求18所述的系统,其中,周期性地确定所述目标声音的所述方向,以确定所述目标声音的运动。

20.根据权利要求1至19中任一项所述的系统,其特征在于,所述系统包括通知子系统,以向人类用户或自动系统提供声音检测信息,其中所述信息可包括一个或多个所述目标声音的身份、所述目标声音的相对位置或所述目标声音的运动。

21.根据权利要求1至20中任一项所述的系统,其中,所述系统可操作地连接到车辆控制系统。

22.一种用于检测目标声音的方法,所述方法包括步骤:

(a)提供至少一个数字目标声音模板,所述数字目标声音模板根据转换参数通过转换所述至少一个目标声音样本而产生;

(b)接收由至少一个音频传感器产生的样本声音信号以响应于样本声波;

(c)根据相同的所述转换参数将所述样本声音信号转换为数字样本向量。

(d)将所述样本向量与所述至少一个模板进行比较,以确定所述向量与所述至少一个模板的相似程度是否超过预定的阈值;以及

(e)如果超过所述阈值则产生输出信号。

23.根据权利要求22所述的方法,其中,所述至少一个音频传感器包括至少两个音频传感器,所述方法包括:

(a)对所述至少两个音频传感器中的每一个执行权利要求20中的步骤(b)至(d),且确定超过所述阈值的时间指标;以及

(b)基于已确定的时间指标之间的差来确定所述目标声音的方向。

24.根据权利要求22或23所述的方法,其中,所述目标声音是在频率下限和频率上限之间扫描的汽笛,且所述模板表示的数据限于以下任何一种情况的数据:

(a)限制在所述频率下限和所述频率上限范围内的窄频带;或

(b)在所述窄频带内的至少一个特定频率。

25.根据权利要求24所述的方法,其中,所窄频带为从约600hz到约1400hz。

26.根据权利要求25所述的方法,其中,所述至少一个特定频率包括多个特定频率,所述特定频率中的至少一个、部分或每个为质数。

27.根据权利要求22所述的方法,其中,所述目标声音是在较低频率和较高频率之间交替的汽笛,且所述模板表示限于以下任何一种情况的数据:

(a)以较低频率为中心的较低窄频带和以较高频率为中心的较高窄频带;或

(b)在每个较低窄频带和较高窄频带内的至少一个特定频率。

28.根据权利要求27所述的方法,其中,所述较低频带和所述较高频带分别提供低于所述较低频率的约20%至高于所述较高频率约20%的范围。

29.根据权利要求24至28中任一项所述的方法,还包括模式识别步骤,其中,对所述目标声音检测的确认是对于特定顺序的多个特定频率的每一个都超过所述阈值的结果。

30.根据权利要求22至29任一项所述的方法,还包括在转换为所述样本向量之前,以对数的方式放大所述样本声音信号的步骤。

31.根据权利要求22至29任一项所述的方法,其中,所述转换参数包括所述声音信号的n位编码,其中n小于或等于8。

32.根据权利要求31所述的方法,其中,n为1、1.5或2。

33.根据权利要求32所述的方法,其中,n为1,并且所述转换参数是电压水平交叉。

34.根据权利要求22至33中任一项所述的方法,其中,所述样本向量和所述目标声音模板中的一个或二者小于约10000位长、5000位长、1000位长或100位长。

35.根据权利要求22至34中任一项所述的方法,其中,步骤(b)至(e)在车辆上实时执行,并且所述目标声音由汽笛产生。

36.根据权利要求22至35中任一项所述的方法,其中,步骤(c)和(d)仅涉及整数数学。

37.一种实时检测目标声音的连续方法,所述方法包括步骤:

(a)接收由至少一个音频传感器产生的样本声音信号以响应于样本声波;

(b)根据转换参数以对数的方式放大所述样本声音信号,并将已放大的样本声音信号转换为数字样本向量;

(c)将所述样本向量与使用相同所述转换参数从所述汽笛生成的至少一个模板进行比较,以确定所述向量与所述至少一个模板的相似程度是否超过预定的阈值;以及

(d)如果超过所述阈值则产生输出信号。

38.根据权利要求37所述的方法,其中,步骤(c)仅涉及整数数学。

39.根据权利要求37所述的方法,还包括通知车辆用户和/或车辆控制系统的步骤。

40.根据权利要求39所述的方法,其中,所述通知车辆用户的步骤包括在数字地图上显示紧急车辆的位置并且可选择地加速和移动方向。

41.根据权利要求37至40任一项所述的方法,还包括模式识别步骤,其中,对所述目标声音检测的确认是对于特定顺序的多个特定频率的每一个都超过所述阈值的结果。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1