声音信号中的瞬时噪声的最小化的制作方法

文档序号:7974241阅读:227来源:国知局
专利名称:声音信号中的瞬时噪声的最小化的制作方法
技术领域
本发明涉及声学,尤其的涉及增强所处理声音的感知质量的系统。
背景技术
很多通信设备获取、吸收并传送声音信号。声音信号经过通信介质从一个系统到达另一系统。在某些系统中,包括用于车辆的某些系统,声音信号的清楚不仅取决于通信系统的质量和通信介质的质量,也取决于伴随声音信号的噪声的数量。当噪声发生在源或接收机附近时,失真通常歪曲声音信号并破坏信息。在某些场合,噪声可能完全掩盖声音信号导致了无论收听者还是声音识别系统都完全不能识别通过声音信号传送的信息。
可以妨碍、干扰或导致信息丢失的噪声来自很多源。来自车辆的噪声可以由发动机、道路、轮胎或空气的运动产生。当车辆在铺砌的道路上运动时,当轮胎撞击到道路表面的障碍物或缺陷时,产生相当大数量的噪声。当轮胎撞击例如颠簸、裂纹、凹凸、伸缩接头等障碍物时,可以产生瞬时道路噪声。
瞬时道路噪声具有使其被确定为这样的噪声的多个共同特征。瞬时道路噪声最主要的属性是它们通常包括一对相关的声音或声音事件。当首先车辆的前轮撞击到障碍物随后后轮撞击同样的障碍物时产生两个声音。因为以给定的车辆行进速率后轮行进车辆的轴距长度,两个声音被必要的时间长度在时间上分离。此外,当前轮和后轮撞击物体时,产生的声音是具有典型时间谱(spectro-temporal)形状的宽带事件。由于大部分车辆使用充气橡胶轮胎,当轮胎撞击物体时产生的声音具有非常低的频率能量。因此,谱形状的特征是在较低频率范围内信号的强度快速增加,随后峰值强度在较高频率范围逐渐变小。
这些特征可以用于在由车辆内的麦克风或其他源中产生的声音信号中识别瞬时道路噪声的存在。一旦在信号中识别瞬时道路噪声,可以执行移除噪声的步骤。

发明内容
本发明提供一种声音增强系统,用于改进所处理声音信号的感知质量。该系统通过从由麦克风记录的或来自一些其他源的声音信号中移除不想要的噪声来改进所接收的声音信号的感知质量。尤其的,该系统移除发生在信号源环境但与语音无关的声音。该系统尤其适用于从记录在运动中车辆的语音信号中移除瞬时道路噪声。
该系统建模瞬时道路噪声的时间和频谱特性。之后,系统分析接收的信号以确定接收的信号是否包括对应于建模的瞬时道路噪声的声音。如果是,则从接收的信号中移除或衰减该噪声,提供原始语音信号的更清楚的更易于理解的版本。该系统非常适合于从由免提电话系统或设置在车辆的驾驶室的声音识别系统记录的信号中移除瞬时道路噪声。
依照瞬时道路噪声抑制系统的实施例,提供了适合在接收信号中检测瞬时道路噪声的存在的瞬时道路噪声检测器。瞬时道路噪声检测器与瞬时道路噪声衰减器一起工作。由瞬时道路噪声检测器检测的瞬时道路噪声基本上被瞬时道路噪声衰减器移除或衰减。
在另一实施例中提供了瞬时道路噪声检测器,用于在信号中检测瞬时道路噪声的存在。瞬时道路噪声检测器包括用于把接收的信号转换为数字信号的模拟数字转换器,以及用于把数字化的信号分为多个单独分析窗口的窗口函数产生器。转换模块把来自时域信号的单独分析窗口转换为频域短期频谱。提供模型器,用于产生和/或存储瞬时道路噪声的模型属性。该模型器然后把转换的分析窗口的短期频谱的属性与建模的瞬时道路噪声的属性进行比较从而确定瞬时道路噪声是否存在于接收的信号中。
还提供了一种移除瞬时道路噪声的方法。该方法包括建模瞬时道路噪声的各种时间和频谱特性。依照该方法,分析接收的信号,以确定接收信号的特性是否对应于瞬时道路噪声的建模的特性。如果是,则对应于瞬时道路噪声建模的特性的信号部分基本上本从信号中移除。
通过查看下面的附图和详细的说明书,本领域的熟练人员将会清楚本发明的其他系统、方法、特征和优点。这意味着所有的附加系统、方法特征和优点可以包括在说明书中,在本申请的范围内并被随后的权利要求保护。


通过参照下面的附图和说明书本发明将会更好的理解。图中的部件并不严格的按比例,相反的,重点被放置在发明的原理上。此外,在图中,相同的参考标记在不同的图中表示相应的部件。
图1是声音增强系统的部分框图;图2是各种瞬时道路噪声的频谱图;图3是存在于基本噪声中的瞬时道路噪声的时域图;图4是发出的元音声的时域-频域图;图5是组合的元音声和瞬时道路噪声的时域-频域图;图6是包括组合元音声和瞬时道路噪声的信号的时域-频域图,其中瞬时道路噪声被基本上移除;图7是包括组合的元音声和瞬时道路噪声的信号的时域-频域图,其中瞬时道路噪声被基本上移除,并且被移除的瞬时道路噪声所造成失真的谐波峰值被恢复;图8是瞬时道路噪声检测器的实施例的框图;图9是声音增强系统的可选择实施例;图10是声音增强系统的另一可选择实施例;图11是从所处理的声音信号中移除瞬时道路噪声的声音增强系统的流程图;图12是车辆内的声音增强系统的框图;图13是与音频系统和/或导航系统和/或通信系统接口的声音增强系统的框图。
具体实施例方式
声音增强系统改进了所处理的声音信号的感知质量。该系统建模了当例如汽车的运动车辆在车辆的行进中撞击到道路表面的颠簸、裂纹或其他障碍物或不理想情况下产生的瞬时道路噪声。该系统分析接收的音频信号以确定所接收的音频信号的特性是否符合瞬时道路噪声的建模的特性。如果是,则系统消除或抑制所接收信号中的瞬时道路噪声。在存在语音或不存在语音的情况下衰减瞬时道路噪声,并且瞬时道路噪声可以被检测并实时的或在一延时,例如缓存延时(例如300-500ms)后被基本上消除。除了瞬时道路噪声之外,声音增强系统也可以抑制或移除例如发动机噪声的连续的背景噪声和例如气流噪声、轮胎噪声、经过轮胎嘶嘶声等的其他瞬时噪声。系统也可以消除“音乐噪声”、尖叫声、叫声、滴答声、水滴声、怦然声、音调或其他由某些声音增强系统产生的人为声音。
图1显示了声音增强系统100的部分框图。声音增强系统可以包括专用的硬件和/或可以在一个或多个电子处理器上执行的软件。这样的处理器可以运行一个或多个操作系统或根本没有操作系统。声音增强系统100包括道路瞬时噪声检测器102和噪声衰减器104。也可以提供残留衰减器106用于移除所处理信号的人为的和其他的有害特征。如下面更详细的描述,瞬时噪声检测器102包括瞬时道路噪声的模型或可以产生瞬时道路噪声的模型。所接收的可以包括声音和噪声分量的音频信号被与模型进行比较,从而确定信号中是否包括对应于瞬时道路噪声的声音。如果包括,则识别的声音可以被从信号中移除从而提供更清楚更易于理解的声音信号。
瞬时道路噪声具有可以被模型化的时间和频率特性。瞬时道路噪声检测器102可以使用该模型确定所接收的音频信号101是否包含对应于瞬时道路噪声的声音。当瞬时道路噪声检测器102确定瞬时道路噪声确实存在于所接收的信号101中时,瞬时道路噪声基本上被噪声衰减器104移除或抑制。
声音增强系统100可以包括基本上从所接收的信号中移除或抑制瞬时道路噪声的任何噪声衰减系统。可以被用于从所接收的信号中移除或抑制瞬时道路噪声的系统的例子可以包括1)使用中枢网络把包含瞬时道路噪声的嘈杂信号映射为噪声降低的信号的系统;2)从所接收信号中减去瞬时道路噪声的系统;3)使用包括瞬时道路噪声的噪声信号和瞬时道路噪声模型从电码本中选择噪声降低信号的系统;以及4)以任何其他方式使用嘈杂信号和瞬时道路噪声模型来基于原始掩蔽信号的重建或噪声降低信号来产生噪声降低信号的系统。在某些情况下,这样的瞬时道路噪声衰减器也可以衰减作为所接收信号101的短期频谱部分的连续噪声。瞬时道路噪声衰减器也可以与可选择的残留衰减器106连接或包括可选择的残留衰减器106,用于移除附加的人为声音,例如“音乐噪声”、尖叫声、叫声、滴答声、水滴声、怦然声、音调或其他可能由瞬时道路噪声的衰减或移除引起的其他噪声。
噪声可以被广义上分为两类(1a)周期噪声;以及(1b)非周期噪声。周期噪声包括例如转数计的滴答、发动或驱动噪声和挡风玻璃雨刷的嗖嗖声等的重复声音。周期噪声可以由于它们的周期特性具有某些谐波频率结构。非周期噪声包括例如瞬时道路噪声、短暂的车轮嘶嘶声、雨、风的打击声等的声音。非周期噪声通常发生在不规则的非周期间隔,不具有谐波频率结构,并且通常具有短的、瞬时的时间持续。语音也可以被大体分为两类(2a)浊音,例如元音声,和(2b)非浊音,例如辅音。浊音具有规则的谐波结构或由描述共振峰结构的频谱包络加权的谐波峰值。非浊音语音不具有谐波或共振峰结构。包括噪声和语音的音频信号可以包括非周期噪声、周期噪声和浊音或非浊音的任意组合。
瞬时道路噪声检测器102可以实时的或在一段延时后从剩余信号中分离类似噪声的部分。瞬时道路噪声检测器102分离类似噪声的部分而不考虑所接收信号101的幅度或复杂度。当瞬时道路噪声检测器检测到瞬时道路噪声时,其建模所检测的瞬时道路噪声的时间和频谱特性。瞬时道路噪声检测器102可以存储瞬时道路噪声的完整模型,或可以存储该模型的所选属性。瞬时道路噪声衰减器104使用模型或模型的保存属性从所接收信号101中移除瞬时道路噪声。可以使用多个瞬时道路噪声模型来产生平均的瞬时道路噪声模型,或所保存的模型的属性可以被组合,用于通过瞬时道路噪声衰减器104从所接收的信号101中移除瞬时道路噪声。
图2显示了不同瞬时道路噪声的两个频谱图110、112。频谱图的水平轴代表时间,垂直轴代表频率。各种瞬时噪声的强度被频谱图的相应的色调表示。浅颜色区域代表更大声更强烈的声音而深颜色的区域代表较安静的声音或根本没有声音。两个图中所描述的瞬时道路噪声由不同的源产生。尽管在频谱图110、112中所绘的瞬时道路噪声的源和整体特性基本上不同,但它们具有很多共有的特点。事实上,频谱图110、112所绘的瞬时道路噪声的共同特点是大部分,即使不是所有的瞬时道路噪声的共同特征。首先是在时域中瞬时道路噪声成对的发生这一事实。第一声音事件在较短的时间后被基本上相同的声音事件跟随。第一声音事件对应于在道路表面上车辆的前轮撞击或骑过障碍物。当后轮童击相同的物体,障碍物或不完整的表面时随后发生第二声音事件。成对的声音(声对)(sonic doublet)导致了每个乘汽车在公路上行进的人熟悉的典型“flup-flup”声音。
大部分瞬时道路噪声的第二共有特征是它们具有相似的频谱形状,尽管不必完全相同。瞬时道路噪声一般是宽带事件,在较宽的频率范围承载声音能量。然而,由于大部分车辆使用充气轮胎,瞬时道路噪声的大部分声音能量集中在较低频范围内。
图2的频谱图110和112很明显的显示了瞬时道路噪声的这两个特征。第一频谱图110显示了114和116两个瞬时道路噪声事件。每个瞬时道路噪声事件的成对特性可以清楚的看到。此外,在成对声音(声对)的每个分量中,基本上所有的能量部在大约低于2000Hz的频率内。第二频谱图112在规则的空间间隔内显示了多个成对瞬时道路噪声118、120、122、124。这种模式可能发生在车辆进行在混凝土道路的路面之间的规则间隔结合处时。再次,瞬时道路噪声的成对特性是非常显著的。并且尽管瞬时道路噪声事件118、120、122和124具有比之前的频谱图110的事件114、116高的频率能量,但是瞬时道路噪声事件118、120、122和124在较低频率范围显示了比较高频率范围更高的强度。
图3显示了在存在基本背景噪声的情况下瞬时道路噪声的频率响应的理想的三维时域-频域图130。时域-频域图130包括沿着时间轴132的多个独立的时间间隔或时间帧。每个时间帧代表车辆内麦克风或其他声音传感器接收的信号的db频谱的瞬时快照。沿着轴134代表频率,并且在每个时间帧和每个频率的以dB表示的信号的大小被沿着dB轴136的曲线的高度表示。
时域-频域图130清楚的显示了两个不同的声音事件138、140。成对事件对应于瞬时道路噪声的成对特性。第一声音事件138在大约20-30ms之间开始出现并且第二事件140在大约45-58ms开始出现。两个声音事件138、140具有多个特征,这些特征可以用于确定声音事件对应于单个瞬时道路噪声事件。最明显的是具有两个瞬时噪声事件,并且它们具有基本上相同的频谱,并用它们在非常近的时间发生。当车辆的轴距的长度和车辆行进的速率是已知时,单个成对瞬时道路噪声的第一和第二声音事件之间的时间间隔可以被精确的计算。发生在预定时间间隔的一对相似声音事件可以被看作属于单个瞬时噪声事件。不是发生在预定时间间隔的声音事件可以看作不是共同的瞬时道路噪声事件的部分。因此,在这些条件下,当车辆的轴距和速度已知时,瞬时道路噪声检测器102可以基于成对事件的时间间隔以更高的精度识别瞬时道路噪声。一旦成对声音被瞬时道路噪声检测器识别为瞬时道路噪声,包括成对声音的两个声音事件被瞬时道路噪声衰减器104移除。
如果不能得到车辆的轴距或速度,则必须使用用于识别瞬时道路噪声的可选择的方法。例如,使用适应性模型来预报与瞬时道路噪声相关的两个声音事件的正确的时间间隔。瞬时道路噪声检测器102基于成对噪声事件的频谱形状来识别可能是瞬时道路噪声的成对的噪声事件。使用加权平均值、leaky积分器或某些其他适应性的模型技术,无论车辆的行进速度是多少,瞬时道路噪声检测器可以不考虑轴距的长度,快速建立成对瞬时道路噪声的合适的时间间隔。
当然,为了建模瞬时道路噪声的合适间隔,首先必须识别可能是成对瞬时道路噪声部分的声音事件。这可以通过检查单独的声音事件的频率特性来完成。如已经提及的,并且已经在频率响应图130中清楚显示的,瞬时道路噪声具有相似的频谱特性。与首先前轮撞击障碍物并且之后后轮撞击障碍物的瞬时道路噪声对相关的单独声音事件都是扩展到较宽频率范围的宽带事件。例如,图3中所示的两个声音事件138和140包括在大部分显示频率上的位于背景噪声上的信号能量。然而,最高信号能量被集中在较低频率范围。因此,瞬时道路噪声的频谱形状的特征是在较低频率的早先尖峰和在较高频率的逐渐变细。这些特征可以被瞬时道路噪声检测器102建模。在所接收信号中发现的这些特征可以被瞬时道路噪声检测器识别为潜在的瞬时道路噪声。一旦瞬时道路噪声检测器102识别出成对瞬时道路噪声的潜在成分,其可以及时的期望或回顾以确定具有相同或相似特征的伴随声音事件来实现瞬时道路噪声对。瞬时噪声检测器及时的期望或回顾以定位伴随声音的时间数量如上所述,或者基于车辆的轴距和车辆行进的速度或基于瞬时道路噪声事件模型,而被确定。
图4显示了元音声音160的频率响应的时域-频域图。时域-频域图160与图3中的时域-频域图130相似。多个单独的时间间隔被沿着时间轴132排列。频率值沿着频率轴134增加。对于每个时间间隔和位于每个频率的所接收信号的幅度大小以dB形式由沿着dB轴136的曲线的高度表示。元音声音被多个谐波峰值162,164,166表征并且在所示的时间间隔上基本保持恒定。比较图3和图4,当在时域-频域上观察时,图3的瞬时道路噪声清楚的从图4的元音声音中区分出来。
之后,图5显示了在存在元音声音和基本背景噪声时显示瞬时道路噪声的时域-频域图170。可以看出,对应于瞬时道路噪声的成对声音事件138,140部分的掩蔽了元音声音的谐波峰值162,164,166。然而,元音声音和瞬时道路噪声的一般时间和频谱波形可以是清楚的。
与瞬时道路噪声相关的声音事件一旦被基于他们的时间和频谱特性在所接收的信号中识别,它们可以被瞬时道路噪声衰减器104移除或衰减。可以使用多种方法从所接收的信号中衰减、抑制或移除瞬时道路噪声。一种方法是把瞬时道路噪声模型增加到记录的或估计的背景噪声信号中。在功率谱中,然后可以从所接收的信号中减去瞬时道路噪声和连续的背景噪声估计。如果主要语音信号的一部分被瞬时道路噪声掩蔽,则可以使用传统的或修改的逐步的内插器(interpolator)来重建信号的丢失部分。可以使用逆FFT把重建的信号转换到时域。
图6是频域-时域图180,在存在背景噪声时显示了元音声,从元音声中移除了瞬时道路噪声。在图5中完全被瞬时道路噪声掩蔽的谐波164和166在图6中重新可以看到,尽管有些失真。图7显示了图6中的失真元音信号在线性逐步的内插器重建信号的失真部分后的频域-时域图190。可以看到,图7中的重建信号基本上与图4的未干扰元音信号相同。
图8是依照本发明的实施例的瞬时道路噪声检测器102的框图。瞬时道路噪声检测器102接收或检测包含语音、噪声和/或语音和噪声的组合的输入信号101。接收的或检测的信号101在预定频率被数字化。为了保证高质量声音,声音信号被具有任何普通采样速率的模拟-数字转换器502(ADC)转化为脉冲编码调制(PCM)信号。平滑窗口函数产生器504产生例如汉明窗口的窗口函数,其被应用于数据块获得窗口信号。可以通过快速傅立叶变化(FFT)506或其他时间-频率转换机制的装置获得窗口信号的复合频谱。FFT把数字化信号分成频率单元(frequency bin),并对于每个频率单元计算所接收信号的不同频率分量的幅度。频率单元的频谱分量可以被模型器508在时间上监视。
如上所述,对于建模的瞬时道路噪声具有两个方面。第一是建模形成成对瞬时道路噪声的单独的声音事件,第二是建模包括成对瞬时道路噪声的两个声音事件之间合适的时间间隔。其次,包括成对瞬时道路噪声的单独声音事件具有特征形状。该形状,或特征形状的属性可以被模型器508产生和/或存储。所接受信号的谱频和/或时间形状与建模的形状之间的相关性,或接收信号频谱的属性与建模的属性之间的相关性,可以识别声音事件为可能的属于成对瞬时道路噪声的声音事件。一旦声音事件被识别为可能属于成对瞬时道路噪声,则模型器508可以回顾之前分析的窗口或期望后面的接收的时间窗口,或在相同的时间窗口内回顾或期待,来确定瞬时道路噪声的相应分量是否已经被接收或稍后被接收。之后,如果具有适当特征的相应声音事件无论在识别的声音事件之前还是之后在合适时间量内被接收,则两个声音事件可以被识别为单个成对瞬时道路噪声的组成。
可选择的,或附加的,模型器可以确定信号包括瞬时道路噪声的概率,并当概率超过概率阈值时可以把声音事件识别为瞬时道路噪声。相关性和概率阈值可以取决于多种因素,包括在输入信号中其他噪声或语音的存在。当瞬时道路噪声检测器102检测到瞬时道路噪声时,检测的瞬时道路噪声的特性可以被提供到瞬时道路噪声衰减器104,以从所接收的信号中移除瞬时道路噪声。
由于多个声音窗口被处理,瞬时道路噪声检测器102可以对包括瞬时道路噪声的两个单独声音事件和它们之间的时间间隔获得平均的噪声模型。可以使用时间平滑或加权平均来建模每个频率单元的瞬时道路噪声声音事件和连续的噪声估计。当瞬时道路噪声在缺少语音的情况下被检测时,平均模型可以被更新。更新平均模型时完全的限制瞬时道路噪声可以增加准确检测的概率。Leaky积分器、加权平均或其他方法可被用于建模前轮和后轮声音事件之间的时间间隔。
为了最小化“音乐噪声”,尖叫声,叫声,滴答声,水滴声,怦然声,音调或其他人为声音,可选的残留衰减器也可以在声音信号被转换到时域前调节声音信号。残留衰减器可以与瞬时道路噪声衰减器104组合,与一个或多个其他元件组合或包括分离的元件。
残留衰减器可以在低频率范围(例如从大约0Hz到大约2kHz,瞬时道路噪声的大部分能量发生在该范围)内追踪功率谱。当信号功率的较大增加被检测时,可以通过在低频范围内把发送的功率限定或抑制到预定的或计算的阈值来获得改进。计算的阈值可以在较早的时间上等于或取决于相同的低频范围内的平均频谱功率。
对于声音质量的进一步改进可以通过在输入信号被瞬时道路噪声检测器102处理之前预调整输入信号来获得。如图9所示,一个预处理系统可以利用由信号在不同时间到达放置为相互远离的不同检测器引起的滞后时间。如果多个检测器或麦克风902用于把声音转化为电信号,则预处理系统可以包括控制器904,该控制器904自动选择麦克风902和感测最小噪声量的信道。当另一麦克风902被选择时,在被瞬时道路噪声检测器102处理之前电信号可以与之前产生的信号组合。
可选择的,瞬时道路噪声检测可以在每个信道上执行。可以通过切换麦克风902之间的输出发生一个或多个信道的混合。可选的或附加的,控制器904可以包括比较器,并且可以根据从麦克风902接收的信号的幅度或时间的不同来检测信号的方向。可以通过在不同的方向设置麦克风902来改进方向检测。瞬时道路噪声检测可以被制作的对车辆外部发出的信号更灵敏。
可以仅在高于或低于特定阈值频率(例如,使用高通或低通滤波器)上估算信号。由于平均瞬时道路噪声模型学习到瞬时道路噪声的预期频率,阈值频率可以在时间上被更新。例如,当车辆以较高速度行进时,用于瞬时道路噪声检测的阈值频率可以设定为较高,因为瞬时道路噪声的最大频率可以随着车辆速度增加。可选择的,控制器904可以通过加权函数在特定频率或频率范围组合多个麦克风902的输出信号。
图10显示了另一声音增强系统1000,该系统也可以改进所处理声音的感知质量。该改进可以通过把时间改变信号数字化或转化到频域的时域-频域转换逻辑1002完成。背景噪声估计器1004测量发生在声音源或接收机附近的连续的噪声或环境噪声。背景噪声估计器1004可以包括功率检测器,该功率检测器在功率、幅度或对数域内对每个频率单元的声功率进行平均。
为了阻止瞬时的偏差背景噪声估计,瞬时检测器1006可以在功率异常或不可预知的增加的情况下禁止或调节背景噪声估计处理。在图10中,当瞬间背景噪声B(f,i)超过平均背景噪声B(f)Ave的值大于所选的分贝值“c”时,瞬时检测器1002禁止背景噪声估计器1004。该关系可以被表述为B(f,i)>B(f)Ave+c (1)可选择的或附加的,可以依靠信号和噪声的比率(SNR)更新平均背景噪声。接近该算法的一个例子是根据SNR自适应leaky积分器B(f)Ave′=aB(f)Ave+(1-a)S (2)其中a是SNR的函数并且S是瞬时信号。在该例子中,SNR越高,平均背景噪声被适应为越低。
为了检测对应于瞬时道路噪声的声音事件,瞬时道路噪声检测器1008可以在时域-频域内把一个函数拟合到信号的所选部分。函数和在一个或多个频带的时域中的信号包络之间的相关性可以识别对应于瞬时道路噪声事件的声音事件。信号的部分被识别为可能对应瞬时道路噪声的声音事件的相关性阈值可以取决于所处理声音的理想清楚度和瞬时道路噪声在宽度和锐度上的变化。可选择的或附加的,系统可以确定信号包括瞬时道路噪声的概率,并且当概率超过概率阈值时可以识别瞬时道路噪声。相关性和概率阈值可以取决于各种因素,包括在输入信号中其它噪声或语音的存在。当噪声检测器1008检测瞬时道路噪声时,检测的瞬时道路噪声特性可以被提供给噪声衰减器1012用于移除瞬时道路噪声。
信号鉴别器1010可以实时的或延时的标记声音和噪声频谱。可以使用任何方法从噪声中区别声音。可以使用如下方面来识别语音信号(1)语音信号的频带的狭窄宽度或峰值;(2)主要谐振(broad resonance),也称为共振峰,其可以由说话人的元音区域形状产生;(3)速率,在该速率,特定特征随着时间改变(即,时间-频率模型可以基于如何随时间改变而被用于识别语音信号);以及当多个检测器或麦克风被使用时,(4)检测器或麦克风的输出信号的相关性、差异或相似性。
图11是移除瞬时道路噪声和某些连续噪声来增强所处理声音信号的感知质量的声音增强系统的流程图。在1102所接收或检测的信号被在预定的频率数字化。为了保证高质量的声音,声音信号可以被ADC转换为PCM信号。在1104可以通过把数字化信号分成频率单元的FFT装置获得窗口信号的复合频谱,其中每个频率单元在小频率范围识别幅度和相位。
在1106,连续的背景或环境噪声估计被确定。背景噪声估计可以包括在每个频率单元的声功率的平均。为了防止瞬时的偏差噪声估计,在功率的异常或不可预知的增加期间噪声估计处理可以被禁止。当瞬时背景噪声超过平均背景噪声的值大于预定分贝值时,瞬时检测1108禁止背景噪声估计。
在1110当与瞬时道路噪声模型一致的一对声音事件被检测时,瞬时道路噪声可以被检测。可以通过声音事件频谱形状或其他属性识别声音事件,并且当声音事件的时间间隔符合一对瞬时道路噪声的建模的时间间隔或符合根据车辆的轴距长度和车辆的速度计算的时间间隔时,一对声音事件可以被确认为属于一对瞬时道路噪声。此外,瞬时道路噪声的检测时以以各种方式被限制。例如,如果检测到元音或另一谐波结构,则瞬时噪声检测方法可以把瞬时噪声修正限定为低于或等于平均值的值。另一种选择是仅在无语音片断的时候允许更新平均瞬时道路噪声模型或瞬时道路噪声模型的属性,例如建模的声音事件的频谱形状或成对瞬时道路噪声的时间间隔。如果语音或混合了噪声片断的语音被检测,则平均瞬时道路噪声模型或瞬时道路噪声模型的属性将不被更新。如果没有检测到语音,则通过各种方法更新瞬时道路噪声模型,例如通过加权平均或leaky积分器。很多其他的可选属性或限制也可以被用于模型。
如果在1110检测到瞬时道路噪声,则在1114执行信号分析,从类似噪声的片断中区别或标记语音信号。通过如下方面可以识别语音信号(1)它们频带的狭窄宽度或峰值;(2)主要谐振,也称为共振峰,其可以由说话人的元音区域形状产生;(3)速率,在该速率,特定特征随时间改变(即,时间-频率模型可以基于如何随时间改变被用于识别语音信号);以及当多个检测器或麦克风被使用时,(4)检测器或麦克风的输出信号的相关性、差异或相似性。
为了克服瞬时道路噪声的影响,在1116噪声基本上从噪声频谱中移除或抑制。在1116使用的一种典型方法是把瞬时道路噪声模型增加到记录的或建模的连续噪声。在功率谱中,建模的噪声基本上通过上述方法和系统从修正的频谱中移除。如果主要的语音信号被瞬时道路噪声掩蔽,或被连续噪声掩蔽,则在1118可以使用传统的或修正的内插器来重建语音信号。在1120可以使用时间序列合成把信号功率转化到时域。结果是瞬时道路噪声已经基本上从其中移除的重构的语音信号。如果在1110没有检测到瞬时道路噪声,信号可以直接在1120转化到时域,以提供重建的语音信号。
图11中所示的方法可以在信号承载介质、计算机可读介质(例如存储器)中被编码,在例如一个或多个集成电路的设备内编程,或被控制器或计算机处理。如果方法通过软件执行,则软件可以驻留于存在或连接到瞬时道路噪声检测器102的存储器中、通信接口或任何其他类型的连接到或存在于声音增强系统100或1000的非易失或易失存储器中。存储器可以包括顺序的执行指令列表用于执行逻辑功能。可以通过数字电路、源代码、模拟电路、例如模拟电子或音频或视频信号的模拟源执行逻辑功能。软件可以被包含在任何计算机可读介质或信号承载介质中,通过或连接到指令执行系统、装置或设备来使用。这样的系统可以包括基于计算机的系统,包含处理器的系统,或其他能够从指令可执行系统、装置或也可以执行指令的设备中选择性的取得指令的系统。
“计算机可读介质”,“机器可读介质”,“传播信号”介质,和/或“信号承载介质”可以包括任何包含、存储、传播或传送软件的装置,用于通过或连接到指令可执行系统、装置或设备来使用。机器可读介质可选择为,但不限定为电、磁、光、电磁、红外线或半导体系统、装置、设备或传播介质。机器可读介质例子的不完全列表可以包括电连接,“电”具有一个或多个电线,便携的磁盘或光盘,易失的存储器例如随机接入存储器“RAM”(电),只读存储器“ROM”(电),可擦可编程只读存储器(EPROM或闪存)(电),光纤(光)。机器可读介质也可以包括有形的介质,与软件可以以图像或其他格式(例如通过光扫描)被电性存储一样,可以在上面进行软件印刷,然后编译,和/或解释或其他处理。所处理的介质可以然后被存储在计算机和/或机器存储器。
上述系统可以调节从一个或多个麦克风或检测器接收的信号。可以使用系统的多种组合来识别和追踪瞬时道路噪声。除了为可能是一对瞬时道路噪声成分的声音事件拟合函数外,系统可以检测并分离具有比建模的声音事件能量高的信号的任何部分。上述系统的一个或多个也可以被用于可选择的声音增强逻辑。
其他可选择的声音增强系统包括上述结构和功能的组合。这些声音增强系统由上述或附图中所示的结构或功能的任意组合形成。系统也可以以软件或硬件的形式被实现。硬件可以包括具有易失和/或非易失存储器的处理器或控制器,并且也可以包括通过无线和/或硬件介质到外围设备的接口。
声音增强系统可以容易的适应于任何技术或设备。某些声音增强系统或部件可以如图12所示连接或耦合到车辆,可以把语音和其他声音转为为可以被传输到远程位置的装置,例如路上运输和无线电话和图13中所示的音频设备,以及易受瞬时噪声影响的其他通信系统。
声音增强系统改进了所处理声音的感知质量。逻辑可以实时的或在一段延时后自动的获知和编码与瞬时道路噪声相关的噪声的形状和形式。通过追踪选定的属性,存储器系统使用临时或永久存储瞬时道路噪声所选属性可以消除、基本上消除或抑制瞬时道路噪声。声音增强系统也可以抑制连续噪声和/或尖叫声、叫声、滴答声、水滴声、怦然声、音调或其他可能在声音增强系统中产生的人为声音并在需要的时候重建声音。
尽管已经描述了本发明的各种实施例,本领域的普通技术人员清楚在本发明的范围内多种其他实施例和实现也是可能的。因此,本发明根据附加的权利要求和其等价物来限定。
权利要求
1.一种抑制信号中瞬时道路噪声的系统,包括瞬时道路噪声检测器,适合于在所述信号中检测瞬时道路噪声的存在;以及瞬时道路噪声衰减器,用于基本上移除在所接收的信号中检测到的道路瞬时噪声。
2.根据权利要求1所述的系统,其中,所述瞬时道路噪声检测器包括瞬时道路噪声的模型并且其中所述瞬时道路噪声检测器适合于将所述信号的属性与所述模型的属性进行比较,当所述瞬时道路噪声检测器确定所述信号的属性基本上与所述模型的属性一致时,所述瞬时道路噪声检测器检测到信号中瞬时道路噪声的存在。
3.根据权利要求2所述的系统,其中,所述模型包括频谱分量和时间分量。
4.根据权利要求3所述的系统,其中,所述时间分量包括第一声音事件和被时间段分离的基本上相同的第二声音事件。
5.根据权利要求4所述的系统,其中,所述第一声音事件和所述第二声音事件之间的时间段是以车辆行进的速度和车辆的前轮与后轮之间的距离为依据的。
6.根据权利要求5所述的系统,其中,所述第一声音事件和所述第二声音事件之间的时间段是以车辆行进的实际速度和车辆的轴距长度的计算为依据的。
7.根据权利要求5所述的系统,其中,所述第一声音事件和所述第二声音事件之间的时间段是由适应性模型决定的。
8.根据权利要求3所述的系统,其中,所述频谱分量包括与瞬时道路噪声相关的声音事件的频谱形状的一个或多个属性。
9.根据权利要求8所述的系统,其中,与瞬时道路噪声相关的声音事件的频谱形状的属性包括在相对较低频率范围具有峰值强度的宽带频率响应。
10.一种检测信号中瞬时道路噪声存在的瞬时道路噪声检测器,所述瞬时道路噪声检测器包括模拟数字转换器,用于把接收的信号转换为数字信号;窗口函数产生器,用于把所述信号分成多个单独分析窗口;转换模块,用于把来自时域信号的单独分析窗口转换为频域短期频谱;以及模型器,用于产生和/或存储瞬时道路噪声的模型属性,把转换的所述分析窗口的短期频谱的属性与所述模型属性进行比较,从而确定瞬时道路噪声是否存在于所述接收的信号中。
11.根据权利要求10所述的瞬时道路噪声检测器,其中,所述模拟数字转换器把所述接收的信号转换为脉冲编码调制(PCM)信号。
12.根据权利要求10所述的瞬时道路噪声检测器,其中,所述窗口函数产生器是汉明窗口函数产生器。
13.根据权利要求10所述的瞬时道路噪声检测器,其中,所述转换模块在单独分析窗口上执行快速傅立叶变换。
14.根据权利要求10所述的瞬时道路噪声检测器,其中,所述模型属性包括瞬时道路噪声特有的时间特性。
15.根据权利要求10所述的瞬时道路噪声检测器,其中,所述模型属性包括瞬时道路噪声特有的频谱特性。
16.根据权利要求10所述的瞬时道路噪声检测器,其中,所述模型属性包括瞬时道路噪声特有的时间和频谱特性。
17.根据权利要求16所述的瞬时道路噪声检测器,其中,所述模型属性包括被相对较短时间段分离的具有基本上相同频谱特性的两个声音事件的存在。
18.根据权利要求17所述的瞬时道路噪声检测器,其中,所述模型属性包括所述两个声音事件的频谱形状特性。
19.根据权利要求18所述的瞬时道路噪声检测器,其中,在时域-频域上对信号的所选部分拟合函数,以估计所述两个声音事件的频谱-时间形状特性。
20.根据权利要求10所述的瞬时道路噪声检测器,进一步包括残留衰减器,用于追踪所述信号的功率谱,并且当信号功率的较大增加被检测到时,基于之前时间段在低频范围内的信号的平均频谱功率,将低频范围内的发送功率限定到预定值。
21.一种从信号中移除瞬时道路噪声的方法,包括建模瞬时道路噪声的特性;分析所述信号以确定所述信号的特性是否对应于瞬时道路噪声的建模的特性;以及从所述信号中基本上移除对应于瞬时道路噪声的所述建模的特性的接收信号的特性。
22.根据权利要求21所述的方法,具中,瞬时道路噪声的建模的特性包括在时间上分离的两个声音事件的声对。
23.根据权利要求22所述的方法,其中,包括声对的两个声音事件被一段时间分离,所述一段时间对应于以某一速率行进的车辆的前轮撞击障碍物和车辆的后轮撞击障碍物之间的时间长度。
24.根据权利要求23所述的方法,其中,所述车辆具有某一长度的轴距,并且其中,所述轴距的长度和车辆行进的速率是已知的,所述方法进一步包括基于所述轴距的长度和车辆行进的速率计算对应于瞬时道路噪声声对的两个声音事件之间的时间间隔。
25.根据权利要求22所述的方法,进一步包括建模包括特征为瞬时道路噪声的声对的两个声音事件之间的时间间隔。
26.根据权利要求25所述的方法,其中,使用leaky积分器建模瞬时道路噪声声对的时间间隔。
27.根据权利要求22所述的方法,其中,瞬时道路噪声的所述建模的特性进一步包括包含与瞬时道路噪声相关的声对的声音事件的频谱形状属性。
28.根据权利要求27所述的方法,其中,所述声音事件的频谱形状属性包括集中在相对较低频率的具有峰值能量水平的宽带事件。
全文摘要
本发明提供一种声音增强系统,用于改进所处理声音信号的感知质量。该系统通过从由麦克风记录的或来自其他源的声音信号中移除不想要的噪声来改进所接收的声音信号的感知质量。特别是,该系统移除发生在信号源环境但与语音无关的声音。该系统尤其适用于从记录在运动中车辆的语音信号中移除瞬时道路噪声。瞬时道路噪声包括可以被建模的通用时间和频谱特性。瞬时道路噪声检测器使用该模型来检测声音信号中瞬时道路噪声的存在。如果瞬时道路噪声被发现存在,则提供瞬时道路噪声衰减器用于从信号中移除瞬时道路噪声。
文档编号H04R3/02GK1956058SQ20061016461
公开日2007年5月2日 申请日期2006年10月10日 优先权日2005年10月17日
发明者P·A·赫瑟林顿, S·A·帕兰杰佩 申请人:哈曼贝克自动系统-威美科公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1