改进的周期信号增强的制作方法

文档序号:2829754阅读:396来源:国知局
专利名称:改进的周期信号增强的制作方法
技术领域
本发明涉及通信系统,并且尤其涉及用于增强语音的系统。
背景技术
通信设备可以获取、吸收并转送语音信号。许多语音信号可以被分类为浊音的(voiced)和清音的(unvoiced)。在时域中,清音段显示像噪声一样的结构。表面上几乎没有周期性。在语音频谱中,浊音语音段差不多都有周期性结构。
某些自然语音具有谐波频谱和噪声频谱的组合。谐波和噪声的混合可能看起来像跨越大的带宽。特别是当噪声会屏蔽浊音段和无语音间隔时,不稳定和/或变化噪声级是相当讨厌的。虽然不稳定噪声的频谱特性可能不会极大地变化,然而其幅度可能急速地变化。
为此,需要一种可以加强或增强浊音段而不会增强不稳定噪声的系统。还需要一种用于在存在音调干扰的情况下增强浊音段的周期式结构的系统。

发明内容
一种增强系统改进了所处理语音的感知质量。该系统包括延迟单元,用于延迟经由离散输入端接收的信号。连接到延迟单元的频谱修正器被编程来基本上拉平(flatten)背景噪声的频谱特性。连接到频谱修正器的自适应滤波器对滤波器特性进行自适应以便匹配未延迟信号的响应。可编程滤波器被连接到延迟单元。可编程滤波器具有与自适应滤波器的传递函数以函数式相关的传递函数。
当检查以下附图和具体实施方式
之后,本发明的其它系统、方法、特征和优点对本领域技术人员来说将变得更加清楚。旨在把所有这种附加系统、方法、特征和优点包括在此描述、本发明的范围内,并且由以下权利要求保护。


参考以下附图和描述可以更好地理解本发明。附图中的组件不必按比例绘制,而是代之以着重示出用于图示本发明原理的部分。此外在附图中,遍及不同视图,相同的附图标记指代相应的部分。
图1是增强系统的框图;图2是第二增强系统的框图;图3是第三增强系统的框图;图4是位于增强声频信号以上的声频信号;图5是增强和过增强声频信号的曲线图;图6是增强和过增强声频信号的曲线图;图7是增强和过增强声频信号的曲线图;图8是第三增强系统的框图;图9是位于过增强声频信号以上的声频信号的曲线图,该过增强声频信号位于增强声频信号以上;图10是增强和过增强声频信号的曲线图;图11是增强和过增强声频信号的曲线图;图12是增强和过增强声频信号的曲线图;图13是信号增强的流程图;图14是信号增强的可替换流程图。
具体实施例方式
一种增强逻辑改进了所处理语音信号的感知质量。该逻辑可以在不放大某些或所有感测噪声的情况下自动地标识并增强语音段。可以在一个或多个频带中处理并放大所选择的浊音和/或清音段。为了改进感知质量,可以在离散域中进行自适应增益调节。该系统可以根据所感测或估算的噪声或背景噪声信号来利用一些调整器调节一些或全部语音段的增益。系统的多功能性允许增强逻辑在由第二系统传递或处理语音之前增强该语音。在一些应用中,语音或其它音频信号可以被传递到远程、本地或移动系统(诸如自动语音识别引擎),该系统可以在时间和/或频率和/或离散域中捕获并提取声音。
图1-3和8的增强系统100可以连接到车辆或通信系统的单个部件(例如,无线电话、自动语音识别系统等)或包括车辆或通信系统的单个部件。这些系统可以包括预处理逻辑和/或后处理逻辑并且可以用硬件和/或软件来实现。在一些系统中,软件由数字信号处理器“DSP”、通用处理器“GPP”或DSP和GPP的一些组合来处理。处理器可以执行用于延迟输入信号、跟踪信号的频率分量、过滤信号和/或加强所选择频谱内容的指令。在其它系统中,硬件或软件可以在离散逻辑或电路、离散和集成逻辑或电路的组合中被编程或实现,和/或可以跨过多个控制器或处理器分送并由其执行。
图1是包括频谱修正器102的通信或增强系统100的框图。如图所示,频谱修正器102改变延迟信号的频谱。数字延迟或延迟单元104把输入“x(n)”连接到频谱修正器102和可以具有单个输入和多个输出的可编程滤波器106,数字延迟或延迟单元104可以由存储设备或缓冲器的一部分来实现,存储设备或缓冲器用于暂时地保留要被转送到另一位置的数据长达所定义或可编程的周期。频谱修正器102基本上拉平在输入“x(n)”或所延迟的输入“x(n-D)”内所检测的背景噪声一部分的频谱特性,所述输入可以包括语音和背景噪声。在一些系统中,在话音突峰(talk spurt)和暂停期间检测部分背景噪声的频率和/或幅度。在一些应用中,所检测的噪声由n-极线性预测编码“n-polelinear predictive coding LPC”滤波器模型来建模,其中n通常被设置为4。在这些及其它系统中,一些背景噪声基本上被拉平,并且在其它系统中,一些背景噪声被抑制。噪声可以被抑制为缓和的噪声级、噪声最低限度或者用户期望听到的预定级。
诸如移动平均滤波器、非递归离散时间滤波器或自适应FIR滤波器之类的自适应滤波器108利用所拉平或抑制的噪声频谱来为一部分语音频谱建立模型。在一些增强系统中,自适应滤波器108改变或自适应其系数以便尽可能紧密匹配或近似输入信号“x(n)”的响应。使用自适应滤波算法,通过加法器逻辑或加法器电路110(例如,向量加法器)来导出误差信号“e(n)”,加法器从所修改的预测输出向量“y(n)”中减去输入信号“x(n)”。如方程式1所示来计算。
向量e(n)=向量y(n)-x(n) 方程式1根据此方法,自适应滤波器108将改变其系数以试图降低在所修改的预测输出向量“y(n)”和离散输入信号“x(n)”之间的差异。
虽然系统包含了用于选择可编程滤波器106的系数的许多技术,然而在图1中,可编程滤波器106基本上以增强系统100的采样率来拷贝自适应滤波器系数。增强系统100的采样率可以随所想要的增强语音信号的分辨率而变化。虽然自适应滤波器108和可编程滤波器106的传递函数可以随输入信号“x(n)”或延迟输入信号“x(n-D)”的幅度和/或频率改变而改变,然而当处理输入信号的每个采样点时,可编程滤波器106具有与自适应滤波器108基本上相同的传递函数。这可以暂时地在增强系统100的采样频率上出现。
在图1中,由可编程滤波器106处理延迟输入“x(n-D)”的一部分以便得到预测性输出向量 然后由加权逻辑或加权电路112来处理预测性输出向量 以便得到标量输出。在图1中,加权逻辑或电路112可以包括求和滤波器,用于在对系数求和之前移除预测性输出向量 的负分量以便导出标量输出。然后通过加法器逻辑或加法器电路114(例如,标量加法器)把标量输出加到输入信号,这增强了浊音语音的周期性或谐波结构而几乎不会加强背景噪声。
为了使输入或离散输入“x(n)”的增强高频分量最小化,前端过程、电路、处理器、控制器或接口可以进一步调节其它通信系统和/或增强系统中的延迟输入。类似于在图1、2、3和8中所示出的系统,延迟可以对应于最大音调周期或可以随每个应用而改变。在图2中,前端的离散逻辑或电路可以允许已经在频谱上拉平背景噪声的所选信号频率被传递到加法器逻辑或加法器电路202(例如,信号加法器)。低通滤波器204可以基本上衰减或基本上抑制由频谱修正器102处理的在频谱上修正的信号的高频分量。低通滤波器204的截止频率可以基本上与高通滤波器206的截止频率相一致。这些滤波器的截止频率可以包括这样的频率或范围,所述频率或范围包含了在通带和邻近衰减带之间的转变。在图2中,前端的其它离散逻辑或电路基本上通过延迟信号在截止频率以上的所有频率,然后所述频率被经由加法器逻辑或电路202添加到在频谱上修正的信号的传递频率。然后诸如移动平均滤波器、非递归离散时间滤波器或自适应FIR滤波器之类的自适应滤波器108可以为所组合的频谱建立模型。
在图2中,经由加法器逻辑或加法器电路110(例如,向量加法器)来导出误差信号(例如,向量),加法器逻辑或加法器电路从所自适应的预测输出向量“y(n)”中减去输入信号。在离散输入和自适应的预测输出向量“y(n)”之间的差异包括误差向量“e(n)”。虽然此系统包含了用于选择可编程滤波器的系数的许多技术,然而在图2中,可编程滤波器106基本上以增强系统200的采样率来拷贝自适应滤波器系数。在此系统中,可编程滤波器106包括单个输入和多个输出(例如,向量系数)。此增强系统200的采样率可以随所想要的增强语音信号的分辨率而改变。虽然自适应滤波器108和可编程滤波器106的传递函数可以随所组合信号的幅度和/或频率改变而改变,然而当处理输入信号的每个采样点时,可编程滤波器106具有与自适应滤波器108基本上相同的传递函数。这可以暂时地在此增强系统200的采样频率上出现。
在图2中,由可编程滤波器106处理所组合的输入以便得到预测性输出向量 然后由加权逻辑或加权电路112来处理预测性输出向量 以便得到标量输出。在图2中,加权逻辑或电路112可以包括求和滤波器,用于在对向量分量求和之前移除预测性输出向量 的负分量以便导出标量输出。然后通过加法器逻辑或加法器电路114(例如,标量加法器)把标量输出加到输入信号,这增强了浊音语音的周期性或谐波结构以便得到增强的语音信号。
在其它通信系统和/或增强系统300中,频谱屏蔽器302可以改进离散输入信号的信噪比。在这些增强系统300中,可替换的前端调节频谱并且在延迟的输入信号被传递到自适应滤波器108之前滤波延迟的输入信号。在一些增强系统中,滤波器包括预定或可编程的频谱屏蔽器302,用于传递基本上可听的频率。在这些增强系统300中,频谱屏蔽器302基本上阻塞或基本上衰减所拉平的位于听觉通带之外的噪声频谱。在其它通信和增强系统中,频谱屏蔽器的通带会改变。在一些增强系统中,可以增强浊音语音的整个段或一部分以便匹配通信系统的带宽,包括在车辆内所连接或集成的无线通信系统。在其它系统中,频谱屏蔽器的通带可以被编程或配置为传递任何频率范围、幅度,并可以采用任何频谱形状。像在图1和2中所示出的增强或通信系统100或200一样,如上所述然后可以处理包括在频谱上被拉平并被滤波的噪声频谱的信号。
为了克服低频干扰的影响,图2的低通滤波器204或图3的频谱屏蔽器302的通带可以被编程或配置为拉平并只传递声频信号的低频部分。如图4中的箭头所示,输入信号可以包括低频干扰或非自然信号(artifact)。这些非自然信号在许多情况下可以被听到或由其它系统产生。风冲击车辆“风颤(wind buffets)”、交流发电机产生电流、冷却系统冷却车辆,以及许多其它系统或情况都可能产生干扰。尽管非自然信号看起来具有一定周期性,然而通信和增强系统增强周期性的声频信号部分而不会增强低频的非自然信号。在一些系统中,非自然信号的幅度或信号强度也可以由增强系统来削弱或抑制。
当低频干扰不能有别于呈现周期性的语音信号时,增强系统或电路可能会过增强在声频信号中所听到的干扰。如图5上方的曲线图所示,箭头指向由风颤所产生的低频干扰所不想要的增强。在此图中,增强放大了低频非自然信号,该非自然信号屏蔽了在大约1.281秒所获取语音信号的快照中的一些语音。如下方的曲线图所示,图2和3的通信或增强系统在几乎没有增强干扰或低频干扰的情况下加强了语音信号的峰值。
图6和7示出了其它曲线图,用于图示当增强语音信号时没有把干扰与语音相区分的影响。如图6和7上面的曲线图所示,箭头指向由风颤所产生的低频干扰所不想要的增强。在这些图中,增强放大了低频非自然信号,该非自然信号屏蔽了在语音的大约2.976秒(图6)以及语音的2.653秒(图7)所获取快照中的语音。如下面的曲线图所示,图2和3的通信或增强系统在几乎没有增强干扰或低频非自然信号的情况下加强或放大了语音信号的峰值。
图8是可替换的通信或增强系统800,用于区别以一个或多个基本上同频的音调噪声或连续干扰。这些可替换的增强系统800可以包括用于实现上述频谱修正器102的硬件和/或软件。图8的频谱修正可以包括图1的背景噪声的频谱拉平102;图2的频谱拉平102、低通滤波器204、高通滤波器206和加法器202;图3的频谱拉平102和频谱屏蔽器(spectral mask)302;或这些前端的一个或多个元件的组合。在一些增强系统中,频谱修正102可以包括诸如被连接到带通滤波器或线性预测编码滤波器的频谱拉平器之类的其它逻辑。
在图8中,频谱修正器102改变延迟信号的频谱。数字延迟104把输入“x(n)”输入到具有单个输入和多个输出(例如,向量系数)的频谱修正器102和可编程滤波器106,所述数字延迟104可以由存储器或缓冲器的一部分来实现,存储器或缓冲器用于暂时地保留要被转送到另一位置的数据长达编程或预定周期。频谱修正器102基本上拉平在输入“x(n)”或所一部分延迟输入“x(n-D)”的所检测的背景噪声的频谱特性。在一些增强系统中,在话音突峰和暂停期间检测背景噪声的频率和/或幅度。在这些及其它增强系统中,背景噪声基本上被拉平或抑制。噪声可以被拉平或抑制为缓和的噪声级、噪声最低限度或者用户期望听到的预定级。
诸如移动平均滤波器、非递归离散时间滤波器或自适应FIR滤波器之类的自适应滤波器108利用所拉平或抑制的噪声频谱来为一部分语音频谱建立模型。在一些增强系统800中,自适应滤波器108改变或自适应其系数以便尽可能紧密匹配或近似输入信号“x(n)”的响应。使用自适应滤波算法,通过加法器逻辑或加法器电路110(例如,向量加法器)来导出误差信号“e(n)”,该加法器从所自适应的预测输出向量“y(n)”中减去输入信号“x(n)”。如方程式1所示来计算。根据此方法,自适应滤波器改变其系数以试图降低在所自适应的预测输出向量“y(n)”和离散输入信号“x(n)”之间的差异。
虽然此增强800系统包含用于选择可编程滤波器106的系数以便满足所想要增强的许多技术,然而在图8中,通过从自适应滤波器系数的瞬时估算中减去滤波器系数的移动平均值来导出可编程滤波器系数。虽然可以使用任何时间平均值,然而在图8中,使用漏平均值(leakyaverage)来导出可编程滤波器系数。漏平均值可以由方程式2或3来表达y(n)=(1-a)y(n-1)+ah(n) 方程式2y(n)=y(n-1)+a(h(n)-y(n-1)) 方程式3其中y(n)是滤波器系数的漏平均向量,h(n)是输入滤波器系数向量,并且a是漏系数。通过采取自适应滤波器系数的漏平均值,可以基本上捕获存在于输入信号中的音调噪声。然后可以从自适应滤波器系数的基本上瞬时的估算中减去滤波器系数的漏平均值以便从所估算的自适应滤波器系数中消除音调噪声的影响。基本上以增强系统800的采样率把所产生或修正的系数拷贝到可编程滤波器106。虽然自适应滤波器108和可编程滤波器106的传递函数在图8中是不相同的并且可以随输入信号“x(n)”或延迟输入信号“x(n-D)”的改变而改变,然而当处理输入信号的每个采样点时,可编程滤波器106的传递函数会跟踪所述自适应滤波器108的传递函数。在图8中,传递函数的系数与时间移动平均值关联。
在图8中,由可编程滤波器106处理延迟的输入“x(n-D)”的一部分以便得到预测性输出向量 然后由加权逻辑或加权电路112来处理预测性输出向量 以便得到标量输出。在图8中,加权逻辑或电路112可以包括求和滤波器,用于在对预测性输出向量 的负系数求和之前移除该负系数以便导出标量输出。然后通过加法器逻辑或加法器电路114(例如,标量加法器)把标量输出添加到输入信号,这增强了浊音语音的周期性或谐波结构而不会增强音调噪声。
当音调干扰不能有别于那些呈现周期性的语音信号时,增强系统或电路可能会过增强在声频信号中所听到的干扰。如图9的上面曲线图所示,音调噪声屏蔽了声频信号的一部分。在图9的中间曲线图中,在基本上水平线中的浓阴影示出了增强系统正放大连续的音调噪声。如在下面曲线图中基本上水平的线的淡阴影和部分浊音信号的浓阴影所示,图8的通信和/或增强系统在几乎没有放大音调噪声的连续干扰的情况下加强了语音信号的幅度。
图10、11和12示出了其它曲线图,用于图示不把音调噪声与语音或声频信号相区分的影响。如图10-12的上面曲线图所示,箭头指向由音调噪声所产生的连续干扰所不想要的增强。在这些图中,增强过程放大了音调噪声,该噪声屏蔽了在语音的大约2.8秒(图10)、语音的3.2秒(图11)以及语音的大约4.642秒(图12)所获取快照中的语音。如下面的曲线图所示,图8的通信和/或增强系统800在几乎没有增强干扰和/或音调噪声的情况下增加了语音信号的峰值幅度。在频域中,系统利用增强音调噪声的频谱来增强谐波。
图13是信号增强的流程图。在此过程中,频谱修正器通过拉平在输入信号的语音段内所有或一部分背景噪声来改变延迟的离散信号的频率。输入信号在传递到频谱修正器之前被数字化(操作1302)并被延迟(操作1304)。在图13中,延迟可以由用于在传递信号之前计数到指定数目的存储器、缓冲器、逻辑或者用于使输入信号在稍后时间到达其目的地的其它设备来实现。在一些系统中,延迟可以包括传播延迟。
在操作1306修正输入信号的频谱。在可选操作1308由一个或多个(例如,多级)滤波器(例如,低通滤波器、高通滤波器、带通滤波器和/或频谱屏蔽器)过滤背景噪声之前,频谱修正器基本上拉平所有或一部分背景噪声的频谱特性。在一些方法中,背景噪声的频率和幅度在话音突峰和暂停期间被检测并且可以由线性预测编码滤波器来建立模型。在这些及其它方法中,一些或所有背景噪声基本上被拉平,并且在其它系统中,一些或所有背景噪声被抑制。噪声可以被抑制为缓和的噪声级、噪声最低限度或者用户期望听到的预定级。
诸如移动平均滤波器、非递归离散时间滤波器或自适应FIR滤波器之类的自适应滤波器在操作1310利用所拉平或抑制的噪声频谱来为一部分语音频谱建立模型。在一些增强系统中,自适应滤波器改变或适应其系数以便在离散时间点上尽可能紧密匹配或近似输入信号“x(n)”。使用自适应滤波算法,通过加法器逻辑或加法器电路110(例如,向量加法器)来导出误差信号“e(n)”,加法器从所适应的预测输出向量“y(n)”中减去输入信号“x(n)”。如方程式1所示来计算。根据此方法,自适应滤波器改变其系数以试图降低在所适应的预测输出向量“y(n)”和离散输入信号“x(n)”之间的差异。
虽然此方法包含了用于选择可编程滤波器系数的许多技术,然而在操作1312,可编程滤波器106基本上以增强系统的采样率来拷贝自适应滤波器系数。增强系统的采样率可以随所想要的增强语音信号的分辨率而改变。虽然自适应滤波器和可编程滤波器的传递函数可以随输入信号“e(n)”或延迟的输入信号“x(n-D)”的幅度和/或频率改变而改变,然而当处理输入信号的每个采样点时,可编程滤波器可以具有与自适应滤波器基本上相同的传递函数。这可以暂时地在增强系统100的采样频率上出现。
在操作1314,由可编程滤波器处理延迟的输入“x(n-D)”的一部分以便得到预测性输出向量 然后在操作1316由加权逻辑或加权电路来处理预测性输出向量 以便得到标量输出。在图13中,加权逻辑或电路可以包括求和滤波器,用于在对预测性输出向量 的负系数求和之前移除该系数以便导出标量输出。然后在操作1318通过加法器逻辑或加法器电路(例如,标量加法器)把标量输出添加到输入信号,这增强了浊音语音的周期性或谐波结构以便得到增强的语音信号。
图14是用于区分音调噪声或连续干扰与语音之间差别的信号增强的可替换的流程图。在图14中,频谱修正器通过拉平在输入信号或语音段内所有或一部分背景噪声来改变延迟的离散信号的频率。输入信号在传递到频谱修正器之前被数字化(操作1402)并被延迟(操作1404)。频谱修正器改变延迟信号的频谱(操作1406)。延迟可以由用于在传递信号之前计数到指定数目的存储器、缓冲器、逻辑或者用于使输入信号在稍后时间到达其目的地的其它设备来实现。在一些系统中,延迟可以包括传播延迟。
在输入信号的频谱由一个或多个(例如,多级)滤波器(例如,低通滤波器、高通滤波器、带通滤波器和/或频谱屏蔽器)在可选操作1408滤波之前在操作1404被修改。频谱修正器基本上拉平在输入“x(n)”或延迟的输入“x(n-D)”的一部分中所检测的一些或所有背景噪声的频谱特性。在一些方法中,在话音突峰和暂停期间检测背景噪声的频率和/或幅度。在这些及其它方法中,背景噪声基本上被拉平或抑制。噪声可以被拉平或被抑制为缓和的噪声级、噪声最低限度或者用户期望听到的预定级。
诸如移动平均滤波器、非递归离散时间滤波器或自适应FIR滤波器之类的自适应滤波器在操作1410利用所拉平或抑制的噪声频谱来为一部分语音频谱建立模型。在一些增强方法中,自适应滤波器改变或适应其系数以便尽可能紧密匹配或近似输入信号“x(n)”的响应。使用自适应滤波算法,通过加法器逻辑或加法器电路(例如,向量加法器)来导出误差信号“e(n)”,加法器从所适应的预测输出向量“y(n)”中减去输入信号“x(n)”。如方程式1所示来计算。根据此方法,自适应滤波器将改变其系数以试图降低在所适应的预测输出向量“y(n)”和离散输入信号“x(n)”之间的差异。
虽然此方法包含用于选择可编程滤波器的系数以便满足所想要增强的许多技术,然而在操作1412通过从自适应滤波器系数的瞬时估算中减去滤波器系数的移动平均值来导出所编程滤波器的系数。虽然可以使用任何时间平均值,然而在图8中,使用漏平均值来导出可编程滤波器系数。漏平均值可以由方程式2或3来表达,其中y(n)是滤波器系数的漏平均向量,h(n)是输入滤波器系数向量,并且a是漏系数。通过采取自适应滤波器系数的漏平均值,可以基本上捕获存在于输入信号中的音调噪声。然后可以从自适应滤波器系数的基本上瞬时的估算中减去滤波器系数的漏平均值以便从所估算的自适应滤波器系数中消除音调噪声的影响。基本上可以以增强系统的采样率把所产生或修改的系数拷贝到可编程滤波器。虽然自适应滤波器和可编程滤波器的传递函数是不相同的并且可以随输入信号“x(n)”或延迟的输入信号“x(n-D)”改变而改变,然而当处理输入信号的每个采样点时,可编程滤波器可以跟踪自适应滤波器的传递函数。在一些方法中,传递函数的系数由时间移动平均值来关联。
在操作1414,由可编程滤波器处理延迟的输入“x(n-D)”一部分以便得到预测性输出向量 然后在操作1416由加权逻辑或加权电路来处理预测性输出向量 以便得到标量输出。加权逻辑或电路可以包括求和滤波器,用于在对预测性输出向量 的负系数求和之前移除该系数以便导出标量输出。然后通过加法器逻辑或加法器电路(例如,标量加法器)在操作1418把标量输出添加到输入信号,这增强了浊音语音的周期性或谐波结构而不会增强音调噪声。
上述的每个系统和方法可以在诸如存储器之类的信号承载介质、计算机可读介质中被编码,在诸如一个或多个集成电路之类的设备内被编程,或由控制器或数字信号处理器来处理。如果该方法由软件来执行,那么该软件可以存在于位于或连接到频谱修正器102、自适应滤波器108、可编程滤波器106的存储器中,或存在于连接到或位于包括增强系统的元件或逻辑的任何其它类型的非易失性或易失性存储器中。存储器可以包括用于实现逻辑功能的可执行指令的排序列表。逻辑功能可以经由数字电路、经由源代码、经由模拟电路或经由模拟源以致经由模拟电或光信号来实现。该软件可以被包含在任何计算机可读或信号承载介质中,以供或结合指令可执行系统、设备或装置来使用。这种系统可以包括基于计算机的系统、包含处理器的系统或可以有选择地从也可以执行指令的指令可执行系统、设备或装置中取出指令的另一系统。
“计算机可读介质”、“机器可读介质”、“传播信号”介质和/或“信号承载介质”可以包括用于包含、存储、传递、传播或传送软件以供或结合指令可执行系统、设备或装置使用的任何设备。计算机可读介质有可以选择地是但不局限于电、磁、光、电磁、红外或半导体系统、设备、装置或传播介质。计算机可读介质的例子的非穷举列表可能会包括具有一个或多个线路的电连接“电子的”、便携式磁或光盘、诸如随机存取存储器“RAM”之类的易失性存储器(电子的)、只读存储器“ROM”(电子的)、可擦除可编程只读存储器(EPROM或闪速存储器)(电子的)或光纤(光的)。计算机可读介质还可以包括其上可印刷有软件的有形介质,软件可以被作为图像或依照另一格式(例如,经由光学扫描)而被电子存储,然后被编译和/或解释或处理。然后可以把所处理的介质存储到计算机和/或机器存储器中。
增强系统可以被修改或适用于任何技术或设备。上述增强系统可以连接到或接口到远程或本地自动语音识别(automatic speechrecognition)“ASR”引擎。ASR引擎可以包含在用于把声音及其它声响转换为可以发送到远程位置的仪器中,诸如陆上线路和无线通信设备(包括诸如在此公开内容中所描述的那些无线协议),其可以包括电话和音频设备并且可以位于运载人或东西(例如,车辆)的设备或结构中或者在设备内独立存在。类似地是,增强系统可以被包含在具有ASR或没有ASR的车辆中。
ASR引擎可以被包含在电话逻辑中,该电话逻辑在一些设备中是车辆控制系统的单个部分或连接到车辆控制系统。增强系统可以连接到预处理和后处理逻辑,诸如在2004年10月26日所提交的美国申请号10/973,575“Periodic Signal Enhancement System”中所描述,在此将其内容引用以供参考。类似地,延迟逻辑、自适应滤波器、向量加法器和标量加法器中的所有或一些可以被修改或被用在美国申请号10/973,575中所描述的增强系统或逻辑来代替。
语音增强系统还是可适应的并且可以无线或经由电或光设备或方法连接到用于检测和/或监视声音的系统。当检测到确定的声音或干扰时,系统可以使增强系统能够防止放大或增大这些声音或干扰的增益。经由诸如通信总线之类的总线,噪声检测器可以发送诸如中断(软件或硬件中断)之类通知或消息以便防止在增强一些或全部语音信号时增强这些声音或干扰。在这些应用中,增强逻辑可以连接到或被包括在一个或多个电路、逻辑、系统或方法内,所说的电路、逻辑、系统或方法在美国序号10/410,736和10/688,802“Method for SuppressingWind Noise”以及美国序号11/006,935“System for Suppressing RainNoise”中有所描述,在此将其内容引用以供参考。
增强逻辑改进了所处理语音信号的感知质量。逻辑可以在不放大某些或所有感测噪声的情况下自动地标识并增强语音段。可以在一个或多个频带中处理并放大所选择的浊音和/或清音段。为了改进感知质量,可以在离散域中进行自适应增益调节。该系统可以根据所感测或估算的噪声或背景噪声信号来利用一些调整器调节一些或整个语音段的增益。系统的多功能性允许增强逻辑在由第二系统传递或处理语音之前增强该语音。在一些应用中,语音或其它音频信号可以被传递到远程、本地或移动系统(诸如ASR引擎),所说的系统可以在时间和/或频率和/或离散域中捕获并提取声音。
虽然已经描述了本发明的各个实施例,然而对本领域普通技术人员来说显然在本发明的范围内可以存在更多的实施例和实现方式。据此,本发明只由所附权利要求及其等效物来限定。
权利要求
1.一种用于改进所处理的语音段的感知质量的增强语音系统,包括离散输入端;延迟单元,其用于数字化地延迟经由所述离散输入端接收的信号;连接到所述延迟单元的频谱修正器,其被编程来基本上拉平背景噪声的频谱特性;连接到所述频谱修正器的自适应滤波器,其用于对滤波器特性进行自适应以便在经由所述离散输入端接收的信号被延迟之前匹配对所述信号的响应;和连接到所述延迟单元的可编程滤波器,其具有与所述自适应滤波器的传递函数以函数形式相关的传递函数。
2.如权利要求1所述的系统,其中,所述延迟单元包括延迟向所述自适应滤波器传递输入信号的可编程延迟。
3.如权利要求1所述的系统,其中,所述延迟单元包括延迟向所述可编程滤波器传递输入信号的可编程延迟。
4.如权利要求1所述的系统,其中,所述延迟单元包括延迟向所述自适应滤波器和所述可编程滤波器传递输入信号的可编程延迟。
5.如权利要求1所述的系统,其中,所述频谱修正器被连接到允许低于预定频率或频率范围的频率通过的电路。
6.如权利要求1所述的语音系统,其中,所述频谱修正器被连接到加法器,所述加法器将延迟的信号的高频带加到低频带上,所述低频带包括具有在频谱上被拉平的背景噪声的信号。
7.如权利要求1所述的语音系统,其中,所述频谱修正器被连接到频谱屏蔽器。
8.如权利要求7所述的语音系统,其中,所述频谱屏蔽器被配置为基本上抑制位于听觉通带之外的信号。
9.如权利要求1所述的语音系统,其中,可编程滤波器的传递函数在离散时间点上与所述自适应滤波器的传递函数基本上相同。
10.如权利要求1所述的语音系统,其中,可编程滤波器的传递函数和所述自适应滤波器的传递函数随输入信号的响应而改变。
11.如权利要求1所述的语音系统,其中,所述可编程滤波器的系数以函数形式分别与所述自适应滤波器的系数相关。
12.如权利要求11所述的语音系统,其中,在所述可编程滤波器的系数和所述自适应滤波器的系数之间的函数关系包括移动平均。
13.如权利要求12所述的语音系统,其中,在所述可编程滤波器的系数和所述自适应滤波器的系数之间的函数关系包括漏平均。
14.一种用于改进所处理的语音段的感知质量的增强语音系统,包括离散输入端;延迟单元,其用于数字地延迟经由所述离散输入端接收的离散信号;连接到所述延迟单元的频谱修正器,其被编程来基本上拉平所检测的背景噪声的一部分频谱特性;连接到所述频谱修正器的自适应滤波器,其用于对系数进行自适应以便在经由所述离散输入端接收的信号被延迟之前匹配对所述信号的响应;和连接到所述延迟单元的可编程滤波器,其具有与所述自适应滤波器的传递函数以函数形式相关的传递函数。15.如权利要求14所述的系统,其中,所述延迟单元包括延迟向所述自适应滤波器和所述可编程滤波器传递输入信号的可编程延迟。
16.如权利要求14所述的系统,其中,所述频谱修正器被连接到允许低于预定频率或频率范围的频率通过的电路。
17.如权利要求14所述的语音系统,其中,所述频谱修正器被连接到加法器,所述加法器将延迟的信号的高频带加到所述延迟的信号的低频带,所述延迟的信号包括具有在频谱上被拉平的背景噪声的信号。
18.如权利要求14所述的语音系统,还包括根据所述可编程滤波器的输出来放大输入信号的谐波结构的电路。
19.一种用于增强所处理的语音段的感知质量的方法,包括延迟输入信号;通过基本上拉平背景噪声的频谱特性来修正所述输入信号的频谱特性;对滤波器的系数进行自适应以便匹配所述输入信号的响应;对可编程滤波器的系数进行自适应使得所述可编程滤波器的传递函数以函数形式与所述滤波器的传递函数相关。
20.如权利要求18所述的方法,还包括根据所述可编程滤波器的输出来调节所述输入信号的增益。
全文摘要
本发明提供的一种增强系统改进了所处理语音的感知质量。该系统包括延迟单元,用于延迟经由离散输入端接收的信号。连接到延迟单元的频谱修正器被编程以基本上拉平背景噪声的频谱特性。连接到频谱修正器的自适应滤波器对滤波器特性进行自适应以便匹配无延迟信号的响应。可编程滤波器被连接到延迟单元。可编程滤波器具有以函数形式与自适应滤波器的传递函数相关的传递函数。
文档编号G10L21/00GK101051466SQ20061016990
公开日2007年10月10日 申请日期2006年12月22日 优先权日2005年12月23日
发明者R·农戈皮尔, P·A·赫瑟林顿 申请人:Qnx软件操作系统(威美科)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1