周期信号增强系统的制作方法

文档序号:2823551阅读:425来源:国知局
专利名称:周期信号增强系统的制作方法
技术领域
本发明涉及信号处理系统,并且更具体地,本发明涉及可以增强周期信号分量的系统。
背景技术
信号处理系统支持许多功能。音频信号处理系统清楚和干净地捕获声音、再现声音并传送声音到其它装置。然而,音频系统容易受到能破坏、掩蔽或有害地影响信号成分的噪声源的影响。
有许多噪声源。风、雨、诸如发动机噪声的背景噪声、电磁干扰和其它噪声源都可能向捕获、再现或传送到其它系统的信号提供噪声。当声音的噪声水平增加时,清晰度降低。
一些现有的系统试图通过多个麦克风来最小化噪声信号。来自每个麦克风的信号被智能地组合以限制噪声。然而在一些情况下,不能使用多个麦克风。其它系统使用噪声滤波器以选择性地衰减声音信号。这些滤波器有时也会不加选择地消除或最小化期望的信号成分。
所以需要能增强信号的系统。

发明内容
本发明提供了一种能增强信号成分并改进信号SNR的信号增强系统。该系统检测、跟踪和增强信号中的非平稳周期信号分量。周期信号分量可代表元音或其它浊音。该系统也可检测、跟踪和衰减信号中的准平稳信号分量。
增强系统包括信号输入、延迟逻辑、分块自适应滤波器和信号增强逻辑。分块自适应滤波器可基于输入信号的延迟版本来跟踪输入信号中的非平稳基频分量。分块自适应滤波器输出多个滤波信号。这些滤波信号可近似地跟踪和增强输入信号中的频率分量。增强逻辑组合输入信号和滤波信号以生成增强信号。可使用第二自适应滤波器以跟踪和抑制输入信号中的准平稳信号分量。
通过对以下的附图和详细说明的研究,对于本领域的技术人员来说,本发明的其它系统、方法、特征和优点将会,或将变得明显。所有这些附加系统、方法、特征和优点都意图被包含在此描述说明书以内,落在本发明的范围内,并被下面的权利要求所保护。


通过参考以下附图和说明,将会更好地理解本发明。图中的部件并不必要依比例,重点将被放在说明本发明的原理上。而且,在不同附图中,相同的附图标记始终表示相应的部件。
图1是具有预处理和后处理逻辑的信号增强系统;图2是单级信号增强系统;图3是适应于女声的滤波器中的滤波器系数图表;图4是适应于男声的滤波器中的滤波器系数图表;图5是信号增强的流程图;图6是多级信号增强系统;图7是包括分块自适应滤波器的信号增强系统;图8是包括分块自适应滤波器的信号增强系统的可选实现方式;图9是图2和图8中显示的信号增强系统的频率性能比较;图10是图7和图8中显示的信号增强系统的频率性能比较;图11是信号增强的流程图;图12是多级信号增强系统。
具体实施例方式
增强系统检测和跟踪信号中的一个或多个基频分量。信号增强系统增强所跟踪的频率分量。增强系统可改进语音信号或其它音频信号中信息的清晰度。被增强的信号可具有改进的信号噪声比(SNR)。
在图1中,信号增强系统100可结合预处理逻辑102和后处理逻辑104工作。该增强系统100可用硬件和/或软件实现。该增强系统100可包括数字信号处理器(DSP)。该DSP可执行延迟输入信号、跟踪信号频率分量、对信号进行滤波和/或增强信号中频谱成分的指令。可选地,增强系统100可包括离散逻辑或电路,离散逻辑和处理器的混合,或可以分布于多个处理器或程序。
增强系统100可从输入源106接收输入。输入源106可包括数字信号源或诸如麦克风108的模拟信号源。麦克风108可通过采样系统110连到增强系统100。该采样系统110能以被选择的采样速率将麦克风108检测的模拟信号转换成数字形式。
可选择采样速率以捕获任何期望的频率成分。对于语音,采样速率可为大约8kHz至大约22kHz。对于音乐,采样速率可为大约22至大约44kHz。其它采样速率也可用于语音和/或音乐。
数字信号源可包括通信接口112,实现增强系统100的系统中的其它电路或逻辑,或其它信号源。当输入源是数字信号源时,不管有或没有附加预处理,增强系统100都能接收数字信号采样。
信号增强系统100也可连到后处理逻辑104。该后处理逻辑104可包括音频再现系统114、数字和/或模拟数据传送系统116或视频处理逻辑118。其它后处理逻辑也可使用。
音频再现系统114可包括数模转换器、滤波器、放大器和其它电路或逻辑。音频再现系统114可以是语音和/或音乐再现系统。音频再现系统114可用蜂窝式电话、汽车电话、数字媒体播放器/录音机、收音机、立体声系统、便携式游戏机或其它使用声音再现的装置来实现。
视频处理系统118可包括提供可视输出的电路和/或逻辑。用于准备可视输出的信号可由增强系统100执行的处理增强。视频处理系统118可控制电视或其它娱乐装置。可选地,视频处理系统118可控制计算机监视器或液晶显示器(LCD)。
传送系统116可提供网络连接,数字或模拟传送器,或其它传送电路和/或逻辑。传送系统116可将增强系统100生成的增强信号传送到其它装置。例如在汽车电话中,传送系统116可通过诸如Zigbee、Mobile-Fi、超宽带、Wi-fi或WiMax网络的无线连接,将增强信号从汽车电话传送到基站或其它接收机。
图2示出了增强系统100。该增强系统100包括信号输入202。该信号输入202携带将由增强系统100处理的输入信号。在图2中,输入信号被标为″x″。输入信号可以是时域的语音采样。为了便于说明,将在下面讨论语音信号。然而,不管信号是可听见或听不见的,增强系统100都能增强具有任何其它频率成分范围的信号。
增强系统100可处理准平稳或非平稳信号。非平稳信号可随时间相对快速地变化其频率和/或幅度成分。声音是非平稳信号的一个实例。
即使是说话者声音中的基频分量在说话过程中也会发生变化,这极少有例外。该基频的变化可能每100毫秒变化差不多50%或更多。然而对于人耳,说话者的声音可具有相对恒定的音调。
准平稳信号的频率和/或幅度的变化频率比非平稳信号低。准平稳信号可由机器噪声、受控的人声引起或由其它声源引起。缓慢变化的发动机噪声或交流发电机噪声是准平稳信号的实例。
如图2所示,输入信号被接到延迟逻辑204。延迟逻辑204将延迟加到输入信号上。延迟可取决于增强系统100的特定实现方式而发生很大变化。该延迟可对应于所选最高音调的周期。该最高音调可等于增强系统100增强的输入信号中的最高音调。该最高音调可取决于输入信号的类型和特性而发生很大变化。
语音信号可包括从大约70Hz至大约400Hz的基频分量。男性语音通常包括大约70Hz至大约200Hz之间的基频分量。女性语音通常包括大约200Hz至大约400Hz之间的基频分量。儿童语音通常包括大约250Hz至大约400Hz之间的基频分量。
增强系统100可处理包括语音的输入信号,其中该语音来自或分开或同时以及重叠出现的男声和女声。在这些系统中,最高音调周期可近似对应于女声基频的周期。最高音调周期可近似为1/300Hz(大约3.3毫秒),或可以是另一个与女声有关的音调周期。
可选地,增强系统100可以只处理男性语音。在这些实现方式中,最高音调周期可对应于男声基频的周期。最高音调周期可近似为1/150Hz(大约6.6毫秒),或可以是另一音调周期。
延迟逻辑204能以对应于最高音调周期的信号采样数目延迟输入信号。信号采样的数目可表示为NSS=MPP*fs其中′NSS′是信号采样的数目,′MPP′是最高音调周期,′fs′是采样速率。假定MPP大约为3.3毫秒且采样速率大约为8kHz,则NSS大约为27个采样。在图2中,NSS对应于ΔF0MAX。
被延迟的输入信号可由滤波器206接收。该滤波器206包括传送滤波输出信号的滤波器输出208,在图2中被标为′y′。滤波器206可基于被延迟的输入信号来跟踪输入信号中一个或多个频率分量。滤波器206可随音调在说话期间改变而跟踪输入信号中的基频。
滤波器206可再现、复制、近似或包括滤波输出信号中被跟踪的频率成分。滤波器206可以是有限脉冲响应滤波器(FIR)或其它类型的数字滤波器。滤波器206的系数可以是自适应的。滤波器206可用归一化最小均方(NLMS)技术或诸如递归最小二乘(RLS)或成比例的LMS的其它类型的自适应滤波技术来被自适应。包括其它滤波器的其它跟踪逻辑也可使用。
滤波器206可收敛于输入信号中的基频。滤波器206收敛的基频f0的范围可表示为f0=f0MAX-f0MINf0MAX=fsΔF0MAX]]>f0MIN=fsΔF0MAX+L]]>其中ΔF0MAX是最高音调周期(根据采样表示),fs是采样频率(以Hz为单位),L是滤波器206的长度(以采样为单位)。滤波器长度L可增加或减小以增加或减小滤波器206跟踪频率分量的频率范围。
在上述实施例中,最高音调近似为300Hz且延迟逻辑204实现27个采样的延迟。64个采样的滤波器长度L使滤波器206跟踪大约88Hz至大约296Hz频率范围的基频成分。
f0MAX=800027≈296]]>f0MIN=800027+64≈88]]>f0=296-88=208Hz滤波器206可随时间自适应。滤波器206可通过逐个采样估算误差信号′e′来快速自适应。可选地,滤波器206可基于采样模块或另一其它依据而自适应。
在自适应过程中,滤波器206可改变一个或多个其滤波器系数。这些滤波器系数能改变滤波器206的响应。滤波器系数可自适应滤波器206以便滤波器206试图最小化误差信号′e′。
误差估计器210可以产生误差信号′e′。误差估计器210可以是加法器、比较器或其它电路或逻辑。误差估计器210能比较输入信号′x′与滤波输出信号′y′。
随着滤波器206收敛于输入信号中的基频,误差信号减小。随着误差信号减小,滤波输出信号′y′更接近地相似于由整数多个信号基频延迟的输入信号′x′。增益控制逻辑212能响应该误差信号。
可选的增益控制逻辑212可包括乘法器214和增益参数216。增益控制逻辑212能衰减、放大或修改滤波输出信号。图2显示了增益控制逻辑212应用增益′A′到滤波输出信号以生成增益控制信号′Ay′。
增强逻辑218能用增益控制信号′Ay′增强输入信号′x′中的频率成分。增强逻辑218可以是加法器或其它电路和/或逻辑。增强逻辑218能产生增强输出信号s=x+Ay当误差信号增加时,增益控制逻辑212可减小增益′A′。当增益减小时,滤波输出信号对增强输出信号的贡献变小。误差信号和增益之间的关系可以是连续的、阶跃的、线性的或非线性的。
在一个实现方式中,增强系统100建立一个或多个误差阈值。当误差信号超过上阈值时,增益控制逻辑212可减小增益′A′到0(零)。上阈值可设为输入信号以便当e>x时,增益′A′可设为零。当误差信号降到下阈值之下时,增益控制逻辑212可增加增益′A′到1(一)。
当误差信号超过上阈值时,滤波器控制逻辑220可将滤波器206复位。当滤波器206复位时,控制逻辑220可将滤波器系数清零,再次初始化滤波器系数,或采取其它操作。控制逻辑220也可动态修改滤波器长度,可修改由延迟逻辑204实现的延迟,或可修改增强系统100的其它特性。控制逻辑220也可修改增强系统100以适应使用增强系统100的变化的环境,以使增强系统100适应于新的说话者或其它应用。
滤波器控制逻辑220也可控制滤波器206自适应的速度,滤波器是否自适应,或可以监测或控制其它的滤波器特性。在增强非平稳信号的系统的环境中,控制逻辑220可预期输入信号中快速变化的频率和幅度分量。控制逻辑220也可随时间预期或确定出输入信号中的特定频率分量是占优势的。
控制逻辑220也可确定出输入信号的频率成分、幅度或其它特性已从预期或已确定的值改变。作为响应,控制逻辑220可阻止滤波器206试图适应新的信号成分,可减慢适应速率,或采取其它操作。控制逻辑220可进行对滤波器206的控制直到输入信号特性返回期望的特性,直到过去预定时间,直到被命令以停止控制,或直到满足另一时刻或条件。
延迟逻辑204防止滤波输出信号精确地复制当前输入信号′x′。因此,滤波输出信号可紧密地跟踪输入信号′x′中被选择的周期。当当前输入信号′x′被滤波输出信号′y′增强以生成输出信号′s′时,周期信号分量可建设性地组合,而随机噪声分量可破坏性地组合。因此,周期信号分量可比噪声增强更多。
由延迟逻辑204和滤波器206引入的延迟可近似为由滤波器206跟踪的基频分量的一周期。该延迟可对应于用于声音的声门脉冲(glottal pulse)延迟,诸如元音。当滤波输出信号加到输入信号上时,该延迟可允许基频分量同相或近似同相地相加。
当同相相加时,增强输出信号中基频分量的合成增益可近似为6dB或更大。输入信号和滤波输出信号中的噪声趋向于不同相。当输入信号和滤波输出信号相加时,噪声可比增强频率分量少增加例如3dB或更多。增强输出信号可具有增强的SNR。
增强系统100处理的输入信号可包括多个基频。例如,当两个说话者同时说话时,输入信号可包括两个非平稳基频。当多个基频出现时,滤波器206继续自适应并收敛以提供作为输入信号延迟版本的滤波输出信号′y′。增强逻辑218可增强输入信号中存在的一个或多个基频。
在图3中示出了滤波器206的系数300。这些系数以系数号为水平轴,幅度为垂直轴绘出。系数300显示已适应于女声的滤波器206。
在任何时刻,系数300可被分析以便以良好的时间分辨率确定输入信号中基频的快速估计。系数300在系数304(第五滤波器系数)、系数306(第六滤波器系数)和系数308(第七滤波器系数)周围开始达到峰值。通过搜索系数峰值或近似系数峰值,并确定对应的系数指标′c′,基频fa的快速近似值可表示为fa=fs(c+ΔF0MAX)]]>在图3中,系数峰值在第六滤波器系数306处。假定扫描速率为8kHz,有27个采样的延迟fa=fs(c+ΔF0MAX)=80006+27≈242Hz]]>在图4中,显示了已适应于男声的滤波器206的系数400。系数峰值出现在系数402(第34滤波器系数)、系数404(第35滤波器系数)和系数406(第36滤波器系数)附近。基频的近似值为fa=fs(c+ΔF0MAX)=800035+27≈129Hz]]>控制逻辑220可存储关于输入信号许多特性的历史数据,包括当输入信号随时间变化时输入信号的基频。控制逻辑220可检查历史数据作为辅助以确定输入信号的特性是否出乎意料地改变。控制逻辑220可通过对滤波器206进行自适应控制或采取其它操作来响应。
图5显示了可采取以增强周期信号的动作的流程图500。最高音调由增强系统100选择用于处理(动作502)。延迟逻辑204可被设置以实现最高音调的周期(动作504)。
增强系统100将要工作的频率范围也可被选择(动作506)。滤波器206的滤波器长度可被设置以适应频率范围(动作508)。在滤波器206工作期间滤波器长度可动态地变化。
输入信号被延迟和滤波(动作510)。增强系统100可生成误差信号并作为响应自适应滤波器206(动作512)。增强系统100可控制滤波输出信号的增益(动作514)。
增强系统100可将输入信号和增益控制信号相加(动作516),可以得到增强的输出信号。增强系统100也可确定基频估计(动作518)。增强系统100可使用频率估计以对滤波器206进行自适应控制(动作520)。
图6显示了多级增强系统600。增强系统600包括第一滤波级602和第二滤波级604。滤波级602和604能以不同速率响应或自适应。
第一滤波级602可缓慢自适应并抑制准平稳信号分量。由于相对恒定的背景噪声,诸如发动机噪声或环境影响或由于其它原因,准平稳信号分量可能出现在输入信号中。
信号输入606连到第一级602。信号输入606可连到延迟逻辑608。该延迟逻辑可实现对应于最高准平稳频率的周期的延迟,其中最高准平稳频率可由第一级602抑制。
最高准平稳频率可根据使用增强系统600的环境的已知或预期特性而被选择。滤波器控制逻辑610可动态修改延迟以使第一级602适应该环境。滤波器控制逻辑610也可控制准平稳滤波器612。
第一级中的滤波器612可包括信号分量跟踪逻辑,诸如NLMS自适应FIR滤波器或RLS自适应FIR滤波器。第一级中的滤波器612能缓慢自适应,例如采样速率为8kHz,并且滤波器长度为64,NLMS步长大于0小于大约0.01可允许衰减准平稳周期信号,同时最低限度地降低典型语音信号。第一级滤波输出614可提供近似再现输入信号中准平稳信号分量的滤波输出信号。
抑制逻辑616和缓慢滤波器自适应可允许非平稳信号分量通过第一级602到第二级604。另一方面,抑制逻辑616可抑制输入信号中的准平稳信号分量。抑制逻辑616可作为将滤波输出信号从输入信号中减去的运算逻辑而被实现。
滤波输出信号中被复制的准平稳信号分量从输入信号中去除。由第一级602生成的输出信号可表示为x2=e1=x-y1其中′e1′是第一级输出信号,′x′是输入信号,′y1′是第一级滤波输出。
第一级输出618可连接到第二级604。第二级604可用自适应滤波器206处理信号′x2′。滤波器206能快速自适应,例如8kHz的采样速率,并且滤波器长度为64,NLMS步长大于大约0.6小于1.0可允许自适应滤波器206跟踪典型语音信号中的基频。
第二级604可增强第一级输出信号中的非平稳信号分量。非平稳信号分量可由于语音、音乐或其它信号源而出现在输入信号中。第二级604可如上所述处理第一级输出信号。
增强系统600使用由第二增强级604跟随的第一抑制级602。增强系统600可用于增强诸如声音成分的非平稳信号成分。在引入缓慢变化信号分量的环境中,增强系统600可去除或抑制缓慢变化信号分量。例如在汽车电话中,第一级602可去除或抑制发动机噪声、公路噪声或其它噪声,而第二级604增强非平稳信号分量,诸如男声或女声分量。
信号增强系统100可增强周期信号成分、增加SNR和/或减小输入信号中的噪声。当应用于声音信号时,增强系统100可增强语音基频并可加强元音或其它声音。增强系统100可增强其它信号,不管信号是可听见或听不见的。
由延迟逻辑204或608与滤波器206或612引入的整个延迟也可近似为跟踪音调周期的整数(一个或更多)个周期。延迟附加的周期可允许输入信号的改变程度比等待一周期更大。将更长的延迟滤波信号加到当前输入信号上可在输出信号中产生诸如回响的特别效果,而仍然增强基频分量。
在图7中,信号增强系统700包括分块自适应滤波器702以及分块延迟逻辑704。分块自适应滤波器702包括多个自适应滤波器,在图7中被显示为自适应滤波器1至′i′。自适应滤波器1、2、3和′i′分别被标为706、708、710和712。每个自适应滤波器的输出可连接到包括乘法器的增益逻辑744,乘法器应用固定或可变增益参数到滤波器输出。图7示出了单独应用到滤波器706-712输出的增益参数714、716、718和720。增益和滤波器控制逻辑722可对增益参数714-720进行控制并对每个单独的滤波器706-712进行滤波器自适应。
一个或多个增益加权滤波器输出可由增强逻辑724加在一起以得到滤波器输出的加权和,′ySUM′。增强逻辑726将加权相加的滤波器输出′ySUM′加到输入信号′x′上以生成输出信号′s′。增强逻辑可以是加法器或其它信号加法器。分块延迟逻辑704包括多个串联的延迟模块,其中的五个被标为延迟模块728、730、732、734和736。
在输入信号被分块延迟逻辑704延迟后,每个滤波器706-712接收输入信号′x′并基于′x′和那个滤波器的输出信号′y′为那个滤波器确定单独的误差信号′e′。例如,用于第一自适应滤波器702的误差信号′e′为′e1′=′x′-′y1′。每个自适应滤波器706-712自适应以试图最小化其单独的误差信号′ei′。
分块滤波器702通过多个自适应滤波器706-712分割整个信号跟踪任务。每个自适应滤波器706-712可处理和自适应分块滤波器702的整个脉冲响应的一部分。结果,每个自适应滤波器706-712可相对于图2中显示的更长的自适应滤波器具有更小的长度(举例来说,更少的抽头数)。
给定由120抽头和六个自适应滤波器实现的脉冲响应,每个自适应滤波器可处理整个脉冲响应的20(或任何其它数目)个抽头。在另一种实现中,滤波器702中自适应滤波器分块的数目等于整个脉冲响应的长度,从而每个自适应滤波器具有长度1。分块滤波器702的整个长度可如上面说明的那样,关于分块滤波器702将要跟踪的频率范围来选择。
自适应滤波器706-712可取决于输入信号中预期的基频而改变长度。为了在预期的基频或在其附近处理部分脉冲响应,自适应滤波器706-712可分块成更短更快速的自适应滤波器。对于远离预期的基频,自适应滤波器706-712可以是更长更缓慢的自适应滤波器。因此,自适应滤波器706-712的长度可被选择以在输入信号中感兴趣的频率或其周围提供快速自适应。
每个自适应滤波器706-712各自使用更少的滤波器系数更新。自适应滤波器706-712可比使用更长自适应滤波器实施方式中的滤波器更快速地更新。更快的滤波器更新可得到整个跟踪性能的增强,尤其在更高频率。整个跟踪性能的增强便于其跟踪快速变化的基频,不管那些频率是有声的或人工生成的。最小均方(LMS)算法、递归最小二乘(RLS)算法、LMS RLS的变体或其它技术可被使用以基于单独误差信号′ei′更新滤波器系数。
延迟逻辑704延迟输入信号′x′到达一个或多个滤波器706-712。图7显示了每个滤波器706-712与其自身的延迟相联系。每个延迟模块728-736可实现任何数目信号采样的延迟。
一种实现方式在第一延迟模块728中使用D个采样的初始延迟。每个随后的延迟逻辑730-736具有单独的可配置延迟,在图7中被显示为M1、M2、M3和Mi个采样。延迟模块730供给第一自适应滤波器706,延迟模块732供给第二自适应滤波器708,第三延迟模块734供给第三自适应滤波器710,等等直到第i延迟模块736供给第i滤波器712。
延迟D、M1、...、Mi可每个都相同或可每个都不同。延迟M1、...、Mi可对应于由延迟模块提供的自适应滤波器的长度(举例来说,抽头数),或可不同于由延迟模块提供的自适应滤波器的长度。例如,自适应滤波器710的长度可以是M3个抽头,为自适应滤波器706供给的延迟模块734可延迟M3个采样的信号采样。
当自适应滤波器′i′的长度小于其相关延迟Mi时,自适应滤波器可在最初收敛得更快。当自适应滤波器′i′的长度大于其相关延迟Mi时,自适应滤波器可通过收敛经历更小的均方误差。滤波器长度和/或延迟逻辑730-736可根据使用系统700的实现方式的实施原则而设置。
延迟D可被选择以设置系统700将要自适应的基频范围。滤波器700收敛或自适应的基频f0或音调的范围可表示为f0=f0MAX-f0MINf0MAX=fsD]]>f0MAX=fsD+L]]>其中,L是整个分块滤波器702的长度,例如,L=M1+M2+...+Mi,且fs是采样速率。
增益和滤波器控制逻辑722可分别对增益714-720和滤波器自适应进行控制,也就是说,对于每个单独的滤波器706-712进行控制。上述关于滤波器控制220的控制技术也可使用在信号增强系统700中。增益714-720可以正比于输入信号′x′的信号噪声比,或可以基于输入信号′x′的信号噪声比而设置。当SNR减小时,一个或多个增益714-720可增加以试图抑制噪声。当SNR增加时,一个或多个增益714-720可减小或可设为零。
增益714-720可被确定为与它对应的自适应滤波器的滤波器系数的函数,或通过其他方式被确定。一个用于增益714-720并可选地包括标准化常量′k′的表达式为Ai=f(hi)/k函数f(hi)是自适应滤波器系数的函数并可取决于期望的增强以许多方式定义。f(hi)的例子可表示如下f(hi)=maxn|hi(n)|---(1)]]>f(hi)=maxn|hi(n)|2---(2)]]>f(hi)=Σnhi(n)+Σn|hi(n)|2---(3)]]>f(hi)=maxn|hi(n)|+maxnhi(n)2---(4)]]>f(hi)=[maxn|hi(n)|+maxnhi(n)2]m,m>0---(5)]]>在一种实现方案中,方程(5)以m=2和滤波器长度为1而使用。增加′m′可更大地增强谐波。增益714-720可以基于附加于滤波器系数的或对滤波器系数可选的其他信息来选择或确定。标准化常量′k′可以设置为k=maxi(f(hi))增益714-720也可被选择或修改(例如,增加)以放大自适应滤波器的影响,该自适应滤波器的系数将增强或加强输入信号的周期分量。增益714-720也可被选择或修改(举例来说,减小或设为零)以减小或消除自适应滤波器的影响,其中该自适应滤波器的系数(通常为负系数)将降低或减弱输入信号的周期分量。然而,增益714-720可用取决于滤波器系数幅度的其它方式设置。因此,增强系统700可单独设置增益714-720以便在系统700中只发生增强。
增强逻辑726生成增强输出信号′s′s=x+A1y1+A2y2+A3y3+...+Aiyi图8显示了提供增强系统700的可选方案的增强系统800。增强系统800将单独地控制的增益714-720替换为增益逻辑802,举例来说,乘法器和增益参数。增益逻辑802通过增益参数′A′804偏置自适应滤波器输出之和。增强逻辑806可提供每个自适应滤波器输出之和。
由增强系统700和800生成的信号′s′包括增强的基频和这些基频的谐波,导致更清晰的音频信号。增强系统中的每个自适应滤波器706-712可独立地由其自身的误差信号更新,导致滤波器和整个系统更快的自适应。分割成多个自适应滤波器从而使相邻谐波间的拖尾效应(smearing)减小,更好地保存更小的谐波(举例来说,接近噪声水平的谐波),以及输入信号非周期分量的更少的畸变。而且,增强系统700可将甚至埋入噪声里的谐波增强到噪声之上的水平,并更好地保存小谐波。在实现方式之间选择时,增强系统800具有降低复杂度和计算要求的优点,而增强系统700具有提供灵活性以独立控制每个自适应滤波器702-708增益及其对输出信号的影响的优点。
图9是信号增强系统200和800的频率性能的比较。图表902示出了信号增强系统200的性能,包括输入信号904和输出信号906。图908示出了信号增强系统800的性能,包括相同的输入信号904和增强的输出信号910。图表908显示了增强系统800对比信号增强系统200而改进的整体跟踪响应,包括改进的高频响应。输出信号910更接近地跟踪输入信号904中的高频成分。
图表902和908也显示了增强系统800获得的谐波之间的改进的分离。图表902显示了输入信号904与增强信号906之间的频率响应间隙912。增强系统800性能的图表908显示的间隙更小,如附图标记914所指示。输出信号910改进了谐波之间的分离,使输出信号910中的谐波之间出现更少的拖尾效应。
图10是信号增强系统700和800的频率性能的比较。图表1002示出了信号增强系统800的性能,包括输入信号1004和由增强系统800产生的输出信号1006。图表1008示出了信号增强系统700的性能,包括相同的输入信号1004和输出信号1010。图表1008显示了增强系统700(通过单独地控制的增益714-720)的改进的整体跟踪响应,包括改进的更小谐波的增强。
增强的更小谐波1012、1014、1016和1018的例子被标在图10中。增强谐波1012和1014位于图表1002中大约3000和3200Hz并被增强系统800增强。如图表1008中增强谐波1016和1018指示的那样,增强系统700提供更小谐波的更大的增强。
图11显示了可采取以增强周期信号的动作的流程图1100。增强系统700、800将要跟踪的最高音调被选择(动作1102)。音调可根据预期会遭遇的信号类型及它们的特性,诸如男声、女声或童声特性而被选择。由延迟模块728-736实现的整个延迟可被设为最高音调的周期(动作1104)。
增强系统700、800将要工作的频率范围也可被选择(操作1106)。自适应滤波器702-708的整个滤波器长度可被设置以适应频率范围(动作1108)。滤波器长度、频率范围和最高音调在增强系统工作期间可动态变化。
增强系统通过多个自适应滤波器702-708分割整个脉冲响应(动作1110)。自适应滤波器可在感兴趣的基频脉冲响应幅度为高的部分分割成更小的模块。任何自适应滤波器706-712可处理一个或多个脉冲响应点。每个自适应滤波器706-712可处理相同或不同数目的脉冲响应点。
增强系统700和800接收输入信号(动作1112)。增强系统700和800通过使用分块自适应滤波器对输入信号进行滤波(动作1114)。单独被选择的增益被应用到每个自适应滤波器的滤波输出信号(动作1116)。然后增益控制输出信号被相加。可选地,增益可应用到一个或多个滤波输出信号之和。增强系统700、800将输入信号和增益控制输出信号相加(动作1118)。结果,增强输出信号具有增强的基频和谐波成分。
增强系统700和800可结合音调检测逻辑738,其中该音调检测逻辑738包括音调估计输出′p′740。音调检测逻辑738可如上所述确定输入信号信号成分的基频估计(动作1120)。该估计可基于滤波器系数的分析通过每个自适应滤波器706-712快速估计基频。频率估计或其它信息可为增强系统700和800提供基础以对滤波器702-708和增益进行自适应控制(动作1122),诸如增加或减小自适应速率,改变滤波器长度,增加或去除滤波器和其它自适应。
增强系统700和800也包括声音检测逻辑742,其中该声音检测逻辑包括声音检测输出′v′744。声音检测逻辑742可以定位滤波器系数中高于预选阈值(举例来说,背景噪声水平)的峰值。这些系数可表示输入信号中周期频率分量的存在。元音可引起系数峰值高于背景噪声水平,其中该背景噪声水平可能是特别强的峰值。当高于阈值的峰值出现时,声音检测逻辑742可声明声音检测输出′v′,其表示输入信号包括声音分量。
声音检测逻辑742可确定检测量度。该检测量度提供表示声音是否出现在输入信号中的指示。检测量度可以是正滤波器系数的幅度之和。当该和超过阈值时,声音检测逻辑可声明声音检测输出′v′744。
每个自适应滤波器702-708生成其自身的误差信号(动作1124)。每个自适应滤波器702-708从而基于其自身的误差信号而自适应(动作1126)。增强系统700、800可继续为输入信号的持续时间提供增强输出信号(动作1128)。
图12显示了多级增强系统1202和多级增强系统1204。系统1202包括连到信号增强系统700的缓慢自适应滤波级(举例来说,级602)。输入信号′x′1206连到缓慢自适应滤波级602,且信号增强系统700生成增强输出信号′s′1208。多级增强系统1204使用连到信号增强系统800的缓慢自适应滤波级602,其中信号增强系统800生成增强输出信号′s′1210。
缓慢自适应滤波级602可抑制准平稳信号分量。准平稳信号分量可由于频率成分缓慢变化的背景噪声而出现在输入信号中。缓慢自适应滤波级602可抑制发动机噪声、环境影响或其它具有相对缓慢变化频率特性的噪声源。信号增强系统700、800接着增强通过缓慢自适应滤波级602的周期频率成分,诸如出现在声音信号中的周期频率成分。
信号增强系统200、600、700和800可用硬件、软件或硬件与软件的组合实现。增强系统可采用存储在机器可读介质上的指令的形式,诸如磁盘、EPROM、闪存卡或其它存储器。增强系统200、600、700和800可结合在通信装置、声音系统、游戏机、信号处理软件或其它装置和程序中。增强系统200、600、700和800可预处理麦克风输入信号以增强元音的SNR用于随后处理。
通过描述本发明的不同实施方式,对于本领域的普通技术人员来说,在本发明的范围内显然可能有更多的实施方式和实现方法。因此,本发明除了受到所附权利要求和其等价物的限制外,并不受其它限制。
权利要求
1.一种信号增强系统,包括信号输入;连接到所述信号输入的分块延迟逻辑;连接到所述分块延迟逻辑并包括多个自适应滤波器输出的分块自适应滤波器;连接到所述自适应滤波器输出的滤波器增强逻辑;连接到所述滤波器增强逻辑的增益逻辑;以及连接到所述信号输入和所述增益逻辑并包括增强信号输出的信号增强逻辑。
2.如权利要求1所述的信号增强系统,其中所述多个滤波器输出包括第一滤波器输出和第二滤波器输出,且其中所述分块自适应滤波器包括第一自适应滤波器,包括第一滤波器系数;所述第一滤波器输出;和第一误差输出;第二自适应滤波器,包括第二滤波器系数;所述第二滤波器输出;和第二误差输出,其中所述第一滤波器系数基于所述第一误差输出而被自适应并且所述第二滤波器系数基于所述第二误差输出而被自适应。
3.如权利要求2所述的信号增强系统,其中所述第一误差输出包括所述信号输入与所述第一滤波器输出之间的第一差值,并且其中所述第二误差输出包括所述信号输入与所述第二滤波器输出之间的第二差值。
4.如权利要求2所述的信号增强系统,其中延迟逻辑包括连接到所述第一自适应滤波器的M1采样延迟和连接到所述第二自适应滤波器的M2采样延迟。
5.如权利要求4所述的信号增强系统,其中所述M2采样延迟与所述M1采样延迟串联。
6.如权利要求4所述的信号增强系统,其中所述第一自适应滤波器是长度为M1的自适应滤波器,并且其中所述第二自适应滤波器是长度为M2的自适应滤波器。
7.如权利要求6所述的信号增强系统,其中M1=M2或M1=M2=1。
8.如权利要求1所述的信号增强系统,其中所述延迟逻辑包括被选择以设置最高自适应音调的D采样延迟。
9.如权利要求1所述的信号增强系统,其中所述延迟逻辑包括被选择以设置自适应音调范围的L采样延迟。
10.如权利要求1所述的信号增强系统,其中所述延迟逻辑实现包括人声音调的自适应音调范围。
11.如权利要求1所述的系统,其中所述延迟逻辑实现大约70Hz和大约400Hz之间的自适应音调范围。
12.一种用于增强信号的方法,包括接收包括基频的输入信号;通过多个不同采样延迟来延迟所述输入信号以得到多个不同延迟的输入信号;将包括多个单独自适应滤波器的分块自适应滤波器应用到多个不同延迟的输入信号;用所述分块自适应滤波器生成滤波输出,所述滤波输出近似被整数多个所述基频延迟;为所述多个单独自适应滤波器的每个生成误差信号;基于用于所述单独自适应滤波器的所述误差信号,自适应所述单独自适应滤波器的每个;以及用所述滤波输出增强所述输入信号。
13.如权利要求12所述的方法,进一步包括形成所述多个自适应滤波器的输出之和;通过增益参数偏置所述和。
14.如权利要求12所述的方法,进一步包括确定最高音调以跟踪;以及,其中延迟所述输入信号包括以D采样延迟所述输入信号,其中D根据所述最高音调来选择。
15.如权利要求14所述的方法,进一步包括选择音调跟踪范围;以及,其中延迟所述输入信号包括以D+L采样延迟所述输入信号,其中L被选择以设置所述音调跟踪范围。
16.如权利要求15所述的方法,其中所述音调范围包括人声音调。
17.如权利要求15所述的方法,其中所述音调范围扩展在大约70Hz与大约400Hz之间。
18.一种产品,包括机器可读介质;以及包含在所述机器可读介质上的机器可读指令,其装入执行权利要求12-17任一所述方法的处理。
全文摘要
本发明公开了一种信号增强系统,其改进了语音或其它音频信号的可理解性。该系统增强了信号的选择部分,可以衰减信号的选择部分,并能增加SNR。该系统包括延迟逻辑、分块自适应滤波器和信号增强逻辑。分块自适应滤波器可跟踪和增强输入信号中的基频和谐波。分块滤波器输出信号可近似地再现由输入信号基频的整数多个周期延迟的输入信号。增强逻辑组合了输入信号和滤波信号以生成增强的输出信号。
文档编号G10L21/02GK1766994SQ200510116669
公开日2006年5月3日 申请日期2005年10月26日 优先权日2004年10月26日
发明者R·农戈皮尔, D·吉斯布雷希特, P·赫瑟林顿 申请人:哈曼贝克自动系统-威美科公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1