语音能量检测的制作方法

文档序号:15739263发布日期:2018-10-23 22:00阅读:430来源:国知局

本申请案主张2017年4月5日申请的第62/482,011号美国临时申请案的权益,所述申请案以全文引用的方式并入本文中。

技术领域

本申请案是针对语音能量检测。



背景技术:

本文中提供的“背景技术”描述是出于一般地呈现本发明的上下文的目的。目前所提名的发明人的工作在此背景技术部分中描述的程度上以及在递交时可能不具有作为现有技术的资格的描述的方面既不明确地也不隐含地被承认作为针对本发明的现有技术。

语音能量检测(VED)可用以检测人类话音的存在或不存在。举例来说,VED可用以检测话音译码、话音辨识等等。



技术实现要素:

前述段落作为一般性介绍而提供,且并不希望限制所附权利要求书的范围。将参考结合附图取得的以下详细描述最佳理解所描述的实施例以及另外的优点。

根据所揭示的标的物的一或多个方面,一种系统可使用语音能量检测(VED)电路以及捕获缓冲器以获得改进的性能和较低功率耗散。在VED指配给所述系统中的每一麦克风的情况下,组合多于一个VED的输出以改进检测概率或减小假警率,从而可改进后检测信号噪声比。可基于背景能量和检测性能动态地选择一或多个VED电路。此外,数字VED算法可依据所述背景噪声的响度和所要信号电平动态地改变过取样率(OSR)值和通带带宽。如果所要信号或噪声强,那么所述OSR可减小以节约功率。如果检测到所要话音,那么所述OSR值可增加以获得用于剩余的音频处理需要的目标SNR。

附图说明

通过结合附图参考下文的详细描述将易于获得对本发明和其多个伴随优点的更全面理解,同样将更好地理解本发明和其多个伴随优点,在附图中:

图1说明根据所揭示的标的物的一或多个示范性方面的VED系统的概述;

图2说明根据所揭示的标的物的一或多个方面的示范性模拟语音能量检测(AVED)架构;

图3说明根据所揭示的标的物的一或多个方面的示范性外部AVED麦克风输入滤波器;

图4说明根据所揭示的标的物的一或多个示范性方面的AVED比较器;

图5说明根据所揭示的标的物的一或多个方面的示范性AVED有限状态机(FSM);

图6是根据所揭示的标的物的一或多个方面的示范性仿真输出;

图7说明根据所揭示的标的物的一或多个方面的示范性AVED数/模转换器(DAC);

图8说明根据所揭示的标的物的一或多个方面的示范性AVED增益和积分器;

图9说明根据所揭示的标的物的一或多个方面的示范性AVED后数字滤波器;

图10说明根据所揭示的标的物的一或多个方面的示范性AVED自动增益控制(AGC)支持;

图11说明根据所揭示的标的物的一或多个示范性方面的AVED和数字语音能量检测(DVED)系统;

图12说明根据所揭示的标的物的一或多个方面的示范性DVED麦克风输入;

图13说明根据所揭示的标的物的一或多个方面的示范性DVED CIC抽选器;

图14说明根据所揭示的标的物的一或多个方面的被配置成用于DVED前端处理的示范性DVED前端;

图15说明根据所揭示的标的物的一或多个方面的示范性麦克风偏压架构;

图16说明根据所揭示的标的物的一或多个方面的示范性AVED系统;

图17说明根据所揭示的标的物的一或多个方面的示范性AVED系统;

图18说明根据所揭示的标的物的一或多个方面的示范性DVED系统;

图19说明根据所揭示的标的物的一或多个方面的示范性捕获缓冲器;

图20A是根据所揭示的标的物的一或多个方面的示范性AVED系统;

图20B是根据所揭示的标的物的一或多个示范性方面的麦克风输入和DAC累加输出;

图21是根据所揭示的标的物的一或多个方面的DVED系统的示范性部分;

图22说明根据所揭示的标的物的一或多个方面的示范性捕获缓冲器;

图23说明根据所揭示的标的物的一或多个方面的示范性传统设计;

图24说明根据所揭示的标的物的一或多个示范性方面的第一设计;

图25说明根据所揭示的标的物的一或多个示范性方面的第二设计;

图26说明根据所揭示的标的物的一或多个示范性方面的第三设计;

图27说明根据所揭示的标的物的一或多个示范性方面的第四设计;

图28A说明根据所揭示的标的物的一或多个方面的第一多个麦克风偏压产生器;

图28B说明根据所揭示的标的物的一或多个示范性方面的第二多个麦克风偏压产生器;

图28C说明根据所揭示的标的物的一或多个示范性方面的第三多个麦克风偏压产生器;和

图29说明根据所揭示的标的物的一或多个示范性方面的数字VED计时图示。

具体实施方式

下文结合附图阐述的描述内容预期作为对所揭示的标的物的各种实施例的描述且不必意图表示仅有实施例。在某些情况下,所述描述出于提供对所揭示的标的物的理解的目的包含具体细节。然而,对于所属领域的技术人员来说将显而易见的是,可在没有这些具体细节的情况下实践实施例。在一些情况下,以框图形式示出众所周知的结构和组件以避免混淆所揭示的标的物的概念。

贯穿本说明书对“一个实施例”或“一实施例”的引用意指结合一实施例描述的特定特征、结构、特性、操作或功能包含在所揭示的标的物的至少一个实施例中。因此,在说明书中任何处出现的短语“在一个实施例中”或“在一实施例中”不必是指相同实施例。此外,可在一或多个实施例中以任何合适方式组合特定特征、结构、特性、操作或功能。此外,希望所揭示的标的物的实施例能够并且确实涵盖所描述的实施例的修改和变化形式。

必须指出,除非上下文另外明确指示,否则如说明书和所附权利要求书中所用,单数形式“一(a/an)”和“所述(the)”包括多个指示物。也就是说,除非另外明确指示,否则如本文中所使用的字词“一(a/an)”等表达“一或多个”的意义。另外,例如“第一”、“第二”、“第三”等术语仅识别如本文中所描述的数个部分、组件、参考点、操作和/或功能中的一个,且同样地不必将所揭示的标的物的实施例限制于任何特定配置或取向。

现参看图式,其中相似的元件符号贯穿数个视图指定相同或对应部分。

一般来说,在所揭示的标的物的一个或多个方面中,VED系统可包含将VED指配给系统中的每一麦克风,组合多于一个VED的输出以改进检测概率,减小假警率,以及/或改进后检测信号噪声比(SNR)。VED系统可基于背景能量和检测性能动态地选择一或多个VED电路。

VED系统可包含数个优点。举例来说,如本文进一步描述,所述系统可使用VED电路以及捕获缓冲器以获得改进的性能和较低功率耗散。

另外,所述系统可调整驻极体电容式麦克风(ECM)接口和偏压产生器,以从VED模式转到正常音频捕获模式。因此,所述系统可同时动态地改变Rbias和Vbias。

此外,多个VED算法可以与所述系统一起使用。举例来说,VED算法可包含斜率增量调制滤波。另外,VED算法可使用不同宽度、中心频率和缩放因子的多个子带,其中每一子带与另一子带进行比较。差值接着可与检测阈值进行比较。此外,VED算法可组合两种技术以改进性能。换句话说,VED算法的组合可被配置成执行斜率增量调制滤波,将多个子带中的每一子带与多个子带中的任一其它子带进行比较,所述子带具有不同宽度、中心频率和缩放因子,以及将来自每一子带比较的差值与检测阈值进行比较,并且当在子带之间存在话音能量差时识别话音存在。

VED系统还可包含低功率能量监测。举例来说,外部CPU可定期唤醒并基于平均能级调整VED阈值和输入电平。

另外,VED系统可基于针对VED功能的假警率调整输入电平和检测阈值。

CPU可定期唤醒正常音频路径以监测噪声和信号电平,从而校准VED阈值。此外,CPU可定期监测背景噪声谱和/或所要讲话者话音谱并且调整VED子带滤波器,以使唤醒字检测的概率达到最大或使假警率降到最低。唤醒字可触发电子装置的功能性(例如,播放音乐、使用电子个人助手、与物联网装置交互等的交互式功能性)。

数字VED算法可依据背景噪声的响度和/或所要信号电平动态地改变过取样率(OSR)值和通带带宽。如果所要信号或噪声强,那么OSR可减小以节约功率。如果检测到所要话音,那么OSR值可增加以获得用于剩余的音频处理需要的目标信号噪声比(SNR)。

图1说明根据所揭示的标的物的一或多个示范性方面的VED系统100的概述。一般来说,VED系统100可包含麦克风105、VED 110、多路复用器125、关键字检测块130、功率管理器135和上下文/NLP块140。

更具体地说,设计可包含低功率字唤醒处理能力。低功率字唤醒处理能力可在3步骤式过程中进行。步骤1(如由S115指示):使用系统中的预定硬件(例如,VED 110)通过语音能量检测而检测来自麦克风105的语音能量。步骤2(如由S120指示):关键字检测-检测具有正常麦克风路径的DSP块(例如,关键字检测块130)的Cortex-M0(CM0)中的预定字唤醒(例如,“Hello”、“Hello,Computer”等)。步骤3(如由S125指示):上下文/NLP块140中的NLP-上下文和/或自然语言处理。这可延伸到供应商的云处理中。

一般来说,VED可用于功率节约。VED可当在所选择的麦克风中存在足够能量时唤醒关键字检测电路。这可用于例如具有2米目标射程的室内音频环境。

优点可包含低成本、低功率以及类似或更好的性能。

表1包含示范性操作信息。

表1

图2说明根据所揭示的标的物的一或多个方面的示范性模拟语音能量检测(AVED)架构200。AVED架构200可包含外部AVED麦克风输入滤波器205(其可表示一或多个AVED麦克风输入滤波器)、比较器210、FSM 215、AVED DAC 220、AVED增益和积分器225、一或多个模拟MEM和ECM 245(其可表示一或多个模拟MEM和ECM)、定位于乘法器255与延迟器260之间的第一累加器250、斜率增量调制器架构、用于额外的灵活性的额外寄存器控制、后数字滤波器230、漏泄增益积分器、多VED组合器、包含定位于绝对值功能235与递增计数器240之间的第二累加器265的阈值检测和自动增益控制(AGC)支持电路(例如,参看图10)、定位于AVED麦克风输入滤波器205与减法器275之间的多路复用器270,以及定位于后数字滤波器230、阈值块285和接收来自第二VED有限脉冲响应(FIR)输出295的输入的第二多路复用器290与之间的加法器280。

在一个实施方案中,AVED的操作可包含从三个麦克风245中的一个选择三个麦克风输入信号中的一个。应了解,改变多路复用器(mux)可使输出对于8-32时钟不可靠,例如直到状态机可稳定为止。另外,还可能需要稳定DC偏移。所选择的麦克风信号可与来自AVED DAC 220的数/模转换器(DAC)信号参考(减法)进行比较。比较器输出∈{-1,+1}直接反馈到有限状态机(FSM)215块中。FSM计数相同的连续样本数目。在一个实施方案中,如果最后N个样本相同,那么使增益增加2倍(不过其可取决于查找表(LUT))。如果过去的N样本中的任一个不同,那么使增益减小2倍(类似地,可取决于LUT)。增益在低端和高端处都饱和。如果比较器输出是连续流“+1”或“-1”,那么环路不在跟踪输入,因而应增加环路增益。如果输出在值之间转换,那么环路正在跟踪输入,且应减少环路增益。或者,如果输出不在转换,那么可能存在高频率信号。使来自比较器210的输出乘以FSM增益并且进行累加。将来自累加器250的输出输入到DAC。DAC220应在下一个时钟循环中作用于输入以获得最小延迟。

图3说明根据所揭示的标的物的一或多个示范性方面的示范性外部AVED麦克风输入滤波器205。AVED麦克风输入滤波器205可连接到外部的ECM麦克风(例如,ECM麦克风245),以及连接到包含可编程门阵列与模/数转换器(PGA+ADC)305、VED块310、模拟多路复用器315和低压降调节器320的组件。在一个实施方案中,VED麦克风输入信号包含低通滤波器(LPF)和高通滤波器(HPF)。这可例如当应用于电气电容式麦克风(ECM)或模拟微机电系统(MEMS)(例如,麦克风245)时在外部进行。另外,可使用单极点电阻器-电容器(RC)。在一个实施方案中,LPF可为介于8KHz和12KHz之间的3dB带宽,且HPF可为50Hz。麦克风偏压供应器可针对麦克风的最低功率耗散进行优化。对于ECM,1.8V数字是可能的,且可在低功率和/或较低电压模式中使用低压降调节器(LDO)调整外部Rbias。麦克风偏压噪声也可保持在芯片输出<1-2mV RMS(即,积分后的0.1-32KHz)下。对于MEM,可使用来自数字的1.8V。另外,避免对麦克风偏压的切换瞬变可防止字唤醒处理需要较多稳定时间。

图4说明根据所揭示的标的物的一或多个示范性方面的AVED比较器210。AVED比较器210可定位于减法器275与FSM 215之间。使用AVED比较器210,电压偏移和输入参考噪声可保持为低。在一个实施方案中,麦克风话音输入信号振幅可为100uVRMS,因此噪声相比来说应为小。可将8uV RMS输入参考比较器噪声定为目标。另外,偏移电压应为低。所述设计对一些DC偏移具有固有的鲁棒性,且DC偏移可保持在DAC的范围内(例如,具有75uV最低有效位(LSB)的9.6mV)但当等效LSB减小时下降。目标FS范围为<DAC的10%。

图5说明根据所揭示的标的物的一或多个方面的示范性AVED FSM 215。一般来说,AVED FSM 215可包含第一延迟器505a、第二延迟器505b和第三延迟器505c,使得信号分别延迟0、1T、2T和3T到达匹配逻辑块510。另外,AVED 215可包含第一加法器515、保持介于+6与0之间的样本值的第一饱和块520、舍入块525、查找表(LUT)530、第四延迟器535和多路复用器540。另外,AVED FSM 215可连接到包含乘法器545、第二加法器550、保持介于+127与-127之间的样本值的第二饱和块555以及第五延迟器560的额外组件。使用AVED FSM 215,选择可包含针对增益的N=2、3或4匹配以随着32KHz时钟而增加。然而,最可能使用N=2。另外,使用AVED FSM 215将使查找表(LUT)7位无正负号系数可编程而并非固定以获得额外灵活性,且因此仅需要中间值可编程。另外,需要3位添加到增益积分器(例如,3分数位),且需要负0.125添加到使用附加位的加法器(漏泄积分器)。因此,需要添加舍入逻辑以去除LUT的分数位。在接通实施方案中,可断言在输出触发之前的起动延迟(即,电路稳定时间),可固定到例如32时钟。

图6是根据所揭示的标的物的一或多个方面的示范性仿真输出。

数据605对应于FSM增益输出(LUT输出)*1/10000。

数据610对应于FSM Din*1/10000。

数据615对应于音频输入。

数据620对应于DAC输出。

举例来说,当N=2(例如,con_sel[2:0]=0)时,DAC LSB=75uV,且增益积分器偏移=0。

图7说明根据所揭示的标的物的一或多个方面的示范性AVED DAC 220。举例来说,AVED DAC 220可连接到延迟器705。在一个实施方案中,单一20dB增益步骤可不必需。实际上,修改增益步骤可被配置成使得存在更多增益步骤和更多分辨率。

举例来说,可使用以下LSB等效选项:

首先,可使用75uV标称,且增益可在大于+/-6dB的范围内可依小于或等于2dB的步长调整,所述步长可对应于最小调整量。因此,所述增益步长可对应于例如大约38uV、48uV、60uV、75uV、94uV、117uV、147uV。

在一个实施方案中,所述增益将由CM0中的AGC算法设置。AGC算法的关键细节包含小于或等于3LSB的积分非线性度、小于或等于1/4LSB的微分非线性度、小于或等于10%的满度范围(FSR)的DAC DC偏移,且输出噪声应远小于8uB RMS。

图8说明根据所揭示的标的物的一或多个示范性方面的示范性AVED增益和积分器225。一般来说,AVED增益和积分器225包含各种组件,包含保持介于+127与-127之间的样本值的饱和块810、加法器815、乘法器820和第一延迟器840。另外,AVED增益和积分器225可连接到包含减法器835、绝对值功能块830、多路复用器825和第二延迟器805的额外组件。

在一个示范性实施方案中,AVED增益和积分器225包含来自FSM LUT的7位增益845。接下来,增益*输入可被积分且在+/-127处针对DAC饱和。

图9说明根据所揭示的标的物的一或多个方面的示范性AVED后数字滤波器230。一般来说,AVED后数字滤波器230可连接到加法器915,所述加法器连接到接收来自第二VED FIR输出905的输入的多路复用器910。另外,加法器915可连接到阈值块920。在一个实施方案中,后数字滤波器230将低通响应应用于LUT输出并且接着将所述输出与可编程阈值进行比较。后数字滤波器230可为对包含最新样本的最后“m”样本进行积分的有限脉冲响应(FIR)“移动平均值”类型,如方程式1中所示。

y[n]={x[n]+x[n-1]+x[n-2]+…x[n-m-1]}*1/m

方程式1

在方程式1中,“m”可编程为等于1、2、4或8。

在一个实施方案中,数字滤波器输出转到加法器,这将允许组合另一VED输出(例如,第二VED FIR输出905)以在噪声不相关的情况下获得特定增益的选择方案。较低8位可用作最小值。将加法器输出与可编程阈值进行比较以产生将唤醒CM0和其它字唤醒电路的唤醒触发。可编程阈值应涵盖作为最小值的较低8位。

图10描绘根据所揭示的标的物的一或多个方面的AVED自动增益控制(AGC)支持1000。一般来说,AVED AGC支持1000包含定位于多路复用器1005与减法器1010之间的绝对值功能块235。另外,AVED AGC支持1000可包含加法器1015、保持介于+2^^22与0之间的样本值的饱和块1020、延迟器1025以及递增计数器240。在一个实施方案中,为了支持CM0中的AGC类型功能性和环境噪声估计,可包含额外电路以产生适用度量。举例来说,可累加DAC积分器输出能量。这可通过绝对值功能(例如,绝对值功能块235)进行。在一个实施方案中,为简单起见,绝对值功能块235可与累加加法器“进位输入”和额外的XOR函数组合。另外,累加DAC积分器输出能量包含积分器大小设定成允许CM0一次休眠至少1秒、CM0可读取的递增计数器(例如,递增计数器240)以确定累加的样本的数目,并且估计DC偏移并将其减去(通过减法器1010),之后进行能量检测。举例来说,多路复用器1005被配置成允许能量积分器测量平均DAC输入(其为DC偏移)或平均值减DC偏移(音频能量)。

图11描绘根据所揭示的标的物的一或多个方面的AVED和数字语音能量检测(DVED)系统1100。一般来说,系统1100可包含表示一或多个数字MEM麦克风的数字MEM麦克风1105、表示一或多个麦克风的麦克风1110、表示一或多个多路复用器的多路复用器1115、连接到第一多路复用器的VED1 1120、连接到第二多路复用器的第一PGA+ADC 1125、连接到第三多路复用器的第二PGA+ADC 1130、连接到第四多路复用器的VED2 1135、连接到第一数字MEM麦克风的第一数字信号处理(DSP)块1140和DVED1 1145,以及连接到第二数字MEM麦克风的第二DSP块1150和DVED2 1155。所述设计可包含如所示具有3:1多路复用器输入的对两个独立模拟VED电路的支持。VED可独立地接通/断开或组合。另外,所述设计包含如所示包含用于数字MEM麦克风1105的VED功能性的能力。DVED独立于正常数字麦克风路径(例如,第一DSP 1140或第二DSP 1150)。在一个实施方案中,系统1100提供对四个数字麦克风的支持,使得存在在每一输入接口上多路复用的两个数字麦克风,以及每接口一个DVED(例如,DVED1 1145或DVED2 1155)。

图12是根据所揭示的标的物的一或多个方面的示范性DVED麦克风输入1105。一般来说,DVED麦克风输入1105可包含数字MEM麦克风1230。另外,DVED麦克风输入1105可连接到麦克风偏压块1215和AND门块1235。AND门块1235可连接到DVED 1220,所述DVED可包含级联积分梳状(CIC)抽选器滤波器1205、DEVD前端1210和VED算法1225。在一个实施方案中,DVED麦克风输入1105可为DVED系统1200的部分。举例来说,麦克风偏压(例如,麦克风偏压块1215)可产生用于最低功率消耗1.8V数字输出。与ECM麦克风相比,外部RC滤波器可为宽松的。可产生对数字MEM麦克风可编程的时钟。时钟可在512K到768K之间可编程。到数字MEM(例如,DVED麦克风1105)的接口可被配置成负责任何多路分用和重新计时。

本文中进一步描述包含在DVED 1220中的级联积分梳状(CIC)抽选器滤波器1205、DVED前端1210和VED算法1225。

图13描绘根据所揭示的标的物的一或多个方面的示范性DVED级联积分梳状(CIC)抽选器滤波器1205。一般来说,抽选器滤波器1205包含第一加法器1315和第一延迟1320、第二加法器1325和第二延迟器1330、第三加法器1335和第三延迟器1340、第四加法器1345和第四延迟器1350。另外,抽选器滤波器1205包含抽选时钟1310,其包含第五延迟器1355和第一减法器1360、第六延迟器和第二减法器1370、第七延迟器1375和第三减法器1380、第八延迟器1385和第四减法器1390以及移位器块1395。用于输入的时钟可与应可在512-768KHz范围内编程的MEM麦克风相同。用于此时钟的抖动需要针对VED边缘到边缘<<100ns。所述抖动可为周期性信号的真周期性的偏差。在一个实施方案中,抽选时钟1310为约32KHz(+/-5%)和输入时钟的直线数字分频。OSR应在16-24范围内。应了解,从直线CIC的少量带内下降对于VED处理是可接受的。最小CIC滤波器目标是四阶(4积分器、抽选、4微分器)。这应通过四阶麦克风(例如,OSR=16)从量化噪声获得大于90dB SNR。在一个实施方案中,初始总线宽度是21位(4*log2(OSR max)+1),且输出可使用移位器(例如,移位器块1395)按比例缩放到16位。应了解,在数字麦克风中可存在特定DC偏移。

图14描绘根据所揭示的标的物的一或多个方面的被配置成用于DVED前端处理的示范性DVED前端1210。一般来说,DVED前端1210可包含减法器1405、正负号块1410、乘法器1415和增益选择块1420。在一个实施方案中,前端逻辑可仿真比较器和DAC用于AVED处理。举例来说,输入可来自CIC抽选器滤波器1205的移位的输出。需要乘以来自DAC累加器的8位以提供AGC/增益缩放。这与AVED相比可为较大范围。DVED前端处理可将移位和相加技术用于乘法。在一个实施方案中,可使用具有用于缩放的2dB步长的20dB范围,且输出可为16位以匹配来自移位的CIC抽取滤波器1205的输出。

图15描绘根据所揭示的标的物的一或多个方面的示范性麦克风偏压架构1500。在一个实施方案中,麦克风偏压架构1500可包含三个独立麦克风偏压产生器。另外,规定两个麦克风偏压供应器支持高达四个数字麦克风。此外,1.6V和1.8V输出模式可添加到低压降调节器(LDO)1505(其可表示一或多个LDO),且LDO静态电流可根据实际情况减小。对于VED模式,麦克风输入接脚处的来自麦克风偏压供应器的噪声应维持在远小于8uV RMS。这对应于在具有差分麦克风配置的麦克风偏压接脚处大致小于2mVRMS。另外,麦克风偏压架构1500可包含用于GPIO的供应件以针对较低VED麦克风偏压电流通过外部FET开关改变Rbias。

图16、图17、表2和3以及对应的描述概述第一VED算法(其也可被称作VED1)与第二VED算法(其也可被称作VED2)之间的差异。在所揭示的标的物的一个或多个方面中,增强型VED方法可用以增加性能并且在系统中添加更大设计裕度。更具体地说,VED2算法可依靠如本文进一步描述的数字门计数的适度增加获得高于96%-97%性能。

图16描绘根据所揭示的标的物的一或多个方面的示范性AVED(出于比较目的,其也可被称作AVED1)系统1600。一般来说,AVED系统1600可包含FSM 1605、后滤波器1610和AGC支持1615,所述组件在本文中都已经被描述。更具体地说,AVED1可包含具有环路增益的后滤波的斜率增量ADC转换器,其可为对简单能量检测器的改进,这是因为斜率滤波器衰减低振幅和高频率噪声。

图17描绘根据所揭示的标的物的一或多个方面的示范性AVED系统1700(其可以被称作AVED2),其为与AVED1相比的另一选择方案。一般来说,AVED系统1700可包含FSM 1705、后滤波器1715和AGC支持1710。FSM 1705和AGC支持1710可分别与FSM 1605和AGC支持1615相同。然而,后滤波器1715可包含表示一或多个带通滤波器的双二次带通滤波器1720、表示定位于每一双二次带通滤波器1720与表示一或多个加法器(例如,针对每一绝对值功能块1725)的加法器1730之间的一或多个绝对值功能块的绝对值功能块1725。另外,绝对值功能块1740可定位于每一加法器1730与表示一或多个阈值块1735(例如,针对每一绝对值功能块1740)的阈值块1735之间,使得每一阈值块1735在OR门1745处收敛。更具体地说,AVED2可包含具有子带差后滤波器的斜率增量ADC转换器。AVED2架构可为对AVED1(例如,来自图16)的改进,这是因为子带差后滤波器更好地瞄准话音特性。此外,AVED系统1700具有针对特定唤醒字调整性能的额外灵活性。

表2是示范性AVED算法的概述性能比较。

表2

如表2中所示,AVED系统1700(AVED2)具有对AVED系统1600(AVED1)的大约2.5%改进。

表3是AVED算法的比较的概述。

表3

AVED2是大约2-2.5%更好的性能,可忽略对裸片面积和功率的影响。不影响调度。

图18描绘根据所揭示的标的物的一或多个方面的DVED系统1800(其当与DVED系统1200相比时也可被称作DVED2)的示范性概述。DVED系统1800包含CIC抽选器滤波器1805、DVED前端1805(例如,DVED前端1205)以及对应于VED算法的结构1815。除了图12中的CIC抽选器1205的CIC抽选器滤波器组件之外,CIC抽选器滤波器1805还可包含双二次高带通滤波器1820和双二次低带通滤波器1825。结构1815可对应于AVED系统1700。在一个实施方案中,CIC抽选器滤波器1805被配置成用于数字抽选和噪声滤波。在一个实施方案中,DVED前端1805被配置成替换ADC和DAC。

表4是示范性模拟DAC和比较器仿真结果的表。对于2米音频处理(15uV RMS)的模拟可包含低输入参考噪声,使得比较器噪声可受前置放大器输入对(热噪声)支配。举例来说,噪声改进可对应于额外25uA从100uV到15uV。可添加控制位以调整噪声级。

表4

通过后处理块的有限状态机累加可对应于约4000um^2的面积和在0.9V下约5uW的功率。

数字VED2可对应于CIC/双二次滤波器/数字前端比较器且可使用例如Broadcom'sEasyflow合成。可使用从门网表产生的VCD进行功率估计面积可为约5600um^2且功率可为在0.9V下约10uW。

数字有限状态机累加可对应于面积约800um^2以及功率为在0.9V下约1uW,这对于工具来说可能太低。

图19-22描述并入用于VED的捕获缓冲器改进所需的改变。

图19说明根据所揭示的标的物的一或多个方面的AVED系统中的示范性捕获缓冲器1905。一般来说,捕获缓冲器连接到AVED 1910,所述AVED连接到多路复用器1915,所述多路复用器连接到麦克风1920。更具体地说,捕获缓冲器1905是与VED电路操作并行地捕获音频ADC样本的缓冲器。此缓冲器的目的是允许CM0当唤醒电路触发所要话音时及时返回以获得更多丢失的音素。这确保即使唤醒触发较迟引发,高唤醒字检测仍可进行。这带走一些压力,及早获得检测,这可减小假警率。也难以及早检测一些音素。此逻辑也允许CM0更快速地确定唤醒是否为假警报,这是由于CM0具有对过去的相关音频样本的瞬时存取。为支持此,可修改VED电路以引出音频样本。SoC可决定存储器到添加多少以及如何将缓冲器连接到音频信道。

图20A是根据所揭示的标的物的一或多个方面的示范性AVED系统2000。一般来说,AVED系统2000包含将捕获缓冲器连接到AVED架构的双二次带通滤波器块2010(例如,后滤波器1715)。更具体地说,可使用8位DAC积分器输出估计音频。此信号可有噪声并在例如32KHz(32-64KHz)下进行取样。低通滤波器可添加到信号并且接着进行子取样以输出8或16KHz。低通滤波器可为简单滑动窗FIR(AVED1中相似的2、4、8样本)或具有设置为低通功能的参数的BQF。信号仍可为有噪声。将时钟增加到64KHz可为有帮助的。

图20B是根据所揭示的标的物的一或多个方面的麦克风输入和DAC累加输出2005。在一个实施方案中,FIR=[1 1 1 1]*0.25。

图21是根据所揭示的标的物的一或多个方面的DVED系统2100的示范性部分。在一个实施方案中,DVED系统2100的部分反映用于并入捕获缓冲器(例如,捕获缓冲器1905)的改变。可使用抽选器BQF(例如,双二次带通滤波器1820、1825)的输出2110估计音频。此信号非常纯净并且在例如32KHz(32-64KHz)下进行取样,且需要分接BQF输出,其中信号具有16位分辨率。这可在任何底层/rnd功能块2105用于对VED2算法的进一步截短之前。所述信号可在8或16KHz下进行子取样。这可在DVED块外部进行。另外,可分配用于音频总线的输出接脚。

图22描绘根据所揭示的标的物的一或多个方面的示范性捕获缓冲器2205。一般来说,捕获缓冲器2205可添加到类似于图11中的DVED系统1100的架构,然而,图22中的架构包含第一AVED 2210和第二AVED 2215而非VED1和VED2,且图22中的架构包含第一DVED 2220和第二DVED 2225而非DVED1和DVED2。另外,图22中的架构可包含一或多个数字MEM麦克风2230之间的单一多路复用缓冲器。裸片面积影响可为高。为了使裸片面积降到最低,可考虑8KHz样本速率。另外,可考虑10或12位广样本。高性能ADC可多路复用到捕获缓冲器输入。选择最佳麦克风的相同算法也可用以选择将捕获缓冲器放置在何处。在一个实施方案中,除SRAM中的使用DMA的循环缓冲器以外的FIFO结构可以与20ms最小值和50ms缓冲器长度一起使用。

图23-28说明当VED操作时降低总麦克风偏压功率消耗。在所揭示的标的物的一个或多个方面中,可如本文进一步描述地实现降低总麦克风偏压电流。传统编解码器/AFE设计具有内部麦克风偏压产生器内的供应件以当VED操作时降低总麦克风偏压功率消耗。然而,考虑可有助于在使用ECM麦克风的情况下进一步降低功率消耗的改变。数个麦克风偏压电路设计解决方案可在以下两个分类中:

1)假设使用ECM,增强现有内部麦克风偏压电路以降低总功率,这可通过在VED期间增加Rbias、减小Vs或这两者进行。

2)使内部麦克风偏压电路保持原样,这可当VED处于运行中时用于MEM麦克风或ECM而无额外功率节约。可移除内部麦克风偏压LDO模式以节约裸片面积。

图23说明根据所揭示的标的物的一或多个方面的示范性传统设计2300。传统设计2300包含ECM麦克风2305、LDO 2310和PGA+ADC 2315。传统设计中的麦克风偏压可产生可编程输出电压。高质量模式(低噪声)LDO 2315可添加来自2.9V轨的约200ua电流。低质量模式(较高噪声)LDO 2315可添加来自2.9V轨的约50ua电流。数字供应器可添加约0ua。MEM麦克风可在VED模式期间将1.8V数字供应器用于最低功率。如果噪声过高,那么可使用2.1V下的低质量LDO模式。ECM麦克风2305可在VED模式期间将1.8V数字供应器用于最低功率。如果噪声过高,那么可使用2.1V下的低质量LDO模式。这将减小内部麦克风偏压电流但不会减小超出预定阈值的外部麦克风偏压电流。

图24说明根据所揭示的标的物的一或多个方面的第一示范性设计2400。一般来说,第一设计2400可包含ECM麦克风2405、PGA+ADC 2410、LDO 2415、模拟多路复用器2420、VED 2425。在一个实施方案中,第一设计2400可仅用于ECM且添加切换外部FET以改变外部麦克风偏压电流(调整Rbias)的能力。这可与内部麦克风偏压输出电压(Vs)的任选降低结合使用。另外,接脚可用于数字控制(例如,CM0)。此外,第一设计2400需要确保来自所添加的FET的噪声或非线性度将不影响VED性能,以及检查当切换模式时的瞬变。第一设计2400的优点是没有AMS改变以及当Vs降低时对较低麦克风增益的补偿。

图25说明根据所揭示的标的物的一或多个方面的第二示范性设计2500。第二设计2500可包含ECM 2505、PGA+ADC 2510、LDO 2515、模拟多路复用器2520和VED 2525。在一个实施方案中,第二设计2500可仅用于ECM并且添加在额外偏压电流中针对正常偏压模式的切换(调整Rbias)的能力。可使用接脚和外部RC滤波器以及额外接通裸片。第二设计2500可需要检查当LDO开关断开时,麦克风(例如,ECM 2505)漏极上的RC不会显著损害VED性能/功率以及稳定性。另外,可当切换模式时检查瞬变。

图26说明根据所揭示的标的物的一或多个方面的第三示范性设计2600。第三设计2600可包含ECM 2605、PGA+ADC 2610、LDO 2615、模拟多路复用器2620和VED 2625。在一个实施方案中,第三设计可仅用于ECM并且使麦克风偏压电路保持原样(例如,传统设计加模拟多路复用器和VED),但并入有对LDO的如下改变:

1)添加1-1.3V较低电压输出选择方案。另外,有可能添加1.8V选择方案用于LDO和数字之间的无缝切换。

2)允许LDO输入针对1-1.3V选择方案使用1.8V数字供应器。

这将允许在VED模式期间使Vs降低到ECM(例如,ECM 2605)可使用的电压,这可减小外部麦克风电流和麦克风增益。这还可有助于消除2.9V轨泄漏电流。应了解,0.9V数字在低侧且可噪声太大。在第三设计2600中,可将检查功率节约的量和LDO环路稳定性,以及当切换模式时的瞬变。

图27说明根据所揭示的标的物的一或多个方面的第四示范性设计2700。第四设计2700可包含模拟MEM麦克风2705、PGA+ADC 2710、LDO 2715、模拟多路复用器2720和VED 2725。在一个实施方案中,第四设计2700可使用MEM麦克风(例如,模拟MEM麦克风2705)。任一模拟或数字MEM麦克风可使用略微有噪声的1.8V供应器。模拟MEM的电流消耗可处于60-200uA范围内,这取决于性能和设备供应商。第四设计2700可确保供应器上的噪声还可以接受,但在为了裸片面积节约而移除LDO的情况下可能是个问题。第四设计2700的优点是不应存在任何归因于改变偏压电流造成的VED模式与正常模式之间的瞬变。

虽然上述描述为易于理解已经组织为四个示范性设计,但所属领域的技术人员将认识到,四个示范性设计中的每一个的元件可与四个示范性设计中的另一个的元件不受限制地组合。在不脱离本发明的范围的情况下其它设计也是可能的。

当前传统麦克风偏压设计可在VED模式期间辅助减小一些电流。第四设计可为可聚焦于模拟和数字MEM麦克风的最简单解决方案。可能的优点包含模拟MEM麦克风已经在全性能下具有低功率(60-200uA)。全性能的ECM正常偏压电流通常在300-500ua范围内。具有针对VED的减小性能的ECM可当Vs降低和/或Rbias增加时降至使用50-100ua的偏压电流。此选择方案可允许在VED模式期间消除2.9V。此选择方案确实允许移除麦克风偏压产生器中的低噪声LDO的可能性。这会节约每偏压产生器0.03mm^2。另外,不存在支持第四麦克风且无额外接脚或外电路的大量面积损失。相同偏压产生器可用于模拟和数字MEM麦克风,且MEM麦克风具有优于ECM麦克风的多个优点。然而,应了解,如果需要具有最低VED功率的ECM支持,那么第三设计可为下一个最佳(至少1.3V添加)。另外,可在有需要的任何时间添加第一设计,只要存在可用的GPIO即可。

图28A说明根据所揭示的标的物的一或多个方面的第一示范性多个麦克风偏压产生器2800。如果限于MEM麦克风,那么可移除所有LDO以节约裸片面积。

图28B说明根据所揭示的标的物的的一或多个方面的第二示范性多个麦克风偏压产生器2805。传统方法可包含3x麦克风偏压电路。

图28C说明根据所揭示的标的物的一或多个方面的第三多个麦克风偏压产生器2810。对于ECM麦克风,可通过共享消除LDO,这可有助于裸片面积和功率。在一个实施方案中,可存在足够的串扰隔离以足以进行操作。然而,LDO可需要支持大于或等于2mA负载。所属领域的技术人员将认识到,图28A-C中描绘的元件可与每一其它元件不受限制地组合。

图29描绘根据所揭示的标的物的一或多个方面的数字VED计时图示2900。一般来说,VED计时图示2900可包含表示一或多个数字MEM麦克风的数字MEM麦克风2905、可包含一或多个AND门2945和多路分用器信道选择块2950的I/F块2945、包含CIC抽选器滤波器2930、数字VED前端2935和VED算法2940的DVED 2915、包含1/N块2975的芯片上系统(SoC)2920,以及包含AVED2 2955、1/OSR_A块2960、1/M块2960和频率锁定环路(FLL)高速时钟2965的模拟前端(AFE)2925。

语音能量检测可具有数个优点。一般来说,提供功率节约是VED的主要优点。此外,可使用多个VED以节约功率。

举例来说,在一个实施方案中,接通装置中的多个麦克风中的一个基于所述一个麦克风具有与其相关联的最大音频声能。因此,可选择主麦克风用于VED处理以节约功率。此外,可定期扫描麦克风以找到具有最大能量的麦克风并且接着选择所述麦克风作为主麦克风。因此,可基于选择具有最大音频声能的麦克风来动态地更新主麦克风。所述扫描可使用第二VED进行,其扫描其它麦克风以查看其它麦克风中的任一个是否具有比当前主麦克风更大的音频声能,并且可在扫描期间发现就具有更大音频声能的另一麦克风的情况下相应地更新主麦克风。

举例来说,在一个实施方案中,用于唤醒工作的处理不必须在芯片上进行。更具体地说,所检测的唤醒字可发送到外部服务器(例如,云、服务器集群等)以确认所检测的唤醒字是否良好匹配。所述外部服务器可将信号发送回到芯片以激活高保真度音频路径,接通麦克风等,且剩余的高保真度音频流可转至所述外部服务器以用于额外后端处理。因此,VED可对应于显著功率节约,这是因为在本地进行所述处理可消耗大量功率。

另外,对麦克风施加偏压可提供显著功率节约。举例来说,考虑M麦克风和VED需要针对麦克风中的一个或两个进行,这是因为如果针对所有麦克风为所有偏压产生器提供功率,那么将浪费巨大量的功率。因此,对于最低功率解决方案,每一麦克风应具有其自身的专用偏压产生器。

现在已经描述所揭示的标的物的实施例,所属领域的技术人员应明白,前述内容仅是说明性的而非限制性的,其仅借助于实例呈现。因此,虽然本文中已论述特定配置,但也可采用其它配置。本发明支持众多修改和其它实施例(例如,组合、重新布置等)并且在所属领域的普通技术人员的能力范围内,且预期在所揭示的标的物和任何其等效物的范围内。所揭示的实施例的特征可在本发明的范围内组合、重新布置、省略等以产生额外实施例。此外,有时可使用某些特征获得优点而无需其它特征的对应使用。因此,申请人希望包涵所揭示的标的物的精神和范围内的所有此类替代方案、修改、等效物和变化形式。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1