一种用于语音活动检测的时分交织带通滤波器的制作方法

文档序号:21718290发布日期:2020-08-05 01:05阅读:138来源:国知局
一种用于语音活动检测的时分交织带通滤波器的制作方法
本发明涉及一种带通滤波器,并且更具体地,涉及用于语音活动检测的时分交织带通滤波器。
背景技术
:在电池供电的物联网系统中,低功耗是决定系统终端使用时间的关键因素。在语音相关的物联网系统中,首先语音活动检测(voiceactivitydetection,vad)从背景噪声中识别出人声,然后再激活系统中其它高功耗模块,从而实现低功耗、持续待机的语音系统。在语音活动检测中,需要分辨输入声音信号是人声还是背景噪音。嵌入式语音识别系统都采用了模式匹配的原理,对输入信号首先经过预处理,其中包括特征提取,即从输入信号波形中提取一组或几组能够描述该输入信号特征的参数。特征提取是语音活动检测识别率的关键,往往需要一组中心频率几何比例分布的带通滤波器。鉴于此,传统语音活动检测是基于数字信号处理技术,是先把麦克风传感器输出的模拟信号通过数模转换器转换成数字信号。然后,通过算法实现数字的带通滤波器。但是数字实现方案需要高功耗的数模转换器并且数字带通滤波器本身也需要高功耗,而vad作为一种常开的检测单元,需要以低功耗实现足够的分类精度。近来区别于传统vad,参考以下论文:“designofanalways-ondeepneuralnetwork-based1-μwvoiceactivitydetectoraidedwithacustomizedsoftwaremodelforanalogfeatureextraction”,doi:10.1109/jssc.2019.2894360;“a1μwvoiceactivitydetectorusinganalogfeatureextractionanddigitaldeepneuralnetwork”,doi:10.1109/is;cc.2018.8310326;基于模拟技术的语音活动检测实现高识率,同时功耗只有1微瓦并且不需要高功耗的数模转换器。该方案实现低功耗的关键是利用16个并行的模拟带通滤波器直接对麦克风传感器输出的模拟信号进行处理。该方案使用了基于超级源跟随(super-source-follower,ssf)架构的带通滤波器组,在100hz到5000hz的频率范围内实现一组几何分布的多中心频率的带通滤波,从而得到输入信号的特征信息。虽然通过基于超级源跟随架构的带通滤波器的特征提取能够实现低功耗语音活动检测,但该方案中存在两个缺点。第一,每一个中心频率都需要一组独立带通滤波器的电路,增大了芯片面积和成本。第二,在特定频率范围内实现多中心频率带通滤波器需要准确的中心频率,以防止多个带通滤波器的中心频率发生混叠,但是该方案中每一组带通滤波器的中心频率取决于该组滤波器采用的晶体管的跨导和金属电容的容值,限制了可实现的带通滤波器的组数和中心频率的准确度,因为晶体管的跨导匹配需要准确的电流镜像电路和相同的晶体管参数。然而实际上,晶体管的参数和电流镜像电路的匹配随着工艺制造过程的偏差和使用环境的不同,会产生比较大的偏差。在语音物联网系统,如蓝牙耳机,智能手表等,这些系统方案对芯片面积大小有非常严格的限制,所以更小芯片面积的语音活动检测方案是很关键的。此外,基于模拟电路的特征提取比数字电路更容易受到工艺制造和使用环境的影响,如果采用的多个不同的晶体管电路组成带通滤波通道,会放大工艺制造这一因素的影响,使得每一组带通滤波器的中心频率不够精确,降低特征提取的准确率,这使得每一颗芯片都会有不一样的识别率。技术实现要素:有鉴于此,为了减小多组带通滤波器的电路面积,并同时提高带通滤波器中心频率在工艺制造偏差和使用环境变化时的准确度。本发明提出的时分带通滤波器通过在同一组晶体管电路,一个特定时间段里的不同的时间间隙实现不同中心频率的模拟带通滤波器组,达到共用晶体管电路的目的。第一方面,提出了一种带通滤波器,包括:耦合电容,第一晶体管,第一滤波通道阵列,第一电流源,第二电流源,所述耦合电容连接第一晶体管栅极端,第一晶体管源极端连接第一电流源输出端,漏极端输出分别连接第一滤波通道阵列、第二电流源,在连接第二电流源后接地。所述带通滤波器还包括第二晶体管、第二滤波通道阵列,所述第二晶体管栅极端的输入连接第一晶体管的漏极端输出,源极端接地,漏极端分别连接第一电流源输出端、第二滤波通道阵列输入端,所述第一、第二滤波通道阵列分别包括多组滤波通道,每一组滤波通道包括开关、电容,所述开关连接电容,电容接地,开关由相位φi的脉冲信号控制,i为0~n的整数。该方案基于超级源跟随架构,实际上利用了第一晶体管、第二晶体管的并联反馈,使得晶体管输出的阻抗降低,以此提升晶体管输出电压对输入电压的跟随效果,第一、第二晶体管相当于一个电压控制电流的转换器,控制能力体现为跨导,把电压信息转换成电流信息,并累积和储存在分别对应的第一、第二滤波通道阵列内滤波通道的电容器上。特别注意,第一滤波通道阵列内与第二滤波通道阵列内相同相位φi的滤波通道构成一组带通滤波通道,即所述带通滤波器实际上在只利用一个晶体管电路下,包含一系列或者多组中心频率不同的带通滤波通道,降低芯片面积。例如,当滤波器处于相位φ0时,第一晶体管将输入电压信号转换成相应的电流,并以电荷的形式累积在电容器c1,0上,累积电荷的大小取决于第一晶体管的跨导gm1和相位φ0的脉冲时间t0。第二晶体管的工作方式与第一晶体管相同。在一个预定的时间段t内的相位φ0、φ1、φ2、....、φn的脉冲时间是t0、t1、t2、....、tn,第一、第二滤波通道阵列内分别包含的n+1个滤波通道,不同通道的滤波器的中心频率的变化取决于相同的晶体管跨导gm1和gm2和不同通道的相位φi的脉冲时间ti和电容器的电容值c1,i和c2,i,不再仅取决于晶体管跨导以及和电流镜像电路的匹配,降低工艺制造和使用环境对中心频率精确度的影响。由第一、第二滤波通道阵列构成的n+1组带通滤波通道的第i个滤波器中心频率为fi表示如下:进一步地,在预定的时间段内,采用时分交织的方式运行上述多组带通滤波通道。即一个预定的时间段里的不同的时间间隙实现不同中心频率的带通滤波器,需要每组带通滤波通道内相位φi的脉冲时间ti占用不同的时间间隙,从而达到共用一个晶体管电路的目的。在一些实施例中,三个反相器组成一个环路振荡器产生一个周期为tvco时钟信号,然后输出的时钟信号经过相位产生器输出脉冲时间为环路振荡器周期整数倍的脉冲信号分别是φ0到φn。进一步地,所述的带通滤波器还包括偏置电路,偏置电路包括偏置电压端、至少一个电阻,偏置电路位于耦合电容和第一晶体管中间,其输出端与耦合电容共同连接第一晶体管的栅极端。特别地,偏置电压通过所述偏置电路内电阻传输到第一晶体管栅极端,使第一晶体管工作在饱和区,第一晶体管漏极端输出电流跟随输入电压变化。进一步地,预定的时间段t也是环路振荡器周期tvco的整数倍,使得其与相位φi的脉冲时间ti的匹配度极高。本发明的有益效果:1、因为多组带通滤波通道只需要一组超级源跟随架构的晶体管电路,本发明在实现多带通滤波通道时节省了芯片面积,芯片面积和带通滤波器通道数目增加不是正比关系。从而可以在一定的芯片面积下,在一个特定的频率范围内可以加入更多的不同中心频率的带通滤波器组,即中心频率的分布更紧密,增加了提取语音信号的特征信息量。2、本发明的使用的相位φi的脉冲时间ti是通过合并整数个环路振荡器的周期tvco而产生。所以ti的匹配度极高,而且不受制造工艺和使用环境因素的影响,不需要电流镜像电路和晶体管参数匹配,提高了中心频率的准确度。3、利用模拟带通滤波器直接对模拟信号进行处理,不需要高功耗的数模转换器,降低功耗。附图说明图1为本发明一实施例示意图;图2为本发明一实施例中不同滤波通道内相位产生的示意图;图3位本发明一实施例中相位时序示意图。符号说明:第一晶体管m1第二晶体管m2第一电流源i1第二电流源i0耦合电容cb偏置电压端vb偏置电阻rb反相器inv1、inv2、inv3具体实施方式为了使发明的目的、原理、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,正如本
发明内容部分所述,此处所描述的具体实施例用以解释本发明,并不用于限定本发明。需要特别说明的是,根据说明书的文字或者技术内容可以确定的连接或位置关系,为了图画的简洁进行了部分的省略或者没有画出全部的位置变化图,本说明书未明确说明省略的或者没有画出的位置变化图,不能认为没有说明,为了阐述的简洁,在具体阐述时不再一一进行说明,在此统一说明。语音活动检测中,需要对输入信号进行识别并分类,这一过程的关键在于进行特征提取,即通过从输入信号波形中提取一组或几组能够描述信号特征的参数,而特征提取的过程需要兼顾低功耗、低面积占用以及高识别率。高识别率与采用一组中心频率几何分布的带通滤波器对输入信号波形提取特征时,该带通滤波器的中心频率的准确划分有关。特别注意,本申请所述的带通滤波器不仅适用在语音活动的检测中,同样适用在需要其他对语音进行模拟特征提取的场景中,如对语音进行关键词识别的场景,发明名称中的用途只是为了方便对本申请的说明。图1为本申请的实施例带通滤波器示意图。请参见图1,一种带通滤波器,包括耦合电容cb,第一晶体管m1,第一滤波通道阵列,所述耦合电容连接第一晶体管m1栅极端,所述第一晶体管m1源极端连接第一电流源i1,漏极端第一晶体管源极端连接第一电流源输出端,漏极端输出分别连接第一滤波通道阵列、第二电流源i0,在连接第二电流源i0后接地。所述带通滤波器还包括第二晶体管m2、第二滤波通道阵列,所述第二晶体管栅极端连接第一晶体管m1的漏极端输出,源极端接地,漏极端分别连接第一电流源i1的输出、第二滤波通道阵列,值得注意的,所述第一、第二滤波通道阵列分别包括多组滤波通道,每组滤波通道包含至少一个开关、电容器以及控制所述开关的相位φi的脉冲信号,i∈0~n,即第一晶体管的漏极端输出通过开关连接电容器的顶端夹板上,电容器底端夹板接地;特别地,在一些实施例中,所述的带通滤波器还包括偏置电路,偏置电路包括偏置电压端vb和至少一个偏置电阻rb,偏置电路位于耦合电容和第一晶体管中间,其输出端与耦合电容共同连接第一晶体管的栅极端。该实施例中,输入信号的交流成分从vin经过耦合电容cb耦合到第一晶体管m1的栅极端,而直流成分在此处被耦合电容cb隔离,偏置电压端vb通过电阻rb传输到第一晶体管m1的栅极端,使第一晶体管m1工作在其饱和区,第一晶体管m1漏极端输出电流随输入电压变化,可以理解,此处的输入电压指的是被隔离了直流成分的输入电压。应当理解,所述第一晶体管m1相当于一个电压控制电流的转换器,控制能力体现为晶体管的跨导,即晶体管输出端电流的变化值与输入端电压的变化值之间的比值,第一晶体管m1把电压信息转换成电流信息,并将所述电流信息以电荷的形式累积和储存在相应第一滤波通道阵列内滤波通道的电容器上。例如,当滤波器处于相位φ0时,第一晶体管m1将输入电压信号转换成相应的电流信息,并累积在电容器c1,0上,累积电荷的大小取决于第一晶体管m1的跨导和相位φ0的脉冲时间t0,一般地,开关的闭合时间越长,累积的电荷越大。其中,第一晶体管m1和第二晶体管m2的跨导分别是gm1和gm2。应当注意的是,在预定的时间段t内的相位φ0至φn对应的脉冲时间是t0至tn,例如相位φ0的脉冲时间为t0,相位φn的脉冲时间为tn。所述第二晶体管m2的工作方式与第一晶体管m1相同,具体地,第一晶体管m1的输出为第二晶体管m2的栅极输入,第二晶体管m2将所述栅极输入的电压信号转换为电流信号,通过连接第二滤波通道阵列内的开关,将电流信号以电荷的形式累积并储存在相应第二滤波通道阵列内滤波通道电容器上。应当理解,本申请中采用超级源跟随架构的晶体管电路实际上利用了第一晶体管m1、第二晶体管m2间的并联反馈,使得晶体管输出的阻抗降低,以此提升晶体管输出电压跟随效果,保证输出电压的一致性。需要说明的是,第一滤波通道阵列内的相位φi的滤波器通道与第二滤波通道阵列内的相位φi的滤波器通道是对应的,即当第一滤波通道阵列内包含n+1组滤波通道,第二滤波通道阵列内也包含n+1组滤波通道,可以组成n+1组带通滤波通道,例如第一滤波通道阵列内一组相位φi的滤波通道与对应的第二滤波通道阵列内的一组同一相位φi的滤波通道构成一组相位φi的带通滤波通道。在一个预定的时间段t内,由于不同的带通滤波通道的滤波器共用同一个晶体管电路,那么所述滤波器的中心频率的变化取决于相同的第一、第二晶体管跨导gm1和gm2和不同通道的相位φi的脉冲时间ti和电容器的电容值c1,i和c2,i,那么所述n+1组带通滤波通道的第i个带通滤波器中心频率为fi表示如下:应当理解,n+1组带通滤波通道共用一个晶体管电路,具体来说,共用耦合电容、偏置电路、第一电流源、第二电流源、第一晶体管、第二晶体管,相对于并行的带通滤波通道,每一组带通滤波通道都减少了一组超级源跟随架构的晶体管电路、偏置电路和电流镜像电路,减少了所需要的晶体管电路器件的数量,进一步地,降低语音活动检测中芯片的面积。另外,应当注意,对于第i组带通滤波器,其中心频率不再仅仅取决于第一晶体管、第二晶体管的跨导和第一、第二滤波通道阵列的滤波通道内的每一组滤波通道所包含的电容容值,而是引入了相位φi的脉冲时间ti,对应计算公式可以理解为对所述中心频率的修正,减少晶体管工艺制造和使用环境对带通滤波器中心频率精确度的影响,同时由于多组带通滤波通道共用同一个晶体管电路,在单位芯片面积上可以实现更多的滤波通道组数。进一步地,在一些实施例中,所述n+1组带通滤波通道以时分交织的方式运行,即在给定的时间段内,由第一滤波通道阵列中每一组滤波通道与第二滤波通道阵列每一组相同相位φi的滤波通道分别组成一组带通滤波通道,可以理解,第一滤波通道阵列与第二滤波通道之间总共可以组成n+1组带通滤波通道,所述每一组带通滤波通道在预定的时间段t内占用不同的时间间隙,结合图1所示的实施例,需要每组带通滤波通道内相位φ的脉冲时间ti占用不同的时间间隙。特别注意,一般情况下,对于几十兆赫兹以上高频信号,时分交织的滤波器需要很高频(输入信号10倍以上)并且噪声很小的时钟信号作为开关的切换,功耗大;另外因为晶体管作为开关并非理想开关,每一次开关的时候都会引入一些误差,最后表现为额外的电荷到电容器上。然而,应当注意,对于本申请所应用的人声识别系统,绝大部分必要的信号频率都是在几千赫兹以下。例如,具体地,本申请的带通滤波器一般是100到5000赫兹,采用时分交织的带通滤波器组的精度在实际处理过程中并不会受到上述问题的影响。具体地,请参见图2,该实施例中利用三个反相器(inv1,inv2和inv3)组成一个环路振荡器产生一个周期为tvco时钟信号,然后输出的时钟信号经过相位产生器脉冲信号分别是φ0,φ1,φ2,φ3,、、、,φn,对应输出脉冲时间t0、t1、t2、....、tn为环路振荡器周期整数倍。并且所述预定的时间段t也是环路振荡器周期整数倍。应当理解,所述环路振荡器并不局限于由3个反相器组成,还可以是能产生同样效果的奇数倍个反相器。同理相位φ0到φn脉冲产生也不局限于采用相位产生器,但需要保证ti的匹配度。进一步地,参见图3,图2所示的实施例使用的每一个相位φi的脉冲时间ti都是通过合并整数个环路振荡器的周期tvco而产生。举例说明,当需要一系列的不同中心频率如fi至fn的带通滤波器时,根据图1的实施例的公式,滤波器处于φi时,对应的时间为ti,得到中心频率为fi的带通滤波通道,此时该相位φi的带通滤波通道使用晶体管电路,之后进入下一个时刻,滤波器处于φi+1,对应的脉冲时间为ti+1,得到中心频率为fi+1的带通滤波通道,此时该φi+1的带通滤波通道使用晶体管电路,同理中心频率fi~fn的带通滤波器依次在不同的时间间隙内使用晶体管电路。应当特别注意,ti都是通过合并整数个环路振荡器的周期tvco得到,预定的时间段t也是环路振荡器周期tvco整数倍,保证ti的匹配度极高,而且不受制造工艺和使用环境因素的影响,不需要电流镜像电路和晶体管参数匹配,提高了中心频率的fi准确度,对于本申请所应用的语音识别场景,在对语音进行特征提取时,设置的多组极高准确中心频率的带通滤波器,有利于语音识别系统的准确率。值得注意的是,上述实施例中,所包括的各个模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;在不冲突的前提下,本申请描述的各个实施例和/或各个实施例中的技术特征可以任意的相互组合,组合之后得到的技术方案也应落入本申请的保护范围。另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。将理解的是,当元件被称为“连接”或“耦合”到另一元件时,其可以直接连接或耦合到另一元件,或者可替代地,可以存在中间元件。相反,当一个元件被称为“直接连接”或“直接耦合”至另一元件时,则不存在中间元件。如本文所使用的,术语“和/或”包括一个或多个相关联列出的项目的任何和所有组合,并且可以缩写为“/”。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1