一种超声波辅助麦克风阵列语音增强装置的制作方法

文档序号:2833356阅读:493来源:国知局
专利名称:一种超声波辅助麦克风阵列语音增强装置的制作方法
技术领域
本发明涉及一种语音信号处理,尤其是涉及一种超声波辅助麦克风阵列语音增强
>J-U ρ α装直。
背景技术
在语音识别、声纹识别、视频会议等语音采集处理系统中,由于受到混响和背景噪声干扰,麦克风接收到的信号通常为带噪语音。这样不仅影响语音的可懂度,而且影响语音 处理系统的整体性能。因此需要对带噪语音进行增强处理。在复杂的声学环境下,单麦克风语音增强已无法满足需求。麦克风阵列可对不同方向上的信号形成不同响应,也即阵列的空间指向特性。当语音和周围环境信息被多个麦克风聚集时,麦克风阵列可以在期望的方向上有效地形成一个波束去拾取波束内的信号,并消除波束外的噪声,从而达到同时提取声源和抑制噪声的目的。传统波束形成就是通过时间延迟补偿,使注视方向与所需加强的语音信号的方向一致,由此实现对其它方向上干扰噪声的消除,从而取得明显的消噪效果。利用麦克风阵列进行语音增强,是通过阵列在期望声源方向形成波束来实现的,因此,获取声源的位置或者方位是麦克风阵列语音增强技术的前提条件。基于麦克风阵列的声源定位和语音增强技术是密切相关的,位置估计是进行波束形成的依据,是麦克风阵列语音增强的基础,也直接影响其语音增强性能。常用的麦克风阵列定位技术在实际应用中存在种种问题,严重制约麦克风阵列语音增强算法的性能。如基于到达时间差(time difference of arrival, TDOA)的定位技术在室内严重混响条件下精度严重下降;基于高分辨率谱估计的定位方法由于需要在全空间进行解搜索运算量极大,且其处理方向性干扰的效果不佳。同时,由于需要先进行声源定位运算,然后再进行麦克风阵列语音增强处理,当声源处于运动状态时,采用声源定位算法进行麦克风阵列语音增强的传统处理方法将导致声源定位滞后,从而造成语音增强效果不理
本巨
ο如麦克风阵列语音增强中常用的“广义旁瓣对消器”(GSC,Generalizedsidelobe canceller)(参见文献L. J. Griffiths, C. W. Jim. An alternative approach tolinearly constrained adaptive beamforming. IEEE Transactions on Antennas andPropagation. January, 1982,30, 27-34)利用一个对准声源方向的固定波束通路和具有阻塞矩阵和对消器的自适应通路实现信号中的干扰抵消,但其使用前提是必须首先获取说话人的方位。中国专利ZL 200510105526. 7提出一种使用噪声降低的多通道自适应语音信号处理方法,该方法通过对GSC的固定波束通路增加一个自适应处理器改善信号通道的信噪t匕。但该方法仍然需要借助频域时延估计来补偿各通道时延,以使得波束对准声源方向,这使得该方法在室内混响条件影响时延估计精度的条件下性能将明显下降。中国专利ZL 200510086876. 3提出一种小尺度麦克风阵列语音增强系统和方法,该方法采用声源位置自适应处理通过调节麦克风阵列的指向性获得不同方向增益最大的接收信号,从而获取声源位置范围使信号增强方向对准声源。但该方法由于需要通过调节阵列指向来进行波束对准,使得方位信息的获取仍然存在一个滞后,对移动的声源同样无法获得实时方位信息。中国专利ZL200410002739. 2提出一种结合定位技术的麦克风阵列收音方法及其系统,通过结合麦克风阵列获取的声波信号和数码摄像机获取的目标声源画面来技术声源方位,由于还需借助图像搜索算法判断数码摄像机获得画面中目标音源的大小及方位来计算,系统定位处理的运算量大且性能将受光照条件等的影响。中国专利201110142759. X提出一种麦克风阵列语音波束形成方法、语音信号处理装置及系统,采用先将各通道语音信号转换到频域,然后进行广义相关分析获取各通道相对时延,并据此进行各通道时延补偿、加权叠加。由于采用的仍然是各通道语音信号间的频域相关,在存在严重混响等条件时时延估计精度将显著下降,从而影响了时延补偿加权叠加语音增强的性能
发明内容
本发明的目的在于提供一种超声波辅助麦克风阵列语音增强装置。本发明设有5元麦克风组成的等间距线阵、前置放大电路、模数转换电路、第I超声波传感器、第2超声波传感器、超声波发射电路、超声波接收电路、方位计算模块、加权叠加模块;5元麦克风组成的等间距线阵用于进行语音信号多通道采集,5元麦克风组成的等间距线阵采集的语音信号输出端依次接前置放大电路、模数转换电路、数据线和加权叠加模块;第I超声波传感器和第2超声波传感器安装在5元麦克风组成的等间距线阵两端延长线上,超声波发射电路和超声波接收电路利用第I超声波传感器和第2超声波传感器分别进行超声波信号发射,并对接收到的超声波信号经过前置放大电路、模数转换电路后通过数据线送入方位计算模块;方位计算模块获取第I超声波传感器和第2超声波传感器的回波接收信号进行匹配滤波获取目标至第I超声波传感器和第2超声波传感器的超声波渡越时间(T0F,time of flight)信息,获取的声源方位信息输入至加权叠加模块,根据超声波获得的声源方位信息计算各通道时延补偿值,并据此对麦克风阵列各通道接收信号进行时延补偿、叠加以增强声源方向语音信号。采用本发明实现语音增强功能的方法包括超声波发射接收、声源方位估计、时延补偿值计算、加权叠加等步骤。超声波发射接收步骤利用与麦克风阵列位置固定的超声波传感器组发射超声波信号并接收回波;在声源方位估计步骤通过接收超声波回波信号并分别进行时延估计、确定说话人声源方位;在时延补偿值计算步骤获得声源方位后根据几何关系计算麦克风阵列信号各通道的时延补偿值;加权叠加步骤根据各通道时延补偿值对各通道进行时延补偿后进行加权叠加处理以增强语音。本发明要解决的问题是提供一种方便、实时、带超声波辅助声源定位功能的麦克风阵列语音增强装置。针对说话人识别、语音识别等麦克风阵列语音增强的情况,本发明提出采用技术成熟、使用简单方便的超声波探测手段来获取目标声源的方位信息,并将声源方位信息用于麦克风阵列语音增强算法实现语音增强。本发明实现超声波辅助麦克风阵列语音增强的具体思路为首先通过声波传感器发射检测信号,并利用超声波传感器获取说话人身上反射后返回的回波信号,据此计算声源方位;在获得声源方位信息后可换算出每个通道的时延补偿指并据此进行声源方向的时延补偿叠加,实现麦克风阵列语音增强。与现有的麦克风阵列定位与语音增强方法相比,本发明提出的超声波辅助麦克风阵列语音增强装置有两个突出的优点第一,由于采用基于回波主动探测的声源目标方位估计,因此可优化选择采用具有高时宽带宽积的宽带信号作为发射信号进行超声波探测,提高目标方位估计精度;第二,由于采用超声波回波主动探测方式而非依据语音信号的被动方位估计,对声源的估计不依赖于麦克风阵列接收的语音信号进行,因此声源方位估计和语音增强算法可同时进行,从而可实现声源方位的实时获取,使得本方案对移动声源也具有一定的跟踪能力。


图I为本发明实施例的结构组成框图。图2为本发明实施例的超声波发射及与微处理器连接电路图。图3为本发明实施例的超声波接收电路、5元麦克风阵列及与微处理器连接电路图。图4为本发明实施例的信号处理原理框图。图5为本发明实施例的超声波辅助声源方位计算、各通道时延补偿值计算原理图。
具体实施例方式为了使本发明的技术内容、特征、优点更加明显易懂,下文以本发明超声波辅助麦克风阵列语音增强装置实施例并结合附图具体说明如下参见图1,本发明实施例设有5元麦克风组成的等间距线阵I、前置放大电路2、第I模数转换电路3、第I超声波传感器4、第2超声波传感器5、第I超声波发射电路6、第2超声波发射电路7、超声波接收电路8、方位计算模块9、第2模数转换电路10和加权叠加模块11 ;5元麦克风组成的等间距线阵I用于进行语音信号多通道采集,5元麦克风组成的等间距线阵I采集的语音信号输出端依次接前置放大电路2、第I模数转换电路3、数据线和加权叠加模块11 ;第I超声波传感器4和第2超声波传感器5安装在5个麦克风组成的等间距线阵I两端延长线上,第I超声波发射电路6、第2超声波发射电路7和超声波接收电路8利用第I超声波传感器4和第2超声波传感器5分别进行超声波信号发射,并对接收到的超声波信号经过前置放大电路、第2模数转换电路10后通过数据线送入方位计算模块9 ;方位计算模块9获取第I超声波传感器4和第2超声波传感器5的回波接收信号进行匹配滤波获取目标至第I超声波传感器4和第2超声波传感器5的超声波渡越时间(TOF,timeof flight)信息,获取的声源方位信息输入至加权叠加模块11,根据超声波获得的声源方位信息计算各通道时延补偿值,并据此对麦克风阵列各通道接收信号进行时延补偿、叠加以增强声源方向语音信号。本发明实施例中麦克风阵列由5个等间距排列的麦克风(m0,m2,…m4))组成线阵,阵列中各麦克风采集的语音信号进时延补偿后加权叠加形成对准声源方向的增强的信号波束,而各通道时延补偿值由图中麦克风线阵延长线两端的两个超声波传感器(Ul,u2)发射探测信号获得回波、进行声源方位估计处理后获得。具体地,5元麦克风线阵由体积小、结构简单、电声性能好的压强式驻极体麦克风micO, - ,mic4组成,NJM2100运算放大器芯片构成麦克风线阵的前置放大电路,MAXl 18模数转换芯片构成模数转换电路,在本实施例中麦克风间距d = 0. lm。超声波发射接收模块由超声波传感器和发射、接收电路组成。本实施例中超声波传感器选用T/R40-16弯曲振动超声波换能器,其中心频率为40kHz。两个超声波传感器Ul、u2发射脉冲宽度10ms、中心频率40kHz、频率范围38 42kHz的线性调频超声波探测信号,以提高回波信号的检测性能和时延估计精度(超声波发射信号的信号脉宽过大导致超声波回波探测有较大的探测盲区,因此应根据麦克风阵列声源的大概范围适当选择,本实施例中超声波发射脉冲宽度设为10ms)。同时,为了区分两个超声波传感器发射信号在目标反射 产生的回波,ul发射升调频信号,u2发射降调频信号,这样可同时通过两个超声波换能器发射信号进行回波探测获取其各自与说话人的距离。本实施例中超声波发射电路由ARM9 S3C2440微处理器通过UDA1341音频接口芯片控制压控发射电路实现超声波换能器ul、u2分别发射升、降调频信号。具体地,如图2所示分别使用S3C2440微处理器的GPB7、GPB8、GPB9端口来连接UDA1341芯片的L3M0DE、L3DATA、L3CL0CK端进行I2S总线控制,并分别在UDA1341芯片的VOUTL、VOUTR端口接出LINEOUT_L、LINEOUT_R信号输出通道,用程序中启动超声波发射后同时输出脉宽10ms,幅度从O至0. 3V的升斜变脉冲信号和幅度从0. 3V至O的降斜变脉冲信号,此升斜变脉冲信号和升斜变脉冲信号分别送入图2所示由4046芯片构成的压控振荡电路,由S3C2440的GPBlO端口输出IOms低电平使能4046芯片输出中心频率40k Hz、频率范围38 42kHz的升调频信号和降调频信号,推动超声波换能器ul,u2同时发射升调频信号和降调频信号超声波脉冲。超声波接收电路由运放NE5532前置放大电路和S3C2440微处理器的接口电路组成如图3所示,接收的超声波信号经过两级前置放大电路放大后输入8通道模数转换芯片MAX118,S3C2440微处理器通过IO 口 GPB2,3,4控制MAXl 18的输入通道端A6、A7,通过定时器输出脚TOUTO、TOUTl控制MAXl 18的读出/写入端口 WR、RD进行采样频率200ksps的模数转换,通过数据线DATAO至DATA7进行8bit模数转换结果到S3C2440微处理器的传送。本实施例中方位计算模块属于数字信号处理模块,采用ARM9 S3C2440微处理器进行软件编程实现,模数转换后的超声波接收信号在S3C2440微处理器中送入方位计算模块进行时延估计、声源方位计算。方位计算模块获取模数转换后的超声波回波信号后进行相关分析获取超声波信号从超声波换能器到说话人的渡越时间(TOF,time of flight)。本实施例中对线性调频回波信号信号采用相关分析进行高精度时延估计可采用本领域技术人员公知的方法。以下结合图4对本实施例超声波辅助麦克风阵列语音增强装置的信号处理原理进行说明如图4所示,本实施例中发射电路驱动两个超声波换能器ul,u2发射超声波信号后,两个超声波换能器ul,u2接收到在说话人a处反射返回的回波信号并通过接收电路进行放大,之后送入微处理器中利用升、降调频信号的本地拷贝与接收回波信号进行相关分析,通过TOF估计分别获取说话人至两个超声波换能器的渡越时间,乘空气中声速后可得到距离,根据这两个距离参数结合几何关系进行方位计算可计算出说话人方位;在获得说话人方位后进行时延补偿计算,根据时延补偿计算结果获得5个麦克风阵列通道对应的时延补偿值并送入各通道进行时延补偿;本实施例麦克风阵列mO,ml, m2, m3, m4总共5个麦克风接收到的信号经过接收电路后,分别进行各通道的时延补偿0,I, 2,3,4,然后通过加权叠加,最后形成对准说话人的语音波束。在图4中,根据获得的说话人方位进行时延补偿计算,然后对5个麦克风通道进行时延补偿、加权叠加和语音波束形成这部分功能被列为加权叠加模块。
本实施例麦克风阵列语音增强装置中5元麦克风线阵与微处理器的连接方式为(如图3所示):5元麦克风线阵中5个麦克风输出信号经过运算放大器构成的2级前置放大电路放大后输入多通道模数转换芯片MAXl 18,S3C2440微处理器通过IO 口 GPB2,3,4控制MAXl 18的输入通道端A1、A2、A3、A4、A5,通过定时器输出脚T0UT0、T0UT1控制MAX118的读出/写入端口 WR、RD进行采样频率16ksps的模数转换,通过数据线DATAO至DATA7进行8bit模数转换结果到S3C2440微处理器的传送。本实施例中加权叠加模块属于数字信号处理模块,采用ARM9 S3C2440微处理器进行软件编程实现,模数转换后的多通道语音信号在S3C2440微处理器中送入加权叠加模块进行波束形成处理语音增强。图4的加权叠加模块中时延补偿计算的基本原理为根据方位计算模块获得的说话人方位和麦克风阵列尺寸参数可计算出麦克风阵列各通道的时延补偿值,根据各通道时延补偿值对麦克风阵列信号进行时延补偿、加权叠加,增强语音信号方向的波束。详细描述在下面结合图5给出。在实施例的上述技术方案中,通过超声波换能器回波探测获取声源方位以及麦克风阵列各通道时延补偿值计算是本发明的关键内容,下面结合图5对此过程进行具体描述如图5所示,在本发明实施例中以5元麦克风线阵所在水平线为X轴,以线阵中间的麦克风m2位置为坐标原点建立定位坐标系,线阵各阵元间距为d,超声波换能器ul、u2距离原点的距离为L。则超声波换能器ul,u2在坐标系中的坐标分别为(_L,0)和(L,0),ul和u2分别发射线性扫频超声波信号并接收经说话人a处反射的回波信号,经过相关分析后通过相关峰位置检测可获取a点至ul,u2的距离Daul,Dau2,并由此可获得a点坐标为x _ Daui AU2 v =++DAU2 ^2l -2[
a— 4L Ja——i2由于在本实施例麦克风阵列语音增强中,可排除说话人位于麦克风阵列后方的情况,因此在消除I坐标的正负模糊后可得— Dlm -Dlvi 几=~ 2 v其方位角=arctan —;由于麦克风线阵在ul,u2的水平线上,且麦克风线阵中点m2也就是ul,u2的中心点,所以在本实施例中得到的方位角a也就是a和麦克风线阵的方位角。得到此方位角后,考虑到实施例中a处于远场范围,其发出的语音信号到达麦克风线阵时可以认为是平面入射波,则以线阵的中心阵元麦克风m2作为基准,即对m2接收的语音信号不作时延补偿,对线阵中各个通道麦克风接收的语音信号SiGO可根据方位角进行如下时延补偿计算(如图5所示)
权利要求
1.一种超声波辅助麦克风阵列语音增强装置,其特征在于设有5元麦克风组成的等间距线阵、前置放大电路、模数转换电路、第I超声波传感器、第2超声波传感器、超声波发射电路、超声波接收电路、方位计算模块、加权叠加模块;5元麦克风组成的等间距线阵用于进行语音信号多通道采集,5元麦克风组成的等间距线阵采集的语音信号输出端依次接前置放大电路、模数转换电路、数据线和加权叠加模块;第I超声波传感器和第2超声波传感器安装在5元麦克风组成的等间距线阵两端延长线上,超声波发射电路和超声波接收电路利用第I超声波传感器和第2超声波传感器分别进行超声波信号发射,并对接收到的超声波信号经过前置放大电路、模数转换电路后通过数据线送入方位计算模块;方位计算模块获取第I超声波传感器和第2超声波传感器的回波接收信号进行匹配滤波获取目标至第I超声波传感器和第2超声波传感器的超声波渡越时间信息,获取的声源方位信息输入至加 权叠加模块,根据超声波获得的声源方位信息计算各通道时延补偿值,并据此对麦克风阵列各通道接收信号进行时延补偿、叠加以增强声源方向语音信号。
全文摘要
一种超声波辅助麦克风阵列语音增强装置,涉及一种语音信号处理。设有5元麦克风组成的等间距线阵、前置放大电路、模数转换电路、2个超声波传感器、发射电路、接收电路、方位计算模块、加权叠加模块;线阵输出端依次接前置放大电路、模数转换电路、数据线和加权叠加模块;传感器安装在线阵两端延长线上,发射、接收电路利用传感器进行信号发射,并对接收到的信号经前置放大、模数转换后送入方位计算模块;方位计算模块获取传感器的回波接收信号进行匹配滤波获取目标至传感器的超声波渡越时间信息,获取的声源方位信息输入至加权叠加模块,再计算各通道时延补偿值,对麦克风阵列各通道接收信号进行时延补偿、叠加以增强声源方向语音信号。
文档编号G10L21/02GK102800325SQ20121031921
公开日2012年11月28日 申请日期2012年8月31日 优先权日2012年8月31日
发明者童峰, 洪青阳, 周跃海 申请人:厦门大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1