基于OMAP-L137的麦克风阵列语音波束形成系统

文档序号:25863631发布日期:2021-07-13 16:21阅读:301来源:国知局
基于OMAP-L137的麦克风阵列语音波束形成系统

本发明属于数字信号处理技术领域,具体的说是涉及一种基于omap-l137的麦克风阵列语音波束形成系统。



背景技术:

智能家居是以住宅为平台,利用综合布线技术、网络通信技术、安全防范技术、自动控制技术、音视频技术将家居生活有关的设施集成,构建高效的住宅设施与家庭日程事务的管理系统,提升家居安全性、便利性、舒适性、艺术性,并实现环保节能的居住环境。随着5g时代的的到来,智能家居行业快速发展,为了使家居能够正确地接收语音指令,通常会采用能够在实时环境中提高各种噪声条件下语音的质量和清晰度的语音增强技术。

与单通道语音增强技术相比,基于麦克风阵列的语音增强方法不仅提高了语音质量,而且提高了语音的可懂度。麦克风阵列可以作为一个方向感测元件,附加信号处理称为波束形成,波束形成的实质是对各阵元接收到的数据进行空域滤波,从而使阵列输出形成空间指向性,达到增强所需的期望信号、抑制干扰和噪声的目的。

zl2019107855554公开了一种基于麦克风阵列波束形成算法的语音处理系统,该系统采用了语音采集终端与语音处理平台的音频扩展口通信互联,圆形麦克风板实时采集嘈杂环境下的语音信号,并通过mcasp接口将数字流传输给开发板,随后音频处理模块对音频扩展口接收到数字信号进行混响去除、语音增强处理,处理后的信号通过网络接口传输给pc端主机。虽然该处理系统提高了提取清晰语音的能力,改善了通信质量。但是目前的语音处理系统在使用过程中容易受网线限制、只能近距离传输,不利于连接,且无论是在语音采集以及语音处理过程中成本比较高。



技术实现要素:

为了解决上述问题,本发明提供了一种基于omap-l137的麦克风阵列语音波束形成系统,该系统对采集到的语音信号进行语音增强处理,不受网线限制且可以远距离传输,连接灵活。

为了达到上述目的,本发明是通过以下技术方案实现的:

本发明是一种基于omap-l137的麦克风阵列语音波束形成系统,该系统包括语音采集模块和语音处理平台,语音采集模块和语音处理平台中的音频扩展口通信互联,该系统还包括语音输出模块,语音输出模块包括蓝牙传输模块和蓝牙音箱,语音采集模块采用4通道线性麦克风阵列板pcm1864lmbevm,在所述线性麦克风阵列板上设置有作为控制核心的高度集成的高性能的音频模数转换器pcm1864和四个麦克风,线性麦克风阵列板用一个所述音频模数转换器与四个麦克风阵列连接,语音处理平台采用基于omap-l137处理器的omap-l137/tms320c6747浮点开发板,所述音频扩展口、dsp内核和音频处理模块均设在所述浮点开发板中。与以往的开发板不同,本发明的浮点开发板保留omap-l137应用处理器、音频扩展口、300mhz定点/浮点c674x的dsp内核和音频处理模块,被设计成基于omap-l137的最小系统,对接收到的语音信号进行处理,效果相同,但成本更低。

本发明的线性麦克风阵列板进行声源定位实时采集嘈杂环境下的语音信号,音频模数转换器对接收到的语音信号进行采样,将模拟语音信号转换成数字信号并通过i2s接口将数字值传输给所述音频扩展口,音频处理模块对从音频扩展口接收到数字信号应用波束形成算法放大来自所需方向的语音信号,并衰减来自其他所有方向的信号,并利用混响消除技术消除混响和回声,处理后的信号通过所述蓝牙传输模块传输给蓝牙音箱。

本发明的进一步改进在于:四个麦克风安装在同一条线上,每相邻的两个所述麦克风之间间距相等。

本发明的进一步改进在于:浮点开发板中设有基于dsp内核的低功耗数字信号处理器,dsp内核采用基于两级高速缓存的架构,一级程序高速缓存(l1p)是32kb的直接映射高速缓存,一级数据高速缓存(l1d)是32kb的双向集合关联高速缓存,二级程序缓存(l2p)由程序和数据空间共享的256kb内存空间组成。

本发明的进一步改进在于:所述声源定位算法为music算法,分解任意阵列输出数据的协方差矩阵,得到信号子空间和噪声子空间,然后利用这两个子空间的正交性来估计信号的入射方向,该music算法用频率和角度分量的去耦在频域中执行平滑操作,这增加了信号互谱矩阵的秩,并使得高分辨率doa估计子空间算法的实现成为可能,doa和源定位的差异都取决于两个独立的部分,一个部分仅取决于信号,另一个部分仅取决于阵列的几何形状。均匀间隔的线性阵列为良好的整体性能提供很好的几何形状。

本发明的进一步改进在于:波束形成算法为改进的gsc波束形成方法,所述gsc波束形成方法基于信号输出功率比(spr)自适应更新滤波器系数,重写fbf输出功率,fbf的功率根据k=32到k=256的频率指数的平均值计算,公式如下:

其中,αs是一个经验选择的平滑参数,pf_o(k,l)是fbf波束形成器的输出信号,采用平滑运算减少了对弱语音的误判,从而减轻了期望信号的语音失真,所有帧中的fbf输出功率表示为

本发明的进一步改进在于:本发明的音频扩展口选用型号为qse-040-01-l-d-a的转接口,能更稳定地传输数据。

本发明的进一步改进在于:本发明的音频处理模块选用型号为tvl320aic3106的音频编解码器。

本发明的进一步改进在于:衰减来自其他所有方向的信号的采用的是混响消除技术,该技术采用集成了多通道线性预测(mclp)和gsc的集成旁瓣消除和线性预测(isclp)卡尔曼滤波器,此处,旁瓣消除(sc)滤波器和线性预测(lp)滤波器并行运行,但在不同的输入数据帧上运行,并且被联合估计。

使用mclp模型描述后期混响,作为过去l帧中d的延迟预测表示如下:

其中,wr,l(n)表示mclp系数,l>d>1;

旁瓣消除分支由下式给出:

usc(n)=bh(n)y(n)

其中,bh(n)是一个分块矩阵且bh(n)g(n)=0

线性预测框架的输出信号表示如下:

其中,wg是固定的波束形成器系数,wsc(n)是用于消除噪声的旁瓣消除滤波器,wlp(n)是预测gsc输出处混响的多通道线性预测系数。

本发明的有益效果是:本发明的波束形成系统在技术上提高了嘈杂环境中提取清晰语音的能力,改善了通信质量,并且语音信号传输过程不受网线限制,可以远距离传输,连接更加灵活,成本更加低廉。

本发明具有结构简单、实用方便、能耗低的优势。

附图说明

图1是本发明的总体结构框图。

图2是本发明线性麦克风阵列板的结构框图。

图3是本发明两个麦克风间的距离和相位差作为信号到达角度的函数。

图4是本发明四个麦克风多角度波束形成系统框图。

具体实施方式

以下将以图式揭露本发明的实施方式,为明确说明起见,许多实务上的细节将在以下叙述中一并说明。然而,应了解到,这些实务上的细节不应用以限制本发明。也就是说,在本发明的部分实施方式中,这些实务上的细节是非必要的。

本发明是一种基于omap-l137的麦克风阵列语音波束形成系统,该系统包括语音采集模块1、语音处理平台2和语音输出模块3的蓝牙传输模块和蓝牙音箱,蓝牙传输模块选用型号为bt201蓝牙模块,该语音采集模块1采用4通道线性麦克风阵列板pcm1864lmbevm,在所述线性麦克风阵列板上设置有作为控制核心的高度集成的高性能的音频模数转换器pcm1864和四个麦克风,如图2所示,所述线性麦克风阵列板通过声源定位算法收集语音信号,然后进行模数转换,利用i2s接口向开发板提供多个数据输入的流式传输。

其中,pcm1864是高度集成的高性能模数转换器,具有四个单声道adc通道和103dbsnr,用以将模拟信号转换成数字信号进行传输。

如图3所示,两个麦克风间的距离和相位差作为信号到达角度的函数,mic1和mic2之间的信号时间差δt为

mic1和mic2之间的相位差δθ为

其中:f是信号频率,α是到达角度,c是声速,d为两个麦克风之间的距离。

从公式(2)很明显可以看出,噪声降低的质量取决于噪声频率,虽然波束成形滤波器被设计为降低来自典型中频段和更高频率的噪声,但是低频噪声不会被降低,因此,在本系统应用自适应asnr滤波器来降低低频噪声的影响。

如图4所示,本系统使用波束形成、自适应频谱降噪(asnr)、多源选择(mss)和动态范围压缩(drc)组合,来进一步提高降噪的质量,并将aec和volib结合,来满足其降噪处理的需求。

本发明的工作过程是:上电后,线性麦克风阵列板上的麦克风开始采集语音信号,模数转换模块pcm1864将采集到的模拟信号转换成数字信号,然后通过omap-l137开发板的i2s接口将数字值传输到omap-l137开发板的音频扩展口,音频处理模块对接收到的语音信号应用波束形成算法即改进的gsc波束形成方法,该方法采用平滑运算减少对弱语音的误判,从而减轻了期望信号的语音失真;对经过波束成形算法处理的信号采用集成了多通道线性预测(mclp)和gsc的卡尔曼滤波器进行混响和回声消除处理;使用asnr滤波器减少低频噪声的影响;使用多源选择算法(mss)选择能量最大的虚拟方向信号,在最佳虚拟麦克风上执行vad(语音活动检测)。最后将处理好的语音信号通过蓝牙连接模块传输给蓝牙音箱。

本发明的工作原理是:所述线性麦克风阵列板进行声源定位实时采集嘈杂环境下的语音信号,音频模数转换器对接受到的语音信号进行采样,将模拟语音信号转换成数字信号并通过i2s接口4将数字值传输给所述音频扩展口5,所述音频处理模块7对从音频扩展口5接收到数字信号应用波束形成算法形成虚拟定向麦克风,放大来自所需方向的语音信号,并衰减来自其他所有方向的信号,使用asnr滤波器减少低频噪声的影响;使用多源选择算法(mss)选择能量最大的虚拟方向信号,在最佳虚拟麦克风上执行vad即语音活动检测,处理后的信号通过所述蓝牙连接传输模块传输给蓝牙音箱。

本系统不仅价格适中,调试方便,而且可以对语音信号进行实时的处理,增强语音信号,滤除噪声并抑制混响。

以上所述仅为本发明的实施方式而已,并不用于限制本发明。对于本领域技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原理的内所作的任何修改、等同替换、改进等,均应包括在本发明的权利要求范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1