基于圆形麦克风阵列波束形成的回声抵消设计方法与流程

文档序号:15739258发布日期:2018-10-23 22:00阅读:1455来源:国知局

本发明属于语音信号处理技术领域,具体涉及一种基于圆形麦克风阵列波束形成的回声抵消设计方法,用于精确增益信号源和抑制噪声源方向的信号。



背景技术:

麦克风阵列信号处理是一种新兴的技术,现已成为语音信号处理领域的一个研究热点。单麦克风接收的信号,是由多个声源和环境噪声叠加的,很难实现各个声源的分离,这样就无法实现声源定位和分离。为了解决单麦克风的这些局限性,利用麦克风阵列进行语音处理的方法应时而生。麦克风阵列由一组按一定几何结构(常用线形、环形)摆放的麦克风组成,对采集的不同空间方向的声音信号进行空时处理,实现噪声抑制、混响去除、人声干扰抑制、声源测向、声源跟踪、阵列增益等功能,进而提高语音信号处理质量,以提高真实环境下的语音识别率。因此,研究基于麦克风阵列的回声抵消,具有重要的意义。

目前,对于麦克风阵列回声抵消的研究,主要集中于时域自适应滤波的方法改进。例如,最小均方误差LMS算法或递归最小二乘算法,后者旨在期望响应与滤波器输出之间的平方和最小。当在每次迭代中接受到输入信号的新的采样值时,采用递归形式求解最小二乘问题,使自适应滤波器的系数得到更新,期望响应与滤波器输出在最小二乘意义上最匹配。LMS滤波是一种瞬时分析方法,即在每个时刻对所有以输入信号,都要重新评估平方和,并通过调整权矢量使其达到最小。但是这种方法的性能受到输入信号影响,LMS滤波器会遇到梯度噪声放大的问题。



技术实现要素:

本发明的目的在于:针对上述已有方法的缺点,提出一种基于圆形麦克风阵列波束形成的回声抵消设计方法,用于精确增益信号源和抑制噪声源方向的信号。

为了达到上述目的,本发明所采用的技术方案是:

基于圆形麦克风阵列波束形成的回声抵消设计方法,其特征在于,所述方法包括如下步骤:

(1)根据自适应滤波器的原理,采用基于射线模型的IMAGE方法估计出房间的声场冲激响应,也就是扬声器到麦克风阵列间的空间回声路径,为后续的回声抵消提供待消除的扬声器干扰信号;

(2)扬声器播放校准音,圆形麦克风阵列根据TDOA基于时延的波达角估计方法,使圆形麦克风阵列识别到扬声器干扰源方向;

(3)根据TDOA基于时延的波达角估计方法识别到讲话人的方位,利用扬声器干扰和讲话人的方位信息,得到阵列导向矢量,然后根据导向矢量设计空域滤波器的权系数,加权得到圆形麦克风阵列的空域最优方向图,使阵列的主瓣方向指向讲话人,而扬声器干扰方向位于阵列低旁瓣,空域滤波的目的是使麦克风阵列采集讲话人的语音信号,增益信号源的同时抑制干扰源方向的信号;

(4)空域滤波切断了扬声器与麦克风阵列的声学回路,剩余的残留回声信号由时域进行处理,由于语音信号是宽带信号,所以时域上采用闭环结构的子带自适应滤波器滤波,抵消扬声器的残留回声信号。

进一步地,所述步骤(1)的具体实现过程是:如果用线性时不变系统来描述房间声场信道模型,声源信号为s(t),因此麦克风阵列接收信号x(t)可以表示为s(t)与声场信道冲激响应h(t)的卷积形式,即:

x(t)=s(t)*h(t)+n(t) (1)

其中*表示卷积运算,n(t)为噪声,信道估计的目的就是在已知s(t)和x(t)的条件下求解冲击响应h(t),在射线声场模型中,信道的冲击响应可以认为是由一系列本征声线确定的,这时冲激响应为:

其中,M是本征声线的个数,Ai和τi分别是第i个本征对应的衰减因子和传播时延。

进一步地,所述步骤(2)的实现过程是:根据阵列的几何形式,结合TDOA(基于时延估计的到达方位角估计)方法,固定声源的声音经过房间路径传播,由于麦克风阵列的几何形式,两两麦克风接收到的语音信号有一个时延,这个时延可以根据互相关函数进行求解,再对任意两两麦克风接收信号联立求解,推导出声源方位所在,可定位出扬声器校准音方位。

进一步地,所述步骤(3)的具体实现过程是:找到声源方位之后得到一组空间角信息水平方位角和垂直仰角(α,β),接着可得到阵列的空间导向矢量A,(·)H表示共轭转置;

其中,τij为i和j两两阵元接收到信号的时延,{ωij,i,j=1,2,…,N}为空域权;

对麦克风阵列的每一路语音信号进行空域加权,得到最优方向图;

阵列的方向图定义为:

p(θ)=|ωHA(θ)| (4)

不同的权向量会使不同方向上的信号有不同的响应,从而形成不同方向的空间波束,使得波束主瓣指向有效声源方向,零陷波束指向干扰声源方向;

利用最大信噪比准则来实现空域自适应滤波,阵列接收信号表示为

x(t)=xs(t)+xn(t) (5)

xs(t)为对应的有效信号部分,xn(t)为干扰和噪声部分;

则波束形成后阵列的输出为:

y(t)=ωHx(t)=ωHxs(t)+ωHxn(t)(6)

进一步地,所述步骤(4)的具体实现过程是:时域上的处理采用闭环结构的子带自适应滤波器滤波,本质是将接收到的语音信号在频率谱上分成若干子信号,在每个子带中,采用归一化最小均方自适应算法,使得子带均方误差最小;

核心的闭环结构的子带滤波器算法更新方程为:

输入信号相对于期望信号存在的延迟Δ,对延迟的补偿在闭环子带结构中至关重要;

其中,L是分析和合成滤波器组的子滤波器长度,[·]表示取整数部分。

与现有技术相比,本发明的有益效果是:本发明提出的基于圆形麦克风阵列波束形成的回声抵消设计方法,其优点在于:

(1)结合了空域波束形成与时域自适应子带滤波方法,设计得到回声抵消效果显著,提高了语音信号质量和回声消除速度。

(2)采用子带自适应滤波法实现时域滤波,可以将输入的宽带信号划分为若干个携带少量信源信号的子带信号,从而降低了系统处理的复杂度。

(3)现在主流的回声抵消系统的麦克风阵列阵元数小,平均3~5个,严格来讲无法构成圆形阵列,定位精度低,空域滤波效果差,时域上本发明采用分频子带滤波,更高效精确。

(4)具有能够零陷干扰方向和增益有效信源方向的优点,可用于对性能要求较高的远程会议系统。

附图说明

图1是本发明的实现总流程图;

图2是本发明空域滤波分布图;

图3是本发明最优方向图示意图;

图4是本发明波束形成的子流程图;

图5是本发明均匀圆阵信号方位图;

图6是本发明时域子带滤波方法示意图。

具体实施方式

为了便于本领域普通技术人员理解和实施本发明,下面结合实施例对本发明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限定本发明。

基于圆形麦克风阵列波束形成的回声抵消设计方法,主要解决现有技术无法精确增益信号源和抑制噪声源的问题。其实现过程是:

(1)根据自适应滤波器得到房间的声场冲激响应;

(2)扬声器播放校准音,设计对应的导向矢量,使圆形麦克风阵列识别到干扰源方向;

(3)根据所得导向矢量设计空域滤波器的权系数,加权得到圆形麦克风阵列的最优方向图;

(4)时域上采用闭环结构的子带自适应滤波器滤波,抵消扬声器的回音信号。

本方法首先根据扬声器放出的校准音使用凸优化方法、矩阵分解方法得到麦克风阵列的协方差矩阵,然后得到干扰信号的角度信息,设计对应的导向矢量,根据所得导向矢量设计空域滤波器的权系数,使得干扰信源方向上的权系数尽量小,以最大限度抑制采集到的干扰信号。声学回波路径的冲激响应时间很长,对一般的房间而言可达到200ms到300ms,如果采用自适应FIR滤波器,需要成千阶甚至更多才能达到模拟实际回波路径冲激响应函数的要求,所以采用子带自适应滤波法实现时域滤波,可以将输入的宽带信号划分为若干个携带少量信源信号的子带信号,从而降低了系统处理的复杂度,其具体实现步骤包括如下:

1)根据会议房间空间,确定N阵元数的均匀圆形麦克风阵列,N个阵元组成外围低采样率圆形阵列,用于计算声源方位角,单独一个高采样阵元位于圆阵中心,用于采集高质量语音信号。利用阵列接收信号与扬声器播放的校准音信号关系,自适应得出房间声场模型的冲激响应。如果用线性时不变系统来描述房间声场信道模型,发射信号s(t),接收信号x(t)可以表示为发射信号与声场信道冲激响应h(t)的卷积形式,即:

x(t)=s(t)*h(t)+n(t) (1)

其中*表示卷积运算,n(t)为噪声。信道估计的目的就是在已知s(t)和x(t)的条件下求解特定的冲击响应h(t),用于由麦克风阵列接收信号估计扬声器发出的语音信号。在射线声场模型中,信道的冲击响应可以认为是由一系列本征声线确定的,这时冲激响应为:

其中,M是本征声线的个数,Ai和τi分别是第i个本征对应的衰减因子和传播时延。

2)阵元最小间距λ为信源最大频率对应的波长。满足空间采样定率。

为了计算出声源所在方位角,在以圆阵圆点为原点的三维坐标中,任意两个阵元的坐标可以表示为Bi(xi,yi,zi),Bj(xj,yj,zj),所示是信源到达角估计的几何示意图,在三维坐标Oxyz中,s是信源到达方向,α表示水平方位角,β表示垂直仰角,均匀圆阵所有阵元位于xy平面,过其中一阵元Bi做s的垂线,交s于A点,由于此时声源为远场模型,到达麦克风阵列时为平面波,所以声波到达Bi阵元与到达原点O点的距离差为OA,由此可得Bi与O点相位差由阵列的几何关系可得出原点与任意两阵元的相位差,式8为图3推导出的信源方向与阵元几何关系:

式(9)、(10)为均匀圆形麦克风阵列中圆心阵元与第i个和第j个阵元所接收信号的相位差,转换到时域即为信号到达阵元的时延。

(i,j=1,2,3...N)

由式(9)、(10)联立最终可以确定任意两个阵元接受到的信号相位差表达式:

通过计算两两阵元接收同一信源的相位差,即可得到一组水平方位角和垂直仰角(α,β),即信源的空域信息,在本发明中,此步骤用于计算出空间中固定扬声器的方位。相位差可以通过广义互相关函数来求解。

广义互相关函数法是通过首先求出俩信号之间的互功率谱,然后在频域内给予一定的加权,以此对信号和噪音进行白化处理,从而增强信号中信噪比较高的频率成分,抑制噪声的影响,最后再反变换到时域,得到两信号之间的互相关函数,即:

Bi与Bj表示第i个和第j个麦克风接收到的语音信号时域形式。再结合图5所示几何结构,对任意三组麦克风接收信号联立求解,推导出声源方位所在,可定位出扬声器基准音方位。其中是一个与τ有关的对称函数,具有唯一峰值,通过搜索峰值对应的横坐标,可得到两信号的时延τ,式中为互功率谱密度函数,ψij(ω)为广义互相关的加权函数。

3)为了得到最优波束形成方向图,均匀圆阵的空域权系数求解方法如下:

麦克风阵列输出信号数据的数学模型:

Rx=E[x(t)xH(t)]=ARxAH+Rn (13)

Rn是噪声协方差矩阵,Rx是信号协方差矩阵,A为阵列方向矢量。(·)H表示共轭转置。空域导向矢量:

其中,τij为i和j两两阵元接收到信号的时延,{ωij,i,j=1,2,…,N}为空域权。

紧接着,所有阵元的加权输出相加后可得到阵列的输出:

其中,{·}*表示共轭。

阵列的方向图定义为:

p(θ)=|ωHA(θ)(16)

不同的权向量会使不同方向上的信号有不同的响应,从而形成不同方向的空间波束。

利用最大信噪比准则来实现空域自适应滤波,阵列接收信号表示为x(t)=xs(t)+xn(t),xs(t)为对应的有效信号部分,xn(t)为干扰和噪声部分。

则波束形成后阵列的输出为:

y(t)=ωHx(t)=ωHxs(t)+ωHxn(t) (17)

自适应加权向量ω由最大信噪比准则来求得:

其中为信号协方差矩阵,为噪声干扰协方差矩阵。使上式输出信噪比最大的最优权向量ωopt为矩阵对(RS,Rn)的最大广义特征值对应的特征向量。

例如,远场存在一个位于θ0角度的信号源,则有

得到的最大信噪比准则为式中α为与θ0无关的常数。

4)时域上的处理采用闭环结构的子带自适应滤波器滤波,本质是将接收到的语音信号在频率谱上分成若干子信号,此方法使所有子带收敛速度都会提高,而且计算复杂度也大为减少,这就在一定程度上提高了计算效率。

闭环结构的子带滤波器算法更新方程为:

输入信号相对于期望信号存在的延迟Δ,对延迟的补偿在闭环子带结构中至关重要。

L是分析和合成滤波器组的子滤波器长度,[·]表示取整数部分。

本发明麦克风阵列与扬声器方位图如图2所示。本发明麦克风阵列的性能参数如下表所示;

参照图1,本发明的实现步骤如下:

步骤1,假定两个扬声器(有二次反射)和两个讲话人,确定均匀圆阵列阵元个数为7=2*2+2+1,可得到形成波束的个数为6个。

步骤2,固定好麦克风阵列位置之后,扬声器输出特定的校准音效,用上述提供的方位角估计方法定位两个扬声器干扰和对应的四个二次反射干扰源的方位。

步骤3,利用上述自适应波束形成方法计算出干扰源方向对应的加权系数,使得方向图谱上产生四个零陷角度,以降低干扰源方向上的增益。

系统进入工作模式后,麦克风阵列开始采集现场人的语音信号,记为x(t),与识别校准音方向一样,阵列实时估计讲话人所在方位角信息,自适应波束形成更新加权系数ωij,使方向图谱的主瓣指向语音信源方向,以提高讲话人的语音信号增益。

应当理解的是,本说明书未详细阐述的部分均属于现有技术。

应当理解的是,上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1