基于质点振速传感器微阵列的干扰语音抑制方法及装置与流程

文档序号：26013909发布日期：2021-07-23 21:35阅读：172来源：国知局

本发明涉及一种基于质点振速传感器微阵列的干扰语音抑制方法及装置。

背景技术：

语音信号在获取的过程中会不可避免地受到环境噪声、传输媒介噪声、房间混响以及其它说话人的话音干扰，严重影响到语音拾取的质量与语音识别率。早期基于单麦克风的语音增强算法，包括谱减法、最小均方误差法、小波变换法、子空间法等算法，在抑制噪声方面取得了一些阶段性的研究成果。但在实际情况中，干扰语音来自于四面八方，且常常与目标语音信号在时间和频谱上相互交叠，再加上回波和混响的影响，单麦克风增强算法抑制背景噪声和方向性语音干扰的效果有限。基于麦克风阵列的语音增强技术可以利用语音信号的空间信息形成波束，有较强的空间噪声与干扰语音抑制能力，从而获得比单麦克风更好的语音增强性能，且随着麦克风数目的增加会进一步提升性能，但受制于半波长理论限制，麦克风数量越多其孔径就越大、硬件设备也越昂贵，同时具有空域混叠与运算复杂度高等不足，极大限制了麦克风阵列的设计自由性与应用场景。

已知语音信号在时频域具有较好的稀疏性，当一段语音有多个说话人出现时，不同说话人的语音信号能量在时频域具有离散分布特性，可以近似认为只有一个说话人语音信号占支配地位，其他声源的贡献可以忽略，此性质被称为语音的时频域稀疏性。专利“cn201310726022一种基于avs和稀疏表示的单语者声源doa估计方法”基于语音信号的时频域稀疏特性，在目标语音与干扰语音同时存在时，可以同时实现目标语音与干扰语音的高精度定向。现有技术基于电子旋转方式，通过采用测得的目标语音方位角信息实现目标语音的自适应波束指向，而对干扰语音的抑制性能不足，具体如下：

质点振速传感器微阵列在进行目标语音拾取时，会同时测量到目标语音与干扰语音的声压与二维的质点振速信号：

式中x1(t),x2(t)分别为目标语音与干扰语音的声压信号，θ1,θ2分别为目标语音与干扰语音的水平方位角，以x轴正方向为0°，np(t)，nx(t)和ny(t)分别为声压与二维质点振速敏感单元接收的噪声信号。为了实现目标语音的拾取，现有技术采用电子旋转方式，通过旋转一定的角度形成组合指向性vc(t)和vs(t)。

其中

vc(t)与vs(t)仍是正交的偶极子指向性，引导方位就是vc(t)的主极大方向，也是vs(t)的指向性零点方向，通过改变值就可以改变质点振速传感器微阵列的指向性，从而实现覆盖360°全方位的波束指向。另外，基于声压p(t)、vc(t)和vs(t)还可以组合成“单边”指向性或“心形”指向性，用于实现单边语音的拾取。

这里以目标语音方位θ作为引导方位角，此时式(2)与式(4)可分别表示为：

在各向同性噪声场中，声压与二维质点振速敏感单元的输出噪声之间是相互独立的(参考文献：孙贵青,李启虎.声矢量传感器研究进展[j].声学学报.2004,29(6):7-8)，且声压通道的噪声功率3倍于质点振速通道的噪声功率。因此，声压与质点振速按声压噪声功率归一化后的相关系数矩阵：

若认为nx(t)、ny(t)的噪声功率为σ²/3，则nc(t)和np(t)的噪声功率分别为σ²/3和σ²。在不考虑干扰语音的情况下，采用“偶极子”指向与“心形”指向接收目标语音的信噪比分别为：

综上所述，基于电子旋转方式，质点振速传感器微阵列能够分别实现目标语音的“偶极子”指向与“心形”指向，指向性指数均为3，并对干扰语音起到一定的抑制效果，“偶极子”指向只能完全抑制与目标方位相差90°的强干扰语音，而“心形”指向只能完全抑制与目标方位相差180°的强干扰语音。但上述算法仅考虑了目标语音的方位，而并未考虑干扰语音的方位，无法实现最优的目标语音拾取与干扰语音抑制性能。

技术实现要素：

本发明的发明目的在于提供基于质点振速传感器微阵列的干扰语音抑制方法及装置，能够有效抑制干扰语音，获取不失真的目标语音。

基于同一发明构思，本发明具有两个独立的技术方案：

1、一种基于质点振速传感器微阵列的干扰语音抑制方法，其特征在于，包括如下步骤：

步骤1：基于质点振速传感器微阵列获取语音信号；

步骤2：检测获得目标语音方位角θ1与干扰语音方位角θ2；

步骤3：基于目标语音方位角θ1，对所述语音信号进行电子旋转，获得电子旋转后的语音信号；

步骤4：基于加权矩阵、干扰语音方位角θ2和所述电子旋转后的语音信号，进行干扰语音自适应抑制计算，输出干扰语音自适应抑制后的语音信号。

进一步地，所述质点振速传感器微阵列包括1通道的x轴质点振速敏感单元、1通道的y轴质点振速敏感单元和1通道的声压敏感单元，所述x轴质点振速敏感单元、y轴质点振速敏感单元整体呈十字形分布，所述声压敏感单元位于所述十字形的中心位置。。

进一步地，步骤2中，基于语音信号的时频域稀疏特性，实现目标语音与干扰语音的定向，获得目标语音方位角θ1与干扰语音方位角θ2。

进一步地，步骤3中，将目标语音的方位角θ1作为引导方位，通过电子旋转方式，获得电子旋转后的语音信号t，具体公式如下，

式中，np(t)、nx(t)和ny(t)分别为声压敏感单元、x轴质点振速敏感单元、y轴质点振速敏感单元接收的噪声信号，x1(t),x2(t)分别为目标语音与干扰语音的声压信号；p(t)为声压敏感单元接收的声压信号，vc(t)、vs(t)分别为x轴质点振速敏感单元、y轴质点振速敏感单元接收信号经电子旋转后的质点振速信号。

进一步地，步骤4中，通过如下公式进行干扰语音自适应抑制计算，

式中，

α1＝[110]^h；α2＝[1cos(θ2-θ1)sin(θ2-θ1)]^h

进一步地，步骤4中，所述加权矩阵k通过如下公式获得

k＝[kpkcks]^h

式中，kp、kc、ks分别为权重调节系数。

进一步地，步骤4中，进行干扰语音自适应抑制计算时，目标语音的拾取与干扰语音的抑制问题表述为有约束条件的极值问题，其数学表达式如下：

式中，pn为噪声功率，满足：

m的取值为0.3。

2、一种基于质点振速传感器的干扰语音抑制装置，其特征在于，包括：

质点振速传感器微阵列，所述质点振速传感器微阵列包括二维的质点振速敏感单元、声压敏感单元，用于获取语音信号；

干扰语音自适应抑制计算单元，用于执行权利要求1所述的方法。

进一步地，所述质点振速传感器微阵列包括1通道的x轴质点振速敏感单元、1通道的y轴质点振速敏感单元和1通道的声压敏感单元，所述x轴质点振速敏感单元、y轴质点振速敏感单元整体呈十字形分布，所述声压敏感单元位于所述十字形的中心位置。

本发明具有的有益效果：

本发明基于质点振速传感器微阵列获取语音信号；检测获得目标语音方位角θ1与干扰语音方位角θ2；基于目标语音方位角θ1对所述语音信号进行电子旋转，基于加权矩阵、干扰语音方位角θ2和所述电子旋转后的语音信号，进行干扰语音自适应抑制计算，输出干扰语音自适应抑制后的语音信号。现有技术仅考虑了目标语音方位，而并未考虑干扰语音方位，导致干扰语音抑制能力不足的问题，本发明基于测得的目标语音与干扰语音方位角，对质点振速传感器微阵列声压p与组合指向性vc(t)与vs(t)赋予不同的权重系数，根据最小噪声功率输出准则，通过调节权重系数并采用线性运算，实现干扰语音的自适应抑制，同时保证获取得到的目标语音不失真。

本发明质点振速传感器微阵列包括1通道的x轴质点振速敏感单元、1通道的y轴质点振速敏感单元和1通道的声压敏感单元，所述x轴质点振速敏感单元、y轴质点振速敏感单元整体呈十字形分布，所述声压敏感单元位于所述十字形的中心位置。本发明通过上述质点振速传感器微阵列结构，声源定向精度高，进一步保证对声场的声压分量、质点振速分量测量准确性，进而保证输出的目标语音信号质量。

本发明通过如下公式进行干扰语音自适应抑制计算，输出加权后的语音信号，

式中，

α1＝[110]^h；α2＝[1cos(θ2-θ1)sin(θ2-θ1)]^h

目标语音的拾取与干扰语音的抑制问题表述为有约束条件的极值问题，其数学表达式如下：

式中，pn为噪声功率，满足：

m的取值为0.3。

本发明根据最小噪声功率输出准则，通过调节权重系数并采用线性运算，从而保证获取得到的目标语音不失真。

附图说明

图1是本发明基于质点振速传感器微阵列的干扰语音抑制方法流程图。

具体实施方式

下面结合附图所示的实施方式对本发明进行详细说明，但应当说明的是，这些实施方式并非对本发明的限制，本领域普通技术人员根据这些实施方式所作的功能、方法、或者结构上的等效变换或替代，均属于本发明的保护范围之内。

实施例一：

基于质点振速传感器微阵列的干扰语音抑制方法

如图1所示，基于质点振速传感器微阵列的干扰语音抑制方法，包括如下步骤：

步骤1：基于质点振速传感器微阵列获取语音信号。

所述质点振速传感器微阵列包括所述质点振速传感器微阵列包括1通道的x轴质点振速敏感单元、1通道的y轴质点振速敏感单元和1通道的声压敏感单元，所述x轴质点振速敏感单元、y轴质点振速敏感单元整体呈十字形分布，所述声压敏感单元位于所述十字形的中心位置。

步骤2：检测获得目标语音方位角θ1与干扰语音方位角θ2。

基于语音信号的时频域稀疏特性，实现目标语音与干扰语音的定向，获得目标语音方位角θ1与干扰语音方位角θ2。

步骤3：基于目标语音方位角θ1，对所述语音信号进行电子旋转，获得电子旋转后的语音信号。

将目标语音的方位角θ1作为引导方位，通过电子旋转方式，获得电子旋转后的语音信号t，具体公式如下，

步骤4：基于加权矩阵、干扰语音方位角θ2和所述电子旋转后的语音信号，进行干扰语音自适应抑制计算，输出干扰语音自适应抑制后的语音信号。

所述加权矩阵k通过如下公式获得

k＝[kpkcks]^h

式中，kp、kc、ks分别为权重调节系数，与声压信号p(t)、质点振速信号vc(t)、vs(t)分别对应。

通过如下公式进行干扰语音自适应抑制计算，

式中，

α1＝[110]^h；α2＝[1cos(θ2-θ1)sin(θ2-θ1)]^h

目标语音的拾取与干扰语音的抑制问题表述为有约束条件的极值问题，其数学表达式如下：

式中，pn为噪声功率，满足：

m的取值为0.3。

m的取值由|θ1-θ2|的大小决定，这里给出具体的实施例：当m＝0时，|θ1-θ2|在(70°，290°)范围内取值可以在不降低目标语音信噪比的情况下实现干扰语音的完全抑制，而在|θ1-θ2|＜70°或|θ1-θ2|＞290°范围内取值时尽管可以完全抑制干扰语音，但会降低目标语音的信噪比，这就不可避免地降低了算法的适用角度范围。为进一步扩大算法的适用角度范围，可以适当增加m的取值，本实施例中m＝0.3，调节权重系数使得算法在抑制干扰与降低信噪比之间达到最优，完成干扰语音的自适应抑制。

实施例二：

基于质点振速传感器的干扰语音抑制装置

包括：

质点振速传感器微阵列，所述质点振速传感器微阵列包括质点振速传感器微阵列，所述质点振速传感器微阵列包括二维的质点振速敏感单元、声压敏感单元，用于获取语音信号；

干扰语音自适应抑制计算单元，用于执行上述的方法。所述质点振速传感器微阵列包括1通道的x轴质点振速敏感单元、1通道的y轴质点振速敏感单元和1通道的声压敏感单元，所述x轴质点振速敏感单元、y轴质点振速敏感单元整体呈十字形分布，所述声压敏感单元位于所述十字形的中心位置。

上文所列出的一系列的详细说明仅仅是针对本发明的可行性实施方式的具体说明，它们并非用以限制本发明的保护范围，凡未脱离本发明技艺精神所作的等效实施方式或变更均应包含在本发明的保护范围之内。

对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李光;刘云飞;周瑜;王笑楠
技术所有人：中国电子科技集团公司第三研究所
我是此专利的发明人

上一篇：用户终端的制作方法
上一篇：一种重组嗜麦芽寡养单胞菌及其在降解多环芳烃废水中的应用的制作方法