噪音排除方法、装置、设备及可读存储介质与流程

文档序号：22112702发布日期：2020-09-04 15:15阅读：144来源：国知局

本发明涉及语音处理技术领域，尤其涉及一种噪音排除方法、装置、设备及可读存储介质。

背景技术：

在实际复杂的声学环境下，麦克风拾取的语音信息不可避免地会受到环境混响、噪声以及其他说话人的干扰，即麦克风接收信息为带噪语音，这样不仅影响语音质量，还会使许多语音处理系统的性能急剧恶化。因此，需要对麦克风拾取的语音信息进行有效的噪声抑制，减小干扰因素对语音信息的影响，以增强语音信息质量，有效地改善语音处理系统的性能。与单麦克风相比，麦克风阵列融合了语音信息的空时信息，具有灵活的波束控制、较高的空间分辨率、较高的信号增益与较强的抗干扰能力等特点，已成为智能通信系统中捕捉说话人语音、改善语音质量的重要手段。目前，麦克风阵列技术已广泛应用于车载语音系统、语音识别系统、助听器和视频会议等各种语音通信领域中。

虽然麦克风阵列计算可以提高采集的语音信息的语音质量，但是受限于麦克风阵列的麦克风数目，还是存在不同干扰源对于采集到的语音信息的干扰，导致采集的语音信息的质量依然存在一定的缺陷。

技术实现要素：

本申请的主要目的在于提供一种噪音排除方法、装置、设备及可读存储介质，旨在解决麦克风阵列中采集的语音信息受干扰源影响导致的语音质量较低的问题。

为实现上述目的，本申请提供的一种噪音排除方法，所述噪音排除方法包括以下步骤：

用麦克风阵列语音采集装置采集实时语音信息；

根据预设音源识别算法，确定所述实时语音信息中期望语音源的期望位置信息；

根据所述期望位置信息，调整所述麦克风阵列语音采集装置的语音采集范围；

根据动态调整的所述语音采集范围，继续采集和处理实时语音信息，以得到目标语音信息。

可选地，所述用麦克风阵列语音采集装置采集实时语音信息的步骤之前包括：

根据预设规则，控制所述麦克风阵列语音采集装置中各麦克风的开启状态；

记录处于开启状态的各所述麦克风的空间位置信息。

可选地，所述根据预设音源识别算法，确定所述实时语音信息中期望语音源的期望位置信息的步骤包括：

设置预设音源算法中的预设语音特征信息；

获取所述实时语音信息中与所述预设语音特征信息匹配的期望语音信息；

根据所述空间位置信息和所述期望语音信息，确定所述期望语音源的期望位置信息。

可选地，所述根据所述空间位置信息和所述期望语音信息，确定所述期望语音源的期望位置信息的步骤包括：

获取所述期望语音信息中的声压信息；

对于所述声压信息进行球傅里叶变换，得到球傅里叶信息；

根据所述球傅里叶信息和所述空间位置信息，确定所述期望语音源相对所述麦克风阵列语音采集装置中心的期望位置信息。

可选地，所述根据所述期望位置信息，调整所述麦克风阵列语音采集装置的语音采集范围的步骤包括：

若所述期望位置信息属于预设范围内，则调整所述语音采集范围为球形区域；

若所述期望位置信息不属于预设范围内，则调整所述语音采集范围为扇形区域。

可选地，所述根据动态调整的所述语音采集范围，继续采集和处理实时语音信息，以得到目标语音信息的步骤包括：

获取所述麦克风阵列语音采集装置的滤波器的预设参数；

根据所述语音采集范围和所述预设参数，获取所述麦克风阵列语音采集装置的阵列权值；

根据所述语音采集范围采集所述实时语音信息；

根据所述阵列权值处理所述实时语音信息，以得到目标语音信息。

可选地，所述根据动态调整的所述语音采集范围，继续采集和处理实时语音信息，以得到目标语音信息的步骤之后包括：

对所述目标语音信息进行重构，生成输出语音信息；

将所述输出语音信息输出到第三方处理。

本申请还提供一种噪音排除装置，所述噪音排除装置包括：

采集模块，用于用麦克风阵列语音采集装置采集实时语音信息；

确定模块，用于根据预设音源识别算法，确定所述实时语音信息中期望语音源的期望位置信息；

调整模块，用于根据所述期望位置信息，调整所述麦克风阵列语音采集装置的语音采集范围；

处理模块，用于根据动态调整的所述语音采集范围，继续采集和处理实时语音信息，以得到目标语音信息。

本申请还提供一种噪音排除设备，所述噪音排除设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的噪音排除程序，所述噪音排除程序被所述处理器执行时实现如上述的噪音排除方法的步骤。

本申请还提供一种可读存储介质，所述可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如上述的噪音排除方法的步骤。

本申请通过用麦克风阵列语音采集装置采集实时语音信息；根据预设音源识别算法，确定所述实时语音信息中期望语音源的期望位置信息；根据所述期望位置信息，调整所述麦克风阵列语音采集装置的语音采集范围；根据动态调整的所述语音采集范围，继续采集和处理实时语音信息，以得到目标语音信息。根据采集的实时语音信息确定期望语音源的期望位置信息，根据期望位置信息调整麦克风阵列的语音采集范围，减少采集到非期望语音源的语音信息，同时在采集到目标语音信息后，对于目标语音信息再次进行处理，通过采集的目标语音信息的语音质量。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本申请的实施例，并与说明书一起用于解释本申请的原理。

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，对于本领域普通技术人员而言，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例方案涉及的硬件运行环境的装置结构示意图；

图2为本申请噪音排除方法第一实施例的流程示意图；

图3为本申请噪音排除方法第三实施例中对于图2步骤s20的细化流程图；

图4为本申请噪音排除方法第五实施例中对于图2步骤s40的细化流程图；

图5为本申请噪音排除设备一实施例的系统结构示意图。

本申请目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

在后续的描述中，使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本发明的说明，其本身没有特定的意义。因此，“模块”、“部件”或“单元”可以混合地使用。

如图1所示，图1是本申请实施例方案涉及的硬件运行环境的终端结构示意图。

本申请实施例终端为噪音排除设备。

如图1所示，该终端可以包括：处理器1001，例如cpu，网络接口1004，用户接口1003，存储器1005，通信总线1002。其中，通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(display)、输入单元比如键盘(keyboard)，可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如wi-fi接口)。存储器1005可以是高速ram存储器，也可以是稳定的存储器(non-volatilememory)，例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

可选地，终端还可以包括摄像头、rf(radiofrequency，射频)电路，传感器、音频电路、wifi模块等等。其中，传感器比如光传感器、运动传感器以及其他传感器。具体地，光传感器可包括环境光传感器及接近传感器，其中，环境光传感器可根据环境光线的明暗来调节显示屏的亮度，接近传感器可在终端设备移动到耳边时，关闭显示屏和/或背光。当然，终端设备还可配置陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器，在此不再赘述。

本领域技术人员可以理解，图1中示出的终端结构并不构成对终端的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

如图1所示，作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及噪音排除程序。

在图1所示的终端中，网络接口1004主要用于连接后台服务器，与后台服务器进行数据通信；用户接口1003主要用于连接客户端(用户端)，与客户端进行数据通信；而处理器1001可以用于调用存储器1005中存储的噪音排除程序，并执行以下操作：

用麦克风阵列语音采集装置采集实时语音信息；

根据预设音源识别算法，确定所述实时语音信息中期望语音源的期望位置信息；

根据所述期望位置信息，调整所述麦克风阵列语音采集装置的语音采集范围；

根据动态调整的所述语音采集范围，继续采集和处理实时语音信息，以得到目标语音信息。

基于上述终端硬件结构，提出本申请各个实施例。

本申请提供一种噪音排除方法。

参照图2，在噪音排除方法第一实施例中，该方法包括：

步骤s10，用麦克风阵列语音采集装置采集实时语音信息；

麦克风阵列是由一定数目的声学传感器(一般是麦克风)组成，用来对声场的空间特性进行采样并处理的系统。通过麦克风阵列语音采集装置可以采集到周围的实时语音信息。麦克风阵列可以根据时域中波束形成与空间滤波器相仿的应用，分析出接收到语音信号音源的方向以及其变化。而这些分析都可以由极坐标图以波束形式来显示语音信号的强度与角度。通常，常见麦克风阵列的拓扑结构主要包括线性阵列、平面阵列和球形阵列。在以上三种阵列形式中，球麦克风阵列(由多个麦克风按照不同的分布情况布置于同一个球面上)物理结构上具有全向旋转对称性，且当空间信号源进行任意方向的旋转移动时，不影响阵列的整体输出,所以能够更好地应用于三维空间波束形成、声源定位、噪声控制以及声场空间特性分析等领域。因此，在本申请中也主要采用球麦克风阵列。

步骤s20，根据预设音源识别算法，确定所述实时语音信息中期望语音源的期望位置信息；

麦克风阵列采集的语音信息包括环境中的各种语音信息，包括期望语音源的信息、干扰源的语音信息以及期望语音源的语音信号因为混响或者其它效应产生的噪音信息，通过采集到的实时语音信息，期望语音源为我们预计采集的语音信息，一般情况下，期望语音源为特定的一个或者多个人的语音源。将采集到的实时语音信息与期望语音源的语音特征进行对比，查找期望语音源的位置信息，即确定期望语音源的语音信息是从空间中的什么位置采集得到的。

步骤s30，根据所述期望位置信息，调整所述麦克风阵列语音采集装置的语音采集范围；

根据期望语音源的期望位置信息，控制麦克风阵列语音采集装置的语音采集范围，当期望语音源与麦克风阵列语音采集装置的中心位置距离较近时，即处于进场采集状态时，控制语音采集范围为一个球形区域，该球形区域为可以将所述期望语音源包括在内的一个球，同时球的半径不能过大，这样可以确保不会采集到较远处的语音源信息，同时可以确保采集到期望语音源尽可能多的语音特征信息，当所述期望语音源距离麦克风阵列语音采集装置的中心位置较远时，则控制语音采集范围为对应的包含期望语音源的扇形区域，这样可以减少因为混响导致的其他噪音对于采集到的语音信息的影响。

步骤s40，根据动态调整的所述语音采集范围，继续采集和处理实时语音信息，以得到目标语音信息；

当根据语音采集范围采集到目标语音信息后，虽然目标语音信息中的来自干扰源的噪音信息已经相对较少，但是在采集到了相应的目标语音信息后，依然需要对于目标语音信息进行处理，进一步减少期望语音源因为麦克风阵列语音采集装置自身的结构导致的噪音问题。

在本实施例中，用麦克风阵列语音采集装置采集实时语音信息；根据预设音源识别算法，确定所述实时语音信息中期望语音源的期望位置信息；根据所述期望位置信息，调整所述麦克风阵列语音采集装置的语音采集范围；根据动态调整的所述语音采集范围，继续采集和处理实时语音信息，以得到目标语音信息。根据采集的实时语音信息确定期望语音源的期望位置信息，根据期望位置信息调整麦克风阵列的语音采集范围，减少采集到非期望语音源的语音信息，同时在采集到目标语音信息后，对于目标语音信息再次进行处理，通过采集的目标语音信息的语音质量。

进一步地，在本申请噪音排除方法上述实施例的基础上，提供噪音排除方法第二实施例，在第二实施例中，

步骤s10之前包括：

步骤a1，根据预设规则，控制所述麦克风阵列语音采集装置中各麦克风的开启状态；

目标语音信息可能是高频语音信息、低频语音信息或者具有其他特征的语音信息，同时也可能是没有什么特定特点的一般语音信息，根据不同的目标语音信息的特点，可以控制麦克风阵列语音采集装置中的各麦克风的开启状态，从而可以更好的采集到相应的语音信息，同时减少噪音对于采集到的语音信息的影响。

步骤a2，记录处于开启状态的各所述麦克风的空间位置信息；

以球麦克风阵列为例，以球的球形作为坐标原点，水平面为xoy平面，铅锤线作为z轴，建立相应的空间坐标系，同时获取各个麦克风的位置信息，将其中在本次采集实时语音信息中处于开启状态的麦克风的位置信息记录下来。

在本实施例中，控制麦克风阵列语音采集装置中麦克风的开启状态，使麦克风阵列语音采集装置能够更好地采集到期望语音源的目标语音信息，进一步减少噪音对采集的目标语音信息的影响。

进一步地，参照图2和图3，在本申请噪音排除方法上述各实施例的基础上，提供噪音排除方法第三实施例，在第三实施例中，

步骤s20包括：

步骤s21，设置预设音源算法中的预设语音特征信息；

如果期望语音源为特定的人，则相应的特定语音特征信息为对应的特定的人的语音特征信息，如对应的音高、音频、振幅等信息，如果期望语音源只是为了采集周围环境中的人声信息，则特定语音特征信息为正常人所对应的语音特征信息，从而避免采集到非人声的噪音，同时通常情况下，都是通过麦克风阵列语音采集装置采集相对应的人声信息作为目标语音信息。

步骤s22，获取所述实时语音信息中与所述特定语音特征信息匹配的期望语音信息；

获取到实时语音信息后，根据相应的实时语音信息与对应的特征语音信息进行对比，可以得到相应的实时语音信息中与特定语音特征信息匹配的期望语音信息，同时麦克风阵列语音采集装置可以记录采集的语音信息的空间位置信息，即通过采集到的实时语音信息可以判断其中不同的语音信息距离麦克风阵列语音采集装置的距离和方向角。

步骤s23，根据所述空间位置信息和所述期望语音信息，确定所述期望语音源的期望位置信息；

以具有20个阵元的球麦克风阵列为例，均匀分布的20个阵元构成特殊的几何体一正十二面体，由于正十二面体具有独特的几何特性，是由12个正五边形所组成的正多面体,所以可以精确确定各顶点的位置，不会产生位置误差，形成严谨的空间旋转对称性，有效釆集信号空间信息。同时球形为原点坐标，根据相应的正五边形的特性，可以轻松的求得各个阵元处的麦克风的位置坐标。从而再根据期望语音信息中语音的波长、频率、声压等信息确定期望语音源与采集到相应期望语音信息的麦克风的位置信息进行对比，从而得到期望语音源的期望位置信息。

其中，步骤s23包括：

步骤b1，获取所述期望语音信息中的声压信息；

声压就是大气压受到声波扰动后产生的变化，即为大气压强的余压，它相当于在大气压强上的叠加一个声波扰动引起的压强变化。在不同的距离时，检测到的相同语音源的声压信息不同，可以根据声压信息推断语音源的强度信息。

步骤b2，对于所述声压信息进行球傅里叶变换，得到球傅里叶信息；

对于麦克风阵列语音采集装置，每个阵元的麦克风都可以采集到期望语音源的声压信息，通过设置的麦克风阵列语音采集装置的采样方案确定其中的权值参数，同时获取各处于开启状态的麦克风采集得到的声压信息，同时还有各麦克风在麦克风阵列表面所处的位置信息，通过这些可以求得相应的球傅里叶变换系数，从而得到声压信息进行球傅里叶变换后的球傅里叶信息。

步骤b3，根据所述球傅里叶信息和所述空间位置信息，确定所述期望语音源相对所述麦克风阵列语音采集装置中心的期望位置信息；

利用基于球阵列的music算法和基于低频不同模式差近场期望源距离估计算法，结合声压信息的球傅里叶信息，估计出期望源相对于麦克风阵列语音采集装置中心的期望位置信息。

在本实施例中，根据采集到的实时语音信息确定期望语音信息，继而确定相应的确定期望语音源的期望位置信息。

进一步地，在本申请噪音排除方法上述各实施例的基础上，提供噪音排除方法第四实施例，在第四实施例中，

步骤s30包括：

步骤c1，若所述期望位置信息属于预设范围内，则调整所述语音采集范围为球形区域；

预设范围一般设置为以麦克风阵列语音采集装置的球心作为新的球心，以更加实际情况设定的长度作为球的半径的一个球形区域，一般半径的设置更加实际处于开启状态的麦克风的数目确定，当期望语音源位于相应的预设范围内时，语音采集范围为球形区域，该球形区域也是以麦克风阵列语音采集装置的中心为新的的球心，半径以能将期望语音源覆盖在球形区域中为标准，稍大于期望语音源到麦克风语音采集装置中心的距离即可。

步骤c2，若所述期望位置信息不属于预设范围内，则调整所述语音采集范围为扇形区域；

如果不处于预设范围中，则说明期望语音源距离麦克风阵列语音采集装置的距离较远。此时将区域设置为扇形区域，且扇形区域的等分线为麦克风阵列语音采集装置与期望语音源的连线。

在本实施例中，通过调整语音采集范围，是采集到的语音信息更加准确，减少空间中干扰源对于采集到的语音信息的干扰。

进一步地，参照图2和图4，在本申请噪音排除方法上述各实施例的基础上，提供噪音排除方法第五实施例，在第五实施例中，

步骤s40包括：

步骤s41，获取所述麦克风阵列语音采集装置的滤波器的预设参数；

根据麦克风阵列采集装置的预设参数，一般的，麦克风阵列是以径向陷波滤波器和多尔夫-切比雪夫径向滤波器进行设计，使用获取这两种滤波器采集的相关参数作为预设参数。

步骤s42，根据所述语音采集范围和所述预设参数，获取所述麦克风阵列语音采集装置的阵列权值；

根据语音采集范围中的麦克风位置和相应的预设参数，可以获取阵列权值，即阵列中每个麦克风相应的权值。

步骤s43，根据所述语音采集范围采集所述实时语音信息；

根据设定好的语音采集范围，如球形区域或者扇形区域采集相应的所述语音信息。

步骤s44，根据所述阵列权值处理所述实时语音信息，以得到目标语音信息；

采集到实时语音信息后，根据主支路和辅支路的相应阵列权值，如主支路为多尔夫-切比雪夫径向滤波器，辅支路为径向陷波滤波器。通过两个滤波器和相应的阵列权值得到相应的输出结果，将两者的时长结果综合，最终可以得到目标语音信息。

在本实施例中，采集实时语音信息后，进一步进行噪音去除处理，提升采集到的实时语音信息的语音质量。

进一步地，在本申请噪音排除方法上述各实施例的基础上，提供噪音排除方法第六实施例，在第六实施例中，

步骤s40之后包括：

步骤d1，对所述目标语音信息进行重构，生成输出语音信息；

步骤d2，将所述输出语音信息输出到第三方处理；

因为处理后的目标语音信息可能为一个个字符信息，所以需要进行重构，以使其重新变成完整的语音信息。之后可以输出给第三方进行处理，如存储，识别等。

在本实施例中，对于目标语音信息需要进行重构，重构成可以输出的输出语音信息。

此外，参照图5，本申请实施例还提出一种噪音排除装置，所述噪音排除装置包括：

采集模块，用于用麦克风阵列语音采集装置采集实时语音信息；

确定模块，用于根据预设音源识别算法，确定所述实时语音信息中期望语音源的期望位置信息；

调整模块，用于根据所述期望位置信息，调整所述麦克风阵列语音采集装置的语音采集范围；

处理模块，用于根据动态调整的所述语音采集范围，继续采集和处理实时语音信息，以得到目标语音信息。

可选地，噪音排除装置还包括：

控制模块，用于根据预设规则，控制所述麦克风阵列语音采集装置中各麦克风的开启状态；

记录模块，用于记录处于开启状态的各所述麦克风的空间位置信息。

可选地，确定模块还用于：

设置预设音源算法中的预设语音特征信息；

获取所述实时语音信息中与所述预设语音特征信息匹配的期望语音信息；

根据所述空间位置信息和所述期望语音信息，确定所述期望语音源的期望位置信息。

可选地，确定模块还用于：

获取所述期望语音信息中的声压信息；

对于所述声压信息进行球傅里叶变换，得到球傅里叶信息；

根据所述球傅里叶信息和所述空间位置信息，确定所述期望语音源相对所述麦克风阵列语音采集装置中心的期望位置信息。

可选地，调整模块还用于：

若所述期望位置信息属于预设范围内，则调整所述语音采集范围为球形区域；

若所述期望位置信息不属于预设范围内，则调整所述语音采集范围为扇形区域。

可选地，处理模块还用于：

获取所述麦克风阵列语音采集装置的滤波器的预设参数；

根据所述语音采集范围和所述预设参数，获取所述麦克风阵列语音采集装置的阵列权值；

根据所述语音采集范围采集所述实时语音信息；

根据所述阵列权值处理所述实时语音信息，以得到目标语音信息。

可选地，噪音排除装置还包括：

重构模块，用于对所述目标语音信息进行重构，生成输出语音信息；

输出模块，用于将所述输出语音信息输出到第三方处理。

本申请设备和可读存储介质(即计算机可读存储介质)的具体实施方式的拓展内容与上述噪音排除方法各实施例基本相同，在此不做赘述。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中，包括若干指令用以使得一台终端(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本发明各个实施例所述的方法。

上面结合附图对本发明的实施例进行了描述，但是本发明并不局限于上述的具体实施方式，上述的具体实施方式仅仅是示意性的，而不是限制性的，本领域的普通技术人员在本发明的启示下，在不脱离本发明宗旨和权利要求所保护的范围情况下，还可做出很多形式，这些均属于本发明的保护之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：黄族良;陈昊亮
技术所有人：广州国音智能科技有限公司
我是此专利的发明人