一种声源定位系统的制作方法

文档序号:25492274发布日期:2021-06-15 21:58阅读:245来源:国知局
一种声源定位系统的制作方法

本发明涉及定位技术领域,具体涉及一种声源定位系统。



背景技术:

在日常生活中,我们的耳朵会听到各种声音并进行识别定位,即所谓的“听声辩位”。人耳的原始声音定位的定位精度非常有限,无法确定声源的精确距离、角度和分贝等。现代工业化社会的生产生活中,很多场景的声源定位问题,人耳已经无法满足要求。因此我们需要借助传感器、数据采集、信号处理等技术帮我们解决这些人们日常生活中无法解决的问题。

随着计算机行业不断更新迭代,近年来语音处理的声源定位技术已成为全球众多公司和研究机构新的研究热点,甚至已经开发了新的用于大型会议语音增强和滤波技术的产品。还有在强噪声环境下语音采集的声源定位技术,语音识别和说话人识别软件处理,大型网站的会议记录和助听器等。这些产品应用于各种实际的社会生活场合,已经显示出巨大的优势和市场潜力。这也说明了该系统具有非常广阔的应用前景和实际意义。

但是,现阶段的声源定位技术一般根据声源的远近划分为远场和近场,进而根据远场或近场的不同特性采用不同算法的进行声源定位。因此,亟需一种系统既可以适用于远场也可以适用于近场的声源定位技术,以适应不同的多种场合。



技术实现要素:

本发明提供一种声源定位系统,用以解决现有技术需要根据远场和近场的不同特性进行不同算法的计算以进行声源定位的技术问题。

本发明提供一种声源定位系统,该系统包括:传声器阵列、信号采集装置、远场装置和近场装置,所述传声器阵列包括至少两个传声器;

所述信号采集装置将从所述传声器阵列采集到的信号分别传输至所述远场装置和近场装置;

所述远场装置根据接收到的信号输出功率确定出所要定位的声源的位置或区域;

所述近场装置根据声源到达所述传声器阵列中的每个传声器的时间差,以及所述传声器阵列的空间位置,确定出所要定位的声源位置或区域。

可选的,所述远场装置通过调节接收到的信号的输出功率,将输出功率最大值对应的位置或区域确定为所要定位的声源的位置或区域。

可选的,所述调节接收到的信号的输出功率包括:

将接收到的信号进行加权求和形成波束,搜索声源的可能位置来引导所述波束,修改权值以调节所述信号的输出功率。

所述远场装置通过对信号进行加权求和获得相应的输出功率,遍历所要定位的声源空间,确定声源空间中每个平面声压分布,根据所述声压分布确定出所要定位的声源的位置或区域。

可选的,所述遍历所要定位的声源空间,确定声源空间中每个平面的声压分布,包括:

将所要定位的声源空间的每个平面进行网格划分,通过每个网格点的延时时间对各个传声器进行时间域延时,最终将所有时间域延时进行求和,获得每个网格的声压及相对声压,根据所述声压及相对声压确定每个平面的声压分布。

可选的,所述传声器装置包括两个传声器,所述传声器包括麦克风。

可选的,还包括信号处理装置,所述信号处理装置接收所述信号采集装置的输出信号,对所述输出信号进行降噪处理,将处理后的所述信号分别传输至所述远场装置和近场装置。

可选的,还包括信号判断装置,所述信号判断装置接收所述信号采集装置的输出信号,判断接收的信号是否为噪声信号,若为噪声信号,则将所述噪声信号传输至所述远场装置和近场装置;否则,将所述输出信号传输至所述信号处理装置。

可选的,所述信号判断装置包括信号分析装置、比对装置和指令下达装置;

所述信号分析装置对接收的信号进行震动频率的分析,确定所述信号的频率;

比对装置是根据所述信号分析装置确定的频率在历史频率数据库中做比对,遍历所述历史频率数据库中的噪声数据库;判断该频率是否属于噪声数据库中的噪音频率;

指令下达装置根据比对装置的比对结果,若属于噪声信号,则将接收到的信号下达指令传输至所述远场装置和近场装置,将该频率记录入历史频率数据库中的噪声数据库中;

若不属于噪声信号,则将接收到的信号下达指令传输至所述信号处理装置。

可选的,所述对所述输出信号进行降噪处理,采用自适应滤波器进行降噪处理,处理方式如下:

所述自适应滤波器的滤波输出为:

y(k)=wt(k)x(k)

其中,w(k)=[w0(k)w1(k)w2(k)...wi(k)]t,所述wt(k)为滤波器系数矩阵,所述x(k)为输入信号矩阵,y(k)输出信号矩阵;

所述自适应滤波器的稳态误差为:

e(k)=d(k)-y(k)

其中,所述d(k)为噪声信号矩阵,e(k)为稳态误差矩阵;

通过所述自适应滤波器的稳态误差的均方值及权系数更新公式进行计算,确定滤波器权系数为:

f(k+1)=f(k)+α(k)(e(k)+ej(k))*(e(k)-ej(k))

其中,f(k)为滤波器的权系数,f(k+1)为更新后的滤波器的权系数;α(k)(e(k)+ej(k))*(e(k)-ej(k))为滤波器的校正因子;ej(k)为最优滤波器阶数对应的稳态误差,α(k)为步长;

进一步,根据滤波器权系数、稳态误差的均方值及步长的关系,对均方值之差(e(k)+ej(k))*(e(k)-ej(k))进行递归运算,确定步长:

p(k)=p(k-1)β+(e(k)+ej(k))*γ*(e(k)-ej(k))

其中,β和γ为调整参数;p(k)为递归函数。

采用本发明提供的技术方案可以产生的有益效果为:由于本系统同时采用了时差分析技术和声压分析技术,因此可以适应于远场以及近场的应用,具有非常高的通用性,可以运用在不同场合的产品中。并且该系统具有高抗噪性、高可靠性、运算量小等特点。总之,本发明提供的声源定位系统可以有效提高声源定位的精度,降低声源定位的算法复杂度。

本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。

附图说明

附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:

图1为本发明实施例中一种声源定位系统的结构示意图;

图2是本发明实施例中声源入射角度的示意图;

图3是本发明实施例中波束叠加的示意图;

图4是本发明实施例中不同入射角下的波束强度的示意图;

图5是本发明实施例中时间差定位技术的应用示意图。

图6是本发明实施例中另一种的声源定位系统的结构示意图。

具体实施方式

以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。

实施例1:

本发明实施例提供了一种声源定位系统,如图1所示,该声源定位系统包括:传声器阵列、信号采集装置、远场装置和近场装置,所述传声器阵列包括至少两个传声器。

所述信号采集装置将从所述传声器阵列采集到的信号分别传输至所述远场装置和近场装置。

所述远场装置根据接收到的信号输出功率确定出所要定位的声源的位置或区域。

所述近场装置根据声源到达所述传声器阵列中的每个传声器的时间差,以及所述传声器阵列的空间位置,确定出所要定位的声源位置或区域。

上述技术方案的工作原理为:本发明实施例提供的声源定位系统所采用的技术是一种结合技术,其结合了分别适用于远场和近场的声源定位技术,也就是,本发明实施例提供的声源定位系统同时具有适用于远场声源定位技术,如波束形成技术;同时,还具有适用于近场的声源定位技术,如声达时间差技术。同时包含近场和远场两类情况,适用性更广泛。

本实施例提供的声源定位系统可以应用在很多场景,常见的如现有的语音识别场景等,通过该定位系统定位声源位置,进而可以对声音进行识别。这只是本实施例列举的其中一个常见应用场景,任何以声源定位系统为应用基础的场景均可采用本实施例提供的声源定位系统。

以下通过具体的介绍对本实施例的原理进行说明。

所述传声器阵列包含有至少两个传声器,所述传声器在传声器阵列中具有排列方式,构成传声器阵列的空间结构,其具体结构在后续文本中进行详细的介绍和说明。

所述信号采集装置是采集信号的装置,其采集的是所述传声器阵列的输出信号,本实施例主要介绍的是声源的定位,因此,此处采集的信号一般是音频信号。另外,信号采集装置会将采集到的音频信号传输至远场装置以及近场装置。

需要说明的是,所述信号采集装置可以将信号同时传输至远场装置和近场装置,也可以根据具体采集到的信号判断是应该传输至远场装置还是近场装置。

所述远场装置根据接收到的信号输出功率确定出所要定位的声源的位置或区域。

所述远场装置是适用于声源为远场的情况,远场可以假设为距离传声器足够远的声源,这样就可以把到达每个传声器的入射声波看成都是平行的。

具体的,所述远场装置采用的技术为波束形成技术,所述波束形成技术是基于最大输出功率的可控波束形成技术(beamforming),该技术的基本思想就是将各阵元采集来的信号进行加权求和形成波束,通过搜索声源的可能位置来引导该波束,修改权值可使得传声器阵列的输出信号功率最大。这种方法既能在时域中使用,也能在频域中使用,它在时域中的时间平移等价于在频域中的相位延迟。

以下通过具体的方法介绍所述波束形成技术。在该实施例中,所述传声器阵列中的传声器可以认定为传统意义上的麦克风,因为现阶段一般的收声传声器为市面上最常见的麦克风,所以,本实施例以最常见常用的麦克风为例进行说明。

图2是本发明实施例中声源入射角度的示意图,图3是本发明实施例中波束叠加的示意图。

结合图2和图3,一个声源到达每个麦克风的时间关系,假设有一个距离麦克风足够远的声源,这样就可以把到达每个麦克风的入射声波看成都是平行的,这时声源到达相应的麦克风的时间则是一致的,相反的,声源到达不同的麦克风都存在不同程度的延时,延时的多少由入射角度大小而定。显而易见的,该种情况下的声源为远场声源。

由于声源达到每个麦克风的是具有延时的,且延时的多少由入射角度大小决定,因此,根据不同的入射角度分析波束的强度。图4是本发明实施例中不同入射角下的波束强度的示意图。

具体的,从图4中可以得知,不同的入射角度,叠加出来的最终波形强度是不一样的。例如,入射角度为45度时,合成的波束信号达到最强;入射角度为0度时,合成的波束微微有点信号;入射角度为-45度时,合成的波束几乎没有信号。该结果说明:把原来没有极性的单支麦克风组装成一个阵列后,组装后的整个阵列是具有极性的,也就是在该种情况下,由多个麦克风组成的传声器阵列式具有方向性的。

通过以上的分析,可以确定每个麦克风阵列都是一个具有极性的方向阵,而这个方向阵的指向性是通过时间域算法实现的,控制不同的时间延时,则可以实现不同方向的指向。该方向阵的指向性是可控的,这相当于设置了一个空间滤波器,这样就可以把定位区域通过网格先划分出来,然后再通过每一个网格点的延时时间对应各个麦克风进行时间域延时,最终将所有时间域的延时进行求和,就可以算出每个网格的声压,并得到每个网格的相对声压,此时就可以得到该声源的全息图。该全息图即可确定出该声源存在的区域或位置,实现本实施例的声源的定位功能。

以上是对远场装置所应用的原理进行的介绍说明,以下将介绍近场装置所应用的原理。

存在远场即存在近场,在近场的情况下,上述算法并不能很准确对声源进行定位,因此,若是近场情况下,将通过近场装置对声源进行定位。

所述近场装置根据声源到达所述传声器阵列中的每个传声器的时间差,以及所述传声器阵列的空间位置,确定出所要定位的声源位置或区域。

所述近场装置采用的技术为声达时间差定位技术,又称为tdoa技术。基于时间差的声源定位方法主要分成两步进行,其一是对声源抵达麦克风的时间差值进行估计,并从中获得麦克风阵列中麦克风两两之间的声场延迟;其二是利用获取到的声场延迟,结合当前的麦克风阵列空间位置进一步确定出声源的位置。

图5是本实施例中时间差定位技术的应用示意图。

如图5中所示,点a是一个声源,点1、点2和点3分别是麦克风1、麦克风2和麦克风3,声源到其中两个麦克风的延迟时间是一个常数,确定了该常数,根据该常数可以画出相应的双曲线。并且声源到另外两个麦克风的延迟时间又是另外一个常数,同理,根据该常数可以画出相对应的另外一条双曲线。具体的,根据双曲线的性质之一:双曲线上的点到两个焦点的距离之差为常数,根据麦克风1和麦克风3之间的时间差,我们可以画出双曲线x,麦克风1和麦克风3是双曲线x的两个焦点。同样地,我们根据麦克风3和麦克风2之间的时间差可以画出曲线y,两条双曲线(双曲线x和双曲线y)相交的位置a即为所要定位的声源的具体位置。

上述技术方法的优点是计算量小,更利于实时处理。

综上,本实施例通过将两个麦克风采集来的信号进行加权求和形成波束,搜索声源的可能位置来引导该波束,修改权值使得传声器阵列的输出信号功率最大,再结合声达时间差估计,并从中获取传声器阵列中阵元间的声源延迟;再利用获取的声达时间差,加入已知的传声器阵列的空间位置进一步确定出声源的位置。由于声源的复杂性,最后确定的声源位置可能为一个具体的位置,也可能是某一个区域。由于本系统同时采用了适用于近场的时差分析技术和远场声压分析技术,因此可以适应于远场以及近场的应用,具有非常高的通用性,可以运用在不同场合的产品中,并且高抗噪性、高可靠性性、运算量小等特点。

上述技术方案的有益效果为:由于本系统同时采用了时差分析技术和声压分析技术,因此可以适应于远场以及近场的应用,具有非常高的通用性,可以运用在不同场合的产品中。并且该系统具有高抗噪性、高可靠性、运算量小等特点。总之,本实施例提供的声源定位系统可以有效提高声源定位的精度,降低声源定位的算法复杂度。

实施例2:

在实施例1的基础上,所述远场装置通过调节接收到的信号的输出功率,将输出功率最大值对应的位置或区域确定为所要定位的声源的位置或区域。

上述技术方案的工作原理为:该实施例采用的是通过最大输出功率的方式确定声源位置,当所述传声器阵列的输出功率最大时,说明其形成的波束强度最大,相应的,声源的位置就可以根据此时的状态进行确定。

上述技术方案的有益效果为:针对远场声源,可以通过该波束成形技术确定出声源的位置和区域。

实施例3:

在实施例2的基础上,所述调节接收到的信号的输出功率包括:

将接收到的信号进行加权求和形成波束,搜索声源的可能位置来引导所述波束,修改权值以调节所述信号的输出功率。

上述技术方案的工作原理为:该实施例采用的是通过最大输出功率的方式确定声源位置,当所述传声器阵列的输出功率最大时,说明其形成的波束强度最大,相应的,声源的位置就可以根据此时的状态进行确定。

所述波束形成技术是基于最大输出功率的可控波束形成技术(beamforming),也就是,当所有波的传播方向一致的时候,形成波束。该技术的基本思想就是将各阵元采集来的信号进行加权求和形成波束,通过搜索声源的可能位置来引导该波束,修改权值可使得传声器阵列的输出信号功率最大。这种方法既能在时域中使用,也能在频域中使用,它在时域中的时间平移等价于在频域中的相位延迟。

上述技术方案的有益效果为:针对远场声源,可以通过该波束成形技术确定出声源的位置和区域。

实施例4:

在实施例1的基础上,所述远场装置通过对信号进行加权求和获得相应的输出功率,遍历所要定位的声源空间,确定声源空间中每个平面声压分布,根据所述声压分布确定出所要定位的声源的位置或区域。

上述技术方案的工作原理为:波束形成技术(beamforming)通过将阵列中各个传感器所采集到的信号进行滤波、加权叠加后形成波束,扫描整个接收空间(声源平面),对一个平面的声压分布进行成像可视化。波束形成方法鲁棒性较强,不需要先验知识,使用简单直观,因此这类设备也被形象的称为声学照相机。

上述技术方案的有益效果为:通过可视化的方式展现声源的位置信息,更简单直观。

实施例5:

在实施例4的基础上,所述遍历所要定位的声源空间,确定声源空间中每个平面的声压分布,包括:

将所要定位的声源空间的每个平面进行网格划分,通过每个网格点的延时时间对各个传声器进行时间域延时,最终将所有时间域延时进行求和,获得每个网格的声压及相对声压,根据所述声压及相对声压确定每个平面的声压分布。

本实施例是对实施例4的具体实施方式的介绍和说明。

上述技术方案的工作原理为:所述将两个传声器装置输出的信号进行加权求和形成波束的具体实施方式是,每个麦克风阵列都是一个方向阵,而这个方向阵的指向性是通过时间域算法实现的,控制不同的时间延时,则可以实现不同方向的指向。该方向阵的指向性是可控的,这相当于设置了一个空间滤波器,可以把定位区域通过网格先划分出来,然后再通过每一个网格点的延时时间对各个麦克风进行时间域延时,最终把它们进行求和,就可以算出每个网格的声压,并得到每个网格的相对声压,此时就可以得到一个声源定位的全息彩图。

麦克风阵列声全息算法能够重构被测物周围的整个声场,从而可以获得任何面上的声压大小分布。假设被测物周围符合一定的声场数学模型,麦克风阵列采集到声场中多点的声压值,从而可以解出数学模型中的未知参数,得到整个声场信息。声全息算法与波束形成算法比较,最大的优势是对于低频声源,也能保持很好的分辨力。

声压值体现的是声源的位置信息,因为根据声压值,以及声压的全息图,就可以确定出产生不同声压所对应的声场的位置,也就可以确定所要定位的声源位置。

上述技术方案的有益效果为:通过可视化的方式展现声源的位置信息,更简单直观。

实施例6:

在实施例1的基础上,所述传声器装置包括两个传声器,所述传声器包括麦克风。

上述技术方案的工作原理为:一般来说麦克风阵列可以划分为规则几何形状的阵列和非常规阵列,如上图所示。规则几何形状阵列,包括线性阵列,十字形阵列,圆形阵列,螺旋形阵列等,这些都是规则几何形状的阵列类型,此外还有更为复杂的不规则阵列类型。不规则的阵列二个麦克风的位置向量方向不同,位置向量是线性无关的,从而能够很好的避免重复空间采样,抑制混叠效应,有效的减少鬼影的出现。但是不规则阵列在制造安装运输方面有着较高的成本。

一个优秀的麦克风阵列可以为算法实现带来极大的便捷性,而麦克风阵列是由一定数量的麦克风按照一定的空间几何位置排列而成的。麦克风阵列包括了麦克风的数目,阵列的孔径大小,麦克风之间的间距,麦克风的空间分布形式等重要参数;这其中又包含指向性,波束宽度,最大旁瓣级等衡量麦克风阵列性能优劣的特征参数。设计一个好的麦克风阵列,不仅需要考虑实际需求还需要考虑器材的限制以及麦克风的成本。因此理论上应该采用最少的麦克风,实现最好的识别效果。

麦克风的数量和阵列孔径决定了一个阵列实现的复杂程度。阵列的麦克风个数越多,布线方式越复杂。阵列孔径表示的是阵列在空间占据的体积,阵列孔径越大,结构实现越困难。麦克风数目还影响阵列增益。由于阵列是在噪声背景下检测信号的,阵列增益是用来描述阵列作为空间处理器所提供的信噪比改善程度。

因此,麦克风的数量决定了一个阵列实现的复杂程度。阵列的麦克风数量越多,布线方式越复杂,而且麦克风的数目还影响阵列增益,并直接影响到成本以及装配工艺。由于阵列是在噪声背景下检测信号的,阵列增益是用来描述阵列作为空间处理器所提供的信噪比改善程度。一般来说,麦克风数目和阵列增益成正比。因此综合考虑评估下来最终决定采用双麦克风的阵列结构。

上述技术方案的有益效果为:采用双麦克风的阵列结构不但在布线方式上简单,而且结构实现起来更容易简单,且可达到声源定位的效果。

实施例7:

在实施例1的基础上,还包括信号处理装置,所述信号处理装置接收所述信号采集装置的输出信号,对所述输出信号进行降噪处理,将处理后的所述信号分别传输至所述远场装置和近场装置。

上述技术方案的工作原理为:由于本实施例的声源定位系统的应用场景包括语音识别技术,在语音识别技术的场景下,则需要对声源或周围的环境噪声进行处理,因此,增加信号处理装置,以对信号采集装置采集的信号进行降噪处理,后续对信号的计算都是经过降噪处理后的信号,从而适应语音识别技术这一应用场景。

上述技术方案的有益效果为:通过降噪的处理,满足大部分环境降噪需求。

实施例8:

在实施例7的基础上,还包括信号判断装置,所述信号判断装置接收所述信号采集装置的输出信号,判断接收的信号是否为噪声信号,若为噪声信号,则将所述噪声信号传输至所述远场装置和近场装置;否则,将所述输出信号传输至所述信号处理装置。

上述技术方案的工作原理为:该实施例是对实施例7的改进和升级。通过增加信号判断装置,用于判断声源是语音信号还是噪声信号。

当要定位声源的音频信号本身为噪声信号,也就是需要定位噪声源的位置时,则需要直接将噪声信号传输至所述远场装置和近场装置。

但当定位声源的音频信号不是噪声信号,而是有规律或具有重复性的语音信号时,则需要对信号进行降噪处理,以更方便语音识别。这种情况下,则需要将信号传输至所述信号处理装置进行降噪处理。

上述技术方案的有益效果为:对声源的音频信号进行了分类处理,优化了降噪处理程序及本实施例的声源定位系统。

实施例9:

在实施例8的基础上,所述信号判断装置包括信号分析装置、比对装置和指令下达装置。

所述信号分析装置对接收的信号进行震动频率的分析,确定所述信号的频率。

比对装置是根据所述信号分析装置确定的频率在历史频率数据库中做比对,遍历所述历史频率数据库中的噪声数据库;判断该频率是否属于噪声数据库中的噪音频率。

指令下达装置根据比对装置的比对结果,若属于噪声信号,则将接收到的信号下达指令传输至所述远场装置和近场装置,将该频率记录入历史频率数据库中的噪声数据库中。

若不属于噪声信号,则将接收到的信号下达指令传输至所述信号处理装置。

上述技术方案的工作原理为:本实施例是对所述信号判断装置的进一步的改进。本实施例主要是为了根据声源所发出的声音属于音频信号还是噪声进行判定,并根据判定结果分别进行不同的处理。

图6是本发明实施例中另一种声源定位系统的结构示意图。

如图6所示,增加上述判断过程的原因是,语音信号在语音识别技术中是需要采集的信号,而该语音信号在传播的过程中很可能会增加噪声,而混合有噪声的信号会干扰声源的定位以及后续的语音识别,因此需要加入降噪处理的环节。而声源发出的本来就是噪声,也就是需要给噪声进行定位时,则不需要进行降噪处理,直接将接收的信号传输至所述远场装置和近场装置即可。

由于噪声和语音信号在频率上具有很大差别,因此,可以将频率作为两者的判断依据。所以,在所述信号判断装置中,首先通过所述信号分析装置对接收的信号进行震动频率的分析,确定所述信号的频率,也就是信号采集装置所采集的声源发出的信号的频率。

其次,比对装置是根据所述信号分析装置确定的频率在频率数据库中做比对,判断该频率属于语音频率还是噪音频率。所述频率数据库可以包含语音信号频率子数据库和噪声频率子数据库,在两个子数据库中判断所要比对的频率是属于语音频率还是噪声频率。

最后,指令下达装置根据比对装置的比对结果,若属于噪声信号,则将接收到的信号下达指令传输至所述远场装置和近场装置;若属于语音信号,则将接收到的信号下达指令传输至所述信号处理装置。

根据判断结果,下达不同的指令,将接收到的信号按照相应的指令进行不同方式的传输。

上述技术方案的有益效果为:本实施例通过增加信号判断装置对接收到的信号进行分析判断,以判定所要定位的声源发出的信号是语音信号还是噪声。因为根据信号的类型的不同需要对该信号进行不同方式的处理。通过上述判断区分,可以更明确该声源定位系统的应用场景,方便用户在使用应用该声源定位系统时可以更简单明了的确定其用途。当所要定位的声源发出的为语音信号时,该语音信号在传输过程中可能会混入噪声,这种情况下采用本实施例的声源定位系统对声源进行定位可能会存在定位不精确的问题,所以,需要将该语音信号进行降噪处理,一方面可以保证对声源定位的精确性,另一方面,为后续语音识别技术中采集语音信号提供便利。此外,当所要定位的声源为噪声源时,说明该声源定位系统是为了定位该噪声源。因此,本实施例提供的技术方案在用途简单明了,方便用户了解,且增加了该声源定位系统的应用场景。

实施例10:

在实施例7的基础上,所述对所述输出信号进行降噪处理,采用自适应滤波器进行降噪处理,处理方式如下:

所述自适应滤波器的滤波输出为:

y(k)=wt(k)x(k)

其中,w(k)=[w0(k)w1(k)w2(k)...wi(k)]t,所述wt(k)为滤波器系数矩阵,所述x(k)为输入信号矩阵,y(k)输出信号矩阵;

所述自适应滤波器的稳态误差为:

e(k)=d(k)-y(k)

其中,所述d(k)为噪声信号矩阵,e(k)为稳态误差矩阵;

通过所述自适应滤波器的稳态误差的均方值及权系数更新公式进行计算,确定滤波器权系数为:

f(k+1)=f(k)+α(k)(e(k)+ej(k))*(e(k)-ej(k))

其中,f(k)为滤波器的权系数,f(k+1)为更新后的滤波器的权系数;α(k)(e(k)+ej(k))*(e(k)-ej(k))为滤波器的校正因子;ej(k)为最优滤波器阶数对应的稳态误差,α(k)为步长;

进一步,根据滤波器权系数、稳态误差的均方值及步长的关系,对均方值之差(e(k)+ej(k))*(e(k)-ej(k))进行递归运算,确定步长:

p(k)=p(k-1)β+(e(k)+ej(k))*γ*(e(k)-ej(k))

其中,β和γ为调整参数;p(k)为递归函数。

上述技术方案的工作原理为:

本实施例是通过对所述自适应滤波器的参数进行计算和调整,确定出最优参数。

具体算法如下:

所述自适应滤波器的滤波输出为:

y(k)=wt(k)x(k)

其中,w(k)=[w0(n)w1(n)w2(n)...wi(n)]t,所述wt(k)为滤波器系数矩阵,所述x(k)为输入信号矩阵,y(k)输出信号矩阵;

所述自适应滤波器的稳态误差为:

e(k)=d(k)-y(k)

其中,所述d(k)为噪声信号矩阵,e(k)为稳态误差矩阵;

令所述自适应滤波器的稳态误差的均方值最小,即:

e{e(k)2}→min

另外,根据权系数更新公式:

w(k+1)=w(k)+αe(k)x(k)

其中α为步长;

对所述自适应滤波器的稳态误差的均方值根据权系数更新公式进行递归算法获得与α步长的关系式:

则:

其中,ej(k)为最优滤波器阶数对应的稳态误差;

结合s型函数与误差均方值之差(e(k)+ej(k))*(e(k)-ej(k))以减小稳态震荡及稳态误差;

进一步根据递归公式对误差均方值之差进行递归算法,确定步长:

p(k)=p(k-1)β+(e(k)+ej(k))*γ*(e(k)-ej(k))

其中,β和γ为调整参数;p(k)为递归函数。

所述s型函数为:将x变量映射到0,1之间。

上述技术方案的有益效果为:本实施例采用s型函数与递归算法相结合,可以确定出反噪声信号,将所述反噪声信号与噪声信号相互消除以实现降噪。采用自适应滤波器,通过自适应算法设置反馈回路,使得自适应滤波器在环境的改变的情况下,根据自适应算法来改变滤波器的参数和结构,以使得该滤波器可以根据输入信号、噪声信号等因素作用下随时改变参数适应不同的降噪效果。因此,本实施例的降噪方式,通过选择合适的滤波器进行不同类型的噪声处理,以增加使用该滤波器的场景,并且该滤波器的关键参数可调,通过调节所述滤波器的参数,使得该滤波器具有更好的降噪效果。通过设置降噪处理,可以增加后续语音识别的准确性,为声源定位系统的定位的精确性提供基础的数据处理,因而可提高声源定位系统定位的准确性。

另外,介绍该声源定位系统的应用场景。对于声音,尤其是噪声和异响,通常意味着产品不合格、有故障、环境突发或出乎意料。要解决这些质量、故障、事故等问题,首先需要进行噪声检测,通过声源定位技术,确定产生这些问题的位置。声源定位在很多行业都有应用需求,例如汽车、家电、航空航天等。

以汽车行业为例,汽车研发过程是一个逐渐适配优化的过程,当第一台样车上路行驶测试时,极有可能发出各种异响,例如,仪表盘材料不合格或固定方式欠佳,仪表盘在颠簸路段就有可能产生共振噪声;内饰和密封不好,发动机噪声或轮胎噪声就会泄露到车内,造成车内nvh(noise,vibrationandharshness)指标不符合研发设计目标;底盘或动力系统,工作过程中也可能产生摩擦、敲击等异响。

和汽车行业类似,需要使用声源的行业还有很多,如家电、航空航天、消费电子、重型装备等。简单来讲,只要产品里有能动或发声的部件,如风扇、轴承、喇叭等,声源定位技术的应用就很重要。在这类产品的研发过程中,使用声源定位能够大大提高工作效率,快速定位噪声源或异响位置,从而帮助工程师快速有针对性地解决问题。

另外声源定位技术还可以用在安防机器人、服务机器人、远程会议系统和语音识别等,工作过程中需要对声音进行响应的领域中。比如安防机器人听到某个方向的声音比较大时,需要将摄像头对准该方向进行录像;服务机器人需要确定说话人的方位,以便面对服务对象进行对话;远程会议系统需要确定参会发言者位置,以便控制摄像头对发言者进行特写,将其近景视频传输至远程端,达到更好的直播效果;语音识别产品结合声源定位可以有效的区分出环境噪声和人发出的声音。

显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1