一种声源定位方法、系统、计算机设备及存储介质与流程

文档序号:17497162发布日期:2019-04-23 21:39阅读:232来源:国知局
一种声源定位方法、系统、计算机设备及存储介质与流程

本发明涉及语音信号处理技术领域,特别是涉及一种声源定位方法、系统、计算机设备及存储介质。



背景技术:

声源定位技术是阵列信号处理的重要技术之一,声源定位技术结合摄像机的监测技术,能够更为实时、准确地跟踪发出声音的目标物体,因此,在实际应用中有着非常重要的意义。目前,声源定位技术已在视频电话、视频会议系统、电话会议系统、监控系统、语音跟踪系统以及声呐探索系统等多个领域广泛应用。

在相关的声源定位技术中,传统的tdoa(timedelayofarrival,到达时间差)方法是最为常用的声源定位方法,该方法首先通过时延估计得到声源信号到达不同声音传感器的时间差,再通过声音传感器阵列的几何构造进行声源位置判断。该方法原理简单、计算效率高,但在较大的噪声或混响干扰下时延估计性能急剧下降,导致声源定位不准确。



技术实现要素:

本发明实施例的目的在于提供一种声源定位方法、系统、计算机设备及存储介质,以保证准确定位声源。具体技术方案如下:

第一方面,本发明实施例提供了一种声源定位方法,所述方法包括:

获取声音传感器阵列中属于第一传感器对和第二传感器对的各声音传感器接收到的声音信号,其中,所述第一传感器对与所述第二传感器对中存在一个相同的声音传感器;

根据所述第一传感器对中两个声音传感器分别接收到的声音信号,分别计算各预先划分的区域对应的第一传播功率,其中,所述预先划分的区域为对所述声音传感器阵列所处平面划分得到的具有同一原点的多个区域;

根据所述第二传感器对中两个声音传感器分别接收到的声音信号,分别计算各预先划分的区域对应的第二传播功率;

确定多个第一传播功率中的最大值对应的多个第一区域以及多个第二传播功率中的最大值对应的多个第二区域;

定位所述多个第一区域与所述多个第二区域的重合区域的方向为声源的方向。

第二方面,本发明实施例提供了一种声源定位系统,所述系统包括:

声音传感器阵列,由多个声音传感器组成,用于接收声源发出的声音信号;

声源定位模块,用于获取所述声音传感器阵列中属于第一传感器对和第二传感器对的各声音传感器接收到的声音信号,其中,所述第一传感器对与所述第二传感器对中存在一个相同的声音传感器;根据所述第一传感器对中两个声音传感器分别接收到的声音信号,分别计算各预先划分的区域对应的第一传播功率,其中,所述预先划分的区域为对所述声音传感器阵列所处平面划分得到的具有同一原点的多个区域;根据所述第二传感器对中两个声音传感器分别接收到的声音信号,分别计算各预先划分的区域对应的第二传播功率;确定多个第一传播功率中的最大值对应的多个第一区域以及多个第二传播功率中的最大值对应的多个第二区域;定位所述多个第一区域与所述多个第二区域的重合区域的方向为声源的方向;

转动控制模块,用于控制摄像头转动至所述声源的方向;

摄像头,用于转动至所述声源的方向,对所述声源进行拍摄。

第三方面,本发明实施例提供了一种计算机设备,包括所述存储器,用于存放计算机程序;

所述处理器,用于执行所述存储器上所存放的程序时,实现如第一方面所述的方法步骤。

第四方面,本发明实施例提供了一种存储介质,所述存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的方法步骤。

本发明实施例提供的一种声源定位方法、系统、计算机设备及存储介质,将声音传感器阵列中的任三个声音传感器划分为两个传感器对,每个声音传感器可以接收到声源发出的声音信号,根据各传感器对中各声音传感器接收到的声音信号,分别计算各预先划分的区域对应的第一传播功率以及第二传播功率,确定多个第一传播功率中的最大值对应的多个第一区域以及多个第二传播功率中的最大值对应的多个第二区域,最终定位多个第一区域与多个第二区域的重合区域的方向为声源的方向。预先对声音传感器阵列所处平面划分得到具有同一原点的多个区域。根据各传感器对中各声音传感器接收到的声音信号,可以通过计算得到各预先划分的区域对应的传播功率,声源所处的区域对应的传播功率最大,而噪声的传播功率往往较小,因此通过传播功率的计算,可以有效的减小噪声干扰对声源定位的影响;并且基于同一原点的区域划分,一个区域内的角度基本相同,在确定了声源在哪个区域之后,则可以准确定位出该声源,使得声源定位更准确。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例的声源定位方法的一种流程示意图;

图2为本发明实施例的对声音传感器阵列所处平面划分的示意图;

图3为本发明实施例的声源定位系统的一种结构示意图;

图4为本发明实施例的摄像机的结构示意图;

图5为本发明实施例的声源区域判断的示意图;

图6为本发明实施例的计算机设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

为了保证准确定位声源,本发明实施例提供了一种声源定位方法、系统、计算机设备及存储介质。下面,首先对本发明实施例所提供的声源定位方法进行介绍。

本发明实施例所提供的一种声源定位方法的执行主体可以为进行语音处理的计算机,也可以为与声音传感器阵列协同工作的摄像机,执行主体中至少包括可以进行语音处理的核心处理芯片,其中,核心处理芯片可以为dsp(digitalsignalprocessor,数字信号处理器)、arm(advancedreducedinstructionsetcomputermachines,精简指令集计算机微处理器)、fpga(field-programmablegatearray,现场可编程门阵列)等核心处理芯片中的任一种。实现本发明实施例所提供的一种声源定位方法的方式可以为设置于执行主体中的软件、硬件电路和逻辑电路的至少一种方式。

如图1所示,为本发明实施例所提供的一种声源定位方法,该声源定位方法可以包括如下步骤:

s101,获取声音传感器阵列中属于第一传感器对和第二传感器对的各声音传感器接收到的声音信号。

其中,第一传感器对与第二传感器对中存在一个相同的声音传感器。声音传感器阵列由大于2个的声音传感器组成,用来对声场的空间特性进行采样并处理,声音传感器可以为麦克风,也可以为声音采集电路,当然,具有声音采集功能的模块、装置均属于本实施例的保护范围,这里不再赘述。传感器对为两个声音传感器所组成的组合,本实施例中,不对声音传感器阵列中的声音传感器的总数目做限定,实现本实施例的方法步骤,可以选择声音传感器阵列中的任意三个声音传感器,这三个声音传感器组成两个传感器对,例如,从声音传感器阵列中选择第一声音传感器、第二声音传感器及第三声音传感器,第一声音传感器与第二声音传感器组成第一传感器对,第一声音传感器与第三声音传感器组成第二传感器对。由于本实施例的实现仅需声音传感器阵列中的三个声音传感器采集的声音信号,因此,为了简化系统结构、减少成本,声音传感器阵列中可以只包含三个声音传感器。

s102,根据第一传感器对中两个声音传感器分别接收到的声音信号,分别计算各预先划分的区域对应的第一传播功率。

其中,预先划分的区域为对声音传感器阵列所处平面划分得到的具有同一原点的多个区域。对声音传感器阵列所处平面进行划分,可以是在该平面中建立一坐标系,令两个传感器对中共同的声音传感器位于坐标系的原点位置,然后从坐标系的横轴开始,以原点为圆心,按照预设角度将该坐标系所处平面划分为多个扇形区域,例如图2所示,为平面划分的示意图,预设角度为10度,则可以将平面划分为36个区域;对声音传感器阵列所处平面进行划分,还可以是以两个传感器对中共同的声音传感器为原点,从其中一个传感器对的连线开始,按照预设角度将声音传感器阵列所处平面划分为多个扇形区域,为了使得能够更为准确的确定声源的位置,可以设置两个传感器对中声音传感器的连线相互垂直,例如,第一传感器对中第一声音传感器与第二声音传感器的连线垂直于第二传感器对中第一声音传感器与第三声音传感器的连线。

以图2为例,第一传感器对中第一声音传感器201和第二声音传感器202分别可以接收到声源发送的声音信号,通过声音信号的幅度、频率、传播时间等参数,可以计算得到声源至第一传感器对的传播功率,可以假设声源位于各预先划分的区域内,可以计算得到各预先划分的区域对应的第一传播功率,因此,可以得到多个第一传播功率,其中,声源实际处于的区域对应的传播功率最大。

传播功率与声音信号的幅度、频率、传播时间等参数相关,如果以时域信号进行传播功率的运算,运算较为复杂,因此,可以选择通过频域变换的方式,对第一传播功率进行计算。则s102可以包括如下步骤:

第一步,采用预设频域变换算法,将第一传感器对中各声音传感器分别接收到的声音信号变换为频域信号。

第二步,针对第一传感器对,分别获取各预先划分的区域对应的各声音传感器接收到声音信号的预设第一时间差。

第三步,根据变换后得到的频域信号以及各预设第一时间差,通过频域运算,分别确定各预先划分的区域对应的第一传播功率。

预设第一时间差为:预先设置的第一传感器对中各声音传感器接收到声音信号的时间差。预设频域变换算法可以为傅里叶变换、傅里叶级数等算法。在通过频域变换后,可以根据变化后得到的频域信号以及预设第一时间差,基于预设广义互相关关系式(1),分别确定各预先划分的区域对应的声源至第一传感器对的广义互相关关系;再基于各广义互相关关系,将各广义互相关关系确定为各预先划分的区域对应的第一传播功率。

其中,rkl(τkl(x))为预先划分的区域x对应的声源至第一传感器对的广义互相关关系,k为第一传感器对中的一声音传感器,l为第一传感器对中的另一声音传感器,τkl(x)为预先划分的区域x对应的声音传感器k和声音传感器l接收到声音信号的时间差,mk(ω)为对声音传感器k接收的声音信号进行频域变换后得到的频域信号,为对声音传感器l接收的声音信号进行频域变换后得到的频域信号的共轭信号。

s103,根据第二传感器对中两个声音传感器分别接收到的声音信号,分别计算各预先划分的区域对应的第二传播功率。

以图2为例,第二传感器对中第一声音传感器201和第三声音传感器203分别可以接收到声源发送的声音信号,通过声音信号的幅度、频率、传播时间等参数,可以计算得到声源至第二传感器对的传播功率,可以假设声源位于各预先划分的区域内,可以计算得到各预先划分的区域对应的第二传播功率,因此,可以得到多个第二传播功率,其中,声源实际处于的区域对应的传播功率最大。

传播功率与声音信号的幅度、频率、传播时间等参数相关,如果以时域信号进行传播功率的运算,运算较为复杂,因此,可以选择通过频域变换的方式,对第二传播功率进行计算。则s103可以包括如下步骤:

第一步,采用预设频域变换算法,将第二传感器对中各声音传感器分别接收到的声音信号变换为频域信号。

第二步,针对第二传感器对,分别获取各预先划分的区域对应的各声音传感器接收到声音信号的预设第二时间差。

第三步,根据变换后得到的频域信号以及各预设第二时间差,通过频域运算,分别确定各预先划分的区域对应的第二传播功率。

预设第二时间差为:预先设置的第二传感器对中各声音传感器接收到声音信号的时间差。预设频域变换算法可以为傅里叶变换、傅里叶级数等算法。在通过频域变换后,可以根据变化后得到的频域信号以及预设第二时间差,基于预设广义互相关关系式(2),分别确定各预先划分的区域对应的声源至第二传感器对的广义互相关关系;再基于各广义互相关关系,将各广义互相关关系确定为各预先划分的区域对应的第二传播功率。

其中,rmn(τmn(x))为预先划分的区域x对应的声源至第二传感器对的广义互相关关系,m为第二传感器对中的一声音传感器,n为第二传感器对中的另一声音传感器,τmn(x)为预先划分的区域x对应的声音传感器m和声音传感器n接收到声音信号的时间差,mm(ω)为对声音传感器m接收的声音信号进行频域变换后得到的频域信号,为对声音传感器n接收的声音信号进行频域变换后得到的频域信号的共轭信号。

s102与s103计算第一传播功率和第二传播功率的步骤,可以并行执行,也可以串行执行,串行执行时,不限定执行的先后顺序,即可以先计算第一传播功率、后计算第二传播功率,也可以先计算第二传播功率、后计算第一传播功率。这里不做具体限定。

s104,确定多个第一传播功率中的最大值对应的多个第一区域以及多个第二传播功率中的最大值对应的多个第二区域。

通过搜索第一传播功率中的最大值对应的第一区域,搜索出的声源可能性最大的区域只能确定是位于声音传感器阵列所处平面的某一侧,在第一传感器对的两侧可能存在两个第一传播功率最大的第一区域,同理,通过对第二区域的搜索,可能搜索出第二传感器对的两侧的两个第二传播功率最大的第二区域。例如,图2中所示的,在声源定位的过程中,先通过第一传感器对,确定声源可能性最大的区域204、205,同样通过第二传感器对,确定声源可能性最大的区域204、206。

s105,定位多个第一区域与多个第二区域的重合区域的方向为声源的方向。

同一个声源被两个传感器对确定出的位置应该是相同的,因此,两个传感器对确定出的声源可能性最大的区域一定存在重合的区域,该重合的区域即为声源所处的区域,由于一个区域内的角度变化范围较小,则可以认为同个区域方向内的角度是相同的,例如,确定出声源位于第一传感器对沿顺时针方向的第三个区域内,且每个区域的角度范围为10度,则识别出的角度可以为声源位于第一传感器对沿顺时针方向的30度方向。当然,如果需要更高的精度,可以将预设角度设置的更小,即将声音传感器阵列所处平面划分的更密,这样,得到的角度值就更为准确。

应用本实施例,将声音传感器阵列中的任三个声音传感器划分为两个传感器对,每个声音传感器可以接收到声源发出的声音信号,根据各传感器对中各声音传感器接收到的声音信号,分别计算各预先划分的区域对应的第一传播功率以及第二传播功率,确定多个第一传播功率中的最大值对应的多个第一区域以及多个第二传播功率中的最大值对应的多个第二区域,最终定位多个第一区域与多个第二区域的重合区域的方向为声源的方向。预先对声音传感器阵列所处平面划分得到具有同一原点的多个区域。根据各传感器对中各声音传感器接收到的声音信号,可以通过计算得到各预先划分的区域对应的传播功率,声源所处的区域对应的传播功率最大,而噪声的传播功率往往较小,因此通过传播功率的计算,可以有效的减小噪声干扰对声源定位的影响;并且基于同一原点的区域划分,一个区域内的角度基本相同,在确定了声源在哪个区域内之后,则可以准确定位出该声源,使得声源定位更准确。

相应于上述方法实施例,本发明实施例提供了一种声源定位系统,如图3所示,该声源定位系统可以包括:

声音传感器阵列310,由多个声音传感器组成,用于接收声源发出的声音信号;

声源定位模块320,用于获取所述声音传感器阵列310中属于第一传感器对和第二传感器对的各声音传感器接收到的声音信号,其中,所述第一传感器对与所述第二传感器对中存在一个相同的声音传感器;根据所述第一传感器对中两个声音传感器分别接收到的声音信号,分别计算各预先划分的区域对应的第一传播功率,其中,所述预先划分的区域为对所述声音传感器阵列所处平面划分得到的具有同一原点的多个区域;根据所述第二传感器对中两个声音传感器分别接收到的声音信号,分别计算各预先划分的区域对应的第二传播功率;确定多个第一传播功率中的最大值对应的多个第一区域以及多个第二传播功率中的最大值对应的多个第二区域;定位所述多个第一区域与所述多个第二区域的重合区域的方向为声源的方向;

转动控制模块330,用于控制摄像头340转动至所述声源的方向;

摄像头340,用于转动至所述声源的方向,对所述声源进行拍摄。

应用本实施例,将声音传感器阵列中的任三个声音传感器划分为两个传感器对,每个声音传感器可以接收到声源发出的声音信号,根据各传感器对中各声音传感器接收到的声音信号,分别计算各预先划分的区域对应的第一传播功率以及第二传播功率,确定多个第一传播功率中的最大值对应的多个第一区域以及多个第二传播功率中的最大值对应的多个第二区域,最终定位多个第一区域与多个第二区域的重合区域的方向为声源的方向。预先对声音传感器阵列所处平面划分得到具有同一原点的多个区域。根据各传感器对中各声音传感器接收到的声音信号,可以通过计算得到各预先划分的区域对应的传播功率,声源所处的区域对应的传播功率最大,而噪声的传播功率往往较小,因此通过传播功率的计算,可以有效的减小噪声干扰对声源定位的影响;并且基于同一原点的区域划分,一个区域内的角度基本相同,在确定了声源在哪个扇形区域内之后,则可以准确定位出该声源,使得声源定位更准确。

可选的,所述声音传感器阵列310由三个声音传感器组成;

所述预先划分的区域为:从所述声音传感器阵列中的第一声音传感器与第二声音传感器的连线起,以所述第一声音传感器为原点,按照预设角度将所述声音传感器阵列所处平面划分得到的多个扇形区域,其中,所述第一声音传感器为所述第一传感器对与所述第二传感器对中相同的声音传感器,所述第一声音传感器与所述第二声音传感器的连线垂直于所述第一声音传感器与所述传感器阵列中的第三声音传感器的连线。

可选的,所述声源定位模块320,具体可以用于:

采用预设频域变换算法,将所述第一传感器对和/或所述第二传感器对中的各声音传感器分别接收到的声音信号变换为频域信号;

针对所述第一传感器对和/或所述第二传感器对,分别获取各预先划分的区域对应的各声音传感器接收到声音信号的预设时间差,其中,针对所述第一传感器对,获取到的预设时间差为预设第一时间差;针对所述第二传感器对,获取到的预设时间差为预设第二时间差;

根据变换后得到的频域信号以及各预设时间差,通过频域运算,分别确定各预先划分的区域对应的传播功率,其中,所述传播功率包括第一传播功率和/或第二传播功率,针对所述第一传感器对,根据对所述第一传感器对中各声音传感器分别接收到的声音信号变换后得到的频域信号以及各预设第一时间差,通过频域运算,分别确定各预先划分的区域对应的第一传播功率;针对所述第二传感器对,根据对所述第二传感器对中各声音传感器分别接收到的声音信号变换后得到的频域信号以及各预设第二时间差,通过频域运算,分别确定各预先划分的区域对应的第二传播功率。

可选的,所述声源定位模块320,具体还可以用于:

根据变换后得到的频域信号以及各预设时间差,基于预设广义互相关关系式,分别确定各预先划分的区域对应的广义互相关关系;

基于各广义互相关关系,将各广义互相关关系确定为各预先划分的区域对应的传播功率;

所述预设广义互相关关系式为:

其中,所述rkl(τkl(x))为预先划分区域x对应的广义互相关关系,所述k为所述第一传感器对或所述第二传感器对中的一声音传感器,所述l为所述第一传感器对或所述第二传感器对中的另一声音传感器,所述τkl(x)为预先划分的区域x对应的预设时间差,所述mk(ω)为对所述声音传感器k接收的声音信号进行频域变换后得到的频域信号,所述为对所述声音传感器l接收的声音信号进行频域变换后得到的频域信号的共轭信号。

本发明实施例的声源定位系统为应用上述声源定位方法的系统,则上述声源定位方法的所有实施例均适用于该系统,且均能达到相同或相似的有益效果。

为了便于理解,下面结合具体实例,对本发明实施例所提供的一种声源定位方法进行介绍。

以声音传感器阵列为麦克风阵列为例,将麦克风阵列集成至摄像机中,则如图4所示,该摄像机包括:

麦克风阵列410,由三个麦克风组成,并且在执行本发明实施例的声源定位的方法步骤之前,预先将麦克风阵列410所处平面划分为多个区域,如图5所示。

其中,预先划分麦克风阵列410所处平面得到多个区域的方法,可以包括:第一步,建立坐标系,该坐标系的原点与麦克风阵列410中的第一麦克风501重合,麦克风阵列410中的第二麦克风502位于坐标系的横轴上;第二步,从坐标系的横轴起,以原点(第一麦克风501)为圆心,按照预设角度将麦克风阵列410所处平面划分为多个区域。并且,为了便于对声源位置的准确判断,可以将麦克风阵列410中的第三麦克风503设置为位于坐标系的纵轴上,如图5所示,预设角度为10度,划分后得到36个区域。其中,第一麦克风501与第二麦克风502构成第一麦克风对,用于估计前后的声源位置;第一麦克风501与第三麦克风503构成第二麦克风对,用于估计左右的声源位置。

a/d采集电路420,用于采集麦克风阵列410中各麦克风接收到的声音信号。

由于本发明实施例中,只需要获取麦克风阵列中三个麦克风接收的声音信号就可以达到声源定位的目的,因此,为了节约成本、简化结构,在本实施例中,构建的麦克风阵列410由三个麦克风组成。

处理器430,用于采用预设频域变换算法,将麦克风阵列410中各麦克风接收到的声音信号变换为频域信号;根据变换后得到的频域信号、预设第一时间差以及预设第二时间差,通过频域运算,分别确定各预先划分的区域对应的第一传播功率以及第二传播功率;确定多个第一传播功率中的最大值对应的多个第一区域以及多个第二传播功率中的最大值对应的多个第二区域;定位多个第一区域与多个第二区域的重合区域的方向为声源的方向。

对于第一麦克风对中的第一麦克风k和第二麦克风l,在通过预设频域变换算法后,得到第一麦克风k接收声音信号进行频域变换后得到的频域信号mk(ω),以及第二麦克风l接收声音信号进行频域变换后得到的频域信号的共轭信号根据频域信号mk(ω)和预设第一时间差τkl(x),基于预设广义互相关关系式(4),确定声源到第一麦克风对各麦克风的广义互相关关系,确定该广义互相关关系为声源至第一麦克风对的第一传播功率,即如公式(5)所示。

pkl(x)=rkl(τkl(x))(5)

其中,pkl(x)为声源至第一麦克风对的第一传播功率,rkl(τkl(x))为预先划分的区域x对应的声源至第一麦克风对的广义互相关关系,k为第一麦克风,l为第二麦克风,τkl(x)为预先划分的区域x对应的第一麦克风k和第二麦克风l接收到声音信号的时间差,mk(ω)为通过预设频域变换后,得到第一麦克风k接收声音信号进行频域变换后得到的频域信号,为通过预设频域变换后,第二麦克风l接收声音信号进行频域变换后得到的频域信号的共轭信号。预设值τkl(x)可以根据公式(6)计算得到。

其中,τkl(x)为当声源位于各预先划分的区域内,第一麦克风k和第二麦克风l接收到声音信号的时间差,k为第一麦克风,l为第二麦克风,x为预先划分的区域,d为第一麦克风和第二麦克风之间的距离,θ为当声源位于各预先划分的区域内,声源与两麦克风连线之间的夹角,c为声音在空气中的传播速度。

通过与上述过程相同的步骤,可以得到声源至第二麦克风对的第二传播功率。然后,根据公式(7)搜索第一传播功率中的最大值对应的第一区域,该第一区域即为对于第一麦克风对而言,声源可能在的位置。

其中,为第一区域,pkl(x)为声源至第一麦克风对的第一传播功率,k为第一麦克风,l为第二麦克风,x为预先划分的区域,g为各预先划分的区域构成的集合。

通过与上述过程相同的步骤,可以搜索第二传播功率中的最大值对应的第二区域。

如图5所示,搜索出的第一区域包括504和505,搜索出的第二区域包括504和506,则定位504的区域方向为声源的方向。例如,如果504的角度为240度,则确定声源的方向为坐标系的240度方向。

摄像头440,根据处理器定位得到的声源方向转动,例如,上述确定声源的方向为坐标系的240度方向,则摄像头转动至坐标系的240度方向,在该角度的附近拍摄声源。

应用本方案,根据各麦克风对中各麦克风接收到的声音信号,可以通过计算得到各预先划分的区域对应的传播功率,声源所处的区域对应的传播功率最大,而噪声的传播功率往往较小,因此通过传播功率的计算,可以有效的减小噪声干扰对声源定位的影响;并且基于同一原点的扇形区域的划分,一个扇形区域内的角度基本相同,在确定了声源在哪个扇形区域内之后,则可以准确定位出该声源,使得声源定位更准确。并且,由于方案的实现只需要获取三个麦克风接收的声音信号,因此,将麦克风阵列设置为由三个麦克风组成,简化了结构、减少了成本,通过三个麦克风进行360度声源定位,通过对麦克风阵列所处平面的坐标系的设置(第一麦克风设置为原点、第二麦克风在横轴上、第三麦克风在纵轴上),使得麦克风阵列呈直角阵列的形式,这样使得对声源位置的判断更为准确。

本发明实施例还提供了一种计算机设备,包括所述存储器,用于存放计算机程序;

所述处理器,用于执行所述存储器上所存放的程序时,实现如上述的方法步骤。

本发明实施例还提供了一种计算机设备,如图6所示,包括处理器610、通信接口620、存储器630和通信总线640,其中,处理器610,通信接口620,存储器630通过通信总线640完成相互间的通信,

存储器630,用于存放计算机程序;

处理器610,用于执行存储器630上所存放的程序时,实现如下步骤:

获取声音传感器阵列中属于第一传感器对和第二传感器对的各声音传感器接收到的声音信号,其中,所述第一传感器对与所述第二传感器对中存在一个相同的声音传感器;

根据所述第一传感器对中两个声音传感器分别接收到的声音信号,分别计算各预先划分的区域对应的第一传播功率,其中,所述预先划分的区域为对所述声音传感器阵列所处平面划分得到的具有同一原点的多个区域;

根据所述第二传感器对中两个声音传感器分别接收到的声音信号,分别计算各预先划分的区域对应的第二传播功率;

确定多个第一传播功率中的最大值对应的多个第一区域以及多个第二传播功率中的最大值对应的多个第二区域;

定位所述多个第一区域与所述多个第二区域的重合区域的方向为声源的方向。

可选的,所述声音传感器阵列由三个声音传感器组成;

所述预先划分的区域为:从所述声音传感器阵列中的第一声音传感器与第二声音传感器的连线起,以所述第一声音传感器为原点,按照预设角度将所述声音传感器阵列所处平面划分得到的多个扇形区域,其中,所述第一声音传感器为所述第一传感器对与所述第二传感器对中相同的声音传感器,所述第一声音传感器与所述第二声音传感器的连线垂直于所述第一声音传感器与所述传感器阵列中的第三声音传感器的连线。

可选的,处理器610在实现所述分别计算各预先划分的区域对应的第一传播功率,及所述分别计算各预先划分的区域对应的第二传播功率的步骤中,具体可以实现:

采用预设频域变换算法,将所述第一传感器对和/或所述第二传感器对中的各声音传感器分别接收到的声音信号变换为频域信号;

针对所述第一传感器对和/或所述第二传感器对,分别获取各预先划分的区域对应的各声音传感器接收到声音信号的预设时间差,其中,针对所述第一传感器对,获取到的预设时间差为预设第一时间差;针对所述第二传感器对,获取到的预设时间差为预设第二时间差;

根据变换后得到的频域信号以及各预设时间差,通过频域运算,分别确定各预先划分的区域对应的传播功率,其中,所述传播功率包括第一传播功率和/或第二传播功率,针对所述第一传感器对,根据对所述第一传感器对中各声音传感器分别接收到的声音信号变换后得到的频域信号以及各预设第一时间差,通过频域运算,分别确定各预先划分的区域对应的第一传播功率;针对所述第二传感器对,根据对所述第二传感器对中各声音传感器分别接收到的声音信号变换后得到的频域信号以及各预设第二时间差,通过频域运算,分别确定各预先划分的区域对应的第二传播功率。

可选的,处理器610在实现所述根据变换后得到的频域信号以及各预设时间差,通过频域运算,分别确定各预先划分的区域对应的传播功率的步骤中,具体可以实现:

根据变换后得到的频域信号以及各预设时间差,基于预设广义互相关关系式,分别确定各预先划分的区域对应的广义互相关关系;

基于各广义互相关关系,将各广义互相关关系确定为各预先划分的区域对应的传播功率;

所述预设广义互相关关系式为:

其中,所述rkl(τkl(x))为预先划分的区域x对应的广义互相关关系,所述k为所述第一传感器对或所述第二传感器对中的一声音传感器,所述l为所述第一传感器对或所述第二传感器对中的另一声音传感器,所述τkl(x)为预先划分的区域x对应的预设时间差,所述mk(ω)为对所述声音传感器k接收的声音信号进行频域变换后得到的频域信号,所述为对所述声音传感器l接收的声音信号进行频域变换后得到的频域信号的共轭信号。

上述电子设备提到的通信总线可以是pci(peripheralcomponentinterconnect,外设部件互连标准)总线或eisa(extendedindustrystandardarchitecture,扩展工业标准结构)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。

上述的通信接口用于上述电子设备与其他设备之间的通信。

上述的存储器可以包括ram(randomaccessmemory,随机存取存储器),也可以包括nvm(non-volatilememory,非易失性存储器),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器,包括cpu(centralprocessingunit,中央处理器)、np(networkprocessor,网络处理器)等;还可以是dsp(digitalsignalprocessing,数字信号处理器)、asic(applicationspecificintegratedcircuit,专用集成电路)、fpga(field-programmablegatearray,现场可编程门阵列)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

本实施例中,该计算机设备的处理器通过读取存储器中存储的计算机程序,并通过运行该计算机程序,能够实现:根据各传感器对中各声音传感器接收到的声音信号,可以通过计算得到各预先划分的区域对应的传播功率,声源所处的区域对应的传播功率最大,而噪声的传播功率往往较小,因此通过传播功率的计算,可以有效的减小噪声干扰对声源定位的影响;并且基于同一原点的区域划分,一个区域内的角度基本相同,在确定了声源在哪个区域内之后,则可以准确定位出该声源,使得声源定位更准确。

另外,相应于上述实施例所提供的声源定位方法,本发明实施例提供了一种存储介质,用于存储计算机程序,所述计算机程序被处理器执行时,实现如上述声源定位方法的步骤。

本实施例中,存储介质存储有在运行时执行本申请实施例所提供的声源定位方法的应用程序,因此能够实现:根据各传感器对中各声音传感器接收到的声音信号,可以通过计算得到各预先划分的区域对应的传播功率,声源所处的区域对应的传播功率最大,而噪声的传播功率往往较小,因此通过传播功率的计算,可以有效的减小噪声干扰对声源定位的影响;并且基于同一原点的区域划分,一个区域内的角度基本相同,在确定了声源在哪个区域内之后,则可以准确定位出该声源,使得声源定位更准确。

对于计算机设备以及存储介质实施例而言,由于其所涉及的方法内容基本相似于前述的方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1