一种声源定位方法及系统的制作方法

文档序号:5820681阅读:116来源:国知局
专利名称:一种声源定位方法及系统的制作方法
技术领域
本发明涉及定位技术,特别涉及一种声源定位方法及系统。

背景技术
目前,定位技术已经得到了越来越广泛的应用,采用定位技术可以根据来自目标的信息确定目标的位置。声源定位是定位技术中的一项重要技术,声源发出的声音信号到达采集装置的时间不同,通过估计采集装置采集到的声音信号之间的时间差,并根据估计出的时间差以及采集装置自身的尺寸和结构的几何关系,可以计算出声源相对于采集装置的位置。声源定位广泛应用于各个领域,例如在监控中,通过声源定位,可以使摄像头自动转向发出声音的方向,在圆桌会议中,通过声源定位,可以使摄像头或麦克风等自动转向发言者的方向。
基本采集装置可以为双麦克风,双麦克风的结构如图1所示,麦克风1和麦克风2之间的距离为L,麦克风1和麦克风2之间连线的中点为基本采集装置的中心,声源与基本采集装置的夹角为。其中,是声源与两个麦克风连线的垂线的夹角,这是因为,声源与麦克风之间的距离远大于两个麦克风之间的距离,因此可以认为声音信号以平面波的形式发送至双麦克风,那么声源与基本采集装置的夹角可以近似认为是声源与两个麦克风连线的垂线的夹角。称声源与基本采集装置的夹角为声源的真实位置。
从图中几何关系可以推导出d=Lsin()/c公式1 其中,d为声音信号到达两个麦克风的时间差,c是声速。
由公式1可得=arcsin(cd/L)公式2 也就是说,只要能够准确地估计出声音信号到达两个麦克风的时间差,即两个麦克风采集到的声音信号的相位差,就可以利用基本采集装置的尺寸和结构的几何关系推算出声波的入射方向,即声源的位置。
但是,基本采集装置采集声音信号时,通过公式2计算出声源与两个麦克风连线的垂线的夹角有两个1和2,其中一个是声源的真实估计位置,一个是声源的镜像估计位置,1+2=180°,即声源的真实估计位置和镜像估计位置相对于双麦克风的连线对称,如图1所示。而单纯采用一个基本采集装置无法区分哪个估计位置是真实的,哪个估计位置是镜像的。
在至少两个基本采集装置与声源在同一个平面内的情况下,例如圆桌会议中,讲话者与多个麦克风均在同一个平面内,可以用至少两个基本采集装置来解决单个基本采集装置无法分辨真实估计位置和镜像估计位置的问题。
每个基本采集装置来采集来自声源的声音信号,并根据采集到的声音信号估算出声源相对于这个基本采集装置的真实估计位置和镜像估计位置,这样就能够获得声源分别相对于这些基本采集装置的真实估计位置和镜像估计位置,而声源的真实估计位置必然是收敛于一点的,因此可以根据所述至少两个基本采集装置之间的几何关系计算出所有收敛于一点的声源估计位置,即所有的真实估计位置,进而根据所有真实估计位置计算出声源的真实位置。
但是,采用至少两个基本采集装置进行声源定位时,由于每个基本采集装置做相同的工作,大大降低了基本采集装置的利用率,造成资源的浪费。


发明内容
本发明实施例提供了一种声源定位方法,能够提高基本采集装置的利用率。
本发明实施例提供了一种声源定位系统,能够提高基本采集装置的利用率。
以下为本发明实施例提供的技术方案 一种声源定位方法,该方法包括 将基本采集装置放置在平面内的至少两个位置,在所述每个位置基本采集装置采集一组来自声源的声音信号,所述平面为所述基本采集装置与所述声源共同所在的平面; 根据采集到的每组声音信号计算一组声源估计位置,并根据收敛于同一点的声源估计位置计算出声源的真实位置。
一种声源定位系统,该系统包括位置控制装置、基本采集装置和处理装置; 所述位置控制装置用于将基本采集装置放置在平面内的至少两个位置,在所述每个位置向基本采集装置发送采集消息,所述平面为所述基本采集装置于所述声源共同所在的平面; 所述基本采集装置用于接收来自位置控制装置的采集消息,接收到所述采集消息后,采集一组来自声源的声音信号,将采集到的声音信号发送至处理装置; 所述处理装置用于接收基本采集装置发送的声音信号,根据采集到的每组声音信号计算出一组声源估计位置,并将收敛于同一点的声源估计位置作为声源的真实位置输出。
从上述技术方案中可以看出,本发明实施例提供的声源定位方法及系统,通过改变基本采集装置的位置来采集声音信号,根据采集到的多组声音信号来计算声源的真实位置,来实现现有技术中利用至少两个基本采集装置来完成的声源定位,提高了基本采集装置的利用率,也减少了资源的浪费。



图1为双麦克风的结构示意图; 图2为本发明实施例一提供的声源定位方法的流程图; 图3为本发明实施例二提供的声源定位方法的流程图; 图4为本发明实施例二提供的声源定位方法的几何关系示意图; 图5为本发明实施例三提供的声源定位系统的结构图。
具体实施万式 为使本发明的目的、技术方案和优点表达得更加清楚明白,下面结合附图及具体实施例对本发明再作进一步详细的说明。
第一实施例 图2为本发明实施例提供的声源定位方法的流程图。如图2所示 步骤201将基本采集装置放置在平面内的至少两个位置,在所述每个位置基本采集装置采集一组来自声源的声音信号,所述平面为所述基本采集装置与所述声源共同所在的平面。
本步骤中将基本采集装置放置在平面内的至少两个位置可以通过以下方式来实现 将所述基本采集装置以其中心为圆心在所述平面内按照一个方向旋转,每旋转到一个预先设定的角度,将所述角度作为基本采集装置采集声音信号的一个位置。
其中,所述按照一个方向旋转可以为360度逆时针匀速旋转。
步骤202根据采集到的每组声音信号计算声源估计位置,并根据收敛于同一点的声源估计位置计算出声源的真实位置。
本步骤中,所述根据采集到的每组声音信号计算声源估计位置可以包括根据采集到的每组声音信号计算声源与基本采集装置采集该组声音信号时所在位置的夹角;根据所述夹角计算声源与预先设定的基准位置的夹角,将所述声源与基准位置的夹角作为声源估计位置。
所述根据收敛于同一点的声源估计位置计算出声源的真实位置可以包括将每两个声源估计位置之间的差值与预先设定的阈值相比较,将差值低于所述阈值的每两个声源估计位置作为收敛于同一点的声源估计位置,其余声源估计位置作为不收敛于同一点的声源估计位置;计算所有收敛于同一点的声源估计位置的平均值,将所述平均值作为声源的真实位置。
以上所述基本采集装置可以为双麦克风。
下面在所述按照一个方向旋转可以为360度逆时针匀速旋转,所述基本采集装置为双麦克风的情况下,对本发明实施例提供的声源定位方法作进一步详细说明。
第二实施例 本实施例中,旋转双麦克风的周期为T,即旋转360度所用的时间为T,麦克风采集信号的采样率为8kHz,一帧声音信号的长度为M,即每一帧采样点的个数为M。
图3为本发明实施例提供的声源定位方法的流程图。如图3所示 步骤301将双麦克风以其中心为圆心在所述平面内进行360度逆时针匀速旋转,双麦克风每旋转到一个预先设定的角度采集一组来自声源的声音信号。
本发明实施例提供的声源定位方法的几何示意图如图4所示 本实施例中,双麦克风阵列以预先设定的基准位置为起点进行逆时针旋转,所述基准位置为开始旋转时两个麦克风的连线所在的位置,因此,在起始点时双麦克风与基准位置的夹角为0,即两个麦克风之间的连线与基准位置的夹角α为0度。
在旋转一周的过程中,α逐渐从0增加到360度完成一周的旋转。
步骤302根据采集到的每组声音信号计算声源与基本采集装置采集该组声音信号时所在位置的夹角。
本实施例中,周期为T,采样率为8kHz,一帧声音信号的长度为M,通过公式3可以计算双麦克风每旋转一周采样的点数N,即双麦克风每旋转一周,可以采集N组声音信号。
N=8000T/M 公式3 由于双麦克风在每采集一组声音信号之后都会对到达两个麦克风的这组声音信号进行一次时间差的估计,因此在一个周期T内可以获得N个时间差的估计值d0,d1,...,dN-1。
其中,在双麦克风采集到一组声音信号之后,可以根据双麦克风中两个麦克风采集到的两路声音信号的互相关函数来估计声音信号到达两个麦克风的时间差。
下面以图4所示的双麦克风为例说明估计声音信号到达两个麦克风的时间差的方法。假设在某次采样中,双麦克风采集到了一组声音信号s1和s2。其中,s1为麦克风1接收到的声音信号,s2为麦克风2接收到的声音信号。一帧声音信号的长度为M。
首先通过公式5计算s1和s2的互相关函数Rs1s2(τ)。
Rs1s2(τ)的计算方法为 公式4 其中M为一帧声音信号的长度,τ为两路信号s1和s2的相位差。
为了简化计算,可以对公式4通过傅立叶变换及逆变换,将公式4变换为频域计算,如公式5所示 公式5 然后改变τ值,计算出至少两个Rs1s2(τ)。其中τ的最小取值为0,最大值由两个麦克风之间的距离和声速决定,这是由于s1和s2的相位差的最小值出现在声音信号方向垂直于双麦克风连线的情况,而s1和s2的相位差的最大值出现在声音信号方向平行于双麦克风连线的情况,这里不再赘述。
最后通过公式6计算两路信号s1和s2的最大互相关位置,所述最大互相关位置为Rs1s2(τ)的值达到最大时τ的取值。进而可以通过公式6根据所述最大互相关位置来估计s1和s2到达双麦克风的时间差d。
公式6 通过N个时间差的估计d0,d1,...,dN-1可以由公式2计算出每次采样时,声源与双麦克风的夹角,如公式7所示 i=arcsin(cdi/L),i=0~N-1 公式7 di为根据第i次采集到的声音信号估计出的时间差,i为双麦克风第i次采集声音信号时,所述双麦克风连线的垂线与声源的夹角。i有两个值,i1和i2,其中一个是声源的真实估计位置,一个是声源的镜像估计位置,i1+i2=180°。
步骤303根据所述夹角计算声源与预先设定的基准位置的夹角,将所述声源与基准位置的夹角作为声源估计位置。
本步骤可以通过以下步骤来实现 步骤3031计算双麦克风与基准位置的夹角αi。
每次采用后,双麦克风与基准位置的夹角可以由公式8计算。


公式8 步骤3032计算声源相对于基准位置的夹角βi。
通过步骤302计算出的声源与双麦克风的夹角以及双麦克风与基准位置的夹角,可以计算出声源相对于基准位置的夹角。
由于步骤302中得到的i有两个值,因此,一个周期内计算出的声源与双麦克风连线的垂线的夹角有2N个,而计算出的声源与基准位置的夹角也就有2N个,即声源估计位置有2N个。
声源相对于基准位置的夹角βi、双麦克风与基准位置的夹角αi以及声源与双麦克风的夹角i之间的关系如图4所示,可以通过公式9来计算声源相对于基准位置的夹角βi,即计算声源估计位置βi βi1=αi+90°-i1,i=0~N-1公式9 βi2=αi-90°+i2 βi1和βi2中,一个是真实的估计位置,一个是是镜像的估计位置。
步骤304将每两个声源估计位置之间的差值与预先设定的阈值相比较,将差值低于所述阈值的每两个声源估计位置作为收敛于同一点的声源估计位置,其余声源估计位置作为不收敛于同一点的声源估计位置。
本步骤中,计算所有βi之间的差值,如果两个βi的差值大于预先设定的阈值,那么这两个βi不收敛于同一点,即不是声源的真实估计位置,如果两个βi的差值小于预先设定的阈值,那么这两个βi收敛于同一点,说明这两个βi同时是声源的真实估计位置。这样,就得到了所有收敛于同一点的βi。
步骤305计算所有收敛于同一点的声源估计位置的平均值,将所述平均值作为声源的真实位置。
本实施例中,如果步骤304最终判断出n个声源估计位置收敛于同一点,其中n>1,即有n个βi之间的差值小于预先设定的阈值,则将这n个βi的置取平均,将得到的平均值作为声源的真实位置。
基于以上方法,本发明实施例还提供了一种声源定位系统,下面以具体实施方式
对本发明实施例提供的声源定位系统作进一步详细说明。
第三实施例 图5为本发明实施例提供的声源定位系统的结构图。如图5所示 本发明实施例提供的声源定位系统包括位置控制装置501、基本采集装置502和处理装置503。
位置控制装置501用于将基本采集装置502放置在平面内的至少两个位置,并在所述每个位置向基本采集装置502发送采集消息,所述平面为所述基本采集装置502于所述声源共同所在的平面。
位置控制装置501包括旋转模块5011和触发模块5012。
旋转模块5011用于以基本采集装置502的中心为圆心,控制所述基本采集装置502在所述平面内按照一个方向旋转,在基本采集装置502每旋转到一个预先设定的角度时,向触发模块发5012送触发消息。
在实际应用中,所述按照一个方向旋转可以为360度逆时针匀速旋转。
本实施例中,基本采集装置502为双麦克风,因此,基本采集装置502的中心为两个麦克风连线的中点。
触发模块5012用于接收来自旋转模块5011的触发消息,接收到所述触发消息后,向基本采集装置502发送采集消息。
基本采集装置502用于接收来自位置控制装置501的采集消息,接收到所述采集消息后,采集一组来自声源的声音信号,将采集到的声音信号发送至处理装置503。
处理装置503用于接收基本采集装置502发送的声音信号,根据采集到的每组声音信号计算出一组声源估计位置,并将收敛于同一点的声源估计位置作为声源的真实位置输出。
处理装置503包括预处理模块5031和定位模块5032。
预处理模块5031用于接收基本采集装置502发送的声音信号,根据采集到的每组声音信号计算出一组声源估计位置,将所述声源估计位置发送至定位模块5032。
定位模块5032用于接收来自预处理模块5031的声源估计位置,根据收敛于同一点的声源估计位置计算出声源的真实位置,输出所述声源的真实位置。
在实际应用中,预处理模块5031可以包括相对角度计算模块01和绝对角度计算模块02。
相对角度计算模块01用于接收来自基本采集装置502的声音信号,根据采集到的每组声音信号计算出声源与基本采集装置502采集该组声音信号时所在位置的夹角,将计算出的夹角发送至绝对角度计算模块02。
绝对角度计算模块02用于接收来自相对角度计算模块01的夹角,根据所述夹角计算出声源与预先设定的基准位置的夹角,将所述声源与基准位置的夹角作为声源估计位置发送至定位模块5032。
定位模块5032可以包括判断模块11和平均模块12。
判断模块11用于接收来自预处理模块5031的声源估计位置,判断每两个声源估计位置之间的差值是否超过预先设定的阈值,如果是,则判定所述两个声源估计位置不收敛于一点,否则判定所述两个声源估计位置收敛于一点,将所述收敛于一点的声源估计位置发送至平均模块12。
平均模块12用于接收来自判断模块11的声源估计位置,计算所有接收到的声源估计位置的平均值,将所述平均值作为声源的真实位置输出。
从上述技术方案中可以看出,本发明实施例提供的声源定位方法及系统,通过改变基本采集装置来采集声音信号,根据采集到的多组声音信号来计算声源的真实位置,来实现现有技术中利用至少两个基本采集装置来完成的声源定位,提高了基本采集装置的利用率,也减少了资源的浪费。
综上所述,以上仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
权利要求
1.一种声源定位方法,其特征在于,该方法包括
将基本采集装置放置在平面内的至少两个位置,在所述每个位置基本采集装置采集一组来自声源的声音信号,所述平面为所述基本采集装置与所述声源共同所在的平面;
根据采集到的每组声音信号计算一组声源估计位置,并根据收敛于同一点的声源估计位置计算出声源的真实位置。
2.根据权利要求1所述的方法,其特征在于,所述将基本采集装置放置在平面内的至少两个位置包括
将所述基本采集装置以其中心为圆心在所述平面内按照一个方向旋转,每旋转到一个预先设定的角度,将所述角度作为基本采集装制采集声源信号的一个位置。
3.根据权利要求2所述的方法,其特征在于,所述按照一个方向旋转为360度逆时针匀速旋转。
4.根据权利要求1所述的方法,其特征在于,所述根据采集到的每组声音信号计算声源估计位置包括
根据采集到的每组声音信号计算声源与基本采集装置采集该组声音信号时所在位置的夹角;
根据所述夹角计算声源与预先设定的基准位置的夹角,将所述声源与基准位置的夹角作为声源估计位置。
5.根据权利要求1或4所述的方法,其特征在于,所述根据收敛于同一点的声源估计位置计算出声源的真实位置包括
将每两个声源估计位置之间的差值与预先设定的阈值相比较,将差值低于所述阈值的每两个声源估计位置作为收敛于同一点的声源估计位置,其余声源估计位置作为不收敛于同一点的声源估计位置;
计算所有收敛于同一点的声源估计位置的平均值,将所述平均值作为声源的真实位置。
6.根据权利要求5所述的方法,其特征在于,所述基本采集装置为双麦克风。
7.一种声源定位系统,其特征在于,该系统包括位置控制装置、基本采集装置和处理装置;
所述位置控制装置用于将基本采集装置放置在平面内的至少两个位置并在所述每个位置向基本采集装置发送采集消息,所述平面为所述基本采集装置于所述声源共同所在的平面;
所述基本采集装置用于接收来自位置控制装置的采集消息,接收到所述采集消息后,采集一组来自声源的声音信号,将采集到的声音信号发送至处理装置;
所述处理装置用于接收基本采集装置发送的声音信号,根据采集到的每组声音信号计算出一组声源估计位置,并将收敛于同一点的声源估计位置作为声源的真实位置输出。
8.根据权利要求7所述的系统,其特征在于,所述位置控制装置包括旋转模块和触发模块;
所述旋转模块用于以基本采集装置的中心为圆心,将所述基本采集装置在所述平面内按照一个方向旋转,每旋转到一个预先设定的角度,向触发模块发送触发消息;
所述触发模块用于接收来自旋转模块的触发消息,接收到所述触发消息后,向基本采集装置发送采集消息。
9.根据权利要求7所述的系统,其特征在于,所述处理装置包括预处理模块和定位模块;
所述预处理模块用于接收基本采集装置发送的声音信号,根据采集到的每组声音信号计算出一组声源估计位置,将所述声源估计位置发送至定位模块;
所述定位模块用于接收来自预处理模块的声源估计位置,根据收敛于同一点的声源估计位置计算出声源的真实位置,输出所述声源的真实位置。
10.根据权利要求9所述的系统,其特征在于,所述预处理模块包括相对角度计算模块和绝对角度计算模块;
所述相对角度计算模块用于接收来自基本采集装置的声音信号,根据采集到的每组声音信号计算出声源与基本采集装置采集该组声音信号时所在位置的夹角,将计算出的夹角发送至绝对角度计算模块;
所述绝对角度计算模块用于接收来自相对角度计算模块的夹角,根据所述夹角计算出声源与预先设定的基准位置的夹角,将所述声源与基准位置的夹角作为声源估计位置发送至定位模块。
11.根据权利要求9或10所述的系统,其特征在于,所述定位模块包括判断模块和平均模块;
所述判断模块用于接收来自预处理模块的声源估计位置,判断每两个声源估计位置之间的差值是否超过预先设定的阈值,如果是,则判定所述两个声源估计位置不收敛于一点,否则判定所述两个声源估计位置收敛于一点,将所述收敛于一点的声源估计位置发送至平均模块;
所述平均模块用于接收来自判断模块的声源估计位置,计算所有接收到的声源估计位置的平均值,将所述平均值作为声源的真实位置输出。
12.根据权利要求7~10所述的系统,其特征在于,所述基本采集装置为双麦克风。
全文摘要
本发明实施例提供了一种声源定位方法及系统,将基本采集装置放置在平面内的至少两个位置,在所述每个位置基本采集装置采集一组来自声源的声音信号,所述平面为所述基本采集装置与所述声源共同所在的平面;根据采集到的每组声音信号计算一组声源估计位置,并根据收敛于同一点的声源估计位置计算出声源的真实位置。通过改变基本采集装置的位置来采集声音信号,根据采集到的多组声音信号来计算声源的真实位置,来实现现有技术中利用至少两个基本采集装置来完成的声源定位,提高了基本采集装置的利用率。
文档编号G01S5/20GK101201399SQ20071017981
公开日2008年6月18日 申请日期2007年12月18日 优先权日2007年12月18日
发明者晨 张 申请人:北京中星微电子有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1