一种声源定位方法及装置与流程

文档序号:11861957阅读:461来源:国知局
一种声源定位方法及装置与流程

本发明涉及声源定位技术领域,尤其涉及一种声源定位方法及装置。



背景技术:

视频监控系统领域的研究一般集中在视频图像的分析上,然而随着安全防范系统要求的不断提高,传统的单一视频监控不能根据异常情况的发生转动到相应的位置捕捉画面。因此,一些学者提出了在监控系统领域引入音频,通过定位声源的方法确定声源的位置,进而调整摄像头转动,准确及时的捕捉到画面。

目前,基于麦克风阵列的声源定位技术受到越来越多的关注,基于时间差估计的双步定向算法对声源进行定位,此种算法的麦克风阵列中包括两个独立、特性相同且朝向相同的麦克风,其中,规定麦克风朝向的方向为正向,麦克风背向的方向为反向,此种算法只能够确定声源相对于正向的初始位置的偏移角度,就是说,只能够默认声源在正向,不能够实时的根据声源产生的声音信号确定声源所处的方向(正向或者反向)。



技术实现要素:

本发明提供一种声源定位方法及装置,用于解决现有技术中不能够实时的根据声源产生的声音信号确定声源所处的方向(正向或者反向)的问题。

一种声源定位方法,预先在球机上设置多个独立且特性相同的声音传感器,任意两个声音传感器间隔预设距离,该预距离离小于球机的直径,并且每个声音传感器朝向的方向相同,该方法包括:

利用所述多个声音传感器采集来自同一声源的声音时域数据;

针对每个声音传感器,将该声音传感器采集的声音时域数据转换为声音频域数据;

根据该声音传感器对应的声音频域数据,计算该声音传感器对应的高频比值;

根据所述多个声音传感器对应的高频比值,确定所述声源所处的方向,其中,所述声源所处的方向为所述声音传感器朝向的方向或者所述声音传感器背向的方向。

所述方法中,所述声音传感器的个数为两个,所述预设距离大于或等于球机的半径。

所述方法中,所述声音传感器设置在球机上具有摄像头的一侧,所述声音传感器朝向的方向为:与两个所述声音传感器的连线垂直,并且,背向与两个所述声音传感器的连线平行的球机的直径。

所述方法中,根据两个所述声音传感器对应的高频比值,确定所述声源所处的方向,具体包括:

计算两个声音传感器对应的高频比值之间的差值;

确定所述差值的绝对值大于设定阈值时,确定所述声源所处的方向为所述声音传感器背向的方向;

确定所述差值的绝对值小于设定阈值时,确定所述声源所处的方向为所述声音传感器朝向的方向。

本发明实施例,通过不同声音传感器对应的高频比值的差值与设定阈值的比较,确定声源所处的方向。

所述方法中,根据该声音传感器对应的声音频域数据,计算该声音传感器对应的高频比值,具体包括:

计算该声音传感器采集到的M帧声音数据中的每帧声音数据的高频比值,M为大于1的整数;

计算M帧声音数据的高频比值的总和N;

将所述N除以M所得的结果作为该声音传感器对应的高频比值。

本发明实施例,通过计算M帧声音数据的高频比值的平均值,确定声音传感器对应的高频比值。

所述方法中,采用如下方式计算该声音传感器采集到的任一帧声音数据的高频比值:

<mrow> <mi>T</mi> <mi>H</mi> <mo>=</mo> <mfrac> <mrow> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mi>n</mi> </mrow> <mn>127</mn> </munderover> <mo>&lsqb;</mo> <msup> <mrow> <mo>(</mo> <msub> <mi>X</mi> <mrow> <mi>i</mi> <mo>_</mo> <mi>r</mi> <mi>e</mi> <mi>a</mi> <mi>l</mi> </mrow> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>+</mo> <msup> <mrow> <mo>(</mo> <msub> <mi>X</mi> <mrow> <mi>i</mi> <mo>_</mo> <mi>i</mi> <mi>m</mi> <mi>a</mi> <mi>g</mi> </mrow> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>&rsqb;</mo> </mrow> <mrow> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>0</mn> </mrow> <mn>127</mn> </munderover> <mo>&lsqb;</mo> <msup> <mrow> <mo>(</mo> <msub> <mi>X</mi> <mrow> <mi>i</mi> <mo>_</mo> <mi>r</mi> <mi>e</mi> <mi>a</mi> <mi>l</mi> </mrow> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>+</mo> <msup> <mrow> <mo>(</mo> <msub> <mi>X</mi> <mrow> <mi>i</mi> <mo>_</mo> <mi>i</mi> <mi>m</mi> <mi>a</mi> <mi>g</mi> </mrow> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>&rsqb;</mo> </mrow> </mfrac> </mrow>

其中,TH表示该声音传感器接收到的第i帧声音数据的高频比值,n为大于0的预设采样点,Xi_real为该声音传感器采集到的第i帧声音频域数据的实部,Xi_imag为该声音传感器采集到的第i帧声音频域数据的虚部。

本发明还提供一种声源定位装置,预先在所述球机上设置多个独立且特性相同的声音传感器,任意两个声音传感器间隔预设距离,该预距离离小于球机的直径,并且每个声音传感器朝向的方向相同,包括:

采集单元,用于利用所述多个声音传感器采集来自同一声源的声音时域数据;

转换单元,用于针对每个声音传感器,将该声音传感器采集的声音时域数据转换为声音频域数据;

计算单元,用于根据该声音传感器对应的声音频域数据,计算该声音传感器对应的高频比值;

方向确定单元,用于根据所述多个声音传感器对应的高频比值,确定所述声源所处的方向,其中,所述声源所处的方向为所述声音传感器朝向的方向或者所述声音传感器背向的方向。

所述装置中,所述声音传感器的个数为两个,所述预设距离大于或等于球机的半径。

所述装置中,所述声音传感器设置在球机上具有摄像头的一侧,所述声音传感器朝向的方向为:与两个所述声音传感器的连线垂直,并且,背向与两个所述声音传感器的连线平行的球机的直径。

所述装置中,所述方向确定单元具体用于:

计算两个声音传感器对应的高频比值之间的差值;

确定所述差值的绝对值大于设定阈值时,确定所述声源所处的方向为所述声音传感器背向的方向;

确定所述差值的绝对值小于设定阈值时,确定所述声源所处的方向为所述声音传感器朝向的方向。

所述装置中,所述计算单元具体用于:

计算该声音传感器采集到的M帧声音数据中的每帧声音数据的高频比值,M为大于1的整数;

计算M帧声音数据的高频比值的总和N;

将所述N除以M所得的结果作为该声音传感器对应的高频比值。

所述装置中,所述计算单元用于采用如下方式计算该声音传感器采集到的任一帧声音数据的高频比值:

<mrow> <mi>T</mi> <mi>H</mi> <mo>=</mo> <mfrac> <mrow> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mi>n</mi> </mrow> <mn>127</mn> </munderover> <mo>&lsqb;</mo> <msup> <mrow> <mo>(</mo> <msub> <mi>X</mi> <mrow> <mi>i</mi> <mo>_</mo> <mi>r</mi> <mi>e</mi> <mi>a</mi> <mi>l</mi> </mrow> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>+</mo> <msup> <mrow> <mo>(</mo> <msub> <mi>X</mi> <mrow> <mi>i</mi> <mo>_</mo> <mi>i</mi> <mi>m</mi> <mi>a</mi> <mi>g</mi> </mrow> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>&rsqb;</mo> </mrow> <mrow> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>0</mn> </mrow> <mn>127</mn> </munderover> <mo>&lsqb;</mo> <msup> <mrow> <mo>(</mo> <msub> <mi>X</mi> <mrow> <mi>i</mi> <mo>_</mo> <mi>r</mi> <mi>e</mi> <mi>a</mi> <mi>l</mi> </mrow> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>+</mo> <msup> <mrow> <mo>(</mo> <msub> <mi>X</mi> <mrow> <mi>i</mi> <mo>_</mo> <mi>i</mi> <mi>m</mi> <mi>a</mi> <mi>g</mi> </mrow> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>&rsqb;</mo> </mrow> </mfrac> </mrow>

其中,TH表示该声音传感器接收到的第i帧声音数据的高频比值,n为大于0的预设采样点,Xi_real为该声音传感器采集到的第i帧声音频域数据的实部,Xi_imag为该声音传感器采集到的第i帧声音频域数据的虚部。

利用本发明提供的声源定位方法及装置,具有以下有益效果:通过多个声音传感器对应的高频比值,确定声源所处的方向是否为多个声音传感器朝向的方向,并控制球机转动到声源所处的方向;之后,根据声音数据到达任意两个声音传感器的时延,确定球机在180度范围内的转动角度,从而实现了球机在360度范围内对声源进行定位,进而提高了声源定位的准确性。

附图说明

图1为本发明实施例提供的声源定位方法流程图;

图2为本发明实施例提供的根据声音传感器对应的高频比值确定声源所处的方向的一方法流程图;

图3为本发明实施例提供的在球机上设置声音传感器以及声音传感器的朝向示意图;

图4为本发明实施例提供的在球机上设置声音传感器示意图;

图5为本发明实施例提供的根据声音传感器对应的高频比值确定声源所处的方向的又一方法流程图;

图6为本发明实施例提供的计算声音传感器对应的高频比值的方法流程图;

图7为本发明实施例提供的具体实施例的实施过程流程图;

图8为本发明实施例提供的声源定位装置示意图。

具体实施方式

下面结合附图和实施例对本发明提供的声源定位方法及装置进行更详细地说明。

现有技术中,基于双麦克风阵列的声源定位技术,仅能够根据声音到达两个麦克风的时间差,确定球机在180度方向上的转动角度,假设,规定麦克风朝向的方向为正向,麦克风背向的方向为反向,现有技术的声源定位算法,只能够确定球机在正向对应的180度范围内的转动角度,就是说,只能够默认声源在正向,之后根据计算的转动角度转动球机,此时,如果声源在反向,根据默认的声源所处的方向转动球机后,会导致声源定位错误的问题。因此,目前业界亟需一种能够确定声源所处的方向为正向还是反向的技术方案,从而解决上述问题。

本发明实施例提供一种声源定位方法,用于确定声源所处的方向,其中,预先在球机上设置多个独立且特性相同的声音传感器,任意两个声音传感器间隔预设距离,并且,该预设距离小于球机的直径,所述预设距离为两个声音传感器的重心之间的直线距离,如图1所示,该方法包括:

步骤101,利用多个声音传感器采集来自同一声源的声音时域数据。

具体的,在球机云台上设置多个独立且特性相同的声音传感器,云台随着球机的转动而转动。声源发出声音后,利用位于球机上的多个声音传感器分别采集来自该声源的声音时域数据。其中,声音传感器可以为全向型麦克风。

步骤102,针对每个声音传感器,将该声音传感器采集的声音时域数据转换为声音频域数据。

具体的,根据预设的频域转换算法,将获取的声音时域数据转换为声音频域数据,频域转换算法可以为MCZT(改进的Z变换)、FFT(快速傅里叶变换)等算法。针对每个声音传感器,对该声音传感器采集的声音时域数据转换为声音频域数据后,得到该声音传感器对应的声音频域数据。

步骤103,根据该声音传感器对应的声音频域数据,计算该声音传感器对应的高频比值。

步骤104,根据多个声音传感器对应的高频比值,确定所述声源所处的方向,其中,所述声源所处的方向为所述声音传感器朝向的方向或者所述声音传感器背向的方向。

具体的,当遮挡物遮挡声音的传输时,声音的高频衰减较多,即,如果来自声源的声音数据被遮挡物遮挡后到达声音传感器,则,声音传感器接收到高频衰减后的声音数据。本发明实施例中,声音传感器对应的高频比值越大,说明到达该声音传感器的声音数据的高频衰减较重。

声音传感器对应的高频比值在一定程度上反映该声音传感器采集到的声音数据的高频衰减,通过比较多个声音传感器对应的高频比值,确定声源所处的方向。

本发明实施例,通过多个声音传感器对应的高频比值,确定声源所处的方向是否为多个声音传感器朝向的方向,并控制球机转动到声源所处的方向;之后,根据声音数据到达任意两个声音传感器的时延,确定球机在180度范围内的转动角度,从而实现了球机在360度范围内对声源进行定位,进而提高了声源定位的准确性,解决了现有技术中存在的问题。

优选地,预先在球机上设置两个独立且特性相同的声音传感器,两个声音传感器之间的预设距离小于球机的直径,并且,所述预设距离大于或等于球机的半径。

具体的,两个声音传感器分别为第一声音传感器和第二声音传感器,第一声音传感器和第二声音传感器对称设置在球机上。

优选地,所述声音传感器设置在球机上具有摄像头的一侧,所述声音传感器朝向的方向为:与两个所述声音传感器的连线垂直,并且,背向与两个所述声音传感器的连线平行的球机的直径,则根据两个所述声音传感器对应的高频比值,确定所述声源所处的方向,如图2所示,具体包括:

步骤201,计算两个声音传感器对应的高频比值之间的差值。

具体的,假设第一声音传感器对应的高频比值为第一高频比值,第二声音传感器对应的高频比值为第二高频比值,则,计算第一高频比值减去第二高频比值所得的差值。

步骤202,确定所述差值的绝对值大于设定阈值时,确定所述声源所处的方向为所述声音传感器背向的方向。

步骤203,确定所述差值的绝对值小于设定阈值时,确定所述声源所处的方向为所述声音传感器朝向的方向。

具体的,如图3所示,两个声音传感器mic1和mic2朝向的方向为与两个声音传感器的连线垂直并且背向与两个声音传感器的连线平行的球机的直径的方向,图3中d1为与两个声音传感器的连线平行的球机的直径,d2为两个声音传感器的连线,两个声音传感器采集到的来自声源的声音数据的高频衰减较轻或者没有衰减时,说明该声源为S’,即说明该声源所处的方向为图3中声音传感器朝向的方向,否则,说明该声源为S,即说明该声源所处的方向为图3中声音传感器背向的方向,图3中如果声源位于S处,则声音到达mic1的衰减较重,图3中,箭头所指的方向为声音传感器朝向的方向,声音传感器朝向的方向与d2垂直。

如图4所示,为本发明实施例提供的将两个声音传感器设置在球机上的示意图,其中,mic1和mic2均设置在球机中具有摄像头的一侧,优选地,mic1和mic2之间的连线(如图3中的d1)与水平面平行,mic1和mic2对称的设置在摄像头的中心线上并且mic1和mic2位于摄像头的两侧。图4提供的球机仅是一种形式的球机,本发明实施例还可应用到其它形式的球机,这里不做限定。

本优选实施方式中,默认声音传感器朝向的方向初始为:与两个所述声音传感器的连线垂直,并且,背向与两个所述声音传感器的连线平行的球机的直径。根据两个声音传感器朝向的方向可知,当声源在两个声音传感器朝向的方向发出声音时,两个声音传感器采集到的来自该声源的声音数据的高频衰减较轻或者没有衰减;当声源在两个声音传感器背向的方向发出声音时,至少一个声音传感器采集到的来自该声源的声音数据的高频衰减较重,即,该至少一个声音传感器采集来自该声源的声音数据时会有遮挡物遮挡声音数据,导致至少一个声音传感器采集到的声音数据产生较大的高频衰减。因此,本优选实施方式根据第一高频比值和第二高频比值的差值的绝对值与设定阈值的比较,确定声源所处的方向。

优选地,所述声音传感器设置在球机上具有摄像头的一侧,所述声音传感器朝向的方向为:与两个所述声音传感器的连线垂直,并且,朝向与两个所述声音传感器的连线平行的球机的直径,则根据两个所述声音传感器对应的高频比值,确定所述声源所处的方向,如图5所示,具体包括:

步骤301,计算两个声音传感器对应的高频比值之间的差值。

具体的,假设第一声音传感器对应的高频比值为第一高频比值,第二声音传感器对应的高频比值为第二高频比值,则,计算第一高频比值减去第二高频比值所得的差值。

步骤302,确定所述差值的绝对值大于设定阈值时,确定所述声源所处的方向为所述声音传感器朝向的方向。

步骤303,确定所述差值的绝对值小于设定阈值时,确定所述声源所处的方向为所述声音传感器背向的方向。

具体的,本发明实施例中声音传感器朝向的方向与图3中所示的声音传感器朝向的方向相反。设定阈值可根据实际应用场景设定,这里不做限定。

本优选实施方式中,默认声音传感器朝向的初始方向为:与两个所述声音传感器的连线垂直,并且,朝向与两个所述声音传感器的连线平行的球机的直径。根据两个声音传感器朝向的方向可知,当声源在两个声音传感器背向的方向发出声音时,两个声音传感器采集到的来自该声源的声音数据的高频衰减较轻或者没有衰减;当声源在两个声音传感器朝向的方向发出声音时,至少一个声音传感器采集到的来自该声源的声音数据的高频衰减较重。因此,本优选实施方式根据第一高频比值和第二高频比值的差值的绝对值与设定阈值的比较,确定声源所处的方向。

优选地,步骤103中,根据该声音传感器对应的声音频域数据,计算该声音传感器对应的高频比值,如图6所示,具体包括:

步骤401,计算该声音传感器采集到的M帧声音数据中的每帧声音数据的高频比值,M为大于1的整数。

具体的,针对每个声音传感器,M帧声音数据优选为该声音传感器连续采集到的M帧声音数据,针对每帧声音数据,确定该帧声音数据的高频比值。

步骤402,计算M帧声音数据的高频比值的总和N。

具体的,确定M帧声音数据中每帧声音数据的高频比值后,计算M帧声音数据的高频比值的总和N。

步骤403,将所述N除以M所得的结果作为该声音传感器对应的高频比值。

具体的,本发明实施例,针对每个声音传感器,将该声音传感器采集到的M帧声音数据的平均高频比值作为该声音传感器对应的高频比值。

本优选实施方式,通过计算多帧声音数据的高频比值的平均值,将该平均值作为该声音传感器对应的高频比值,使得计算得到的该声音传感器对应的高频比值更加稳定可靠。

优选地,采用如下方式计算该声音传感器采集到的任一帧声音数据的高频比值:

<mrow> <mi>T</mi> <mi>H</mi> <mo>=</mo> <mfrac> <mrow> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mi>n</mi> </mrow> <mn>127</mn> </munderover> <mo>&lsqb;</mo> <msup> <mrow> <mo>(</mo> <msub> <mi>X</mi> <mrow> <mi>i</mi> <mo>_</mo> <mi>r</mi> <mi>e</mi> <mi>a</mi> <mi>l</mi> </mrow> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>+</mo> <msup> <mrow> <mo>(</mo> <msub> <mi>X</mi> <mrow> <mi>i</mi> <mo>_</mo> <mi>i</mi> <mi>m</mi> <mi>a</mi> <mi>g</mi> </mrow> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>&rsqb;</mo> </mrow> <mrow> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>0</mn> </mrow> <mn>127</mn> </munderover> <mo>&lsqb;</mo> <msup> <mrow> <mo>(</mo> <msub> <mi>X</mi> <mrow> <mi>i</mi> <mo>_</mo> <mi>r</mi> <mi>e</mi> <mi>a</mi> <mi>l</mi> </mrow> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>+</mo> <msup> <mrow> <mo>(</mo> <msub> <mi>X</mi> <mrow> <mi>i</mi> <mo>_</mo> <mi>i</mi> <mi>m</mi> <mi>a</mi> <mi>g</mi> </mrow> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>&rsqb;</mo> </mrow> </mfrac> </mrow>

其中,TH表示该声音传感器接收到的第i帧声音数据的高频比值,n为大于0的预设采样点,Xi_real为该声音传感器采集到的第i帧声音频域数据的实部,Xi_imag为该声音传感器采集到的第i帧声音频域数据的虚部,i大于零,并且小于或等于M,i为整数。

其中,n可以为预先设定的特定数值,也可以为根据设定公式计算得到的数值,并且,n为正整数。具体的,根据设定公式计算得到n的方式为:

计算当q为整数时,n等于q;当q为非整数时,n等于q向上取整或者向下取整,其中,fhigh为声音绕射不过去的高频的值,即,当声音的频率高于fhigh时,会产生高频衰减;fs为采样率;常数256为采样点数;其中,可根据如下方式确定fhigh

根据衍射理论,障碍物尺寸大于一定声音频率的波长时,声音衰减比较大,按照声音的传播速度计算公式其中,c等于340米/秒,d表示球机的直径,a为预先设定的常数,比如a=200Hz。

下面结合具体实施例,对本发明实施例提供的声源定位方法进行详细说明。

实施例

假设设置在球机上的声音传感器的个数为两个,两个声音传感器设置在球机上具有摄像头的一侧,两个声音传感器朝向的方向为:与两个所述声音传感器的连线垂直,并且,背向与两个所述声音传感器的连线平行的球机的直径,则本发明实施例提供的声源定位方法,如图7所示,包括:

步骤501,利用第一声音传感器采集来自声源的第一声音时域数据以及利用第二声音传感器采集来自所述声源的第二声音时域数据。

具体的,第一声音传感器采集来自声源的第一声音时域数据,第二声音传感器采集来自该声源的第二声音时域数据;获取声音传感器采集的声音时域数据的方式为:从第一声音传感器中获取第一声音时域数据,并,从第二声音传感器中获取第二声音时域数据;或者,由第一声音传感器将其采集的第一声音时域数据上传至服务器侧的存储器,由第二声音传感器将其采集的第二声音时域数据上传至服务器侧的存储器,从服务器侧的存储器获取第一声音时域数据和第二声音时域数据。

其中,第一声音时域数据是指由第一声音传感器采集的来自声源的声音时域数据,第二声音时域数据是指由第二声音传感器采集的来自声源的声音时域数据,第一声音时域数据和第二声音时域数据来自同一声源。

步骤502,将所述第一声音时域数据转换为第一声音频域数据,并将所述第二声音时域数据转换为第二声音频域数据。

步骤503,根据第一声音频域数据,计算第一声音传感器对应的第一高频比值,并,根据第二声音频域数据,计算第二声音传感器对应的第二高频比值。

具体的,可根据图6提供的内容计算第一高频比值和第二高频比值。

步骤504,计算所述第一高频比值减去所述第二高频比值所得的差值。

步骤505,确定该差值的绝对值大于设定阈值时,确定所述声源所处的方向为所述声音传感器背向的方向。

步骤506,确定该差值的绝对值小于设定阈值时,确定所述声源所处的方向为所述声音传感器朝向的方向。

具体的,第一高频比值如果较大,说明到达第一声音传感器的声音数据的高频衰减较轻,否则,说明到达第一声音传感器的声音数据的高频衰减较重,同理,第二高频比值也具有这种特点。

本发明实施例还提供一种声源定位装置,预先在所述球机上设置多个独立且特性相同的声音传感器,任意两个声音传感器间隔预设距离,该预距离离小于球机的直径,并且每个声音传感器朝向的方向相同,如图8所示,包括:

采集单元801,用于利用所述多个声音传感器采集来自同一声源的声音时域数据;

转换单元802,用于针对每个声音传感器,将该声音传感器采集的声音时域数据转换为声音频域数据;

计算单元803,用于根据该声音传感器对应的声音频域数据,计算该声音传感器对应的高频比值;

方向确定单元804,用于根据所述多个声音传感器对应的高频比值,确定所述声源所处的方向,其中,所述声源所处的方向为所述声音传感器朝向的方向或者所述声音传感器背向的方向。

优选地,所述声音传感器的个数为两个,所述预设距离大于或等于球机的半径。

优选地,所述声音传感器设置在球机上具有摄像头的一侧,所述声音传感器朝向的方向为:与两个所述声音传感器的连线垂直,并且,背向与两个所述声音传感器的连线平行的球机的直径。

优选地,所述装置中,所述方向确定单元具体用于:

计算两个声音传感器对应的高频比值之间的差值;

确定所述差值的绝对值大于设定阈值时,确定所述声源所处的方向为所述声音传感器背向的方向;

确定所述差值的绝对值小于设定阈值时,确定所述声源所处的方向为所述声音传感器朝向的方向。

优选地,所述装置中,所述计算单元具体用于:

计算该声音传感器采集到的M帧声音数据中的每帧声音数据的高频比值,M为大于1的整数;

计算M帧声音数据的高频比值的总和N;

将所述N除以M所得的结果作为该声音传感器对应的高频比值。

优选地,所述装置中,所述计算单元用于采用如下方式计算该声音传感器采集到的任一帧声音数据的高频比值:

<mrow> <mi>T</mi> <mi>H</mi> <mo>=</mo> <mfrac> <mrow> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mi>n</mi> </mrow> <mn>127</mn> </munderover> <mo>&lsqb;</mo> <msup> <mrow> <mo>(</mo> <msub> <mi>X</mi> <mrow> <mi>i</mi> <mo>_</mo> <mi>r</mi> <mi>e</mi> <mi>a</mi> <mi>l</mi> </mrow> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>+</mo> <msup> <mrow> <mo>(</mo> <msub> <mi>X</mi> <mrow> <mi>i</mi> <mo>_</mo> <mi>i</mi> <mi>m</mi> <mi>a</mi> <mi>g</mi> </mrow> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>&rsqb;</mo> </mrow> <mrow> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>0</mn> </mrow> <mn>127</mn> </munderover> <mo>&lsqb;</mo> <msup> <mrow> <mo>(</mo> <msub> <mi>X</mi> <mrow> <mi>i</mi> <mo>_</mo> <mi>r</mi> <mi>e</mi> <mi>a</mi> <mi>l</mi> </mrow> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>+</mo> <msup> <mrow> <mo>(</mo> <msub> <mi>X</mi> <mrow> <mi>i</mi> <mo>_</mo> <mi>i</mi> <mi>m</mi> <mi>a</mi> <mi>g</mi> </mrow> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>&rsqb;</mo> </mrow> </mfrac> </mrow>

其中,TH表示该声音传感器接收到的第i帧声音数据的高频比值,n为大于0的预设采样点,Xi_real为该声音传感器采集到的第i帧声音频域数据的实部,Xi_imag为该声音传感器采集到的第i帧声音频域数据的虚部。

利用本发明实施例提供的声源定位方法及装置,具有以下有益效果:

通过多个声音传感器对应的高频比值,确定声源所处的方向是否为多个声音传感器朝向的方向,并控制球机转动到声源所处的方向;之后,根据声音数据到达任意两个声音传感器的时延,确定球机在180度范围内的转动角度,从而实现了球机在360度范围内对声源进行定位,进而提高了声源定位的准确性,解决了现有技术中存在的问题。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1