一种基于麦克风阵列的机器人声源定位方法与流程

文档序号:16259998发布日期:2018-12-14 21:25阅读:458来源:国知局
一种基于麦克风阵列的机器人声源定位方法与流程

本发明涉及声源定位技术,特别涉及一种基于麦克风阵列的移动机器人空间声源定位技术,即利用多个麦克风组成的拓扑结构计算空间中的声源位置及方向的一种方法。

背景技术

声源定位在音视频会议系统、语音识别系统、语音控制系统和机器人交互方面都有重要的应用。大多数的声源定位方法一般是基于麦克风阵列的方法。在机器人声源定位中,由于机器人的体积限制,要求麦克风阵列的尺寸较小,大多数情况下,与声源距麦克风阵列的距离相比较,麦克风阵列的大小是可以忽略的。又因为机器人的计算能力,一般要求麦克风阵列的阵元数目较少。

文献[1,2]通过建立一个三维坐标系,在x,y和z轴上分别放置两个麦克风,构成具有6个阵元的麦克风阵列用于声源定位。这也是声源定位中常用的拓扑结构。文献[3]则在坐标原点多加了一个麦克风,使计算过程稍显简便。文献[4]是另一种类型的声源定位方法,只使用了两个麦克风,但需要通过利用麦克风的运动才能定位声源。

本发明使用了文献[1,2]中的麦克风阵列拓扑结构,并在此基础上获得声源的距离。但在声源位置的计算过程中,对文献[4]的声源定位算法进行了改进,利用麦克风之间的相对位置,替代了文献[4]里声源定位过程中所需的旋转运动,从而获取了声源位置。

参考文献

[1]赵圣.基于麦克风阵列的仿人智能机器人声源定位技术的研究[d].哈尔滨:哈尔滨工业大学,2013.

[2]赵圣,崔牧凡,尤磊,王鸿鹏.基于小型麦克风阵列的声源定位技术[j].华中科技大学学报(自然科学版),2013,41(s1):188-191.

[3]y.c.guo,k.k.songgong,n.zhang.soundsourcelocalizationalgorithmbasedonseven-microphonearrayandphat-gccmethod[j].wittransactionsonengineeringsciences,2015,98:568-575

[4]laurentkneip,claudebaumann.binauralmodelforartificialspatialsoundlocalizationbasedoninterauraltimedelaysandmovementsoftheinterauralaxis.j.acoust.soc.am.2008,124(5):3108-3119.



技术实现要素:

本发明的目的在于提供一种基于麦克风阵列的机器人声源定位方法。

本发明的目的是这样实现的:

一种基于麦克风阵列的机器人声源定位方法,其特征在于,包括如下步骤:

(1)构造麦克风阵列,该阵列包含六个麦克风mi(i=1,2,…,6),若以麦克风阵列的几何中心为声源定位空间的原点o,并以点o建立空间直角坐标系o-xyz,则o的坐标为(0,0,0),m1的坐标为(l,0,0),m2的坐标为(-l,0,0),m3的坐标为(0,l,0),m4的坐标为(0,-l,0),m5的坐标为(0,0,l),m6的坐标为(0,0,-l),l为大于0的实数;

(2)利用互相关算法计算声源信号到各麦克风对之间的时延差,设麦克风mi接收到的连续信号经采样后的数字信号为xi(m),设采样周期为t,则nt时刻xi(m)与xj(m)之间的短时互相关函数为

其中w(n)为窗函数,窗长为n,求使值最大的索引值iij,

那么xi(m)和xj(m)之间的时延差为

τij=iij·t

(3)计算声源s到坐标原点o的距离r,设s到各麦克风mi之间的距离为di,当声源s到坐标原点o的距离r>4l时,可以用声源到o-xy平面上任一麦克风的距离di作为其r的估计值,令τi为声源信号从s传播到mi所需的时间,取声源s到麦克风m1的距离d1作为r的估计值,有

d1=c·τ1

r≈d1

其中c为声音在空气中的传播速度;

(4)计算声源s的坐标,由点o向点s作射线与x,y,z轴正方向形成的夹角分别为φx,φy和φz,则φx,φy,φz与τij,l,c之间存在如下近似关系,

则声源s的坐标(x,y,z)的值为

x=r·cosφx

y=r·cosφy

z=r·cosφz

(5)求声源方位角θ和俯仰角由θ与s的坐标(x,y,z)的几何关系

可得

与s的坐标(x,y,z)和r的几何关系

可得

或直接由和φz的关系得

(6)至此,求得声源s的坐标为(x,y,z),方位角θ,俯仰角

由于采用上述技术方案,本发明提供的一种基于麦克风阵列的机器人声源定位方法,与现有技术相比具有这样的有益效果:

第一,当声源距离麦克风阵列较远时,可认为声源到任一麦克风的距离作为声源到麦克风阵列几何中心的距离r的估计值。当r>4l时,则认为声源与麦克风阵列之间的距离较远。根据这一假设,在步骤(3)中,以声源s到某一麦克风的距离di作为声源s到坐标原点o的距离r的估计值,这对于后面步骤中对坐标及声源角度的估计,降低了计算复杂度。这里d1的计算为例,说明r的计算过程。根据声源s的坐标(x,y,z)和各麦克风的坐标,可以得到s与mi之间的距离di,

由上式可知如下关系,

由图3可知,

联立式(1)和(2)可得

d1=c·τ1(3)

从而得到r的估计值d1,本步骤的部分推导借鉴了文献[1-3]中的推导方法。

第二,当麦克风阵列固定不动时,且麦克风mi和mj之间的时延值τij为一定值时,则声源s会位于三维空间中某一特定的双叶双曲面h上,该双曲面h以mi和mj的坐标为焦点,如图6所示,图中的点表示麦克风所在位置。双曲面有一个渐近锥,双曲面与其对应渐近锥的关系如图7所示,渐近锥位于双曲面外部,图中用网格线表示,且只表示了渐近锥的一部分。过声源s与双曲面焦点所在的轴作一平面,该平面与双曲面及其渐近锥相交,得到与双曲面对应的双曲线及其渐近线,如图8所示。设渐近线与坐标轴所成的夹角为α,设os与坐标轴所成的夹角为β,设mi与mj之间的距离为lij,则存在如下关系

当声源s距坐标原点的距离大于2lij时,有

α≈β(5)

若麦克风阵列的拓扑结构如图2所示,声源s位于空间某一位置时,根据时延和麦克风对的位置的几何关系,由m1和m2可得双曲面h12,由m3和m4可得双曲面h34,由m5和m6可得双曲面h56,而声源s必位于h12、h34和h56的交点上。设h12、h34和h56对应的渐近锥分别c12、c34和c56,因为声源s离曲面c12、c34和c56的距离都很近,可以假定声源s位于c12、c34和c56上,则c12、c34和c56相应的渐近线与对应轴所构成的夹角分别为βx,βy和βz。由点o向点s作射线与x,y,z轴正方向形成的夹角分别为φx,φy和φz,如图7所示。当声源与坐标原点距离较远时,有

所以,根据式(4)和(5)可以获得φx,φy和φz的估计值。本发明通过以上步骤中的假设,避免了复杂计算,提高了声源定位效率。本步骤的部分推导借鉴了文献[4]中的推导方法。

综上,利用麦克风阵列阵元之间的时延估计值,通过较为简单的计算就可获得声源的空间位置,当应用于机器人声源定位时,对于提高机器人的环境感知能力和人机交互能力具有重要意义。

附图说明

图1是声源定位方法流程图。

图2是麦克风阵列拓扑结构图。

图3是声源位置与o-xy平面内四元麦克风的几何关系图。

图4是声源与三个坐标轴所成角度示意图

图5是声源方位角θ和俯仰角示意图。

图6是麦克风对之间特定声源时延差所对应的双曲面示意图。

图7是双曲面及其渐近锥对应位置关系示意图。

图8是双曲面及其渐近锥的剖面示意图。

具体实施方式

下面结合附图举例对本发明做详细的描述:

一种机器人三维空间声源定位方法,其具体实施方法如图1所示,现根据图1对本发明方法做详细说明如下:

(1)构造麦克风阵列,如图2所示,该阵列包含六个麦克风mi(i=1,2,…,6),若以麦克风阵列的几何中心为声源定位空间的原点o,并以点o建立空间直角坐标系o-xyz,则o的坐标为(0,0,0),m1的坐标为(l,0,0),m2的坐标为(-l,0,0),m3的坐标为(0,l,0),m4的坐标为(0,-l,0),m5的坐标为(0,0,l),m6的坐标为(0,0,-l),l为大于0的实数;

(2)利用互相关算法计算声源信号到各麦克风对之间的时延差,设麦克风mi接收到的连续信号经采样后的数字信号为xi(m),麦克风mj接收到的连续信号经采样后的数字信号为xj(m),设采样周期为t,则nt时刻xi(m)与xj(m)之间的短时互相关函数为

其中w(n)为窗函数,窗长为n,m为求和范围,k表示两个信号之间的滞后关系

求使值最大的索引值iij,

那么xi(m)和xj(m)之间的时延差为

τij=iij·t

(3)计算声源s到坐标原点o的距离r,设s到各麦克风mi之间的距离为di,如图3所示,当声源s到坐标原点o的距离r>4l时,可以用声源到o-xy平面上任一麦克风的距离di作为其r的估计值,令τi为声源信号从s传播到mi所需的时间,取声源s到麦克风m1的距离d1作为r的估计值,有

d1=c·τ1

r≈d1

其中c为声音在空气中的传播速度;

(4)计算声源s的坐标,由点o向点s作射线与x,y,z轴正方向形成的夹角分别为φx,φy和φz,如图4所示,则φx,φy,φz与τij,l,c之间存在如下近似关系,

则声源s的坐标(x,y,z)的值为

x=r·cosφx

y=r·cosφy

z=r·cosφz

(5)求声源方位角θ和俯仰角如图5所示,由θ与s的坐标(x,y,z)的几何关系

可得

与s的坐标(x,y,z)和r的几何关系

可得

或直接由和φz的关系得

(6)至此,求得声源s的坐标为(x,y,z),方位角θ,俯仰角

以上所述,仅为本发明创造较佳的具体实施方式,但本发明创造的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明创造披露的技术范围内,根据本发明创造的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明创造的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1