远场声源定位系统和方法与流程

文档序号:13759421阅读:692来源:国知局
远场声源定位系统和方法与流程

本申请涉及远场声源定位技术领域,具体涉及一种远场声源定位系统和方法。



背景技术:

到达时间差(Time Difference of Arrival,简称TDOA)定位技术是目前最主流的声源定位技术,通过几何建模,根据麦克风拾取到远场声源的信息。经过互相关算法算出相对延时,再通过延时和阵列距离估算出声源角度。

传统的麦克风阵列通过TDOA实现定位,通常对阵列的尺寸有一定的要求。原因在于如果麦克风阵列的尺寸过小,即各麦克风的间距过近,会导致远场声源到达各麦克风的声音信号过于相近,很难通过互相关算法来算出声源从远场到达麦克风阵列的时间差即延时,同时,过小的阵列尺寸会产生很大误差,难以准确计算声源相对于麦克风阵列的角度。最终导致远场声源的角度定位的精度大幅下降。



技术实现要素:

鉴于现有技术中的上述缺陷或不足,期望提供一种能通过小尺寸麦克风阵列对远场声源的角度进行精准定位的远场声源定位系统和方法。

第一方面,本发明提供一种远场声源定位系统,所述系统包括:

麦克风阵列,包括至少两个麦克风,各所述麦克风分别用于采集声源的声音信息;

空间分集定位单元,用于建立空间坐标系,根据各所述麦克风在所述空间坐标系中的位置将空间划分为若干个子集,根据各所述声音信息确定所述声源所在的子集;

虚拟相位定位单元,用于分别对各所述麦克风中每一对麦克风进行虚拟相位定位;其中,所述虚拟相位定位包括:对所述一对麦克风所采集的两个声音信息进行虚拟相位迁移以获得放大相位差,并根据与所述虚拟相位迁移对应的逆函数确定真实相位差,根据所述真实相位差确定所述声源相对于所述一对麦克风的入射角;

统计定位单元,用于对各所述入射角进行统计分析,确定所述声源相对于所述系统的角度信息。

第二方面,本发明提供一种远场声源定位方法,所述方法包括:

麦克风阵列中的各麦克风分别采集声源的声音信息;

建立空间坐标系,根据各所述麦克风在所述空间坐标系中的位置将空间划分为若干个子集,根据各所述声音信息确定所述声源所在的子集;

分别对各所述麦克风中每一对麦克风进行虚拟相位定位;其中,所述虚拟相位定位包括:对所述一对麦克风所采集的两个声音信息进行虚拟相位迁移以获得放大相位差,并根据与所述虚拟相位迁移对应的逆函数确定真实相位差,根据所述真实相位差确定所述声源相对于所述一对麦克风的入射角;

对各所述入射角进行统计分析,确定所述声源相对于所述系统的角度信息。

本发明诸多实施例提供的远场声源定位系统和方法根据麦克风阵列的各麦克风在空间坐标系中的位置将空间划分为若干个子集,并根据各麦克风采集的声音信息确定声源所在的子集,再通过分别对各所述麦克风中每一对麦克风进行虚拟相位定位,即通过放大相位差再求逆以获得精准的真实相位差,确定声源对每一对麦克风的入射角,最后对各入射角进行统计分析,确定声源的角度信息,实现了通过小尺寸麦克风阵列对远场声源的角度进行精准定位;

本发明一些实施例提供的远场声源定位系统和方法进一步根据空间坐标系和各所述入射角建立几何模型,将声源对每一对麦克风的入射角分别转换为声源对麦克风阵列的入射角,从而实现声源对麦克风阵列的入射角的精确统计分析。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:

图1为本发明一实施例中远场声源定位系统的结构示意图。

图2为本发明一实施例中远场声源定位方法的流程图。

图3为图2所示方法的一优选实施方式中步骤S40的流程图。

图4为本发明一优选实施例中根据各麦克风的位置将空间划分为若干个子集并确定声源所在子集的示意图。

图5为图2所示方法的一优选实施方式中步骤S60的流程图。

图6为本发明一优选实施例中对各所述麦克风进行两两配对的示意图。

图7为本发明一优选实施例中对一对麦克风进行虚拟相位定位的示意图。

图8为图2所示方法的一优选实施方式中步骤S80的流程图。

图9为图8所示步骤S80的一种优选实施方式的流程图。

具体实施方式

下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与发明相关的部分。

需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

图1为本发明一实施例中远场声源定位系统的结构示意图。

如图1所示,在本实施例中,本发明提供的远场声源定位系统包括麦克风阵列10、空间分集定位单元30、虚拟相位定位单元50和统计定位单元70。

其中,麦克风阵列10包括至少两个麦克风,各所述麦克风分别用于采集声源的声音信息。

空间分集定位单元30用于建立空间坐标系,根据各所述麦克风在所述空间坐标系中的位置将空间划分为若干个子集,根据各所述声音信息确定所述声源所在的子集。

虚拟相位定位单元50用于分别对各所述麦克风中每一对麦克风进行虚拟相位定位。其中,所述虚拟相位定位包括:对所述一对麦克风所采集的两个声音信息进行虚拟相位迁移以获得放大相位差,并根据与所述虚拟相位迁移对应的逆函数确定真实相位差,根据所述真实相位差确定所述声源相对于所述一对麦克风的入射角。

统计定位单元70用于对各所述入射角进行统计分析,确定所述声源相对于所述系统的角度信息。

图2为本发明一实施例中远场声源定位方法的流程图。图2所示的远场声源定位方法可对应应用于图1所示的系统中。

如图2所示,在本实施例中,本发明提供的远场声源定位方法包括:

S20:麦克风阵列中的各麦克风分别采集声源的声音信息;

S40:建立空间坐标系,根据各所述麦克风在所述空间坐标系中的位置将空间划分为若干个子集,根据各所述声音信息确定所述声源所在的子集;

S60:分别对各所述麦克风中每一对麦克风进行虚拟相位定位;

S80:对各所述入射角进行统计分析,确定所述声源相对于所述系统的角度信息。

其中,所述虚拟相位定位包括:对所述一对麦克风所采集的两个声音信息进行虚拟相位迁移以获得放大相位差,并根据与所述虚拟相位迁移对应的逆函数确定真实相位差,根据所述真实相位差确定所述声源相对于所述一对麦克风的入射角。

具体地,在本实施例中,所述声源为远场声源。麦克风阵列10为平面的圆形麦克风阵列。在更多实施例中,麦克风阵列10可根据实际需求设置为不同形状的平面麦克风阵列,或不同形状的立体麦克风阵列,均可实现相同的技术效果,利用小尺寸的麦克风阵列完成对远场声源的精准定位。

在步骤S20中,麦克风阵列10中的各麦克风分别采集远场声源的声音信息;

在步骤S40中,空间分集定位单元30根据各所述麦克风的位置建立空间坐标系,例如取麦克风阵列的中心点为原点,在平面麦克风阵列所在的平面作为X轴-Y轴平面,在更多实施例中可根据实际需求以不同方式建立空间坐标系;根据各所述麦克风在所述空间坐标系中的位置将空间划分为若干个子集,根据各所述麦克风采集的各声音信息依次判断所述声源距离哪个麦克风更近,以确定所述声源所在的子集。

在步骤S60中,虚拟相位定位单元50依次对各所述麦克风中每一对麦克风进行虚拟相位定位。例如,当麦克风阵列包括3个麦克风A、B、C时,依次对每一对麦克风(A,B)、(A,C)、(B,C)进行虚拟相位定位。以对麦克风A和B进行虚拟相位定位为例,根据预设的函数分别对麦克风A采集的声音信息a和麦克风B采集的声音信息b进行虚拟相位迁移,从而放大声音信息a和声音信息b的相位差,并计算出放大相位差,再根据预设的逆函数对放大相位差进行计算,获得声音信息a和声音信息b的真实相位差,最后利用TDOA定位法根据真实相位差确定所述声源相对于一对麦克风(A,B)的入射角。

在步骤S80中,统计定位单元70对虚拟相位定位单元50计算出的各所述入射角进行统计分析以确定所述声源相对于所述系统的入射角度信息。

上述实施例根据麦克风阵列的各麦克风在空间坐标系中的位置将空间划分为若干个子集,并根据各麦克风采集的声音信息确定声源所在的子集,再通过分别对各所述麦克风中每一对麦克风进行虚拟相位定位,即通过放大相位差再求逆以获得精准的真实相位差,确定声源对每一对麦克风的入射角,最后对各入射角进行统计分析,确定声源的角度信息,实现了通过小尺寸麦克风阵列对远场声源的角度进行精准定位。

图3为图2所示方法的一优选实施方式中步骤S40的流程图。

如图3所示,在一优选实施例中,步骤S40包括:

S41:建立空间坐标系;

S43:以各所述麦克风中每一对麦克风的中垂面为界线,将空间划分为若干个子集;

S45:分别根据每一对麦克风所采集的两个声音信息判断所述声源在各所述中垂面的哪一侧,以确定所述声源所在的子集。

图4为本发明一优选实施例中根据各麦克风的位置将空间划分为若干个子集并确定声源所在子集的示意图。

具体地,如图4所示,在步骤S41中,空间分集定位单元30建立空间坐标系;

在步骤S43中,空间分集定位单元30以麦克风阵列10中的4个麦克风中任意两个麦克风的中垂面为界线,将空间划分为8个子集;

在步骤S45中,空间分集定位单元30依次判断声源90更靠近哪一麦克风,例如,根据麦克风101采集的第一声音信息和麦克风102采集的第二声音信息判断出声源90更靠近麦克风102,再根据麦克风102采集的第二声音信息和麦克风103采集的第三声音信息判断出声源90更靠近麦克风103,即可确定,声源90位于子集7中。

图5为图2所示方法的一优选实施方式中步骤S60的流程图。图6为本发明一优选实施例中对各所述麦克风进行两两配对的示意图。

如图5-6所示,在一优选实施例中,步骤S60包括依次对麦克风阵列10中的每一对麦克风执行子步骤S61-S69:

S61:对所述一对麦克风中远离所述声源的第一麦克风所采集的第一声音信息进行虚拟相位后移,得到第三声音信息;

S63:对所述一对麦克风中靠近所述声源的第二麦克风所采集的第二声音信息进行虚拟相位前移,得到第四声音信息;

S65:根据所述第三声音信息和所述第四声音信息计算得到放大相位差;

S67:根据所述放大相位差、虚拟相位后移求逆函数、虚拟相位前移求逆函数计算得到真实相位差;

S69:根据所述真实相位差确定所述声源的入射角。

图7为本发明一优选实施例中对一对麦克风进行虚拟相位定位的示意图。

具体地,如图7所示,以对麦克风101和102进行虚拟相位定位为例:

在步骤S61中,对远离声源90的麦克风101所采集的第一声音信息进行虚拟相位后移,得到第三声音信息;

在步骤S63中,对靠近声源90的麦克风102所采集的第二声音信息进行虚拟相位前移,得到第四声音信息;

在步骤S65中,根据所述第三声音信息和所述第四声音信息计算得到放大相位差;

在步骤S67中,根据所述放大相位差、虚拟相位后移求逆函数、虚拟相位前移求逆函数计算得到第一声音信息和第二声音信息的真实相位差;

在步骤S69中,利用TDOA定位法根据第一声音信息和第二声音信息的真实相位差确定声源90相对于麦克风101和102的第一入射角。

循环步骤S61-S69,分别得到声源90相对于麦克风101和102的第一入射角、相对于麦克风101和103的第二入射角、相对于麦克风101和104的第三入射角、相对于麦克风102和103的第四入射角、相对于麦克风102和104的第五入射角,相对于麦克风103和104的第六入射角。

图8为图2所示方法的一优选实施方式中步骤S80的流程图。

如图8所示,在一优选实施例中,步骤S80包括:

S83:根据所述空间坐标系将各所述入射角分别转换为相对于所述系统的入射角,并建立几何模型;

S85:对各相对于所述系统的入射角进行统计分析,确定所述声源相对于所述系统的角度信息。

具体地,以上述麦克风阵列包括麦克风101-104的实施例为例,在步骤S83中,统计定位单元70将第一入射角至第六入射角分别在所述空间坐标系中转换为相对于所述系统的第七入射角至第十二入射角,并建立几何模型;

在步骤S85中,统计定位单元70对第七入射角至第十二入射角进行统计分析,最终确定声源90相对于所述系统的角度信息。

上述实施例进一步根据空间坐标系和各所述入射角建立几何模型,将声源对每一对麦克风的入射角分别转换为声源对麦克风阵列的入射角,从而实现声源对麦克风阵列的入射角的精确统计分析。

图9为图8所示步骤S80的一种优选实施方式的流程图。

如图9所示,在一优选实施例中,步骤S83之前还包括:

S81:根据各所述声音信息判断所述声源位于近场或远场,并根据判断结果选择对应的建模类型。

具体地,在步骤S81中,根据各所述声音信息的延时判断声源位于近场还是远场:

若所述声源位于近场,则在步骤S83中建立对应的近场声源的几何模型,并在步骤S85中确定声源的角度信息,同时结合各所述声音信息的幅度信息确定近场声源的位置;

若所述声源位于远场,则在步骤S83中建立对应的远场声源的几何模型,并在步骤S85中确定声源的角度信息。

在本实施例中,麦克风阵列10为平面麦克风阵列,各所述麦克风位于同一平面上。

在一些优选实施例中,麦克风阵列10为立体麦克风阵列,各所述麦克风不位于同一平面上。

更具体地,在本实施例中,麦克风阵列10为圆形阵列,在更多实施例中,麦克风阵列10还可根据实际需求设置为正三角形阵列、直线阵列、正多边形阵列、球形阵列等中心对称阵列,以简化计算任务;还可根据实际需求设置为其它形状的阵列或不规则形状的阵列,同样可以通过本发明提供的远场声源定位系统和方法实现小尺寸阵列的远场声源角度的精准定位。

附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,所述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这根据所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以通过执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以通过专用硬件与计算机指令的组合来实现。

描述于本申请实施例中所涉及到的单元或模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元或模块也可以设置在处理器中,例如,空间分集定位单元、虚拟相位定位单元和统计定位单元可以是设置在计算机或移动智能设备中的软件程序,通过有线或无线的方式与麦克风阵列连接;也可以是与麦克风阵列集成、单独进行远场声源识别的硬件装置。其中,这些单元或模块的名称在某种情况下并不构成对该单元或模块本身的限定,例如,虚拟相位定位单元还可以被描述为“用于通过虚拟相位迁移提高相位差计算的精确度的高精度定位单元”。

作为另一方面,本申请还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中所述装置中所包含的计算机可读存储介质;也可以是单独存在,未装配入设备中的计算机可读存储介质。计算机可读存储介质存储有一个或者一个以上程序,所述程序被一个或者一个以上的处理器用来执行描述于本申请的公式输入方法。

以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1