基于传声器镜像的室内声源定位方法与流程

文档序号:12658940阅读:391来源:国知局
基于传声器镜像的室内声源定位方法与流程

本发明涉及一种室内声源定位方法,特别涉及一种基于传声器镜像的室内声源定位方法。



背景技术:

文献“Sparse sound field decomposition using group sparse Bayesian learning,in 2015Asia-Pacific Signal and Information Processing Association Annual Summit and Conference(APSIPA),2015,pp.850-855.”公开了一种室内声源定位方法。该方法将直达声和混响声分解为单独的声源信息以及多个虚源的混响信息,采集多个接收信号,在室内和室外空间划分网格,构建字典求解来进行室内声源定位。文献所述方法基于虚声源法,将室内的混响信息分解为由声源以及房间外多个虚源辐射声波的叠加,基于这些信息可将房间内部的直达声和混响声分解。然而,当室内混响较强时,为满足声能量衰减为10%以下的要求,空间内设定网格点数目会极大地增加,这将导致求解时所构造字典的相应的维数产生相应的扩张。而稀疏求解时,字典原子个数的增多会增加求解的计算成本,降低计算效率,这将严重影响声源定位的实时输出。



技术实现要素:

为了克服现有室内声源定位方法复杂的不足,本发明提供一种基于传声器镜像的室内声源定位方法。该方法以室内多传声器的采集数据为输入,将室内各接收点位置、房间尺寸信息与虚声源法结合建立信号模型,并借助传声器镜像构建求解字典,最后采取Lasso优化算法进行求解,求出的位置向量可直接获取声源的位置信息;在定位计算时,使用基于传声器镜像的字典构建字典,可以显著提升算法计算效率,提高室内声源定位的实时效率,方法简单易行。

本发明解决其技术问题所采用的技术方案:一种基于传声器镜像的室内声源定位方法,其特点是包括以下步骤:

步骤一、在室内布置多个传声器,所述传声器为无指向性型。对于1000~2000频率段,传声器与声源的距离大于0.2m。采集信号工作实时同步完成,数据预处理的采样频率为16kHz以上,录制时间不超过30s。

步骤二、对于尺寸为lx×ly×lz的房间,任意接收点镜像的空间坐标表示为

xi=2l·lx±xm

yi=2m·ly±ym (1)

zi=2n·lz±zm

式中,接收点位置为rm=(xm,ym,zm)),某级接收点镜像的位置为ri=(xi,yi,zi),l、m、n是界于-∞和+∞之间的整数,镜像对应的反射级数由(2)式给出

N=|2l-Δl|+|2m-Δm|+|2n-Δn| (2)

Δl=1表示求xi式中xm前取负;Δl=0表示求xi式中xm前取正;Δm=1表示求yi式中ym前取负;Δm=0表示求yi式中ym前取正;Δn=1表示求zi式中zm前取负;Δn=0表示求zi式中zm前取正;N=0时表示传声器本身,所以无反射级数。

步骤三、对于房间内某一二维平面,平均吸声系数大于0.1,房间内部空间沿各方向按照距离间隔Δx、Δy和Δz划分网格,每个网格点gj的位置信息取网格点中心位置,设总网格点数为G。

步骤四、计算各传声器位置及其一定阶数镜像的位置rni与每个网格点位置gj之间的距离|rni-gj|,将所述距离|rni-gj|与对应的镜像级数和频率联合运算,求解字典矩阵Df中的各元素,Df的维度为M×G。

式中,f为频率,c为空气中的声速,N0为传声器镜像的最高阶数。

步骤五、将传声器信号的频域表示yf和各频率的字典矩阵Df作为输入,采取Lasso优化算法求解xf

yf=Dfxf (5)

步骤六、基于频域表示yf和字典矩阵Df,根据公式(5),选择l1范数作为求解方法获取各单独频率下以及联合频率下的位置向量xf和x,二者具有相同的维度。式中,y∈CM×1,x,xf∈CG×1,Df∈CM×G。在进行室内声定位时,房间内的网格点数目N远远大于 传声器个数M。相对于整个房间,x具有稀疏性,给x加稀疏约束求解方程。

步骤七、选取基于Lasso优化算法,构建如下的单频率及多频率的目标函数:

其中,λ是需要调节的参数,用来平衡估计误差和信号稀疏度。

步骤八、根据式(6)和式(7)求解结果xf和x,其最大值对应的网格点位置为该频率点下定位得到的声源位置。

本发明的有益效果是:该方法以室内多传声器的采集数据为输入,将室内各接收点位置、房间尺寸信息与虚声源法结合建立信号模型,并借助传声器镜像构建求解字典,最后采取Lasso优化算法进行求解,求出的位置向量可直接获取声源的位置信息;在定位计算时,使用基于传声器镜像的字典构建字典,可以显著提升算法计算效率,提高室内声源定位的实时效率,方法简单易行。

假设室内划分为a2个网格点,则对于背景技术方法字典对应的网格点数目为(2n+1)2*a2个,n为与房间混响相关的虚源层数,房间混响越强烈,层数n数值也越大。而对于本发明方法,在对房间混响或平均吸声有预估的基础上,最终所构造字典对应的网格点数目为a2个,且网格点数目不会因房间混响的强弱而改变。假设n=2,房间内部网格点为10×10,背景技术方法计算时的网格点为2500,求解需要1小时,然而本发明方法在预先不考虑接收点虚源计算时间时,只需要100个网格点,求解只需要2.4分钟。

下面结合附图和具体实施方式对本发明作详细说明。

附图说明

图1是本发明基于传声器镜像的室内声源定位方法的流程图。

图2是本发明方法用测试系统连接框图。

图3是不同信噪比下的定位对比结果曲线。

具体实施方式

参照图1-3。本发明基于传声器镜像的室内声源定位方法具体步骤如下:

步骤一、在室内布置多个传声器采集数据,要求传声器为无指向性型,此外,根据所选的频频范围,传声器应选择尽可能小尺寸的,这有利于提高在测点附近的所采 集声场数据的精度。对于1000Hz,对应的半波长为0.172m。在本方法中,一般选取1000~2000的频率段,对于这一频段,传声器与声源的距离大于0.2m便可满足定位要求。在采集信号时,应保证采集工作是实时同步完成的,对于数据预处理,保证16kHz以上的采样频率,录制时间不超过30s。

步骤二、根据虚声源法,对于规则的矩形房间,对于给定点声源位置可直接计算获得该点声源不同反射级数的虚声源。同样的,对于内部的每个传声器位置,也可以直接计算获得该位置对称于各壁面的镜像及其相应的反射级数。对于尺寸为lx×ly×lz的房间,任意接收点镜像的空间坐标可表示为

xi=2l·lx±xm

yi=2m·ly±ym (1)

zi=2n·lz±zm

式中,接收点位置为rm=(xm,ym,zm)),某级接收点镜像的位置为ri=(xi,yi,zi),l、m、n是界于-∞和+∞之间的整数,镜像对应的反射级数可以由下式给出

N=|2l-Δl|+|2m-Δm|+|2n-Δn| (2)

Δl=1表示求xi式中xm前取负;Δl=0表示求xi式中xm前取正;Δm=1表示求yi式中ym前取负;Δm=0表示求yi式中ym前取正;Δn=1表示求zi式中zm前取负;Δn=0表示求zi式中zm前取正;N=0时表示传声器本身,所以无反射级数。

步骤三、对于定位环境,由于声源的虚源的求解受房间形状的限制,此方法只可用于矩形或其他根据形状可直接获取虚源的房间。对于房间的吸声条件,在平均吸声系数大于0.1时,均有高效的定位效果。理论上对于二维、三维房间问题,本方法都可以实现,然而二维到三维的变化会使字典维度急剧增加,限于实际计算机的计算能力,传统方法与改进方法均是对房间内某一二维平面内的进行声源定位。

针对目标房间,将其内部空间沿各方向按照一定的距离间隔Δx、Δy和Δz划分网格,每个网格点gj的位置信息取网格点中心位置,设总网格点数为G。

步骤四、计算各传声器位置及其一定阶数镜像的位置rni与每个网格点位置gj之间的距离,将该距离|rni-gj|与对应的镜像级数、频率联合运算,求解字典矩阵Df中的各元素,Df的维度为M×G。

式中,f为频率,c为空气中的声速,N0为传声器镜像的最高阶数。

步骤五、将传声器信号的频域表示yf和各频率的字典矩阵Df作为输入,采取Lasso优化算法求解xf

yf=Dfxf (5)

步骤六、基于yf和Df,根据公式(5),选择l1范数作为求解方法来获取各单独频率下以及联合频率下的位置向量xf和x,二者具有相同的维度。式中,y∈CM×1,x,xf∈CG×1,Df∈CM×G。在进行室内声定位时,房间内的网格点数目N远远大于传声器个数M。实际环境中,室内一般仅存在少数几个发声声源,因此相对于整个房间,x具有稀疏性,可以给x加稀疏约束来求解方程。

步骤七、选取基于Lasso优化算法,构建如下的单频率及多频率的目标函数:

其中,λ是需要调节的参数,用来平衡估计误差和信号稀疏度。

步骤八、根据式(6)和式(7)求解结果xf和x,其最大值对应的网格点位置为该频率点下使用本方法定位得到的声源位置。

应用实施例:

房间为一封闭矩形空间。其长宽高分别为lx=3m,ly=3m,lz=3m。

步骤1、在封闭房间内部选定同一高度z=1m,布置15阵元的线性传声器阵列,阵列位置为x=1.44m,y方向间隔为0.2m,起始端传声器位置为y=0.1m。

步骤2、根据房间尺寸,选定z=1m的平面为主要参考区域,x、y方向各划分10段来进行网格划分,即房间内部的网格点为100个,网格间距为10cm。网格坐标取网格中心位置坐标。

步骤3、根据房间壁面材料,通过查表或测量室内混响时间确定房间壁面的平均声压反射系数β0

步骤4、随机选取一个预划分的网格点作为声源位置,按照附图2连接电脑,以及相应的采集设备。

步骤5、开启所有设备和声源,持续播放预定的白噪声信号并设定所采集时域信号的采样频率并进行录制,保存数据。对各保存数据做短时傅立叶变换,获取各传声器信号的频域表示yf

步骤6、选定坐标参考点,测量各传声器在房间内的相对位置,根据房间内部网格点划分,求解各传声器镜像的坐标信息以及各镜像的反射级数。

步骤7、根据各传声器镜像、镜像反射级数以及各壁面吸声系数,根据公式(3)求解房间内各网格点对应的字典原子,形成各频率点下的字典Df

步骤8、基于yf和Df,根据式(5)、(6)、(7),选择l1范数作为超定方程组的求解方法来获取各单独频率下的位置向量xf以及联合各频率点数据求解的位置向量x。

步骤9、根据求解结果,xf、x中最大值对应的网格点即为该频率点下使用本方法定位得到的声源位置。

在本实施例中,分别对得到的采集信号做不同的信噪比处理并进行定位,选定频率范围为2kHz~2.3kHz。分别统计两种方法的计算时间,结果见表1。

表1两种方法计算时间对比统计

根据计算效率结果,背景技术方法的运行速度受房间混响程度的影响,在房间混响较大时,需要划分较多的网格点来进行求解,因而耗费时间较多,而本发明方法的计算时间不受房间混响程度的影响,它只于房间划分的网格点数有直接的关系,网格点数目越多,求解向量维度越高,耗费时间越多。

最后,验证所提方法在不同信噪比下的定位精度性能,参照图3,单一频率点的信号定位准确率达到85%以上需要信噪比高于15dB,而对于多频点的联合求解,在信噪比高于-5dB时,就可以达到100%的定位精度,这证明了本发明方法的有效性。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1