本发明涉及声学定位,更具体地说,本发明涉及一种基于空间声场重构的移动声源实时跟踪定位方法。
背景技术:
1、空间声场重构指的是通过一系列技术手段,对特定空间内的声音场进行重新构建或模拟的过程。在会议同传、沉浸式演出等场景中,对移动声源的实时跟踪定位具有极高的需求。传统的声源跟踪系统大多依赖固定阵列,在开放室内环境中,难以实现移动声源的连续定位与声像重塑,导致听众感知到的声源位置与实际发声体存在空间不一致性,影响语音可懂度与声场沉浸感。
2、现有技术存在的不足:
3、现有的声源定位方法在定位精度、实时性以及对环境的适应性等方面存在不足。部分方法定位延迟较高,无法满足实时跟踪的需求;有些方法在空间声像定位误差和波束指向精度上表现欠佳,难以提供良好的沉浸式体验。因此,亟需一种新的基于空间声场重构的移动声源实时跟踪定位方法,以解决上述问题。
4、针对上述问题,本发明提出一种解决方案。
技术实现思路
1、为了克服现有技术的上述缺陷,本发明的实施例提供一种基于空间声场重构的移动声源实时跟踪定位方法,通过提供一种基于空间声场重构的移动声源实时跟踪定位方法,以解决上述背景技术中提出的问题。
2、为实现上述目的,本发明提供如下技术方案:
3、一种基于空间声场重构的移动声源实时跟踪定位方法,包括以下步骤:
4、在感知层部署复合声学感知网络,通过时间差分算法对声源坐标进行初筛定位并采集环境声学指纹数据;
5、在分析层构建基于压缩感知理论的空间谱估计模型,结合粒子滤波算法对初筛坐标进行轨迹平滑处理,生成连续声源运动矢量;
6、在渲染层设计动态波束成形网络,根据声源运动矢量实时调整麦克风通道的相位与幅度权重,通过虚拟基阵技术形成指向性声束;
7、利用射线追踪算法对室内反射面进行在线标定,生成空间声场冲激响应补偿参数,实现对空间声场的准确重构。
8、在一个优选的实施方式中,所述复合声学感知网络由麦克风阵列与超声波传感器组成;所述麦克风阵列以均匀圆形分布的方式部署,超声波传感器均匀分布在麦克风阵列周围。
9、在一个优选的实施方式中,通过时间差分算法对声源坐标进行初筛定位过程如下:
10、麦克风阵列接收可听声波信号,记录每个麦克风接收到信号的时间超声波传感器接收超声波信号,记录每个传感器接收到信号的时间并获取声源开始发声的时间t0;
11、根据每个麦克风接收到信号的时间与声源开始发声的时间t0结合可听声波在空气中的传播速度计算声源到第i个麦克风的距离;
12、将每个传感器接收到信号的时间与声源开始发声的时间t0得到传感器接收信号间隔,与超声波的传播速度相乘得到声源到第j个超声波传感器的距离;
13、将声源到第i个麦克风的距离与声源到第j个超声波传感器的距离联立,消去声源开始发声的时间t0,得到麦克风阵列与超声波传感器接收到移动声源信号的时间差与距离的关系;
14、设声源坐标为s=(x,y,z),结合麦克风与超声波传感器的坐标,根据距离公式计算声源到麦克风以及超声波传感器的距离;
15、将时间差与距离的关系,根据距离公式计算得到的声源到麦克风以及超声波传感器的距离结合为方程组,通过解方程组,并采用最小二乘法求解得到声源的初筛坐标
16、在一个优选的实施方式中,所述将时间差与距离的关系,根据距离公式计算得到的声源到麦克风以及超声波传感器的距离结合为方程组如下:
17、
18、式中,(x,y,z)为声源坐标,是第j个超声波传感器的坐标,为第i个麦克风的坐标,为声源到第i个麦克风的距离,为声源到第j个超声波传感器的距离,ca为声波在空气中的传播速度,cu为超声波在空气中的传播速度,为第i个麦克风接收到信号的时间,为第j个超声波传感器接收超声波信号接收到信号的时间。
19、在一个优选的实施方式中,所述环境声学指纹数据包括环境噪声功率谱密度,获取过程如下:
20、采集环境噪声信号,并结合采样时长进行积分计算得到环境噪声功率谱密度,计算公式如下:
21、
22、其中,p(f)为环境噪声功率谱密度;t为采样时长;n(t,f)为环境噪声在时间t和频率f处的信号值。
23、在一个优选的实施方式中,所述分析层构建基于压缩感知理论的空间谱估计模型,包括将声源空间分布视为稀疏信号,通过对采集到的信号进行处理和重构,估计声源的空间分布,过程如下:
24、将监测空间划分为若干个网格点,设网格点坐标为gk=(kxδx,kyδy,kzδz),其中δx,δy,δz为网格间距,kx,ky,kz为网格索引;
25、构建稀疏感知矩阵φ∈r32×k,其中k为网格点总数,矩阵元素为第i个麦克风到第k个网格点的距离,λ为声波波长;
26、通过l1范数最小化求解稀疏向量α,即min||α||1,约束条件为||φα-s||2≤∈,其中s为麦克风阵列接收信号向量,∈为噪声阈值;
27、取α中最大值对应的网格点作为声源在该时刻的候选位置,进而得到声源的空间分布。
28、在一个优选的实施方式中,所述结合粒子滤波算法对初筛坐标进行轨迹平滑处理,生成连续声源运动矢量过程如下:
29、首先对粒子进行初始化,初始粒子集为每个粒子服从以初筛坐标为均值,协方差矩阵为σ的高斯分布,即
30、根据声源运动模型,预测粒子的下一状态ξn(t),公式为ξn(t)=ξn(t-1)+v(t-1)δt+mn(t),其中v(t-1)为t-1时刻的声源速度,δt为时间间隔,mn(t)为过程噪声,ξn(t-1)为t-1时刻的粒子状态;
31、根据信号的似然度更新粒子权重wn(t),其中wn(t)∝p(z(t)|ξn(t)),z(t)为t时刻的观测值,p(z(t)|ξn(t))为似然函数;
32、对粒子进行归一化处理,公式为重新生成粒子集
33、计算t时刻的声源运动矢量,生成连续声源运动矢量,公式为:
34、
35、式中,为声源运动矢量,ξ′n(t)为t时刻重新生成的粒子集,ξ′n(t-1)为t-1时刻重新生成的粒子集。
36、在一个优选的实施方式中,根据声源运动矢量实时调整麦克风通道的相位与幅度权重过程如下:
37、根据分析层得到的声源运动矢量确定t时刻声源的方位角θ(t);
38、根据t时刻声源的方位角θ(t)结合声波波长λ以及第i个麦克风在圆形阵列中的角度位置θi,得到第i个麦克风通道的相位权重φi(t),公式为φi(t)=2πrcos(θ(t)-θi)/λ,幅度权重为ai(t)=sinc(πncos(θ(t)-θi)/2),其中n为麦克风数量,r为麦克风部署圆形半径。
39、在一个优选的实施方式中,利用射线追踪算法对室内反射面进行在线标定过程如下:
40、根据射线追踪算法模拟声波从声源到麦克风的传播路径,初始参数设置时,需输入声源与麦克风坐标,预设室内反射面初始方程;
41、并以声源为顶点按1°间隔发射覆盖一定范围的射线,分别进行0次反射路径(直达声)模拟,1次反射路径模拟,2次与3次反射路径模拟;
42、对于室内反射面,根据模拟的传播路径计算声波在各反射面的反射点,通过最小二乘法优化反射面方程参数,实现对反射面的在线标定。
43、在一个优选的实施方式中,所述生成空间声场冲激响应补偿参数,实现对空间声场的准确重构过程如下:
44、根据标定后的反射面类型查询对应材料的声反射系数,并根据声反射系数以及反射路径模拟次数计算衰减系数;
45、对每个麦克风生成冲激响应,构建离散冲激响应序列并转换为频率响应,得到空间声场冲激响应补偿参数其中αk为第k次反射的衰减系数,tk为第k次反射声波到达麦克风的时间,δ(·)为狄拉克函数;
46、根据空间声场冲激响应补偿参数对对实时信号滤波,再结合虚拟基阵技术合成空间声场,实现声源位置与声像的空间一致性重构。
47、本发明一种基于空间声场重构的移动声源实时跟踪定位方法的技术效果和优点:
48、1.本发明通过多模态感知与动态声场渲染的技术融合,构建了分层式功能架构,实现了从声源信号采集、坐标初筛到运动轨迹优化、声场精准重构的全流程闭环控制。感知层的复合声学感知网络结合时间差分算法,为定位提供了可靠的初始坐标;分析层的压缩感知空间谱估计与粒子滤波算法,显著提升了移动声源轨迹跟踪的连续性与准确性;渲染层的动态波束成形与射线追踪技术,则通过声场冲激响应补偿实现了声像的空间一致性,解决了传统方法中声源感知位置与实际位置存在偏差的问题,大幅提升了语音可懂度与声场沉浸感。
49、2.本发明通过声场处理架构,在开放室内环境中实现了移动声源的高效跟踪定位。其声源定位延迟≤15ms、空间声像定位误差<3°、波束指向精度达±5°的性能指标,能够满足会议同传、沉浸式演出等场景对实时性和精度的高要求。同时,环境声学指纹的动态更新机制与反射面在线标定功能,增强了系统对复杂环境的适应性,避免了固定场景参数导致的定位漂移,为不同室内场景下的移动声源跟踪提供了通用且高效的解决方案。