分布式麦克风阵列网络的鲁棒声源空间定位方法

文档序号:9630702阅读:763来源:国知局
分布式麦克风阵列网络的鲁棒声源空间定位方法
【技术领域】
[0001] 本发明属于语音技术领域,特别涉及一种分布式麦克风阵列网络的鲁棒声源空间 定位方法。
【背景技术】
[0002] 随着软硬件技术的不断发展,分布式传感器网络逐渐在民用市场得到普及。在诸 如环境监测、安全监控及智能家居等场景中,都需要使用声源定位功能,例如对环境的噪声 源进行监测;在光照不足时监控视频无能为力,此时需要进行声源探测和定位;智能家居 场景中的声源定位可以提高人机交互的效果。
[0003] 常见的用于声源定位的设备是麦克风阵列,一般定义为:由多个(通常大于三个) 麦克风按照指定的几何规则摆放并完全同步采集声音信号的设备。麦克风阵列对同步的要 求非常高,因为基于麦克风阵列的声源定位和语音增强等算法的精度,都依赖于对声波传 播到达每个阵元的时间差的正确估计;此外这种估计非常容易受到房间混响的干扰而产生 误差。
[0004] 麦克风阵列网络系统是由多个麦克风阵列作为节点组成声传感器网络对语音进 行处理,无线网络中分布式语音输入设备需要统一的时钟来保证采集时间同步;分布式麦 克风阵列网络是由多个麦克风阵列组成的信号采集系统,每个麦克风阵列作为一个网络的 节点,由不同设备控制,具有各自独立的时钟和采样频率,节点与节点之间的排列和间距没 有限制,分布式麦克风阵列网络采集的信号在时间域不完全同步。
[0005] 麦克风阵列定位的常用方法为:基于到达时间差(TimeDelayofArrival,TD0A) 的定位,定位首先通过时延估计得到声源信号到达不同阵元的时间差,再通过麦克风阵列 的几何构造进行声源位置判断;基于双耳电平差(Inter-auralLevelDifference,ILD)的 定位建立在人耳感知特性基础之上,借助于声源到达两耳间的电平差信息来判断声源的位 置。其中的时延估计算法则主要包括广义互相关(GeneralizedCrossCorrelation,GCC)、 最大似然估计(MaximumLikelihoodEstimation,MLE)和最小均方误差(LeastMean Square,LMS)及其改进方法。
[0006] 然而这些麦克风阵列声源定位的方法并不完全适用于分布式麦克风阵列网络声 源定位,首先是由于上述技术假设所有的麦克风都是同步的,而在一个分布式麦克风阵列 场景中只有同节点上的麦克风之间是同步的,不同节点上的麦克风采集的信号不同步;其 次是分布式麦克风阵列网络声源定位系统中存在多个麦克风阵列,每个麦克风阵列在空间 中的相对位置是未知的;此外依然存在对房间混响敏感导致无法满足定位精度的问题。

【发明内容】

[0007] 为了克服上述现有技术的缺点,本发明的目的在于提供一种分布式麦克风阵列网 络的鲁棒声源空间定位方法,以分布式麦克风阵列网络作为信号采集和输出设备,通过使 用两个麦克风阵列确定三维空间坐标并对空间坐标区域进行划分,利用时延估计数据对多 个时空域不重叠的信号进行定位,并通过反复估计来最终确定声源的空间位置;根据本发 明进行的声源定位原理简单,计算代价小,在三维空间上定位的理论误差范围小于麦克风 间距(通常为厘米量级),性能优于基于现有技术的方法,具有较好的定位精度及鲁棒性, 可应用于智能监控和智能家居等需要进行声源定位的场景。
[0008] 为了实现上述目的,本发明采用的技术方案是:
[0009] -种分布式麦克风阵列网络的鲁棒声源空间定位方法,首先构建三维空间坐标 系,然后估计到达时间差并降低混响干扰,估计声源位置,最终判定声源位置。
[0010] 本发明使用两个麦克风阵列确定三维空间坐标,充分利用麦克风阵列网络中存在 的时延信息降低室内混响带来的干扰;并将空间坐标区域进行划分,通过两次估计来最终 确定声源的空间位置。
[0011] 具体步骤如下:
[0012] 第一步,构建三维空间坐标系
[0013] 假设分布式麦克风阵列网络有N个麦克风阵列作为网络节点,麦克风阵列为线性 阵列,即阵列上的麦克风在一条直线上且麦克风彼此的实际物理间距均为D;每个麦克风 阵列包括Μ个麦克风,对每个麦克风阵列而言,假设各路麦克风采集进来的信号同步;在声 学空间中存在Κ个声源,其中Ν彡2,Μ彡4,Κ彡1;
[0014] 定义每个麦克风阵列中每个麦克风的空间位置%=[~,心,5],其中元表示第」_ 个麦克风阵列中的第i个麦克风的空间位置矢量,Xlj,y^,代表此空间位置分别在X轴、y轴、z轴上的投影,且ie[l,M],je[l,N];
[0015] 假设每个声源的空间位置彼此不重叠,且每个声源在时间上彼此不重叠,定义 每个声源的空间位置& 其中%表示第ke[l,K]个声源的空间位置矢量, Xk,Yk,z#表此空间位置分别在X轴、y轴、ζ轴上的投影;
[0016] 在此基础上,构建一个三维空间坐标系,全部麦克风及声源的空间位置以此坐标 系为基准,坐标系满足如下要求:
[0017] (1)第1个节点的麦克风阵列位于X轴,即其上的第i个麦克风的位置矢量为 =[λπ +£>*(/ -1),0,0]且 Xll> 〇;
[0018] (2)第2个节点的麦克风阵列位于y轴,即其上的第i个麦克风的位置矢量为 + - 1),0]且y12彡 〇 ;
[0019] (3)z轴垂直于X轴和y轴构成的平面;
[0020] (4)其他麦克风阵列水平于第1个麦克风阵列或第2个麦克风阵列;
[0021] (5)全部麦克风及声源的空间位置在X轴和y轴上的投影都不小于0 ;
[0022] 在此三维空间坐标系中,将第一象限按照D*D*D的尺寸进行划分得到I> 0个子 空间区域,将第i个子空间区域的中心点定义为04?),定义第i个子空间区域的中心 点和第j个阵列之间的时间差矢量为0 J;
[0023] 第二步,估计到达时间差并降低混响干扰
[0024]首先在安静的室内产生近似于冲击响应的声音信号δ,则δ在每个麦克风阵列 的麦克风对ii'上产生的广义互相关函数为:
[0025]
[0026] 其中i代表第i个麦克风,i'代表第i'个麦克风且有i'辛i,麦克风对ii'为第 i个麦克风和第i'个麦克风构成的一对,代表室内混响干扰下S引起的麦克风i与 麦克风i'之间的广义互相关函数,糾代表在第j个麦克风阵列上第i个麦克风上 采集到的声音信号,h(n)代表信号δ引起的室内混响冲激响应,*代表卷积,F代表傅里叶 变换,F1代表傅里叶反变换,$代表复共辄,I. |代表求模;
[0027] 当不存在室内混响时,δ在每个麦克风阵列的麦克风对ii'上产生的广义互相关 函数为:
[0028]
[0029] %(")代表无室内混响干扰的麦克风i与麦克风i'之间的广义互相关函数;
[0030] 随后计算每个目标声源在室内混响干扰下产生的广义互相关函数:
[0031]
[0032]其中k代表第k个声源,$f(n)为室内混响干扰下第k个声源引起的麦克风i与 麦克风i'之间的广义互相关函数,代表在第j个麦克风阵列中的第i个麦克风 上采集到的第k个声源的声音信号,h(η)代表室内混响冲激响应;
[0033] 当不存在室内混响时,每个目标声源在室内混响干扰下产生的广义互相关函数 为:
[0034]
[0035] 代表无室内混响干扰下,第k个声源引起的麦克风i与麦克风i'之间的广 义互相关函数,则有:, "_、,
"_、, .
[0036] 通过公式:
,将在室内混响干扰下得到的^⑷转 化为无室内混响干扰的&f(?),随后对^(?)求极值,得到每个麦克风阵列上每个麦克风 对的到达时间差,每个麦克风对的到达时间差计算如下:
[0037]
[0038] 其中,I
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1