一种面向实时声源定位的改进时延估计方法

文档序号：30972914发布日期：2022-08-02 22:20阅读：来源：国知局

技术特征：
1.一种面向实时声源定位的改进时延估计方法，其特征在于，包括：fifo buffer，为fifo(first input first output，先进先出的队列)数据结构的矩阵，矩阵每行具有先进先出的特性，用于实时存放多通道麦克风接收信号；声源信号检测，从fifo buffer内取需要估计时延的两通道信号，采用离散hilbert变换和短时过零率相结合的双门限法，检测实时接收的信号中是否存在有效声源信号；gcc-phat改进互相关算法，在确认存在有效声源信号的前提下，快速、准确计算两通道信号的互相关，得到包含尖锐互相关峰值的互相关序列；区域峰值搜索，根据实际阵元的间距大小，设定在中搜索互相关峰值的范围，并同时提取区域峰值所对应的偏移量；时延估计，将搜索的偏移量转化为时延值。2.根据权利要求1所述的一种面向实时声源定位的改进时延估计方法，其特征在于，所述fifo buffer，需要实时无阻塞地将多通道麦克风接收信号写入其内，构建的buffer内存放每通道接收信号的长度为0.8s～1.5s，太长不仅影响计算的实时性，还会引入较多的多径干扰。3.根据权利要求1所述的一种面向实时声源定位的改进时延估计方法，其特征在于，所述声源信号检测，首先的离散hilbert变换用于提取信号包络，其基于fft实现，通过设定其门限值作为检测声源的第一级判断，而短时过零率表示一帧语音中波形穿过横轴的次数，通过设定其门限值作为检测声源的第二级判断。4.根据权利要求1所述的一种面向实时声源定位的改进时延估计方法，其特征在于，所述gcc-phat改进互相关算法，其主要步骤如下：首先，求得带通滤波后的互功率谱，并对其进行最值归一化；然后，根据所用带通滤波的上下截止频点，从上述归一化的互功率谱中截取出有效声源频段，并对其进行phat加权，拼接成完整的互功率谱；最后，对拼接完的互功率谱进行ifft，得所需的互相关序列。

技术总结
一种面向实时声源定位的改进时延估计方法，包括：FIFO Buffer，声源信号检测，GCC-PHAT改进互相关算法，区域峰值搜索，时延估计。所述FIFO Buffer为FIFO数据结构的矩阵，实时存放多通道麦克风接收信号；所述声源信号检测，采用离散hilbert变换和短时过零率结合的双门限检测信号中是否存在有效声源；所述GCC-PHAT改进互相关算法，先求得带通滤波后的互功率谱，并进行最值归一化；再由带通滤波的截止频点截取有效声源频段，再对其PHAT加权，拼接成完整的互功率谱；最后对互功率谱进行IFFT，获得互相关序列；所述区域峰值搜索和时延估计，提取区域峰值对应的偏移量，转化为时延值。本方法能在较低噪声比的场景和嵌入式设备实现实时准确的时延估计，为声源定位提供支撑。为声源定位提供支撑。为声源定位提供支撑。

技术研发人员：汪志胜崔俊宁
受保护的技术使用者：哈尔滨工业大学
技术研发日：2022.04.10
技术公布日：2022/8/1

完整全部详细技术资料下载

当前第2页1 2