基于语音分析的森林枪声定位方法与流程

文档序号：37369551发布日期：2024-03-22 10:22阅读：10来源：国知局

本技术涉及语音处理，具体涉及基于语音分析的森林枪声定位方法。

背景技术：

1、由于森林中的风吹过树叶、草丛等植物时会产生噪声，并且在枪声响起的同时，通常会引发森林中动物的鸣叫，这些问题均造成利用麦克风阵列采集的声音信号数据中包含较多噪声、动物鸣叫声等干扰数据，在使用声源定位算法对枪声信号进行定位时，例如music（multiple signal classification，多重信号分类）算法，容易将动物的鸣叫误认为是枪声信号的声源进行定位，导致枪声的定位结果出现较大的误差。而且由于森林中存在大量的树木和植被，而枪声信号属于高频信号，在传播的过程中容易被空气、树木和植被等吸收，并且动物的声音也会和枪声信号形成混合信号，导致麦克风阵列采集到的枪声信号损失了过多的可用信息，影响枪声定位结果的精度。

技术实现思路

1、本技术提供基于语音分析的森林枪声定位方法，以解决通过语音分析对森林中枪声定位准确性低的问题，所采用的技术方案具体如下：

2、本技术一个实施例提供了基于语音分析的森林枪声定位方法，该方法包括以下步骤：

3、获取森林中的声音信号数据，将森林中每个声音信号采集点的麦克风阵列中每个阵元麦克风的声音信号数据转换为语谱图；

4、根据每个阵元麦克风对应的语谱图中每个数据点的局部能量特征构建声音高能量聚集度；根据每个阵元麦克风对应的语谱图中每个数据点对应的声音高能量聚集度构建语谱图中每列数据点的高能量频带和低能量频带；根据每个阵元麦克风对应的语谱图中每列数据点的高能量频带和低能量频带计算高能量频带集中覆盖率；基于每个阵元麦克风对应的语谱图中每列数据点对应的高能量频带集中覆盖率计算枪声马赫波疑似度；

5、根据每个阵元麦克风对应的语谱图中所有列的枪声马赫波疑似度获取森林中每个声音信号采集点对应的马赫波数据矩阵，基于马赫波数据矩阵获取森林中枪声所在的方向角度的定位结果。

6、优选的，所述根据每个阵元麦克风对应的语谱图中每个数据点的局部能量特征构建声音高能量聚集度的方法为：

7、将每个阵元麦克风对应的语谱图中所有的数据点的能量值作为输入，采用密度峰值聚类算法获取所述语谱图中每个数据点的局部声音能量密度；

8、以每个阵元麦克风对应的语谱图中每个数据点为中心构建预设大小的局部窗口，根据所述语谱图中每个数据点的局部窗口内不同数据点之间的局部声音能量密度和能量值差异计算能量分布相似聚集度；

9、根据每个阵元麦克风对应的语谱图中每个数据点的局部窗口对应的能量分布相似聚集度计算每个数据点的声音高能量聚集度。

10、优选的，所述根据所述语谱图中每个数据点的局部窗口内不同数据点之间的局部声音能量密度和能量值差异计算能量分布相似聚集度的具体方法为：

11、对于每个阵元麦克风对应的语谱图中每个数据点的局部窗口，将所述局部窗口内每个数据点的局部能量密度与能量值的乘积作为第一聚集系数，将所述局部窗口内任意两个数据点对应的第一聚集系数之差的绝对值作为第二聚集系数；

12、将所述局部窗口内任意两个数据点之间的欧氏距离作为第三聚集系数，将所述局部窗口内任意两个数据点对应的第二聚集系数与第三聚集系数的乘积与预设参数之和的倒数作为所述局部窗口内任意两个数据点之间的能量分布相似聚集度。

13、优选的，所述根据每个阵元麦克风对应的语谱图中每个数据点的局部窗口对应的能量分布相似聚集度计算每个数据点的声音高能量聚集度的具体方法为：

14、对于每个阵元麦克风对应的语谱图中每个数据点的局部窗口，将所述局部窗口内的任意两个数据点之间的能量分布相似聚集度在局部窗口上累加结果的均值作为第一高能量系数；将所述局部窗口内所有数据点能量值的均值作为第二高能量系数，将所述局部窗口的第一高能量系数与第二高能量系数的乘积作为所述语谱图中每个数据点的声音高能量聚集度。

15、优选的，所述根据每个阵元麦克风对应的语谱图中每个数据点的声音高能量聚集度构建语谱图中每列数据点的高能量频带和低能量频带的方法为：

16、采用阈值分割算法获取每个阵元麦克风对应的语谱图中所有数据点的声音高能量聚集度的分割阈值，将所述语谱图中声音高能量聚集度大于等于分割阈值的数据点作为声音高能量聚集点，将所述语谱图中声音高能量聚集度小于分割阈值的数据点作为声音低能量聚集点；

17、对于每个阵元麦克风对应的语谱图中的每列数据点，将每列数据点中声音高能量聚集点的能量值置为1，将每列数据点中声音低能量聚集点的能量值置为0，将每列数据点能量值更新后的数据组成的序列作为频带分析序列，采用连通域分析算法获取频带分析序列的连通域，将频带分析序列中元素均为1的连通域作为高能量频带，将频带分析序列中元素均为0的连通域作为低能量频带。

18、优选的，所述根据每个阵元麦克风对应的语谱图中每列数据点的高能量频带和低能量频带计算高能量频带集中覆盖率的方法为：

19、对于每个阵元麦克风对应的语谱图中每列数据点，将每列数据点中任意一个高能量频带中所有数据点的能量值的标准差的映射结果作为第一集中系数，将第一集中系数在每列数据点的所有高能量频带上的累加结果作为第二集中系数；将每列数据点中任意一个低能量频带中所有数据点的能量值的标准差的映射结果作为第三集中系数，将第三集中系数在每列数据点中所有低能量频带上的累加结果作为第四集中系数，将第二集中系数与第四集中系数的乘积作为每列数据点的语谱频带能量集中度；

20、将每列数据点中任意一个高能量频带中所有数据点的能量值的均值作为第一差异系数，将每列数据点中任意一个低能量频带中所有数据点的能量值的均值作为第二差异系数，将第一差异系数与第二差异系数之差的绝对值的映射结果作为第三差异系数，将第三差异系数在每列数据点上的累加结果作为每列数据点的频带能量差异系数；

21、根据每个阵元麦克风对应的语谱图中每列数据点的语谱频带能量集中度、频带能量差异系数和每列数据点的频带分布特征计算高能量分布集中度；根据每个阵元麦克风对应的语谱图中每列数据点的高能量分布集中度和高能量频带的频带宽度获取高能量频带集中覆盖率。

22、优选的，所述根据每个阵元麦克风对应的语谱图中每列数据点的语谱频带能量集中度、频带能量差异系数和每列数据点的频带分布特征计算高能量分布集中度的具体方法为：

23、对于每个阵元麦克风对应的语谱图中每列数据点，分别将每列数据点中每个高能量频带、低能量频带中所有数据点之间频率差值的最大值作为每个高能量频带、低能量频带的频带宽度；

24、将每列数据点的语谱频带能量集中度与频带能量差异系数的比值作为分子，将每列数据点中相邻两个高能量频带之间所有低能量频带的频带宽度的和作为第一分布系数，将第一分布系数在每列数据点上累加结果的均值与预设参数的和作为分母，将分子与分母的比值作为每列数据点的高能量分布集中度。

25、优选的，所述根据每个阵元麦克风对应的语谱图中每列数据点的高能量分布集中度和高能量频带的频带宽度获取高能量频带集中覆盖率的方法为：

26、对于每个阵元麦克风对应的语谱图中每列数据点，计算每列数据点中所有高能量频带的频带宽度的均值，将所述均值与每列数据点的高能量分布集中度的乘积作为每列数据点的高能量频带集中覆盖率。

27、优选的，所述基于每个阵元麦克风对应的语谱图中每列数据点对应的高能量频带集中覆盖率计算枪声马赫波疑似度的方法为：

28、对于每个阵元麦克风对应的语谱图中每列数据点，将每列数据点中所有高能量频带的频带宽度的和作为频带覆盖率，获取以每列数据点为中心列所取短时区间内所有列的频带覆盖率，将所述短时区间内每一列的序号为横坐标，将每一列的频带覆盖率为纵坐标，将横坐标和纵坐标确定的数据点的拟合直线的斜率作为每列数据点的短时高能覆盖率；

29、将以每列数据点为中心列所取短时区间内每一列的短时频带覆盖率变化指数与中心列的短时频带覆盖率变化指数之差的平方作为第一疑似系数，将第一疑似系数在以每列数据点为中心列所取短时区间上累加结果的均值与每列数据点的短时频带覆盖率变化指数的映射结果的乘积作为第二疑似系数，将第二疑似系数与预设参数的和作为分母，将每列数据点对应的高能量频带集中覆盖率作为分子，将分子与分母的比值作为每列数据点的枪声马赫波疑似度。

30、优选的，所述根据每个阵元麦克风对应的语谱图中所有列的枪声马赫波疑似度获取森林中每个声音信号采集点对应的马赫波数据矩阵，基于马赫波数据矩阵获取森林中枪声所在的方向角的方法为：

31、将每个阵元麦克风对应的语谱图中所有列的枪声马赫波疑似度作为输入，利用最大类类间方差算法获取所述语谱图中所有列的分割结果，将所有列的分割结果作为基音同步叠加算法的输入，获取所述语谱图的拼接数据序列，将每个所述拼接数据序列作为集合中的一个元素，将所有所述拼接数据序列组成的集合作为马赫波数据序列集合，将马赫波数据序列集中所有元素按照时间升序顺序进行排序组成的序列作为每个阵元麦克风的马赫波数据序列；

32、将每个阵元麦克风的马赫波数据序列作为矩阵中一行元素，将麦克风阵列中所有阵元麦克风的马赫波数据序列组成的矩阵作为每个声音信号采集点的麦克风阵列的枪声马赫波数据矩阵，将所述枪声马赫波数据矩阵的k等划分的结果作为music算法的输入，获取每个声音信号采集点的麦克风阵列的马赫波方向角度序列，将所述马赫波方向角度序列作为lstm神经网络模型的输入，获取每个声音信号采集点的森林中枪声所在的方向角度的定位结果。

33、本技术的有益效果是：通过分析声音信号数据中的声音能量的局部分布特征和聚集特征构建声音高能量聚集度，通过声音高能量聚集度反应声音信号数据中局部信号特征的能量差异，提高分析声音信号中枪声信号的马赫波能量的特征的准确性，进一步的，根据声音高能量聚集度构建声音信号数据对应的语谱图中的高能量频带和低能量频带，通过高能量频带和低能量频带的分布特征差异构建高能量频带集中覆盖率，通过高能量频带集中覆盖率反应声音信号数据中的马赫波的声音信号特征，提高声音信号中对马赫波的识别的准确性，根据高频能量频带集中覆盖率构建枪声马赫波疑似度，基于枪声马赫波疑似度利用music算法和lstm神经网络模型获取森林中枪声所在的方向角度，其有益效果在于可以准确识别森林中采集的声音信号数据中的马赫波，提高通过森林中采集的声音信号的分析对枪声定位的准确性。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：滕兵,张根,王崇瑞,杨毅
技术所有人：百鸟数据科技（北京）有限责任公司
我是此专利的发明人