基于声学识别的生物多样性监测方法及系统与流程

文档序号：37386895发布日期：2024-03-22 10:39阅读：33来源：国知局

本发明涉及生物多样性分析，具体涉及基于声学识别的生物多样性监测方法及系统。

背景技术：

1、在生态学中，生物多样性是评价一个生态环境的重要指标之一，生物多样性能够维持着生态系统的平衡，不同生物之间相互依存、相互作用，形成复杂的生态网络，对自然保护区的稳定和可持续发展具有极为重要的意义。同时由于不同生物种类通常具有独特的声音特征，因此作为一种非侵入性的监测方式，声学手段是监测和分析生态系统生物活动规律、评价生态系统健康状况的一种重要方法，有助于了解整个生态系统中各个物种的分布、行为和相互作用。

2、传统基于声学手段进行生物多样性监测中，主要采用统计分析的方法，分析的目标侧重在频谱特征的复杂性和差异性上，然而传统频谱特征往往需要手动调整参数或特征选择，而基于语谱图的面向对象分类方式，可以进行自适应的生物声音信息提取。其中传统聚类算法如k-means算法简单易实现，但是需要提前设置聚类簇的个数，即生物物种的个数，基于密度的dbscan聚类算法，无需提前设置聚类簇的个数，但是存在生物鸣叫和人类活动声音无法区分的问题。

技术实现思路

1、为了解决上述技术问题，本发明的目的在于提供基于声学识别的生物多样性监测方法及系统，所采用的技术方案具体如下：

2、第一方面，本发明实施例提供了基于声学识别的生物多样性监测方法，该方法包括以下步骤：

3、获取各时序区间的保护区声音语谱图，将保护区声音语谱图中每个声音数据点作为一个时频单元；

4、根据保护区声音语谱图中的时频单元构建各保护区声音语谱图的无向图，使用广度优先搜索算法获取无向图中各节点之间的节点路径序列，根据大津阈值分割法获取节点路径序列中的可达中间节点；根据时频单元的能量值分布和各节点之间的最短可达路径长度获取各可达中间节点的中间代表路径的代表路径差异系数；根据代表路径差异系数、中间代表路径序列中节点的个数、可达中间节点的个数和最短可达路径长度获取各节点之间的节点邻近相似指数；根据节点邻近相似指数获取第一聚类簇，根据时频单元的声音频率获取第一聚类簇的中心频率，使用快速凸包算法获取各第一聚类簇的最外围时频单元，根据最外围时频单元获取各第一聚类簇的轮廓不规则系数；根据时频单元的曲率获取最外围时频单元的曲率偏差值，根据曲率偏差值获取各第一聚类簇的轮廓曲率离散系数，根据轮廓不规则系数和轮廓曲率离散系数获取各第一聚类簇的轮廓形态复杂指数；根据中心频率、轮廓不规则系数、轮廓曲率离散系数和轮廓形态复杂指数获取各第一聚类簇的形态特征向量；

5、根据第一聚类簇的形态特征向量获取各第二聚类簇，根据生物识别模型获取第二聚类簇的生物物种。

6、进一步，所述根据保护区声音语谱图中的时频单元构建各保护区声音语谱图的无向图，使用广度优先搜索算法获取无向图中各节点之间的节点路径序列，包括：

7、对于各保护区声音语谱图，将保护区声音语谱图中各时频单元都作为一个节点，将各个时频单元与其八邻域内的时频单元进行连线获取无向图；

8、采用广度优先搜索算法，输入无向图，获取各节点之间的所有路径，其中，将各节点之间的每条路径中经过的节点按照经过的先后顺序排列组成节点路径序列。

9、进一步，所述根据大津阈值分割法获取节点路径序列中的可达中间节点，包括：

10、对于各节点之间的所有节点路径序列中的节点，统计每个节点在所有节点路径序列中出现的次数，将各节点之间的所有节点路径序列中所有节点的次数作为大津阈值分割法的输入，输出为数目分割阈值，将次数大于等于数目分割阈值的节点作为各节点之间的各节点路径序列中的可达中间节点。

11、进一步，所述获取各可达中间节点的中间代表路径的代表路径差异系数，包括：

12、计算以各节点为中心的、边长为5的方形窗口中所有时频单元的分布直方图作为各节点的能量分布；

13、对于所有节点路径序列中的各可达中间节点，将最短的节点路径序列作为各可达中间节点的中间代表路径序列，将中间代表路径序列从可达中间节点划分，得到各可达中间节点的左路径序列和右路径序列；

14、对于各可达中间节点，计算可达中间节点的左路径序列和右路径序列的各节点之间的能量分布的js散度；

15、将各节点之间的最短路径经过的节点的个数作为各节点之间最短可达路径长度；计算可达中间节点的左路径序列和右路径序列的各节点之间的最短可达路径长度与所述js散度的乘积，将可达中间节点的中间代表路径序列中所有乘积的均值作为各可达中间节点的中间代表路径的代表路径差异系数。

16、进一步，所述获取各节点之间的节点邻近相似指数，包括：

17、对于各节点之间的节点路径序列的各可达中间点，计算可达中间节点的中间代表路径序列中节点的个数与代表路径差异系数的和值的倒数，计算各节点之间所有倒数的和值作为第一和值；

18、计算第一和值与所述各节点之间所有可达中间节点的个数的比值，计算以自然常数为底、以所述最短可达路径长度为指数的指数函数的计算结果，将所述比值与所述计算结果的乘积作为各节点之间的节点邻近相似指数。

19、进一步，所述获取第一聚类簇，根据时频单元的声音频率获取第一聚类簇的中心频率，使用快速凸包算法获取各第一聚类簇的最外围时频单元，根据最外围时频单元获取各第一聚类簇的轮廓不规则系数，包括：

20、计算所有节点邻近相似指数的均值，将所有节点邻近相似指数大于等于节点邻近相似指数的均值两个节点作为真实时频相关组合，将所有真实时频相关组合中的节点进行连线，将真实时频相关组合中两节点之间的节点邻近相似指数作为边权重构成的无向图作为真实相关无向图；

21、采用马尔科夫聚类算法，输入为真实相关无向图，输出为各聚类簇，将所述聚类簇作为第一聚类簇；

22、对于各第一聚类簇，将第一聚类簇中的所有时频单元都作为lof异常检测算法的输入，输出每个时频单元的lof异常得分，将各时频单元的lof异常得分的倒数作为时频单元的局部密度，将第一聚类簇中最大的局部密度时频单元作为第一聚类簇的中心时频单元，将各第一聚类簇中心时频单元的声音频率值作为各第一聚类簇的中心频率；

23、对于各第一聚类簇，使用快速凸包算法将第一聚类簇中的所有节点对应的时频单元作为输入，所述快速凸包算法的输出为各第一聚类簇的最外围时频单元集合在三维凸包上的集合，计算第一聚类簇的各最外围时频单元与中心时频单元的欧式距离，计算第一聚类簇上所有欧式距离的均值，计算所述欧式距离与所述均值的差值绝对值，将各第一聚类簇上所有差值绝对值的均值作为各第一聚类簇的轮廓不规则系数。

24、进一步，所述获取最外围时频单元的曲率偏差值，根据曲率偏差值获取各第一聚类簇的轮廓曲率离散系数，根据轮廓不规则系数和轮廓曲率离散系数获取各第一聚类簇的轮廓形态复杂指数，包括：

25、将第一聚类簇上第m个与第m+1个相邻最外围时频单元在三维凸包上的曲率的差值绝对值作为第一聚类簇上第m个最外围时频单元的曲率偏差率；

26、对于各第一聚类簇，计算第一聚类簇上所有最外围时频单元的曲率偏差率的均值，计算各最外围时频单元与所述均值的差值的平方，将各第一聚类簇中所有差值的平方的均值作为各第一聚类簇的轮廓曲率离散系数；

27、将各第一聚类簇的轮廓不规则系数与轮廓曲率离散系数的乘积作为各第一聚类簇的轮廓形态复杂指数。

28、进一步，所述获取各第一聚类簇的形态特征向量，包括：

29、将各第一聚类簇的中心频率、轮廓不规则系数、轮廓曲率离散系数和轮廓形态复杂指数排序组成的向量作为各第一聚类簇的形态特征向量。

30、进一步，所述获取各第二聚类簇，根据生物识别模型获取第二聚类簇的生物物种，包括：

31、将所有时序区间的保护区声音语谱图的第一聚类簇作为dbscan聚类算法的输入，度量距离为各第一聚类簇的归一化的形态特征向量的欧式距离，所述dbscan聚类算法的输出为各第二聚类簇；

32、将第二聚类簇中任意一个第一聚类簇中所有的时频单元使用短时傅立叶逆变换转换成声音数据输入到生物声音识别模型中，生物声音识别模型采用卷积神经网络，采用交叉熵作为生物声音识别模型的损失函数，采用批量梯度下降作为优化函数，所述生物声音识别模型的输出为第二聚类簇的生物物种。

33、第二方面，本发明实施例还提供了基于声学识别的生物多样性监测系统，包括存储器、处理器以及存储在所述存储器中并在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述任意一项所述方法的步骤。

34、本发明至少具有如下有益效果：

35、本发明实现一种基于声学识别的生物多样性监测方法及系统，根据保护区声音语谱图中各个时频单元之间的时间-频率特征，结合bfs算法和马尔科夫聚类算法，对一个时序区间对应的保护区声音语谱图进行分类，其有益效果在于考虑语谱图中各个时频单元之间的时间-频率特征和节点路径特征，避免两个时频单元具有较为相似的语音能量，但在时间-频率特征上差异较大的问题；根据马尔科夫聚类算法所得的第一聚类簇之间时频特征，结合lof异常检测算法和快速凸包算法，构建第一聚类簇的轮廓形态复杂指数，其有益效果在于考虑生物鸣叫时，具有不同的轮廓形态特征，同时解决生物鸣叫声音和人类活动声音无法进行准确区分的问题，提高自然保护区生物多样性监测的精度。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：雷佳琳,陈俊竹,杜田甜
技术所有人：百鸟数据科技（北京）有限责任公司
我是此专利的发明人