本发明属于蓝藻监测的,特别是涉及一种基于非连续数据的蓝藻堆积预测方法及系统。
背景技术:
1、蓝藻堆积是富营养化水体(如湖泊、水库)常见的生态环境问题,尤其在贡湖湾等兼具饮用水源地功能与生态调节价值的水域,蓝藻大量繁殖堆积不仅会消耗水体溶解氧、释放藻毒素,威胁饮用水安全,还会破坏水域生态平衡。
2、但是,受天气、交通、设备运维等因素影响,监测数据存在时间间隔不均、空间覆盖不完整的问题,形成大量非连续数据片段,传统依赖连续时序数据的模型(如rnn/lstm)无法有效利用此类数据,导致预测精度大幅下降。
3、蓝藻生长与堆积受多维度因素共同影响,包括气象要素、水质参数、空间特征及生态指标等,各因素间存在复杂的非线性耦合关系,传统线性模型(如线性回归)或单一维度建模方法(如仅关注时间特征的cnn)难以捕捉这种多因素协同作用,导致预测结果与实际情况偏差较大。
4、传统方法多仅输出蓝藻浓度等基础指标,未将预测结果与蓝藻堆积的实际生态风险关联,也未建立与应急措施的映射关系,导致预测结果难以直接为环保部门的决策提供支撑,延误蓝藻堆积的早期防控时机。
技术实现思路
1、本发明为解决上述背景技术中存在的技术问题,提供了一种基于非连续数据的蓝藻堆积预测方法及系统。
2、本发明采用以下技术方案:一种基于非连续数据的蓝藻堆积预测方法,包括以下步骤:
3、采集目标水域内的多监测站点的历史非连续数据,对所述历史非连续数据进行数据预处理生成结构统一、特征有效的预处理后数据;
4、基于蓝藻形态对应的生态威胁程度,建立蓝藻形态-风险映射规则,从所述预处理后数据中提取蓝藻状况信息,表示时间点,为监测站点;
5、结合所述蓝藻形态-风险映射规则将蓝藻状况信息转化为对应的风险概率值,并将风险概率值作为蓝藻堆积风险标签;
6、获取预处理后数据中的特征变量生成特征变量集合,构建堆积预测模型,利用堆积预测模型输出目标预测点的蓝藻堆积概率初始值;所述堆积预测模型融合了高维特征降维优化、非线性关系建模及时空序列关联分析;
7、基于空间位置和气象因素构建修正函数,对所述蓝藻堆积概率初始值进行修正得到最终蓝藻堆积概率;根据所述最终蓝藻堆积概率匹配风险等级,生成对应的响应措施。
8、在进一步的实施例中,所述预处理后数据的预处理过程包括:数据清洗、控制填补、特征编码、冗余删除和标准化处理中的至少一种。
9、在进一步的实施例中,所述蓝藻形态-风险映射规则的建立过程如下:
10、将蓝藻形态划分为以下形态类型:未发现、颗粒状、条带状和油漆状,并定义每种形态类型的判断指标;
11、结合蓝藻形态对应的溶解氧消耗速率、藻毒素释放量及水域生态破坏范围,确定各形态的威胁权重系数:未发现威胁权重系数为0,颗粒状威胁权重系数为,条带状威胁权重系数为和油漆状威胁权重系数为,其中,;
12、将蓝藻形态与威胁权重系数一一对应,形成蓝藻形态-风险映射规则。
13、在进一步的实施例中,所述风险概率值的转化公式为:
14、根据蓝藻状况信息获取蓝藻在目标水域内的覆盖面积占比,基于覆盖面积占比计算得到覆盖面积修正因子;
15、基于蓝藻状况信息确定目标水域内的蓝藻聚集密度,根据蓝藻聚集密度确定聚集密度修正因子;
16、基于覆盖面积修正因子和聚集密度修正因子进行加权融合,得到风险概率值:
17、;
18、式中,,为蓝藻的形态类型,为颗粒状威胁权重系数,为条带状威胁权重系数,、和均为权重系数,。
19、在进一步的实施例中,所述高维特征降维优化的优化过程如下:
20、按照特征维度将所述特征变量集合划分为四类特征集合:时间特征集合、空间特征集合、气象特征集合和水质特征集合;对四类特征集合分别做标准化处理得到对应的标准化特征;
21、按照蓝藻堆积影响程度分配权重,分别为时间特征权重系数、空间特征权重系数、气象特征权重系数和水质特征权重系数;
22、对标准化后的四类特征集合分别执行动态pca降维,得到时间低维特征子集、空间低维特征子集、气象低维特征子集和水质低维特征子集;
23、得到时空融合低纬特征集合:
24、。
25、在进一步的实施例中,所述非线性关系建模的具体步骤如下:
26、构建随机森林模型捕捉特征与蓝藻堆积风险标签的非线性关系,设定决策树数量为,第棵决策树的预测结果为,则随机森林模型的短期预测结果为:。
27、在进一步的实施例中,所述时空序列关联分析的分析过程如下:
28、构建transformer模型捕捉长期时空关联,对时间特征进行正弦-余弦位置编码;
29、将时空特征中的站点与目标距离、角度进行归一化后嵌入编码向量,生成时空融合特征;
30、基于建transformer模型得到长期预测结果:
31、;式中,为前馈神经网络,为层归一化,为特征权重系数。
32、在进一步的实施例中,所述修正函数的构建方法如下:
33、确定监测站点与目标预测点的直线距离、监测站点与目标预测点的连线与实时风向的夹角,同步获取实时风向角度;
34、基于直线距离、夹角和实时风向角度构建修正函数,其表达形式如下:
35、,式中,为衰减系数。
36、在进一步的实施例中,所述最终蓝藻堆积概率的计算公式如下:
37、,其中,为监测点的总数量,为监测站点的修正函数的输出值,为监测站点经堆积预测模型得到的预测值。
38、一种基于非连续数据的蓝藻堆积预测方法系统,用于实现如上所述的蓝藻堆积预测方法,包括:
39、第一模块,被设置为采集目标水域内的多监测站点的历史非连续数据,对所述历史非连续数据进行数据预处理生成结构统一、特征有效的预处理后数据;
40、第二模块,被设置为基于蓝藻形态对应的生态威胁程度,建立蓝藻形态-风险映射规则,从所述预处理后数据中提取蓝藻状况信息,表示时间点,为监测站点;
41、第三模块,被设置为结合所述蓝藻形态-风险映射规则将蓝藻状况信息转化为对应的风险概率值,并将风险概率值作为蓝藻堆积风险标签;
42、第四模块,被设置为获取预处理后数据中的特征变量生成特征变量集合,构建堆积预测模型,利用堆积预测模型输出目标预测点的蓝藻堆积概率初始值;所述堆积预测模型融合了高维特征降维优化、非线性关系建模及时空序列关联分析;
43、第五模块,被设置为基于空间位置和气象因素构建修正函数,对所述蓝藻堆积概率初始值进行修正得到最终蓝藻堆积概率;根据所述最终蓝藻堆积概率匹配风险等级,生成对应的响应措施。
44、本发明的有益效果:本发明构建堆积预测模型时,对包含时间、空间、气象和水质等多维度的特征变量集合进行高维特征降维优化,按照蓝藻堆积影响程度合理分配权重后,运用动态pca降维等手段,既能有效降低数据维度、减少计算量,又能保留关键特征信息,提高模型对复杂数据的处理能力,进而提升蓝藻堆积概率预测的准确性。
45、本发明基于蓝藻形态对应的生态威胁程度,将蓝藻形态细致划分为未发现、颗粒状、条带状和油漆状等不同类型,并确定各形态的威胁权重系数,从而建立起蓝藻形态-风险映射规则,使得蓝藻的状况能客观地转化为对应的风险概率值,实现对蓝藻堆积风险的量化评估。
46、在风险概率值的转化过程中,综合考虑蓝藻在目标水域内的覆盖面积占比、聚集密度等多方面因素,并通过合理的加权融合计算得到风险概率值,避免了单一因素评估风险的片面性,更加全面、科学地反映了蓝藻堆积所带来的实际风险程度。
47、根据最终蓝藻堆积概率匹配相应的风险等级,并生成对应的响应措施,实现了从预测到决策的无缝衔接,能帮助相关管理部门或人员快速、直观地了解蓝藻堆积情况的严重性,进而采取有效的应对手段,如及时开展打捞、调整水质治理策略等,增强了整个预测方法在实际蓝藻防控工作中的实用价值。