本发明涉及空气质量监控领域,尤其涉及一种基于autoformer改进的空气质量预报方法及系统。
背景技术:
1、空气质量预报是进行空气管控的有效方式和技术手段,空气质量预报模型发展过程经历了三代。第一代是高斯模型,有adms和aermod两种,adm s用的最多。adms是一种考虑了复杂地形、重力沉降与干湿沉降、化学反应等因素的模型,可用于计算连续点源、线源、体源、面源或者间歇性的点源排放的大气污染物浓度。目前,adms模型系统中以adms-urban使用频率最高,adms-urban模型参照图1,它适用于较大尺度的城市、乡镇等区域内,由交通运输、工业、商业、家庭以及其他不明污染源排放出的污染物发生的变化。第二代是拉格朗日模型,calpuff是一个烟团扩散模型系统,属于高斯型解的拉格朗日型k模式,可模拟三维流场中随时间和空间发生变化的污染物输送、转化和清除过程。
2、第三代模型是cmaq,是近年来大气环境污染控制研究中应用较多的,也是较为先进的模式,该模式是美国环保署(epa)发布的第三代空气质量模式系统,cmaq模型由图2的排放清单处理模型smoke、中尺度气象模型wrf和通用尺度空气质量模型cmaq组成,cmaq的边界条件模块bcon、初始条件模块icon、光解速率模块jproc、气象-化学传输模块mcip和化学传输模块cctm构成。它将各种复杂大气物理、化学过程的模式系统化,以应用于环境影响评价及决策分析中。cmaq适用于城市和区域尺度对流层o3、酸沉降、能见度、细粒子及污染物的空气质量模拟。第三代的集合预报是国内外目前用的最多的方式,发展出美国模式和中国模式。现在应用最广的就是cmaq模型。
3、但现有cmaq模型技术存在缺陷和不足:1、并行处理能力差,因为内部结构复杂、模型参数多,要求其处理长的序列要逐层处理,不能并行,计算量大,效率低,预测误差高,不能进行逐小时的小尺度区域汇报;2、不能综合考虑时间序列因素和空间传输的综合因素,导致预测模型不稳定,处理长序列时预测误差高;3、只考虑了单因素自相关,没有考虑多项因素之间的偏相关影响,预测误差高。
技术实现思路
1、本发明的目的在于克服现有空气质量预报模型存在的问题,提供了一种基于autoformer改进的空气质量预报方法及系统。
2、本发明的目的是通过以下技术方案来实现的:
3、第一方面,提供一种基于autoformer改进的空气质量预报方法,所述方法包括以下步骤:
4、s1、收集空气质量的指标历史数据和影响因素历史数据;
5、s2、对空气质量的指标历史数据和影响因素历史数据进行预处理;
6、s3、构建基于autoformer改进的空气质量预测模型并进行训练,所述空气质量预测模型包括依次连接的编码器和解码器,所述编码器用于逐步消除趋势项,得到周期项,所述解码器进行双路处理,上分支处理周期项,下分支处理趋势项;所述编码器和解码器中均嵌入有偏相关机制,所述偏相关机制利用序列的多种因素互相影响的性质,聚合不同周期中具有相似过程的子序列;
7、s4、使用训练好的空气质量预测模型进行预测。
8、进一步地,还包括步骤:
9、s5、根据突发情况优化调整空气质量预测模型的预测值。
10、进一步地,所述空气质量的指标历史数据包括co、so2、no2、o3、pm10、pm2.5、综合指数以及污染等级;所述影响因素历史数据包括走航监测的数据、企业园区的在线监测数据、气象五参数据、小尺度环境的地形地貌数据、污染源排放清单数据、污染源机理研究数据以及卫星遥感数据。
11、进一步地,所述对空气质量的指标历史数据和影响因素历史数据进行预处理,包括:
12、s21、建立空气质量历史数据矩阵y,将数据归一化到分钟数据;
13、s22、将矩阵行列数据的异常值和缺失值按照环保部和气象的规范数据处理,进行数据的平滑和优化;
14、s23、矩阵的偶然数据根据具体突发因素进行优化调整。
15、进一步地,所述偏相关机制利用序列的多种因素互相影响的性质,聚合不同周期中具有相似过程的子序列,包括:
16、根据l个因素组成偏相关系数矩阵:
17、
18、yr矩阵的逆矩阵为yr-1:
19、
20、其中,rij(t)为自相关系数,c′ii为主对角线因素,c′ij为非主对角线因素。
21、进一步地,偏相关系数的显著性可用t检验:
22、t=rij(t)/srij;
23、其中,n为样本容量。
24、进一步地,所述使用训练好的空气质量预测模型进行预测,包括:
25、基于各个空气质量样本,以空气质量样本中时间序列下预设各气象因素数据为输入,所述空气质量样本中空气质量参数标签为输出。
26、进一步地,所述突发情况包括大规模传输的沙尘暴、大规模的烧山、大规模秸秆焚烧以及突发的污染排放。
27、第二方面,提供一种基于autoformer改进的空气质量预报系统,所述系统包括:
28、历史数据收集模块,配置为收集空气质量的指标历史数据和影响因素历史数据;
29、数据预处理模块,配置为对空气质量的指标历史数据和影响因素历史数据进行预处理;
30、模型构建模块,配置为构建基于autoformer改进的空气质量预测模型并进行训练,所述空气质量预测模型包括依次连接的编码器和解码器,所述编码器用于逐步消除趋势项,得到周期项,所述解码器进行双路处理,上分支处理周期项,下分支处理趋势项;所述编码器和解码器中均嵌入有偏相关机制,所述偏相关机制利用序列的多种因素互相影响的性质,聚合不同周期中具有相似过程的子序列;
31、预测模块,配置为使用训练好的空气质量预测模型进行预测。
32、进一步地,所述系统还包括:
33、模型优化模块,配置为根据突发情况优化调整空气质量预测模型的预测值。
34、需要进一步说明的是,上述各选项对应的技术特征在不冲突的情况下可以相互组合或替换构成新的技术方案。
35、与现有技术相比,本发明有益效果是:
36、(1)本发明综合考虑时间序列因素和空间传输的综合因素,使得预测模型稳定,同时考虑多因素偏相关,预测误差低,提高预测准确率。
37、(2)本发明替代第三代的cmaq模型,有益于提取更多信息以供空气质量预测模型学习。
38、(3)本发明的空气质量预测模块是基于tansformer改进构建的,将序列分解作为内部分解单元,增强对复杂时间序列的分解能力,考虑多个因素,采用的自/偏相关机制聚合相似的周期子序列,效率和准确性优于自我注意力机制,能极大限度提高模型预测的精确度,有效降低模型预测误差。
1.一种基于autoformer改进的空气质量预报方法,其特征在于,所述方法包括以下步骤:
2.根据权利要求1所述的一种基于autoformer改进的空气质量预报方法,其特征在于,还包括步骤:
3.根据权利要求1所述的一种基于autoformer改进的空气质量预报方法,其特征在于,所述空气质量的指标历史数据包括co、so2、no2、o3、pm10、pm2.5、综合指数以及污染等级;所述影响因素历史数据包括走航监测的数据、企业园区的在线监测数据、气象五参数据、小尺度环境的地形地貌数据、污染源排放清单数据、污染源机理研究数据以及卫星遥感数据。
4.根据权利要求1所述的一种基于autoformer改进的空气质量预报方法,其特征在于,所述对空气质量的指标历史数据和影响因素历史数据进行预处理,包括:
5.根据权利要求1所述的一种基于autoformer改进的空气质量预报方法,其特征在于,所述偏相关机制利用序列的多种因素互相影响的性质,聚合不同周期中具有相似过程的子序列,包括:
6.根据权利要求5所述的一种基于autoformer改进的空气质量预报方法,其特征在于,偏相关系数的显著性可用t检验:
7.根据权利要求1所述的一种基于autoformer改进的空气质量预报方法,其特征在于,所述使用训练好的空气质量预测模型进行预测,包括:
8.根据权利要求2所述的一种基于autoformer改进的空气质量预报方法,其特征在于,所述突发情况包括大规模传输的沙尘暴、大规模的烧山、大规模秸秆焚烧以及突发的污染排放。
9.一种基于autoformer改进的空气质量预报系统,其特征在于,所述系统包括:
10.根据权利要求9所述的一种基于autoformer改进的空气质量预报系统,其特征在于,所述系统还包括: