基于四维有向GCN-LSTM模型的多城市多种大气污染物预测方法

文档序号:34631207发布日期:2023-06-29 14:51阅读:122来源:国知局
基于四维有向GCN-LSTM模型的多城市多种大气污染物预测方法

本发明涉及一种大气污染物浓度预测方法,属于人工智能技术与环境学科交叉领域,具体涉及一种四维有向gcn-lstm模型的多城市多种大气污染物浓度大数据预测方法。


背景技术:

1、近些年,伴随全国工业化和城市化水平越来越高,能源消耗也急剧增加,以煤炭、石油和天然气为主的一次能源消耗占比高达84.7%,这些化石能源的大量使用直接致使我国经济发达地区空气质量较差,大气污染物浓度指数超标。根据国家颁布的《环境空气质量标准》,明确规定了六个基本的大气污染物,包括了大气颗粒物和气态污染物:pm2.5、pm10、no2、so2、co、o3。这些大气污染物被世界卫生组织评定为世界最大的环境健康风险诱因。据统计,近十年来,我国多个省市出现不同程度的极端低能见度和重度空气污染事件,大气污染物种类也由工业烟尘转为pm2.5、pm10这类直径更细小的颗粒物。大气污染除了会直接对人体健康造成危害和影响人类社会活动,还会给自然生态系统带来负面影响。如:so2致使农耕土壤酸化森林衰亡、pm2.5、pm10致使大气能见度降低、o3大量分解全球气候变暖、大气污染物携带氮磷等元素通过干湿沉降致使湖泊河流富营养化。因此对大气污染物浓度预测非常有必要。

2、目前,大气污染物浓度预测建模方法主要分为两类:基于机理驱动的大气污染预测建模方法和基于数理统计的大气污染预测建模方法。机理驱动的大气污染预测建模方法是以大气动力学、大气环境化学为基础,根据大气污染排放源数据、气象数据,用方程组构建数学模型来分析污染物时空分布和扩散迁移,再计算求解实现预测未来污染物的浓度变化和分布。由于大气污染物的产生和浓度大小受污染源的空间地理位置、区域气象条件等诸多因素影响,使得系统结构难以精准建立,因此仅仅依赖机理驱动的建模方法并不适合大气污染物浓度的预测。大气污染物数理统计预测模型是建立在数据分析与数据挖掘理论之上,此类模型不依赖污染物产生和扩散机理,不依赖相关的物理、化学作用及生物过程,以统计学为基础,通过大气污染物及相关影响因素数据,分析污染物浓度变化规律,给出未来一段时间内大气污染物浓度的预测结果。相对于机理驱动方法,数理统计的预测成本较低,尤其是多频次的短期预测中具备极大优势。而在现有的大气污染物浓度预测方法中,大多采用单一的数据驱动模型,如回归模型、灰色理论模型、进化算法、机器学习等,它们都存在预测结果不够准确的弊端。

3、多城市多种大气污染物浓度数据具有海量、高维、时空演变、多因素等特征,符合大数据特点,对其进行预测应采用适用于大数据分析的深度学习方法。传统的循环神经网络和长短期记忆网络在处理时间序列数据时,任务中的数据样本是由多个因素的时间序列值组成,捕捉时间序列中元素之间的短记忆和长记忆依赖关系,使得序列中排序靠后的元素为排序靠前的元素的计算提供指导信息。然而,多个城市大气污染物的扩散运动受动力因素和热力因素影响,具有空间相关性。因此,研究城市的大气污染物浓度则需要考虑其周围城市的大气污染物浓度之间的时间-空间相关性,采用一种适用于研究多因素的时空序列建模方法。

4、图卷积神经网络是以图论为基础的一种利用深度学习对图论中的图数据搭建起的建模框架,图数据包括图的节点和边,主要描述了节点之间的两两关系,可将各城市作为图的节点,城市间关联作为图的边,大气污染物即大气污染的表征因素,作为图节点的属性。传统的图卷积神经网络在处理时空序列预测问题时,一般仅考虑建立一维空间距离图来表示多城市多种大气污染物在空间上的相关性,且大多数研究仅采用无向图来反映多种大气污染物在多个城市间的扩散运动影响。但是多城市间的大气污染物实际包含经度和纬度的二维空间关系,并且大气污染物扩散具有一定的有向性。应采用包含二维空间信息的有向图描述多城市间的大气污染物空间相关性,同时,需要考虑多种大气污染物间的多因素相关性以及时间相关性。


技术实现思路

1、针对上述现有技术在预测城市多种大气污染物浓度数据不够准确的问题,本发明提供了一种基于四维有向gcn-lstm模型的多城市多种大气污染物预测方法,解决了传统图卷积神经网络在预测多城市大气污染物浓度时,建立的图模型未考虑多城市间的二维空间关系和大气污染物扩散有向性的问题,通过构建一种能够包含二维空间有向性信息、捕捉图节点内多个因素一维相关性信息、提取不同时刻时间一维相关性信息的四维有向图模型,为具有时空特性的多城市多种大气污染物浓度预测提供一种新思路。

2、本发明提供的基于四维有向gcn-lstm模型的多城市多种大气污染物预测方法,包括以下五个步骤:

3、步骤一,对多城市的多种大气污染物浓度数据进行相关性分析,确定不同城市的多种大气污染物浓度数据间具有相关性;

4、步骤二,根据所要研究的城市的地理位置建立四维有向gcn(图卷积神经网络)模型的图;

5、该图为二维空间有向图,图中将每座城市作为一个节点,节点位置为城市中心的经纬度二维坐标,图中节点间都存在有向边,有向边表示为一节点指向另一节点的平面向量;将每种大气污染物作为节点的一个属性,属性值随时间变化;构建二维空间有向图的邻接矩阵、度矩阵和拉普拉斯矩阵;其中邻接矩阵用于描述图中节点和节点间边的信息,度矩阵用于描述图中节点与相连节点间边的权重之和;可以将多城市多种大气污染物浓度时间序列表示为上述二维空间有向图信息序列;

6、步骤三,进行四维有向gcn模型的谱分解及张量运算;

7、四维有向gcn模型的谱分解是指:由于二维空间有向图的拉普拉斯矩阵为反对称矩阵,不能做频域卷积,因此将二维空间有向图的邻接矩阵通过线性代数变换构建一个新的邻接矩阵,新的邻接矩阵为对称矩阵,包含旧的度矩阵和旧的邻接矩阵的信息;根据新的邻接矩阵更新度矩阵,获取新的对称的拉普拉斯矩阵,对新的拉普拉斯矩阵进行谱分解,获取特征值矩阵和特征向量矩阵,分别作为图傅里叶系数和图傅里叶基,能够进行谱域上的图卷积运算;

8、四维有向gcn模型的张量运算是指:传统gcn模型的输入数据为二维矩阵,经谱分解获取的特征值矩阵和特征向量矩阵均为三维矩阵,存在张量维数不匹配的问题,因此,采用广播机制将输入矩阵进行维数扩展和元素复制,变换为与所述特征向量矩阵维数相同的三维矩阵,将变换后的输入矩阵与特征向量矩阵进行张量运算,进行二维空间有向性的信息整合;所述输入矩阵是根据多城市多种大气污染物浓度数据获取的矩阵,在下面步骤五中说明;

9、步骤四,改进四维有向gcn模型的图滤波器;

10、图信号在进行傅里叶变换转到频域后,得到图傅里叶基和图傅里叶系数,通过图滤波器对图傅里叶系数进行调制,传统的图滤波器采用切比雪夫滤波器,但在通带频率的末端部分会存在较强的波动,导致信号处理不稳定,因此本发明利用hermite滤波器作为图滤波器,对变换后的输入矩阵进行滤波,以解决末端部分信号出现受噪声干扰的问题;

11、步骤五,构建四维有向gcn-lstm模型进行大气污染预测;

12、所述的四维有向gcn-lstm模型是将四维有向gcn模型嵌入到lstm(长短期记忆网络)网络架构里,该模型首先将当前时刻的多城市多种大气污染物浓度xt与四维有向gcn模型上一时刻的输出数据一起输入lstm模型,利用lstm模型提取不同时刻间多因素的时序特征,输出四维有向gcn模型的输入矩阵ht,将输入矩阵ht采用广播机制变换为与特征向量矩阵维数相同的三维矩阵后,输入四维有向gcn模型;四维有向gcn模型利用图滤波器对输入矩阵ht进行滤波后,输入网络层进行卷积操作,输入矩阵ht与网络层的输出一起送入输入门、遗忘门和输出门,最后四维有向gcn模型输出t时刻的输出数据输出数据记录下一时刻的各城市每种大气污染物的浓度预测值。训练所述四维有向gcn-lstm模型,利用训练好的模型进行大气污染预测。

13、相比现有技术,本发明的优点在于:

14、(1)本发明方法首先采用典型相关分析方法分析并验证了具有一定空间地理位置关联的不同城市不同时刻多种大气污染物浓度存在相关性,说明了多种大气污染物浓度不仅在时间维度上具有相关性而且在空间维度上也具有一定相关性,为后续预测模型的提出奠定基础。

15、(2)本发明方法通过建立二维空间有向图来拓扑多城市间大气污染物的空间相关性,将传统gcn模型的图由传统包含一维空间距离信息的三维无向图改为包含二维空间有向信息的四维有向图,通过此方式构建的图邻接矩阵和度矩阵能够充分挖掘城市间的二维空间有向信息,从而提出能够全面提取二维空间相关性、时间相关性、多因素相关性特征的四维有向gcn模型,提升gcn模型特征提取的有效性,提高模型预测精度。

16、(3)本发明方法提出四维有向gcn模型的谱分解和张量运算算法,利用反对称矩阵性质,将有向图的反对称的图邻接矩阵和对称的图度矩阵通过线性代数变换成对称的图邻接矩阵,解决了无法对有向图的拉普拉斯矩阵进行谱分解的问题,并采用广播机制对四维有向gcn模型的输入信号和有向图拉普拉斯矩阵的特征向量组成的矩阵进行张量运算,解决了四维有向gcn模型的输入信号与二维空间信息的图拉普拉斯矩阵的特征向量矩阵存在维度不匹配的问题。

17、(4)本发明方法对四维有向gcn模型的滤波器进行了改进,传统gcn模型中使用的是切比雪夫滤波器,即chebyshev多项式滤波器,而chebyshev多项式在拟合逼近信号时对通带频率末端这部分信号的处理过程容易受噪声干扰不稳定,因此本发明使用hermite多项式滤波器替换chebyshev多项式滤波器,hermite滤波器具有良好的带通特性可以有效地减少频率末端这部分信号受噪声干扰的现象出现,提高模型运算的准确性和速度。

18、(5)本发明方法提出将四维有向gcn模型嵌入lstm网络构成四维有向gcn-lstm模型,利用四维有向gcn模型具有刻画空间分布能力来提取不同城市的多种大气污染物浓度的空间相关性,同时再通过lstm网络循环递归来捕捉记录多种大气污染物浓度变化的多因素相关性和时序相关性,有效解决多种大气污染物浓度这类多因素时空序列数据进行多因素相关性、时间相关性和空间相关性的统一建模的问题,经试验验证,采用本发明方法的预测模型具有更高的预测准确度。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1