一种PM2.5浓度预测方法与装置与流程

文档序号:18234093发布日期:2019-07-24 08:34阅读:412来源:国知局
一种PM2.5浓度预测方法与装置与流程
本发明涉及一种PM2.5浓度预测方法与装置,属于PM2.5浓度值的预测
技术领域

背景技术
:细颗粒物(PM2.5)不仅对公众健康造成严重威胁,而且严重影响了城市交通和市民日常生活,因此,PM2.5作为一种直接影响人类生活和健康的大气污染物,引起了众多学者对PM2.5相关反演研究工作的广泛关注,实现对PM2.5浓度的预测。现有技术中对PM2.5进行预测的方法有很多,比如:申请公布号CN106056210A的中国专利申请文件公开了一种基于混合神经网络的PM2.5浓度值预测方法,该方法采用PM2.5浓度值的历史数据、相关指标的历史数据、气象历史数据以及PM2.5成分解析数据,通过神经网络分段模拟出当地PM2.5浓度值的变化规律,实现PM2.5浓度值的预测。又比如:赵阳阳等人结合了协同训练与时空地理加权回归模型(GTWR),提出一种协同时空地理加权回归PM2.5浓度估算方法,其出处为《测绘科学》,2016,41(12):172-178,该方法以2015年3月到7月的京津冀PM2.5浓度为例,采用欧式空间距离度量,通过不同核函数的GTWR进行对比分析实验,结果表明,在时空样本数量不足时,该方法能够提高PM2.5的浓度估算精度。然而现有技术中PM2.5浓度预测方法的预测准确性仍然有待提高。技术实现要素:本发明的目的在于提供一种PM2.5浓度预测方法,用以解决现有预测方法的准确性低的问题;同时还提供一种PM2.5浓度预测装置,用以解决现有预测装置的准确性低的问题。为实现上述目的,本发明提出一种PM2.5浓度预测方法,包括以下步骤:获取PM2.5浓度历史数据、气象历史数据、大气气溶胶光学厚度历史数据;获取观测点的二维位置信息、高程信息和采样时间信息;根据上述数据确定4D-GTWR模型的参数,从而确定4D-GTWR模型,4D-GTWR模型为:其中,xik为观测点i的第k个自变量,共有p个自变量,所述自变量为气象数据;yi为观测点i的因变量,所述因变量为PM2.5浓度数据;4D-GTWR模型的参数为:βik(ui,vi,zi,ti)、βi0(ui,vi,zi,ti)和ξi,βik(ui,vi,zi,ti)为观测点i的第k个自变量的自变量回归系数,与观测点i的空间位置有关;βi0(ui,vi,zi,ti)为观测点i的自变量回归系数常数项;ξi为观测点i的随机误差;(ui,vi,zi,ti)为观测点i的四维空间坐标,其中,(ui,vi)表示二维空间坐标,(zi)表示高程空间坐标,(ti)表示时间坐标;n为观测点的数量;根据预测的气象数据、大气气溶胶光学厚度数据以及确定的4D-GTWR模型,预测PM2.5的浓度。另外,本发明还提出一种PM2.5浓度预测装置,包括存储器、处理器以及存储在所述存储器中并可在处理器上运行的计算机程序,所述处理器在执行所述计算机程序时实现上述PM2.5浓度预测方法。有益效果是:在时空地理加权回归模型中引入高程信息,提出了一种四维时空地理加权回归模型(4D-GTWR),采用四维空间欧式距离度量,能够更好的反映四维时空分布特征,提供更加真实的空间距离,从而对实际情况进行有效的分析,并且4D-GTWR模型在预测PM2.5浓度方面提供了有效的方法,使得PM2.5浓度的预测更加准确,同时还解决了四维时空的非平稳性,也验证了高程信息对PM2.5浓度变化具有重要影响。进一步的,上述PM2.5浓度预测方法及装置中,计算自变量回归系数的方法包括:通过建立观测点i的目标函数求解自变量回归系数的最小二乘估值,所述目标函数为:其中,wijST为观测点i与观测点j之间的核函数;所述自变量回归系数的最小二乘估值为:其中,W(ui,vi,zi,ti)为四维时空权重矩阵,是由wijST组成的矩阵,X为自变量矩阵,Y为因变量的观测值矩阵。有益效果是:通过建立目标函数进行自变量回归系数的求解,该方法简单准确。进一步的,上述PM2.5浓度预测方法及装置中,所述核函数为Gaussian型核函数,公式为:其中,h4D-ST为四维时空带宽,dijST为观测点i与观测点j之间的四维时空距离。有益效果是:通过Gaussian型核函数可以更加准确的得到四维时空权重矩阵。进一步的,上述PM2.5浓度预测方法及装置中,所述高程信息为数字高程信息,所述观测点i与观测点j之间的四维时空距离的计算公式为:其中,为观测点i与观测点j之间的二维空间距离;为观测点i与观测点j之间的数字高程空间距离;为观测点i与观测点j之间的时间距离;λ、δ、μ为尺度调整因子,用来平衡不同四维时空距离的尺度差异。有益效果是:计算四维时空距离的方法简单准确。进一步的,上述PM2.5浓度预测方法及装置中,所述四维时空带宽是根据的二维空间带宽hS2d、数字高程空间带宽hSDEM以及时间带宽hT得到的。有益效果是:分别求解二维空间带宽、数字高程空间带宽和时间带宽,然后根据二维空间带宽、数字高程空间带宽、时间带宽和四维时空带宽得到四维时空带宽,使得得到的四维时空带宽更加准确。进一步的,上述PM2.5浓度预测方法及装置中,根据赤池信息量准则计算二维空间带宽、数字高程空间带宽和时间带宽,所述赤池信息量准则AICc为:其中,σ2为4D-GTWR模型中随机误差方差的无偏估计,S是4D-GTWR模型的帽子矩阵,X1、X2、…、Xn分别是观测点1、2、…、n的自变量组成的行向量。有益效果是:通过赤池信息量准则可以得到更加准确的带宽数据,进一步的提高PM2.5预测的准确度。进一步的,上述PM2.5浓度预测方法及装置中,所述4D-GTWR模型中随机误差方差的无偏估计σ2的计算公式为:σ2=RSS4D-GTWR/(n-2tr(S)+tr(STS));其中,RSS4D-GTWR为4D-GTWR模型的残差平方和。进一步的,上述PM2.5浓度预测方法及装置中,所述4D-GTWR模型的残差平方和RSS4D-GTWR的计算公式为:RSS4D-GTWR=YT(I-S)T(I-S)Y;其中,I为单位矩阵。进一步的,上述PM2.5浓度预测方法及装置中,气象数据至少包括气压、气温、相对湿度、降雨量、风速以及风向。有益效果是:以上各气象数据都与PM2.5的浓度相关,通过以上气象数据可以更加全面的预测PM2.5的浓度。附图说明图1为本发明观测点i与观测点j之间的四维时空距离示意图;图2为现有技术中采用GTWR模型的PM2.5估计值与观测值的关系图;图3为本发明采用4D-GTWR模型的PM2.5估计值与观测值的关系图。具体实施方式PM2.5浓度预测方法实施例:本实施例提出的PM2.5浓度预测方法,包括以下步骤:1)获取PM2.5浓度历史数据、气象历史数据、大气气溶胶光学厚度历史数据。不同的气象和不同的大气气溶胶光学厚度(AOD数据)都会对PM2.5浓度产生不同的影响。本实施例中,气象历史数据包括的气象因子有气压(hPa)、气温(℃)、相对湿度(%)、降雨量(mm)、风速(km/h)以及风向(°)。不过,对PM2.5浓度影响较大的有风速、风向以及相对湿度,因此在气象历史数据只有风速、风向以及相对湿度也是可以的。PM2.5浓度历史数据是由空气质量污染自动监测站(以下简称监测站)检测得到的,为每小时PM2.5均值浓度监测数据,气象历史数据是由气象站检测得到的,为每小时均值数据。这些数据均可在中国国家气象信息中心网站提供下载,由于气象站点与PM2.5监测站点的地理位置有所差异,PM2.5监测站点的气象因子的值则由周围气象站点的数据采用克里金插值而来。AOD数据是由中分辨率成像光谱仪(MODIS)反演得来的,采用IDL程序设计将MYD04_3K数据做几何校正,转化为WGS-84地理坐标系,并利用Arcpy提取与PM2.5检测站点时空匹配的AOD数据。MODIS是一种反演大气气溶胶光学厚度常用的传感器,扫描宽度为2330km,可以每天获取至少一次的全球观测数据。MODIS具有36个光谱通道,波谱范围为0.4–14μm,空间分辨率可以为250m,500m,1000m,可以用于获取AOD,水汽,地表温度,海洋等方面的数据。MODIS数据中的AOD数据由NASALAADS提供数据下载。2)获取观测点的二维位置信息、数字高程信息(即DEM信息)和采样时间信息。二维位置信息为观测点的位置信息,采样时间为2017.12-2018.2,本实施例中采用数字高程信息(即DEM信息)作为三维空间的高度信息,DEM数据(即DEM信息)来源于中国科学院计算机网络信息中心地理空间数据云平台,空间分辨率为30m,DEM数据为2009年的数据。作为其他实施方式,也可以采用其他高程信息,本发明对此不做限制。3)根据上述数据确定4D-GTWR模型的参数,从而确定4D-GTWR模型。4D-GTWR模型为:其中,xik为观测点i的第k个自变量,共有p个自变量,自变量为气象数据;yi为观测点i的因变量,因变量为PM2.5浓度数据;4D-GTWR模型的参数为:βik(ui,vi,zi,ti)、βi0(ui,vi,zi,ti)和ξi,βik(ui,vi,zi,ti)为观测点i的第k个自变量的自变量回归系数,与观测点i的空间位置有关;βi0(ui,vi,zi,ti)为观测点i的自变量回归系数常数项;ξi为观测点i的随机误差;(ui,vi,zi,ti)为观测点i的四维空间坐标,其中,(ui,vi)表示二维空间坐标,(zi)表示数字高程空间坐标,(ti)表示时间坐标;n为观测点的数量。对该模型求解主要是对自变量回归系数βik(ui,vi,zi,ti)的求解,ξi为观测点i的随机误差,服从ξi-N(0,ω2)的独立同分布,且Cov(ξi,ξj)=0(i≠j)(即随机变量ξi与ξj有相同的概率分布,并且互相独立)。观测点i的自变量回归系数的最小二乘估值为是由βik(ui,vi,zi,ti)组成的矩阵,βi0(ui,vi,zi,ti)是矩阵中的第一列的值,依据加权最小二乘准则对4D-GTWR模型进行估计,分别对每个观测点建立目标函数。观测点i的目标函数如下:其中,wijST为观测点i与观测点j之间的核函数(即权重),与四维时空距离相关。自变量回归系数的最小二乘估值可表示为:其中,W(ui,vi,zi,ti)表示四维时空权重矩阵,是由wijST组成的矩阵,X为自变量矩阵,X矩阵中的1为βi0对应的自变量xi0,一般取值为1,Y为观测值矩阵(这里为观测到的实际PM2.5值),通过上述计算可得出观测点i的因变量估计值为:其中,Xi表示矩阵X第i行的向量(即观测点i的自变量组成的行向量)。因此,各观测点处的因变量回归向量(即预测结果)为:其中,S是4D-GTWR模型的帽子矩阵。本实施例中wijST核函数为Gaussian型核函数,作为其他实施方式,wijST核函数也可以为Bi-square型核函数,本发明对核函数的类型不做限制。Gaussian型核函数公式为:其中,h4D-ST为四维时空带宽,dijST为观测点i与观测点j之间的四维时空距离。本发明考虑到三维空间和一维时间的四维空间异质性,提出四维时空距离的分析计算方法,下面阐述4D-GTWR模型的时间距离和三维空间距离的构造方法。考虑到DEM主要对空间维度产生一定影响,基于本文对PM2.5时空变化研究,PM2.5等污染物的污染过程是具有四维时空地域性变化的,即存在四维时空非平稳性变化。因此,针对任意多个监测点,它们之间的三维空间坐标是有区别的。考虑到二三维空间可能具有不同的尺度效应,4D-GTWR模型引入来表现其之间的尺度差异。因此,由欧式空间距离可知,对于观测点i和观测点j之间的三维空间距离dijs可通过如下方式表示:其中,可表示各种运算符。在此基础上,融合时空距离构造方法,四维时空距离表示如下:尺度效应符号和通常均采用加法,即对四维时空距离进行线性组合,可得到4D-GTWR模型下,如图1所示,观测点i(即图1中的回归点)与观测点j(即图1中的临近点)之间的四维时空距离dijST的表示如下:其中,为观测点i与观测点j之间的二维空间距离;观测点i与观测点j之间的数字高程空间距离;观测点i与观测点j之间的时间距离,λ、δ、μ为尺度调整因子,用来平衡不同四维时空距离的尺度差异。这里的u对应图中坐标的X轴,v对应图中坐标的Y轴,z对应图中坐标的Z轴,t对应图中坐标的T轴。在核函数中,带宽参数的选取对模型的拟合结果影响很大,带宽过小会导致估计结果出现过拟合,带宽过大则会导致估计结果不够准确。因此,选取合适的带宽参数对于模型估计的准确性至关重要。应用到本实施例中,也就是说四维时空带宽h4D-ST对于4D-GTWR模型估计的准确性至关重要。四维时空带宽h4D-ST是根据的二维空间带宽hS2d、数字高程空间带宽hSDEM以及时间带宽hT得到的。将以上所述的dijST带入可以得出:其中,wijS2d、wijSDEM、wijT分别表示二维空间权重、DEM空间权重和时间权重,因而,4D-GTWR模型的四维时空权重矩阵表述如下:从上述W(ui,vi,zi,ti)的表达式可以看出四维时空权重矩阵是与二维空间权重、DEM空间权重和时间权重相关的,为了求解需要求解出hS2d、hSDEM、hT、λ、δ、μ。本实施例中,根据赤池信息量准则(AICc)计算hS2d、hSDEM、hT、λ、δ、μ,作为其他实施方式,也可以根据CV准则(交叉验证法)进行计算,本发明对带宽以及尺度调整因子的计算过程不做限制。AICc的计算过程为:σ2=RSS4D-GTWR/(n-2tr(S)+tr(STS));RSS4D-GTWR=YT(I-S)T(I-S)Y;其中,σ2为4D-GTWR模型中随机误差方差的无偏估计,RSS4D-GTWR为4D-GTWR模型的残差平方和,I为单位矩阵。RSS4D-GTWR的具体计算过程为:其中,假设拟合值是E(yi)的无偏估计,即则:且E(εTε)=σ2I。那么RSS4D-GTWR还可以表式为:其中自由度fd为n-2tr(S)+tr(STS),从而可以得到4D-GTWR模型中随机误差项的无偏方差估计σ2为:σ2=RSS4D-GTWR/(n-2tr(S)+tr(STS))。通过以上公式可以看出,4D-GTWR模型的帽子矩阵S是关于未知参数W(ui,vi,zi,ti)的矩阵,则AICc是仅关于W(ui,vi,zi,ti)的函数,然而W(ui,vi,zi,ti)是关于各带宽的函数,因此最终AICc是关于各带宽的函数,求解AICc值最小时对应的各带宽以及尺度调整因子即为所需的各带宽以及尺度调整因子。尺度调整因子λ、与二维空间相关,λ、δ与DEM空间相关,μ与时间相关,一般情况下,λ、设置成为一个常数m,在进行δ、μ以及各个带宽计算的过程中,首先先设定δ、μ以及各个带宽的范围(带宽范围设置依据其实是在计算过程中不断去测试的,与四维时空距离有关)。具体求解过程为:第一步:将λ和设置成m,再设置hS2d的范围,确定最小AICc值对应的hS2d;第二步:将λ和设置成m,再设置μ与hT的范围,确定最小AICc值对应的μ和hT;第三步:将λ和设置成m,再设置δ与hSDEM的范围,确定最小AICc值对应的δ和hSDEM。4)通过以上计算可以反推求解出W(ui,vi,zi,ti),进而求解出4D-GTWR模型的帽子矩阵S,最后得到预测结果通过以上计算,4D-GTWR模型中的各参数已经确定,最终可以确定4D-GTWR模型,在进行PM2.5浓度预测时,将预测的气象数据带入4D-GTWR模型,即可预测出各观测区的PM2.5浓度。以下通过具体的历史数据对本方法进行验证:以某观测点为例进行验证,设某观测点为(u1,v1,z1,t1),其他另外两个观测点为(u2,v2,z2,t2)和(u3,v3,z3,t3),自变量和因变量的历史数据如表一:表一历史数据以上数据只是一部分历史数据,在确定4D-GTWR模型的过程中,至少需要100个观测点的数据,由于数据过多这里不一一列举。三个观测点的时空坐标为表二,二维位置信息是WGS_1984_World_Mercator投影坐标系中的横坐标与纵坐标:表二观测点的时空坐标ztuv161(z1)49(t1)12612250.93(u1)4111074.699(v1)147(z2)49(t2)12612591.07(u2)4114111.191(v2)131(z3)49(t3)12575408.2(u3)4105491.236(v3)将历史数据带入模型中,做相关性的分析即可得知模型的准确度,相关性分析包括R2(相关系数),RMSE(均方根误差),MAE(平均绝对误差),R2越大,RMSE和MAE越小,说明模型准确度高。计算公式如下:其中,为观测点i的PM2.5浓度估计值(预测值),为观测点i的PM2.5浓度观测值的平均值,yi为观测点i的PM2.5浓度观测值。将上述历史数据分别带入GTWR模型中(GTWR模型为现有技术,这里不做过多介绍),将得出GTWR模型的结果,包括各观测点中自变量的自变量回归系数,各观测点的因变量回归拟合向量带宽参数为2.2895,然后将与实际向量值y(各观测点的PM2.5观测值)做线性相关性分析,结果如图2所示,可以得出线性相关分析曲线y=1.0536x-2.3442(该曲线为相关性分析曲线,该公式中的x为PM2.5观测值,y为PM2.5的预测值),R2,RMSE,MAE,图2中零散的点中既有PM2.5估计值(预测值),也有PM2.5观测值(实测值),横坐标为PM2.5(实测值),纵坐标为PM2.5预测值,通过零散的点与的线性相关分析曲线的关系可以看出模型的效果,所得的结果如表三所示:表三GTWR模型表三中,Min为最小值,LQ为下四分位数,Med为中值,UQ为上四分位数,Max为最大值,描述了各自变量回归系数随时空位置的变化情况,截距为自变量的回归系数常数项,表中的AOD表示自变量AOD对应的自变量回归系数,相对湿度表示自变量相对湿度对应的自变量回归系数,气压表示自变量气压对应的自变量回归系数,气温表示自变量气温对应的自变量回归系数,风速表示自变量风速对应的自变量回归系数,风向表示自变量风向对应的自变量回归系数,降雨量数据为0,因此这里没有相关回归系数。将上述历史数据分别带入4D-GTWR模型中,将得出4D-GTWR模型的结果,包括各观测点中自变量的自变量回归系数,各观测点的因变量回归拟合向量带宽参数为0.0063,然后将与实际向量值y(各观测点的PM2.5观测值)做线性相关性分析,结果如图3所示,可以得出线性相关分析曲线y=1.0253x-1.2749,R2,RMSE,MAE,如图3所示,图3与图2横坐标、纵坐标、零散的点与曲线所表示的含义相同,这里不做过多介绍,所得的结果如表四所示:表四4D-GTWR模型表四中的各含义与表三相同,从结果可以看出,GTWR模型中,R2=0.8811,RMSE=12.9579,MAE=9.5815,4D-GTWR模型中,R2=0.9496,RMSE=8.5931,MAE=5.9498,4D-GTWR模型的R2比GTWR模型的R2大,4D-GTWR模型的RMSE和MAE比GTWR模型的RMSE和MAE小,说明4D-GTWR模型准确度更高。PM2.5浓度预测装置实施例:本实施例提出的PM2.5浓度预测装置,包括存储器、处理器以及存储在所述存储器中并可在处理器上运行的计算机程序,处理器在执行所述计算机程序时实现PM2.5浓度预测方法。PM2.5浓度预测方法的具体实施过程在上述PM2.5浓度预测方法实施例中已经介绍,这里不做赘述。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1