基于VARX模型的大气PM<sub>2.5</sub>浓度预测方法

文档序号：10687398阅读：373来源：国知局

基于VARX模型的大气PM<sub>2.5</sub>浓度预测方法
【专利摘要】本发明提供了一种基于VARX模型的大气PM2.5浓度预测方法，其包括如下步骤：步骤一、收集目标城市的污染物浓度数据及气象数据；步骤二、从数据库中读出目标城市的污染数据和气象数据；步骤三、对除PM2.5以外的数据进行主成分分析；步骤四、对数据集进行根检验；步骤五、构造VARX方程模型；步骤六、使用AIC赤池信息量准则和SC施瓦兹准则来确定模型的滞后阶数；步骤七、修正并使用VARX模型来对PM2.5浓度进行预测。本发明具有较强的泛化能力、预测精度较高等特点。
【专利说明】
基于VARX模型的大气PM25浓度预测方法
技术领域
[00011本发明涉及一种基于VARX模型的大气PM2.5浓度预测方法，特别是基于VARX模型并结合目标城市气象数据和污染数据的大气PM2.5质量浓度的时间序列预测方法。根据模型设置不同，可进行短期和长期的预测。
【背景技术】
[0002] 中国经济在保持高速发展的同时，粗放型经济发展方式带来的是能源的巨大消耗及污染物排放量的大幅增加，这种高浓度的PM2. 5将影响公众身心健康和环境安全，降低大气能见度，影响区域气候，并导致中国经济发达地区如京津冀，长三角地区和珠三角地区的大气复合污染日益严重。对此，近几年的研究结果表明，传统的以S0 2、TSP、PM1Q等煤烟型为代表的第一代大气污染得到了明显改善，但随着机动车数量的激增，导致大气污染的类型正逐渐向煤烟和汽车尾气混合型污染发展，以大气臭氧(O 3)和细颗粒物(PM2.5)为代表的大气复合型空气污染已经开始成为影响人民生活质量的重大环境问题。因此对PM 2.5浓度进行预测可为公众出行安排、自我健康防护提供参考。
[0003] 同传统的S02、TSP、PM1Q的污染物相比，PM2.5质量浓度中大部分为二次气溶胶，即由一次污染物在大气中二次反应形成的气溶胶，其形成机理和治理难度都比一次污染物更复杂。近年来的研究都表明PM 2.5的形成和灰霾天气的发生是污染排放和气象条件共同作用的结果。
[0004] 本发明通过对不同城市的PM2.5浓度及其他污染物浓度和气象因子进行相关性分析和主成分分析，在获得不同城市的PM 2.5同其他数据的相关性质后，对模型的参数进行调整，使预测结果更准确。

【发明内容】

[0005] 本发明的提供了一种基于VARX模型的PM2.5浓度预测方法，用以解决大气PM2. 5浓度预测及其精度问题。
[0006] 为了达到上述目的，本发明提供一种基于VARX模型的大气PM2.5浓度预测方法，其特征在于，所述基于VARX模型的大气PM 2.5浓度预测方法包括如下步骤：
[0007] 步骤一、收集目标城市的污染物浓度数据及气象数据，在对数据进行清洗之后，存入数据库；
[0008] 步骤二、从数据库中读出目标城市的污染数据和气象数据，并进行一定的格式化处理;定义预测周期Tmin，作为时间序列中的最小预测时间间隔；
[0009] 步骤三、对除PM2.5以外的数据进行主成分分析，选择累计贡献率达到90%的前η个主成分序列与PM 2.5质量浓度共同构成数据集S;
[0010] 步骤四、对数据集S的η+1列数据进行PP(Phillips-Perron)单根检验，检验每一列时间序列是否存在单位根，并对一阶差分不是平稳序列的时间序列进行差分处理;若存在单位根，则进一步差分处理，重复以上过程直到时间序列的一阶差分为平稳序列；
[0011] 步骤五、以数据集S中的η个主成分序列作为向量自回归模型的内生变量及样本，构造 VARX方程模型：
[0012]
[0013] 式中Yt代表了第t期k个时间序列变量构成的kXl向量，Yt-i是Yt滞后i期的滞后变量构成的kXl列向量，是k Xl的常数项向量，Ai为k Xk的系数矩阵，X是η Xl列向量，η是外生变量个数向量即主成分个数，B是kXn系数矩阵，是由随机误差扰动项构成的nXl列向量，P为滞后阶数；
[0014] 步骤六、使用AIC赤池信息量准则和SC施瓦兹准则来确定模型的滞后阶数，计算公式如下：
[0015]
[0016]
[0017] 式中L为极大似然估计，T为样本容量;计算1到η阶的AICi和SCi的值，当二者都取到最小值时，该P值就是最大的滞后阶数;若二值不同时取到最小值，则再参考似然比法LR;
[0018] 步骤七、对于VARX模型，由于E( t) = Σ，且Σ是正定矩阵，则存在唯一的主对角线为1的下三角阵Q使得E=QAQ'，其中Λ为对角矩阵，因此可以构造％. = ，从而得
到：
[0019]
[0020] 因此Σ的cholesky分解式为：
[0021]
[0022]且由于Σ是正定矩阵，所以Λ对角线上元素全为整数，对其对角线元素进行平方根运算可得aIq为下三角阵，则f = 也为下三角阵，令1% = ,得到：
[0023] E(yty/t) = (r1)E(ete/T)(r1)/ =(r1)E(r1)/ =(r1)(RR/ )(^1)7 =I
[0024] I为单位矩阵，对步骤五的公式左乘下三角矩阵ΙΓ1，使模型中的所有扰动项互相独立;在此基础上，修正并使用VARX模型来对PM 2.5质量浓度进行预测。
[0025]优选地，所述基于VARX模型的大气ΡΜ2.5浓度预测方法首先对目标城市的ΡΜ 2.5及其相关污染物的浓度数据和气象数据进行预处理;对除ΡΜ2.5以为的其他数据做主成分分析获得主成分序列矩阵;提取ΡΜ 2.5浓度数据作为模型因变量y(预测值），将其他主成分Comp的组合作为模型的自变量~1 2，..，以预测特征）；使用1矩阵和7向量构造时间序列数据集5、并将数据集S分为训练集S train和验证集SvaIidate;以训练集Strain通过计算机算法生成VARX向量自回归模型，以验证集S valldate数据来对模型结果的进行评价。
[0026] 本发明的有益效果如下：
[0027] -、本发明结合环境监测站的污染数据和气象站的气象数据，通过相关分析和主成分分析，对目标城市的PM 2.5影响因素进行分析。可以将对目标城市影响最大的气象和污染数据导出并构成训练集的外生变量。并可选择不同的预测周期来对PM 2.5浓度进行短期和长期预测。
[0028] 二、基于分析结果，构建目标城市VARX模型来对PM2.5污染浓度进行预测。
[0029] 三、本专利具有较强的泛化能力，对多个城市和多种时间间隔的预测结果进行验证，模拟结果较好，说明本发明提出的方法预测精度较高。
【附图说明】
[0030] 图1为本发明的方法流程示意图。
[0031] 图2为PM2.5预测值与实际值对比示意图。
【具体实施方式】
[0032] 如图1所示，本发明首先对目标城市的PM2.5及其相关污染物的浓度数据和气象数据进行预处理。对除PM 2.5以为的其他数据做主成分分析获得主成分序列矩阵。提取PM2.5浓度数据作为模型因变量y(预测值），将其他主成分Comp的组合作为模型的自变量 X1，X2，..， Xn(预测特征）。使用X矩阵和y向量构造时间序列数据集S、并将数据集S分为训练集Strain和验证集Svalidate。以训练集Strain通过计算机算法生成VARX向量自回归模型，以验证集Svalidate 数据来对模型结果的进行评价。本方法还可根据设置模型的最小预测间隔Tmln，对PM2. 5浓度进行短期和长期的浓度预测。
[0033]本发明基于VARX模型的PM2.5浓度预测方法的具体步骤如下：
[0034]步骤一、收集目标城市的污染物浓度数据及气象数据，污染物主要包括PM2.5、S0 2、 CO、NOx、PM1Q、O3，气象数据主要包括大气温度、露点温度、湿度、海平面气压、可见度、风向、风速、降雨等数据。在对数据进行清洗之后，存入数据库。
[0035]步骤二、从数据库中读出目标城市的污染数据和气象数据，并进行一定的格式化处理。定义预测周期Tmin，作为时间序列中的最小预测时间间隔。
[0036]步骤三、对除PM2.5以外的数据进行主成分分析，选择累计贡献率达到90%的前η个主成分序列与PM2.5质量浓度共同构成数据集S。
[0037] 步骤四、对数据集S的η+1列数据进行PP(Phillips-Perron)单根检验，检验每一列时间序列是否存在单位根，并对一阶差分不是平稳序列的时间序列进行差分处理。若存在单位根，则进一步差分处理，重复以上过程直到时间序列的一阶差分为平稳序列。
[0038] 步骤五、以数据集S中的η个主成分序列作为向量自回归模型的内生变量及样本，构造 VARX方程模型，如下式(1):
[0039]
[0040] 式中Yt代表了第t期k个时间序列变量构成的kXl向量，Yt-i是Yt滞后i期的滞后变量构成的kXl列向量，是k Xl的常数项向量，Ai为k Xk的系数矩阵，X是η Xl列向量，η是外生变量个数向量即主成分个数，B是kXn系数矩阵，是由随机误差扰动项构成的nXl列向量，P为滞后阶数。
[0041 ]并且有Cov( ε js，ejr) = 〇(j=1,2...k且s矣r)、Cov(Yt_i，et) = 0(i=i,2...p)。即 et相互之间可以同期相关，但不与自己的滞后值相关且不与等式右边的变量相关。
[0042]步骤六、使用AIC赤池信息量准则和SC施瓦兹准则来确定模型的滞后阶数，计算公式如下式(2)和(3):
[0043]
[0044]
[0045] 式中L为极大似然估计，T为样本容量。计算1到η阶的AICi和SCi的值，当二者都取到最小值时，该P值就是最大的滞后阶数。若二值不同时取到最小值，则再参考似然比法LR。 [0046] 步骤七、对于VARX模型，由于E(et/t)=X，且Σ是正定矩阵，则存在唯一的主对角线为1的下三角阵Q使得Σ =QAQ'，其中Λ为对角矩阵，因此可以构造|* = ^^￡*，从而得到如下式(4):
[0047] EUftXQ-WEGt^tKQ-1V = (Qd)E^1V = A ……（4)
[0048] 因此Σ的cholesky分解式为如下式(5):
[0049]
[0050] 且由于Σ是正定矩阵，所以Λ对角线上元素全为整数，对其对角线元素进行平方根运算可彳I为下三角阵，！
?为下三角阵，令Pt = IT1Et,可以得到如下式 (6)：
[0051 ] E(yty71) = (R^1)EC Ete7T) (r1)'=
[0052] (R^1)E (r1)' = (r1) (RR') (r1)' = I......(6)
[0053] I为单位矩阵，对步骤五的公式（1)左乘下三角矩阵ΙΓ1，可使模型中的所有扰动项互相独立。
[0054] 在此基础上，可以修正和使用VARX模型来对PM2.5质量浓度进行预测，具体如下式 (7)：
[0055]
[0056]式中ylt是第t期第i个内生变量，ylt是第t期第i个常数项，A1，…，A p分别对应滞后1 到p期的kXk维系数矩阵，ylt^是第t-j期第i个内生变量，其中j为落后期数，B为kXn维系数矩阵，X lt是第t期的第i个外生变量，elt为第t期第i个扰动项。
[0057]本发明采用国家公布的大气污染物浓度数据与气象站的气象数据，根据各城市不同的特点，构建时间序列的VARX模型，并可设置最小预测时间对PM2.5的质量浓度进行短期和长期的预测。
[0058]下面是一个具体实施的例子:如本发明可以设定预测周期Tmin为24小时，对某城市除PM2.5以外的数据进行主成分分析来对变量进行降维，通过碎石图和主成分分析计算结果，将该城市30多种数据转换成4个主成分。将这4个主成分序列同PM 2.5质量浓度共同构成数据集S。使用AIC赤池信息量准则和SC施瓦兹准则计算得到模型的的滞后阶数为4。通过PP 检验和差分处理，将S数据集转换成平稳时间序列，以转换后的数据集S构建VARX向量自回归模型来对PM2. 5浓度进行预测。预测结果与实际值对比示意图如图2所示。从图中可以看出该模型对于短期日均PM2.5浓度预测准确程度较高，若要进行长期预测则需要对模型实施滚动运行，并加入季节性扰动因素和循环变动因素，同时扩大训练集的训练数量。
【主权项】
1. 一种基于VARX模型的大气PM2.5浓度预测方法，其特征在于，所述基于VARX模型的大气PM2.5浓度预测方法包括如下步骤：步骤一、收集目标城市的污染物浓度数据及气象数据，在对数据进行清洗之后，存入数据库；步骤二、从数据库中读出目标城市的污染数据和气象数据，并进行一定的格式化处理；定义预测周期Tmin，作为时间序列中的最小预测时间间隔；步骤三、对除PM2.5以外的数据进行主成分分析，选择累计贡献率达到90%的前n个主成分序列与PM2.5质量浓度共同构成数据集S; 步骤四、对数据集S的n+1列数据进行PP单根检验，检验每一列时间序列是否存在单位根，并对一阶差分不是平稳序列的时间序列进行差分处理;若存在单位根，则进一步差分处理，重复以上过程直到时间序列的一阶差分为平稳序列；步骤五、以数据集S中的n个主成分序列作为向量自回归模型的内生变量及样本，构造 VARX方程模型：式中Yt代表了第t期k个时间序列变量构成的k X 1向量，Yt-i是Yt滞后i期的滞后变量构成的kXl列向量，yt是kXl的常数项向量，Ai为kXk的系数矩阵，X是nXl列向量，n是外生变量个数向量即主成分个数，B是kXn系数矩阵，e t是由随机误差扰动项构成的nXl列向量，P 为滞后阶数；步骤六、使用AIC赤池信息量准则和SC施瓦兹准则来确定模型的滞后阶数，计算公式如下：式中L为极大似然估计，T为样本容量;计算1到n阶的AlCi和SCi的值，当二者都取到最小值时，该P值就是最大的滞后阶数;若二值不同时取到最小值，则再参考似然比法LR; 步骤七、对于VARX模型，由于￡(^\) = ￡，且￡是正定矩阵，则存在唯一的主对角线为 1的下三角阵Q使得E=QAQ'，其中A为对角矩阵，因此可以构造 UzQlt，从而得到：因此E的cholesky分解式为：且由于E是正定矩阵，所以A对角线上元素全为整数，对其对角线元素进行平方根运算可得为下三角阵，则I? = @ ^也为下三角阵，令以二丨、，得到： E(yty/t) = (r1)E(ete/x)(r1)/ =(r1)E(r1)/ =(r1)(RR/ )(r1)/ =i 其中，I为单位矩阵，对步骤五的公式左乘下三角矩阵IT1，使模型中的所有扰动项互相独立；在此基础上，修正并使用VARX模型来对PM2.5质量浓度进行预测。2.根据权利要求1所述的基于VARX模型的大气PM2.5浓度预测方法，其特征在于，所述基于VARX模型的大气PM2.5浓度预测方法首先对目标城市的PM2. 5及其相关污染物的浓度数据和气象数据进行预处理;对除PM2.5以为的其他数据做主成分分析获得主成分序列矩阵;提取PM 2.5浓度数据作为模型因变量y(预测值），将其他主成分Comp的组合作为模型的自变量 X1，X2, . .，Xn;使用X矩阵和y向量构造时间序列数据集S、并将数据集S分为训练集Strain和验证集Svalidate;以训练集Strain通过计算机算法生成VARX向量自回归模型，以验证集Svalidate 数据来对模型结果的进行评价。
【文档编号】G06F19/00GK106055904SQ201610393256
【公开日】2016年10月26日
【申请日】2016年6月4日
【发明人】许振影, 王杨君, 赵博阳, 鲍胜威, 陈杨欢
【申请人】上海大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：许振影;王杨君;赵博阳;鲍胜威;陈杨欢;
技术所有人：上海大学;
我是此专利的发明人

上一篇：一种基于沥青路面破损pci系统软件的评价方法
上一篇：基于分段常函数正交基的随机动态载荷分解技术的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。