基于VARX模型的大气PM<sub>2.5</sub>浓度预测方法

文档序号:10687398阅读:373来源:国知局
基于VARX模型的大气PM<sub>2.5</sub>浓度预测方法
【专利摘要】本发明提供了一种基于VARX模型的大气PM2.5浓度预测方法,其包括如下步骤:步骤一、收集目标城市的污染物浓度数据及气象数据;步骤二、从数据库中读出目标城市的污染数据和气象数据;步骤三、对除PM2.5以外的数据进行主成分分析;步骤四、对数据集进行根检验;步骤五、构造VARX方程模型;步骤六、使用AIC赤池信息量准则和SC施瓦兹准则来确定模型的滞后阶数;步骤七、修正并使用VARX模型来对PM2.5浓度进行预测。本发明具有较强的泛化能力、预测精度较高等特点。
【专利说明】
基于VARX模型的大气PM25浓度预测方法
技术领域
[00011本发明涉及一种基于VARX模型的大气PM2.5浓度预测方法,特别是基于VARX模型并 结合目标城市气象数据和污染数据的大气PM2.5质量浓度的时间序列预测方法。根据模型设 置不同,可进行短期和长期的预测。
【背景技术】
[0002] 中国经济在保持高速发展的同时,粗放型经济发展方式带来的是能源的巨大消耗 及污染物排放量的大幅增加,这种高浓度的PM2. 5将影响公众身心健康和环境安全,降低大 气能见度,影响区域气候,并导致中国经济发达地区如京津冀,长三角地区和珠三角地区的 大气复合污染日益严重。对此,近几年的研究结果表明,传统的以S0 2、TSP、PM1Q等煤烟型为 代表的第一代大气污染得到了明显改善,但随着机动车数量的激增,导致大气污染的类型 正逐渐向煤烟和汽车尾气混合型污染发展,以大气臭氧(O 3)和细颗粒物(PM2.5)为代表的大 气复合型空气污染已经开始成为影响人民生活质量的重大环境问题。因此对PM 2.5浓度进行 预测可为公众出行安排、自我健康防护提供参考。
[0003] 同传统的S02、TSP、PM1Q的污染物相比,PM2.5质量浓度中大部分为二次气溶胶,即由 一次污染物在大气中二次反应形成的气溶胶,其形成机理和治理难度都比一次污染物更复 杂。近年来的研究都表明PM 2.5的形成和灰霾天气的发生是污染排放和气象条件共同作用的 结果。
[0004] 本发明通过对不同城市的PM2.5浓度及其他污染物浓度和气象因子进行相关性分 析和主成分分析,在获得不同城市的PM 2.5同其他数据的相关性质后,对模型的参数进行调 整,使预测结果更准确。

【发明内容】

[0005] 本发明的提供了一种基于VARX模型的PM2.5浓度预测方法,用以解决大气PM2. 5浓度 预测及其精度问题。
[0006] 为了达到上述目的,本发明提供一种基于VARX模型的大气PM2.5浓度预测方法,其 特征在于,所述基于VARX模型的大气PM 2.5浓度预测方法包括如下步骤:
[0007] 步骤一、收集目标城市的污染物浓度数据及气象数据,在对数据进行清洗之后,存 入数据库;
[0008] 步骤二、从数据库中读出目标城市的污染数据和气象数据,并进行一定的格式化 处理;定义预测周期Tmin,作为时间序列中的最小预测时间间隔;
[0009] 步骤三、对除PM2.5以外的数据进行主成分分析,选择累计贡献率达到90%的前η个 主成分序列与PM 2.5质量浓度共同构成数据集S;
[0010] 步骤四、对数据集S的η+1列数据进行PP(Phillips-Perron)单根检验,检验每一列 时间序列是否存在单位根,并对一阶差分不是平稳序列的时间序列进行差分处理;若存在 单位根,则进一步差分处理,重复以上过程直到时间序列的一阶差分为平稳序列;
[0011] 步骤五、以数据集S中的η个主成分序列作为向量自回归模型的内生变量及样本, 构造 VARX方程模型:
[0012]
[0013] 式中Yt代表了第t期k个时间序列变量构成的kXl向量,Yt-i是Yt滞后i期的滞后变 量构成的kXl列向量,是k Xl的常数项向量,Ai为k Xk的系数矩阵,X是η Xl列向量,η是外 生变量个数向量即主成分个数,B是kXn系数矩阵,是由随机误差扰动项构成的nXl列向 量,P为滞后阶数;
[0014] 步骤六、使用AIC赤池信息量准则和SC施瓦兹准则来确定模型的滞后阶数,计算公 式如下:
[0015]
[0016]
[0017] 式中L为极大似然估计,T为样本容量;计算1到η阶的AICi和SCi的值,当二者都取到 最小值时,该P值就是最大的滞后阶数;若二值不同时取到最小值,则再参考似然比法LR;
[0018] 步骤七、对于VARX模型,由于E( t) = Σ,且Σ是正定矩阵,则存在唯一的主对角 线为1的下三角阵Q使得E=QAQ',其中Λ为对角矩阵,因此可以构造%. = ,从而得
到:
[0019]
[0020] 因此Σ的cholesky分解式为:
[0021]
[0022]且由于Σ是正定矩阵,所以Λ对角线上元素全为整数,对其对角线元素进行平方 根运算可得aIq为下三角阵,则f = 也为下三角阵,令1% = ,得到:
[0023] E(yty/t) = (r1)E(ete/T)(r1)/ =(r1)E(r1)/ =(r1)(RR/ )(^1)7 =I
[0024] I为单位矩阵,对步骤五的公式左乘下三角矩阵ΙΓ1,使模型中的所有扰动项互相独 立;在此基础上,修正并使用VARX模型来对PM 2.5质量浓度进行预测。
[0025]优选地,所述基于VARX模型的大气ΡΜ2.5浓度预测方法首先对目标城市的ΡΜ 2.5及其 相关污染物的浓度数据和气象数据进行预处理;对除ΡΜ2.5以为的其他数据做主成分分析获 得主成分序列矩阵;提取ΡΜ 2.5浓度数据作为模型因变量y(预测值),将其他主成分Comp的组 合作为模型的自变量~1 2,..,以预测特征);使用1矩阵和7向量构造时间序列数据集5、并 将数据集S分为训练集S train和验证集SvaIidate;以训练集Strain通过计算机算法生成VARX向量 自回归模型,以验证集S valldate数据来对模型结果的进行评价。
[0026] 本发明的有益效果如下:
[0027] -、本发明结合环境监测站的污染数据和气象站的气象数据,通过相关分析和主 成分分析,对目标城市的PM 2.5影响因素进行分析。可以将对目标城市影响最大的气象和污 染数据导出并构成训练集的外生变量。并可选择不同的预测周期来对PM 2.5浓度进行短期和 长期预测。
[0028] 二、基于分析结果,构建目标城市VARX模型来对PM2.5污染浓度进行预测。
[0029] 三、本专利具有较强的泛化能力,对多个城市和多种时间间隔的预测结果进行验 证,模拟结果较好,说明本发明提出的方法预测精度较高。
【附图说明】
[0030] 图1为本发明的方法流程示意图。
[0031] 图2为PM2.5预测值与实际值对比示意图。
【具体实施方式】
[0032] 如图1所示,本发明首先对目标城市的PM2.5及其相关污染物的浓度数据和气象数 据进行预处理。对除PM 2.5以为的其他数据做主成分分析获得主成分序列矩阵。提取PM2.5浓 度数据作为模型因变量y(预测值),将其他主成分Comp的组合作为模型的自变量 X1,X2,.., Xn(预测特征)。使用X矩阵和y向量构造时间序列数据集S、并将数据集S分为训练集Strain和 验证集Svalidate。以训练集Strain通过计算机算法生成VARX向量自回归模型,以验证集Svalidate 数据来对模型结果的进行评价。本方法还可根据设置模型的最小预测间隔Tmln,对PM2. 5浓度 进行短期和长期的浓度预测。
[0033]本发明基于VARX模型的PM2.5浓度预测方法的具体步骤如下:
[0034]步骤一、收集目标城市的污染物浓度数据及气象数据,污染物主要包括PM2.5、S0 2、 CO、NOx、PM1Q、O3,气象数据主要包括大气温度、露点温度、湿度、海平面气压、可见度、风向、 风速、降雨等数据。在对数据进行清洗之后,存入数据库。
[0035]步骤二、从数据库中读出目标城市的污染数据和气象数据,并进行一定的格式化 处理。定义预测周期Tmin,作为时间序列中的最小预测时间间隔。
[0036]步骤三、对除PM2.5以外的数据进行主成分分析,选择累计贡献率达到90%的前η个 主成分序列与PM2.5质量浓度共同构成数据集S。
[0037] 步骤四、对数据集S的η+1列数据进行PP(Phillips-Perron)单根检验,检验每一列 时间序列是否存在单位根,并对一阶差分不是平稳序列的时间序列进行差分处理。若存在 单位根,则进一步差分处理,重复以上过程直到时间序列的一阶差分为平稳序列。
[0038] 步骤五、以数据集S中的η个主成分序列作为向量自回归模型的内生变量及样本, 构造 VARX方程模型,如下式(1):
[0039]
[0040] 式中Yt代表了第t期k个时间序列变量构成的kXl向量,Yt-i是Yt滞后i期的滞后变 量构成的kXl列向量,是k Xl的常数项向量,Ai为k Xk的系数矩阵,X是η Xl列向量,η是外 生变量个数向量即主成分个数,B是kXn系数矩阵,是由随机误差扰动项构成的nXl列向 量,P为滞后阶数。
[0041 ]并且有Cov( ε js,ejr) = 〇(j=1,2...k且s矣r)、Cov(Yt_i,et) = 0(i=i,2...p)。即 et相互之间可以 同期相关,但不与自己的滞后值相关且不与等式右边的变量相关。
[0042]步骤六、使用AIC赤池信息量准则和SC施瓦兹准则来确定模型的滞后阶数,计算公 式如下式(2)和(3):
[0043]
[0044]
[0045] 式中L为极大似然估计,T为样本容量。计算1到η阶的AICi和SCi的值,当二者都取到 最小值时,该P值就是最大的滞后阶数。若二值不同时取到最小值,则再参考似然比法LR。 [0046] 步骤七、对于VARX模型,由于E(et/t)=X,且Σ是正定矩阵,则存在唯一的主对角 线为1的下三角阵Q使得Σ =QAQ',其中Λ为对角矩阵,因此可以构造|* = ^^£*,从而得到 如下式(4):
[0047] EUftXQ-WEGt^tKQ-1V = (Qd)E^1V = A ……(4)
[0048] 因此Σ的cholesky分解式为如下式(5):
[0049]
[0050] 且由于Σ是正定矩阵,所以Λ对角线上元素全为整数,对其对角线元素进行平方 根运算可彳I为下三角阵,!
?为下三角阵,令Pt = IT1Et,可以得到如下式 (6):
[0051 ] E(yty71) = (R^1)EC Ete7T) (r1)'=
[0052] (R^1)E (r1)' = (r1) (RR') (r1)' = I......(6)
[0053] I为单位矩阵,对步骤五的公式(1)左乘下三角矩阵ΙΓ1,可使模型中的所有扰动项 互相独立。
[0054] 在此基础上,可以修正和使用VARX模型来对PM2.5质量浓度进行预测,具体如下式 (7):
[0055]
[0056]式中ylt是第t期第i个内生变量,ylt是第t期第i个常数项,A1,…,A p分别对应滞后1 到p期的kXk维系数矩阵,ylt^是第t-j期第i个内生变量,其中j为落后期数,B为kXn维系 数矩阵,X lt是第t期的第i个外生变量,elt为第t期第i个扰动项。
[0057]本发明采用国家公布的大气污染物浓度数据与气象站的气象数据,根据各城市不 同的特点,构建时间序列的VARX模型,并可设置最小预测时间对PM2.5的质量浓度进行短期 和长期的预测。
[0058]下面是一个具体实施的例子:如本发明可以设定预测周期Tmin为24小时,对某城市 除PM2.5以外的数据进行主成分分析来对变量进行降维,通过碎石图和主成分分析计算结 果,将该城市30多种数据转换成4个主成分。将这4个主成分序列同PM 2.5质量浓度共同构成 数据集S。使用AIC赤池信息量准则和SC施瓦兹准则计算得到模型的的滞后阶数为4。通过PP 检验和差分处理,将S数据集转换成平稳时间序列,以转换后的数据集S构建VARX向量自回 归模型来对PM2. 5浓度进行预测。预测结果与实际值对比示意图如图2所示。从图中可以看出 该模型对于短期日均PM2.5浓度预测准确程度较高,若要进行长期预测则需要对模型实施滚 动运行,并加入季节性扰动因素和循环变动因素,同时扩大训练集的训练数量。
【主权项】
1. 一种基于VARX模型的大气PM2.5浓度预测方法,其特征在于,所述基于VARX模型的大 气PM2.5浓度预测方法包括如下步骤: 步骤一、收集目标城市的污染物浓度数据及气象数据,在对数据进行清洗之后,存入数 据库; 步骤二、从数据库中读出目标城市的污染数据和气象数据,并进行一定的格式化处理; 定义预测周期Tmin,作为时间序列中的最小预测时间间隔; 步骤三、对除PM2.5以外的数据进行主成分分析,选择累计贡献率达到90%的前n个主成 分序列与PM2.5质量浓度共同构成数据集S; 步骤四、对数据集S的n+1列数据进行PP单根检验,检验每一列时间序列是否存在单位 根,并对一阶差分不是平稳序列的时间序列进行差分处理;若存在单位根,则进一步差分处 理,重复以上过程直到时间序列的一阶差分为平稳序列; 步骤五、以数据集S中的n个主成分序列作为向量自回归模型的内生变量及样本,构造 VARX方程模型:式中Yt代表了第t期k个时间序列变量构成的k X 1向量,Yt-i是Yt滞后i期的滞后变量构 成的kXl列向量,yt是kXl的常数项向量,Ai为kXk的系数矩阵,X是nXl列向量,n是外生变 量个数向量即主成分个数,B是kXn系数矩阵,e t是由随机误差扰动项构成的nXl列向量,P 为滞后阶数; 步骤六、使用AIC赤池信息量准则和SC施瓦兹准则来确定模型的滞后阶数,计算公式如 下:式中L为极大似然估计,T为样本容量;计算1到n阶的AlCi和SCi的值,当二者都取到最 小值时,该P值就是最大的滞后阶数;若二值不同时取到最小值,则再参考似然比法LR; 步骤七、对于VARX模型,由于£(^\) = £,且£是正定矩阵,则存在唯一的主对角线为 1的下三角阵Q使得E=QAQ',其中A为对角矩阵,因此可以构造 UzQlt,从而得到:因此E的cholesky分解式为:且由于E是正定矩阵,所以A对角线上元素全为整数,对其对角线元素进行平方根运 算可得为下三角阵,则I? = @ ^也为下三角阵,令以二丨、,得到: E(yty/t) = (r1)E(ete/x)(r1)/ =(r1)E(r1)/ =(r1)(RR/ )(r1)/ =i 其中,I为单位矩阵,对步骤五的公式左乘下三角矩阵IT1,使模型中的所有扰动项互相 独立; 在此基础上,修正并使用VARX模型来对PM2.5质量浓度进行预测。2.根据权利要求1所述的基于VARX模型的大气PM2.5浓度预测方法,其特征在于,所述基 于VARX模型的大气PM2.5浓度预测方法首先对目标城市的PM2. 5及其相关污染物的浓度数据 和气象数据进行预处理;对除PM2.5以为的其他数据做主成分分析获得主成分序列矩阵;提 取PM 2.5浓度数据作为模型因变量y(预测值),将其他主成分Comp的组合作为模型的自变量 X1,X2, . .,Xn;使用X矩阵和y向量构造时间序列数据集S、并将数据集S分为训练集Strain和验 证集Svalidate;以训练集Strain通过计算机算法生成VARX向量自回归模型,以验证集Svalidate 数据来对模型结果的进行评价。
【文档编号】G06F19/00GK106055904SQ201610393256
【公开日】2016年10月26日
【申请日】2016年6月4日
【发明人】许振影, 王杨君, 赵博阳, 鲍胜威, 陈杨欢
【申请人】上海大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1