基于自适应主成分分析及神经网络的PM2.5浓度预测方法

文档序号:34825090发布日期:2023-07-20 07:30阅读:33来源:国知局
基于自适应主成分分析及神经网络的PM2.5浓度预测方法

本发明涉及空气质量预测,特别涉及一种基于自适应主成分分析及神经网络的pm2.5浓度预测方法。


背景技术:

1、伴随经济发展以及城市化进程的加速,各类污染物排放量的增加对大气环境造成了巨大影响,空气污染问题已经成为当今社会广泛关注的问题之一。pm2.5作为大气环境的主要污染物,对人群健康、交通出行、环境质量等都具有负面效应,因其具有传输距离长、停留时间久的特性,常被用来评定空气质量。因此,精确预测pm2.5日均浓度,对污染预报、预防呼吸道疾病以及大气环境治理有着至关重要的作用。

2、目前关于pm2.5日均浓度的预测方法主要有两类:一类是传统的统计学方法,另一类是深度学习的神经网络方法。在早期,对pm2.5日均浓度进行预测的方法主要采用灰色模型、线性回归、主成分回归等传统的统计学方法。虽然以上传统模型已经应用于污染物的预测之中,但这些模型大多是针对线性数据而设计的,对线性数据具有良好的预测效果,而pm2.5日均浓度的变化具有非线性、突变性等特点,是一种比较复杂的非线性系统,所以用传统的线性统计学方法对pm2.5浓度进行预测会产生较大误差。近些年随着神经网络在非线性问题领域表现越来越突出,越来越多地开始将神经网络作为污染物浓度的预测模型。但是单一预测模型的初始参数设置对预测的精度会产生很大的影响,为了提高模型的预测精度,越来越多地提出了混合模型,即根据单一的神经网络模型与其他的方法结合在一起的模型。虽然混合模型具有良好的预测效果,但需要通过反复试验来确定模型的参数,不仅费时费力,确定的参数也不一定最优。


技术实现思路

1、本发明的目的是:针对上述背景技术中存在的不足,提供一种pm2.5浓度预测方法,通过自适应主成分分析(spca)能够准确地提取有用信息,可以识别出有助于预测pm2.5日均浓度的变量,降低输入层维度;通过神经网络混频数据模型(ann-u-midas)能够降低计算复杂度,避免数据同频化预处理的缺陷,同时能够在混频数据分析中准确识别变量间的非线性影响模式,来提高模型的拟合效果与预测能力。

2、为了达到上述目的,本发明提供了一种基于自适应主成分分析及神经网络的pm2.5浓度预测方法,包括:

3、s1,获取pm2.5浓度的影响因素历史数据并构造预测变量总样本;

4、s2,利用自适应主成分分析对每类影响因素提取预测因子,识别出有助于预测pm2.5日均浓度的影响因素,包括

5、s21,形成一组缩放的预测变量,缩放系数是在标准化预测变量上进行预测回归的斜率;

6、s22,从缩放的预测变量中提取扩散指数作为pm2.5日均浓度的预测因子;

7、s3,将降低维度后的影响因素输入神经网络混频数据模型,通过原始混频数据预测pm2.5日均浓度,包括

8、s31,对每个预测变量进行频率对齐,以与输出变量具有相同频率;

9、s32,将进入隐藏层的所有频率对齐向量与隐藏层权重相乘,再加上隐藏层偏差,在sigmoid传递函数的作用下,得到各隐藏层节点的计算结果;

10、s33,将进入输入层的所有隐藏层节点的计算结果带入输出层,将进入输入层的所有隐藏层节点的计算结果与输出层权重相乘,再加上输出层偏差,在输出层传递函数的作用下,得到pm2.5日均浓度最终的输出结果:

11、;

12、其中,是输出层权重向量,是输出层偏差,是输出层传递函数。

13、进一步地,s1中影响因素包括so2、no2、co、o3污染气体,最高温度、降水量、最低温度和风力,低频月度数据人均地区生产总值、人均地区工业企业总数、机动车辆数。

14、进一步地,s21中形成一组缩放的预测变量,缩放系数是在第i个标准化预测变量上进行预测回归的斜率,提取预测力强的变量对pm2.5日均浓度进行预测;

15、;

16、其中,n是潜在预测变量的总数量,表示pm2.5日均浓度从时间t到时间t+1的回归,是时间t的第i个预测变量,是均值等于零的误差值,表示第i个预测变量的截距项。

17、进一步地,s22从中提取扩散指数作为pm2.5日均浓度预测因子,所提取的扩散指数的形式为:

18、;

19、其中是k阶向量,表示自适应主成分分析的扩散指数,k由修正的确定,表示拟合优度,衡量的是预测值对于真实值的拟合好坏程度,是需要估计的k维参数,是异质噪声项。

20、进一步地,对每个预测变量的滞后值进行预测回归,通过缩放系数评估预测能力,缩放系数大的预测能力强,缩放系数小的预测能力弱,将预测能力强的预测变量作为神经网络混频数据模型的输入值。

21、进一步地,预测能力强的预测变量包括so2、no2、co、风力、人均地区工业企业总数、机动车辆数。

22、进一步地,s31中对每个预测变量进行频率对齐,获得与输出变量具有相同频率的

23、;

24、其中,是高频原始输入变量,是低频目标输出变量,表示和之间的频率不匹配,。

25、进一步地,s32中将进入隐藏层的所有频率对齐向量与隐藏层权重相乘,再加上隐藏层偏差,在sigmoid传递函数的作用下,得到各隐藏层节点的计算结果:

26、;

27、其中,

28、是隐藏层的权重向量,是隐藏层的偏差向量,是与高频变量相关的高频预测范围,表示使用双曲正切函数的sigmoid传递函数。

29、本发明的上述方案有如下的有益效果:

30、本发明提供的基于自适应主成分分析及神经网络的pm2.5浓度预测方法,利用了自适应主成分分析(spca)对每类影响因素提取公因子,识别出有助于预测pm2.5日均浓度的影响因素,准确地提取有用信息,降低了输入层的维数;运用了神经网络混频数据模型(ann-u-midas)预测pm2.5日均浓度,该模型能够在人工神经网络中直接输入原始混频数据,避免了数据同频化预处理的缺陷,能够在混频数据分析中准确识别变量间的非线性影响模式,提高了模型的拟合效果与预测能力。

31、本发明的其它有益效果将在随后的具体实施方式部分予以详细说明。



技术特征:

1.一种基于自适应主成分分析及神经网络的pm2.5浓度预测方法,其特征在于,包括:

2.根据权利要求1所述的基于自适应主成分分析及神经网络的pm2.5浓度预测方法,其特征在于,s1中影响因素包括so2、no2、co、o3污染气体,最高温度、降水量、最低温度和风力,低频月度数据人均地区生产总值、人均地区工业企业总数、机动车辆数。

3.根据权利要求2所述的基于自适应主成分分析及神经网络的pm2.5浓度预测方法,其特征在于,s21中形成一组缩放的预测变量,缩放系数是在第i个标准化预测变量上进行预测回归的斜率,提取预测力强的变量对pm2.5日均浓度进行预测;

4.根据权利要求3所述的基于自适应主成分分析及神经网络的pm2.5浓度预测方法,其特征在于,s22从中提取扩散指数作为pm2.5日均浓度预测因子,所提取的扩散指数的形式为:

5.根据权利要求4所述的基于自适应主成分分析及神经网络的pm2.5浓度预测方法,其特征在于,

6.根据权利要求5所述的基于自适应主成分分析及神经网络的pm2.5浓度预测方法,其特征在于,预测能力强的预测变量包括so2、no2、co、风力、人均地区工业企业总数、机动车辆数。

7.根据权利要求6所述的基于自适应主成分分析及神经网络的pm2.5浓度预测方法,其特征在于,s31中对每个预测变量进行频率对齐,获得与输出变量具有相同频率的


技术总结
本发明提供了一种基于自适应主成分分析及神经网络的PM2.5浓度预测方法,包括:获取PM2.5浓度的影响因素历史数据并构造预测变量总样本;利用自适应主成分分析对每类影响因素提取预测因子,识别出有助于预测PM2.5日均浓度的影响因素;将降低维度后的影响因素输入神经网络混频数据模型,通过原始混频数据预测PM2.5日均浓度。本发明利用了sPCA准确地提取有用信息,降低了输入层的维数;运用了ANN‑U‑MIDAS预测PM2.5日均浓度,该模型能够在人工神经网络中直接输入原始混频数据,避免了数据同频化预处理的缺陷,能够在混频数据分析中准确识别变量间的非线性影响模式,提高了模型的拟合效果与预测能力。

技术研发人员:姚婷,李振莹
受保护的技术使用者:湖南工商大学
技术研发日:
技术公布日:2024/1/13
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1