基于自适应主成分分析及神经网络的PM2.5浓度预测方法

文档序号：34825090发布日期：2023-07-20 07:30阅读：33来源：国知局

本发明涉及空气质量预测，特别涉及一种基于自适应主成分分析及神经网络的pm2.5浓度预测方法。

背景技术：

1、伴随经济发展以及城市化进程的加速，各类污染物排放量的增加对大气环境造成了巨大影响，空气污染问题已经成为当今社会广泛关注的问题之一。pm2.5作为大气环境的主要污染物，对人群健康、交通出行、环境质量等都具有负面效应，因其具有传输距离长、停留时间久的特性，常被用来评定空气质量。因此，精确预测pm2.5日均浓度，对污染预报、预防呼吸道疾病以及大气环境治理有着至关重要的作用。

2、目前关于pm2.5日均浓度的预测方法主要有两类：一类是传统的统计学方法，另一类是深度学习的神经网络方法。在早期，对pm2.5日均浓度进行预测的方法主要采用灰色模型、线性回归、主成分回归等传统的统计学方法。虽然以上传统模型已经应用于污染物的预测之中，但这些模型大多是针对线性数据而设计的，对线性数据具有良好的预测效果，而pm2.5日均浓度的变化具有非线性、突变性等特点，是一种比较复杂的非线性系统，所以用传统的线性统计学方法对pm2.5浓度进行预测会产生较大误差。近些年随着神经网络在非线性问题领域表现越来越突出，越来越多地开始将神经网络作为污染物浓度的预测模型。但是单一预测模型的初始参数设置对预测的精度会产生很大的影响，为了提高模型的预测精度，越来越多地提出了混合模型，即根据单一的神经网络模型与其他的方法结合在一起的模型。虽然混合模型具有良好的预测效果，但需要通过反复试验来确定模型的参数，不仅费时费力，确定的参数也不一定最优。

技术实现思路

1、本发明的目的是：针对上述背景技术中存在的不足，提供一种pm2.5浓度预测方法，通过自适应主成分分析（spca）能够准确地提取有用信息，可以识别出有助于预测pm2.5日均浓度的变量，降低输入层维度；通过神经网络混频数据模型（ann-u-midas）能够降低计算复杂度，避免数据同频化预处理的缺陷，同时能够在混频数据分析中准确识别变量间的非线性影响模式，来提高模型的拟合效果与预测能力。

2、为了达到上述目的，本发明提供了一种基于自适应主成分分析及神经网络的pm2.5浓度预测方法，包括：

3、s1，获取pm2.5浓度的影响因素历史数据并构造预测变量总样本；

4、s2，利用自适应主成分分析对每类影响因素提取预测因子，识别出有助于预测pm2.5日均浓度的影响因素，包括

5、s21，形成一组缩放的预测变量，缩放系数是在标准化预测变量上进行预测回归的斜率；

6、s22，从缩放的预测变量中提取扩散指数作为pm2.5日均浓度的预测因子；

7、s3，将降低维度后的影响因素输入神经网络混频数据模型，通过原始混频数据预测pm2.5日均浓度，包括

8、s31，对每个预测变量进行频率对齐，以与输出变量具有相同频率；

9、s32，将进入隐藏层的所有频率对齐向量与隐藏层权重相乘，再加上隐藏层偏差，在sigmoid传递函数的作用下，得到各隐藏层节点的计算结果；

10、s33，将进入输入层的所有隐藏层节点的计算结果带入输出层，将进入输入层的所有隐藏层节点的计算结果与输出层权重相乘，再加上输出层偏差，在输出层传递函数的作用下，得到pm2.5日均浓度最终的输出结果：

11、；

12、其中，是输出层权重向量，是输出层偏差，是输出层传递函数。

13、进一步地，s1中影响因素包括so2、no2、co、o3污染气体，最高温度、降水量、最低温度和风力，低频月度数据人均地区生产总值、人均地区工业企业总数、机动车辆数。

14、进一步地，s21中形成一组缩放的预测变量，缩放系数是在第i个标准化预测变量上进行预测回归的斜率，提取预测力强的变量对pm2.5日均浓度进行预测；

15、；

16、其中，n是潜在预测变量的总数量，表示pm2.5日均浓度从时间t到时间t+1的回归，是时间t的第i个预测变量，是均值等于零的误差值，表示第i个预测变量的截距项。

17、进一步地，s22从中提取扩散指数作为pm2.5日均浓度预测因子，所提取的扩散指数的形式为：

18、；

19、其中是k阶向量，表示自适应主成分分析的扩散指数，k由修正的确定，表示拟合优度，衡量的是预测值对于真实值的拟合好坏程度，是需要估计的k维参数，是异质噪声项。

20、进一步地，对每个预测变量的滞后值进行预测回归，通过缩放系数评估预测能力，缩放系数大的预测能力强，缩放系数小的预测能力弱，将预测能力强的预测变量作为神经网络混频数据模型的输入值。

21、进一步地，预测能力强的预测变量包括so2、no2、co、风力、人均地区工业企业总数、机动车辆数。

22、进一步地，s31中对每个预测变量进行频率对齐，获得与输出变量具有相同频率的

23、；

24、其中，是高频原始输入变量，是低频目标输出变量，表示和之间的频率不匹配，。

25、进一步地，s32中将进入隐藏层的所有频率对齐向量与隐藏层权重相乘，再加上隐藏层偏差，在sigmoid传递函数的作用下，得到各隐藏层节点的计算结果：

26、；

27、其中，

28、是隐藏层的权重向量，是隐藏层的偏差向量，是与高频变量相关的高频预测范围，表示使用双曲正切函数的sigmoid传递函数。

29、本发明的上述方案有如下的有益效果：

30、本发明提供的基于自适应主成分分析及神经网络的pm2.5浓度预测方法，利用了自适应主成分分析（spca）对每类影响因素提取公因子，识别出有助于预测pm2.5日均浓度的影响因素，准确地提取有用信息，降低了输入层的维数；运用了神经网络混频数据模型（ann-u-midas）预测pm2.5日均浓度，该模型能够在人工神经网络中直接输入原始混频数据，避免了数据同频化预处理的缺陷，能够在混频数据分析中准确识别变量间的非线性影响模式，提高了模型的拟合效果与预测能力。

31、本发明的其它有益效果将在随后的具体实施方式部分予以详细说明。

技术特征：

1.一种基于自适应主成分分析及神经网络的pm2.5浓度预测方法，其特征在于，包括：

2.根据权利要求1所述的基于自适应主成分分析及神经网络的pm2.5浓度预测方法，其特征在于，s1中影响因素包括so2、no2、co、o3污染气体，最高温度、降水量、最低温度和风力，低频月度数据人均地区生产总值、人均地区工业企业总数、机动车辆数。

3.根据权利要求2所述的基于自适应主成分分析及神经网络的pm2.5浓度预测方法，其特征在于，s21中形成一组缩放的预测变量，缩放系数是在第i个标准化预测变量上进行预测回归的斜率，提取预测力强的变量对pm2.5日均浓度进行预测；

4.根据权利要求3所述的基于自适应主成分分析及神经网络的pm2.5浓度预测方法，其特征在于，s22从中提取扩散指数作为pm2.5日均浓度预测因子，所提取的扩散指数的形式为：

5.根据权利要求4所述的基于自适应主成分分析及神经网络的pm2.5浓度预测方法，其特征在于，

6.根据权利要求5所述的基于自适应主成分分析及神经网络的pm2.5浓度预测方法，其特征在于，预测能力强的预测变量包括so2、no2、co、风力、人均地区工业企业总数、机动车辆数。

7.根据权利要求6所述的基于自适应主成分分析及神经网络的pm2.5浓度预测方法，其特征在于，s31中对每个预测变量进行频率对齐，获得与输出变量具有相同频率的

技术总结
本发明提供了一种基于自适应主成分分析及神经网络的PM2.5浓度预测方法，包括：获取PM2.5浓度的影响因素历史数据并构造预测变量总样本；利用自适应主成分分析对每类影响因素提取预测因子，识别出有助于预测PM2.5日均浓度的影响因素；将降低维度后的影响因素输入神经网络混频数据模型，通过原始混频数据预测PM2.5日均浓度。本发明利用了sPCA准确地提取有用信息，降低了输入层的维数；运用了ANN‑U‑MIDAS预测PM2.5日均浓度，该模型能够在人工神经网络中直接输入原始混频数据，避免了数据同频化预处理的缺陷，能够在混频数据分析中准确识别变量间的非线性影响模式，提高了模型的拟合效果与预测能力。

技术研发人员：姚婷,李振莹
受保护的技术使用者：湖南工商大学
技术研发日：
技术公布日：2024/1/13

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：姚婷李振莹
技术所有人：湖南工商大学
我是此专利的发明人

上一篇：一种直拉硅单晶检测CCD相机的制作方法
上一篇：一种血管介入手术机器人的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。