一种PM2.5浓度的数据分析和预测模型建立方法与流程

文档序号：11251195阅读：1246来源：国知局

本发明属于天气预测技术领域，具体涉及一种pm2.5浓度的数据分析和预测模型建立方法。

背景技术：

pm2.5指环境空气中空气动力学当量直径小于或等于2.5微米的颗粒物。它能较长时间悬浮于空气中，其在空气中含量浓度越高，就代表空气污染越严重。pm2.5易附带有毒有害物质，且在大气中的停留时间长、输送距离远，严重影响人体健康和大气环境质量。受人类活动和气象条件的影响，pm2.5浓度的变化情况复杂，如何模拟pm2.5的浓度变化过程并预测变化趋势，对pm2.5的治理与人类活动有重要的指导意义。传统的复杂系统动力学研究都是以微分方程为主，从简单模型开始不断的添加复杂条件使模型更加接近真实模型。但是由于问题本身的复杂性和变化性，完全依靠方程的方法不再能处理多因素耦合的复杂问题。

目前，元胞自动机模型在多领域的复杂系统动态行为研究中展现优势，它是根据复杂系统本身的基本模式设计自动机演化规则，根据其演化结果所表现出来的宏观现象，确定复杂系统的基本规律。但是元胞自动机的规则空间极其庞大，严重需要依赖人工经验缩小选择范围，其训练时间通常较长。

技术实现要素：

有鉴于此，本发明的目的是提供一种pm2.5浓度的数据分析和预测模型建立方法，使用元胞自动机模型模拟和预测pm2.5浓度变化，能有效且快速地预测pm2.5浓度的变化过程。

实现本发明的技术方案如下：

一种pm2.5浓度的数据分析和预测模型建立方法，包括如下步骤：

步骤一、将pm2.5的变化过程分解为污染产生、扩散、稀释和沉降；将pm2.5的监测区域划分为多个元胞，针对每一过程分别建立元胞自动机模型；

步骤二、利用历史数据对各模型中的参数进行训练，获得pm2.5数据的预测模型。

进一步地，本发明污染产生模型为：

s(x,y,t+1)＝s(x,y,t)+s1(x,y,t)×q(x,y,t)(3)

其中，s(x,y,t)代表元胞(x,y)在t时刻pm2.5的浓度值，s1(x,y,t)代表元胞(x,y)内的污染源在t时刻产生的污染量，q(x,y,t)代表元胞(x,y)内的污染源在t时刻产生的污染转化为pm2.5的系数，s(x,y,t+1)代表元胞(x,y)在t+1时刻pm2.5的浓度值；

q(x,y,t)＝k11t+k12h+k13r(4)

其中，k11，k12，k13为待训练的模型参数，t表示温度，r表示辐射，h表示湿度。

进一步地，本发明污染扩散模型为：

第一种情况：无风时的污染物扩散

e＝k21t+k22p(6)

s(x,y,t+1)＝s(x,y,t)-∑ei(8)

其中，ei为中心元胞向第i个邻居元胞ni扩散的污染物质量，e为扩散系数，与温度t和气压p有关，s(x,y,t)表示中心元胞(x,y)在t时刻pm2.5的浓度值，ni表示邻居元胞在t时刻pm2.5的浓度值，s(x,y,t+1)表示中心元胞(x,y)在t+1时刻pm2.5的浓度值，k21，k22分别表示待训练的模型参数；

第二种情况：有风时的污染物扩散

e＝s(x,y,t)×(1-fv)(9)

s(x,y,t+1)＝s(x,y,t)-e(12)

其中，e为从元胞(x,y)扩散出去的污染物质量，fv表示风速；

第三种情况：湍流运动污染物的扩散

每个元胞内一小部分质量的污染物随机扩散到周围元胞中

degree＝random(0,360)

其中，degree为0到360度间随机数。

进一步地，本发明污染稀释模型为：

污染物垂直方向上的稀释如式(13)所示

s(x,y,t+1)＝s(x,y,t)×(1-d)(13)

其中，d为稀释系数，s(x,y,t)代表元胞(x,y)在t时刻pm2.5的浓度值，s(x,y,t+1)代表元胞(x,y)在t+1时刻pm2.5的浓度值。

进一步地，本发明污染沉降模型为：

s(x,y,t+1)＝s(x,y,t)-s2(x,y)(14)

s(x,y,t+1)＝s(x,y,t)×p(15)

其中，s2(x,y)代表植被的吸收能力，p代表降水量。

进一步地，本发明所述历史数据为经过清洗后的数据，具体清洗的方式为：使用多项式模型学习监测的历史数据，获取最佳拟合曲线的项数n，建立n次多项式；对第i个时刻的历史数据进行评估时，利用离第i个时刻间隔较短且质量较高的n个时刻的数据训练n次多项式；将n次多项式所确定的曲线上的第i个时刻的数据作为评估值，第i个时刻的监测值与评估值数值越近，数据质量越高，对数据质量低于设定阈值的数据进行修正，实现数据的清洗。

进一步地，本发明计算出不同类污染源产生的污染量，具体为：以污染源与监测点之间距离的函数和作为自变量，监测点的pm2.5变化量作为因变量，根据人类生产作息变化将数据按季节与时刻分开，使用相应的历史数据训练出每一季节下不同时刻的模型；根据时间t选择对应的模型，并计算出污染源在t时刻产生的污染量。

进一步地，本发明对清洗后的数据进行可视化，可视化数据包括监测点的年平均pm2.5浓度与周围污染源的分布，以及监测点的pm2.5浓度与气象条件之间的关系曲线；使用统计方法判断某一污染源或气象因素与pm2.5浓度之间的相关性，计算相关系数；选择相关系数大于设定阈值的因素作为主要影响因素。

有益效果：

(1)本发明使用元胞自动机模型模拟和预测pm2.5浓度变化。一方面，该模型有较强的演化能力，可以模拟多种复杂现象并适应复杂系统中的变化。另一方面，该模型有极强的并行性，易于实现并行计算。综上，该模型能有效且快速地预测pm2.5浓度的变化过程。

(2)本发明综合考虑了影响pm2.5浓度变化的主要因素，提出了使用多元线性回归研究污染源分布和气象因素对pm2.5浓度的影响。一方面，使用从数据角度证明了不同因素对pm2.5浓度的影响，发挥了监测数据的价值。另一方面，使用数据统计代替人工经验，加快了元胞自动机模型的规则提取过程。

(3)本发明的预测方法结构简单、易于实现，能够学习到不同地区的环境特点，具有较好泛化能力的优点。

(4)本发明的预测方法使用元胞自动机建立模型，可以灵活地改变内部参数，模拟各种条件下pm2.5的质量浓度，从而对pm2.5问题进行深入的研究。

附图说明

图1为本发明实施例一的流程图。

图2为本发明实施例二的流程图。

图3为本发明多个元胞中pm2.5的浓度示意图。

具体实施方式

下面结合附图并列举实施例，对本发明进行详细描述。

实施例一：

本发明一种pm2.5浓度的数据分析和预测模型建立方法，具体步骤如下：

一种pm2.5浓度的数据分析和预测模型建立方法，包括如下步骤：

步骤一、将pm2.5的变化过程分解为污染产生、扩散、稀释和沉降；将pm2.5的监测区域划分为多个元胞，针对每一过程分别建立元胞自动机模型；

步骤二、利用历史数据对各模型中的参数进行训练，获得pm2.5数据的预测模型。

本发明使用元胞自动机模型模拟和预测pm2.5浓度变化。一方面，该模型有较强的演化能力，可以模拟多种复杂现象并适应复杂系统中的变化。另一方面，该模型有极强的并行性，易于实现并行计算。综上，该模型能有效且快速地预测pm2.5浓度的变化过程。

实施例二：

一种pm2.5浓度的数据分析和预测模型建立方法，针对pm2.5浓度变化难以模拟和预测的问题，通过元胞自动机模型对pm2.5的变化过程进行演化，并通过数据分析方法缩小pm2.5的规则选取空间，加快元胞自动机的建模过程，实现了对pm2.5浓度的预测目的，如图2所示，具体过程为：

步骤1，数据清洗。

使用多项式模型学习历史数据(与天气有关的)，获取最佳拟合曲线的项数n，建立n次多项式。对第i个时刻监测到的历史数据进行评估时，离第i个时刻间隔较短且质量较高的n个时刻的数据训练n次多项式，该曲线第i个时刻的数据为评估值，第i个时刻的监测值与评估值数值越近，数据质量越高。对数据质量低于某一阈值的数据进行修正，修正后的数据质量不变。

步骤2，数据预分析。

对清洗后的数据进行可视化，可视化数据包括监测点的年平均pm2.5浓度与周围污染源的分布的关系曲线，以及监测点的pm2.5浓度与气象条件之间的关系曲线。

使用统计方法判断某一污染源或气象因素与pm2.5浓度之间的相关性，计算相关系数。选择相关系数大于设定阈值的因素作为主要影响因素。

步骤3，pm2.5污染源分析。

根据污染源可视化结果，使用多元回归模型判断不同类别污染源(为主要影响因素的污染源)对pm2.5的贡献量。具体为：

对污染源进行分类，认为相同类型污染源产生的污染量相同。由于污染点对检测点的贡献量与其距离有关，距离越远贡献率越低，将某一类污染中每个污染点与监测点距离函数的总和作为自变量，使用多元回归方程进行训练，所得到的训练参数就是某一类污染源的污染生成量。

pm＝∑pixi+∑qiyi+∑rizi+ε(2)

其中，pm代表监测站的pm2.5质量浓度的单位时间变化量，污染源离监测站越近对监测站pm的贡献程度越大。

例如：xi(i＝1,2,3,4)代表同一路况所有道路点对监测站的贡献量(x1,x2,x3,x4代表畅通、轻微拥堵、中度拥堵和严重拥堵)。yi(i＝1,2,3)代表同一绿化程度的所有绿化点对监测站pm的吸收量(y1,y2,y3代表林地、耕地和公园)。zi代表除机动车污染外的同一类污染中所有污染点对pm的贡献量(包括住宅、汽车站、工厂、餐饮、农场等)。变量的选择使用逐步法，直至偏回归系数不再显著增加。污染的排放随着人类的日常活动发生变化，有季节性和周期性的特点，将数据按季节和时刻分开计算，可以得到某季节某时刻的排放量。最终得到96个多元回归模型(4个季节24个小时)。例如，表1为夏季6-8月上午十点的数据训练结果，系数为某一类污染源的排放量或某一绿化带的吸收量，利用多元回归方法计算系数pi，qi，ri，得到监测站的pm2.5质量浓度的单位时间变化量的模型。

表1污染源分类及排放量

将这些参数进行相加就是不同类型的污染源的贡献量所占总污染的比重。

pm2.5受气象条件影响分析。

在控制一部分气象因素基本不变的情况下，观察另一部分气象条件的变化对pm2.5浓度变化的影响，使用多元线性方程拟合这一关系。通过物理学对结果进行解释，将影响因素对应于pm2.5变化的各个过程中。例如，从预分析中相关系数的计算结果得到，风速的平方与pm2.5浓度变化呈负线性关系，其物理解释是风对空气中的污染物颗粒具有明显的输送和稀释作用。风速越大，其对污染物在水平方向上的扩散和在垂直方向上稀释的作用越强，空气质量相对较好。所以，将风对pm2.5的影响映射到pm2.5扩散和pm2.5稀释两个过程中。

基于污染源和气象因素对pm2.5浓度影响的分析，建立污染产生、扩散、稀释和沉降元胞自动机模型，具体过程如步骤4。

步骤4，建立元胞自动机模型。

将监测区域划分成多个元胞，使用元胞自动机模拟pm2.5的变化过程，可将其分解为pm2.5的产生、pm2.5的扩散、pm2.5的稀释和pm2.5的沉降四个部分。其中pm2.5的产生受污染物、温度、湿度和光辐射作用，pm2.5的扩散受粒子运动、气压、温度、风向风速影响，pm2.5的稀释受风速、气压的影响，pm2.5的沉降受降雨和绿化带吸收的影响。将上述分析结果直接转化为元胞自动机的规则如下：

(1)污染产生

s(x,y,t+1)＝s(x,y,t)+s1(x,y,t)×q(x,y,t)(3)

其中，s(x,y,t)代表元胞(x,y)在t时刻pm2.5的浓度值。s1(x,y,t)代表元胞(x,y)内的污染源在t时刻产生的污染量。q(x,y,t)代表元胞(x,y)内的污染源在t时刻产生的污染转化为pm2.5的系数。在影响因素分析中，温度、辐射和湿度都会影响pm2.5的转化，且这三个影响因素间没有明显的相关关系。根据探索性分析pm2.5与温度t、辐射r和湿度h之间的关系，用多元线性模型训练转化系数q。

q＝k11t+k12h+k13r(4)

其中，k11，k12，k13分别表示待训练的模型系数。

根据公式(3)计算出t+1时刻元胞(x,y)pm2.5的浓度值。

(2)污染扩散

水平扩散主要受粒子自由运动和风的影响。

根据菲克扩散方程，相邻元胞之间浓度扩散与浓度差有关，若中心元胞的pm2.5浓度大于邻居元胞，则根据浓度差向邻居元胞扩散。粒子的扩散速度受气象条件的影响。高温条件下粒子运动加快，而高压条件下粒子更加稳定。

e＝k21t+k22p(6)

s(x,y,t+1)＝s(x,y,t)-∑ei(8)

其中，ei为中心元胞向第i个邻居元胞ni扩散的污染物质量，若ni为对角线上邻居，则根据其距离r进行缩减。e为扩散系数，与温度t和气压p有关。s(x,y,t)表示中心元胞(x,y)在t时刻pm2.5的浓度值，ni表示邻居元胞在t时刻pm2.5的浓度值。s(x,y,t+1)表示中心元胞(x,y)在t+1时刻pm2.5的浓度值；k21，k22分别表示待训练的模型参数。

风对污染物扩散的作用较为明显，直接带动粒子在风向上传输。以西南风为例，风向角deg和风速fv将产生以下扩散结果：

e＝s(x,y,t)×(1-fv)(9)

s(x,y-1,t+1)＝s(x,y-1,t)+e×sin²(deg)(10)

s(x+1,y,t+1)＝s(x+1,y,t)+e×cos²(deg)(11)

s(x,y,t+1)＝s(x,y,t)-e(12)

其中，e为从元胞(x,y)扩散出去的污染物质量，(x,y-1)和(x+1,y)分别为(x,y)北方和南方的邻居元胞，根据风向角分别接收来自(x,y)的污染物。

湍流运动的表现出粒子运动的随机性，所以扩散过程中，对污染物的扩散增加一项随机运动，即每个元胞内一小部分质量的污染物随机扩散到周围元胞中。

degree＝random(0,360)

degree为0到360度间随机数，按照该角度对元胞中1％的污染质量进行扩散。

(3)污染稀释

风和气压不但影响粒子在水平方向的扩散，还作用于粒子在垂直方向上的稀释过程。

s(x,y,t+1)＝s(x,y,t)×(1-d)(13)

其中，d为稀释系数，与风和气压有关，s(x,y,t)代表元胞(x,y)在t时刻pm2.5的浓度值，s(x,y,t+1)代表元胞(x,y)在t+1时刻pm2.5的浓度值。

(4)污染沉降

绿化对污染物有吸收作用，降水对颗粒物有沉降效果。

s(x,y,t+1)＝s(x,y,t)-s2(x,y)(14)

s(x,y,t+1)＝s(x,y,t)×p(15)

其中，若元胞(x,y)(x,y)所在位置有绿化带，s2(x,y)代表植被的吸收能力，代表植被的吸收能力p代表降水量。

模型中的参数可单独训练，由统计分析模型得出理论值，并小范围内调整。由此建立了用于pm2.5浓度模拟和预测的元胞自动机模型。

步骤5，验证治理决策并预测pm2.5浓度。

根据具体的治理决策，改变元胞自动机模型中的参数，得到决策的治理效果预测。将实时数据和预测数据输入到元胞自动机模型中，可得到pm2.5浓度变化的预测结果，具体如表2所示。

表2经治理后pm2.5的改善情况

综上所述，以上仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：邓方;马丽秋;陈杰;高欣;赵佳晨;闫文茹
技术所有人：北京理工大学
我是此专利的发明人

上一篇：一种数据治理方法及医疗信息化系统与流程
上一篇：一种地下水控采量的计算方法及装置与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。