一种基于地理信息系统的大气颗粒浓度监测方法及系统

文档序号:28276709发布日期:2021-12-31 20:54阅读:145来源:国知局
一种基于地理信息系统的大气颗粒浓度监测方法及系统

1.本发明属于地理信息系统,具体的,涉及一种基于地理信息系统的大气颗粒浓度监测方法及系统。


背景技术:

2.人们对能源资源的消耗以及远超环境承载力的污染物排放,导致大气污染成为第一大环 境污染问题。全国主要的经济发达地区,工业化和城市化发展迅速,污染排放强度较大,成 为中国大气污染最为严重的地区。pm2.5作为大气污染的首要污染物之一,对其近地面浓度 的时空分布特点进行准确了解,可为地区大气污染防治提供科学的依据和支撑。
3.1949年至1990年,工业生产中产生的粉尘和so2为我国城市的主要大气污染物,空 气污染程度较轻,1990年至2000年,城市化速度明显加快,中小企业迅速发展,氮氧化物 成为我国城市的主要大气污染物,城市扩建和建筑物建设产生大量悬浮物和pm10,空气污染 程度较为严重,21世纪以来进入城市化快速推进时期,机动车使用数量增多和光化学污染等 大气污染问题频发,pm2.5、o3、co和no2也成为我国城市的主要大气污染物。
4.目前,许多 aod 产品已被应用于近地面 pm2.5预测,其广泛的空间覆盖范围和对地球表面及大气的重复观测,可以很好地填补由于地面监测网络站点稀疏而留下的数据空白。其中,aod 的空间覆盖率和分辨率是基于卫星的 pm2.5暴露建模和健康影响研究的主要考虑因素,因此,通过建立高分辨率 aod 与 pm2.5浓度的关系模型,可以评估流行病学研究的较小城市规模或更小区域的暴露评估,更加精确地反映近地面 pm2.5的时空分布特点。同时,在不同的机器学习方法中,随机森林方法与大部分机器学习方法相比存在许多优点,易于实现,能够处理维度高特征多的数据,自动处理缺失值,计算耗费时间短,不容易陷入过拟合,可以应用在处理大规模数据集问题中,处理预测变量之间非线性和高阶相互作用的能力较强。如何更好地利用随机森林方法等机器学习方法对空气质量和空气污染物浓度进行预测,提高预测结果的准确率,是不断发展机器学习应用的重要课题。


技术实现要素:

5.为解决当前大气污染物分析的信息化问题,本发明请求保护一种基于地理信息系统的大气颗粒浓度监测方法及系统。
6.本发明首先请求保护一种基于地理信息系统的大气颗粒浓度监测方法,其特征在于,包括:获取待检测大气源数据,对所述大气源数据进行预处理;对以 pm2.5为首要污染物的污染天气过程进行数值模拟,并分析气象要素对于 pm2.5质量浓度的影响;建立基于机器学习方法的回归模型,模型数据匹配与验证,对地区pm2.5质量浓度进行模拟和预报,完成模型的构建与验证。
7.具体的,所述获取待检测大气源数据,对所述大气源数据进行预处理,还包括:
pm2.5的小时数据整理成日均数据;aod 数据采用最小二乘法对 terra、aqua 逐月数据构建线性回归模型,继而以此预测缺失的 aod 值,再将 terra、aqua 两星 aod 值进行平均融合,得到融合后的 maiac aod 数据;气象数据双线性内插重采样成 1km
×
1km 的栅格,土地利用数据直接平均到 1km
×
1km 的栅格,在 excel 和 arcgis 10.3 中完成提取森林覆盖率和建筑用地覆盖率两个参数。
8.进一步地,所述对以 pm2.5为首要污染物的污染天气过程进行数值模拟,并分析气象要素对于 pm2.5质量浓度的影响,还包括:进行气象要素模拟能力检验,采用 wrf3.9.1,利用 fnl 再分析资料驱动数值模式;选用平均绝对误差(mae)和均方根误差(rmse)统计量对模拟结果进行检验;分析气象要素对 pm2.5质量浓度的影响,包括风场分析、气温场分析。
9.进一步地,所述建立基于机器学习方法的回归模型,模型数据匹配与验证,对地区pm2.5质量浓度进行模拟和预报,完成模型的构建与验证,还包括:建立随机森林回归模型,选取模型变量,进行空气污染物相关性分析;进行特征选择,寻找最优特征子集,剔除不相关或相关程度低的特征,获得随机森林回归模型模拟结果;采用十折交叉验证对 lme 和 lme+gwr 两个模型分别进行检验,采用决定系数(r2)、均方根预测误差(rsmpe)、验证模型斜率(slope)、相对预测误差(rpe)指标来检测模型的精确度。
10.本发明还请求保护一种基于地理信息系统的大气颗粒浓度监测系统,其特征在于,包括:数据收集模块,用于获取待检测大气源数据,对所述大气源数据进行预处理;数据分析模块,对以 pm2.5为首要污染物的污染天气过程进行数值模拟,并分析气象要素对于 pm2.5质量浓度的影响;模型处理模块,建立基于机器学习方法的回归模型,模型数据匹配与验证,对地区pm2.5质量浓度进行模拟和预报,完成模型的构建与验证。
11.进一步地,上述数据收集模块,用于获取待检测大气源数据,对所述大气源数据进行预处理,还包括:pm2.5的小时数据整理成日均数据;aod 数据采用最小二乘法对 terra、aqua 逐月数据构建线性回归模型,继而以此预测缺失的 aod 值,再将 terra、aqua 两星 aod 值进行平均融合,得到融合后的 maiac aod 数据;气象数据双线性内插重采样成 1km
×
1km 的栅格,土地利用数据直接平均到 1km
×
1km 的栅格,在 excel 和 arcgis 10.3 中完成提取森林覆盖率和建筑用地覆盖率两个参数。
12.进一步地,上述数据分析模块,对以 pm2.5为首要污染物的污染天气过程进行数值模拟,并分析气象要素对于 pm2.5质量浓度的影响,还包括:
进行气象要素模拟能力检验,采用 wrf3.9.1,利用 fnl 再分析资料驱动数值模式;选用平均绝对误差(mae)和均方根误差(rmse)统计量对模拟结果进行检验;分析气象要素对 pm2.5质量浓度的影响,包括风场分析、气温场分析。
13.进一步地,上述模型处理模块,建立基于机器学习方法的回归模型,模型数据匹配与验证,对地区pm2.5质量浓度进行模拟和预报,完成模型的构建与验证,还包括:建立随机森林回归模型,选取模型变量,进行空气污染物相关性分析;进行特征选择,寻找最优特征子集,剔除不相关或相关程度低的特征,获得随机森林回归模型模拟结果;采用十折交叉验证对 lme 和 lme+gwr 两个模型分别进行检验,采用决定系数(r2)、均方根预测误差(rsmpe)、验证模型斜率(slope)、相对预测误差(rpe)指标来检测模型的精确度。
14.本发明将 maiac aod、气象和土地利用等因子引入第一阶段混合效应模型中,并在模型中加入了 aod2和pblh 与 aod 乘积,将残差值与 maiac aod 数据引入第二阶段地理加权回归模型中,最后用所得到的两阶段统计模型来预测全域的 pm2.5浓度,分析域内 pm2.5浓度的时空分布。建立每个城市的回归模型时均考虑了其他城市的 pm2.5质量浓度,使机器学习训练得到的模型与实际空气污染状况更贴近,利用 gfs 未来预报产品驱动数值模式进行预报,将预报得到的气象要素代入回归模型中进行pm2.5质量浓度预报,使数值模式与机器学习方法相结合,为pm2.5质量浓度发布预报和政府决策提供参考。
附图说明
15.为了更清楚地说明本技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
16.图1为本发明所涉及的一种基于地理信息系统的大气颗粒浓度监测方法的工作流程图;图2为本发明所涉及的一种基于地理信息系统的大气颗粒浓度监测方法实施例一的工作流程图;图3为本发明所涉及的一种基于地理信息系统的大气颗粒浓度监测方法实施例二的工作流程图;图4为本发明所涉及的一种基于地理信息系统的大气颗粒浓度监测方法实施例三的工作流程图;图5为本发明所涉及的一种基于地理信息系统的大气颗粒浓度监测系统的结构模块图。
具体实施方式
17.下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例
所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
18.参照附图1,本发明首先请求保护一种基于地理信息系统的大气颗粒浓度监测方法,其特征在于,包括:获取待检测大气源数据,对所述大气源数据进行预处理;对以 pm2.5为首要污染物的污染天气过程进行数值模拟,并分析气象要素对于 pm2.5质量浓度的影响;建立基于机器学习方法的回归模型,模型数据匹配与验证,对地区pm2.5质量浓度进行模拟和预报,完成模型的构建与验证。
19.具体的,参照附图2,所述获取待检测大气源数据,对所述大气源数据进行预处理,还包括:pm2.5的小时数据整理成日均数据;aod 数据采用最小二乘法对 terra、aqua 逐月数据构建线性回归模型,继而以此预测缺失的 aod 值,再将 terra、aqua 两星 aod 值进行平均融合,得到融合后的 maiac aod 数据;气象数据双线性内插重采样成 1km
×
1km 的栅格,土地利用数据直接平均到 1km
×
1km 的栅格,在 excel 和 arcgis 10.3 中完成提取森林覆盖率和建筑用地覆盖率两个参数。
20.maiac 是一种处理 modis 数据的新算法,它是将 modis l1b 数据网格化测量到固定的 1km 网格开始,并使用滑动窗口技术积累同一地区多达 16 天的时间序列数据,而且算法也适用于 terra 和 aqua 数据。maiac 报告了 0.47nm(blue

band)和 0.55nm(green

band)波段的 aod,0.55nm 波段处的 aod 是根据反演中使用的气溶胶模型的光谱特性计算的,它被用来支持区域和全球化学输送和气候模拟模型、aod 验证和 aod产品相互比较。本方案所采用的 2013~2017 年 maiac aod 产品来源于 nasa 气候模拟中心。其中,包括 h03v01、h03v02、h04v01 这 3 个条带数据在内的地区 aod 数据。为提高空间覆盖率,本方案采用 terra 和 aqua 卫星融合后的 maiac aod数据,首先,在 arcgis10.3 中对下载的 maiac aod 数据选取 550nm 波段进行投影、重采样、拼接和裁剪处理,得到 terra 和 aqua 两种 aod 数据;然后采用最小二乘法对terra、aqua 逐月数据构建线性回归模型,继而以此预测缺失的 aod 值;再将 terra、aqua 两星 aod 值进行平均融合,该平均值可以更好地代表 10:30~1:30 的 aod 的平均状况。
21.pblh 日均数据是空间分辨率为 0.25
˚×
0.3125
˚
的nc 文件,风速、气温、空气比湿、近地面气压和降水量等日均气象数据是空间分辨率为 10km
×
10km 的 nc 文件,为满足建模要求,将所有数据重采样成与 maiac aod 同分辨率的 1km
×
1km 的栅格数据;分辨率为 30m
×
30m 的土地利用数据是直接平均到 1km
×
1km 的栅格单元中。
22.实际建模过程中,由于原始数据中不同特征的性质不同,它们通常具有不同的数量级和量纲,为了保证建模结果的可靠性,便于不同量纲和数量级的特征能够进行比较和加权,需要对原始数据进行标准化处理。
23.本方案采用了 z

score 标准化方法,z

score 标准化是将数据按一定比例缩放,使数据落入一个特定的区间内,标准化公式为:
进一步地,参照附图3,所述对以 pm2.5为首要污染物的污染天气过程进行数值模拟,并分析气象要素对于 pm2.5质量浓度的影响,还包括:进行气象要素模拟能力检验,采用 wrf3.9.1,利用 fnl 再分析资料驱动数值模式;选用平均绝对误差(mae)和均方根误差(rmse)统计量对模拟结果进行检验;分析气象要素对 pm2.5质量浓度的影响,包括风场分析、气温场分析。
24.所述风场分析中污染天气过程关中盆地 5 个主要城市以 pm2.5为首要污染物,其中d市与其他 4 个城市相比 pm2.5质量浓度最低,a市 pm2.5质量浓度最高,其次为c市 pm2.5质量浓度较高。风速小不利于空气污染物的扩散,因此趋于静风的大气状态其空气污染程度越严重,反之风速超过一定阈值后则风速越大空气污染程度也越轻。5 个城市风速较小或静风出现时,不利于空气污染物的扩散,pm2.5质量浓度较高,其中a市、c市和b市由于空气污染程度与其他 2 个城市相比较为严重,因此在个别时刻风速较大时也出现了pm2.5质量浓度的高值,其中a市和c市个别时刻为西北风且风速较大时,pm2.5质量浓度达到了 300μg/m3左右。a市和c市均以东西方向的风为主,a市风向为偏西风时,pm2.5质量浓度最高,风向为偏东风尤其是东北风时,a市 pm2.5质量浓度最低,空气状况最为良好。c市风向为偏西风尤其是西北风时,pm2.5质量浓度最高,风向为偏东风和偏北风时,c市 pm2.5质量浓度最低,可以看出在偏西风的条件下,a市和c市空气污染程度会加重。b市东南风和东北风频次较少,以西北风和西南风为主,风向为偏西风尤其是西南风时,pm2.5质量浓度最高,这可能是由于b市受到位于上游西南方向的a市和c市的影响,空气污染物随着西南风传输至当地,使b市空气质量状况进一步变差,b市风向为偏东风尤其是东南风时,pm2.5质量浓度最低,这可能是由于关中盆地东部较为开阔,偏东风风速较大,将b市的 pm2.5扩散至周围地区,b市空气污染程度也随之减弱。
25.此次污染天气过程中,d市和e市空气污染程度相对较轻,其中d市以偏北风和偏南风为主,风向为偏南风尤其是东南风时,pm2.5质量浓度最低,可以看出a市和c市对于d市空气污染程度的影响小于对于b市空气污染程度的影响,d市风向为偏北风尤其是西北风时,pm2.5质量浓度最高。
26.e市以偏北风为主,风向为东北风和东南风时,pm2.5质量浓度最低,风向为偏西风尤其是西北风时,pm2.5质量浓度最高,关中盆地西部较为狭窄,e市偏西风风速较小,不利于 pm2.5的扩散。
27.所述气温场分析中,污染天气过程中,整体来看关中盆地 2m 气温呈现先升高后降低的趋势,表明近地面气温与 pm2.5质量浓度也存在一定关系,pm2.5质量浓度随着近地面气温的升高而升高,呈现较好的正相关关系。1 月 2日 pm2.5累积阶段整体来看关中盆地 2m 气温由 08 时至 20 时有所升高,其中a市和c市2m气温升高了大约6℃,b市和e市2m气温升高了大约4℃。
28.1 月 6 日 pm2.5维持阶段关中盆地 2m 气温与 1 月 2 日相比整体升高,由 08 时至20 时关中盆地 2m 气温整体升高了大约 6℃,且南部山脉 2m 气温也有明显升高,与 1 月 2 日 20 时相比,1 月 6 日 20 时a市和c市 2m 气温升高了大约 3℃。
29.1 月 15 日 p2.5消散阶段整体来看关中盆地 2m 气温由 08 时至 20 时开始下降,其中a市和c市 2m 气温下降至

2℃左右,此次污染天气过程结束进一步地,参照附图4,所述建立基于机器学习方法的回归模型,模型数据匹配与验证,对地区pm2.5质量浓度进行模拟和预报,完成模型的构建与验证,还包括:建立随机森林回归模型,选取模型变量,进行空气污染物相关性分析;进行特征选择,寻找最优特征子集,剔除不相关或相关程度低的特征,获得随机森林回归模型模拟结果;采用十折交叉验证对 lme 和 lme+gwr 两个模型分别进行检验,采用决定系数(r2)、均方根预测误差(rsmpe)、验证模型斜率(slope)、相对预测误差(rpe)指标来检测模型的精确度。
30.所述选取模型变量中,根据首要污染物的分析结果,发现关中盆地 5 个主要城市以 so2为首要污染物的污染天气天数均为 0,以 co 为首要污染物的污染天气天数最多仅 3 天,表明 5 个城市均不存在以 so2为首要污染物的污染天气,以 co 为首要污染物的污染天气天数远少于以 pm2.5、pm10、no2和 o3为首要污染物的污染天气天数,因此在建立每个城市 pm2.5质量浓度回归模型时,可以不考虑 so2和 co 的影响,只考虑当地 pm2.5、pm10、no2和 o3与 pm2.5质量浓度之间的关系。
31.随着城市化进程的加快,城市面积不断向周围扩张,大气污染已经逐渐由单一型转变为复合型,并且由城市污染扩展到区域污染,空气污染物在城市群之间相互传输和转化,往往造成严重的区域性污染,因此为了考虑关中盆地 5 个主要城市之间由于 pm2.5相互传输带来的影响,在建立每个城市 pm2.5质量浓度回归模型时,考虑其他 4 个城市提前和同时刻的 pm2.5质量浓度与该城市同时刻的pm2.5质量浓度之间的关系。根据不同时间尺度的分析,发现 pm2.5质量浓度随时间的变化比较明显,因此在建立每个城市 pm2.5质量浓度回归模型时,考虑时间尺度的影响。
32.建模时采用 2017 年 1 月 1 日至 2018 年 12 月 30 日的逐小时数据,模拟的时段为 2018 年 12 月 31 日至 2019 年 1 月 15 日,关中盆地 5 个主要城市发生了一次以 pm2.5为首要污染物且持续时间较长的污染天气过程,也采用逐小时数据。由于空气污染物在当地的累积和维持往往长达几天以上,因此变量选取时考虑同时刻和提前 24h、48h 和 72h 的 pm2.5、pm10、no2和o3质量浓度,而空气污染物在关中盆地城市群之间的相互传输速度较快,比如c市的 pm2.5可以在几小时之内传输至位于其下游的a市和b市,对 2 个城市的空气污染程度造成一定影响,因此变量选取时考虑其他城市同时刻和提前 1h 至提前 6h 的 pm2.5质量浓度。
33.所述空气污染物相关性分析中分析每个城市pm2.5质量浓度与其他空气污染物质量浓度 的相关性时,首先计算关中盆地5个主要城市各自提前24h、48h和72h的pm2.5质量浓 度与同时刻pm2.5质量浓度的相关系数,再考虑同时刻和提前24h、48h和72h的pm10、 no2和o3质量浓度与该城市同时刻pm2.5质量浓度之间的相关关系,相关系数的绝对值越 大,表明选取的变量与该城市pm2.5质量浓度相关性越好。pm2.5是指空气动力学直径小于 等于2.5μm的颗粒物,也称为细颗粒物,pm10则是指空气动力学直径小于等于10μm的 颗粒物,也称为可吸入颗粒物,因此pm10包括pm2.5,一般来说这2种空气污染物相关程 度较高且呈现正相关关系。根据图5中的pearson相关系数热图可以看出,关中盆地5个 主要城市
与各自同时刻的pm2.5质量浓度线性相关程度最高的均为各自同时刻的pm10质量浓 度,其中a市同时刻的pm10质量浓度与同时刻的pm2.5质量浓度pearson相关系数为0.823, c市为0.798,b市为0.725,d市为0.776,e市为0.782。再根据图5中的spearman相 关系数热图可以看出,关中盆地5个主要城市与各自同时刻的pm2.5质量浓度非线性相关 程度最高的也均为各自同时刻的pm10质量浓度,其中a市同时刻的pm10质量浓度与同时刻 的pm2.5质量浓度pearson相关系数为0.892,c市为0.853,b市为0.857,d市为0.833, e市为0.873,表明a市同时刻的pm10质量浓度与同时刻的pm2.5质量浓度之间的相关程度 与其他4个城市相比最高,b市同时刻的pm10质量浓度与同时刻的pm2.5质量浓度之间的 相关程度与其他4个城市相比最低。
34.所述进行特征选择的目标是寻找最优特征子集,剔除不相关或相关程度低的特征,减少 模型运行时间,从而提高模型的精确度,采用机器学习方法进行回归预测建模的结果好坏主 要取决于特征选择。根据前人经验首先采用各城市同时刻的地面气温、海平面气压、相对湿 度、地面风速和地面风向这5项气象数据及时间数据作为各城市同时刻pm2.5质量浓度回 归模型的建模特征,再根据特征选择方法之一的过滤法筛选出其他建模特征。本方案采用过 滤法中的相关系数法对不同城市和不同时刻的空气污染物质量浓度进行特征选择,保留一定 相关程度的变量作为建模特征,不考虑相关程度较差的变量,由于pm2.5质量浓度和其他变 量之间既存在线性关系也存在非线性关系,故同时考虑pearson相关系数和spearman相关 系数来进行特征选择,特征选择所依据的根本原则是筛选出与pm2.5质量浓度显著相关的变 量,即:(1)针对关中盆地5个主要城市各自提前24h、48h和72h的pm2.5质量浓度与 同时刻pm2.5质量浓度的相关性分析,以及同时刻和提前24h、48h和72h的pm10、no2和o3 质量浓度与该城市同时刻pm2.5质量浓度之间的相关性分析,选择pearson相关系数和 spearman相关系数之和的绝对值的平均值不小于0.7的变量作为特征,即(|r|+|ρ|)≥0.7; (2)针对关中盆地5个主要城市之间同时刻及提前1h至6h的pm2.5质量浓度的相关性 分析,为了充分考虑关中盆地5个主要城市相互之间的影响,选择其他城市与该城市的 pearson相关系数和spearman相关系数之和的绝对值的平均值最大的变量作为特征。根据 上述原则保留相关程度最好的变量,去掉相关程度较差的变量,分别筛选出建立每个城市 pm2.5质量浓度回归模型时所需要的特征。
35.所述获得随机森林回归模型模拟结果为随机森林回归模型对关中盆地 5 个主要城市 pm2.5质量浓度的模拟效果较好,模拟值和观测值非常接近且趋势一致,表明随机森林回归模型在城市空气污染物质量浓度的模拟实践中有着良好的应用前景。2018 年12 月 31 日至 2019 年 1 月 15 日期间关中盆地的污染天气过程持续时间较长,污染程度较为严重,变化趋势不具有规律性,pm2.5质量浓度与其他月份相比明显较高,随机森林对于这类偶发且较为严重的污染天气过程也有着良好的模拟性能,可见其泛化能力较强,值得广泛应用于城市空气污染物质量浓度的模拟和预报中。此次污染天气过程中,a市、c市和b市 pm2.5质量浓度的变化趋势最为接近,而d市和e市与这 3 个城市相比 pm2.5质量浓度明显较低,其中d市 pm2.5质量浓度的峰值和谷值明显低于其他 4 个城市,污染程度相对较轻。
36.1 月 14 日零点左右a市、c市和b市同时出现 pm2.5质量浓度的较高峰值,其中b市出现 pm2.5质量浓度的最大值,而 1 月 14 日零点左右d市和e市 pm2.5质量浓度的峰值则较低。
37.所述采用十折交叉验证对lme和lme+gwr两个模型分别进行检验,采用决定系数(r2)、 均方根预测误差(rsmpe)、验证模型斜率(slope)、相对预测误差(rpe)指标来检测模型的 精确度,还包括:采用两阶段统计模型对pm2.5

aod关系的时空变化进行模拟。第一阶段是以pm2.5和 maiac aod为基础,加入气象和土地利用因子的混合效应模型(lme),模型中除了固定效应 还加入了随机效应。此外,在预测变量选择上,除选择常规的时间与空间变量外,针对研究 区污染较严重的特点,增加了aod2和pblh与aod的交互项作为待选变。经过变量选择和 多重共线性诊断,最终确定模型表达式如下:pm
2.5st
=(α+μ
t
)+(β1+v
t
)aod
st
+((β2+k
t
)aod
st2
)+(β3+m
t
)pblh+(β4)*pblh
st
*aod
st
+(β5+h
t
)wind
st
+(β6+w
t
)temp
st
+(β7+e
t
)rh
st
+(β8+n
t
)prec
st
+(β9+p
t
)pres
st

10
*forest
s

11
*urban
s

st
(v
t
,k
t
,m
t
,h
t
,w
t
,e
t
,n
t
,p
t
)~n(0,σ),ε
st
~(0,σ2)模型中:pm2.5st表示第s个地面监测点第t天的pm2.5浓度监测值;aod
st
表示相应 的第s个地面监测点所在网格在第t天的气溶胶光学厚度值;aod
st2
表示第s个地面监测 点所在网格在第t天的气溶胶光学厚度的平方值;pblh
st
、wind
st
、temp
st
、rh
st
、prec
st
和 pres
st
分别表示第s个地面监测点所在网格在第t天相应的大气边界层高度、近地面速、近 地面气温、近地面相对湿度、降水量和近地面气压;pblh
st
*aod
st
代表第s个地面监测点所 在网格在第t天的大气边界层高度和气溶胶光学厚度的乘积;forest
s
和urban
s
表示第s个 地面监测点所在网格森林覆盖率和建设用地比率;α和μ
t
为模型的固定截距和随机截距; β1~β11表示各自变量参数的固定效应斜率;v
t
,k
t
,m
t
,h
t
,w
t
,e
t
,n
t
,p
t
为aod和各气象变量的 随机效应斜率;ε
st
为模型第s个地面监测点在第t天的随机误差,服从独立等方差多元正 态分布;各随机效应亦服从多元正态分布,其中,∑为随机效应的无结构方差

协方差矩阵。
38.参照附图5,本发明还请求保护一种基于地理信息系统的大气颗粒浓度监测系统,其特征在于,包括:数据收集模块,用于获取待检测大气源数据,对所述大气源数据进行预处理;数据分析模块,对以 pm2.5为首要污染物的污染天气过程进行数值模拟,并分析气象要素对于 pm2.5质量浓度的影响;模型处理模块,建立基于机器学习方法的回归模型,模型数据匹配与验证,对地区pm2.5质量浓度进行模拟和预报,完成模型的构建与验证。
39.进一步地,上述数据收集模块,用于获取待检测大气源数据,对所述大气源数据进行预处理,还包括:pm2.5的小时数据整理成日均数据;aod 数据采用最小二乘法对 terra、aqua 逐月数据构建线性回归模型,继而以此预测缺失的 aod 值,再将 terra、aqua 两星 aod 值进行平均融合,得到融合后的 maiac aod 数据;气象数据双线性内插重采样成 1km
×
1km 的栅格,土地利用数据直接平均到 1km
×
1km 的栅格,在 excel 和 arcgis 10.3 中完成提取森林覆盖率和建筑用地覆盖率两个参数。
40.进一步地,上述数据分析模块,对以 pm2.5为首要污染物的污染天气过程进行数
值模拟,并分析气象要素对于 pm2.5质量浓度的影响,还包括:进行气象要素模拟能力检验,采用 wrf3.9.1,利用 fnl 再分析资料驱动数值模式;选用平均绝对误差(mae)和均方根误差(rmse)统计量对模拟结果进行检验;分析气象要素对 pm2.5质量浓度的影响,包括风场分析、气温场分析。
41.进一步地,上述模型处理模块,建立基于机器学习方法的回归模型,模型数据匹配与验证,对地区pm2.5质量浓度进行模拟和预报,完成模型的构建与验证,还包括:建立随机森林回归模型,选取模型变量,进行空气污染物相关性分析;进行特征选择,寻找最优特征子集,剔除不相关或相关程度低的特征,获得随机森林回归模型模拟结果;采用十折交叉验证对 lme 和 lme+gwr 两个模型分别进行检验,采用决定系数(r2)、均方根预测误差(rsmpe)、验证模型斜率(slope)、相对预测误差(rpe)指标来检测模型的精确度。
42.以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1