一种基于深度森林模型框架的近地表O3估算方法

文档序号：35663878发布日期：2023-10-06 19:02阅读：50来源：国知局

导航： X技术> 最新专利>计算;推算;计数设备的制造及其应用技术

一种基于深度森林模型框架的近地表O3估算方法

本发明属于大气污染物反演预测领域，具体涉及一种基于深度森林模型框架的近地表o3估算方法。

背景技术：

1、近地表o3是一种存在于大气中的空气污染物，对人类健康和生态环境具有不利影响，据报道，接触臭氧会增加死亡、呼吸系统疾病和心血管疾病的风险。通常，氮氧化物(nox)、挥发性有机化合物(vocs)和一氧化碳(co)在光化学反应下形成近地表o3。短波紫外线辐射对地面o3的形成也起着重要作用，风向、风速、降水、蒸发量和温度等气象参数也影响着地表o3的生成。

2、2013年以来，中国已经建立了1000多个国家级空气质量检测点，以实时观测空气污染物浓度，包括o3和pm2.5等空气污染物。然而，监测网的地理覆盖度有限且不均匀，同时站点的维护成本较高，仅通过监测点数据难以评估o3的区域变异性。

3、卫星遥感的发展为评估近地表o3提供了更广泛的空间覆盖和更高的空间分辨率的监测手段。常见的用于o3反演的遥感产品包括gome、omi和tropomi等。估算地表o3浓度的主要方法有统计模型(bme，贝叶斯最大熵；lur土地利用回归模型)；化学传输模型(geos-chem、wrt-chem和cmaq)；机器学习模型(深度神经网络、随机森林和lightgbm)。

4、传统的化学和统计模型可以估算大范围近地表o3，但需要耗费大量的计算资源，相比之下，机器学习方法近年来取得了快速发展，其能够提供更高计算效率的同时消耗更少的资源，但在使用机器学习算法反演近地表o3的过程中，由于训练样本的不平衡导致对较高浓度近地表o3的估测能力不足，这是估算近地表o3中仍需解决的问题之一。

5、因此针对上述问题，本发明公开了一种基于深度森林模型的近地表o3估算方法，利用机器学习对近地表o3进行反演，改善训练样本不平衡所带来的问题，提高估算近地表o3的准确度，并将模型应用于不同区域范围的测试集，以测试模型的普适性。

技术实现思路

1、本发明的目的在于解决现有技术中存在的问题，并提供一种基于深度森林模型的近地表o3估算方法。

2、本发明所采用的具体技术方案如下：

3、本发明提供了一种基于深度森林模型的近地表o3估算方法，具体如下：

4、s1：获取待估算区域的o3地面观测数据、tropomi产品数据、modis产品数据、气象数据和社会经济数据，并共同作为模型构建的多源数据，进而对没有o3地面观测数据的区域进行预测；将不同时空分辨率的所述多源数据进行时空匹配，以获得时空尺度一致的时间序列数据集；

5、s2：对s1中所述时间序列数据集分别基于样本和基于空间进行训练集和测试集的划分；

6、s3：基于深度森林算法对s2划分出的训练集数据进行模型训练，构建近地表o3反演模型，以对待估算区域的近地表o3进行反演估算；

7、s4：将构建的近地表o3反演模型用于s2划分出的测试集中，进行精度评价并将模型反演结果与待估算区域的o3地面观测数据进行对比验证；

8、s5：将待预测区域的预测集的数据输入经s2-s4得到的近地表o3反演模型中，对待预测区域目标时间内的近地表o3进行空间连续估算，得到空间分辨率为1km的近地表o3时空分布产品。

9、作为优选，所述待估算区域和待预测区域均位于中国。

10、作为优选，所述步骤s1中，o3地面观测数据为日最大8小时平均的地面站点数据；tropomi产品数据采用sentinel-5的三级气体产品，三级气体产品包括o3,no2,co,so2和hcho；modis产品数据包括增强型植被指数和地面温度；数据气象数据包括风速、湿度、温度、气压和蒸发量；社会经济数据采用suomi-npp的夜间灯光数据。

11、作为优选，所述步骤s1中，利用gee和r语言，将tropomi产品数据、modis产品数据、气象数据和社会经济数据，均预处理为与o3地面观测数据具有相同时空尺度的数据；随后利用双线性插值方法确保所有数据处于相同的时空分辨率；接着按照所述多源数据的时间先后关系，利用python将其编码为时间序列格式，并获得时间序列数据集。

12、作为优选，所述步骤s2中，基于样本的训练集和测试集划分是将经步骤s1预处理过后的所有时间序列数据集随机划分训练集和测试集；基于空间的训练集和测试集划分是将经步骤s1预处理过后的时间序列数据集按照地面观测站点列表随机划分为训练集和测试集。

13、作为优选，对所述近地表o3反演模型训练过程中，以o3地面观测数据为因变量，其余多源数据为辅助变量。

14、作为优选，所述步骤s3具体如下：

15、将得到的训练集样本输入到多粒度扫描板块，使用不同的滑动窗口对输入的原始样本进行采集，得到特征样本；

16、将所述特征样本输入到级联森林中进行训练，输入的特征信息经过每层的学习器生成一个类向量，生成的类向量由此层生成的所有多维类向量和多粒度扫描后的特征向量组成，类向量成为下一层的输入，层层传递后直到最后一层得到模型的最终输出结果；

17、若所处层的验证集准确率相比于上一层没有提升时，停止计算下一层，通过调节模型参数得到最优模型，由此得到近地表o3反演模型。

18、作为优选，所述步骤s4中，精度评价采用决定系数、均方根误差和偏差对近地表o3反演模型的估算结果进行10折交叉检验。

19、作为优选，所述步骤s5具体如下：

20、将待预测区域范围内的辅助变量数据通过gee采集至1km网格中，输入步骤s2-s4所得近地表o3反演模型中，对待预测区域范围内的近地表o3进行估算，生成1km分辨率的近地表o3产品。

21、本发明相对于现有技术而言，具有以下有益效果：

22、1)本发明开发了一种基于深度森林模型的近地表o3估算方法，通过将多源遥感产品、气象指标和人类活动指标相结合，更精确的预测待研究区域内o3的空间分布与时间演变。通过将辅助变量输入到能够处理时间序列的级联森林中，其表现较优。此外，该模型还具有强大的空间可迁移性，可以外推到没有o3地面监测的年份和地区。

23、2)本发明充分利用了o3和遥感数据的时空变化特征，可以生成长期的、更详细的、更可靠的高分辨率o3产品，对o3污染及其对人体危害的研究有较大帮助，对空气污染预防和治理具有重要的理论、实践意义和推广应用价值。

技术特征：

1.一种基于深度森林模型的近地表o3估算方法，其特征在于，具体如下：

2.根据权利要求1所述的一种基于深度森林模型的近地表o3估算方法，其特征在于，所述待估算区域和待预测区域均位于中国。

3.根据权利要求1所述的一种基于深度森林模型的近地表o3估算方法，其特征在于，所述步骤s1中，o3地面观测数据为日最大8小时平均的地面站点数据；tropomi产品数据采用sentinel-5的三级气体产品，三级气体产品包括o3,no2,co,so2和hcho；modis产品数据包括增强型植被指数和地面温度；数据气象数据包括风速、湿度、温度、气压和蒸发量；社会经济数据采用suomi-npp的夜间灯光数据。

4.根据权利要求1所述的一种基于深度森林模型的近地表o3估算方法，其特征在于，所述步骤s1中，利用gee和r语言，将tropomi产品数据、modis产品数据、气象数据和社会经济数据，均预处理为与o3地面观测数据具有相同时空尺度的数据；随后利用双线性插值方法确保所有数据处于相同的时空分辨率；接着按照所述多源数据的时间先后关系，利用python将其编码为时间序列格式，并获得时间序列数据集。

5.根据权利要求1所述的一种基于深度森林模型的近地表o3估算方法，其特征在于，所述步骤s2中，基于样本的训练集和测试集划分是将经步骤s1预处理过后的所有时间序列数据集随机划分训练集和测试集；基于空间的训练集和测试集划分是将经步骤s1预处理过后的时间序列数据集按照地面观测站点列表随机划分为训练集和测试集。

6.根据权利要求1所述的一种基于深度森林模型的近地表o3估算方法，其特征在于，对所述近地表o3反演模型训练过程中，以o3地面观测数据为因变量，其余多源数据为辅助变量。

7.根据权利要求1所述的一种基于深度森林模型的近地表o3估算方法，其特征在于，所述步骤s3具体如下：

8.根据权利要求1所述的一种基于深度森林模型的近地表o3估算方法，其特征在于，所述步骤s4中，精度评价采用决定系数、均方根误差和偏差对近地表o3反演模型的估算结果进行10折交叉检验。

9.根据权利要求1所述的一种基于深度森林模型的近地表o3估算方法，其特征在于，所述步骤s5具体如下：

技术总结
本发明公开了一种基于深度森林模型框架的近地表O<subgt;3</subgt;估算方法，属于大气污染物反演预测领域。方法包括获取待研究区域的O<subgt;3</subgt;地面观测数据、TROPOMI产品数据、MODIS产品数据、气象数据和社会经济数据，并共同作为多源数据；分别将多源数据进行时空匹配，并编码为时间序列格式，以O<subgt;3</subgt;地面观测数据作为因变量，建立反演模型，对研究区域内的近地表O<subgt;3</subgt;进行反演估算；将预测集的数据输入经过稳定性检验和精度评价的深度森林模型中，对待估算区域目标时间内的近地表O<subgt;3</subgt;进行空间连续估算，得到高分辨率的近地表O<subgt;3</subgt;时空分布产品。本发明充分利用了O<subgt;3</subgt;和遥感数据的时空变化，可以生成长期、更详细、更可靠、分辨率更高的近地表O<subgt;3</subgt;产品。

技术研发人员：史舟,陈雪瑶,王之戈
受保护的技术使用者：浙江大学
技术研发日：
技术公布日：2024/1/15

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：史舟陈雪瑶王之戈
技术所有人：浙江大学
我是此专利的发明人

上一篇：一种凝胶敷贴一体化成型装置
上一篇：一种预扩装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。

相关技术

网友询问留言已有0条留言

还没有人留言评论。精彩留言会获得点赞！

1

精彩留言，会给你点赞！