基于网格化特征深度学习的热点网格污染物数据获取方法与流程

文档序号:16628675发布日期:2019-01-16 06:21阅读:321来源:国知局
基于网格化特征深度学习的热点网格污染物数据获取方法与流程

本发明涉及数据处理技术领域,尤其涉及一种基于网格化特征深度学习的热点网格污染物数据获取方法。



背景技术:

随着各项工业的迅速发展,产生了大量有害物质,如烟尘、二氧化硫、氮氧化物、一氧化碳、碳氢化合物等。这些有害物质持续不断地排放到大气中,当其含量超过环境所能承受的极限后,就会破坏自然的物理、化学和生态平衡,形成大气污染,危害人们的生活、工作和健康。随着全国大范围雾霾天气的出现,pm2.5这一名词进入公众视野。pm2.5是指环境空气中空气动力学当量直径小于等于2.5微米的颗粒物。它能较长时间悬浮于空气中,其在空气中含量浓度越高,就代表空气污染越严重。

大气污染监测是指测定大气环境中污染物的种类及其浓度,观察其时空分布和变化规律的过程。大气污染监测的目的在于识别大气中的污染物质,掌握其分布与扩散规律,监视大气污染源的排放和控制情况。由于监测区域范围大,人力物力有限,给大气污染监测带来困难。

因此,目前急需一种对大气污染区域进行有效监测的解决方案。



技术实现要素:

本发明的目的是针对现有技术中存在的缺陷,提供一种基于网格化特征深度学习的热点网格污染物数据获取方法。

为实现上述目的,第一方面,本发明提供了一种基于网格化特征深度学习的热点网格污染物数据获取方法,包括:

获取污染监测区域的多源卫星观测数据、地面特征数据、时空特征数据、大气污染物数据、气象数据;

将所述污染监测区域划分为多个网格单元,每个所述网格单元对应一个监测子区域;

根据所述多源卫星观测数据获取每一个监测子区域的气溶胶光学厚度aod特征参数;

根据所述地面特征数据获取每一个监测子区域的多个地面特征参数;

根据所述时空特征数据获取每一个监测子区域的多个时空特征参数;

根据所述大气污染物数据获取每一个监测子区域的污染物浓度特征参数;

根据所述气象数据获取每一个监测子区域的多个气象特征参数;

根据所述aod特征参数、地面特征参数、时空特征参数、污染物浓度特征参数和气象特征参数构造每一个监测子区域的多维特征向量;

将所有所述多维特征向量生成多维特征样本集;

采用深度学习模型对所述多维特征样本集进行训练,得到关系模型;

获取目标区域的多源卫星观测数据,并提取网格化多维特征信息;

根据所述网格化多维特征信息和所述关系模型,得到所述目标区域的网格化污染物浓度数据。

进一步的,所述根据所述多源卫星观测数据获取每一个监测子区域的气溶胶光学厚度aod特征参数具体包括:

据根据公式τα(λ)=τ(λ)-τm(λ)-τω1(λ)-τω2(λ)-τμ(λ)计算得到aod特征参数;其中,τα(λ)表示气溶胶光学厚度,τ(λ)表示大气总的光学厚度,τm(λ)表示整层大气的分子散射光学厚度,τω1(λ)表示氧气的吸收光学厚度,τω2(λ)表示臭氧的吸收光学厚度,τμ(λ)表示水汽的吸收光学厚度。

进一步的,所述根据所述地面特征数据获取每一个监测子区域的多个地面特征参数具体包括:

根据所述地面特征数据获取每一个监测子区域的地形高程特征、工业信息点poi分布特征、工业园区分布特征、建成区分布特征、夜间灯光亮度分布特征。

进一步的,所述根据所述时空特征数据获取每一个监测子区域的多个时空特征参数具体包括:

根据所述时空特征数据获取每一个监测子区域的时间、经度、纬度。

进一步的,所述根据所述大气污染物数据获取每一个监测子区域的污染物浓度特征参数具体包括:

根据所述大气污染物数据获取每一个监测子区域的pm2.5浓度值。

进一步的,所述根据所述气象数据获取每一个监测子区域的多个气象特征参数具体包括:

根据所述气象数据获取每一个监测子区域的温度、湿度、风速风向、压强、温度异常分布。

进一步的,所述获取目标区域的多源卫星观测数据,并提取网格化多维特征信息具体包括:

获取目标区域的多源卫星观测数据;

将所述目标区域划分成多个网格单元,提取每个网格单元的多个特征参数;

将所述多个特征参数进行特征归一化处理,得到网格化多维特征信息。

第二方面,本发明提供了一种设备,包括存储器和处理器,所述存储器用于存储程序,所述处理器用于执行第一方面及第一方面的各种实现方式中的方法。

第三方面,本发明提供了一种包含指令的计算机程序产品,当所述计算机程序产品在计算机上运行时,使得所述计算机执行第一方面及第一方面的各种实现方式中的方法。

第四方面,本发明提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现第一方面及第一方面的各种实现方式中的方法。

本发明提供的基于网格化特征深度学习的热点网格污染物数据获取方法,根据监测区域的多源卫星观测数据、地面特征数据、时空特征数据、大气污染物数据、气象数据,获取网格化子区域的多个特征参数,构造多维特征样本集,采用深度学习模型训练多维特征样本集的关系模型,利用关系模型来获取目标区域的网格化污染物浓度数据。本发明提供的方法,无需对目标区域进行全区域的地面站点观测,根据卫星观测数据即可得到目标区域的精细网格化污染物时空分布数据,节省了人力物力,提高了污染监测的有效性。

附图说明

图1为本发明实施例一提供的基于网格化特征深度学习的热点网格污染物数据获取方法流程图;

图2为本发明实施例一提供的将监测区域划分成网格单元示意图;

图3为本发明实施例一提供的提取特征示意图。

具体实施方式

为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部份实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。

本发明技术方案基于网格化特征获取热点网格大气污染物数据,也就是目标监测区域的精细网格化污染物时空分布数据,目的是提高大气污染监测的有效性。图1为本发明实施例一涉及的基于网格化特征深度学习的热点网格污染物数据获取方法流程图。如图1所示,具体包括如下步骤:

步骤101,获取污染监测区域的多源卫星观测数据、地面特征数据、时空特征数据、大气污染物数据、气象数据;

从网络公开的卫星遥感数据库、地面无线传感网、地面监测设备等渠道按照对应的监测区域调用多源卫星观测数据、地面特征数据、时空特征数据、大气污染物数据、气象数据。其中包括交通、排污、水利、气象、工商、自然资源、测绘地理、质监、农业、社会经济、民政、住建、生态环境等各个领域或部门的相关数据。

卫星遥感数据库中包括通过各种对地观测卫星获取多尺度、多频次、全波段的无缝观测数据。对地观测卫星包括美国陆地卫星(landsat)、美国陆地观测卫星(terra)、美国遥感卫星(npp)、中-巴地球资源卫星(cbers)、欧空局地球资源卫星(sentinel-2)、日本气象卫星(himawari-8)、日本地球资源卫星(aster)。

通过地面无线传感网能够高密度、自组织、时间连续地获取地面相关数据。

步骤102,将污染监测区域划分为多个网格单元,每个网格单元对应一个监测子区域;

其中,网格单元是指将污染监测区域划分成多个网格,便于进行精确监测。例如,将京津冀及周边重点区域“2+26”城市(2指北京市和天津市,26指河北省石家庄、唐山、保定、廊坊、沧州、衡水、邯郸、邢台,山西省太原、阳泉、长治、晋城,山东省济南、淄博、聊城、德州、滨州、济宁、菏泽,河南省郑州、新乡、鹤壁、安阳、焦作、濮阳、开封26个城市)按照3km×3km划分网格,共计36793个。为了更进一步细化,将每个3km×3km的网格再次划分成多个100米×100米的网格单元。如图2所示。将划分之后的每个网格单元赋予一个唯一的网格编码,根据网格编码能够查询到对应的监测子区域。

步骤103,根据多源卫星观测数据获取每一个监测子区域的气溶胶光学厚度aod特征参数;

气溶胶光学厚度(aerosolopticaldepth,aod)为介质的消光系数在垂直方向上的积分,是描述气溶胶对光的削减作用的。aod是气溶胶最重要的参数之一,是表征大气浑浊程度的物理量。

在可见光和近红外波段,据根据公式τα(λ)=τ(λ)-τm(λ)-τω1(λ)-τω2(λ)-τμ(λ)计算得到aod特征参数;其中,τα(λ)表示气溶胶光学厚度,τ(λ)表示大气总的光学厚度,τm(λ)表示整层大气的分子散射光学厚度,τω1(λ)表示氧气的吸收光学厚度,τω2(λ)表示臭氧的吸收光学厚度,τμ(λ)表示水汽的吸收光学厚度。

气溶胶光学厚度反演算法包括:单通道算法、多通道算法、暗像元法、结构函数法、深蓝算法、多星协同反演法、海陆对比法、多角度偏振法、热辐射对比法等。

步骤104,根据地面特征数据获取每一个监测子区域的多个地面特征参数;

具体的,根据地面特征数据获取每一个监测子区域的地形高程特征、工业信息点(pointofinterest,poi)分布特征、工业园区分布特征、建成区分布特征、夜间灯光亮度分布特征。

其中,地面特征数据包括地面的地理特征以及建筑物分布特征等。地形高程是指某点沿铅垂线方向到绝对基面的距离。工业poi分布特征包括工业poi的名称、类别、经度纬度、用途、数量、工业poi聚集度等;工业园区分布特征包括工业园区的数量、类别、聚集度等;建成区是指市行政区范围内经过征收的土地和实际建设发展起来的非农业生产建设地段,它包括市区集中连片的部分以及分散在近郊区与城市有着密切联系,具有基本完善的市政公用设施的城市建设用地(如机场、铁路编组站、污水处理厂、通讯电台等)建成区分布特征包括城市建设用地的类别、建筑物数量等;夜间灯光亮度分布特征包括夜间灯光亮度级别和对应区域的面积。

步骤105,根据时空特征数据获取每一个监测子区域的多个时空特征参数;

具体的,根据时空特征数据获取每一个监测子区域的时间、经度、纬度。时空特征参数是表征采集数据时当前监测子区域的时间和空间特征的参数。

步骤106,根据大气污染物数据获取每一个监测子区域的污染物浓度特征参数;

其中,大气污染物数据中包括所有能够监测到的对大气造成污染的污染物数据,例如,pm2.5,pm10等。可选地,根据大气污染物数据获取每一个监测子区域的pm2.5浓度值。

步骤107,根据气象数据获取每一个监测子区域的多个气象特征参数;

具体的,根据气象数据获取每一个监测子区域的温度、湿度、风速风向、压强、温度异常分布等气象特征。

步骤108,根据aod特征参数、地面特征参数、时空特征参数、污染物浓度特征参数和气象特征参数构造每一个监测子区域的多维特征向量;

提取各项特征如图3所示。提取多个特征参数之后,可以根据这些特征参数构造不同维度的特征向量。例如,构造的特征向量可以为

{year,month,day,hour,aod,longitude,latitude,wind_u,wind_v,t2,p,dem_mean,dem_std,}或者

{lst_201701,poi,pm25_2016,buildup,industrial_park,factory_roof,aod_feature,}。

需要说明的是,选取的特征参数数量不同,则构造的特征向量维度不同,可以根据具体需要进行设置。

步骤109,将所有多维特征向量生成多维特征样本集;

将所有监测子区域的多维特征向量构造成多维特征样本集,每一个网格单元的网格编码可以对应一个或多个该监测子区域的特征构造的多维特征向量。

步骤110,采用深度学习模型对多维特征样本集进行训练,得到关系模型;

具体的,从多维特征样本集中选择一部分作为训练集进行模型训练,选择另一部分作为测试集对训练出的模型进行测试。例如,从多维特征样本集中选择70%的样本作为训练样本集,选择30%的样本作为测试样本集。

采用深度学习模型对多维特征样本集进行深度学习、集成学习、非监督学习等特征学习方式,最终训练出模型参数,根据模型参数确定关系模型。

多维特征样本集中的样本数据样本越多,得到的关系模型越有效。

步骤111,获取目标区域的多源卫星观测数据,并提取网格化多维特征信息;

具体的,获取目标区域的多源卫星观测数据;将目标区域划分成多个网格单元,提取每个网格单元的多个特征参数;将多个特征参数进行特征归一化处理,得到网格化多维特征信息。

进行特征归一化处理的目的是将不同量级的特征参数进行一致化处理,避免输入数值范围不同导致算法无法接受的问题。

步骤112,根据网格化多维特征信息和关系模型,得到目标区域的网格化污染物浓度数据。

关系模型能够反映出多源卫星观测数据和污染物浓度之间的关系。将目标区域的网格化多维特征信息输入关系模型,则输出目标区域的网格化污染物浓度数据。针对污染物浓度不符合标准的网格单元对应的子区域重点实施环保监管排查,从而使污染监测更有针对性。

本发明提供的基于网格化特征深度学习的热点网格污染物数据获取方法,根据监测区域的多源卫星观测数据、地面特征数据、时空特征数据、大气污染物数据、气象数据,获取网格化子区域的多个特征参数,构造多维特征样本集,采用深度学习模型训练多维特征样本集的关系模型,利用关系模型来获取目标区域的网格化污染物浓度数据。本发明提供的方法,无需对目标区域进行全区域的地面站点观测,根据卫星观测数据即可得到目标区域的精细网格化污染物时空分布数据,节省了人力物力,提高了污染监测的有效性。

本发明实施例二提供了一种设备,包括存储器和处理器,存储器用于存储程序,存储器可通过总线与处理器连接。存储器可以是非易失存储器,例如硬盘驱动器和闪存,存储器中存储有软件程序和设备驱动程序。软件程序能够执行本发明实施例提供的上述方法的各种功能;设备驱动程序可以是网络和接口驱动程序。处理器用于执行软件程序,该软件程序被执行时,能够实现本发明实施例提供的方法。

本发明实施例三提供了一种包含指令的计算机程序产品,当计算机程序产品在计算机上运行时,使得计算机执行本发明实施例一提供的方法。

本发明实施例四提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现本发明实施例一提供的方法。

专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(ram)、内存、只读存储器(rom)、电可编程rom、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、cd-rom、或技术领域内所公知的任意其它形式的存储介质中。

以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1