基于多维特征深度学习的热点网格识别方法与流程

文档序号:16628680发布日期:2019-01-16 06:21阅读:204来源:国知局
基于多维特征深度学习的热点网格识别方法与流程

本发明涉及数据处理技术领域,尤其涉及一种基于多维特征深度学习的热点网格识别方法。



背景技术:

随着各项工业的迅速发展,产生了大量有害物质,如烟尘、二氧化硫、氮氧化物、一氧化碳、碳氢化合物等。这些有害物质持续不断地排放到大气中,当其含量超过环境所能承受的极限后,就会破坏自然的物理、化学和生态平衡,形成大气污染,危害人们的生活、工作和健康。随着全国大范围雾霾天气的出现,pm2.5这一名词进入公众视野。pm2.5是指环境空气中空气动力学当量直径小于等于2.5微米的颗粒物。它能较长时间悬浮于空气中,其在空气中含量浓度越高,就代表空气污染越严重。

大气污染监测是指测定大气环境中污染物的种类及其浓度,观察其时空分布和变化规律的过程。大气污染监测的目的在于识别大气中的污染物质,掌握其分布与扩散规律,监视大气污染源的排放和控制情况。由于监测区域范围大,人力物力有限,给大气污染监测带来困难。

因此,目前急需一种对大气污染区域进行有效监测的解决方案。



技术实现要素:

本发明的目的是针对现有技术中存在的缺陷,提供一种基于多维特征深度学习的热点网格识别方法。

为实现上述目的,第一方面,本发明提供了一种基于多维特征深度学习的热点网格识别方法,包括:

获取监测区域的区域信息,根据所述区域信息将所述监测区域划分为多个网格单元;

获取每一个所述网格单元的多维特征数据,所述多维特征数据包括污染物数据、基础地理数据、气象要素特征数据、地面要素特征数据、地理位置数据;

提取每一项所述多维特征数据的第一特征参数;

获取每一个所述网格单元的第一污染源信息,并对所述第一污染源信息进行校正处理,得到第二污染源信息;

提取所述第二污染源信息的第二特征参数;

根据所述第一特征参数、第二特征参数构造多维特征向量;

将所有网格单元的多维特征向量生成多维特征样本集;

采用深度学习模型对所述多维特征样本集进行训练,得到识别模型;

根据所述识别模型对目标区域进行识别处理,得到热点网格。

进一步的,获取网格单元的污染物数据具体包括:

根据卫星遥感数据获取所述网格单元的近地面第一pm2.5浓度数据;

根据空气质量地面观测数据和高密度空气质量监测设备对所述第一pm2.5浓度数据进行校正处理,得到第二pm2.5浓度数据;

根据气象观测数据、地形数据和气象动力学模型对所述第二pm2.5浓度数据进行校正处理,得到所述网格单元近期地面pm2.5浓度背景数据。

进一步的,获取基础地理数据具体包括:

获取网格单元的工业信息点poi数据、工业园区分布数据。

进一步的,获取气象要素特征数据具体包括:

根据三维气象数据,计算边界层高度、温度、相对湿度、风速风向、压强数据。

进一步的,获取地面要素特征数据具体包括:

利用遥感识别提取网格单元的地形高程、地表热异常、建成区比例、潜在工业厂房数据。

进一步的,在将所有网格单元的多维特征向量生成多维特征样本集之后,所述方法还包括:

将所述多维特征样本集划分为训练样本集和验证样本集。

进一步的,所述采用深度学习模型对所述多维特征样本集进行训练,得到识别模型具体包括:

采用深度玻尔兹曼机对所述训练样本集进行训练,得到识别模型参数;

根据所述识别模型参数生成识别模型;

采用所述验证样本集对所述识别模型进行验证处理。

第二方面,本发明提供了一种设备,包括存储器和处理器,所述存储器用于存储程序,所述处理器用于执行第一方面及第一方面的各种实现方式中的方法。

第三方面,本发明提供了一种包含指令的计算机程序产品,当所述计算机程序产品在计算机上运行时,使得所述计算机执行第一方面及第一方面的各种实现方式中的方法。

第四方面,本发明提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现第一方面及第一方面的各种实现方式中的方法。

本发明提供的基于多维特征深度学习的热点网格识别方法,基于监测区域的污染物数据、基础地理数据、气象要素特征数据、地面要素特征数据、地理位置数据、污染源信息构造多维特征样本集,采用深度学习模型对多维特征样本进行训练,得到识别模型,利用识别模型识别出目标区域中的目标子监控区域。本发明提供的方法,能够识别出主导整个区域大气污染排放贡献的热点网格,对热点网格进行精准监测,节省了人力物力资源,提高了污染监测的有效性。

附图说明

图1为本发明实施例一提供的基于多维特征深度学习的热点网格识别方法流程图;

图2为本发明实施例一提供的监控区域划分示意图;

图3为本发明实施例一提供的监控子区域示意图;

图4为本发明实施例一提供的多维特征提取示意图;

图5为本发明实施例一提供的受限玻尔兹曼机的可见层和隐层节点连接示意图;

图6为本发明实施例一提供的受限玻尔兹曼机的典型训练方法示意图;

图7为本发明实施例一提供的多个受限玻尔兹曼机堆叠示意图;

图8为本发明实施例一提供的深度玻尔兹曼机训练示意图。

具体实施方式

为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部份实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。

图1为本发明实施例一涉及的基于多维特征深度学习的热点网格识别方法流程图。如图1所示,具体包括如下步骤:

步骤101,获取监测区域的区域信息,根据区域信息将监测区域划分为多个网格单元。

具体的,获取监测区域的位置信息、尺寸信息等区域信息,按照预设的划分方式将监测区域划分为多个网格单元。

例如,将监测区域按照3公里×3公里网格进行划分,得到多个尺寸为3公里×3公里的网格单元,监测区域划分示意图如图2所示,划分之后得到的多个子区域如图3所示。

监测区域的划分尺寸可以根据具体需要进行设置,可以结合监测区域的尺寸以及监测该区域的人力物力等因素进行考虑,划分尺寸不同则划分后的监控子区域的数量不同。

步骤102,获取每一个网格单元的多维特征数据。

其中,多维特征数据包括污染物数据、基础地理数据、气象要素特征数据、地面要素特征数据、地理位置数据。

获取网格单元的污染物数据具体包括:根据卫星遥感数据获取网格单元的近地面第一pm2.5浓度数据;根据空气质量地面观测数据和高密度空气质量监测设备对第一pm2.5浓度数据进行校正处理,得到第二pm2.5浓度数据;根据气象观测数据、地形数据和气象动力学模型对第二pm2.5浓度数据进行校正处理,排除地形、水平扩散和垂直扩散对污染浓度的影响,得到网格单元近期地面pm2.5浓度背景数据。

需要说明的是,pm2.5浓度数据只是一个具体的实施例,污染物数据还可以是其他标准的污染物。

获取基础地理数据具体包括:获取网格单元的工业信息点(pointofinterest,poi)数据、工业园区分布数据。

获取气象要素特征数据具体包括:根据三维气象数据,计算边界层高度、温度、相对湿度、风速风向、压强数据。

获取地面要素特征数据具体包括:利用遥感识别提取网格单元的地形高程、地表热异常、建成区比例、潜在工业厂房数据。

地理位置数据包括该检测子区域的所在位置的经度数据和维度数据。

以上的各项多维特征数据可以全部选用也可以部分选用,具体根据监测污染对象选取上述一项或多项特征数据。

步骤103,提取每一项多维特征数据的第一特征参数。

具体的,从多维特征数据:污染物数据、基础地理数据、气象要素特征数据、地面要素特征数据、地理位置数据中提取特征参数,可以提取一项或多项参数,例如,从污染物数据中提取年均pm2.5的浓度背景数据,从基础地理数据中提取poi数据,从气象要素特征数据中提取风速风向、相对湿度数据,从地面要素特征数据地表热异常、地形高程,从地理位置数据中提取经度数据和维度数据等。

分别以土地利用率、夜间灯光亮度、工业poi分布、热异常数据、地形数据、年均pm2.5浓度、工业园数量、餐饮汽修分布、工厂分布、建成区分布为第一特征参数的提取对象的示意图如图4所示。

步骤104,获取每一个网格单元的第一污染源信息,并对第一污染源信息进行校正处理,得到第二污染源信息。

通过工商、质监、环保等部门以及网络数据获取企业注册等潜在污染源信息,并获取污染源实地勘察数据,利用污染源实地勘察数据对潜在污染源信息进行校正,其中,第一污染源信息为潜在污染源信息,第二污染源信息为校正后的污染源信息。污染源信息包括该网格单元内污染物排放企业的分布特征、数量特征等。

步骤105,提取第二污染源信息的第二特征参数。

第二特征参数为第二污染源信息的多个特征中的一部分对应的特征参数。例如,从校正后的污染源信息中提取工业企业分布特征、工业园区分布特征对应的特征参数。

步骤106,根据第一特征参数、第二特征参数构造多维特征向量;

将所有网格单元的第一特征参数、第二特征参数构造成多维特征向量。

步骤107,将所有网格单元的多维特征向量生成多维特征样本集。

步骤107的目的是构建训练样本集,将多维特征向量生成多维特征样本集作为训练样本集,用于后续进行模型训练。

在将所有网格单元的多维特征向量生成多维特征样本集之后,将多维特征样本集按照预设比例划分为训练样本集和验证样本集。例如,将多维特征样本集中的70%样本作为训练样本集,将30%样本作为验证样本集。利用训练样本集训练识别模型,利用验证样本集来验证训练出的识别模型。

步骤108,采用深度学习模型对多维特征样本集进行训练,得到识别模型。

采用深度玻尔兹曼机对训练样本集进行训练,得到识别模型参数;根据识别模型参数生成识别模型;采用验证样本集对识别模型进行验证处理。

玻尔兹曼机(boltzmannmachine,bm)是一种随机的递归神经网络,能通过学习数据固有内在表示解决复杂学习问题。

受限玻尔兹曼机(restrictedboltzmannmachine,rbm)去掉了玻尔兹曼机同层之间的连接,从而大大提高了学习效率。受限玻尔兹曼机分为可见层v以及隐层h,可见层和隐层的节点通过权值w相连接,两层节点之间是全连接,同层节点间互不相连,如图5所示。

多个受限玻尔兹曼机堆叠构成深度玻尔兹曼机(deepboltzmannmachines,dbm)。

采用受限玻尔兹曼机的典型训练方法如图6所示,具体步骤如下:

(1)首先随机初始化可见层,然后在可见层与隐层之间交替进行吉布斯采样:用条件分布概率p(h|v)计算隐层;

(2)再根据隐层节点,同样用条件分布概率p(v|h)来计算可见层;

(3)重复这一采样过程直到可见层和隐层达到平稳分布。采用对比离差(contrastivedivergence,cd)学习算法使用训练数据初始化可见层,只需迭代k次上述采样过程,就可获得对模型的估计(通常k=1)。

将多个受限玻尔兹曼机堆叠,前一层的输出作为后一层的输入,便构成了深度玻尔兹曼机,如图7所示。网络中所有节点间的连线都是双向的。

深度玻尔兹曼机训练分为两个阶段:预训练阶段和微调阶段,如图8所示。

在预训练阶段:采用无监督的逐层贪心训练方法来训练网络每层的参数,即先训练网络的第1个隐含层,然后接着训练第2,3,…个隐含层,最后用这些训练好的网络参数值作为整体网络参数的初始值。预训练之后,将训练好的每层受限玻尔兹曼机叠加形成深度玻尔兹曼机,利用有监督的学习对网络进行微调训练。

步骤109,根据识别模型对目标区域进行识别处理,得到热点网格。

通过在监测区域设置污染物监测设备得到污染物数据,结合监测区域的基础地理数据、气象要素特征数据、地面要素特征数据、地理位置数据得到热点网格的识别模型,利用识别模型反演出目标区域的热点网格。

根据识别模型对目标区域中的所有网格单元进行识别,得到主导整个目标区域大气污染排放贡献的目标子区域,即为热点网格。热点网格可以是排放污染物种类超过预设标准或者排放污染物的排放量超过预设标准等的子区域,需要对该类网格单元进行重点监测。

识别出的热点网格可以为一个或多个,针对识别出的热点网格还可以基于人工经验或现场排查数据进行人工审核校正。

识别出热点网格之后,可以在热点网格进行精准监测,设置监测人员和监测设备,无需再对整个区域进行监测,从而节省了人力物力的消耗,同时也使监测更加有效。

例如,某市共设有126个热点网格,368台pm2.5监测设备,这些热点网格覆盖的面积仅占全市总面积的10%,却能够锁定80%的污染排放贡献。

本发明提供的基于多维特征深度学习的热点网格识别方法,基于监测区域的污染物数据、基础地理数据、气象要素特征数据、地面要素特征数据、地理位置数据、污染源信息构造多维特征样本集,采用深度学习模型对多维特征样本进行训练,得到识别模型,利用识别模型识别出监测区域中的目标子监控区域。本发明提供的方法,能够识别出主导整个区域大气污染排放贡献的热点网格,对热点网格进行精准监测,节省了人力物力资源,提高了污染监测的有效性。

本发明实施例二提供了一种设备,包括存储器和处理器,存储器用于存储程序,存储器可通过总线与处理器连接。存储器可以是非易失存储器,例如硬盘驱动器和闪存,存储器中存储有软件程序和设备驱动程序。软件程序能够执行本发明实施例提供的上述方法的各种功能;设备驱动程序可以是网络和接口驱动程序。处理器用于执行软件程序,该软件程序被执行时,能够实现本发明实施例提供的方法。

本发明实施例三提供了一种包含指令的计算机程序产品,当计算机程序产品在计算机上运行时,使得计算机执行本发明实施例一提供的方法。

本发明实施例四提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现本发明实施例一提供的方法。

专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(ram)、内存、只读存储器(rom)、电可编程rom、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、cd-rom、或技术领域内所公知的任意其它形式的存储介质中。

以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1