一种基于深度神经网络的空气质量预测方法与流程

文档序号:15447952发布日期:2018-09-14 23:35阅读:2274来源:国知局

本发明涉及空气质量预测技术领域,尤其是涉及一种基于深度神经网络的空气质量预测方法。



背景技术:

由于全球社会经济和工业化过程的发展,以及世界城市化飞速发展,能源、交通规模的扩大,城市人口的膨胀,大型工业开发区的建立等为大气环境带来了前所未有的巨大压力。以颗粒物、二氧化硫、氮氧化物等为主要污染物的大气环境污染问题日趋严重,对资源、环境的巨大冲击威胁着可持续发展的基础。我国是发展中国家,能源结构不尽合理,使城市大气污染不断加重。因此,如何防治大气污染,减轻大气污染的危害与影响,成为当今重大而紧迫的研究课题。在这种形势下,开展空气质量预测的研究具有重要意义。开展空气质量预测不仅可以更好地了解空气污染变化趋势,掌握及时、准确、全面的空气质量信息,而且对城市环境管理、污染控制、环境规划、城市建设及公共卫生事业均有重要的实际应用价值。

空气质量的时空分布受到气象场、排放源、复杂下垫面、理化过程的耦合等多种因素的影响,具有较强的非线性特性。以往在空气质量预测领域中常用的统计预测方法,虽然建立简单,业务运行方便、易普及,但缺乏坚实的物理基础,需要大量的监测资料;数值预测虽然物理基础坚实,预测结果全面,但模式所需要的边界、初始条件不易给出,难度大,计算时间长,预测结果精度不高。



技术实现要素:

本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于深度神经网络的空气质量预测方法。

本发明的目的可以通过以下技术方案来实现:

本发明方法基于深度神经网络,并采用dnn(deepneuralnetwork,dnn)结构进行空气质量的预测,其原理为:深度神经网络为深度学习的一个重要分支,其包括很多隐藏层,具有较强的学习和预测能力。采用不同时间点的空气污染物浓度来衡量空气质量,同时也作为输入数据和输出数据,通过训练学习已知的污染物浓度数据获得dnn的输入向量,从而建立所需的dnn模型,然后可利用该dnn预测未知的其他时刻的污染物浓度数据。

一种基于深度神经网络的空气质量预测方法,包括下列步骤:

s1:确定时间序列和等间隔时间点,对不同地点采集各等间隔时间点下的各个空气污染物的浓度;

s2:将采集的各个污染物浓度排序,获取不同地点在不同时间点的浓度向量,各个浓度向量中浓度种类的排序一致;

s3:将不同地点在同一时间点的浓度向量作为一个数据组,将一个时间序列中所有数据组作为一个数据集合;

s4:从多个数据集合中选出一个包含所有污染物的浓度值的已知集合,找出待测集合中缺失的污染物浓度的数据组,确定其所对应的时间点;

s5:从已知集合中挑选出与时间点对应的数据组作为输入数据,将已知集合中其余数据组作为输出数据,获取输入向量作为隐层;

s6:根据输入向量构建深度神经网络模型,将待测集合中其他数据组作为输入值,通过深度神经网络模型获取输出值,进而完成待测集合中缺失浓度的预测。

优选地,所述的深度神经网络模型采用dnn模型,该dnn模型为l+2层结构,其中第0层为模型输入层,第1到第l层为隐层,第l+1层为模型结构特征的输出层,相邻层之间通过前馈权值矩阵连接。

优选地,所述的步骤s2中,不同地点在不同时间点的浓度向量vecab的表达式为:

vecab={cab(a),cab(b),cab(c),cab(d),cab(e)…}

式中,a为时间点编号,b为地点编号;cab(a),cab(b),cab(c),cab(d),cab(e)分别为不同污染物种类的浓度值。

优选地,所述的步骤s3中,数据组的表达式为:

xa={veca1,veca2,veca3,…,vecan}

式中,n为地点的总数。

优选地,所述的步骤s3中,数据集合的表达式为:

datap={x1,x2,x3,…,xm}

式中,p为集合编号,m为时间点的总数。

与现有技术相比,本发明采用深度神经网络对未知污染物浓度进行预测,利用已知的各个时间点的数据组建立深度神经网络模型,通过建立的深度神经网络预测未知时间点的数据,进而获取未知浓度的预测值,dnn具有较强的学习和预测事物能力,能够获取精度更高的预测结果;同时,本发明在建模过程中,将某一时间序列的大气污染物浓度预测按照周期变化规律分类预测,可有效提高预测质量。

附图说明

图1为dnn模型的原理图。

具体实施方式

下面结合附图和具体实施例对本发明进行详细说明。

实施例

如图1所示,本发明涉及一种基于深度神经网络的空气质量预测方法,该方法包括以下步骤:

步骤一、确定时间序列和等间隔时间点,对不同地点采集等间隔时间点下的各个空气污染物的浓度;;

步骤二、将采集的各个污染物浓度排序,获取不同地点在不同时间点的浓度向量,各个浓度向量中浓度种类的排序一致;

步骤三、将不同地点在同一时间点的浓度向量作为一个数据组,将一个时间序列中所有数据组作为一个集合;

步骤四、从多个集合中选出一个包含所有污染物的浓度值的已知集合,并判断待测集合中缺失浓度数据组所对应的时间点;

步骤五、从已知集合中挑选出与时间点对应的数据组作为输入数据,将已知集合中其余数据组作为输出数据,根据dnn结构原理,获取输入向量作为隐层;

步骤六、根据输入向量构建深度神经网络模型,将待测集合中其他数据组作为输入值,通过深度神经网络模型获取输出值,进而完成待测集合中缺失浓度的预测。

污染物(如二氧化氮、二氧化硫、臭氧、一氧化碳、悬浮微粒等)浓度是衡量空气质量的主要评价标准。本实施例的污染物浓度以二氧化氮、二氧化硫、臭氧、一氧化碳、悬浮微粒五个种类为例对本发明方法进行说明。

假设为dnn模型共设计l+2层,其中第0层为模式的输入层,第1到第l层为隐层,相邻层之间通过前馈权值矩阵连接。第l+1层为模式结构特征的输出层。该dnn模型的总体框架结构如图1所示。采用{x1,x2,…,xm}表示m种输入结果,{y1,y2,…,yn}表示有n种输出结果,{hij,i=1,2,…l;j=1,2,…,ri}表示第i个隐含层的第j个输出向量,其中ri表示第i层的输出向量总数。

在dnn模型中,当前层的节点与前一层的所有节点、后一层的所有节点都是全连接,即对于当前层的某一个节点,它与前一层的所有节点均有相连的边,同理,它与下一层的所有节点也都有相连的边。深度神经网络实际上是由多个人工神经元组合而成,总的来说,深度神经网络的每一层都是由前一层的所有节点求和后通过分类器或回归得到的不同节点所构成,深度神经网络的参数学习则是通过误差逐层反向传播来修改相对应的权重完成的。

在进行空气质量预测时,污染物浓度与多种因素相关,一天中不同时间的气象状况、人类的活动状况对大气污染的影响有所不同,一般情况下在时间序列上将成一定的周期变化特性。如果将每天24小时各小时检测的大气污染物浓度预测按照周期变化规律分类预测,将有效提高预测质量。例如,在如图1所示的dnn的结构图中,可以将每天每个相同时间段(如1点,2点,…,23点,24点)获得的不同地点的污染物(二氧化氮、二氧化硫、臭氧、一氧化碳、悬浮微粒)的浓度数据作为输入或者输出数据。主要过程包括:

假设每个污染物浓度向量为:

vecab={cab(no2),cab(so2),cab(o3),cab(co),cab(tsp)}

式中,a表示不同时间点,此处a=1,2,…,24;b表示不同地点,假设一共有n个地点;cab(no2)、cab(so2)、cab(o3)、cab(co)、cab(tsp)分别为不同时间点不同地点所采集的二氧化氮浓度、二氧化硫浓度、臭氧浓度、一氧化碳浓度以及悬浮微粒浓度。

则一个时间点所对应的数据组可表示为:

xa={veca1,veca2,veca3,…,vecan}

一个集合包括24个数据组,即:

data1={x1,x2,x3,…,x24}

假设已知一个24个时间点的数据集合data1,其采集的各个数据组中的数据未有任何缺失;待测集合data2同样为24个时间点的数据集合,但其中缺少12点和13点采集的数据中缺少部分污染物种类的浓度值,因此需要利用集合data1的数据对data2进行预测,以弥补缺失浓度。

将集合data1中的数据组作为训练数据,用来构建一个预测大气污染物浓度的dnn模型。若想构建一个预测12点和13点的污染物浓度数据,可将data1的24个时间点污染物浓度数据分为两部分,将12点和13点的污染物浓度数据组作为输出数据,此处用y12和y13表示,而其他22个时间点的污染物浓度数据组作为输入数据,即x1,x2,x3,…,x22。根据图1所示,利用已知的输入数据和输出数据可以求出输入向量{hij},随后可以构建整个污染物浓度数据预测的dnn模型。因待测集合data2中12点和13点的污染物浓度数据组中浓度缺失,即为未知状态,则将data2的22个时间点的数据组作为输入数据,利用dnn模型得到输出数据,即12点和13点的数据组中污染物的浓度数据,获得该预测数据组后,即可对缺失的浓度值进行补充。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的工作人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1