一种基于多示例遗传神经网络的室内PM2.5预测方法与流程

文档序号:15159044发布日期:2018-08-14 09:15阅读:223来源:国知局

本发明涉及颗粒物浓度检测技术领域,特别是涉及一种基于多示例遗传神经网络的室内pm2.5预测方法。



背景技术:

经验模型和统计模型是早年对室内空气质量进行预测的主要方法,后来随着大气物理、化学机制研究的发展,机理模型逐渐取代之前的预测方法。在基于机理模型的空气质量预测方法研究中,主要的思路是对污染物在空气中的传播、扩散、化学反应等过程实施抽象模拟,通过研究大气污染物的物理化学特性及其在特定条件下的转化规律,对未来的空气质量状况做出预测。

当今世界上普遍采用的空气质量预测模型大多是机理模型,但是对于我国室内空气的重要污染物之一pm2.5来说,其来源具有多样性且其形成机理较为复杂,研究其在室内空气中的扩散及复杂的转化机理并进行为之有效的建模难度较大,因此利用传统的机理模型对pm2.5浓度进行准确的预测比较困难,并且机理模型所需数据源多种多样,运算过程也非常耗时,机器学习被众多专家认为是一种全新的学习途径,能高效地解决问题,而伴随着机器学习的发展,新的机器学习理论和方法也在不断诞生,很多研究者开始尝试使用机器学习方法来进行空气质量预测的研究和探索,然而目前的研究多集中于对室外大气污染物的预测,利用机器学习的方法对室内空气污染物进行预测却鲜有提及。



技术实现要素:

本发明主要解决的技术问题是提供一种基于多示例遗传神经网络的室内pm2.5预测方法。

为解决上述技术问题,本发明采用的一个技术方案是:

提供一种基于多示例遗传神经网络的室内pm2.5预测方法,包括以下步骤:

(1)数据采集与特征选取:设定采样时间和采样时间间隔,采集当前时间t对应的当前室外温度wout、当前室内温度win、当前室外湿度sout、当前室内湿度sin、当前室外pm2.5浓度pout数据,当前室外温度wout、当前室内温度win、当前室外湿度sout、当前室内湿度sin、当前室外pm2.5浓度pout为输入参数,将每小时内采集的输入参数数据作为一个样本,删除由于传感器初始检测时不稳定造成的噪声数据;

(2)构建多示例遗传神经网络预测模型;

(3)根据多示例遗传神经网络预测模型预测室内pm2.5浓度m;

所述构建多示例遗传神经网络预测模型的具体步骤为:

步骤1:定义预测模型

m=f(t,pout,win,wout,sin,sout,v),

其中,m表示当前室内pm2.5浓度,v表示当前房间室内通风率,

v=s×|wout-win|,

其中,s为窗口打开的面积;

步骤2:将样本中的每个输入参数数据进行归一化处理,使之分布在[-1,1]的间隔中,

其中a表示样本中同一输入参数下的所有数据,a表示属于a输入参数下的单个数据;

步骤3:设定示例bij、阈值e1和阈值e2:n个样本作为n个数据包,每个数据包中有m个示例,每个示例为一个7维的特征向量,第i个数据包bi中的第j个示例为

[bij1,bij2,...,bij7]t

步骤4:初始化网络结构,然后初始化种群,使用种群中的个体对数据集进行回归训练,得到预测值yij,计算适应度函数f=1/sse,

其中,li为第i个数据包中的示例实际值的平均值;

步骤5:进化操作,产生下一代种群,当适应度函数f的最小值小于阈值e1或者进化代数达到100代,则选取适应度函数f的最小值对应的网络权值作为最优权值,否则返回步骤4进行下一轮的寻优;

步骤6:计算第i个数据包bi的误差ei,

步骤7:计算全局误差函数e,

当e小于阈值e2,循环结束,否则根据e修正最优个体网络权值,返回步骤6。

在本发明一个较佳实施例中,所述采样时间为夏季、秋季、冬季各自连续7天,所述采样间隔为全天24小时每隔1分钟进行一次采样。

在本发明一个较佳实施例中,所述初始化网络结构步骤包括设置输入层、输出层神经元的个数。

在本发明一个较佳实施例中,所述室内为室内高度为1.5米呼吸带区域。

本发明的有益效果是:提供一种基于多示例遗传神经网络的室内pm2.5预测方法,通过选取与室内pm2.5密切相关的通风率、气温、相对湿度等7个特征进行模型训练,将多示例神经网络与遗传算法应用到室内空气质量的预测中,不仅得到了较好的预测精度,同时相对于经验模型来说,大大缩短建模的时间,具有可靠性能高、精度高、效率高、实用性强等优点。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图,其中:

图1是本发明的多示例遗传神经网络模型框图;

图2是本发明的遗传神经网络训练算法流程图。

具体实施方式

下面将对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。

请参阅图1至图2,本发明实施例包括:

一种基于多示例遗传神经网络的室内pm2.5预测方法,包括以下步骤:

(1)数据采集与特征选取:

设定采样时间和采样时间间隔,采集当前时间t对应的当前室外温度wout、当前室内温度win、当前室外湿度sout、当前室内湿度sin、当前室外pm2.5浓度pout数据,当前室外温度wout、当前室内温度win、当前室外湿度sout、当前室内湿度sin、当前室外pm2.5浓度pout为输入参数;

分别于测试房间室内外设置监测点,室外监测点布于医院大楼3层,室内监测点布于高度为1.5米呼吸带区域,分别于2017年7月、10月、2018年1月,即夏季、秋季、冬季3个季节连续采集7天数据,形成3个数据集,采样间隔为全天24小时每隔1分钟进行一次采样,所采集数据分别为室内外气温、室内外相对湿度以及室内外pm2.5浓度,共7*24*60共10080条数据,但是由于传感器刚初始检测时的不稳定性造成噪声数据的产生,对原始数据进行了部分剔除,最后每个样本集包含9600条数据,同时把采集时间点t也作为模型特征之一,因此每条数据为(t,pout,win,wout,sin,sout,v)t

(2)构建多示例遗传神经网络预测模型;

(3)根据多示例遗传神经网络预测模型预测室内pm2.5浓度m。

所述构建多示例遗传神经网络预测模型的具体步骤为:

步骤1:定义预测模型

m=f(t,pout,win,wout,sin,sout,v),

当前室内的pm2.5浓度与当前室外温度wout、当前室内温度win、当前室外湿度sout、当前室内湿度sin、当前室外pm2.5浓度pout、当前时间点t、当前室内通风率v共7个参数有关,对应于示例子网的的7个输入,而当前室内pm2.5浓度对应于每个数据包的输出,示例子网的特征输入如下:

表1示例子网的输入特征数据表

其中,m表示当前室内pm2.5浓度,v表示当前房间室内通风率,

v=s×|wout-win|,

其中,s为窗口打开的面积;

步骤2:将样本中的每个输入参数进行归一化处理,使之分布在[-1,1]的间隔中

其中a表示样本中同一输入参数下的所有数据,a表示属于a输入参数下的单个数据;

步骤3:设定示例bij、阈值e1和阈值e2:n个样本作为n个数据包,每个数据包中有m个示例,每个示例为一个7维的特征向量,第i个数据包bi中的第j个示例为

[bij1,bij2,...,bij7]t

步骤4:初始化网络结构,然后初始化种群,使用种群中的个体对数据集进行回归训练,得到预测值yij,计算适应度函数f=1/sse,

其中,li为第i个数据包中的示例实际值的平均值;

步骤5:进化操作,产生下一代种群,当适应度函数f的最小值小于阈值e1或者进化代数达到100代,则选取适应度函数f的最小值对应的网络权值作为最优权值,否则返回步骤4进行下一轮的寻优;

步骤6:计算第i个数据包bi的误差ei,

步骤7:在多示例神经网络的回归学习问题中,数据包的实值li是已知的,因此,利用训练包的实际输出,在数据包的基础上根据误差函数ei计算全局误差函数e,

当e小于阈值e2,循环结束,否则根据e修正最优个体网络权值,返回步骤6。

本发明基于多示例遗传神经网络的室内pm2.5预测方法的有益效果是:

(1)创造性地将多示例神经网络与遗传算法结合应用到室内空气质量的预测中,取得了较好的预测精度,同时相对于经验模型来说,能大大缩短建模的时间;

(2)每分钟采集1次数据,同时将每小时内的60条数据组合成一个包作为1个样本,既考虑了一小时内连续时刻可能隐藏关系,又做到了相对更有意义的小时级预测。

以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书内容所作的等效结构或等效流程变换,或直接或间接运用在其它相关的技术领域,均同理包括在本发明的专利保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1