一种结合气象条件影响的机场空气质量预测方法与流程

文档序号:17239624发布日期:2019-03-30 08:31阅读:482来源:国知局
一种结合气象条件影响的机场空气质量预测方法与流程

本发明涉及一种机场空气质量预测方法,是一种基于随机森林分类方法的机场空气质量预测技术;具体涉及与机场气象条件相关联的机场污染物浓度评估方法,机场空气质量评估方法。



背景技术:

自改革开放以后的数十年来,我国的综合国力得到快速增强,航空运输业发展迅速,空中交通量迅猛增长。然而,由此带来的环境污染等问题也日益加重,空气质量受到人们越来越多的关注,为减小航空排放对空气质量的影响,如何准确评估天气条件对机场空气质量的影响成为航空业界关注的热点。

空中交通量和气象条件是影响机场空气质量的两个重要因素,其中空中交通量主要影响航空污染物的总排放量,气象条件主要影响各种排放物的扩散。

当前对机场空气质量的研究主要是针对机场运行过程中污染物的排放对空气质量的影响,建立了机场污染物排放清单;此类技术侧重于从机场运行排放层面对机场的空气质量进行分析和研究,很少考虑气象条件例如相对湿度对污染物扩散的影响。即使是其他研究中考虑机场气象条件的影响,也仅限于分析气象条件对机场运行的影响,较少结合排放来分析机场的空气质量,对空气质量的预测和监控能力不足。由于缺乏可靠的机场空气质量预测信息,导致在战术层面制定机场运行计划不够灵活。

目前,国内外以气象条件和机场交通量对机场空气质量预测方面的技术成果较少,仍存在一定的领域空白。因此,亟需采用一种高效的预测方法,对机场的空气质量进行科学和准确预测,这对于推进空中交通管理绿色化发展目标,增强机场空气质量的预测能力,辅助合理安排机场运行方案等具有重要意义。



技术实现要素:

本发明所要解决的技术问题在于针对目前研究的空缺,提供一种基于随机森林的机场空气质量预测方法,可显著增强机场范围内空气质量的预测能力,并为合理安排机场运行方案提供数据参考依据。

本发明采用lto模型与aermod模型结合,使用基于历史气象数据和航班运行数据,来计算排放浓度和空气质量指数,其后采用随机森林分类算法对以四种主要气象条件和交通量为主要特征对机场空气质量建立分类器。实现此方法的技术方案如下:

步骤一:分析机场运行中污染物的排放,梳理影响污染物扩散的各类气象因素,计算机场空气质量指数,具体包括以下子步骤:

(1.1)分析机场运行中污染物的排放过程,以及在气象条件影响下的污染物扩散过程,分析影响机场空气质量关键气象因素;

(1.2)以标准lto循环和aermod空气质量模型为基础,使用机场的交通量数据和关键气象因素数据,统计各个机型比例,计算各个机型单个lto循环中污染物的排放量,进而据此设置aermod中污染源排放参数,计算出机场排放污染物的日平均浓度,并以此计算机场空气质量指数。

(1.3)使用机场一天内的温度、风速、气压、以及相对湿度的平均值x1、x2、x3、x4和机场交通量x5五个变量为集合元素来构建机场空气质量影响因素初始集x={x1,x2,x3,x4,x5}。

步骤二:采用随机森林分类方法,提炼不同自变量对应的航空器机场空气质量的影响因素,构建机场空气质量影响因素筛选样本集,对基于随机森林的机场空气质量预测模型进行训练,具体包括以下子步骤:

(2.1)根据机场空气质量影响因素初始集x,给定训练集s,测试集t,特征维数f。确定参数:使用到决策树的数量t,每棵树的深度d,每个节点使用到的特征数量f,终止条件:节点上最少样本数s,节点上最少的信息增益m

(2.2)从s中有放回的抽取大小和s一样的训练集s(i),作为根节点的样本,从根节点开始训练

(2.3)如果当前节点上达到终止条件,则设置当前节点为叶子节点,该问题是分类问题,则该叶子节点的预测输出为当前节点样本集合中数量最多的那一类c(j),概率p为c(j)占当前样本集的比例,然后继续训练其他节点。如果当前节点没有达到终止条件,则从f维特征中无放回的随机选取f维特征。利用这f维特征,寻找分类效果最好的一维特征k及其阈值th,当前节点上样本第k维特征小于th的样本被划分到左节点,其余的被划分到右节点。继续训练其他节点。

(2.4)重复(2.2)(2.3)直到所有节点都训练过了或者被标记为叶子节点。

(2.5)重复(2.2)(2.3)(2.4)直到所有的决策树都被训练。

步骤三:在对随机森林进行训练的基础上,使用测试集数据对基于随机森林的机场空气质量预测模型进行测试以达到交叉验证的目的,具体包括以下子步骤:

(3.1)从测试集t中有放回的随机采样,从当前树的根节点开始,根据当前节点的阈值th,判断是进入左节点(<th)还是进入右节点(>=th),直到到达,某个叶子节点,并输出预测值。

(3.2)重复执行(3.1)直到所有t棵树都输出了预测值。输出为所有树中预测概率总和最大的那一个类,即对每个c(j)的概率p进行累计。

步骤四:在步骤三的基础之上对分类器进行调参优化,以达到提高预测准确率的目的。

(4.1)分别对各个参数进行调整,记录下各个参数调整时预测准确率的变化趋势。

(4.2)统一整理各个参数,选择最优的即预测准确率最大的参数组合。

本发明的有益效果为:本发明提出的基于随机森林的机场空气质量预测方法,可根据机场的气象条件和交通量,对任意一天的机场空气质量进行准确和快速预测,也可为战术和预战术层面机场运行计划的制定提供数据参考依据,有效完成了对机场空气质量进行预测的实现。

附图说明

图1为基于随机森林的机场空气质量预测方法流程图;、

图2为单次lto循环中各种机型污染物排放量

图3为aermod计算的污染物日平均浓度

图4为对最小叶片大小进行调整时预测准确的变化情况;

图5为对单棵决策树允许使用的特征数进行调整时预测准确的变化情况;

图6为对决策树个数进行调整时预测准确的变化情况;

图7为对决策树深度进行调整时预测准确的变化情况。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚,以下结合7个附图与计算实例,对本发明进行进一步的详细说明,应当理解,此处所描述的实例仅用于解释本发明的核心原理,但是并不用于限定本发明。

选取某一航空运输机场,执行预测过程,计算实例如下:

步骤一:分析机场运行中污染物的排放,梳理影响污染物扩散的各类气象因素,计算机场空气质量指数,子步骤如下:(1.1)分析机场运行中污染物的排放过程,以及在气象条件影响下的污染物扩散过程,分析影响机场空气质量关键气象因素。收集某一航空运输机场的历史气象数据(包括metar报数据和探空数据)及其运行数据。(1.2)对收集的数据进行处理,首先对机场的历史气象数据进行筛选和清洗,去除数据集中不符合正常情况的数据,并针对缺失数据使用插值法补充缺失数据;对机场的运行数据进行统计分析,筛选出机场运行的主要机型,并查询其发动机类型及发动机数目,并记录各机型的运行次数和时间。(1.3)使用标准lto循环,根据国际民航组织(icao)中规定的lto循环中各阶段中航空器运行时间和发动机参数以及bada数据库中规定的航空器发动机排放因子,结合(1.2)中筛选的机型,计算各机型单个lto循环中污染物的排放量,在本专利中只计算了no2,so2,co三种污染物的排放量。(1.4)根据(1.3)中的计算结果来设定aermod空气质量模型中的污染源排放参数,其中当航空器在场面滑行时视为面污染源,航空器起飞时视为线污染源。以此计算出no2,so2,co三种污染物的日平均浓度,进而计算机场空气质量指数,计算结果用我国规定的空气质量等级1-6来表示。

步骤二:采用随机森林分类方法,提炼不同自变量对应的航空器机场空气质量的影响因素包括温度、风速、气压、相对湿度和机场交通量来构建机场空气质量影响因素筛选样本集,使用基于随机森林的机场空气质量预测模型对这些影响因素进行训练,具体包括以下子步骤:

(2.1)提取特征,整理收集的历史气象数据、机场运行数据和计算的机场空气质量指数,将温度、风速、气压、相对湿度和机场交通量进行归一化之后,提取平均温度x1、平均风速x2平均气压x3、平均相对湿度x4和机场交通量x5五个变量为集合元素,构建机场空气质量影响因素初始集x={x1,x2,x3,x4,x5}和与之对应的标签集y。

(2.2)根据机场空气质量影响因素初始集x,给定训练集s,测试集t,特征维数f。确定参数:使用到决策树的数量t,每棵树的深度d,每个节点使用到的特征数量f,终止条件:节点上最少样本数n。将第一大步整理后的数据,以机场空气质量指数为标签,以温度、风速、气压、相对湿度和机场交通量为特征,给出初始样本集;而后选取其中的80%作为训练集s,将剩下的20%作为测试集t,特征维数f为5,初始决策树的数量t为2,每棵树深度d为3,每个节点使用的特征数f为2,节点最少样本数s为10。(2.3)从s中有放回的抽取大小和s一样的训练集s(i),作为根节点的样本,从根节点开始训练。

(2.4)如果当前节点上达到终止条件,则设置当前节点为叶子节点,该问题是分类问题,则该叶子节点的预测输出为当前节点样本集合中数量最多的那一类c(j),概率p为c(j)占当前样本集的比例,然后继续训练其他节点。如果当前节点没有达到终止条件,则从f维特征中无放回的随机选取f维特征。利用这f维特征,寻找分类效果最好的一维特征k及其阈值th,当前节点上样本第k维特征小于th的样本被划分到左节点,其余的被划分到右节点,而后继续训练其他节点。例如在本发明中,将分割后形成的决策树,从五种特征中无放回的选择温度和交通量,寻找分类效果最好的一维特征及其阈值寻找分类效果最好的一维特征k及其阈值th,当前节点上样本第k维特征小于th的样本被划分到左节点,其余的被划分到右节点,而后继续训练其他节点。分割后计算gini不纯度

gini=1-∑(p(i)*p(i))

式中,p(i)为当前节点上数据集中第i类样本的比例。可以看出,类别分布越平均,gini值越大,分类效果越差需要再次分类;分布越不均匀,gini值越小,说明分类效果越好。将分割后gini不纯度较大的那一节点继续分割,计算二次分割后的gini不纯度,将gini不纯度较大的那一节点继续分割,直到达到参数限制。

(2.5)重复(2.3)(2.4)直到所有节点都训练过了或者被标记为叶子节点。

(2.6)重复(2.3)(2.4)(2.5)直到所有的决策树都被训练。此时可以得出训练准确率,训练准确率是指分类器预测准确率为预测准确的样本数量与样本总数之间的比值,该值可以很好的对随机森林的分类结果进行评估,可以看出该值越大,分类结果越好;反之,该值越小,分类结果越差。

步骤三:在对随机森林进行训练的基础上,使用测试集数据对基于随机森林的机场空气质量预测模型进行测试以达到交叉验证的目的,具体包括以下子步骤:

(3.1)从测试集t中有放回的随机采样,从当前树的根节点开始,根据当前节点的阈值th,判断是进入左节点(<th)还是进入右节点(>=th),直到到达,某个叶子节点,并输出预测值。

(3.2)重复执行(3.1)直到所有t棵树都输出了预测值。输出为所有树中预测概率总和最大的那一个类,即对每个c(j)的概率p进行累计。

步骤四:在步骤三的基础之上对分类器进行调参优化,以达到提高预测准确率的目的。

(4.1)分别对各个参数进行调整,记录下各个参数调整时预测准确率的变化趋势。其中分别对最小叶片大小,单棵决策树允许使用的特征数,决策树个数,决策树深度进行调整。

(4.2)统一整理各个参数,选择最优的即预测准确率最大的参数组合。

以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下还可以作出若干改进,这些改进也应视为本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1