基于单分类SVM的森林火险等级判定方法及系统与流程

文档序号:11476623阅读:198来源:国知局
基于单分类SVM的森林火险等级判定方法及系统与流程

本发明涉及一种等级判定方法及系统,特别是涉及一种基于单分类svm的森林火险等级判定方法及系统。



背景技术:

森林火灾是一种突发性强、破坏性大、处置救助较为困难的自然灾害,其高破坏性决定了森林火灾防控的重要性。因此,如何科学有效的对森林火灾进行预警预报,最大限度的减少森林火灾的发生以及由森林火灾带来的损失一直是我国林业部门和科研部门十分关注的问题。

森林火险是森林火灾发生的可能性和蔓延容易程度的一种度量。森林火灾的发生、发展与气象条件密切相关。故开展森林火险预报工作离不开实时观测气象要素,它是可燃物和背景综合因子的综合函数。

森林火险等级与多种因子有关。现有技术中,对火险等级的预测主要是根据气象因子以及可燃物情况等因子进行。其中,气象因子包括空气温度、相对湿度、光照、降水、风速等、。

在森林火灾领域,传统的森林火险预测方法一般是选取一段时间内的气象数据,以天为样本单位,对每个样本标注‘是’或‘否’发生火灾;然后将所有的样本送入二分类器进行训练,得到一个火险预测模型。但是,由于森林火灾的特殊性,发生火灾的正样本数严重少于未发生火灾的负样本数,导致该样本集存在严重的类别不平衡性。标准的机器学习分类方法在处理不平衡数据分类问题时,分类判决综合倾向多样本类,导致少样本类分类精度很低。而在森林防火中,作为少样本的正样本才是真正关心的样本。因此,现有的森林火险预测方法无法达到对森林火险预测准确度的要求。



技术实现要素:

鉴于以上所述现有技术的缺点,本发明的目的在于提供一种基于单分类svm的森林火险等级判定方法及系统,以若干项气象因子作为判断森林火险等级的影响因子,利用不发生火灾的样本基于单分类svm进行森林火险发生概率模型的学习,进而判定森林火险等级,有效地克服了由于森林火灾样本集中而存在类别不平衡问题,提高了森林火险的判定的准确度。

为实现上述目的及其他相关目的,本发明提供一种基于单分类svm的森林火险等级判定方法,包括以下步骤:以天为样本单位,根据火灾数据选取发生火灾的样本作为建模样本;获取所述建模样本对应的气象因子;基于所述建模样本对应的气象因子,构建单分类svm模型;构建森林火险发生概率模型,即利用激活函数将所述单分类svm模型的中间输出的样本到模型中超球面球心的距离的取值区间映射至[0,1],映射结果即为森林火险发生概率;计算待测样本的森林火险发生概率,并根据所述待测样本的森林火险发生概率判定森林火险等级。

于本发明一实施例中,所述气象因子包括日降水量、日最高气温、日最低气温、日平均相对湿度、日平均风速、昨日降水量、前三天天降水量合计值、前三天相对湿度平均值、前三天气温合计值、今日以前降水量小于等于5毫米的连续日数、20时以前日降水量小于等于3毫米的连续日数、20时前日降水量小于等于0.5毫米的连续日数。

于本发明一实施例中,构建所述单分类svm模型时,使用怀卡托智能分析环境平台的单分类svm模型,采用默认参数。

于本发明一实施例中,所述激活函数采用

于本发明一实施例中,根据待测样本的森林火险发生概率判定森林火险等级时,遵循以下原则:

当森林火险发生概率在区间[0,0.2]时,判定森林火险等级为火险一级;

当森林火险发生概率在区间(0.2,0.4]时,判定森林火险等级为火险二级;

当森林火险发生概率在区间(0.4,0.6]时,判定森林火险等级为火险三级;

当森林火险发生概率在区间(0.6,0.8]时,判定森林火险等级为火险四级;

当森林火险发生概率在区间(0.8,1]时,判定森林火险等级为火险五级。

同时,本发明还提供一种基于单分类svm的森林火险等级判定系统,包括选取模块、获取模块、单分类svm模型构建模块、森林火险发生概率模型构建模块和判定模块;

所述选取模块用于以天为样本单位,根据火灾数据选取发生火灾的样本作为建模样本;

所述获取模块用于获取建模样本对应的气象因子;

所述单分类svm模型构建模块用于基于建模样本对应的气象因子,构建单分类svm模型;

所述森林火险发生概率模型构建模块用于构建森林火险发生概率模型,即利用激活函数将单分类svm模型的中间输出的样本到模型中超球面球心的距离的取值区间映射至[0,1],映射结果即为森林火险发生概率;

所述判定模块用于计算待测样本的森林火险发生概率,并根据待测样本的森林火险发生概率判定森林火险等级。

于本发明一实施例中,所述气象因子包括日降水量、日最高气温、日最低气温、日平均相对湿度、日平均风速、昨日降水量、前三天天降水量合计值、前三天相对湿度平均值、前三天气温合计值、今日以前降水量小于等于5毫米的连续日数、20时以前日降水量小于等于3毫米的连续日数、20时前日降水量小于等于0.5毫米的连续日数。

于本发明一实施例中,所述单分类svm模型构建模块构建所述单分类svm模型时,使用怀卡托智能分析环境平台的单分类svm模型,采用默认参数。

于本发明一实施例中,所述激活函数采用

于本发明一实施例中,所述判定模块根据待测样本的森林火险发生概率判定森林火险等级时,遵循以下原则:

当森林火险发生概率在区间[0,0.2]时,判定森林火险等级为火险一级;

当森林火险发生概率在区间(0.2,0.4]时,判定森林火险等级为火险二级;

当森林火险发生概率在区间(0.4,0.6]时,判定森林火险等级为火险三级;

当森林火险发生概率在区间(0.6,0.8]时,判定森林火险等级为火险四级;

当森林火险发生概率在区间(0.8,1]时,判定森林火险等级为火险五级。

如上所述,本发明的基于单分类svm的森林火险等级判定方法及系统,具有以下有益效果:

(1)以若干项气象因子作为判断森林火险等级的影响因子,利用不发生火灾的样本基于单分类svm进行森林火险发生概率模型的学习,进而判定森林火险等级;

(2)有效地克服了由于森林火灾样本集中而存在类别不平衡问题;

(3)从火灾发生概率的角度进行森林火险等级的判断,提高了森林火险的判定的准确度,更具有科学性。

附图说明

图1显示为本发明的基于单分类svm的森林火险等级判定方法的流程图;

图2显示为本发明的基于单分类svm的森林火险等级判定系统的结构示意图。

元件标号说明

1选取模块

2获取模块

3单分类svm模型构建模块

4森林火险发生概率模型构建模块

5判定模块

具体实施方式

以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。

需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,遂图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。

在机器学习领域,支持向量机(supportvectormachine,svm)是一个有监督的学习模型,通常用来进行模式识别、分类、以及回归分析。svm的主要思想可以概括为以下:

1)针对线性可分情况进行分析;对于线性不可分的情况,通过使用非线性映射算法将低维输入空间线性不可分的样本转化为高维特征空间使其线性可分,从而使得高维特征空间采用线性算法对样本的非线性特征进行线性分析成为可能;

2)基于结构风险最小化理论之上在特征空间中建构最优分割超平面,使得学习器得到全局最优化,并且在整个样本空间的期望风险以某个概率满足一定上界。

单分类svm(one-classsupportvectormachine,ocsvm)属于判别模型,是输出结果为“是”或“否”的硬性判决。在本发明中,为了判定森林火险等级,实现对森林火灾发生的可能性和蔓延容易程度进行定量化的度量,使用激活函数将ocsvm算法的中间输出数据转换为森林火灾发生概率,并根据森林火灾发生概率判定森林火险等级,通过量化的方式确定森林火险等级。

为了适应防火指挥部门和群众应用火险预报的习惯,将森林的火险程度人为划分为五个火险等级,具体如表1所示。

表1、火险等级

参照图1,本发明的基于单分类svm的森林火险等级判定方法包括以下步骤:

步骤s1、以天为样本单位,根据火灾数据选取发生火灾的样本作为建模样本。

具体地,以一天为一个样本,根据火灾数据对样本进行标注,将发生火灾的样本标注为正样本,将未发生火灾的样本标注为负样本。仅选取正样本作为后续森林火险等级判定的建模样本。

因此,步骤s1包括以下步骤:

11)以天为样本单位,将发生火灾的样本标注为正样本,将未发生火灾的样本标注为负样本。

12)选取正样本作为建模样本。

步骤s2、获取建模样本对应的气象因子。

具体地,根据气象数据,获取每个样本所对应的气象因子。在本发明中,气象因子包括日降水量、日最高气温、日最低气温、日平均相对湿度、日平均风速、昨日降水量、前三天天降水量合计值、前三天相对湿度平均值、前三天气温合计值、今日以前降水量小于等于5毫米的连续日数、20时以前日降水量小于等于3毫米的连续日数、20时前日降水量小于等于0.5毫米的连续日数。这12个气象因子作为森林火险等级的影响因子。

步骤s3、基于建模样本对应的气象因子,构建单分类svm模型。

具体地,使用平台waikatoenvironmentforknowledgeanalysis(weka,怀卡托智能分析环境)的算法包weka.classifiers.functions.libsvm构建单分类svm模型。weka是一款免费的、非商业化的、基于java环境下开源的机器学习以及数据挖掘软件。在weka中,参数svmtype设定为one-classsvm,即svmtype类型选择为单分类svm,其他参数使用默认设置。

因此,在步骤s3中,将建模样本对应的气象因子输入单分类svm算法进行训练,即可得到单分类svm模型。

步骤s4、构建森林火险发生概率模型,即利用激活函数将单分类svm模型的中间输出的样本到模型中超球面球心的距离的取值区间映射至[0,1],映射结果即为森林火险发生概率。

单分类svm模型输出的为“是”或“否”的硬性判决结果,无法判定森林火险等级。单分类svm算法只对发生火灾的样本进行训练,其将学习一个尽量小的超球面包裹所有的样本。当新的预测样本落在超球面外时,则判定发生火灾;当新的预测样本落在超球面内部时,则判定不发生火灾。故步骤s4中,选取单分类svm模型的中间输出结果-样本到模型中超球面球心的距离作为输出,并经由激活函数对样本到模型中超球面球心的距离进行映射,以将样本到模型中超球面球心的距离的取值区间由[0,∞)映射至[0,1]。映射后得到的映射结果即为森林火险发生概率。

具体地,利用激活函数对单分类svm模型的中间输出的样本到模型中超球面球心的距离d进行映射,使得样本到模型中超球面球心的距离d的取值区间为至[0,1]。映射结果f(d)即为森林火险发生概率。

步骤s5、计算待测样本的森林火险发生概率,并根据待测样本的森林火险发生概率判定森林火险等级。

具体地,将待测样本的气象因子输入森林火险发生概率模型,获取森林火险发生概率,并根据该森林火险发生概率判定森林火险等级。根据森林火险发生概率判定森林火险等级时,遵循以下原则:

当森林火险发生概率在区间[0,0.2]时,判定森林火险等级为火险一级;

当森林火险发生概率在区间(0.2,0.4]时,判定森林火险等级为火险二级;

当森林火险发生概率在区间(0.4,0.6]时,判定森林火险等级为火险三级;

当森林火险发生概率在区间(0.6,0.8]时,判定森林火险等级为火险四级;

当森林火险发生概率在区间(0.8,1]时,判定森林火险等级为火险五级。

参照图2,本发明的基于单分类svm的森林火险等级判定系统包括选取模块1、获取模块2、单分类svm模型构建模块3、森林火险发生概率模型构建模块4和判定模块5。

选取模块1用于以天为样本单位,根据火灾数据选取发生火灾的样本作为建模样本。

具体地,以一天为一个样本,根据火灾数据对样本进行标注,将发生火灾的样本标注为正样本,将未发生火灾的样本标注为负样本。仅选取正样本作为后续森林火险等级判定的建模样本。

因此,选取模块1执行以下操作:

11)以天为样本单位,将发生火灾的样本标注为正样本,将未发生火灾的样本标注为负样本。

12)选取正样本作为建模样本。

获取模块2与选取模块1相连,用于获取建模样本对应的气象因子。

具体地,根据气象数据,获取每个样本所对应的气象因子。在本发明中,气象因子包括日降水量、日最高气温、日最低气温、日平均相对湿度、日平均风速、昨日降水量、前三天天降水量合计值、前三天相对湿度平均值、前三天气温合计值、今日以前降水量小于等于5毫米的连续日数、20时以前日降水量小于等于3毫米的连续日数、20时前日降水量小于等于0.5毫米的连续日数。这12个气象因子作为森林火险等级的影响因子。

单分类svm模型构建模块3与获取模块2相连,用于基于建模样本对应的气象因子,构建单分类svm模型。

具体地,使用平台waikatoenvironmentforknowledgeanalysis(weka)的算法包weka.classifiers.functions.libsvm构建单分类svm模型。weka是一款免费的、非商业化的、基于java环境下开源的机器学习以及数据挖掘软件。在weka中,参数svmtype设定为one-classsvm,即svmtype类型选择为单分类svm,其他参数使用默认设置。

因此,构建单分类svm模型时,将建模样本对应的气象因子输入单分类svm算法进行训练,即可得到单分类svm模型。

森林火险发生概率模型构建模块4与单分类svm模型构建模块3相连,用于构建森林火险发生概率模型,即利用激活函数将单分类svm模型的中间输出的样本到模型中超球面球心的距离的取值区间映射至[0,1],映射结果即为森林火险发生概率。

单分类svm模型输出的为“是”或“否”的硬性判决结果,无法判定森林火险等级。单分类svm算法只对发生火灾的样本进行训练,其将学习一个尽量小的超球面包裹所有的样本。当新的预测样本落在超球面外时,则判定发生火灾;当新的预测样本落在超球面内部时,则判定不发生火灾。故在森林火险发生概率模型构建模块中,选取单分类svm模型的中间输出结果-样本到模型中超球面球心的距离作为输出,并经由激活函数对样本到模型中超球面球心的距离进行映射,以将样本到模型中超球面球心的距离的取值区间由[0,∞)映射至[0,1]。映射后得到的映射结果即为森林火险发生概率。

具体地,利用激活函数对单分类svm模型的中间输出的样本到模型中超球面球心的距离d进行映射,使得样本到模型中超球面球心的距离d的取值区间为至[0,1]。映射结果f(d)即为森林火险发生概率。

判定模块5与森林火险发生概率模型构建模块4相连,用于计算待测样本的森林火险发生概率,并根据待测样本的森林火险发生概率判定森林火险等级。

具体地,将待测样本的气象因子输入森林火险发生概率模型,获取森林火险发生概率,并根据该森林火险发生概率判定森林火险等级。根据森林火险发生概率判定森林火险等级时,遵循以下原则:

当森林火险发生概率在区间[0,0.2]时,判定森林火险等级为火险一级;

当森林火险发生概率在区间(0.2,0.4]时,判定森林火险等级为火险二级;

当森林火险发生概率在区间(0.4,0.6]时,判定森林火险等级为火险三级;

当森林火险发生概率在区间(0.6,0.8]时,判定森林火险等级为火险四级;

当森林火险发生概率在区间(0.8,1]时,判定森林火险等级为火险五级。

综上所述,本发明的基于单分类svm的森林火险等级判定方法及系统以若干项气象因子作为判断森林火险等级的影响因子,利用不发生火灾的样本基于单分类svm进行森林火险发生概率模型的学习,进而判定森林火险等级;有效地克服了由于森林火灾样本集中而存在类别不平衡问题;从火灾发生概率的角度进行森林火险等级的判断,提高了森林火险的判定的准确度,更具有科学性。所以,本发明有效克服了现有技术中的种种缺点而具高度产业利用价值。

上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1