基于GIS-神经网络集成的山洪灾害风险区划及预测方法与流程

文档序号:14923549发布日期:2018-07-13 07:59阅读:220来源:国知局

本发明涉及山洪灾害防治领域,更具体地,涉及一种基于gis-神经网络集成的山洪灾害风险区划及预测方法。



背景技术:

我国是一个多山的国家,山丘区面积约占全国陆地面积的2/3。复杂的地形地质条件、暴雨多发的气候特征、密集的人口分布和人类活动的影响,导致山洪灾害发生频繁。我国山洪灾害呈现出影响范围广、发生频率高、灾害历时短、危害破坏程度大、地域差异显著的整体特征。据《全国山洪灾害防治规划报告》数据统计,我国山丘区流域面积在100km2以上的山溪河流约5万条,其中70%因受降雨、地形及人类活动影响会发生山洪灾害。据官方统计数据表明,我国每年因山洪灾害直接或间接导致人民群众生命财产的损失约占自然灾害造成的总损失的40%左右。目前,我国山洪灾害的研究已经涉及成因、空间分布特征、灾害损失评估、风险评价与制图等各方面。风险评估与管理逐渐也成为国际上倡导和推广的减灾防灾有效途径之一。目前,山洪灾情评估工作得到了来自地学工作者、工程专家和各级政府部门的高度重视,并逐渐成为国际性的研究项目。特别是在山洪风险评估方面的表现尤为突出。

变化环境下山洪灾害的形成条件及灾情分布具有空间尺度上的非线性特点,无论是在风险评价指标体系,还是在风险评估数学模型中,都存在不同空间尺度范围的不确定性,这对准确评估山洪灾害风险带来了很大的不确定性。应用时间序列分析、多元回归分析、延神经元网络、人工神经网络、模糊数学方法、混沌优化算法、灰色聚类分析等数理统计方法、地理信息系统的空间分析方法等方法构建山洪灾害评估体系,进行山洪灾害定量评估具有很大前景性。



技术实现要素:

本发明的目的在于克服现有技术的不足,提供一种基于gis-神经网络集成的山洪灾害风险区划及预测方法,构建了山洪灾害风险评价及损失预估模型,解决了变化环境下山洪灾害评估中的空间尺度不确定性问题。

为解决上述问题,本发明提供的技术方案为:一种基于gis-神经网络集成的山洪灾害风险区划及预测方法,其中,包括以下步骤:

s1.利用关联规则挖掘山洪灾害中风险因子与风险等级之间的关联关系,辨识风险因子,构建定量化的山洪灾害风险评价指标体系;

本发明利用关联规则挖掘山洪灾害中风险因子与风险等级之间的关联关系,构建了定量化的山洪灾害风险评价指标体系。在初步构建的风险因子数据库,用项集a来表示,如式(1)所示,基于历史灾情分析的损失风险等级用项集b来表示,如式(2)所示,由此构建用于山洪灾害的“风险因子-风险等级”不确定性分析的事物集。

a={a1,a2,a3,...,am}(1)

b={b1,b2,b3,...,bn}(2)

其中,a为山洪灾害的环境条件因素项集,a1,a2,a3,…,am分别对应于某个山洪灾害案例的环境条件因素状态的组合;b为山洪灾害的风险等级项集,b1,b2,b3,…,bn等表征了山洪灾害的风险特征。

关联规则可以用x=>y来表示,其中x、y是项集,i是所有项集的总和,x∈i,y∈i,x∩y=φ,x=>y表示在数据库的事件中,包含项集x的事件同时也包含项集y的可能性。然后,在遍历所有项集的基础上,利用式(3)和式(4)进行关联规则分析,挖掘不同灾害环境组合条件项与不同灾害等级项之间的强关联规则,如图1所示。进一步地,探究其间的物理成因,与关联规则的分析结果进行验证。进而对各风险因子在山洪灾害风险评价中的作用大小及其不确定性进行定量分析,构建相应的风险评价指标体系,为研究更加符合山洪灾害成因机理和客观规律的风险评价模型提供科学合理的物理基础。

其中,式(3)为支持度的计算式,表示在数据库中项集x和项集y同时出现的概率,dx∪y为包含x且包含y的元组数,d表示总元组数;式(4)为置信度的计算式,表示在出现项集x的事件中,项集y也出现的概率,dx∪y为包含x且包含y的元组数,dx表示包含x的元组数。

s2.采用层次分析法确定危险性和易损性指标体系及其权重,生成各要素图层;

本发明利用层次分析法对山洪灾害风险评价指标体系进行定权,其主要原理是将与决策相关的元素分解成目标层(a层),准则层(c层),指标层或决策层(c层)三个层面;将各层次的指标两两进行比较,对其予以优劣评判;并利用评判结果建立矩阵模型来计算各指标的权重系数,即得到在某一准则下各个指标相对重要性的度量,具体计算步骤为:

s21.建立层次递阶结构

层次分析的结构模型大致分为三层,从最高层到最底层依次是目标层,准则层和变量层。目标层一般情况下是唯一的,研究所要达到的目标;准则层是为实现总目标所采取的措施;变量层是影响措施的因素

s22.构建判断矩阵

判断矩阵是针对上一层次中某元素而言,评定该层次中各元素间相对重要程度的判断。两两指标之间的相对重要程度的度量尺度一般采用9分法。划分标准如表1所示:

表1ahp法程度赋值及意义

在山洪灾害发生的危险性因子中,降雨是引发山洪灾害的主导因素,其影响力最大,地形地貌、河网水系等下垫面条件又为山洪灾害的发生提供了孕灾环境,但影响力较降雨小;而在山洪灾害易损性分析的各指标中,因为人口是山洪灾害中最重要的保护对象,城镇化率是防洪能力的体现,所以人口和城镇化率指标是最重要的指标,地均gdp、一产比重反映了资产暴露状况和下垫面土壤持水能力影响防洪能力,对山洪灾害易损性评价有重大影响,由此建立各层次判断矩阵见表2。

表2各层次判断矩阵

s23.计算判断矩阵的最大特征向量与特征根;

首先,计算判断矩阵每行所有元素的几何平均值

得到

然后,将归一化,即计算:

得到即为所求特征向量的近似值,也是各因素的相对权重ω;

最后,计算判断矩阵的最大特征值λmax:

其中,为向量aω的第i个元素;

s24.计算判断矩阵一致性指标,并检验其一致性;引入一致性比率cr:

式中,n为判断矩阵阶数,ci为一致性指标,cr为随机一致性比率,ri为随机一致性指标;

由于不同阶数的矩阵两两判断的比例测度达到一致性的难度不一样,用ri来对不同阶数矩阵一致性指标ci进行修正。随机一致性指标的统计平均值如表3所示。

表3平均随机一致性指标

若cr<0.1,判断矩阵具有很好一致性,判断合理;

若cr=0.1,判断矩阵具有较好一致性,判断较合理;

若cr>0.1,判断矩阵不符合一致性原则,需重新调整;

根据以上步骤,计算得到判断矩阵的最大特征向量、特征根、一致性检验值如表4所示:

表4最大特征向量、特征根、一致性检验值

s25.通过加权综合计算得到准则层c层指标的相对权重;通过步骤s21至s24的计算,得到一层指标相对于上一层指标的权重,再计算指标层各指标相对于目标层的总权重,其计算公式为:

目标层对准则层的相对权重为:

准则层对指标层的相对权重为:

则,指标层对目标层的总权重为:

得到的为指标层相对于目标层的总权重。

根据以上方法,构造出通过一致性检验的判断矩阵,并确定准则层和指标层各指标的相对权重。

s3.利用arcgis将山洪灾害危险性和易损性分布图层叠加得到山洪灾害风险分布图;

s31.依照层次分析法建立的指标体系和权重对各指标层的指标进行汇总,得出各栅格的山洪风险值;风险值越高,意味着面临的山洪风险越大。

s32.利用arcgis栅格计算器通过以下公式将不同指标图层叠加起来,得到危险性、易损性和风险性栅格分布图,其中,

危险性计算公式为:

易损性计算公式为:

风险性计算公式为:d=f(h,v)=ωhh+ωvv

式中,hi、vi为各个栅格单元经过标准化处理后危险性指标和易损性指标的取值;ω为危险性和易损性各指标权重

s4.采用iso最大似然法聚类以及自下而上区域合并与自上而下定性分析结合的方法,形成山洪灾害风险区划;

iso最大似然法聚类:iso聚类是以空间相似性为原则的非监督分类方法,主要运算思想是:输入n个样本,预选nc个初始聚类中心和各参数指标:预期的聚类中心数目k、每一聚类域中最少的样本数θn、聚类域中样本距离分布的标准差θs、两聚类中心间的最小距离θc、一次迭代运算中可以合并的聚类中心的最多对数l、迭代运算的次数i;当某两类聚类中心距离θc小于阀值则归为一类,否则为不同类;若某类样本数θn小于阀值,则将其取消。iso聚类不需要提供监督样本,自动进行合并和分裂,进而得到较为合理的聚类效果。将其与最大似然法结合,能得到与实际条件相吻合的区划分类结果。在本次区划评价中主要通过arcgis中iso聚类工具和最大似然法分类工具实现。

“自上而下”分区与“自下而上”合并相结合:参考《全国山洪灾害风险区划》,以“自上而下”分区与“自下而上”合并相结合的方法为主要思路进行区域划分。区划原则应与区划方法相对应,本次评价所遵循的原则包括:主导因素与综合因素相结合原则、区域单元内部相对一致性原则、以人为本的经济社会分析原则、区域共轭性原则、定性分析与定量研究相结合原则,而“自上而下”区划方法是为相对一致性原则而设计的,“自下而上”区划方法是为区域共轭性原则而设计的。

以上两种方法都是自然灾害区划乃至自然区划中最通用的方法。“自上而下”方法进行区划时,要掌握宏观格局,根据某些区划指标,首先进行最高级别单位的划分然后依次将已划分出的高级单位再划分成低四级的单位,一直划分到最低级区划单位为止;“自下而上”方法则恰恰相反,它通过对最小图斑的指标的分析,首先合并出最低级的区划单位,然后再在低级区划单位的基础上,逐步合并出较高级别的单位,直到得出最高级别的区划单位为止。

s5.利用elman神经网络分析评价指标与风险等级、灾情数据之间的非线性关系,构建山洪灾害风险评价及损失预估模型。

elman神经网络是elman于1990年提出的一种典型的局部回归网络。除了拥有一般的神经网络所具有的输入层、隐含层、输出层之外,还有一个特殊的承接层,用于构成局部反馈,可以改善bp神经网络训练时间较长,和易于陷入局部最优的状况。承接层选择线性函数为传递函数,由于多出一个延迟单元,承接层能够对过去状态进行记录,这种记录在下一次也会作为输入单元,这种动态记忆功能,让elman神经网络在时间序列预测上有较好的表现。

在本发明中,若elman神经网络的输入u(k-1)∈rr,输出y(k)∈rm,隐含层输出x(k)∈rn,承接层输出xc(k)∈rn,elman网络的数学模型为:

x(k)=f(w1xc(k)+w2u(k-1))

xc(k)=αxc(k-1)+x(k-1)

y(k)=g(w3x(k))

其中,w1∈rn×nw2∈rn×r、w3∈rm×n分别为承接层到隐含层、输入层到隐含层、隐含层到输出层的连接权矩阵;f(·)和g(·)分别为隐含层神经元和输出层神经元的激发函数组成的非线性向量函数;

设第k步网络的实际输出为则误差指标函数为:

进一步地,所述的s5步骤中利用elman神经网络,构建山洪灾害风险评价及损失预测模型包括以下步骤:

s51.数据准备,将各评价指标原始数据作为输入数据,利用arcgis自然间断法将各指标数据分为5个灾害风险等级并作为风险评价ⅰ,将基于历史灾情评价的损失风险评估结果作为损失评价集ⅱ,将风险评价集ⅰ和损失评价集ⅱ作为输出数据,随机选取训练样本和验证样本,训练样本和验证样本的比例为3:1。

s52.数据预处理,采用premnmx函数对输入和输出数据进行归一化处理至[-1,1]区间内;神经网络的输入数据大多存在着多维、多纲、多源的特点,若将数据直接输入网络中,可能需要花费较长的训练时间,且当数值差别很大时,大数值往往会更多的影响网络的学习,大大降低网络学习速度更可能导致最终无法收敛。因此,有必要对输入数据进行合理的预处理。

s53.elman神经网络构建,网络结构关系决定着神经网络解决问题的能力和效率,但在隐含层层数和节点数的选择上,当前还未存在确切的理论和方法。一般情况下,单隐含层的神经网络能够逼近任意的非线性函数,因此本发明选择单隐含层的神经网络即三层elman神经网络来进行模拟灾害风险评价和灾害损失预估。在隐含层节点的选择上,通过训练数据不断调试来确定。隐含层传输函数选择非线性的双曲正切函数(tanh或tansig),其公式为

输出层使用线性传输函数purelin,训练函数选择带有动量项的自适应学习算法traingdx;训练函数的选择上,主要考虑以下三种方式:带有动量项的梯度下降法(traingdm)、带有动量项的自适应学习算法(traingdx)和levenberg-marquardt算法(trainlm)。其中,traingdm和traingdx是基于基本梯度下降法(traing)发展而来的方法,在收敛速度上,traing<traingdm<traingdx;对于中等规模的网络,trainlm是达到收敛需要训练次数最少的方法,但其在运算过程中内存占用较大。

s54.elman神经网络训练,根据s3步骤构建的神经网络,分别对灾害风险评价和灾害损失预估利用训练输入数据进行调试,traingdx训练方法设定训练步数为10000步,期望训练精度根据不同的数据输入,选择0.008-0.05不等,通过比较模拟值和实际值的拟合程度,确定模型隐含层节点;

s55.elman神经网络预测,将验证输入数据分别输入到训练好的灾害风险评价和灾害损失预估模型中进行预测,分别得到山洪灾害风险评价结果和山洪灾害损失预估结果,应用上述训练好的网络,将各指标图层栅格值作为输入数据,模拟灾害风险及损失,利用arcgis输出山洪灾害风险评价等级图和灾害损失预测分布图;

s56.误差分析与泛化验证,通过误差函数评价模拟效果,并更换训练数据和验证数据,对模型的泛化能力进行验证。

与现有技术相比,有益效果是:本发明提供的一种基于gis-神经网络集成的山洪灾害风险区划及预测方法,利用关联规则构建了定量化的山洪灾害风险评价指标体系,减少了构建指标体系过程中主观随意性的影响;集成ahp-gis分析方法,分析山洪灾害危险性和易损性水平,进行风险评价,得到山洪灾害风险等级分布图;采用iso最大似然法聚类及自上而下定性分析方法,形成山洪灾害风险区划;最后利用elman神经网络分析评价指标与风险等级、灾情数据之间的非线性关系,构建山洪灾害风险评价及损失预估模型,解决了变化环境下山洪灾害评估中的空间尺度不确定性问题,本发明可用于山洪灾害风险研究分析,为山洪灾害的空间预测和防治提供科学依据。

附图说明

图1为本发明方法整体流程图。

图2为本发明关联规则辨识山洪灾害驱动因子概化图。

图3为本发明基于神经网络的山洪灾害风险评估模型。

图4为本发明实施例中广东省山洪灾害风险等级分布图。

图5为本发明实施例中广东省山洪灾害风险分析聚类结果。

图6为本发明实施例中广东省山洪灾害风险区划。

图7为本发明实施例中选取的历史山洪灾害情况验证结果。

具体实施方式

如图1至图3所示,一种基于gis-神经网络集成的山洪灾害风险区划及预测方法,其中,包括以下步骤:

步骤1:本发明选择广东省作为实验区域。广东省位于我国大陆南部,地形地貌类型复杂多样,且以山地丘陵为主,海拔500m以上的山地占31.7%,丘陵占28.5%。加之地处亚热带季风区,暴雨频发,受特殊自然地理环境、日趋极端的灾害性天气以及山丘区人类经济社会活动等多种自然和人为因素的影响,导致广东省山洪灾害发生频繁。因此,为进一步做好山洪灾害的防御工作,本发明提出一种山洪灾害风险区划方法,并将其用于广东省的山洪灾害风险区划,为广东省山洪灾害的空间预测和防治提供科学依据。

步骤2:首先利用层次分析法对山洪灾害风险评价指标体系进行定权,如表5、表6所示,将各层次的指标两两进行比较,对其予以优劣评判,并利用评判结果建立矩阵模型来计算各指标的权重系数,即得到在某一准则下各个指标相对重要性的度量。本发明认为广东省山洪灾害危险性受降雨因子、地形因子(地貌、坡度)、河网密度影响,其物理意义在于:区域暴雨、地形、水文水系条件是影响山洪过程分布格局最为重要的3项因子,且只有3项因子均达到较高水平,才有可能发育规模-频率水平较高的山洪过程。本发明认为反映人口集中程度的人口密度和城镇化率指标应赋予高权重,地均gdp和第一产业产值比重反映资产的集中程度,权重设置可以相对低些。

表5广东省山洪灾害危险性评价指标体系及权重

步骤3:山洪灾害风险是山洪灾害危险性、易损性的结合体,是在山洪灾害危险性、易损性等要素评估结果的基础上进行评价的,用山洪灾害综合风险指数来表征其等级。本发明利用层次分析法确定风险性评价指标权重后,将危险性、易损性的栅格图叠加后,得到广东省山洪灾害风险等级分布图,如图4所示。

步骤4:利用arcgis软件对广东省山洪灾害风险评价结果进行iso最大似然法聚类分析,得到广东省山洪灾害风险分析5类聚类结果,如图5所示。

步骤5:为了保证区划单元的准确性和科学性,在单纯地采用聚类分析后,需将自下而上区域合并工作与自上而下定性分析紧密结合,从而得到最终的风险区划单元。根据全国山洪灾害风险三级区划,广东省划分为滇东南粤桂山地中高风险区和粤桂低山平原中风险区2个三级区划单元。在三级区划框架内,按照区划的集中连片原则以及区域共轭性原则,同时参阅《广东省地貌区划》、《广东省气候区划》等区划成果,进一步划分28个山洪灾害风险等级相对一致的四级区划单元,形成广东省山洪灾害风险四级区划,如图6所示。

步骤6:将本发明评价结果与历史山洪灾害分布情况进行对比,结果显示风险等级较高的区域均是历史山洪灾害发生次数与损失较大的区域,如图7所示。如清远市的清新、英德、佛冈、阳山、连山、连南;韶关市的乐昌;河源市的连平、东源、紫金;梅州市的五华、兴宁;惠州市的龙门、博罗;阳江市的阳春;茂名市的信宜、高州、电白、化州等地。根据初步对比验证结果,认为本次广东省山洪灾害风险区划结果较为符合实际情况,可为山洪灾害的空间预测和防治提供科学依据。

山洪灾害风险区划作为一项防洪减灾非工程措施,是洪水灾害风险分析系统中必不可少的组成部分。应用关联规则、人工神经网络以及地理信息系统等方法构建山洪灾害评估体系,进行山洪灾害定量评估,实施山洪灾害风险区划,是山洪灾害风险研究的主要发展方向。本发明利用关联规则构建了定量化的山洪灾害风险评价指标体系,减少了构建指标体系过程中主观随意性的影响;集成ahp-gis分析方法,分析山洪灾害危险性和易损性水平,进行风险评价,得到山洪灾害风险等级分布图;采用iso最大似然法聚类及自上而下定性分析方法,形成山洪灾害风险区划;最后利用elman神经网络分析评价指标与风险等级、灾情数据之间的非线性关系,构建山洪灾害风险评价及损失预估模型,解决了变化环境下山洪灾害评估中的空间尺度不确定性问题。因此本发明可用于山洪灾害风险研究分析,并可为山洪灾害的空间预测和防治提供科学依据。

显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1