一种河流凌汛冰塞险情智能诊断方法

文档序号:27131266发布日期:2021-10-29 21:25阅读:121来源:国知局
一种河流凌汛冰塞险情智能诊断方法

1.本发明涉及一种河流凌汛冰塞险情智能诊断方法。


背景技术:

2.寒区河道凌汛灾害具有致灾因子多样、孕灾环境复杂、承灾体脆弱性大等特点,凌汛冰塞险情突发性强、诊断预测难度大。目前关于河流凌汛冰塞险情的研究,更多采用的是数值模拟方法,集中在冰塞形成及演变过程模拟、冰塞壅水过程模拟及风险分析等,数值模拟方法对于冰塞演变过程数据资料的详实程度要求较高,相关资料条件不理想的情况下难以取得很高的模拟或诊断精度。


技术实现要素:

3.本发明所要解决的技术问题是提供一种河流凌汛冰塞险情智能诊断方法。
4.本发明一种河流凌汛冰塞险情智能诊断方法的技术方案是这样实现的:
5.一种河流凌汛冰塞险情智能诊断方法,依次包括下列步骤:
6.1、凌汛冰塞险情诊断样本制作
7.(1)、诊断样本划分、诊断指标体系构建及实测数据标准化处理
8.①
、根据所研究河段地理位置和河势走向,将所研究河段平均划分为若干个小尺度诊断样本,上述诊断样本的划分原则为诊断样本内弯道需保持完整、河段长度为河宽的3~5倍;
9.②
、建立目标层a、准则层b与指标层c三层递阶的凌汛冰塞险情诊断指标体系,上述目标层a即指凌汛冰塞易发风险度;准则层b包括热力环境b1、动力因素b2和边界条件b3;指标层c则由热力环境b1、动力因素b2和边界条件b3的各项诊断指标构成,热力环境b1诊断指标为凌汛期平均气温c1(℃)、累积负气温c2(℃)、凌汛周期c3(d)、最大冰厚c4(cm),主要反映凌汛期气温变化因素对河流凌汛冰塞险情的影响;动力因素b2诊断指标为凌峰流量c5(m3/s)、单位河长槽蓄水增量c6(105m2)、平滩流量c7(m3/s),主要反映凌汛洪水动力条件对河流凌汛冰塞险情的驱动作用;边界条件b3诊断指标为单位河长泥沙淤积量c8(万t/km)、河相系数c9(m
1/2
)、底坡比降c10(

)、河槽弯曲系数c11、平滩河宽间距c12(m)、桥梁工程c13(座),主要反映河道形态、河势变化及工程设施等要素对河流凌汛冰塞险情的影响;
10.③
、收集并整理研究河段历年凌汛期实测的水文、气象及河道工程数据,以不同类型数据的多年平均值对步骤1(1)

所述指标层c各项诊断指标赋值,构建诊断样本矩阵x
n
×
m
=(x
ij
)
n
×
m
,式中n为诊断样本数量、m为各诊断样本对应诊断指标数量、x
ij
为第i个诊断样本对应的第j项诊断指标值,利用极差变换标准化处理方法对上述诊断样本矩阵进行数据标准化处理;
11.(2)、由主客观组合评价确定诊断指标权重
12.①
、根据层次分析法重要性比例标度规则,结合专家经验打分,构造步骤1(1)

所述不同诊断指标对应的递阶层次判断矩阵a
n
×
n
=(a
ij
)
n
×
n
,式中n为当前指标层对应诊断指
标的数量,a
ij
为第i项诊断指标与第j项诊断指标相对于上层诊断指标的重要性比例标度,且a
n
×
n
满足一致性检验标准;
13.②
、根据变异系数法、层次分析法、模糊层次分析法和熵权法,由下列公式1至公式4计算步骤1(1)

所述指标层c对应各项诊断指标的权重;
14.假设变异系数法、层次分析法、模糊层次分析法和熵权法求得河流凌汛冰塞险情诊断指标的综合权重向量分别为w1,w2,w3和w4,则表示各方法诊断指标权重向量的公式(公式1)如下:
[0015][0016]
针对各方法诊断指标权重向量,分别计算诊断指标权重间变异系数cvw
n
的公式(公式2)如下:
[0017]
cvw
n
=σ(w
n
)/μ((w
n
)
[0018]
表示不同方法主客观指标权重的均匀化系数η
n
的公式(公式3)如下:
[0019][0020]
对η
n
进行归一化处理得到修正系数可得各诊断指标对应总目标的综合优化权重向量为的公式(公式4)如下:
[0021][0022]
(3)、凌汛冰塞易发风险度计算
[0023]
将步骤1(2)

所得诊断指标权重与步骤1(1)

所得数据标准值对应加权求和,得到步骤1(1)

各诊断样本的凌汛冰塞险情数据,即凌汛冰塞易发风险度;
[0024]
(4)、凌汛冰塞易发风险度等级划分
[0025]
采用k

means聚类算法和手肘法对步骤3所得的凌汛冰塞易发风险度进行等级划分;采用k

means聚类算法,通过迭代分析寻求最优聚类,凌汛冰塞易发风险度等级划分的步骤如下:
[0026]

、构建步骤1(1)

不同诊断样本凌汛冰塞易发风险度数据集s,s={s1,s2,......,s
n
},初始化k个聚类中心,不同聚类中心各对应一个簇p,p={p1,p2,......,p
k
},1<k≤n;
[0027]

、将步骤1(3)所得不同诊断样本凌汛冰塞易发风险度数据集s中的每一数据划分至欧氏距离最近的聚类中心所在类簇中,数据分配完成,重新计算k个类簇数据平均值,对应得到新的聚类中心;
[0028]

、重复迭代步骤1(4)

操作,不同诊断样本凌汛冰塞易发风险度数据集s中的数据再分配,不断更新聚类中心,直至聚类中心不变为止,从而得到最优聚类结果;
[0029]
k

means聚类算法中第i个诊断样本凌汛冰塞易发风险度数据s
i
与第j个聚类中心u
j
间欧氏距离计算公式(公式5)为:
[0030]
d(s
i
,u
j
)=||s
i

u
j
||2,1≤i≤n,1≤j≤k
[0031]
由公式5可知,对于每个聚类中心,类簇中所有样本凌汛冰塞易发风险度数据欧氏
距离之和越小,说明聚类效果越好,样本与聚类中心相似度越高。
[0032]
采用手肘法分析确定聚类中心个数k值,衡量指标是误差平方和sse,sse计算公式(公式6)如下:
[0033][0034]
手肘法判定k值的主要思路是:随着聚类中心数量的增加,各类簇中诊断样本聚合程度不断提高,诊断样本与聚类中心距离平方和减小;当k小于真实聚类数目时,各类簇中诊断样本聚合程度会随k的增大而迅速提高,而sse表现为迅速大幅下降;当k大于真实聚类数目时,各类簇中诊断样本聚合程度便会迅速降低,sse下降幅度会大幅减小至趋于平缓,sse与k值关系曲线为手肘形状,肘部对应k值即为最佳聚类数目;
[0035]
(5)、绘制凌汛冰塞险情分布图,构造凌汛冰塞险情诊断样本集
[0036]
根据步骤1(4)凌汛冰塞易发风险度等级划分结果,基于gis平台赋予步骤1(1)

各诊断样本对应的凌汛冰塞险情等级属性绘制凌汛冰塞险情分布图,直观地反映凌汛冰塞易发河段位置及其险情等级的空间分布特征,从而构造由诊断指标体系标准值及其对应凌汛冰塞险情等级组成的凌汛冰塞险情诊断样本集;
[0037]
2、凌汛冰塞险情诊断样本的智能诊断
[0038]
(1)、凌汛冰塞险情诊断样本训练与参数设定
[0039]
根据步骤1(5)构造的凌汛冰塞险情诊断样本集,基于python构建随机森林(rf)凌汛冰塞险情诊断模型,随机森林中弱学习器最大迭代次数或分类树数目n=50,每个决策树随机选择的诊断指标数量为4,同时建立支持向量机(svm)、决策树(dt)、先验为高斯分布的朴素贝叶斯(gnb)、先验为多项式分布的朴素贝叶斯(mnb)、k最邻近(knn)、自适应增强(ada)和梯度提升(gb)的凌汛冰塞险情诊断模型,用于对比论证随机森林(rf)凌汛冰塞险情诊断模型的合理性和可靠性,随机抽取70%的样本进行训练,30%的样本用于模型测试;
[0040]
随机森林是由分类树和bagging两部分组成的一种新型分类算法,随机森林由一系列树型分类器{h(x,θ
k
),k=1,2,

}组成,其中θ
k
为独立同分布随机向量,h(x,θ
k
)为构造的未经剪枝的分类树,每棵树对输入向量x进行分类决策投票,根据分类树所有投票结果,即可得到某一诊断样本对应的凌汛冰塞险情等级。随机森林生成步骤,如图8所示,首先,采用bootstrap方法从训练样本集g中抽样选取k个子训练样本集{g1,g2,
···
g
k
},并构建k棵分类树;然后,在分类树每个节点上,随机从n个指标中选取m个,选择最优分割指标进行分割,并重复选择指标、分割,直至遍历k棵分类树;最后,将k棵分类树聚集,构建完整的随机森林。运用随机森林算法进行凌汛冰塞险情诊断时,需要将待诊断样本输入到训练好的分类树中,叶子节点上分布的凌汛冰塞险情等级即为对应分类树的诊断结果,将各棵分类树叶子上的凌汛冰塞险情等级进行数据平均,如下列公式(公式7)所示,即得到整个随机森林的凌汛冰塞险情等级诊断结果:
[0041][0042]
公式7中:t为随机森林分类树数目;c为某一险情等级;p(c|v)为冰塞险情等级c在叶子节点v处发生的概率函数。
[0043]
bootstrap方法通过对训练样本进行重抽样,分割节点,随机选择指标,能够降低不同分类树之间的联系,而剪枝操作会增加分类树偏差,因此本发明一种河流凌汛冰塞险情智能诊断方法不对单颗树进行剪枝操作,使分类树处于低偏差状态,以保障凌汛冰塞险情等级诊断的准确性;
[0044]
(2)、凌汛冰塞险情诊断样本的智能诊断
[0045]
利用步骤2(1)诊断样本训练后的八种凌汛冰塞险情诊断模型,对测试样本进行凌汛冰塞险情等级诊断,采用精确率p、召回率r和综合指标f1,由公式8、公式9与公式11计算并评判诊断精度;
[0046]
精确率p表示被分为正例的样本中实际为正例的比例,召回率r是实际正例被分为正例的比例,f

measure指标f是精确率与召回率的加权调和平均,p、r和f越大,说明诊断精度越高。p、r和f的计算公式(公式8、公式9、公式10)如下:
[0047][0048][0049][0050]
当参数α=1时,即为最常见的f1,f1的计算公式(公式11)如下:
[0051][0052]
公式8至公式11中:p指精确率(%);tp指将正例诊断为正例的样本数量(个);fp指将非正例诊断为正例的样本数量(个);r指召回率(%);fn指将正例诊断为非正例的样本数量(个);
[0053]
(3)、凌汛冰塞险情诊断指标的重要性排序
[0054]
根据随机森林基尼指数,计算不同诊断指标对凌汛冰塞险情的贡献度,同时考虑模型样本训练产生的误差影响,通过样本集中不同凌汛冰塞险情等级对应各诊断指标均值之间的变异系数,以“诊断指标贡献度与变异系数乘积越大,指标越重要”为原则,结合凌汛冰塞灾害的主要成因分析,综合确定凌汛冰塞险情诊断指标的重要性排序;下列公式依次为公式12、公式13、公式14、公式15与公式16:
[0055][0056][0057][0058]
[0059][0060]
本发明一种河流凌汛冰塞险情智能诊断方法采用主客观组合评价与人工智能算法相融合,具有诊断精度高、能够智能分析凌汛冰塞险情的空间分布特征及其变化规律、可进行凌汛冰塞险情诊断指标的重要性排序的特点。
附图说明
[0061]
下面结合附图和实施例对本发明做进一步的说明。
[0062]
图1是本发明一种河流凌汛冰塞险情智能诊断方法流程图;
[0063]
图2是所研究河段小尺度诊断样本分布图;
[0064]
图3是所研究河段凌汛冰塞险情诊断指标赋值结果图;
[0065]
图4是所研究河段凌汛冰塞险情诊断指标递阶层次判断矩阵图;
[0066]
图5是所研究河段凌汛冰塞险情诊断指标权重图;
[0067]
图6是所研究河段凌汛冰塞险情大小分布图;
[0068]
图7是所研究河段凌汛冰塞险情聚类结果图;
[0069]
图8是随机森林生成步骤图;
[0070]
图9是所研究河段凌汛冰塞险情诊断精度对比图;
[0071]
图10是所研究河段凌汛冰塞险情诊断指标贡献度统计图;
[0072]
图11是所研究河段凌汛冰塞险情诊断指标变异系数统计图。
具体实施方式
[0073]
实施例1
[0074]
1、计算机软件与程序来源
[0075]
软件:python,版本3.8,开源软件;
[0076]
编译器:pycharm,社区版
[0077]
2、本发明一种河流凌汛冰塞险情智能诊断方法
[0078]
如图1所示,一种河流凌汛冰塞险情智能诊断方法,依次包括下列步骤:
[0079]ⅰ、凌汛冰塞险情诊断样本制作
[0080]
(1)、诊断样本划分、诊断指标体系构建及实测数据标准化处理
[0081]

、如图2所示,根据所研究河段地理位置和河势走向,将所研究河段黄河石嘴山至头道拐河段平均划分为64个小尺度诊断样本,上述诊断样本的划分原则为诊断样本内弯道需保持完整、河段长度为河宽的3倍;
[0082]

、建立目标层a、准则层b与指标层c三层递阶的凌汛冰塞险情诊断指标体系,上述目标层a即指凌汛冰塞易发风险度;准则层b包括热力环境b1、动力因素b2和边界条件b3;指标层c则由热力环境b1、动力因素b2和边界条件b3的各项诊断指标构成,热力环境b1诊断指标为凌汛期平均气温c1(℃)、累积负气温c2(℃)、凌汛周期c3(d)、最大冰厚c4(cm);动力因素b2诊断指标为凌峰流量c5(m3/s)、单位河长槽蓄水增量c6(105m2)、平滩流量c7(m3/s);边界条件b3诊断指标为单位河长泥沙淤积量c8(万t/km)、河相系数c9(m
1/2
)、底坡比降c10
(

)、河槽弯曲系数c11、平滩河宽间距c12(m)、桥梁工程c13(座);
[0083]

、选取研究河段1951~2018年凌汛期实测的水文、气象及河道工程数据,以不同类型数据的多年平均值对步骤ⅰ(1)

所述指标层c各项诊断指标赋值,构建诊断样本矩阵x
n
×
m
=(x
ij
)
n
×
m
,式中n为诊断样本数量64、m为各诊断样本对应诊断指标数量13、x
ij
为第i个诊断样本对应的第j项诊断指标值,利用极差变换标准化处理方法对上述诊断样本矩阵进行数据标准化处理;凌汛冰塞险情诊断指标赋值结果见表1与图3;
[0084]
表1凌汛冰塞险情诊断指标赋值结果
[0085]
研究河段上游至下游编号18152229诊断指标值c13.123.834.474.734.99诊断指标值c2630.24756.89871.74915.88960.01诊断指标值c390.0099.15107.70112.60117.50诊断指标值c442.6556.7168.5767.1565.73诊断指标值c5804.00830.38873.551017.401161.25诊断指标值c60.030.030.020.020.02诊断指标值c71800.001800.001792.501740.001687.50诊断指标值c83.413.414.204.204.20诊断指标值c94.756.998.818.097.38诊断指标值c100.270.270.150.150.15诊断指标值c111.081.071.091.171.36诊断指标值c12325.00385.31434.40416.20398.00诊断指标值c1300200研究河段上游至下游编号3643505764诊断指标值c15.215.355.505.645.78诊断指标值c2996.221012.651029.071045.501061.92诊断指标值c3121.07121.30121.53121.77122.00诊断指标值c464.7464.8264.8964.9765.04诊断指标值c51309.001466.501624.001781.501939.00诊断指标值c60.020.020.020.020.02诊断指标值c71678.201776.901875.601974.302073.00诊断指标值c89.299.299.299.299.29诊断指标值c96.957.237.507.788.06诊断指标值c100.090.090.090.090.09诊断指标值c111.411.351.361.711.96诊断指标值c12393.60423.70453.80483.90514.00诊断指标值c1310000
[0086]
(2)、由主客观组合评价确定诊断指标权重
[0087]

、根据层次分析法重要性比例标度规则,结合专家经验打分,构造如图4所示的步骤ⅰ(1)

所述不同诊断指标对应的递阶层次判断矩阵a
n
×
n
=(a
ij
)
n
×
n
,式中a
ij
为第i项诊断指标与第j项诊断指标相对于上层诊断指标的重要性比例标度,且a
n
×
n
满足一致性检验标
准;
[0088]

、根据变异系数法、层次分析法、模糊层次分析法和熵权法,由公式1至公式4计算步骤ⅰ(1)

所述指标层c对应各项诊断指标的权重;表2和图5为步骤ⅰ(1)

所述指标层c对应各项诊断指标的权重计算结果,由图5可见,河流凌汛冰塞险情影响权重较大的因素是桥梁工程c13、凌峰流量c5、底坡比降c10、泥沙淤积量c8、单位河长槽蓄水增量c6、河槽弯曲系数c11和凌汛期平均气温c1,与实际冰塞或冰坝灾害的主要影响因素基本相符;
[0089]
表2凌汛冰塞诊断指标权重计算结果
[0090][0091]
(3)、凌汛冰塞易发风险度计算
[0092]
将步骤ⅰ(2)

所得诊断指标权重与步骤ⅰ(1)

所得数据标准值对应加权求和,得到步骤ⅰ(1)

各诊断样本的凌汛冰塞险情数据,即凌汛冰塞易发风险度;表3和图6为凌汛冰塞易发风险度计算结果;
[0093]
表3凌汛冰塞易发风险度计算结果
[0094]
河段编号48121620242832凌汛冰塞易发险度0.43130.44120.45610.27790.29840.32150.34390.3742河段编号3640444852566064凌汛冰塞易发险度0.41480.43510.45940.46740.50300.53820.53950.5750
[0095]
(4)、凌汛冰塞易发风险度等级划分
[0096]
采用k

means聚类算法和手肘法对步骤ⅰ(3)所得的凌汛冰塞易发风险度进行等级划分;通过公式5和公式6计算不同聚类中心数目k(k=2,3
……
,8)对应的诊断样本与簇聚类中心距离误差平方和sse,绘制sse

k关系曲线,根据手肘法确定最佳聚类数目k=4,即凌汛冰塞险情划分为四个等级:低风险、中风险、高风险和极高风险;表4为凌汛冰塞险情等级划分标准;
[0097]
表4凌汛冰塞险情等级划分标准
[0098]
冰塞险情等级名称低风险中风险高风险极高风险凌汛冰塞易发风险度聚类中心值0.210.390.520.61
[0099]
(5)、绘制凌汛冰塞险情分布图,构造凌汛冰塞险情诊断样本集
[0100]
根据步骤ⅰ(4)凌汛冰塞易发风险度等级划分结果,基于gis平台赋予步骤ⅰ(1)

各诊断样本对应的凌汛冰塞险情等级属性绘制凌汛冰塞险情分布图即图7,直观地反映凌汛冰塞易发河段位置及其险情等级的空间分布特征,从而构造由诊断指标体系标准值及其对应凌汛冰塞险情等级组成的凌汛冰塞险情诊断样本集;由图7分析可知:黄河石嘴山至头
道拐河段凌汛冰塞险情高风险或极高风险区多分布在三湖河口至头道拐河段,下游河段冰塞险情总体大于上游河段;表5为凌汛冰塞险情分布图标注示例;
[0101]
表5凌汛冰塞险情分布图标注示例
[0102]
地名石嘴山乌海市磴口八彦高勒三湖河口昭君坟头道拐颜色表示浅灰色浅灰色浅灰色灰色深灰色深灰色黑色冰塞险情等级低风险低风险低风险中风险高风险高风险极高风险
[0103]
ii、凌汛冰塞险情诊断样本的智能诊断
[0104]
(1)、凌汛冰塞险情诊断样本训练与参数设定
[0105]
根据步骤ⅰ(5)构造的凌汛冰塞险情诊断样本集,基于python构建随机森林(rf)凌汛冰塞险情诊断模型,随机森林中弱学习器最大迭代次数或分类树数目n=50,每个决策树随机选择的诊断指标数量为4,同时建立支持向量机(svm)、决策树(dt)、先验为高斯分布的朴素贝叶斯(gnb)、先验为多项式分布的朴素贝叶斯(mnb)、k最邻近(knn)、自适应增强(ada)和梯度提升(gb)的凌汛冰塞险情诊断模型,用于对比论证随机森林(rf)凌汛冰塞险情诊断模型的合理性和可靠性,随机抽取70%的样本进行训练,30%的样本用于模型测试;
[0106]
(2)、凌汛冰塞险情诊断样本的智能诊断
[0107]
利用步骤ii(1)诊断样本训练后的随机森林(rf)凌汛冰塞险情诊断模型,对测试样本进行凌汛冰塞险情等级诊断,采用精确率p、召回率r和综合指标f1,由公式8、公式9、公式11计算并评判诊断精度,精确率p=97.72%,召回率r=95.83%,综合指标f1=96.54%,明显高于支持向量机(svm)、决策树(dt)、先验为高斯分布的朴素贝叶斯(gnb)、先验为多项式分布的朴素贝叶斯(mnb)、k最邻近(knn)、自适应增强(ada)和梯度提升(gb)七种智能方法的诊断精度,凌汛冰塞险情八种智能方法诊断精度比较见表6和图9,由图9可见,经过比较,随机森林更适用于黄河宁蒙段(石嘴山至头道拐河段)凌汛冰塞险情诊断,数据挖掘能力更强,与gis结合,能够快速分析凌汛冰塞险情的空间分布特征及其变化规律。
[0108]
表6凌汛冰塞险情八种智能方法诊断精度比较
[0109]
方法名称rfknnmnbdtgbsvmgnbada精确率p0.980.950.900.930.880.750.750.50召回率r0.960.980.900.850.810.560.560.22综合指标f10.970.960.880.870.830.610.610.28
[0110]
(3)、凌汛冰塞险情诊断指标的重要性排序
[0111]
根据随机森林基尼指数,计算不同诊断指标对凌汛冰塞险情的贡献度,同时考虑模型样本训练产生的误差影响,通过诊断样本集中不同凌汛冰塞险情等级对应各诊断指标均值之间的变异系数,以“诊断指标贡献度与变异系数乘积越大,指标越重要”为原则,结合凌汛冰塞灾害的主要成因分析,综合确定凌汛冰塞险情诊断指标的重要性排序,表7和图10为凌汛冰塞险情诊断指标贡献度,表8和图11为凌汛冰塞险情诊断指标变异系数,根据指标重要性判断原则,得出诊断指标重要性由大至小排序的前7项为c13>c8>c10>c1>c5>c6>c2,考虑底坡比降c10受单位河长泥沙淤积量c8影响且多年变化较小,而河槽弯曲系数c11已被其他学者论证为其与冰塞冰坝具有较好的关联关系,因此从冰塞灾害成因角度分析,前7个重要指标中舍掉c10而增加c11指标,可得冰塞险情的主要驱动因子为:凌汛期平均气温c1、累积负气温c2、凌峰流量c5、单位河长槽蓄水增量c6、单位河长泥沙淤积量c8、河
槽弯曲系数c11和跨河桥梁工程c13,与本发明步骤ⅰ(2)

得出的凌汛冰塞险情影响权重较大的因素相比,两种方法分析的主要因素基本一致,只是个别因素的重要性排序略有差别,考虑主要是由诊断样本矩阵中不同指标标准值的差异性而引起,同时也验证了凌汛冰塞险情指标重要性分析结果是合理的。
[0112]
表7凌汛冰塞险情诊断指标贡献度
[0113][0114]
表8凌汛冰塞险情诊断指标变异系数
[0115][0116]
实施例说明,本发明一种河流凌汛冰塞险情智能诊断方法步骤依次包括凌汛冰塞险情诊断样本制作与凌汛冰塞险情诊断样本的智能诊断,根据河段地理位置和河势走向,将所研究河段黄河石嘴山至头道拐河段平均划分为64个小尺度诊断样本,上述诊断样本的划分原则为诊断样本内弯道需保持完整、河段长度为河宽的3倍,采用目标层a、准则层b与指标层c三层递阶的凌汛冰塞险情诊断指标体系,通过选取1951~2018年凌汛期水文、气象及河道工程实测数据的均值对第三层指标层c中13项诊断指标赋值、构建诊断样本矩阵并进行数据标准化处理,采用主客观组合评价确定第三层指标层13项诊断指标权重,得到凌汛冰塞易发风险度,采用k

means聚类算法和手肘法将凌汛冰塞易发风险度划分为低风险、中风险、高风险与极高风险的四个等级,基于gis平台赋予不同诊断样本对应的凌汛冰塞险情等级属性,绘制凌汛冰塞险情分布图,直观地反映凌汛冰塞易发河段位置及其险情等级的空间分布特征,从而构造了由诊断指标体系标准值及其对应险情等级组成的凌汛冰塞险情诊断样本集,根据凌汛冰塞险情诊断样本集,基于python构建随机森林(rf)凌汛冰塞险情诊断模型,利用诊断样本训练后的随机森林(rf)凌汛冰塞险情诊断模型,对测试样本进行凌汛冰塞险情等级诊断,采用精确率p、召回率r和综合指标f1计算并评判诊断精度,精确率p=97.72%,召回率r=95.83%,综合指标f1=96.54%,明显高于支持向量机(svm)、决
策树(dt)、先验为高斯分布的朴素贝叶斯(gnb)、先验为多项式分布的朴素贝叶斯(mnb)、k最邻近(knn)、自适应增强(ada)和梯度提升(gb)七种智能方法的诊断精度,说明随机森林更适用于黄河石嘴山至头道拐河段凌汛冰塞险情诊断,数据挖掘能力更强,与gis结合,能够快速分析凌汛冰塞险情的空间分布特征及其变化规律。根据随机森林基尼指数,计算不同诊断指标对凌汛冰塞险情的贡献度,同时考虑模型样本训练产生的误差影响,通过诊断样本集中不同凌汛冰塞险情等级对应各诊断指标均值之间的变异系数,以“诊断指标贡献度与变异系数乘积越大,指标越重要”为原则,结合凌汛冰塞灾害的主要成因分析,综合确定凌汛冰塞险情诊断指标的重要性排序,与本发明一种河流凌汛冰塞险情智能诊断方法主客观组合评价确定第三层指标层13项诊断指标权重得出的凌汛冰塞险情影响权重较大的因素相比,两种方法分析的主要因素基本一致,只是个别因素的重要性排序略有差别,考虑主要是由诊断样本矩阵中不同指标标准值的差异性而引起,同时也验证了凌汛冰塞险情指标重要性分析结果是合理的。总之,本发明一种河流凌汛冰塞险情智能诊断方法采用主客观组合评价与人工智能算法相融合,具有诊断精度高、能够智能分析凌汛冰塞险情的空间分布特征及其变化规律、可进行凌汛冰塞险情诊断指标的重要性排序的特点。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1