一种大坝位移指标确定方法及装置与流程

文档序号:16883259发布日期:2019-02-15 22:23阅读:305来源:国知局
一种大坝位移指标确定方法及装置与流程

本发明涉及大坝位移指标监控技术,具体的讲是一种大坝位移指标确定方法及装置。



背景技术:

大坝位移作为大坝安全最主要的监测项目,综合反映了大坝的运行性态,因此拟定位移监控指标对大坝安全监控意义重大。

目前对大坝位置监控的通常用的方法有置信区间法、典型小概率法、极限状态法、结构分析法等,其中,置信区间法在国外普遍采用。现有技术中,通常选用典型坝段监测位移效应量或者根据最不利荷载组合进行建模求位移指标,求得的结果作为唯一指标,但是,将该结果作为位移指标来表征大坝运行状态,往往导致评价或诊断结果不符合大坝实际情况。



技术实现要素:

为了使大坝位移监控指标更加准确,本发明实施例提供了一种大坝位移指标确定方法,包括:

采集大坝位移测点数据;

利用证据理论集成分类器构造随机森林分区模型;

利用构造的随机森林分区模型对所述测点数据进行分区;

采用置信区间法确定各分区的位移监控指标。

本发明实施例中,所述的利用证据理论集成分类器构造随机森林分区模型包括:

从所述大坝位移测点数据中抽取样本确定训练样本;

利用所述训练样本对决策树进行训练,构建随机森林分类器;

利用证据理论集成多分类器方法集成所述随机森林分类器,构造所述随机森林分区模型。

本发明实施例中,从所述大坝位移测点数据中抽取样本确定训练样本包括:

利用随机抽取重抽样方法,从所述大坝位移测点数据中抽取样本确定训练样本。

本发明实施例中,所述的利用证据理论集成多分类器方法集成所述随机森林分类器,构造所述随机森林分区模型包括:

利用所述证据理论集成多分类器方法确定所述随机森林分类器中每个类的信任度,确定最大信任度的随机森林分类器;

将所述最大信任度的最大信任度的随机森林分类器作为所述随机森林分区模型。

同时,本发明还提供一种大坝位移指标确定装置,包括:

数据采集装置,用于采集大坝位移测点数据;

分区模型构造模块,用于利用证据理论集成分类器构造随机森林分区模型;

测点分区模块,利用构造的随机森林分区模型对所述测点数据进行分区;

监控指标确定模块,用于采用置信区间法确定各分区的位移监控指标。

本发明实施例中,所述的分区模型构造模块包括:

训练样本抽取单元,用于从所述大坝位移测点数据中抽取样本确定训练样本;

随机森林分类器构建单元,用于利用所述训练样本对决策树进行训练,构建随机森林分类器;

分区模型构造单元,用于利用证据理论集成多分类器方法集成所述随机森林分类器,构造所述随机森林分区模型。

本发明实施例中,所述的训练样本抽取单元利用随机抽取重抽样方法,从所述大坝位移测点数据中抽取样本确定训练样本。

本发明实施例中,所述的分区模型构造单元,进一步利用所述证据理论集成多分类器方法确定所述随机森林分类器中每个类的信任度,确定最大信任度的随机森林分类器,将所述最大信任度的最大信任度的随机森林分类器作为所述随机森林分区模型。

同时,本发明提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现前述的大坝位移指标确定方法。

同时,本发明还提供一种计算机可读存储介质,计算机可读存储介质存储有执行大坝位移指标确定方法的计算机程序。

本发明针对大坝监测过程中存在的种种不确定性,用证据理论集成多分类器作为随机森林分类器集成方法,再采用置信区间法对大坝各区建立了位移监控指标,本发明方法充分考虑了大坝结构的整体性与差异性,对大坝位移监控指标的拟定具有一定的实际应用意义。

为让本发明的上述和其他目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附图式,作详细说明如下。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明提供的一种大坝位移指标确定方法的流程图;

图2为本发明实施例为一个简单的决策树模型;

图3为发明实施例中随机森林基本框架图;

图4为本发明实施例中的信任函数和似然函数关系图;

图5为本发明实施例中某水电站水位过程线;

图6为大坝位移各测点位移时间序列实测值曲线图;

图7为为全时间序列的分区结果。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

如图1所示为本发明提供的一种大坝位移指标确定方法的流程图,包括:

步骤s101,采集大坝位移测点数据;

步骤s102,利用证据理论集成分类器构造随机森林分区模型;

步骤s103,利用构造的随机森林分区模型对所述测点数据进行分区;

步骤s104,采用置信区间法确定各分区的位移监控指标。

本发明的大坝位移指标确定方法,采用随机森林算法对大坝位移测点进行分区,并用证据理论集成多分类器作为随机森林分类器集成方法分区,根据原型观测资料,充分考虑了大坝结构的整体性与差异性,拟定了大坝位移监控指标,较传统方法更具有实际应用价值。

即本发明利用证据理论集成分类器作为随机森林分类器集成方法分区,能够根据大坝不同测点之间的相似性进行分区,对大坝不同区域分别拟定监控指标,这样既考虑了大坝不同部位变形规律的差异性,又将具有相似变化规律的测点建立了一定的联系,再对其进行指标的拟定,使位移指标对大坝的安全管理更具指导意义。

随机森林是一种较新的机器算法,它是一种现代分类与回归技术,同时也是一种组合式的自学习技术。鉴于随机森林本身在算法上的优势,本发明将随机森林算法应用于大坝安全监控领域,同时考虑到大坝运行过程中受多种不确定性因素的影响,引进证据理论对随机森林算法进行改进,对大坝位移效应量进行决策分区,在此基础上,采用置信区间法,拟定大坝各区的位移监控指标。

随机森林对大坝位移测点进行分类的时候,把若干个单个测点集成起来,通过对多个分类器的分类结果进行某种组合来决定最终的分类,以取得比单个分类器更好的性能。如果把单个分类器比作一个决策者的话,组合学习的方法就相当于多个决策者共同进行一项决策。随机森林是决策树的集合,它让所有决策树参与投票,获得最多投票的类作为位移测点的分类。

本发明实施例中,决策树是一种树状的预测模型,节点和有向边构成了树的层次结构。决策树含有有3种节点类型:根节点(root),中间节点(node),叶子节点(leaf)。图2所示本发明实施例为一个简单的决策树模型,本发明实施例中,决策树的根节点是唯一的,是所有训练数据的集合。中间节点由根节点分裂而来。叶子节点是带有标签的样本结合。决策树从根节点到叶子节点形成的每条路径都是一个分类。决策树通常选择c4.5,cart等分裂算法,这些算法在每次分裂选择时,选择使当前分类效果最好的属性,直到每个叶子节点上的样本均处于单一的类别或每个属性都被选择过为止。

本发明实施例中,决策树不需要先验概率分布,产生的树结构简单易懂,便于计算。但决策树分类规则和分类器过于复杂,易产生过拟合问题,另外在属性选择时,由于不进行回溯,最终形成的决策树有可能会收敛到非全局的局部最优解,影响分类精度。

随机森林是一种统计学习理论,采用放回重抽样方法(bootsrap)从原始样本中抽取多个样本,对每个bootsrap样本进行决策树建模,然后组合多棵决策树的预测,通过投票得出最终预测结果。随机森林对异常值和噪声具有很好的容忍度,且不容易出现过拟合。随机森林分类是由多决策树分类模型组成的组合分类模型,其基本思想首先利用bootstrap抽样从原始训练集抽取k个样本,且每个样本的样本容量都与原始训练集一样;其次,对k个样本分别建立k个决策树模型,得到k种分类结果;最后,根据k种分类结果对每个记录进行投票表决决定其最终分类,如图3所示,为本发明实施例中随机森林基本框架图。

随机森林通过k轮训练,得到一个分类模型序列{h1(x),h2(x),…,hk(x)},用该序列构成一个多分类模型系统,得到最终的分类决策:

其中,h(x)为组合分类模型;hi(x)为单决策树分类模型;y为输出变量;i(·)为示性函数。

本实施例中,随机森林的构建采用的是袋装法(bagging),即将所有的训练样本放入袋子中,采取放回的方式随机抽取袋中的样本(bootstrap),形成一个新的样本集。具体步骤如下:

(1)给定样本集t,t含有n个样本,记为(x1,y1),(x2,y2),…,(xn,yn),每个样本具有m个属性,记为α1,α2,…,αm;给定整数m,用来指示生成树时,选择m种属性作为候选属性;给定整数f,用来指示森林中数的数目。

(2)采取放回的方式,在样本集t中随机抽取n个样本,形成新的样本集t′,为(x′1,y′1),(x′2,y′2),…,(x′n,y′n)。

(3)从m种属性中选择m种属性作为单棵决策树的候选属性。根据t′和m种候选属性训练单棵决策树。

(4)重复(1)~(3),直至生成f棵树。

(5)对每棵树的输出分类结果进行投票。

(5)统计投票结果。

现有技术中,采用欧式距离、切比雪夫距离、明可夫斯基距离、马氏距离等来衡量样本间的相似度,为大坝变形分区提供依据。但是欧式距离等没有考虑样本属性间的相关性及总体变异对“距离”远近的影响,而马氏距离由于异常样本的存在易导致样本总体的期望和方差不稳定,使这些距离在实际应用中受到了很大的限制。

随机森林可以计算样本间的相似程度,得到相似度矩阵。假设大坝位移测点样本的数目为n,根据下列步骤计算相似度矩阵:首先初始化样本n行n列的全零矩阵相似度矩阵prox。用生成的每一棵树对所有样本进行判别,每个样本都会落于该树的某一个叶子节点。对于样本i和样本j,如果它们都落于该树的同一个叶子节点上,则在prox矩阵相应的第i行和第j列处加上1。对森林中的每一棵树重复上述过程,遍历每一棵树,得到一个总的相加值。再将prox矩阵中的每一个元素除以总的树的数目,得到最终的prox矩阵。prox矩阵为对称矩阵,定义第i行和第j列的元素的prox(i,j)为样本测值i行和测值j之间的相似度。prox(i,j)值越大,则表示两个样本间的相似度越高。

本发明实施例中,基于证据理论改进的随机森林算法:

影响随机森林分类性能的主要因素有两部分:森林中单棵树的分类强度和森林中树之间的相关度。每棵树的分类强度越大,则表示随机森林的分类性能越好;树之间的相关度越大,则随机森林的分类性能越差。

现有的随机森林算法采用传统投票法组合多个决策树作为分类器进行输出,证据理论能够生成具有不确定性的信任度来作出决策,这是一种“软”的决策机制,用该机制来改进传统随机森林中“硬”的基于投票法的分类决策机制,能提升其分类的性能和准确度。

大坝各部位变形测值,由于仪器类别、仪器精度、仪器埋设施工、仪器老化等因素,加上观测过程中某些主客观不确定因素的影响,存在多种不确定性。本发明利用证据理论能够有效处理和表示大坝测值的不确定问题,能够对信息进行有效融合,本发明利用证据理论改进随机森林算法,用证据理论集成多分类器作为随机森林分类器集成方法分区拟定大坝位移监控指标。

本实施例中证据理论的几个基本概念:

定义1:若集合θ为一个有限集合,且其元素为关于某一问题领域的互斥且全面的命题假设,则称其为识别框架。

定义2:在θ的幂集2θ上定义映射m:2θ→[0,1],称为一个基本信任分配函数(basicbeliefassignment,bba),满足:

m(φ)=0

称m(a)为mass函数,表示对事件a可信程度的一种度量。基本信任分配函数根据大坝实测数据构造得到。

定义3对于θ每个子集a,a的所有子集的基本信任分配值和称为信任函数:

式中,bel(a)也是对a的总的信任度,其中一部分是通过m(a)直接给出,一部分是通过m(b)间接给出,m(b)为对事件a可信程度的一种度量。

对于θ的子集a,若m(a)>0,则称其为信任函数的焦元。对于命题a,本发明的证据理论还引入了似然函数,用来表示对命题的怀疑程度。定义为a的似然函数:

证据理论与概率论的主要区别在于,命题a的信任度bel(a)与其补集的信任度的和不一定为1。

信任函数和似然函数组成了一个完整的对于焦元a的不确定区间,它们的关系如图4所示。

信任函数bel(a)可以理解为a事件发生的下界概率的测度,似然函数pl(a)则为上界概率的测度。

针对传统随机森林分类方法中存在的类别不平衡现象,本发明采用rogova给出的基于参考向量的用证据理论集成多分类器的方法作为随机森林分类器集成方法,进一步降低识别误差。

设{fi(x)}为训练数据集上对应于决策树fi的输出的集合,{xk}为训练数据集中所有属于第k类的数据组成的训练数据集的一个子集,则决策树fi对应于第k类训练集{xk}的输出的集合{fi(xk)}的平均向量定义为对于第k类的参考向量。

对于测试样本d,决策树输出fi(d)和参考向量的相似度用下式表示:

本实施例中,为相似度度量,式(5)中的相似度函数φ(·)可以用不同形式的函数表示。

本实施例采用如下相似度函数:

设识别框架θ={ω1,…,ωk},假设对于任一决策树fi和每一个类别k,相似度度量属于ωk类的一个证据。

作为对焦元ωk的支持函数,则基本信任分配函数为:

同样的,当j≠k时,可以作为对焦元的支持函数,则相应的基本信任分配函数为:

接下来组合所有关于ωk类的先验信息形式的证据,从而得到总的证据用下式表示:

从而根据所有决策树分类器产生的证据得到关于每个类的基本信任分配值:

归一化得到:

式中,c为归一化常量。

从而将测试样本d分类到具有最大信任度的类ωτ:

ωτ=argmax1≤k≤kek(d)(14)

综上,对于给定的大坝位移实测值集合d=(d1,d2,...,dn),分区拟定位移监控指标具体步骤如下:

(1)选择原始样本d=(d1,d2,…,dn),对数据进行预处理,处理数据中的噪声、不完整数据等;

(2)根据训练样本对决策树学习进行训练构建基分类器;

(3)采用基于“参考向量”的证据理论集成多分类器对各基分类器进行组合构造,形成大坝位移测点随机森林分区模型;

(4)对各区采用置信区间法拟定位移监控指标。

某水电站,挡水建筑物为双曲拱坝,坝高305m,该工程在2012年12月7日完成首次蓄水,坝身导流底孔开始泄洪。由于首次蓄水,水位较低,位移较小,本实施例主要根据2013年6月16日至2015年9月28日的坝体主要垂线测点的位移变化拟定位移监控指标。

图5为本发明实施例中某水电站水位过程线,根据蓄水情况分为三个阶段,第一阶段为2013年6月16日至2014年5月29日;第二阶段为2014年5月30日至2015年6月16日;第三阶段为2015年6月17日至2015年9月28日。第一阶段最高蓄水至1840m,第二阶段于2014年8月23日蓄至正常蓄水位1880m。下面以大坝垂线测点为例进行分析,该坝垂线测点布置如图5所示,共24个测点。对测点数据进行预处理后,图6为大坝位移各测点位移时间序列实测值曲线图。

采用基于“参考向量”的证据理论集成多分类器构造随机森林模型,将位移测点分为6区,表1为改进的随机森林模型对大坝位移测点分区结果表。如图7为全时间序列的分区结果,曲面的形状代表该阶段末的实测位移值。可以看出,分区结果基本符合大坝位移实际变化规律。随着水位的升高,位移最大值逐渐从低高程向高高程变化,验证了改进的随机森林模型对大坝位移测点进行分区的有效性。

表1改进的随机森林模型对大坝位移测点分区结果表

下面采用置信区间法对各区建立位移监控指标,取显著性水平α=5%,主要用于早期大坝险情的识别,结合随机森林回归模型分析得到的回归系数,根据各区测点位移的标准差s1=0.583mm,s2=1.349mm,s3=0.286mm,s4=0.167mm,s5=0.852mm,s6=0.341mm,得到大坝各区的置信区δ=±2s分别为:δ1=±1.166mm,δ2=±2.698mm,δ3=±0.572mm,δ4=±0.334mm,δ5=±1.704mm,δ6=±0.682mm,根据实测水位、温度和运行时间资料,根据回归模型得到各区位移δ的指标上下限值结果见表2。

表2大坝各区位移指标结果

本文选择的位移时间序列在该拱坝首次蓄水期间,位移值较小,在安全预警指标范围之内,处于正常运行状态,随着后期水位的升高,应密切关注位移的变化情况,对其进行分析,识别大坝的潜在险情。

同时,本发明还提供一种大坝位移指标确定装置,包括:

数据采集装置,用于采集大坝位移测点数据;

分区模型构造模块,用于利用证据理论集成分类器构造随机森林分区模型;

测点分区模块,利用构造的随机森林分区模型对所述测点数据进行分区;

监控指标确定模块,用于采用置信区间法确定各分区的位移监控指标。

对本领域技术人员而言通过本发明前述的实施例,可以清楚获知如何实现本发明的大坝位移指标确定装置,在此不再赘述。

本发明考虑采用随机森林算法对大坝位移测点进行分区,用证据理论集成多分类器作为随机森林分类器集成方法分区,根据原型观测资料,充分考虑了大坝结构的整体性与差异性,拟定了大坝位移监控指标,较传统方法更具有实际应用价值。本发明充分利用随机森林的分类与回归性能,首次把随机森林算法引入到大坝安全监控指标拟定中,考虑大坝各实测效应量之间的相似性与差异性,对测点进行分区。

本发明考虑了大坝监测过程中存在的种种不确定性,引入证据理论,证据理论能够有效处理和表示测值的不确定问题,能够对大坝原型观测数据进行有效融合,用证据理论集成多分类器作为随机森林分类器集成方法,改进了传统随机森林分区过程中出现的类别不平衡现象。

本发明通过工程实例验证了改进的随机森林模型对大坝测点分区的有效性,并采用置信区间法对各区建立了位移监控指标,更具针对性。

本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

本发明中应用了具体实施例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1