一种基于机器学习技术的场地地震液化势评价方法与流程

文档序号:16738477发布日期:2019-01-28 12:48阅读:214来源:国知局
一种基于机器学习技术的场地地震液化势评价方法与流程

本发明属于抗震领域,尤其涉及一种基于机器学习技术的场地地震液化势评价方法。



背景技术:

为本领域技术人员所熟知的是,在地震作用下土壤会产生急剧的状态改变和丧失强度和刚度,导致地面建筑物的破坏,这种现象被称为液化现象。液化是导致建筑物在地震中不稳定进而破坏的主要因素,也是地震研究及地基抗震设计的重要方面。液化势就是饱和砂土或饱和粉土在地震作用下产生的超孔隙水压力,使土体有效抗剪强度降低或消失,以导致土层喷水冒砂或土体滑移失稳的一种趋势。对液化势进行评价,可判断地基在地震作用下液化的可能性,从而为建筑设计中采取抗液化措施提供依据。



技术实现要素:

本发明所要解决的技术问题在于提供基于机器学习技术的场地地震液化势评价方法,欲提高液化势评价分类器泛化能力。

本发明的技术方案如下:一种基于机器学习技术的场地地震液化势评价方法,包括如下步骤:

s1:开始;

s2:输入:包含有n个原因属性变量和1个标签变量的数据集合,交叉验证的折数k;

s3:定义:fn为全体属性集合,length-fn为fn中包括的属性个数,fi为fn的子集,且初始化:fi=fn;

s4:令i=0,转s5;

s5:当i不大于length-fn时,令length-fi为fi中包括的属性个数,同时令j=1,转s6;

若i大于length-fn时,直接到s12;

s6:令j=1,转s7;

s7:当j的数值不大于length-fn,同时i不等于0时,定义fj为fi中第j个属性,令fj=fi\fj;同时将数据集合分为k份,转s8;

当i等于0时,直接将数据集合分为k份,转s8;

当j的数值大于length-fn时,转s11;

s8:令s=1,转s9;

s9:反复判断s与k的大小,进行交叉验证;

交叉验证完成,有k个误差值,令errij为k个误差值中最大值,记录errij,同时判断i是否等于0,若等于0,令erri=errij,转s10,若i不等于0,令j=j+1,并返回s7;

s10:令i=i+1,返回s5;

s11:令令fi为erri对应的属性集合,判断erri是否大于或等于erri-1,

若是则输出fi-1,转s12;

若否则返回s10;

s12:结束。

优选的,步骤s9当中交叉验证具体实施为:当s不大于k时,以fj为模型的属性集合,第s份数据用来评价分类器,其他k-1份被用来训练分类器;同时将s+1的值赋值给新的s;

当s大于k时,交叉验证完成。

优选的,在s1前进行数据预处理,对属性变量数据进行标准化,标准化计算公式如下:

利用上述公式,将属性变量数据映射到区间[0,1]。结果变量yi∈{-1,1},yi=-1表示非液化地基,yi=1表示可液化地基。

上述的步骤实现过程都是在计算机内存的操作下完成,而不是人为活动或智力规则。

有益效果:以交叉验证的最大误差为优化对象,优化策略是逐个将属性删除,寻找能够使交叉验证最大误差最小的属性集合;能够有效降低模型分类准确率的波动,并提高了模型的可靠性,提高了模型的泛化能力,进一步推动了基于机器学习技术的地基液化势评价方法的实际应用。

附图说明

图1为本发明算法流程图;

图2为属性选择前后交叉验证准确率图;

图3为属性选择后分类器交叉验证auc图。

具体实施方式

下面结合附图和实施例对本发明作进一步说明:

如图1所示,

一种基于机器学习技术的场地地震液化势评价方法,包括如下步骤:

s1:开始;

s2:输入:包含有n个原因属性变量和1个标签变量的数据集合,交叉验证的折数k;

s3:定义:fn为全体属性集合,length-fn为fn中包括的属性个数,fi为fn的子集,且初始化:fi=fn;

s4:令i=0,转s5;

s5:当i不大于length-fn时,令length-fi为fi中包括的属性个数,同时令j=1,转s6;

若i大于length-fn时,直接到s12;

s6:令j=1,转s7;

s7:当j的数值不大于length-fn,同时i不等于0时,定义fj为fi中第j个属性,令fj=fi\fj;同时将数据集合分为k份,转s8;

当i等于0时,直接将数据集合分为k份,转s8;

当j的数值大于length-fn时,转s11;

s8:令s=1,转s9;

s9:反复判断s与k的大小,进行交叉验证;

交叉验证完成,有k个误差值,令errij为k个误差值中最大值,记录errij,同时判断i是否等于0,若等于0,令erri=errij,转s10,若i不等于0,令j=j+1,并返回s7;

s10:令i=i+1,返回s5;

s11:令令fi为erri对应的属性集合,判断erri是否大于或等于erri-1,

若是则输出fi-1,转s12;

若否则返回s10;

s12:结束。

进一步的,步骤s9当中交叉验证具体实施为:当s不大于k时,以fj为模型的属性集合,第s份数据用来评价分类器,其他k-1份被用来训练分类器;同时将s+1的值赋值给新的s;能够对s与k的比较进行循环比较,可以快速进行交叉验证。

当s大于k时,交叉验证完成;

进一步的,在s1前进行数据预处理,对属性变量数据进行标准化,标准化计算公式如下:

利用上述公式,将属性变量数据映射到区间[0,1]。结果变量yi∈{-1,1},yi=-1表示非液化地基,yi=1表示可液化地基。

如图2所示,左侧为属性选择前,右侧为属性选择后,以支持向量机为分类器。采用本研究提出的方法得到的交叉验证准确率和为适用本研究提出的方法得到的交叉验证准确率如图2,属性选择前的属性包括土层深度(depth),测量圆锥阻力(qc),摩阻比(rf),有效竖向应力(σ'v),总竖向应力(σv),峰值地面水平加速度(αmax)和矩震级(mw),经过计算,得到属性集合为{depth,qc,rf,σ'v,αmax,mw}。

在10折交叉验证中,属性选择前的最大误差为0.1304,相应的准确率为0.8696;属性选择后最大误差为0.1053,相应的准确率为0.8947。同时,属性选择前有3次准确度为100%,属性选择后有5次准确度为100%.可见,经过属性选择后,分类器的计算准确率有明显的提高。属性选择前的交叉验证准确度的变异系数为0.04959;属性选择后的交叉验证准确度的变异系数为0.0478。经过属性选择后,分类器的准确度有所提高,泛化能力更好,计算准确率的离散性降低了,计算结果更加可靠。

如图3所示,auc>0.9时,表明分类器具有较好的区分性能,采用10折交叉验证,利用不同的数据训练分类器,并得到10个auc值,如图3所示,全部auc值均大于0.9,说明经过选择后的数据可以训练出具有较好性能的分类器,机器学习实践中分类器常用的评价指标就是auc,即auc(areaundercurve):roc曲线下的面积,介于0.1和1之间。auc作为数值可以直观的评价分类器的好坏,值越大越好。

综述所述,本案使用的数据集包括了226条数据,其中133条为液化,其他93条为非液化。这些数据是通过圆锥触探试验(简称cpt),从6场地震中的52个地点采集到的,土壤类型包括砂土、粉砂土和粉土。本研究提出的方法能够有效降低模型分类准确率的波动,并提高了模型的可靠性,提高了模型的泛化能力,进一步推动了基于机器学习技术的地基液化势评价方法的实际应用。

以上所述仅为本发明的较佳实施例而已,并不以本发明为限制,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1