基于PCA融合机器学习的剪力墙震损破坏模式预测方法

文档序号:32214421发布日期:2022-11-16 07:04阅读:152来源:国知局
基于PCA融合机器学习的剪力墙震损破坏模式预测方法
基于pca融合机器学习的剪力墙震损破坏模式预测方法
技术领域
1.本发明属于结构健康监测中结构损伤识别技术领域,尤其涉及基于主成分分析融合机器学习的剪力墙震损破坏模式预测方法。


背景技术:

2.在多高层建筑结构中,剪力墙作为主要的抗侧力构件,表现出良好的抗侧性能及建造效率,同时在往复荷载作用下也表现出复杂的破坏机理。在结构设计阶段剪力墙抗侧性能取得极大关注的同时,区域风险评估和震后建筑改造也吁求建立出剪力墙破坏模式的快速识别方法,以指导指定震前应急机制和组织震后评估救援。
3.然而由于缺乏鲁棒的基于经验和力学性能的识别模型,传统基于数值模拟和加载试验的破坏模式识别方法不再适用于快速识别的场景。近来随着机器学习算法的兴起以及数据开放获取程度提升,基于机器学习技术驱动的破坏模式识别取得了广泛关注,同时也取得了大量的研究进展。
4.本质上作为一个多类识别问题,通过机器学习分类模型(分类器)对剪力墙破坏模式进行预测,其预测效果极大程度依赖于构建数据集的特征提取。然而目前相关研究中,对于特征工程的选取大都依赖于对构建数据集参数的概念性组合,即通过挑选参数直接作为分类器的输入。由于缺乏对数据集高维特征的有效提取,一方面,对分类器的预测精度带来了极大的限值;另一方面,不同模型中所适用的参数类型也给模型的泛化性带来困难。


技术实现要素:

5.本发明的目的在于提出一种基于主成分分析融合机器学习的剪力墙震损破坏模式预测方法。该方法基于181组剪力墙试验资料进行数据汇编分析,构建出包含表征试件配筋信息、尺寸信息和加载信息的特征变量数据库,在此基础上提出一种基于主成分分析(principle component analysis,pca)的特征抽取方法,抽取的特征工程输入到9种典型分类器模型中进行训练,进而从中挑选出最优的分类器模型,最后该模型进行超参数优化,从而得到具有最佳参数组合的优化模型。本发明通过对构件试验数据资料的汇编分析,构建了墙震损敏感参数数据集,并对数据进行高维特征提取输入到分类器模型中进行训练,实现对剪力墙震损破坏模式的高精度快速识别。同时,由于模型训练所需特征工程的建立是通过pca实现而非直接基于数据集参数组合,因此模型的泛化性也得以提升。
6.作为相关研究领域内首次尝试利用pca进行特征提取,本发明实现了对剪力墙破坏模式的快速识别,与传统识别方法相比具有明显的精度优势,在相关工程领域中表现出极大的应用前景。
7.为实现本发明的目的,本发明通过以下技术方案实现:
8.一种基于pca融合机器学习的剪力墙震损破坏模式预测方法,其特征在于,通过对构件试验数据资料的汇编分析,构建了墙震损敏感参数数据集,并对数据进行pca高维特征提取,输入到分类器模型中进行训练,实现对剪力墙震损破坏模式的高精度快速识别。
9.一种基于pca融合机器学习的剪力墙震损破坏模式预测方法,其特征在于,包括以下步骤:
10.s1、收集相关数据资料,构建剪力墙在往复荷载作用下试件设计、反应参数及对应破坏模式的震损数据集s={x1,x2,...,x
10
,y},其中{x1,x2,...,x
10
}为定义的震损破坏模式敏感特征参数,分别为r,f
ck
,n,fy,as,f
yw
,ρw,f
sw

sw
和vf/v,对应参数具体含义如表1。y为剪力墙破坏模式,根据试件破坏形式按常规通用的paulay-priestley方法,将破坏模式划分为三种,即包括弯曲破坏(f),弯剪破坏(fs)和剪切破坏(s)三种破坏模式。
11.表1.剪力墙震损破坏模式敏感参数定义
[0012] 参数含义1r剪力墙高宽比2f
ck
混凝土抗压强度3n轴压比4fy约束区纵筋屈服强度5as约束区纵筋面积6f
yw
腹板纵筋屈服强度7ρw腹板纵筋配筋率8f
sw
腹板横向钢筋屈服强度9ρ
sw
腹板横向钢筋配筋率10vf/v剪应力比
[0013]
s2、对特征参数{x1,x2,...,x
10
}进行pca处理,主成分维度设置为10,即与敏感特征参数相同。将原参数转化为主成分空间内投影,如对于主成分pc1,
[0014]
pc1=ω1x1+ω2x2+...+ω
10
x
10
[0015]
其中w1为协方差矩阵∑的特征向量
[0016][0017]
将主成分系数矩阵w提取为特征工程作为输入,n为数据集样本数。
[0018]
s3、将提取的特征工程随机划分,70%作为训练集,剩余30%作为测试集,用于后续分类器模型进行训练测试。其中为了最大化利用构建数据集,在模型验证过程中采用cross-validation的方法,即通过对训练数据集进行重采样(不同采样比例和不同迭代步数)来定义验证集,从而无需单独划分验证集。
[0019]
同时,在模型训练输入前,对每个样本的主成分系数矩阵w进行归一化处理,归一化至[0,1]区间,即
[0020][0021]
式中,w.min和w.max分别为主成分系数矩阵每一行的最小值和最大值,w
std
为归一化后系数矩阵,用于模型训练输入。
[0022]
s4、引入9种典型机器学习算法进行分类器模型训练测试,包括bayes(朴素贝叶斯),nearest neighbors(临近算法),logistic regression(逻辑回归),svc(支持向量机),decision tree(决策树),random forest(随机森林),adaboost,gradient boosting
(梯度提升)和perceptron neural network(感知神经网络),从而构建出特征工程与破坏模式之间的映射关系。
[0023]
s5、测试不同分类器模型的预测精度μ1,进行模型评估,挑选出预测精度最高的分类器模型m0。
[0024][0025]
s6、对模型m0进行超参数优化,采用网格搜索法进行优化计算,获得具有最佳参数组合的优化模型m1。
[0026]
s7、给某一待预测破坏模式的剪力墙参数,按s2方法提取特征工程后输入到模型m1进行测试,即可输出预测的对应破坏模式。
[0027]
本发明未涉及之处适用于现有技术。
[0028]
本发明的有益效果为:通过搜集试验数据构建剪力墙破坏模式数据集,利用主成分分析提取数据集特征工程,其结果作为输入到机器学习分类器模型进行训练并挑选出精度最高的模型,最后通过对模型进行超参数优化得到具有最佳参数组合的优化模型,实现对剪力墙破坏模式的快速精准识别。
[0029]
作为相关研究领域内首次尝试利用pca进行特征提取,本发明通过对构建数据的高维特征提取,从而有效提高模型训练效果,实现对剪力墙破坏模式的高精度快速识别,与传统识别方法相比具有明显的精度优势,在相关工程领域中表现出极大的应用前景。同时,由于模型训练所需特征工程的建立是通过pca实现而非直接基于数据集参数组合,因此模型的泛化性也得以提升。
附图说明
[0030]
图1为本发明的总体流程图;
[0031]
图2为剪力墙常见破坏模式分类示意图;
[0032]
图3为主成分分析示意图;
[0033]
图4为引入的9种机器学习算法示意图;
[0034]
图5为本发明一实施例的模型预测混淆矩阵(测试集)。
[0035]
图6为本发明一实施例的优化模型混淆矩阵(测试集)。
具体实施方式
[0036]
以下结合附图对本发明的实施例做进一步详述。以剪力墙在往复荷载作用下的实验数据为例进行说明。
[0037]
本发明的设计思想为:通过搜集试验数据构建剪力墙破坏模式数据集,利用主成分分析提取数据集特征工程,其结果作为输入到机器学习分类器模型提升进行训练,最后通过对模型进行超参数优化得到优化模型,实现对剪力墙破坏模式的快速精准识别。
[0038]
基于主成分特征提取融合梯度提升的剪力墙破坏模式识别方法,如图1所示,包括以下步骤:
[0039]
s1、收集相关数据资料,构建剪力墙在往复荷载作用下试件设计、反应参数及对应破坏模式。本实施例构建数据集包括181组剪力墙试件数据,每组试件包括尺寸信息、配筋
信息及荷载信息共10个参数分别为r,f
ck
,n,fy,as,f
yw
,ρw,f
sw

sw
和vf/v,对应参数具体含义如表1。根据试件破坏形式(裂缝开展、纵屈服情况等)按常规三类别分类,即包括弯曲破坏(f),弯剪破坏(fs)和剪切破坏(s)三种破坏模式。图2给出了几种常见的破坏模式分类示意图,其中(a)为弯曲破坏,(b)为弯剪破坏,(c-e)统一划分为剪切破坏。
[0040]
s2、对数据集进行pca处理,其结果作为特征工程输入到后续分类器模型。为尽可能保留更多数据信息,主成分维度设定为10,即与数据集敏感特征参数维度一致,pca数据处理原理如图3。
[0041]
s3、将提取的特征工程随机划分为训练集和测试集。其中,70%用于模型训练,30%用于模型测试。
[0042]
s4、引入9种典型机器学习算法进行分类器模型训练测试,包括bayes(朴素贝叶斯),nearest neighbors(临近算法),logistic regression(逻辑回归),svc(支持向量机),decision tree(决策树),random forest(随机森林),adaboost,gradient boosting(梯度提升)和perceptron neural network(感知神经网络),如图4。从而构建出特征工程与破坏模式之间的映射关系。
[0043]
s5、测试不同分类器模型的预测精度μ1,进行模型评估,模型测试混淆矩阵如图5。挑选出预测精度最高的模型为随机森林和梯度提升模型。
[0044]
s6、采用网格搜索法对随机森林模型和梯度提升模型分别进行超参数优化,网格参数搜索如表2。获得具有最佳参数组合的优化模型,超参数优化结果如表3.
[0045]
表2.模型超参数优化参数搜索区间
[0046][0047][0048]
表3.模型超参数优化最佳参数组合
[0049][0050]
s7、将优化后的模型进行测试集测试,模型测试混淆矩阵如图6。计算得到梯度提升优化模型预测精度μ2=0.98,为最终预测模型。给某一待知破坏模式的剪力墙参数,按前述方法提取特征工程后输入到最终模型(优化梯度提升模型)进行测试,即可输出预测的对应破坏模式。
[0051]
以上实施例描述了本发明的基本原理、主要特征和技术路线,同时也显示本发明
在实现结构损伤识别的可行性和有效性。需要强调的是,本发明所述的实施例是说明性而非限定性的,并非因此限值本发明的专利范围,凡是由本领域技术人员根据本发明的技术方案直接或间接变化本发明的,均同理包括在本发明的专利保护范围之内。本发明要求保护范围由所附的权利要求书及其等效物界定。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1