基于支持向量数据描述集成学习的齿轮故障识别方法与流程

文档序号:17549586发布日期:2019-04-30 18:10阅读:197来源:国知局
基于支持向量数据描述集成学习的齿轮故障识别方法与流程

本发明属于故障识别领域,具体地说,是一种基于支持向量数据描述集成学习的齿轮故障识别方法。



背景技术:

支持向量数据描述是一种在支持向量机基础上发展起来的一种单分类方法。其基本思想是把要描述的个体作为一个整体,建立一个封闭空间,将描述的个体尽可能多的包含在封闭空间内部,而不在描述个体范围的非目标个体则不能被包含在封闭空间内部。目前常用的故障识别方法如支持向量机和神经网络,均是建立在大量训练样本的映射分布的基础上,因此分类结果具有一定的随机性。



技术实现要素:

本发明公开了一种基于支持向量数据描述集成学习的齿轮故障多分类识别方法。本发明利用支持向量数据描述方法的单分类特性,通过数据训练的方式可训练出对应的齿轮故障单分类器,并以超球体分类半径作为描述齿轮故障类别的指标;再运用集成学习的方法,以加权平均求和为集成规则,将一定数量的支持向量数据描述齿轮故障分类器集成为齿轮故障多分类学习器,从而实现齿轮故障类别的辨识。

实现本发明目的的技术方案如下:一种基于支持向量数据描述集成学习的齿轮故障识别方法,包括以下步骤:

步骤一,构建支持向量数据描述齿轮故障分类器。

步骤二,采用自助采样法构建t个含m个齿轮故障特征训练样本的特征训练集,分别训练出t个支持向量数据描述齿轮故障分类器。

步骤三,通过加权求和的规则将t个支持向量数据描述齿轮故障分类器集成在一起,即可实现齿轮故障类别辨识的目标。

本发明与现有技术相比,其显著优点为:通过单分类方法的支持向量数据描述齿轮故障分类器的集成,可实现对齿轮故障类别辨识的目标。

附图说明

图1为本发明的样本采样示意图。

图2为本发明的分类器训练示意图。

图3为本发明的分类器集成示意图。

图4为本发明的分类识别示意图。

图5为本发明基于支持向量数据描述集成学习的齿轮故障识别方法的技术原理框架图。

具体实施方式

本发明的技术方案可以概括为:

步骤一:构建支持向量数据描述齿轮故障分类器。

引入核函数的方法构建构建支持向量数据描述齿轮故障分类器。

步骤二:齿轮故障特征训练样本集构建,支持向量数据描述齿轮故障分类器训练

采用自助采样法构建t个含m个齿轮故障特征样本的训练集。

通过一个齿轮故障特征训练集训练一个样本分类器的方法,训练出t个支持向量数据描述齿轮故障分类器,并利用齿轮故障特征样本集除去单个特征训练集后的剩余特征样本数据来测试支持向量数据描述齿轮故障分类器的分类性能。

步骤三:支持向量数据描述齿轮故障分类器集成

利用加权求和的方式将t个支持向量数据描述齿轮故障分类器集成在一起形成支持向量数据描述齿轮故障类型辨识器。

下面结合附图对本发明作进一步说明。

步骤一:构建支持向量数据描述齿轮故障分类器

假定有n个齿轮故障特征样本点xi,i=1,2,….,n,存在一个超球体将所有的样本点包含在超球体内部,其中心为o半径为r,则超球体内的所有特征样本点距离球体中心o的距离满足

l(xi,o)=||xi-o||2≤r2(1)

r为保证超球体内部全部为目标特征样本点的最大半径;

以上条件为标准超球体条件下的距离约束规则,对每一个目标点添加一个冗余度εi,即上述约束条件变更为

l(xi,o)=||xi-o||2≤r2+εi(2)

使每一个点到超球体中心的距离满足如下条件:

使得超球体最小;

对于一个齿轮故障特征样本群,其特征个体数n确定不变,则上述约束规则更变为:

minl(x,o)=r2+c∑εi(4)

c为常数,其约束条件为(2)式,根据拉格朗日乘子算法,得到上式问题的拉格朗日函数:

l(xi,o,εi,r,α,β)=r2+c∑εi-∑αi(r2+εi-||xi-o||2)-∑βiεi(5)

根据其对各变量的偏导数为零,可知:

同时

将(6)式代入(5)式可得:

l(xi,o,εi,r,α,β)=∑αi||xi-o||2(7)

即l(xi,o,εi,r,α,β)=∑αi(xi·xi)-∑αiαj(xi·xj)

要确保(4)式取最小值,则(5)式中αi(r2+εi-||xi-o||2)≥0且越大越好;

因此有||xi-o||2≥r2时,总有αi=0;||xi-o||2<r2时,位于超球体内部;||xi-o||2=r2时,均成立,且位于超球体表面,该向量称为支撑向量;

根据支持向量xk得出超球体半径

r2=(xk·xk)-2∑αi(xi·xk)+∑αiαj(xi·xj)(8)

任意一齿轮故障特征样本,均可通过计算其道超球体中心o的距离来判断其是否位于超球体内;

当齿轮故障特征样本点在样本空间内无法进行线性区分时,需要将特征样本点映射进高维空间,即其拉格朗日函数就变为

l(xi,o,εi,r,α,β)=∑αi(φ(xi)·φ(xi))-∑αiαj(φ(xi)·φ(xj))(9)

其映射关系只出现在内积运算中,将内积运算定义为一个核函数,即

κ(xi,xj)=φ(xi)·φ(xj)(10)

则拉格朗日函数变为

l(xi,o,εi,r,α,β)=∑αiκ(xi,xi)-∑αiαjκ(xi,xj)(11)

要确保(4)式取最小值,则(5)式中αi(r2+εi-||xi-o||2)≥0且越大越好因此有||xi-o||2≥r2时,总有αi=0;||xi-o||2<r2时,位于超球体内部;||xi-o||2=r2时,均成立,且位于超球体表面,该向量称为支撑向量。

根据支持向量xk就可以得出超球体半径

r2=(xk·xk)-2∑αi(xi·xk)+∑αiαj(xi·xj)(12)

任意一样本xz,均可通过计算其道超球体中心o的距离来判断其是否位于超球体内。

步骤二:训练样本集构建,个体分类器训练

如图1所示,某齿轮特征样本集中共计包含n个齿轮故障特征样本点,进行不放回采样m个特征值,采样结束后将采样的特征样本作为一个特征训练集;重复上述过程t次,即可得到t个特征训练集。

如图2所示为支持向量数据描述齿轮故障分类器的训练过程,每一个特征训练集对应训练一个支持向量数据描述齿轮故障分类器;假定齿轮故障类别数为p,则对应不同故障类别共计有p个原始特征样本集,每一特征样本集重复步骤二中的数据采样过程,分别获得t1,t2,….,tp个训练集,且t1=t2=…=tp。每一个特征训练集训练一个支持向量数据描述齿轮故障分类器,并利用特征样本i中除去当前特征训练集的数据作为对应支持向量数据描述齿轮故障分类器的特征测试集,以测试其分类效果,并获得每一种齿轮故障类型特征群体对应的超球体半径r1,r2,…,rp。

步骤三:支持向量数据描述齿轮故障分类器集成

假定有一个齿轮故障特征样本群m需要通过基于支持向量数据描述集成学习的齿轮故障分类器进行故障类型识别,则先通过关联分析计算该特征样本群与原特征样本群体的采样训练集之间的关联度wm1,wm2,…,wmt,将其作为支持向量数据描述齿轮故障分类器集成的权重,然后将测试特征样本群m逐一通过个体分类器进行计算,可得到其距各特征样本中心的无量纲距离rm1,rm2,…,rmt,通过加权求和即可得到其对应的无量纲距离值rm,其计算过程如下:

rm=wm1rm1+wm2rm2+…+wmtrmt

通过rm与各样本群体的超球体半径r1,r2,…,rp进行比对,即可判断其所属的类别。

本发明通过集成学习的方式将个体支持向量数据描述分类器进行加权集成,可有效的降低分类结果的随机性,在小样本量的训练基础上仍能得到较高的准确率。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1