计及多分类目标的风电机组轴承机械故障诊断方法与流程

文档序号:14735105发布日期:2018-06-19 20:19阅读:136来源:国知局
计及多分类目标的风电机组轴承机械故障诊断方法与流程



背景技术:

轴承作为旋转机械的关键部件,其故障影响包括风力发电机等多类电气设备的可靠运行。风电机组机械传动系统的齿轮箱、桨叶等非轴承故障多是由轴承故障引起的,且其他机械设备故障也是如此。因此,对轴承状态监测技术和故障诊断方法的研究具有重要意义。现有的轴承故障诊断过程主要包括特征提取和故障分类两个步骤。

常用的信号处理方法有经验模态分解、小波分解、集合经验模态分解和局域均值分解等。以上方法虽取得了不错的效果,但仍存在不足之处。小波分解不是自适应的信号处理方法,且在小波基和分解尺度的选定上需要做进一步的研究;采用经验模态分解和局域均值分解进行故障特征提取已得到广泛关注,但分解过程中存在模态混叠、端点效应、对频率相近的分量无法正确分离等问题;集合经验模态分解虽然通过加入白噪声对模态混叠现象进行了抑制,但该方法也增加了运算量,并且会分解出超出信号真实组成的多个分量。因此,找到一种合适的信号分解方法对于特征提取乃至整个故障诊断过程是非常必要的。经验小波变换是结合经验模态分解的自适应性和小波分析的理论框架提出的一种信号分解方法,已被证明具有自适应性好,分解结果更稳定,计算量小,分解速度更快等优势,已初步应用于机械故障诊断领域。

现有方法在特征提取方面已经积累了可用于轴承故障诊断的大量特征,因此可以提取尽可能全面的、从各个方面反映故障特性的特征信息。提取丰富的特征虽然能增加故障识别信息,但会造成特征集维数过高,同时还可能引入冗余特征,严重地降低分类器性能,容易将训练样本中不包含的新故障程度或者新故障类型样本误识别为正常状态,故障识别准确率,影响故障诊断精度,增加故障诊断时间。因此,通过特征选择方法,有效地从高维数据中选择出最优特征子集,是有效提高故障诊断效率与准确率的关键。

在提取特征并进行特征选择之后,一般需要将特征向量输入分类器来实现故障类型的自动识别。有些方法仅仅通过观察振动谱中的频率峰值即故障特征频率来实现故障诊断。然而,轴承故障从早期异常到形成功能故障是一个逐渐劣化的过程。因此,在故障的早期,可能没有明显的故障特征频率,从而错过轴承维护的最佳时机。当在谱中出现明显的故障特征频率时,此时轴承可能已经处于非常严重的故障状态,从而面临重新更换零部件以及停机造成的损失,大大增加运营成本。因此,通过提取复杂特征,实现轴承故障诊断的多分类识别,仍是当今轴承故障领域的主流技术。现有的基于多分类器的故障诊断技术一般将历史故障数据作为训练数据来训练支持向量机、神经网络等,构建多分类故障诊断模型。这类方法对有丰富训练样本的故障类型具有较高的识别准确率。在缺乏故障训练数据时,支持向量机等多类分类器易将无训练故障样本误识别为错误的故障类型甚至正常状态,严重影响设备可靠性。因此在训练样本不充分的应用场景下,利用相对容易获得的正常样本来判断轴承等机械部件是否发生故障,具有较高的实用价值。



技术实现要素:

本发明的目的在于克服现有技术的不足,提供一种计及多分类目标的风电机组轴承机械故障诊断方法,具有科学合理,适应性强,实用价值高,能够准确识别故障的避免现有方法容易将训练样本中不包含的新故障程度或者新故障类型样本误识别为正常状态。

本发明的目的是通过以下技术手段实现的:一种计及多分类目标的风电机组轴承机械故障诊断方法,其特征在于能够有效降低模型复杂度且具有更好的状态监控能力与分类效果,对训练样本依赖程度低,及时发现无训练样本异常状况,克服了传统方法训练样本不平衡场景下,易将无训练样本故障程度或故障位置对应故障误识别为正常状态的缺陷,并提高了故障识别准确率,它包括以下步骤:

1)风电机组轴承振动信号采集

通过加速度传感器采集风电机组轴承正常状态信号、滚动体故障振动信号、内圈故障振动信号和外圈故障信号,并将上述信号由16通道的数据记录器记录,信号采样频率为12kHz,信号长度为4096个采样点;

2)风电机组轴承振动信号处理

为了提取有效的故障特征信息,并考虑到轴承振动信号的调制特性,将经验小波变换用于轴承故障诊断,首先,经验小波变换根据检测到的轴承振动信号傅里叶频谱的极大值来对区间进行分割,然后,基于分割区间构造一组正交滤波器组,从而将复杂的轴承振动信号分解为一系列的调幅-调频单分量成分,便于提取有效特征,

假定傅里叶频率范围[0,π]被分为W个连续的部分Λn=[ωn-1,ωn],ω0=0,ωW=π,经验小波变换将原始振动信号f(t)分解成n+1个固有模态函数fi(t)之和:

其中,t为采样点,fi(t)为本征模函数分量,i=0,1,…n,n=0,1,…W;

经验小波变换对信号的处理过程主要包括3步:首先,对原始信号进行快速傅里叶变换;然后,对原始信号的傅里叶频谱进行自适应分割;最后,在每个分割区间内,经验小波变换被定义为带通滤波器,

经验小波变换中,经验尺度函数和经验小波函数表达式如下:

式中:β(x)在[0,1]区间满足E阶任意函数,ωn表示不同分割区间的边界,ω在区间[0,π]内,n=0,1,…W,W傅里叶频谱分割区间个数,

经验小波变换通过自适应分割原始振动信号的傅里叶谱,构造正交小波滤波器组直接提取原始振动信号的固有模态,不需要进行多次迭代,分解得到的模态少且受模态混叠影响小,且不易出现虚假模态;

3)风电机组轴承振动信号特征提取

对风电机组轴承振动信号进行快速傅里叶变换后得到本征模函数分量,分别选择滚动体故障振动信号的本征模函数分量1~3(IMF1~IMF3)、本征模函数分量5、6(IMF5、IMF6),内圈故障振动信号的本征模函数分量1~5(IMF1~IMF5),外圈故障振动信号的本征模函数分量1(IMF1)、本征模函数分量3~6(IMF3~IMF6)以及正常状态信号的本征模函数分量1~5(IMF1~IMF5)作为有效分量进行特征提取,对原始信号及分解后各本征模函数分量提取18种时域特征以及4种频域特征,

时域特征包括时域幅值最大值pmax、最小值pmin、均值pmv、标准差pstd、绝对平均值paa、偏态值psv、峭度pkv、峰峰值pppv、方根幅值psra、均方根prms、峰值ppv、波形指标psf、峰值指标pcf、脉冲指标pif、裕度指标pmf、偏态指标pskf、变异系数pcv、峭度指标pkf,各时域特征计算公式如下,其中x(n)时域信号序列,n=1,2,...N,N为样本采样点数,

pmax=max(x(n)) (4)

pmin=min(x(n)) (5)

pppv=max(x(n))-min(x(n)) (11)

ppv=max(|x(n)|) (14)

频域特征包括平均频率pmf、均方根频率pfc、中心频率prmsf和根方差频率prvf。各特征计算公式如下,其中,y(k)表示信号x(n)的频谱,k=1,2…K;K是谱线数;fk是第k条谱线的频率值,

当滚动轴承元件发生故障时,振动信号在相同频带内信号能量会发生较大差别,能量分布在频带之间也会产生差异,而经验小波变换得到的本征模函数分量包含了各个频段的信息,此外,奇异值分解具有较好的稳定性,即当矩阵元素发生小的变动时,矩阵奇异值变化很小,同时矩阵奇异值还具有比例不变性和旋转不变性,因此,可用于分析轴承运行状态,为了更好地捕捉到隐藏在信号中的故障信息以及更好地描述轴承的故障特征,提取了每个本征模函数分量的能量特征和奇异值特征,最终,对原始振动信号及分解后本征模函数提取各类特征构成原始特征集合;

4)风电机组轴承振动信号特征选择

为了提高诊断系统的分类精度,减少分类时间,降低分类器复杂度,采用随机森林训练过程中获得的Gini重要度开展特征排序,并构建特征子集,以不同特征子集下重新构建的随机森林分类准确率为决策变量,开展序列前项选择对特征进行选择,Gini指数是一种节点不纯度的度量方式,假设S是含有s个样本的数据集,可分成n类,si表示第i类包含的样本数,i=1,2,…n,则集合S的Gini指数为:

其中,Pi=si/s,表示任意样本属于第i类的概率,当S中只包含一类时,其Gini指数为0;当S中所有类别均匀分布时,Gini指数取最大值,

随机森林使用某特征划分节点时,可将S分为m个子集Sj,j=1,2,…,m,则S的Gini指数为:

式中,sj为集合Sj中样本数,由(27)式可知,Ginisplit值越小,特征划分效果最好,在随机森林构建完成后,把同一个特征的所有Gini重要度进行线性叠加,并降序排序,可得到所有特征的Gini重要度排序,

参考序列前向搜索思想,在以完整原始特征集合训练随机森林得出不同轴承信号特征Gini重要度的前提下,结合不同特征子集随机森林分类准确率,开展特征前向搜索策略,首先,按照Gini特征重要度降序排序的顺序,将特征依次加入到候选特征集合中;每加入一个特征,候选特征集合作为输入向量重新训练一个随机森林分类器,并记录分类准确率;之后,重复以上过程直至所有特征都加入到候选特征集合中;最后综合考虑分类准确率和特征维度确定最优特征子集;

5)层次化混合分类器对断路器状态进行识别

首先通过只用正常样本训练的单类支持向量机分类器判断轴承机械状态,及时发现早期异常状况;若轴承机械状态被判断为故障,则通过经所有已知类型故障样本训练的随机森林判断该样本的类型,

单类支持向量机只使用容易获得的正常样本即可完成训练过程,对训练样本要求低,训练与决策速度快,抗噪性能好,假设{xl,l=1,2,…,n}为输入空间的训练样本集,n为样本个数,单类支持向量机可在高维特征空间找到一个由支持向量表示的决策超平面f(x)=<ω,x>-ρ,并通过该超平面将目标样本,即正常样本和原点,即故障样本以最大间隔隔开,同时要求尽可能少的目标样本位于原点一侧,为了允许训练样本中存在异常值,引入变量ξi来惩罚背离超平面的异常点,单类支持向量机的表达式为:

其中,v∈(0,1],称为误差限,用于控制训练过程中异常点占总样本数目的上界;ω为超平面法向量;ρ为边界系数;ξi为松弛变量,假设采用非线性映射ψ:x→ψ(x)将样本从输入空间映射到高维特征空间,引入核函数,可以得到与此问题相应的对偶形式:

其中,αi、αj表示拉格朗日乘子,xi,xj为输入空间样本,i=1,2,…n,j=1,2,…n,核函数K(xi,xj)=<ψ(xi),ψ(xj)>表示特征空间中ψ(xi)和ψ(xj)的内积,采用RBF高斯核函数,其形式为:

式中c为RBF高斯核函数的宽度参数,

对于任意待测轴承样本z,可能是正常状态样本,也可能是已知故障类型或者未知故障类型样本,通过(32)式解出αi之后即可得到用于判断轴承机械状态的决策方程:

其中,sgn为符号函数。通过决策方程可判断待测样本z是否为故障样本,

随机森林将决策树与集成学习结合,构成新型树形分类器集合:

{h(x,Θk),k=1,…} (32)

其中h(x,Θk)是由分类回归树算法生成的分类决策树元分类器;x是输入向量,k为元分类器个数;Θk是独立同分布的随机向量,随机森林在各决策树不同节点产生随机特征子集,并选择分类效果最好的特征作为分类特征,再汇总不同决策树的分类结论实现准确分类,

其分类流程为:

(Ι)从轴承原始训练数据集中,应用bootstrap重采样技术有放回地随机抽取L个新的自助样本集,并由此构建L棵决策树,每次未被抽取到的样本组成了L个袋外数据;

(Ⅱ)设原始特征个数为M,在每棵决策树的每个节点处随机选择mtry个特征,通过计算每个特征所含有的信息量,在mtry个特征中选择分类能力最强的特征作为该节点的分割特征,在现有研究多取

(III)对每棵决策树不做任何剪裁操作,使其最大限度地生长;

(IV)将生成的多棵决策树组成随机森林,并通过随机森林对新的样本进行分类,综合考虑每个决策树分类器的投票情况决定最优分类结果。

本发明提供的一种计及多分类目标的风电机组轴承机械故障诊断方法,它将单分类支持向量机(One-Class Support Vector Machine,OCSVM)与随机森林(Random Forest,RF)的层次化相结合,首先,通过经验小波变换将轴承振动信号分解为一系列的本征模函数(Intrinsic Mode Function,IMF)分量,并对包含主要故障信息的本征模函数分量及原始振动信号分别提取时域、频域以及时-频域特征值,构建全面的初始特征集合;其次,根据不同的分类目标采用随机森林分析初始特征集合中的每个特征的重要度,结合序列前向选择方法,以不同特征子集、不同分类目标下随机森林的分类准确率为依据,确定满足不同分类需要的最优特征子集;最后,根据其特征选择结果构建单类支持向量机-随机森林混合分类器,开展故障诊断:首先通过只用正常样本训练的单类支持向量机模型判断轴承机械状态,及时发现早期异常状况;若轴承机械状态被判断为故障,则通过经所有已知类型故障样本训练的随机森林模型判断该样本的类型。具有科学合理,适应性强,实用价值高,能够准确识别故障的避免现有方法容易将训练样本中不包含的新故障程度或者新故障类型样本误识别为正常状态。

附图说明

图1为风电机组轴承正常状态振动信号波形图;

图2为风电机组轴承驱动端滚动体故障振动信号波形图;

图3为风电机组轴承驱动端内圈故障振动信号波形图;

图4为风电机组轴承驱动端外圈故障振动信号波形图;

图5为风电机组轴承正常状态振动信号经验小波变换分解图;

图6为风电机组轴承驱动端滚动体振动信号经验小波变换分解图;

图7为风电机组轴承驱动端内圈故障振动信号经验小波变换分解图;

图8为为风电机组轴承驱动端外圈故障振动信号经验小波变换分解图;

图9为风电机组轴承振动信号特征分布图。

具体实施方式

本发明是一种计及多分类目标的风电机组轴承机械故障诊断方法,包括以下步骤:

2)风电机组轴承振动信号采集

通过加速度传感器采集风电机组轴承正常状态信号、滚动体故障振动信号、内圈故障振动信号和外圈故障信号,并将上述信号由16通道的数据记录器记录,信号采样频率为12kHz,信号长度为4096个采样点;

2)风电机组轴承振动信号处理

为了提取有效的故障特征信息,并考虑到轴承振动信号的调制特性,将经验小波变换用于轴承故障诊断,首先,经验小波变换根据检测到的轴承振动信号傅里叶频谱的极大值来对区间进行分割,然后,基于分割区间构造一组正交滤波器组,从而将复杂的轴承振动信号分解为一系列的调幅-调频单分量成分,便于提取有效特征,

假定傅里叶频率范围[0,π]被分为W个连续的部分Λn=[ωn-1,ωn],ω0=0,ωW=π,经验小波变换将原始振动信号f(t)分解成n+1个固有模态函数fi(t)之和:

其中,t为采样点,fi(t)为本征模函数分量,i=0,1,…n,n=0,1,…W;

经验小波变换对信号的处理过程主要包括3步:首先,对原始信号进行快速傅里叶变换;然后,对原始信号的傅里叶频谱进行自适应分割;最后,在每个分割区间内,经验小波变换被定义为带通滤波器,

经验小波变换中,经验尺度函数和经验小波函数表达式如下:

式中:β(x)在[0,1]区间满足E阶任意函数,ωn表示不同分割区间的边界,ω在区间[0,π]内,n=0,1,…W,W傅里叶频谱分割区间个数,

经验小波变换通过自适应分割原始振动信号的傅里叶谱,构造正交小波滤波器组直接提取原始振动信号的固有模态,不需要进行多次迭代,分解得到的模态少且受模态混叠影响小,且不易出现虚假模态;

3)风电机组轴承振动信号特征提取

对风电机组轴承振动信号进行快速傅里叶变换后得到本征模函数分量,分别选择滚动体故障振动信号的本征模函数分量1~3(IMF1~IMF3)、本征模函数分量5、6(IMF5、IMF6),内圈故障振动信号的本征模函数分量1~5(IMF1~IMF5),外圈故障振动信号的本征模函数分量1(IMF1)、本征模函数分量3~6(IMF3~IMF6)以及正常状态信号的本征模函数分量1~5(IMF1~IMF5)作为有效分量进行特征提取,对原始信号及分解后各本征模函数分量提取18种时域特征以及4种频域特征,

时域特征包括时域幅值最大值pmax、最小值pmin、均值pmv、标准差pstd、绝对平均值paa、偏态值psv、峭度pkv、峰峰值pppv、方根幅值psra、均方根prms、峰值ppv、波形指标psf、峰值指标pcf、脉冲指标pif、裕度指标pmf、偏态指标pskf、变异系数pcv、峭度指标pkf,各时域特征计算公式如下,其中x(n)时域信号序列,n=1,2,...N,N为样本采样点数,

pmax=max(x(n)) (4)

pmin=min(x(n)) (5)

pppv=max(x(n))-min(x(n)) (11)

ppv=max(|x(n)|) (14)

频域特征包括平均频率pmf、均方根频率pfc、中心频率prmsf和根方差频率prvf。各特征计算公式如下,其中,y(k)表示信号x(n)的频谱,k=1,2…K;K是谱线数;fk是第k条谱线的频率值,

当滚动轴承元件发生故障时,振动信号在相同频带内信号能量会发生较大差别,能量分布在频带之间也会产生差异,而经验小波变换得到的本征模函数分量包含了各个频段的信息,此外,奇异值分解具有较好的稳定性,即当矩阵元素发生小的变动时,矩阵奇异值变化很小,同时矩阵奇异值还具有比例不变性和旋转不变性,因此,可用于分析轴承运行状态,为了更好地捕捉到隐藏在信号中的故障信息以及更好地描述轴承的故障特征,提取了每个本征模函数分量的能量特征和奇异值特征,最终,对原始振动信号及分解后本征模函数提取各类特征构成原始特征集合;

4)风电机组轴承振动信号特征选择

为了提高诊断系统的分类精度,减少分类时间,降低分类器复杂度,采用随机森林训练过程中获得的Gini重要度开展特征排序,并构建特征子集,以不同特征子集下重新构建的随机森林分类准确率为决策变量,开展序列前项选择对特征进行选择,Gini指数是一种节点不纯度的度量方式,假设S是含有s个样本的数据集,可分成n类,si表示第i类包含的样本数,i=1,2,…n,则集合S的Gini指数为:

其中,Pi=si/s,表示任意样本属于第i类的概率,当S中只包含一类时,其Gini指数为0;当S中所有类别均匀分布时,Gini指数取最大值,

随机森林使用某特征划分节点时,可将S分为m个子集Sj,j=1,2,…,m,则S的Gini指数为:

式中,sj为集合Sj中样本数,由(27)式可知,Ginisplit值越小,特征划分效果最好,在随机森林构建完成后,把同一个特征的所有Gini重要度进行线性叠加,并降序排序,可得到所有特征的Gini重要度排序,

参考序列前向搜索思想,在以完整原始特征集合训练随机森林得出不同轴承信号特征Gini重要度的前提下,结合不同特征子集随机森林分类准确率,开展特征前向搜索策略,首先,按照Gini特征重要度降序排序的顺序,将特征依次加入到候选特征集合中;每加入一个特征,候选特征集合作为输入向量重新训练一个随机森林分类器,并记录分类准确率;之后,重复以上过程直至所有特征都加入到候选特征集合中;最后综合考虑分类准确率和特征维度确定最优特征子集;

5)层次化混合分类器对断路器状态进行识别

首先通过只用正常样本训练的单类支持向量机分类器判断轴承机械状态,及时发现早期异常状况;若轴承机械状态被判断为故障,则通过经所有已知类型故障样本训练的随机森林判断该样本的类型,

单类支持向量机只使用容易获得的正常样本即可完成训练过程,对训练样本要求低,训练与决策速度快,抗噪性能好,假设{xl,l=1,2,…,n}为输入空间的训练样本集,n为样本个数,单类支持向量机可在高维特征空间找到一个由支持向量表示的决策超平面f(x)=<ω,x>-ρ,并通过该超平面将目标样本,即正常样本和原点,即故障样本以最大间隔隔开,同时要求尽可能少的目标样本位于原点一侧,为了允许训练样本中存在异常值,引入变量ξi来惩罚背离超平面的异常点,单类支持向量机的表达式为:

其中,v∈(0,1],称为误差限,用于控制训练过程中异常点占总样本数目的上界;ω为超平面法向量;ρ为边界系数;ξi为松弛变量,假设采用非线性映射ψ:x→ψ(x)将样本从输入空间映射到高维特征空间,引入核函数,可以得到与此问题相应的对偶形式:

其中,αi、αj表示拉格朗日乘子,xi,xj为输入空间样本,i=1,2,…n,j=1,2,…n,核函数K(xi,xj)=<ψ(xi),ψ(xj)>表示特征空间中ψ(xi)和ψ(xj)的内积,采用RBF高斯核函数,其形式为:

式中c为RBF高斯核函数的宽度参数,

对于任意待测轴承样本z,可能是正常状态样本,也可能是已知故障类型或者未知故障类型样本,通过(32)式解出αi之后即可得到用于判断轴承机械状态的决策方程:

其中,sgn为符号函数。通过决策方程可判断待测样本z是否为故障样本,

随机森林将决策树与集成学习结合,构成新型树形分类器集合:

{h(x,Θk),k=1,…} (32)

其中h(x,Θk)是由分类回归树算法生成的分类决策树元分类器;x是输入向量,k为元分类器个数;Θk是独立同分布的随机向量,随机森林在各决策树不同节点产生随机特征子集,并选择分类效果最好的特征作为分类特征,再汇总不同决策树的分类结论实现准确分类,

其分类流程为:

(Ι)从轴承原始训练数据集中,应用bootstrap重采样技术有放回地随机抽取L个新的自助样本集,并由此构建L棵决策树,每次未被抽取到的样本组成了L个袋外数据;

(Ⅱ)设原始特征个数为M,在每棵决策树的每个节点处随机选择mtry个特征,通过计算每个特征所含有的信息量,在mtry个特征中选择分类能力最强的特征作为该节点的分割特征,在现有研究多取

(III)对每棵决策树不做任何剪裁操作,使其最大限度地生长;

(IV)将生成的多棵决策树组成随机森林,并通过随机森林对新的样本进行分类,综合考虑每个决策树分类器的投票情况决定最优分类结果。

下面结合附图和具体实施例对本发明做进一步描述。

(1)风电机组轴承振动信号采集

通过加速度传感器采集振动信号,使用磁性底座将传感器安放在电机壳体上,振动信号是由16通道的数据记录器记录,如图1-图4所示采集得到正常状态、驱动端轴承滚动体故障、内圈故障以及外圈故障4种风电机组轴承振动信号。

(2)风电机组轴承振动信号处理

经验小波变换根据检测采集得到的风电机组轴承振动信号傅里叶频谱的极大值来对区间进行分割,然后基于分割区间构造一组正交滤波器组,从而将复杂的轴承振动信号分解为一系列的调幅-调频单分量成分,便于提取有效特征。如图5-图8所示,经验小波变换分别将4种风电机组轴承振动信号分解为多组本征模函数。

(3)风电机组轴承振动信号特征提取

本实施例对风电机组轴承振动信号进行快速傅里叶变换后得到本征模函数分量,分别选择滚动体故障信号的本征模函数分量1~3(IMF1~IMF3)、本征模函数分量5、6(IMF5、IMF6),内圈故障信号的本征模函数分量1~5(IMF1~IMF5),外圈故障信号的本征模函数分量1(IMF1)、本征模函数分量3~6(IMF3~IMF6)以及正常信号的本征模函数分量1~5(IMF1~IMF5)作为有效分量进行特征提取。如图9所示,当取5个本征模函数时,对原始信号共提取44个特征,其中时域统计特征数量为18x2=36(F1-F36,为特征1到特征36),频域统计特征数目为4x2=8(F37-F44,为特征37到特征44),每个IMF分量所提时域和频域统计特征的分布与原始信号特征分布类似,时域特征数目为18x2=36,频域特征数目8,能量和奇异值特征各2个,从而构成含284维特征的特征向量。

(4)特征选择

本实施例中,将数据集随机地分为训练集、验证集和测试集三部分。训练集占整个数据集的60%,验证集和测试集各占20%。训练集用于构建随机森林分类模型并得到每一个特征的重要度,验证集用于评价模型的故障诊断能力并选出最优特征子集,测试集用于评估所选最优特征子集的性能。由步骤C中得到的特征向量构成的数据集输入随机森林,在随机森林完成训练后能够得到训练集中每一个特征的Gini重要度值。将特征按照重要度由高到低的顺序逐一添加到特征集合中,每增加一个特征,则用新的训练集重新训练随机森林,并记录在相应验证集上的分类准确率。最后选择分类正确率最高时对应的特征子集为最优特征子集。

(5)层次化混合分类器对风电机组状态进行识别

首先通过只用正常样本训练的单类支持向量机分类器判断轴承机械状态,及时发现早期异常状况;若轴承机械状态被判断为故障,则通过经所有已知类型故障样本训练的随机森林判断该样本的类型。可以解决传统方法容易将训练样本中不包含的新故障程度或者新故障类型样本误识别为正常状态的问题并提高故障识别准确率。

按上述算法,将滚动体故障、内圈故障、外圈故障3类作为识别目标,其中将100组滚动体故障作为训练样本缺失类型。在随机森林多分类器中,其中94组识别为滚动体故障,2组识别为其它故障,4组识别为正常状态,会将滚动体故障识别为其它故障类型或者正常状态;但是采用混合分类器时,其中98组识别为滚动体故障,2组识别为其它故障,利用单分类支持向量机对故障进行正常与故障的识别,防止误识别,然后采用随机森林进行故障识别,降低了对训练样本依赖度,对故障样本敏感度高,在保留随机森林高分类能力的同时,提高了分类器的状态监测能力,验证了本发明方法的有效性。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1