一种基于迁移学习的轴承故障诊断方法_2

文档序号:9545089阅读:来源:国知局
度与诊断正确率曲线;
[0056] 图6为本发明的不同数据量与故障部位诊断正确率曲线;
[0057] 图7为本发明的迀移学习与机器学习正确率比较曲线。
【具体实施方式】
[0058] 下面结合附图及具体实施例对本发明进行详细说明。
[0059] 参见图1,本发明的一种基于迀移学习的轴承故障诊断方法包括如下步骤:
[0060] 步骤A:对目标数据和辅助数据利用自相关奇异值分解(SVD)分别提取所包含故 障奇异值向量(即故障特征向量),并根据训练数据集T和测试数据集S的选取规则进行样 本集选取;
[0061] 步骤A中,目标数据来源为:目标环境下目标轴承对象的振动数据,辅助数据来源 为:非目标环境或非目标对象的振动数据;轴承系统的目标数据与辅助数据均为振动加速 度信号,轴承振动信号示例图如图2所示;辅助数据选择根据是:不同工况条件具有多数特 征相似性,只有少数特征具有差异性(如噪音);不同负载具有部分相似性(如非受力方向 特性);不同故障类别具有成因相似性(如摩擦,腐蚀等);不同故障部件具有频率特征等 相似性(如齿轮与轴承,轴与轴承等),故目标数据不易得时,则可利用较为易得的辅助数 据;目标振动数据与辅助振动数采集示意图如图3所示。
[0062] 步骤A中,自相关奇异值分解提取的奇异值向量f = (A1, λ2, . . .,λΜ)为IXM 维向量,其中A1, λ2,…,λΜ为向量元素且从大至小排列(λ λ 2>~λ Μ);由于不 同故障的振动信号存在差异,其奇异值向量也存在差异,如图4所示,不同故障直径(0_、 0. 178mm、0. 533mm)与不同故障部位(健康、滚珠故障、内圈故障、外圈故障)的奇异值向量 对数曲线,可见其具有明显差异性。
[0063] 步骤A中,训练数据集T和测试数据集S的样本选取规则为:
[0064] a)训练数据集 T = {Ta,TJ,
[0067] 其中,Ta为选取目标振动数据奇异值向量及其故障类别构成的样本集,f ^为选取 第i个样本的奇异值向量,为第i个样本对应的故障类别标识(整数值),η为选取样本 数,a为目标数据标识,i为目标数据计数器;T b为选取辅助振动数据奇异值向量及其故障 类别构成的样本集,f/为选取第j个样本的奇异值向量,.为第j个样本对应的故障类别 标识(整数值,且包含目标数据所有类型),m为选取样本数(一般η << m),b为辅助数据 标识,j为辅助数据计数器;选取辅助振动数据时,一般应包含目标数据所有故障类型。
[0068] b)测试数据集
其中,If:选取目标振动数据第k个样本 的奇异值向量(与选取不重复),q为选取样本数,k为目标数据计数器,迀移学习分类 器设计目的是使得在S上的分类错误率最小。
[0069] c)统计训练数据集T中目标和辅助数据的故障分布比例:
[0072] 其中,Pa为目标数据分类标识Jf的分布集,Pb为辅助数据分类标识的分布集, 於&为即单故障类型(故障标识id)在目标数据中所占比例,Pi为即单故障类型(故障标 识id)在辅助数据中所占比例,R为故障标识数,id为故障标识;由于所选辅助数据包含目 标数据所有故障类型,故可等于〇,而?^不等于〇。
[0073] 步骤B :定义目标和辅助数据之间归一化的可迀移度5"作为两者共性的量化标 准,并设定迀移阈值St作为能否迀移学习的评判,若S w> S t,则进入步骤C,若不符合则重 新选取辅助数据,并进入步骤A ;
[0074] 步骤B中,归一化的可迀移度Sw量化步骤如下:
[0075] a)查找Ta中故障标识为id的所有样本,数量为n ld,并构成数据集/?;查找Tb中故 障标识为id的所有样本,其数量为m ld,并构成数据集/?;并对』巧和$|进行元素均值化:
[0079] 其中S =以涵:为目标数据反映故障标识特征向量;/1。Pl:为辅助数据反映故 障标识特征向量;c为故障标识id的目标数据样本计数器,d为故障标识id的辅助数据样 本计数器,τ =1,2,...,M为奇异值向量元素计数器。
[0080] b)奇异值向量单故障相似度计算,利用向量夹角余弦值公式计算第id类故障奇 异值向量相似度Sld:

且越接近I,对标识为id的单故障而言,目标振动数据和辅助 振动数据的相似度越高,所选的辅助数据对迀移学习越有利;
[0083] 参见表1和表2 (表中,RPM :转/分,外圈6:00 :故障部位为轴承6:00方向(设负 载方向为6:00)):
[0084] 表1变转速试验单故障相似度列表
[0087] 表2变对象试验单故障相似度列表
[0088]
[0089] 表1和表2表明,变转速振动数据对轴承故障诊断的影响小于变对象振动数据的 影响(即前表的单故障相似度整体大于后表),这是由于来自不同对象的辅助与目标数据 共性较小;变转速对内圈故障的影响略大于其它故障类型,而变试验对象对各故障部位的 影响较为平均,是由于变转速的辅助与目标数据只对与转速相关的故障类型影响较大,而 变试验对象对所有故障类型产生影响;无论是变转速还是变试验对象,其影响均随着故障 直径的增大而增大,即呈正相关。
[0090] C)利用单故障相似度计算可迀移度Sw:不难理解,当辅助数据中与目标数据相似 度高的故障类别所占比例越多,辅助数据的可迀移度越高。
[0092] 其中,Sw G 且越接近1,可迀移度越高,反之越低。
[0093] 步骤B中,定义迀移阈值St,若Sw> S t,则所选辅助振动数据能帮助目标数据学习 (正迀移),若SwS S t,则引入辅助数据使得目标数据分类效果变差(负迀移),归一化的迀 移阈值St定义步骤如下:
[0094] a)利用传统机器学习(K最近邻分类,KNN算法)对定量目标振动数据进行故障诊 断,得到诊断错误率Ea;
[0095] b)在步骤a中定量目标振动数据引入更多的辅助数据,调整辅助数据故障分布比 例和数据来源,实施下述迀移学习算法进行故障诊断,当诊断错误率Eab= E 3时,记录此时 目标数据与辅助数据的可迀移度统计值,即迀移阈值St。
[0096] 参见表3 :
[0097] 表3迀移阈值StS计列表
[0098]
[0099] 学习性能(X):达到x倍目标数据机器学习性能
[0100] St统计列表说明:辅助数据较少时,诊断性能的提升需要与目标数据更大的相似 度,辅助数据较多时,阈值上升缓慢,更有助于S t选取。实施迀移学习之前,综合相似度S w 与St相比较,若SwS S t则导致负迀移,应重新选取辅助数据样本。
[0101] 步骤C :利用迀移学习基于权重调整的TrAdaBoost算法,迭代过程建立一种自动 权重调整机制,将能帮助学习的重要辅助数据权重增加,不能帮助学习的次要辅助数据权 重减小,最终辅助数据T b中的有用成分将帮助目标数据T Jl丨练,得到比传统机器学习更好 的诊断效果。
[0102] 步骤C中,基于权重调整的TrAdaBoost算法实施步骤如下:
[0103] a)设置数据集T作为训练样本,数据集S作为测试样本,总迭代次数为Ite ;
[0104] b)初始化权重向量
《其中,n、m为T中目标数据和 辅助数据个数,
为样本训练权重,Wt上标t为第t次迭代,(t = 1, 2, ···,Ite);初始化 Hedge 参数:
[0105] c)迭代(t = 1,2, · · ·,Ite):
[0106] c-Ι :归一化权重,
1为训练样本计数器;
[0107] c-2 :实施KNN机器学习算法,并得到测试集S上的分类器ht;
[0108] c-3 :计算分类器ht在数据集T a上的错误率:
其中 hjf?)为分类器对得到的学习标识,>f为的正确标识,sgn为符号函数;i为目标数 据计数器;
[0109] c-4 :根据迭代次数调整Hedge参数:β t= e t/(l_et),使得越后的迭代权重越大, 诊断结果越具价值。
[0110] c-5 :分配下一次迭代的权重,即增加 Ta的权重,减少分类错误的T b权重:
[0112] d)利用Ite/2至Ite次迭代结果得到测试集S诊断结果,并计算诊断正确率:
=1,2, 3, . . .,R,则=鉍即为轴承数据第
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1