一种基于迁移学习的轴承故障诊断方法_3

文档序号:9545089阅读:来源:国知局
k测试样本故障诊断结果。
[0114] 在每次迭代时,如果一个辅助训练样本被误分类,则权重乘在下 一轮迭代中,其对分类模型的影响要少一些。若干次迭代后,Tb中符合目标训练数据1\的 部分样本权重增大,不符合者权重会降低,最终Tb中的有用成分将帮助T 3训练并得到更好 的学习效果。
[0115] 参见图5和图6,实测中,辅助数据组合对1:1与1:5比例条件的目标振动数据进 行故障诊断,得到故障部位和故障直径的诊断结果,利用图5,计算综合相似度与诊断正确 率曲线的相关系数,分别为0. 8488和0. 9512,表明轴承故障的迀移学习分类结果与辅助数 据选取显著相关,辅助数据与目标数据共性越大,越有利于故障诊断。同时,在目标数据与 辅助数据比值为1:1的基础上再注入4倍辅助数据有助于增强学习效果。而且,故障部位 的学习条件比故障直径诊断更为苛刻,后者即使在可迀移度低于〇. 75时仍能保证100%的 正确率,故St应当按照前者选取;图6中,我们可以发现,目标数据与辅助数据比值为1:1时 迀移学习的诊断效果最差,比值增大时效果较好。考虑到迀移学习中辅助数据样本多于目 标数据样本,故本发明的效果优势体现在曲线前端。同时,目标数据量越多,诊断正确率越 高,100组数据的正确率平均比10组数据提升17. 19%,但学习数据越多,计算量越大,所需 时间越长,故两者应适中选取。
[0116] 参见图7,将传统基于机器学习(KNN算法)与本发明公布的基于迀移学习的轴承 故障诊断进行性能比较,可以发现:当目标数据量较大时,两者均能达到很好的性能;而当 目标数据量较小时,机器学习无法诊断,而迀移学习仍能保证85%以上的正确率,在10倍 标识数量(50组)时迀移学习较机器学习诊断性能提升12. 69%。同时,两者故障直径分类 性能均优于故障部位分类性能,说明迀移方法对不同诊断目标性能同时提升;就算法复杂 度而言,虽然基于TrAdaboost算法的迀移学习在KNN机器学习的基础上增添了权值调整, 带来额外计算量,但相比其性能的提升是可接受的,不过当轴承目标振动数据足够时,没有 采用迀移学习策略的必要性。以上所述仅是本发明的优选实施方式,应当指出:对于本技术 领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这 些改进和润饰也应视为本发明的保护范围。
【主权项】
1. 一种基于迀移学习的轴承故障诊断方法,其特征在于:包括如下步骤: 步骤A:对目标数据和辅助数据利用自相关奇异值分解分别提取所包含故障奇异值向 量,并根据训练数据集T和测试数据集S的选取规则进行样本集选取; 步骤B:定义目标和辅助数据之间归一化的可迀移度Sw作为两者共性的量化标准,并 设定迀移阈值St作为能否迀移学习的评判,若Sw>St,则进入步骤C,若不符合则重新选取 辅助数据,并进入步骤A; 步骤C:利用迀移学习基于权重调整的TrAdaBoost算法,迭代过程建立一种自动权重 调整机制,将能帮助学习的重要辅助数据权重增加,不能帮助学习的次要辅助数据权重减 小,最终辅助数据Tb中的有用成分将帮助目标数据1\训练,得到比传统机器学习更好的诊 断效果。2. 根据权利要求1所述的基于迀移学习的轴承故障诊断方法,其特征在于:步骤A中, 所述的目标数据来源为:目标环境下目标轴承对象的振动数据;所述的辅助数据来源为: 非目标环境或非目标对象的振动数据。3. 根据权利要求1所述的基于迀移学习的轴承故障诊断方法,其特征在于:步骤A中, 所述自相关奇异值分解提取的奇异值向量f=(λρλ2,...,λΜ)为1XM维向量,其中 入2,…,λΜ为向量兀素且从大至小排列(入入2>…〉入Μ)。4. 根据权利要求1所述的基于迀移学习的轴承故障诊断方法,其特征在于:步骤Α中, 训练数据集T和测试数据集S的样本选取规则如下: a) 训练数据集T= {Ta,Tb},其中,Ta为选取目标振动数据奇异值向量及其故障类别构成的样本集,f严为选取第i个样本的奇异值向量,为第i个样本对应的故障类别标识,其为整数值,η为选取样本数, a为目标数据标识,i为目标数据计数器; Tb为选取辅助振动数据奇异值向量及其故障类别构成的样本集,为选取第j个样本 的奇异值向量,、vf为第j个样本对应的故障类别标识,其为整数值,且包含目标数据所有类 型,m为选取样本数,且η<<m,b为辅助数据标识,j为辅助数据计数器; b) 测试数据集s' =[fjfhif= 其中,If选取目标振动数据第k个样本的奇异值向量,且与选取不重复,q为选取测 试样本数,k为测试数据计数器; c) 统计训练数据集T中目标和辅助数据的故障分布比例:其中,pa为目标数据分类标识yf的分布集,pb为辅助数据分类标识的分布集,Pi为 即单故障类型在目标数据中所占比例,9?为即单故障类型在辅助数据中所占比例,R为故 障标识数,id为故障标识。5. 根据权利要求1所述的基于迀移学习的轴承故障诊断方法,其特征在于:步骤B中, 所述的归一化的可迀移度Sw量化步骤如下: a) 查找Ta中故障标识为id的所有样本,数量为nld,并构成数据集^ :查找Tb中故障 标识为id的所有样本,其数量为mld,并构成数据集并对1?和1?进行元素均值化:其中β= 0?为目标数据反映故障标识特征向量;/1 =PII为辅助数据反映故障标 识特征向量;c为故障标识id的目标数据样本计数器,d为故障标识id的辅助数据样本计 数器,τ=1,2,...,Μ为奇异值向量元素计数器; b) 奇异值向量单故障相似度计算,利用向量夹角余弦值公式计算第id类故障奇异值 向量相似度Sld:c) 利用单故障相似度计算可迀移度Sw:不难理解,当辅助数据中与目标数据相似度高 的故障类别所占比例越多,辅助数据的可迀移度越高; 其中,心efMl,且越接近1,可迀移度越高,反之越低。6. 根据权利要求1所述的基于迀移学习的轴承故障诊断方法,其特征在于:步骤b中, 所述的归一化的迀移阈值st判定步骤如下: a) 利用传统机器学习对定量目标振动数据进行故障诊断,得到诊断错误率Ea; b) 在步骤a)中定量目标振动数据引入更多的辅助数据,调整辅助数据故障分布比例 和数据来源,实施下述迀移学习算法进行故障诊断,当诊断错误率Eab=E3时,记录此时目 标数据与辅助数据的可迀移度统计值,即迀移阈值St。7. 根据权利要求1所述的基于迀移学习的轴承故障诊断方法,其特征在于:步骤C中, 所述的基于权重调整的TrAdaBoost算法实施步骤如下: a) 设置数据集T作为训练样本,数据集S作为测试样本,总迭代次数为Ite; b) 初始化权重向其中,n、m为T中目标数据和辅助数据个数,嫩嫩 1+^为样本训练权重,矿上标t为第t次迭代,(t= 1,2,..., Ite);初始化Hedge参数c) 迭代(t= 1,2,…,Ite); d) 利用Ite/2至Ite次迭代结果得到测试集S诊断结果,并计算诊断正确率:id= 1,2, 3, . . .,R,则=鉍即为轴承数据第k测试样本故障诊断结果。8.根据权利要求7所述的基于迀移学习的轴承故障诊断方法,其特征在于:所述步骤 c)迭代(t= 1,2, . . .,Ite)的具体步骤为: c-1):归一化权重,P* =淡71'卩#<, 1为训练样本计数器;c-2):实施KNN机器学习算法,并得到测试集S上的分类器ht;c-3):计算分类器ht在数据集1\上的错误率: 为分类器对纪得到的学习标识,:Vf为的正确标识,sgn为符号函数;i为目标数据计数 器; c-4):根据迭代次数调整Hedge参数:βt=ey(l_et),使得越后的迭代权重越大,诊断 结果越具价值; c-5):分配下一次迭代的权重,即增加Ta的权重,减少分类错误的Tb权重:
【专利摘要】本发明公开了一种基于迁移学习的轴承故障诊断方法,包括:训练数据集和测试数据集的选取规则;辅助数据归一化的可迁移度量化与阈值选取方法;基于权重调整的TrAdaboost算法用于轴承故障分类的算法流程。本发明针对变工况、无法直接测量以及新故障类型等条件导致缺乏诊断通用性的问题,引入迁移学习中辅助数据帮助目标数据学习的思想策略。本发明方法不但提升了传统机器学习在少量目标数据的诊断精度,而且增强了轴承故障诊断的环境适应性,在变工况负载、新故障、间接测量下的轴承故障应用领域具有潜在的经济价值。
【IPC分类】G01M13/04
【公开号】CN105300693
【申请号】CN201510624168
【发明人】严如强, 沈飞
【申请人】东南大学
【公开日】2016年2月3日
【申请日】2015年9月25日
当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1