含噪声标签有限数据驱动的变工况风机滚动轴承故障诊断方法与流程

文档序号:21085076发布日期:2020-06-12 16:50阅读:452来源:国知局
含噪声标签有限数据驱动的变工况风机滚动轴承故障诊断方法与流程

本发明涉及风机轴承故障诊断方法,具体地说,是一种含噪声标签有限数据驱动的变工况风机滚动轴承故障诊断方法,应用于风电机组轴承机械故障状态的在线诊断。



背景技术:

滚动轴承作为风机传动系统的核心支撑部件,持续受到交变冲击力和载荷作用影响,成为风机机械故障高发部位。由于风机轴承常工作于变工况下,而不同工况场景风机故障数据有限,导致缺少与待测工况下不同故障训练数据。此外,传统轴承故障诊断往往假设故障样本标签是正确的,但由于录入错误、缺乏有效信息等原因,实际工作中标签往往会发生错误,进而显著影响训练的效果与故障识别准确率。因此,根据已知工况下含噪声标签的有限故障数据对其他工况下未知标签风机轴承故障信号进行准确诊断对保障风电机组安全、可靠运行与风场经济性有重要的实际意义。风机轴承故障诊断多基于轴承振动信号开展,传统诊断过程分为特征提取与模式识别两个环节。

当轴承发生故障时,其振动信号各频带能量随之变化,因此,可通过提取振动信号各频带特征,识别轴承故障。传统特征提取通过时-频分析法解析信号能量在时域与频域的能量分布,提取相关时-频特征。常用时-频分析方法包括小波变换、经验模态分解与变分模态分解等。小波变换通过多分辨率时-频局部化,有效提取非线性暂态振动时-频信号特征;但在处理复杂振动信号时,需选择不同基函数才能获得最佳效果,且参数选取无统一标准。经验模态分解具有自适应信号处理能力,但存在端点效应和模态混叠等不足。变分模态分解是多分量信号自适应分解方法,在处理轴承滚动信号时具有良好的抗噪性能;但模态数需根据先验知识进行预估,如模态数选择不合理则易造成较大分解误差。现有特征提取方法虽取得较好的应用效果,但其过程耗时且过度依赖专家经验,影响风机轴承故障诊断的实时性。同时,变工况场景下风机轴承的振动特征不稳定,受标签噪声干扰大,进一步加大了特征提取的难度,降低了轴承故障识别准确率。

模式识别方法主要包括极限学习机、支持向量机、卷积神经网络等。极限学习机学习速度快、所需训练样本少,能够实现快速故障诊断,但稳定性相对较弱。支持向量机能够高效的解决高维非线性决策问题,但核参数和样本参数选择困难,且受故障样本影响显著。现有研究已在实验数据环境下,获得较好的故障诊断效果。但是,可用于分析风机轴承故障的精确标注的振动数据获取成本高、故障程度有限,而实测数据往往存在不同类型样本累计数据量不足导致的数据非平衡问题,导致现有轴承故障诊断方法在小样本非平衡含标签噪声数据驱动的变工况场景下识别准确率有限,甚至存在状态误识别问题。

卷积神经网络等深度学习方法可通过原始故障数据进行网络层间学习,建立故障样本和故障类别之间的映射关系,实现故障特征自提取,从而将待测数据样本输送至已训练好的网络进行故障判定。但其训练过程需要海量精确标注的数据为支撑,而实际上故障数据获取困难、成本高同时故障数据存在噪声标签。目前,有限数据驱动下故障诊断的两种研究思路:一是利用先验知识建立预测模型,但多数情况下,小样本数据的先验知识不够明确,应用效果难以保证。二是扩充数据样本,将小样本问题转化为大样本问题进行处理,其中,基于生成对抗网络针对性生成轴承故障样本数据拟合真实样本分布,已成为目前的重要研究方向,但仍然难以避免噪声标签负面影响。

在监督学习中,针对数据含噪声标签的处理方法主要有鲁棒性建模方法和基于模型预测的过滤方法。前者主要通过鲁棒性损失、重要性加权及决策树的划分准则等方式来实现模型的标签噪声鲁棒性。后者主要通过模型预测的方法对噪声数据进行检测并移除,以达到降低噪声数据对模型影响的目的。然而,基于模型预测的噪声数据过滤方法易出现过度过滤现象,即将非噪声数据去除,导致数据利用率降低,影响预测模型的泛化能力;其次,建立噪声预测模型所使用到的数据本身含有标签噪声,使得模型预测可靠性不强。基于鲁棒性建模方法在监督学习中对于标签噪声虽然不能完全鲁棒,但其不直接处理噪声,通过合理构建鲁棒性模型仍能大大降标签低噪声所带来的影响,具有更强的适用性。



技术实现要素:

本发明的目的在于克服现有技术的不足,提供一种科学合理,适应性强,实用价值高,能够在含噪声标签干扰、样本数量不足及不同类型样本训练集规模非平衡,且复杂的变工况场景下,具有较好故障识别准确率的含噪声标签有限数据驱动的变工况风机滚动轴承故障诊断方法。

本发明的目的是通过以下技术手段实现的:一种含噪声标签有限数据驱动的变工况风机滚动轴承故障诊断方法,其特征是,它包括以下步骤:

1)风电机组轴承振动信号采集

针对风电机组滚动轴承,通过加速度传感器采集轴承运行状态中的振动信号,采样频率为12khz,采集的风电机组轴承正常状态信号、滚动体故障振动信号、内圈故障振动信号和外圈故障信号由16通道的数据记录器记录,根据轴承的带负载及转速情况将运行工况进行分类,并且记录风电机组在不同运行工况条件下的轴承振动信号;

2)改进rac-gan模型构建

带标签辅助分类器的辅助分类生成对抗网络(auxiliaryclassifiergenerativeadversarialnetworks,ac-gan),在生成对抗网络(generativeadversarialnetworks,gan)的基础上增加了噪声标签和多分类功能,能够根据标签生成指定类型样本,或利用其判别器(discriminator,d)直接实现样本多分类;ac-gan中,生成器(generator,g)在输入端同时输入随机噪声信号z及生成样本对应类标签c,并利用z和c生成对应类别样本xfake=g(c,z);判别器d同时输出样本x来源于真实样本xreal及生成样本xfake的概率p(s|x)和属于不同类别的概率p(c|x),即为:

[p(s|x),p(c|x)]=d(x)(1)

其中s为样本来源,其有两种可能:真实(real)、生成(fake),c=c,c∈{1,2,…,n},n表示样本类数;ac-gan中,生成器g目标函数为最大化lc-ls,判别器d目标函数为最大化lc+ls,ls与lc与定义为:

其中,ls为正确源损失函数,衡量判别数据来源于真实样本的正确性;lc为正确类损失函数,衡量输出类别的正确性;ac-gan通过内部博弈,最终实现有效生成与识别多类样本,为解决在含噪声标签有限数据驱动的变工况场景下,风机轴承故障诊断准确率不足问题,并提高轴承故障信号泛化特征提取效果,满足强鲁棒性分类需求,提出改进的强鲁棒性辅助分类生成对抗网络(robustauxiliaryclassifiergenerativeadversarialnetworks,rac-gan)模型;在生成器输入端引入数据编码器,不直接用随机噪声信号,而是使模型根据真实轴承故障数据预先学习浅层故障特征,得到随机噪声输入,然后再输入生成器,使生成器针对性生成大量符合真实样本概率分布特性的多分类故障类型数据;其次,考虑标签噪声重定义损失函数,并引入噪声过渡模型,同时加入正则化互信息,使判别器d在含噪声标签有限数据不同工况场景下进行故障识别时均具有良好的性能;在rac-gan判别器引入minibatchdiscrimination,实现生成数据与真实数据的差异性批量比较,保证生成数据质量,防止过拟合导致生成重复数据,以此提高模型的鲁棒性;此外,通过权值共享,卷积层减少模型训练参数,提高训练效率;同时,以卷积核对故障样本进行区域动态特征提取,能提取出更多细节特征,从而提高判别器d故障诊断能力;

由于标签噪声的影响,真实故障样本的实际类别可能被误识别,为提高新模型标签噪声鲁棒性,在判别器d中引入噪声过渡模型并重定义损失函数,将真实故障样本实际类别标签定义为不带噪声的样本标签将真实故障样本被错误标记的标签定义为带噪声的样本标签如真实故障样本类别为第i类、则其可能被误标记为第j类的概率称为噪声过渡概率ti,j:

由此,噪声过渡模型t定义如下

t=(ti,j),t∈[0,1]n×n且(∑iti,j=1)(4)

在此基础上,定义辅助分类损失函数代替原ac-gan中的正确类损失函数lc,以提高判别器d抗噪能力;定义为:

式(5)中,xr表示真实故障样本,表示将真实故障样本判别为带噪声的样本标签的概率,表示将真实故障样本判别为不带噪声的样本标签的概率,损失函数代替原rac-gan中的正确源损失函数ls,如下:

式(6)中,改进rac-gan通过优化生成器生成无噪声的故障样本,为在生成器g的输入端加入的不带噪声的故障样本类别标签,基于重定义损失函数构建的改进rac-gan的目标函数,在博弈优化过程中向降低标签噪声导致故障误识别概率方向开展优化,提高了判别器d的鲁棒性;

3)改进rac-gan样本构建

根据轴承的带负载及转速情况将运行工况分为4种,设置滚动轴承同一运行工况的10类状态,其中,正常状态为第1类,按照不同故障位置,即滚动体,内圈和外圈,不同损伤直径故障程度,即轻微,中度和重度,将故障状态分为第2类至第10类,即类n为正常状态,类b1为滚动体轻微故障,类b2滚动体中度故障,类b3滚动体重度故障,类i1为内圈轻微故障,类i2为内圈中度故障,类i3为内圈重度故障,类o1为外圈轻微故障,类o2为外圈中度故障,类o3为外圈重度故障;采用cwru数据集中12khz采样频率下的驱动端轴承故障数据,轴承类型为6205-2rsjemskf,转速分别为1730r/min、1772r/min、1750r/min、1797r/min;由于轴承旋转工作,其振动信号故障特征存在周期性,12khz的采样率意味着每秒采样12000个数据点,那么每运行一圈可以采样12000/(1797/60)~12000/(1730/60),共计400~416个点;为适应生成对抗神经网络结构,保证信息完整性和故障特征有效性,每个故障样本采用约两个旋转周期内784个采样点的振动信号构成,同时,为提高训练样本数量且保障样本差异性,训练样本通过每隔50个点重叠采样获取,为通过卷积层挖掘更多细节特征,将每个样本处理为28×28的二维矩阵,输入改进rac-gan的判别器d;

4)风电机组轴承振动信号样本生成

改进的rac-gan通过带标签约束的生成器,生成兼具真实性与差异性的“生成样本”,并采用ms(modescore)和fid(fréchetinceptiondistance)指标分析样本生成效果,评估改进rac-gan生成样本的多样性和真实性;训练初始阶段,fid值较大、ms值较小,生成样本真实性低、多样性小;随着训练的进行,fid值逐渐下降,ms逐渐增加,生成样本与真实样本的概率分布更加接近,且生成样本的多样性提高;采用三种统计量平均值mean、方差std和最大值max,分析生成样本和原始样本的概率统计特性,x(k)表示故障样本时间序列,平均值体现故障样本振动范围;方差体现故障样本离散程度;最大值体现故障样本振动幅值,并以pdf曲线展现生成数据集与真实数据集概率分布特性;

5)含噪声标签各场景下风电机组轴承故障诊断

(a)含噪声标签小样本场景下风电机组轴承故障诊断

原始的每个故障类型为含5%标签跨类噪声的2000个训练样本,采用训练样本减少的方式模拟小样本场景,分别随机减少每类原始故障训练样本的20%、40%、60%,构成不同规模训练样本集;将不同规模训练样本集输入判别器,判别器学习故障样本集的平均值mean、方差std和最大值max分布规律,通过与生成器的生成样本与真实样本不断比较分析平均值mean、方差std和最大值max分布规律,当生成样本集与真实样本集分布规律相似时,说明判别器学习到10类故障类型特征,最后在每个故障类型为400测试样本的测试集上测试不同训练样本数下新方法分类效果,通过受试者工作特征曲线(receiveroperatingcharacteristiccurve,roc)和混淆矩阵评估改进rac-gan分类性能,验证改进rac-gan在含噪声标签小样本场景下轴承机械故障诊断的有效性;

(b)含噪声标签非平衡场景下风电机组轴承故障诊断

在含噪声标签场景下,平衡类的故障样本数为每类2000,非平衡类故障类样本数为每类1000,分别构建非平衡类为类n,类b1,类i2和类o3的一类非平衡集,类i2与类o2,类b2与类o3的二类非平衡训练集,类n、类b3与类o3的三类非平衡集,由此构建多种非平衡训练集,仿真实际环境下可能存在的样本非平衡场景,并分别训练改进rac-gan模型;改进rac-gan在训练过程中通过生成器不断学习非平衡故障类型的内部平均值mean、最大值max和方差std概率分布规律,实现非平衡故障类自动填补,达到含噪声标签非平衡场景下的风电机组轴承故障诊断的目的;

(c)含不同比例噪声标签数据场景下风电机组轴承故障诊断

在不同噪声标签环境下验证改进rac-gan复杂噪声环境下故障诊断准确性,在有限的轴承故障数据基础上,即2000组训练样本数据,400组测试样本数据,随机对标签错位、误标操作进行更改,轴承故障数据标签标注得到标签错误率分别为2.5%、5%、10%、20%跨类标签噪声训练数据,对改进rac-gan模型在不同比例噪声标签数据场景下进行抗噪性训练,并使用抗噪性能良好的fid指标,量化改进rac-gan的抗噪性能;

(d)含噪声标签变工况场景下故障诊断

针对含噪声标签的变工况场景,引入最大均值差异(maximummeandiscrepancy,mmd)相关性指标分析各工况下数据集间的差异性,评估深度对抗网络变工况场景诊断的难度,分析噪声标签加入后对故障识别效果影响,并针对含噪声标签不同变工况场景开展诊断效果对比试验;分别选取有限的800组单工况故障数据集作为训练样本集,在工况a、工况b、工况c、工况d的工况数据集中各选取100组故障数据作为变工况测试数据集,使用fid、intrafid、gan-train及gan-test指标量化改进rac-gan的故障分类性能与抗噪声标签干扰能力,并在含5%跨类别噪声标签的不同工况滚动轴承振动信号数据集中添加不同程度的白噪声,以仿真验证复杂噪声及标签噪声环境,进一步研究改进rac-gan在含复杂噪声有限数据驱动的变工况场景下轴承故障诊断。

本发明的一种含噪声标签有限数据驱动的变工况风机滚动轴承故障诊断方法,解决了基于振动信号的变工况风机故障诊断存在的故障特征不稳定,且存在故障样本数据少、类型不平衡,历史数据中含有噪声标签,即错误标签等问题,其进一步的优点在于:

(1)将rac-gan引入风机轴承故障识别领域,实现了小样本非平衡场景下有效数据增强,提高了系统对非平衡故障类型识别能力;

(2)在生成器输入端引入数据自编码器,使输入随机噪声信号预先学习真实数据分布,得到浅层故障特征,从而,使生成器针对性生成大量符合真实样本概率分布特性的海量多类型故障数据,提高非平衡小样本故障数据场景下系统分类能力;

(3)考虑含噪声标签重定义损失函数,同时加入正则化互信息,提高含噪声标签有限数据复杂工况场景下判别器抗噪能力;

(4)在rac-gan判别器引入minibatchdiscrimination,实现生成数据与真实数据的差异性批量比较,保证生成数据质量,提高模型变工况场景的泛化能力;

(5)在高噪声标签干扰、样本数量不足及不同类型样本训练集规模非平衡等复杂变工况场景下该方法具有较好的故障识别准确率。具有科学合理,适应性强,实用价值高,可为风机研发、风电场运行维护、风机研究等相关人员提供参考。

附图说明

图1为改进强鲁棒性rac-gan模型结构图;

图2为训练与测试样本集合构建图;

图3为风机轴承正常状态训练样本二维展示图;

图4为生成器训练过程mmd与ms指标变化图;

图5为9种风机轴承故障状态训练样本二维展示图;

图6为含5%噪声标签场景某类故障生成样本与真实样本散点及概率分布图;

图7为含5%噪声标签场景训练样本减少改进rac-gan分类结果图;

图8为含5%噪声标签样本减少场景改进rac-gan误识别结果图;

图9为不同比例噪声标签下各算法抗噪模型精度指标图;

图10为含噪声场景各工况下每类故障误识别率图;

图11为复杂噪声有限数据驱动场景变工况故障诊断精度图。

具体实施方式

本发明的一种含噪声标签有限数据驱动的变工况风机滚动轴承故障诊断方法,包括以下步骤:

1)风电机组轴承振动信号采集

针对风电机组滚动轴承,通过加速度传感器采集轴承运行状态中的振动信号,采样频率为12khz,采集的风电机组轴承正常状态信号、滚动体故障振动信号、内圈故障振动信号和外圈故障信号由16通道的数据记录器记录,根据轴承的带负载及转速情况将运行工况进行分类,并且记录风电机组在不同运行工况条件下的轴承振动信号;

2)改进rac-gan模型构建

带标签辅助分类器的生成对抗网络ac-gan,在gan的基础上增加了噪声标签和多分类功能,能够根据标签生成指定类型样本,或利用其判别器d直接实现样本多分类;ac-gan中,生成器g在输入端同时输入随机噪声信号z及生成样本对应类标签c,并利用z和c生成对应类别样本xfake=g(c,z);判别器d同时输出样本x来源于真实样本xreal及生成样本xfake的概率p(s|x)和属于不同类别的概率p(c|x),即为:

[p(s|x),p(c|x)]=d(x)(1)

其中s为样本来源,其有两种可能:真实(real)、生成(fake),c=c,c∈{1,2,…,n},n表示样本类数;ac-gan中,生成器g目标函数为最大化lc-ls,判别器d目标函数为最大化lc+ls,ls与lc与定义为:

其中,ls为正确源损失函数,衡量判别数据来源于真实样本的正确性;lc为正确类损失函数,衡量输出类别的正确性;ac-gan通过内部博弈,最终实现有效生成与识别多类样本,为解决在含噪声标签有限数据驱动的变工况场景下,风机轴承故障诊断准确率不足问题,并提高轴承故障信号泛化特征提取效果,满足强鲁棒性分类需求,提出改进的强鲁棒性rac-gan模型;在生成器输入端引入数据编码器,不直接用随机噪声信号,而是使模型根据真实轴承故障数据预先学习浅层故障特征,得到随机噪声输入,然后再输入生成器,使生成器针对性生成大量符合真实样本概率分布特性的多分类故障类型数据;其次,考虑标签噪声重定义损失函数,并引入噪声过渡模型,同时加入正则化互信息,使判别器d在含噪声标签有限数据不同工况场景下进行故障识别时均具有良好的性能;在rac-gan判别器引入minibatchdiscrimination,实现生成数据与真实数据的差异性批量比较,保证生成数据质量,防止过拟合导致生成重复数据,以此提高模型的鲁棒性;此外,通过权值共享,卷积层减少模型训练参数,提高训练效率;同时,以卷积核对故障样本进行区域动态特征提取,能提取出更多细节特征,从而提高判别器d故障诊断能力;

由于标签噪声的影响,真实故障样本的实际类别可能被误识别,为提高新模型标签噪声鲁棒性,在判别器d中引入噪声过渡模型并重定义损失函数,将真实故障样本实际类别标签定义为不带噪声的样本标签将真实故障样本被错误标记的标签定义为带噪声的样本标签如真实故障样本类别为第i类、则其可能被误标记为第j类的概率称为噪声过渡概率ti,j:

由此,噪声过渡模型t定义如下

t=(ti,j),t∈[0,1]n×n且(σiti,j=1)(4)

在此基础上,定义辅助分类损失函数代替原ac-gan中的正确类损失函数lc,以提高判别器d抗噪能力;定义为:

式(5)中,xr表示真实故障样本,表示将真实故障样本判别为带噪声的样本标签的概率,表示将真实故障样本判别为不带噪声的样本标签的概率,损失函数代替原rac-gan中的正确源损失函数ls,如下:

式(6)中,改进rac-gan通过优化生成器生成无噪声的故障样本,为在生成器g的输入端加入的不带噪声的故障样本类别标签,基于重定义损失函数构建的改进rac-gan的目标函数,在博弈优化过程中向降低标签噪声导致故障误识别概率方向开展优化,提高了判别器d的鲁棒性;

3)改进rac-gan样本构建

根据轴承的带负载及转速情况将运行工况分为4种,设置滚动轴承同一运行工况的10类状态,其中,正常状态为第1类,按照不同故障位置,即滚动体,内圈和外圈,不同损伤直径故障程度,即轻微,中度和重度,将故障状态分为第2类至第10类,即类n为正常状态,类b1为滚动体轻微故障,类b2滚动体中度故障,类b3滚动体重度故障,类i1为内圈轻微故障,类i2为内圈中度故障,类i3为内圈重度故障,类o1为外圈轻微故障,类o2为外圈中度故障,类o3为外圈重度故障;采用cwru数据集中12khz采样频率下的驱动端轴承故障数据,轴承类型为6205-2rsjemskf,转速分别为1730r/min、1772r/min、1750r/min、1797r/min;由于轴承旋转工作,其振动信号故障特征存在周期性,12khz的采样率意味着每秒采样12000个数据点,那么每运行一圈可以采样12000/(1797/60)~12000/(1730/60),共计400~416个点;为适应生成对抗神经网络结构,保证信息完整性和故障特征有效性,每个故障样本采用约两个旋转周期内784个采样点的振动信号构成,同时,为提高训练样本数量且保障样本差异性,训练样本通过每隔50个点重叠采样获取,为通过卷积层挖掘更多细节特征,将每个样本处理为28×28的二维矩阵,输入改进rac-gan的判别器d;

4)改进rac-gan实施例样本构建

参照图1,实施例中,滚动轴承内环损伤直径分别为0.007,0.014,0.021inch,相同损伤程度包括4种不同负载、不同转速工况下滚动轴承振动信号数据。其中同一工况下,滚动轴承内环、滚动轴承外环、滚动体各有3类故障状态,另加正常状态共分为10类故障状态,详见表1。

表1轴承状态分类

实施例根据轴承的带负载及转速情况将运行工况分为4种(a、b、c、d),实验设置中包含10类滚动轴承故障状态的4种工况条件如表2所示。

表2风机轴承不同工况下故障状态

实施例采用cwru数据集中12khz采样频率下的驱动端轴承故障数据。轴承类型为6205-2rsjemskf,转速分别为1730r/min、1772r/min、1750r/min、1797r/min。由于轴承旋转工作,其振动信号故障特征存在周期性。经计算,轴承每运行一圈,采样系统约采样400~416个点。为适应生成对抗神经网络结构,保证信息完整性和故障特征有效性,每个故障样本采用约两个旋转周期内784个采样点的振动信号构成。同时,为提高训练样本数量且保障样本差异性,训练样本通过重叠采样获取。重叠采样可更全面的覆盖原始信号的特征信息,有助于提高原始训练样本的基础数量,提高生成对抗网络对原始信号的特征挖掘效果。同时,为避免采样间隔过大导致原始特征覆盖不完整,每隔50个点采样采集1个样本,判别器的训练与测试样本集合构建方式如图2所示。为通过卷积层挖掘更多细节特征,将每个样本处理为28×28的二维矩阵,输入改进rac-gan的判别器d。各故障状态下,改进rac-gan判别器正常训练样本及各类故障训练样本分别如图3、4所示。

实施例在有限的轴承故障数据基础上(2000组训练样本数据,400组测试样本数据),随机更改(标签错位、误标等操作)轴承故障数据标签标注得到标签错误率分别为2.5%、5%、10%、20%跨类标签噪声训练数据。不同标签噪声水平训练数据集如表3所示。

表3不同标签噪声水平训练数据集构建

5)风电机组轴承振动信号样本生成

单纯采用过采样等方法实现分类器增强,会增加数据集中样本间的相似性,导致训练后的分类器存在过拟合风险。改进的rac-gan通过带标签约束的生成器,生成兼具真实性与差异性的“生成样本”。现有生成器评估指标中,fid通过计算生成样本与真实样本在特征层(inceptionv3的featuremap层)之间的距离,判别生成样本是否失真,实现了对生成数据真实性和多样性的评估;ms通过“生成样本”与“真实样本”间边际标签分布kl散度距离评估样本差异性。fid值越小,越接近真实样本概率分布;ms值越大,差异性越高。

选择跨类噪声比例5%的训练数据集开展相关实验。在生成器训练中,每次迭代后,分别计算一次ac-gan及改进rac-gan生成样本与真实样本间fid和ms值,200次迭代后,fid和ms值变化趋势如图5所示。由图5可知,随迭代次数增加,fid值逐渐降低,ms的值逐渐增加,最终均达到了收敛。表明生成器生成样本与真实样本概率分布趋向一致且具有差异性,而改进rac-gan生成样本在此方面表现更优。由图5可知,在含5%跨类噪声标签场景,训练初始阶段,fid值较大、ms值较小,生成样本真实性低、多样性小。随着训练的进行,fid值逐渐下降,ms逐渐增加。相较于传统ac-gan,采用改进rac-gan得到较低的fid值和较高的ms值,表明其生成样本与真实样本的概率分布更加接近,且生成样本的多样性提高。采用如表4所示的三种统计量平均值、方差和最大值,分析生成样本和原始样本的概率统计特性。x(k)表示样本时间序列,平均值体现故障样本振动范围;方差体现故障样本离散程度;最大值体现故障样本振动幅值。

表4样本统计量

3种统计量的散点图与pdf分析如图6所示,在含相同比例噪声标签数据场景,相较于ac-gan,改进rac-gan生成样本和真实样本概率分布更加接近,且生成样本散点基本覆盖真实样本散点仅存在较少离群点。证明改进rac-gan生成样本更加接近真实故障样本概率分布且存在一定差异性,其具有较好的标签抗噪性能,满足博弈训练判别器所需生成样本多样性要求。相同噪声比例下,ac-gan生成数据比rac-gan生成数据均值、方差更大。可见生成阶段,rac-gan可有效避免噪声标签影响,可以生成更加接近真实故障样本概率分布的样本数据。

6)含噪声标签各场景下风电机组轴承故障诊断

(a)含噪声标签小样本场景下风电机组轴承故障诊断

以工况数据集a作为样本数据,分别随机减少改进rac-gan训练样本数20%、40%、60%,并在相同工况测试集上验证不同训练样本数下新方法分类效果。不同样本数训练集构建如表5所示。

表5不同样本数训练集构建

不同训练集下识别10类故障的roc曲线如图7所示。由图7可知,不同训练集合规模下,roc曲线下的面积差异较小。改进rac-gan在训练集减少比例达到60%的情况下,auc面积仍达到了99%以上,验证了改进rac-gan在小样本场景下轴承故障诊断有效性。由样本减小实验的macro-average值可见,所用模型在训练样本减少60%时仍具有较优的分类性能。

不同样本训练集下,各类故障识别效果如图8所示,同类故障的不同程度识别情况为小正方形所圈区域。如图可知,当故障训练样本减少时,故障识别准确率稍有减小。同时,滚动体故障识别难度较大。在含5%跨类别噪声标签场景,改进rac-gan在训练集减少比例达60%的情况下,各故障类型识别准确率仍达到86%以上,总体分类精度仍高于97.85%,且不存在将正常状态识别为故障状态的情况,也不存在将故障状态识别为正常情况且大部分误识别情况仅为故障程度误识别。

(b)含噪声标签非平衡场景下风电机组轴承故障诊断

在故障诊断中,部分故障类型危害大但发生机率小,造成此类故障样本缺乏,训练样本非平衡,难以挖掘内部规律,使之识别率低。当训练集非平衡时,改进rac-gan的生成器在训练时能自动填补非平衡类,有助于解决故障类别非平衡问题。实验采用多个不同非平衡程度训练集,仿真实际环境下可能存在的样本非平衡场景,并分别训练改进rac-gan,以验证新方法解决非平衡问题能力。以工况数据集a作为故障样本数据,训练样本非平衡程度如表6所示。其中,平衡类的样本数为每类2000,非平衡类样本数为每类1000。

表6含5%跨类别噪声标签非平衡程度设置

在含5%跨类别噪声标签不同非平衡程度数据场景下开展轴承故障诊断,实验结果如表7所示。从表7可知,在含噪声标签的不同非平衡数据驱动场景下,新方法仍有良好的准确率。其中,正常类n、故障类o1及故障类o2保持100%准确率。在平衡场景下,平均识别准确率达98.78%;单类非平衡场景下,平均识别准确率达98.55%;在2类非平衡场景下,平均识别准确率达98.42%;在3类非平衡场景下,平均识别准确率达98.00%。虽然部分故障类型的识别准确率略低于其他类别,但无将正常状态误识别为故障状态情况。

表7含噪声标签类别非平衡的场景下分类精度

(c)含不同比例噪声标签数据场景下风电机组轴承故障诊断

使用ac-gan和改进rac-gan在不同比例的跨类别噪声标签数据下开展轴承故障诊断实验,所得识别精度对比如表8所示。

表8不同噪声标签比例下轴承故障识别精度

由表8可知,随噪声标签比例的增加,模型的分类准确率会受到相应的影响,但仍有较好的识别效果。同时,改进rac-gan在含噪声标签场景下,分类性能均优于ac-gan分类模型。

使用抗噪性能良好的fid指标,量化改进rac-gan及ac-gan在有限数据驱动场景的抗噪性能。两种模型在不同比例跨类别噪声标签数据场景下,fid值变化如图9所示。由图9可见,随噪声标签比例增加,改进rac-gan在抗标签噪声方面优势显著。

(d)含噪声标签变工况场景下故障诊断

针对含噪声标签的变工况场景,引入最大均值差异(maximummeandiscrepancy,mmd)相关性指标分析各工况下数据集间的差异性,评估深度对抗网络变工况场景诊断的难度,分析噪声标签加入后对故障识别效果影响。各工况数据集间最大均值差异统计值如表9所示。表中测试工况数据集与训练工况数据集间的最大均值差异值越小,说明两种工况数据集之间的相似性越大。

由表9可知,工况a数据集、工况b数据集、工况c数据集与其他数据集之间具有较高的相似性,其中工况a数据集和工况c数据集相似性最高。而工况d数据集与其他数据集差异度较大且与工况a数据集差异度最大。

表9最大均值差异统计值表

在单工况数据集a中,选用800组各类的故障数据作为相同的训练集,在4种不同工况数据集中,分别选择100组作为测试集,分析在不同差异度的工况数据集间的故障识别效果。含5%噪声标签不同测试工况集故障识别效果如表10所示。

表10含5%跨类噪声标签不同测试工况测试集识别效果

结合表9和表10可知,在含噪声标签场景下,测试工况数据集与训练工况数据集间的差异度越小故障识别精度越高。同时,在工况数据集间差异度较大时,改进rac-gan仍具有较好的分类效果。分别选取有限的单工况数据集作为训练样本集,选择4种不同的工况故障数据构造相同的变工况测试样本集。其中,测试样本集中各不同工况数据样本量相同。变工况场景样本集构建及改进rac-gan在含噪声标签变工况场景的故障识别效果如表11所示。

表11含噪声标签变工况场景识别效果

如表11可知,改进rac-gan在含噪声标签的不同训练工况下的变工况场景故障识别精度存在一定差异。以工况数据集d为训练工况样本的变工况场景,故障识别难度较大,但本发明的方法仍具有较高的识别准确率。改进rac-gan在变工况场景下故障误识别效果如图10所示。由图10可知,在含噪声标签数据驱动的不同变工况场景,改进rac-gan未出现将正常状态识别为故障状态的情况,能够有效降低标签噪声的影响,其对各类故障类型仍具有较好的抗标签噪声性能及较高的分类能力。

在含不同比例噪声标签的变工况场景下,使用多种指标量化改进rac-gan与ac-gan的故障分类性能与抗噪声标签干扰能力。fid测量inception网络在含噪声场景真实样本和生成样本在特征层面之间的距离,较低的fid意味着较高的生成质量及生成多样性;intrafid用来计算每种故障类别的fid,用来评估条件生成的分布质量;gan-train是测试实验中对经生成样本训练分类器对真实样本进行评估的准确率,其近似于召回率tpr;gan-test是测试实验中对经真实样本训练分类器对生成样本进行评估的准确率,其值近似于分类准确率。分别针对与其他工况数据差异性较小的工况数据a训练的变工况场景和与其他工况均存在较大差异的工况数据d训练的变工况场景,以改进的rac-gan与传统ac-gan在两种变工况场景比较,故障识别效果相关指标如表12所示。

表12含不同比例跨类噪声标签变工况场景评估指标对比

由表12各种量化指标可知,改进rac-gan在含噪声标签数据驱动的变工况场景具有明显优势,且噪声比例增大时,改进rac-gan在抗噪性和分类精度的优势更加明显。

为进一步研究含故障数据噪声及标签噪声的复杂噪声干扰下,风机滚动轴承振动信号识别准确率的影响,通过在含5%跨类别噪声标签的不同工况滚动轴承振动信号数据集中添加不同程度的白噪声,以仿真验证复杂噪声及标签噪声环境下,改进rac-gan风机滚动轴承故障诊断效果。将训练完成的模型,分别以含白噪声且信噪比为25db、30db和35db的测试数据集验证模型的分类效果。复杂噪声有限数据驱动场景,变工况轴承故障诊断效果如图11所示。如图11可知,在信噪比最低的25db高噪声环境下,不同工况场景下平均识别准确率达92%以上;信噪比为30db和35db噪声环境下,故障的平均识别准确率均达到93%以上;在以数据集d训练,各种工况数据集测试的变工况场景下,故障分类难度较大,但改进rac-gan仍能达到92%的分类精度。可见,在含标签噪声及样本噪声的复杂噪声有限数据驱动的不同工况场景故障诊断场景下,新方法仍保持良好的变工况轴承故障准确率。

本发明的一种含噪声标签有限数据驱动的变工况风机滚动轴承故障诊断方法,能够解决基于振动信号的风机故障诊断存在的振动信号故障样本有限、故障样本类型非平衡、故障样本标签存在噪声、变工况下故障类型诊断准确率不足等问题,具有以下优点:

(1)将rac-gan引入风机轴承故障识别领域,实现了小样本非平衡场景下有效数据增强,提高了系统对非平衡故障类型识别能力。

(2)在输入端引入数据编码器,用深度神经网络学习含随机噪声输入真实数据概率特性后再输入生成器,提高了多分类场景下数据可靠生成能力。

(3)考虑标签噪声重定义损失函数,同时加入正则化互信息,提高含噪声标签有限数据复杂变工况场景下判别器抗噪能力。

(4)在判别器引入minibatchdiscrimination,实现生成数据与真实数据的差异性批量比较,保证生成数据质量,提高模型在含噪声标签变工况场景下故障诊断泛化能力。

本发明一种含噪声标签有限数据驱动的变工况风机滚动轴承故障诊断方法所涉及的加速度传感器、带标签辅助分类器、判别器、生成器等均为本领域常用器具。

本发明实施例中的计算条件、图表等仅用于对本发明作进一步的说明,并非穷举,并不构成对权利要求保护范围的限定,本领域技术人员根据本发明实施例获得的启示,不经过创造性劳动就能够想到其它实质上等同的替代,均在本发明保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1