一种面向机电设备的智能故障诊断方法及系统与流程

文档序号:19788220发布日期:2020-01-24 13:53阅读:373来源:国知局
一种面向机电设备的智能故障诊断方法及系统与流程
本公开属于故障诊断
技术领域
,涉及一种面向机电设备的智能故障诊断方法及系统。
背景技术
:本部分的陈述仅仅是提供了与本公开相关的
背景技术
信息,不必然构成在先技术。现代工业中的机器损伤严重影响了工业物联网(industrialinternetofthings,iiot)的安全生产、工作效率和产品质量。利用振动信号或电流信号在事故发生前进行故障诊断,可以提高iiot在制造业和工业生产中的可信度。目前,人工神经网络(artificialneuralnetwork,ann)、支持向量机(supportvectormachine,svm)、极限学习机(extremelearningmachine,elm)等机器学习算法在智能故障诊断中得到了广泛的应用。据发明人了解,目前具有很多现有文献关于利用机器学习算法对工业机器进行损伤或故障判定,但这些方法大多是利用数据驱动的故障诊断方法,需要使用基于研究者经验的特征选择和一个有效的分类器,这意味着这些特征与分类器没有直接关系,分类的准确度和精度并不高。近年来,深度学习以其在图像分类、数据挖掘和语音识别等任务上的突出表现而备受关注。因此,许多基于深度学习的故障诊断工作应运而生。但据发明人了解,这些研究工作没有考虑训练数据与测试数据获取条件不一致的情况。在大多数情况下,训练和测试数据集的获取条件是一致的。但对于在不同工作环境下获得的测试数据,利用训练数据训练的模型可能具有较差的泛化性能。技术实现要素:本公开为了解决上述问题,提出了一种面向机电设备的智能故障诊断方法及系统,本公开充分考虑到训练数据与测试数据获取条件不一致的情况,进一步提高诊断的准确度。根据一些实施例,本公开采用如下技术方案:一种面向机电设备的智能故障诊断方法,包括以下步骤:获取目标机器的以往故障数据,构成训练数据;获取目标机器的实时采集数据,构成测试数据;构建域自适应网络模型,对网络模型进行训练,并将不同数据的输出进行标记,并最小化训练数据和测试数据之间的差异,并对训练数据的特征进行提取和分类;利用训练好的模型得到测试数据的伪标记,利用加权伪标记测试数据和原始训练数据,对整个网络模型进行至少一次的重训练;利用重训练后的模型对测试数据进行预测和分类,得到机器的故障诊断结果。本公开提供的技术方案,通过充分考虑到训练数据与测试数据获取条件不一致的情况,利用对训练样本和测试样本的特征输出分别标记,并最小化训练数据和测试数据之间的差异,保证了模型可适用的广泛性;同时,为了使用测试数据集预测结果中的有效信息,,将基于测试数据集预测结果和原训练数据集进行重训练,进一步优化域自适应网络模型,能够有效的提高分类的精度和准确性,提高诊断的准确度。作为可选择的实施方式,所述域自适应网络模型具体包括依次连接的特征提取网络、特征域自适应网络和分类网络。作为可选择的实施方式,所述特征提取网络的输入是分段的一维原始信号,特征提取网络的前两层卷积核长度大于10。机器轴承信号中的当前时刻数据可能与距离其较远的数据都有关系,因此,长卷积核比短卷积核能提供更有效的信息。通过特征提取网络的前两层卷积核长度大于设定值,能够保证特征提取的准确性和有效性。作为可选择的实施方式,所述特征域自适应网络被配置为对特征提取网络的输出进行标记,对训练样本和测试样本的特征输出分别标记为1和0,然后标记后的数据输入到两个全连接层中,以最小化训练数据和测试数据之间的差异。作为可选择的实施方式,最小化训练数据和测试数据之间的差异的具体过程为,使特征域自适应网络的损失函数,即训练数据和测试数据的输出之间的差值最小化。作为可选择的实施方式,分类网络的输入是特征提取网络的输出的训练数据集。作为可选择的实施方式,使用测试数据的预测结果来重新训练域自适应网络模型的具体过程包括,设测试数据的预测结果为其伪标签,即带有伪标签的测试数据,使用训练数据集和伪标记测试数据集重新训练域自适应网络,且在分类损失函数中引入样本权重。作为可选择的实施方式,重训练分类网络的交叉熵损失函数如下:其中y和表示训练数据的真实标签和预测输出,和是测试数据的伪标签和分类器预测输出,η和λ分别是训练数据和测试数据的损失函数权重,且η≥λ。作为可选择的实施方式,所述重训练过程循环使用,即基于当前重新训练的域自适应网络模型模型预测的测试数据分类结果作为下一次训练的输入。一种面向机电设备的智能故障诊断系统,包括:样本数据构建模块,被配置为获取目标机器的以往故障数据,构成训练数据;获取目标机器的实时采集数据,构成测试数据;网络模型构建模块,被配置为构建域自适应网络模型,对网络模型进行训练,并将不同数据的输出进行标记,并最小化训练数据和测试数据之间的差异,并对训练数据的特征进行提取和分类;重训练模块,被配置为利用训练好的模型得到测试数据的伪标记,利用加权伪标记测试数据和原始训练数据,对整个网络模型进行至少一次的重训练;结果输出模块,被配置为利用重训练后的模型对测试数据进行预测和分类,得到机器的故障诊断结果。一种计算机可读存储介质,其中存储有多条指令,所述指令适于由终端设备的处理器加载并执行所述的一种面向机电设备的智能故障诊断方法的步骤。一种终端设备,包括处理器和计算机可读存储介质,处理器用于实现各指令;计算机可读存储介质用于存储多条指令,所述指令适于由处理器加载并执行所述的一种面向机电设备的智能故障诊断方法的步骤。与现有技术相比,本公开的有益效果为:本公开将域自适应网络(domainadaptionnetwork,dan)应用于机器的故障诊断,同时,在构建dan模型时,以最小化不同领域特征之间的差异,同时训练基于标记训练数据的最优分类模型,具有很好的应用性。本公开提出了重训练策略,能够利用未标记测试数据的信息进一步提高诊断精度。附图说明构成本公开的一部分的说明书附图用来提供对本公开的进一步理解,本公开的示意性实施例及其说明用于解释本公开,并不构成对本公开的不当限定。图1是dan的结构和训练过程示意图;图2是基于dan训练模型预测测试数据的分类结果示意图;图3是dan-r的结构和训练过程示意图;图4是基于dan-r训练模型预测测试数据的分类结果示意图;图5是dan和dan-r在paderborn数据集上的第一个实验的分类结果比较示意图;图6是左列:t-sne给出的cwru的特征可视化结果;右列:混淆矩阵。(a)1772→1750;(b)1772→1730;(c)1750→1772;(d)1750→1730;(e)1730→1772;(f)1730→1750。图7是dan(左列)和dan-r(右列)的混淆矩阵比较:(a)a→b;(b)a→c;(c)b→a;(d)b→c;(e)c→a;(f)c→b。图8是paderborn数据集(表4)的t-sne图和混淆矩阵:(a)dan的t-sne结果;(b)dan-r的t-sne结果;(c)dan-r的混淆矩阵结果。图9是dan和dan-r在a→c上的结果。(a)不同重训练次数对应的dan-r的分类正确率;(b)dan特征提取网络的第二层卷积层获得的特征;(c)-(j)使用1到8次重训练策略从dan-r特征提取网络的第二卷积层获得的特征。图10是对比实施例依托的系统结构图;具体实施方式:下面结合附图与实施例对本公开作进一步说明。应该指出,以下详细说明都是例示性的,旨在对本公开提供进一步的说明。除非另有指明,本实施例使用的所有技术和科学术语具有与本公开所属
技术领域
的普通技术人员通常理解的相同含义。需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本公开的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。一种基于重训练策略的域自适应网络(retrainingstrategybaseddomainadaptionnetwork,dan-r)用于故障诊断。该方法首先最小化训练数据和测试故障数据的特征差异,同时最大化训练数据的分类精度。然后利用训练好的模型给出测试数据的伪标记。最后,利用加权伪标记测试数据和原始训练数据对整个网络进行重训练。本实施例主要贡献如下:将dan用于故障诊断,以最小化不同领域特征之间的差异,同时训练基于标记训练数据的最优分类模型。重训练策略利用未标记测试数据的信息进一步提高诊断精度。dan-r的实现包括两步:域自适应网络dan和重训练策略。下面将分别介绍。第一部分为域自适应网络的构建:dan中包括特征提取网络、特征域自适应网络和分类网络。后两种网络的损失函数之和用于辅助特征提取网络的训练。dan的框架如图1所示。1)特征提取网络:特征提取网络的输入是分段的一维原始信号。为了从这些分段信号中学习有效的特性,这个网络中的卷积核和最大池核比传统cnn中的要长得多。例如,传统cnn最常用的卷积核长度为1、3或5,但dan中特征提取网络的前两层卷积核长度为17。与图像不同,轴承信号中的当前时刻数据可能与距离其较远的数据都有关系。因此,长卷积核比短卷积核能提供更有效的信息。2)特征域自适应网络:首先,该网络对特征提取网络的输出进行标记,对训练样本和测试样本的特征输出分别标记为1和0。然后标记后的数据输入到两个全连接层中。该网络的任务是最小化训练数据和测试数据之间的差异。假设在两个完整连接层之后,训练数据dtr和测试数据dtt的输出分别为f(dtr)和f(dtt)。函数f(·)表示三个全连接层的处理。特征域自适应网络的目的是实现以下功能:min(lossds)=min(||f(dtr)-f(dtt)||)(1)其中lossds表示特征域自适应网络的损失函数。3)分类网络:分类网络的输入是特征提取网络的输出的训练数据集。对于多分类问题,交叉熵损失函数的计算如式(2)所示:其中y表示训练数据的真实标签,是分类网络的预测输出。在dan中,为了同时满足训练和测试数据之间的低差异和低交叉熵损失这两个条件,整个dan网络的损失函数是losswhole=αlosscross-entropy+βlossds(3)其中α和β是两个损失的权重因子。在本实施例中,α和β都设置为1。第二部分为重训练策略:完成dan训练后,可以得到分类网络模型,进而得到测试数据的预测结果。虽然预测结果中有错误的分类结果,但其中正确的分类结果包含有用的信息,这意味着它们可以用来优化dan模型。因此,本实施例使用测试数据的预测结果来重新训练dan网络(dan-r)。设测试数据的预测结果为其伪标签,记带有伪标签的测试数据为dan-r中的特征域自适应网络和特征提取网络的训练方法与dan相同,但分类网络的训练方法不同,如图3所示,dan-r使用训练数据集和伪标记测试数据集训练分类网络。此外,为了减少伪标签中错误标签的影响,增强训练数据集的有效性,dan-r在分类损失函数中引入了样本权重。重训练分类网络的交叉熵损失函数如下:其中y和表示训练数据的真实标签和预测输出,和是测试数据的伪标签和分类器预测输出,η和λ分别是训练数据和测试数据的损失函数权重,且η≥λ。本实施例提出的重训练策略可以循环使用,即基于当前dan-r模型预测的测试数据分类结果可以作为下一次训练dan-r的第三部分dan-r参数的确定dan-r的详细参数见表1,特征提取网络采用两个大尺度核一维卷积层和一个小尺度核一维卷积层,每个卷积层后接一个最大池化层;特征域自适应网络采用三层全连接;分类网络采用两层全连接。在每个卷积层之后使用批标准化(batchnormalization,bn)和带泄露的修正线性单元(leakyrectifiedlinearunit,lrelu),在每个内部全连接层之后使用dropout操作。在实验中,η等于1;λ的范围为0.1到1,间隔为0.1。表1中,convolution1d表示一维卷积层,bn表示批标准化,leakyrelu表示带泄露的修正线性单元,maxpooling1d表示最大池化层,flatten表示把多维的输入一维化,dropout表示dropout操作。表1.dan-r详细参数实验结果与分析本节首先介绍了数据集和实验结果评价指标,然后介绍了凯斯西储大学(casewesternreserveuniversity,cwru)数据集和paderborn数据集的实验结果,最后给出了实验分析。本实施例的实验是在geforcertx2080显卡上,使用运行在tensorflow上的keras实现的。实验中使用的优化器为adam,训练次数为120,学习率为0.0005,每训练50次学习率减少50%,批处理参数大小为16。本实施例采用paderborn数据集和cwru数据集对dan-r的分类性能进行评估。paderborn数据集包含三种状态的样本:内圈故障、外圈故障和健康状态。本实施例使用paderborn数据集进行了两次实验,见表2、表3和表4。轴承代码和每个代码的设置如表2和表3所示。在第一次实验中,我们用一种工作设置的数据作为训练数据集,将其他工作设置的数据作为测试数据集。第二次实验中用于训练和测试该方法的数据如表4所示。本实施例将paderborn数据集的原始信号分割成相同长度的数据段,然后输入到dan-r中。每个数据段有4096个数据。cwru数据集包含四种状态的样本:健康、外圈故障、内圈故障和滚珠故障。本实施例使用的数据采集频率为48khz。对于每种情况,分别采用三种电机转速(1772、1750和1730)和三种不同的故障直径(0.007、0.014和0.021)。对每种组合的数据,本实施例采用随机抽取5000个长4096的样本,即每种电机转速包含60000个4种状态的样本。为了测试不同方法的泛化性能,将使用一种电机转速的数据训练模型,而其他转速的数据作为测试数据。表2.paderborn数据集的三种状态和数据代码表3.paderborn数据集的数据采集工况及数据代码编号数据代码转速(单位:rpm)径向力(单位:n)负载转矩(nm)an15n07f10150010000.7bn15m01f10150010000.1cn15m07f0415004000.7表4.paderborn数据集用于第二个实验的训练和测试数据的代码评价指标本实施例用分类正确率来衡量方法性能,定义如下:其中,当x=y时,δ(x,y)=1;当x≠y时,δ(x,y)=0。lgt是故障数据的标签,ls是分类方法的预测结果。ρ值越高,分类性能越好。cwru数据集实验结果首先,我们给出了将elm、svm、cnn(去掉特征域自适应网络的dan)、dan和dan-r应用于cwru数据集的实验结果。实验结果如表5所示,dan的分类性能优于其他方法,且其在所有情况下的准确率都高于99.4%。另一方面,该方法的性能优于cnn,证明了dan方法能使训练数据与测试数据的差异最小化,并且用标记训练集训练的分类模型能很好地适用于测试数据集。此外,表6给出了dan-r的分类结果。由结果可知,dan-r可以达到100%的分类准确率。也就是说,伪标记的测试数据和重训练策略有助于提高分类结果。表5.dan在cwru数据集上的实验结果表6.dan-r在cwru数据集上的实验结果paderborn数据集实验结果本实施例在paderborn数据集上进行了两个不同的实验。第一个实验涉及在不同的工作条件下采集的训练和测试数据,第二个实验涉及人工和自然条件下获取的训练和测试数据。具体实验结果如下。1)第一个实验的实验结果见表7,表7列出了dan和其他方法的分类精度。与其他方法相比,本实施例方法具有更好的性能。表8和图5给出了dan-r的实验结果。dan-r的表现优于dan。2)paderborn数据集的第二个实验研究人工故障数据与自然故障数据之间的关系。由于在实际中更容易获得大量的人工故障数据,因此研究利用人工故障数据训练并在自然故障数据上测试的方法具有重要意义。表9显示了当所提出的方法与其他方法进行比较时的分类精度。从表9可以看出,dan-r比其他方法具有更好的分类性能。在paderborn数据集上的实验结果表明,dan和dan-r均能有效地诊断不同环境下的故障,具有良好的泛化性能。dan-r的实验结果表明,重训练策略有助于提高dan的学习效果。提出的方法在几个不同的数据集上进行评估:不同工作条件下的故障数据,以及自然和人工条件获取下的故障数据。实验结果证明了该方法的有效性。表7.dan在paderborn数据集(表2、表3)上的分类结果表8.dan-r在paderborn数据集(表2、表3)上的分类结果表9.dan-r在paderborn数据集(表4)上的分类结果实验结果分析为了进一步清晰地分析该方法,本实施例给出了t-分布随机近邻嵌入(t-distributionrandomneighborembedding,t-sne)的特征可视化图。图6(a)-(f)为cwru数据集的t-sne结果。t-sne的输入特征是dan和dan-r中特征提取网络的输出。很明显,dan-r成功地将所有类分离。此外,dan-r的混淆矩阵也如图所示,其结果与表6一致。从混淆矩阵可以清楚地看到错误分类样本的数量。图7(a)-(f)为将dan和dan-r应用于paderborn数据集(表2和表3)时的混淆矩阵。混淆矩阵生动地展示了分类正确和错误的样本。因此,我们可以得出结论,dan-r减少了错误分类的测试数据。图8(a)-(c)为paderborn数据集(表4)的t-sne图和混淆矩阵。使用伪标记测试数据重训练后,类之间的距离变大,分类精度提高。最后,图9(a)-(j)为dan和dan-r在a→c(a为训练,c为测试)上的分类结果。图9(a)为在不同重训练次数下获得的分类精度。显然,重训练次数越多,分类精度越高。因此,重训练策略可以反复使用,以获得更好的故障诊断效果。图9(b)为从dan特征提取网络的第二层卷积层获得的特征。图9(c)-(j)分别为通过使用1到8次重训练策略从dan-r的第二卷积层获得的特征。使用重训练策略前后的特征有很大差异,这种差异使dan-r具有更高的分类精度。上述对比实施例所依托的系统包括数据采集系统和振动信号分析与诊断系统,其中,振动信号分析与诊断系统由设备信息管理模块和振动数据采集系统提供必要的设备信息及数据,故障诊断模块根据设备组成信息和振动数据对舰艇上的关键设备进行故障诊断。具体功能包括对被测设备的组成参数进行设置管理;24通道振动信号采集、放大、模数转换、实时显示、存储;实时显示最多24通道振动信号(时域、频域两种形式)可通过触摸屏控制数采系统、设置的采集参数;对设备运行状态进行监测;出现故障后的诊断。采集系统包括多个振动传感器和数据采集器,具体结构可以如图10所示。振动信号分析与诊断系统具体包括:设备信息管理模块:首先确定设备类型,将设备分为旋转设备和非旋转设备。非旋转设备根据具体设备参数确定特征频率和参数。旋转类设备分别输入电机参数、轴承参数和具体机械参数,自动计算特征频率。根据历史测量记录,计算出在不同特征频点的最大值和最小值。并将所有信息添加保存至数据库中,并支持对历史数据的管理查看。振动数据采集模块:在数据采集模块,首先设置采集参数,如采集通道数、采样率、采集时间和时长。开始采集后,可实时显示时域和频域的振动信号,测量文件(.bin)自动保存在指定目录下。数字信号分析模块:本模块的主要功能是对采集到的振动数据进行数字信号处理和图形化显示,为诊断专家提供参考,并可以以图片形式保存处理结果。故障诊断模块:在诊断模块中,首先选择设备名称,将设备库中的相应参数、特征频率及取值范围传入到该模块。然后将测量值载入到模块中,根据历史经验判断被测设备的运行状态、故障种类、严重程度。同时该模块可根据多次测量结果确定磨损状态并对使用寿命做出预测。其中,振动传感器选用dh112,诊断软件选用thinkpadx,主控模块采用凌华pxes-2590。本领域内的技术人员应明白,本公开的实施例可提供为方法、系统、或计算机程序产品。因此,本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。本公开是参照根据本公开实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。以上所述仅为本公开的优选实施例而已,并不用于限制本公开,对于本领域的技术人员来说,本公开可以有各种更改和变化。凡在本公开的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。上述虽然结合附图对本公开的具体实施方式进行了描述,但并非对本公开保护范围的限制,所属领域技术人员应该明白,在本公开的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本公开的保护范围以内。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1