一种风电机组齿轮箱故障的迁移诊断方法与流程

文档序号:16933674发布日期:2019-02-22 20:30阅读:239来源:国知局
一种风电机组齿轮箱故障的迁移诊断方法与流程
本发明属于风电机组状态监测与故障诊断
技术领域
,尤其涉及一种风电机组齿轮箱故障的迁移诊断方法。
背景技术
:风电机组长期运行在室外恶劣自然环境下,故障率比常规发电机组高。与此同时,风电机组地处偏远,机舱安装在近百米高的位置,这给机组的维护检修造成了极大的不便,是其维护成本高昂的重要原因。据不完全统计,按照风电机组20年全寿命周期运行成本计算,故障导致的停机时间已占其额定发电时间的25.6%,维护费用高达风电场总收入的20-25%。齿轮箱是风电机组中连接传动系统和发电系统的关键设备,在复杂载荷的作用下,齿轮箱常常会发生断齿或齿面磨损等故障。与其他风电机组的零部件相比,齿轮箱的故障率不是最高的,但齿轮箱一旦发生问题维修非常不便,其所造成的停机时间和经济损失一直排在所有部件的首位。风电机组齿轮箱属于高可靠性复杂专用旋转机械设备,常规的故障诊断技术不能很好的适应这种长寿命,高可靠性的复杂系统。通常情况下在风电机组上监测一台齿轮箱若干年,采集数万小时的监测数据,可能只有一两次失效记录,甚至还会出现没有一个失效的情况,由于现场数据中提供的失效信息太少,很难甚至无法建立实际可用的齿轮箱故障诊断系统。风电机组齿轮箱的失效或故障是由性能退化导致的,属于退化型失效,其性能在失效前是在逐渐发生退化的,性能退化到一定程度就判定为失效或故障。假如机组都在相同条件和相同的环境下制造和使用,失效水平也相同,那么风电机组齿轮箱的退化轨道和失效状态也应该是相同的。可是实际情况不是这样,即使是同一风电场内同一批次的机组,也不是工作在相同的条件和环境下的。由于风电场内地形以及机组间尾流的影响,不同机位处的机组的风速、风向以及湍流强度均不相同,有时差异很大,齿轮箱所承受的载荷也不相同,因此,齿轮箱的退化过程总是受到各种各样波动的干扰,最终导致失效判定具有模糊性,难以用明确的规则给出风电机组齿轮箱的失效或故障状态的判据。风电机组齿轮箱的故障诊断是具有挑战性的问题。目前,国内外学者在相关方向上均开展了大量工作,取得了一些有意义的成果。按照诊断方法分类,风电机组齿轮箱的故障诊断方法主要分为:基于物理模型/解析模型的方法和数据驱动的方法。目前数据驱动的风电机组故障诊断和健康评估方法已经成为该领域内的研究热点。按照故障诊断所采用的信号分类,包括:振动信号、声学信号、电信号、温度以及油液成分。振动分析是旋转机械设备最常用的状态监测技术,也是风电机组传动链故障诊断最为有效的方法。时域分析、频域分析和时频域分析是传统振动分析技术的主要方法。虽然,目前在风电机组齿轮箱故障诊断方面取得了一定的成果,然而大部分方法仍然需要依赖专家经验,这些经验是主观的,很难通过形式化的方式描述清楚,这意味着在机组数量众多、型号与工况各异的风电场内,这些方法将不具备通用性和推广性。除此之外,风电机组大部件的故障数据十分稀缺,特别是带有故障标注的数据更是非常稀少,这使得基于监督学习的状态识别算法由于缺少故障样本而无法真正应用。另外,随着机组齿轮箱的老化,其性能逐渐降低,表征齿轮箱状态的信号也会随之发生分布上的改变,若模型不具备自适应调整的能力,这将严重影响诊断模型的泛化能力。技术实现要素:针对上述问题,本发明提出了一种风电机组齿轮箱故障的迁移诊断方法,其包括以下步骤:步骤1:建立四个神经网络结构,分别为源域特征提取器、目标域特征提取器、域分类器和域判别器;步骤2:用带标注的源域数据通过前向传播计算得到预测标签值,根据预测标签和实际标签计算得到网络训练损失函数,采用反向传播算法对源域特征提取器和域分类器进行预训练;步骤3:用源域数据和目标域数据通过前向传播依次计算得到源域特征、目标域特征和域判别器的损失函数,用反向传播算法分别依次对域判别器和目标域特征提取器进行训练;步骤4:将新获取的目标域数据输入目标域特征提取器,计算得到特征,将特征输入步骤2中得到的域分类器得出该新数据的预测标签。所述源域是在实验室控制条件下获得的风电机组齿轮箱故障模拟数据集,含有大量标注数据;所述目标域是真实风电机组齿轮箱故障数据集,含有少量标注数据或不包含标注数据。所述源域特征提取器和目标域特征提取器网络结构一致,用于把相应领域的数据分别映射到特征分布空间;所述域判别器对输入特征的分布差异进行评估从而判断输入的特征来源于源域还是目标域;所述域分类器用以执行最终的分类任务。所述步骤2具体包括:步骤21:随机初始化源域特征提取器和域分类器;步骤22:将源域数据输入源域特征提取器,经过前向传播过程,得到源域特征,再将源域特征输入域分类器,经过域分类器的前向传播过程,计算得到预测标签值,根据预测标签和实际标签计算得到网络训练损失函数;步骤23:采用反向传播算法分别计算预训练网络损失函数对域分类器和源域特征提取器的网络参数的偏导数,采用梯度下降算法更新上述两个预训练网络的参数;步骤24:重复步骤22到步骤23,直到预训练网络收敛。所述步骤3具体包括:步骤31:用经过预训练的源域特征提取器的参数初始化目标域特征提取器,随机初始化域判别器;步骤32:分别将源域和目标域的数据输入各自的特征提取器,经过特征提取器的前向传播过程,计算得到源域和目标域特征;将源域和目标域特征一起输入域判别器网络,经过域判别器的前向传播过程,计算出域判别器的损失函数;步骤33:保持源域和目标域特征提取器网络参数不变,用反向传播算法求域判别器的损失函数对域判别器网络参数的偏导数,并用梯度上升算法更新域判别器网络参数;步骤34:保持源域特征提取器和域判别器网络参数不变,用反向传播算法求域判别器的损失函数对目标域特征提取器网络参数的偏导数,并用梯度下降算法更新目标域特征提取器的网络参数;步骤35:重复步骤32到步骤34的过程,直到收敛。所述网络训练损失函数是用来评估域分类器在特征识别分类上的评价标准,选择交叉熵作为网络训练损失函数。所述域判别器的损失函数是用来对源域特征和目标域特征的分别差异进行评价,选择为j-s散度作为域判别器的损失函数。本发明的有益效果:1、本发明实现了从振动数据中自动搜索更好的故障表征的过程,避免人工设计特征带来的局限性,实现通用化特征提取技术。2、本发明能够充分利用迁移学习技术,采用与风电机组实际故障数据(目标域)相似的实验室模拟故障数据(源域)进行故障诊断模型的预训练,从试验数据中搜索故障表征,并成功外推到真实的风电机组齿轮箱数据上,在一定程度上降低了故障诊断模型的训练过程对风电机组实际故障数据的需求量。3、本发明成功把试验数据(源域)上训练的模型外推到实际风电机组齿轮箱上的数据(目标域)中,实现了在相似领域之间的故障特征迁移,并在目标域上实现了无监督模式下的迁移,具备适用于机组齿轮箱监测数据分布发生小幅变化时的自调整能力,提高了故障诊断系统的泛化性能和自调节能力。附图说明图1为本发明的故障迁移诊断方法网络结构图。图2为本发明的网络预训练过程前向传播和反向传播过程示意图。图3为本发明的域判别器前向传播和反向传播过程示意图。图4为本发明的目标特征提取器前向传播和反向传播过程示意图。图5为本发明的诊断模型推理过程示意图。图6为本发明的故障迁移诊断模型训练流程图。图7为本发明的实施例混淆矩阵示意图。具体实施方式下面结合附图,对实施例作详细说明。在本发明中,针对上述风电机组齿轮箱故障诊断存在的问题,提出一种风电机组齿轮箱故障的迁移诊断方法,通过实验室带标签的试验数据和实际不带标签的风电机组齿轮箱数据来进行特征迁移,最终在无监督的学习模式下,实现风电机组齿轮箱的故障诊断。为了和迁移学习的记法保持一致,用下标s和t来分别指代源域和目标域,将故障模拟试验数据集记为源域将风电机组齿轮箱真实监测数据集记为目标域其中源域是在实验室控制条件下的获得的故障模拟数据集,可以方便的获得大量标注数据,目标域是真实机组数据集,通常只包含少量甚至不包含标注数据。用xs和xt表示源域和目标域上的一个数据样本,用xs和xt表示源域和目标域的全部数据的矩阵,用和表示源域和目标域的数据特征空间;类似的,用ys和yt表示源域和目标域的实际类别,用和表示源域和目标域的类别空间。在上述的标记下,迁移诊断问题用形式化的语言可以描述为:给定一个有标注的源域和一个无标注的目标域且它们的特征空间相同,即并且它们的类别空间也相同,即但是这两个域的边缘分布不同,即ps(xs)≠pt(xt),标注的条件概率分布也不同,即ps(ys|xs)≠pt(yt|xt)。风电机组齿轮箱故障的迁移诊断方法实现的目标是利用有标记的数据和无标记数据去学习一个分类器来预测目标域的标签根据上述形式化描述,一种风电机组齿轮箱故障的迁移诊断方法,包含以下步骤:步骤1:根据图1建立四个神经网络结构,分别为源域特征提取器、目标域特征提取器、域分类器和域判别器。该方法借鉴生成对抗网络(gans)的思想来训练这四个神经网络,与gans不同的是,这里生成器的职能发生变化,不再生成新样本,而是扮演了特征提取的功能:不断学习领域数据的特征,使得判别器无法对两个领域进行分辨。这样,原来的生成器也可以称为特征提取器(featureextractor)。源域特征提取器和目标域特征提取器网络结构一致;特征提取器的主要作用是把给定数据映射到特征分布空间,它是通过一系列简单的数据变换(神经网络层)来实现从输入到特征的映射,相比其他网络结构,特征提取器具有较深的层级和较复杂的层结构,以保证从复杂的原始数据中变换出可供识别的特征,具体的特征提取器的网络层结构取决于输入数据的形式;域分类器用以执行最终的分类任务,其网络层结构是全连接层,具有较浅的深度,通常仅有一到两层;域判别器则主要对输入特征的分布差异进行评估,从而判断输入的特征来源于源域还是目标域,其结构也比较简单,通常是两层的全连接层。在后面的实施例中将给出在具体算例下各神经网络的详细结构配置。步骤2:用带标注的源域数据对源域特征提取器和域分类器进行预训练,如图2所示。预训练过程实际上是通过源域数据来训练其特征提取器和域分类器的过程。通过这个过程,可以让源域特征提取器在大量源域数据的训练下,学习到具有识别性的特征映射方式。在这个训练过程中,域特征提取器将提取到的特征以一维向量的形式输入到域分类器中,域分类器通过特征与源域所含有的标签的数学关系,来执行对源域的输入数据的分类任务。每次训练后,域分类器可以通过计算损失函数来将分类偏差以反向传播的方式反馈到分类器自身以及源域特征提取器上,来优化模型。通过在大量源域数据上的多次训练,可以让源域的预训练网络模型达到稳定,并能精确地在源域上完成特征识别和分类任务。进一步,该步骤包括:步骤21:随机初始化源域特征提取器和域分类器。步骤22:从源域的分布xs中抽取源域数据和源域标签将输入源域特征提取器,经过前向传播过程,得到源域特征如式(1)所示,再将输入域分类器,经过域分类器的前向传播过程,计算得到预测输出如式(2)所示,根据式(3)计算网络训练损失函数lc,pretrain。式中,θsrc,g表示源域特征提取器的网络参数,θc表示域分类器网络参数,fsrc,g表示源域特征提取器映射,fc表示域分类器映射,m1表示源域样本数量。步骤23:采用反向传播算法(backpropagation,bp算法)分别计算lc,pretrain对θsrc,g和θc的偏导数,采用梯度下降算法更新上述两个预训练网络的参数,特征提取器和域分类器的参数更新公式如式(4)和式(5)所示。预训练过程前向传播和反向传播过程示意图如图2所示。式中,α1和α2为学习率。步骤24:重复步骤22到步骤23,直到网络损失函数lc,pretrain不再降低为止。步骤3:基于生成对抗网络领域对抗的思想,采用对抗训练方式训练域判别器和目标域特征提取器,同时,保持源域特征提取器的网络参数θsrc,g不变,如图3和图4所示。进一步,该步骤包括:步骤31:用经过预训练的源域特征提取器的参数初始化目标域特征提取器,并且随机初始化域判别器。由于目标域特征提取器是在无监督条件下训练的,相比源域特征提取器来说,其训练难度大幅增加。而源域和目标域数据分布存在一定的相似性,以源域上已经训练好的参数作为初始值开始微调(finetune),既可以传递从源域中获取的特征结构信息,也可以让目标域特征提取器更快收敛到比较好的结果。由于源域和目标域特征提取器网络结构一致,直接将步骤2中预训练得到的参数赋到目标特征提取器作为初始值即可。步骤32:分别从源域分布xs中抽取数据从目标域分布xt中抽取数据将源域和目标域的数据和输入各自的特征提取器,经过特征提取器的前向传播过程,计算得到源域特征和目标域特征;将源域和目标域特征一起输入域判别器网络,经过域判别器的前向传播过程,计算出域判别器的损失函数ld(θd),如图3所示。域判别器损失函数ld的计算如式(6)所示。式中,θd表示域判别网络参数,fd表示域判别器对应的映射,fsrc,c和ftgt,g分别代表源域和目标域特征提取器对应的映射,m1和m2代表源域和目标域样本数量。步骤33:保持源域和目标域特征提取器网络参数θsrc,g和θtgt,g不变,用反向传播算法求域判别器的损失函数对域判别器网络参数的偏导数,并用梯度上升算法更新域判别器网络参数,在更新过程中可以让域判别器对数据差异的估计越来越准确,更新公式如式(7)所示。域判别器前向传播和反向传播过程如图3所示。式中,α3为域判别器的学习率。步骤34:保持源域特征提取器和域判别器网络参数θsrc,g和θd不变,用反向传播算法求域判别器的损失函数ld对目标域特征提取器网络参数θtgt,g的偏导数,并用梯度下降算法更新算法更新目标域特征提取器的参数。由于θsrc,g和θd保持不变,因此,式(6)中域判别器损失函数中的第一项为常数项,可以将其省略,故域判别器的损失函数ld可简化为式(8)所示。目标特征提取器参数更新如式(9)所示。目标特征提取器前向传播和反向传播过程如图4所示。步骤34:重复步骤32到步骤34的过程,直到收敛。迁移诊断模型的训练流程图如图6所示。步骤4:诊断模型推理过程。将新获取的目标域数据输入目标域特征提取器,计算得到特征,并将特征输入步骤2中得到的域分类器,计算得出该新数据的预测标签,如式(10)所示。诊断模型推理过程示意图如图5所示。式中,xnew代表新获取的待诊断数据,fc和ftgt,g分别代表经过步骤2和步骤3训练后的域分类器和目标域特征提取器,代表待诊断数据的预测标签。实施例1:本发明共采用两类数据集来进行算例分析,一类为带故障标签的试验数据(本发明中称之为源域数据),一类为无故障标签的风电机组齿轮箱数据(本发明中称之为目标域数据)。旨在通过对两类数据采用故障迁移诊断方法训练故障诊断模型,最终在目标域上实现无监督的齿轮箱故障诊断。本实施例中采用的源域数据来源于美国凯斯西储大学轴承数据中心的轴承故障数据。待检测的轴承支撑着电动机的转轴,每种的故障利用电火花单点损伤的方式加载在轴承位于中心距离为0.007、0.0014、0.0021、0.0028以及0.0040英寸处。电动机驱动端轴承的具体型号是skf-6205,故障分别设置在驱动端滚珠轴承,轴承内圈,轴承外圈上,其中,轴承外圈的损伤点分别按照时钟位置在3点钟、6点钟以及12点钟共三个不同位置进行设置。电动机驱动端的轴承基座上方固定一个加速度传感器,用来采集正常和故障轴承的振动加速度信号。振动信号通过16通道数据记录仪收集得到,信号的采样频率为12khz,轴承故障中还含有采样频率为48khz的数据。功率和转速可通过译码器或扭矩传感器实时采集得到。为了达到建模的前提条件,源域和目标域的类别空间必须相同,这里将源域的数据分为正常和故障两大类,并用0和1赋予其标签。源域各类故障样本数量及所占百分比如表1所示。表1源域各类故障样本数量及所占百分比故障位置正常内圈故障滚动体故障外圈故障(3点)外圈故障(6点)外圈故障(12点)样本数量169633903389229821811456所占百分比11.8%23.5%23.5%15.9%15.1%10.1%故障标签011111本实施例中采用的目标域数据来源于中国北方某风电场1.5mw风电机组齿轮箱振动信号的实测数据。考虑到风电机组运实际行工况的复杂和多变性,选择了在908、914、929、949、1013、1069和1498rpm的转速下,高速轴和低速轴端径向和轴向上测得的406组齿轮箱振动速度信号。所选齿轮箱数据集中包含4中状态,分别为正常状态、齿轮磨损状态和断齿状态以及机械松动状态。本实施例所选数据的采样频率为5120hz,每个样本采样点数为8192点。为了与源域的类别空间保持一致,这里将目标域的数据集也分为正常和故障两大类,并用0和1赋予其标签。目标域故障样本数量及所占百分比如表2所示。表2目标域故障样本数量及所占百分比故障位置正常齿轮磨损断齿机械松动样本数量232567246所占百分比57.1%13.8%17.7%11.3%故障标签0111应用本发明进行目标域故障诊断,包括以下步骤:步骤1:建立源域和目标域数据集并对原始数据进行预处理。通过对源域数据和目标域数据的观察发现,两类数据具有的差异性较大。具体差异体现在:1、采样频率;2、数据质量(信噪比);3、数据样本数;4、数据采集对象;5、数据分布差异。具体预处理的步骤和内容如下:步骤11:考虑到两者在采样频率上的差异对源域数据进行降采样,使其达到与目标数据分布一致的5120hz。步骤12:划分训练集和测试集样本以训练集75%,测试集25%的比例分别划分源域和目标域数据集,得到源域训练数据、源域测试数据、目标域训练数据以及目标域测试数据。步骤13:用固定的时间窗口分割每条数据,得到维度相同的振动片段。源域数据样本容量较大,为了方便分析,将连续的包含14769600组数据的源域数据切割为每2048个点为一组,共3077组的矩阵形式;将目标域中的原始数据也分割为每2048个点为一组共406组并生成矩阵。步骤2:源域和目标域数据进行时频域变换。本实施例通过短时傅里叶变换的时频域变换方法,对振动加速度数据片段进行处理。短时傅里叶变换(stft,short-timefouriertransform)是一种用信号局部区域的特征来反映其与时间关系的数学变换方法。这种变换的基本思路是通过窗函数与时间信号的乘法运算,以较小的时间间隔将时域信号划分为多个时段,并通过傅里叶变换对每一时段进行分析,以获取信号在特定时段中的频谱变化规律,随着窗函数的滑移得到时间尺度上一系列的变化结果。因此,对于给定时间序列s[n],可对时间短时傅里叶变换进行定义。离散时间短时傅里叶变换公式如式(11)所示。式中,γ[n]为窗函数;n是离散的,而ω是连续的。因此公式可理解为离散时间短时傅里叶变换在时间上是离散的,而在频率上是连续的。步骤3:建立故障迁移诊断模型,并用源域和目标域的训练集对四个网络分别进行训练。进一步,所述步骤3包括:步骤31:按照图1所示的网络结构,建立故障迁移诊断模型。由于特征提取器的输入是振动加速度片段的时频谱,而时频谱具有二维矩阵形式的数据结构,因此特征提取器采用卷积神经网络结构;域分类器和与判别器由于相对简单,采用全连接神经网络结构。各网络的结构配置如表3所示。表3网络结构配置根据表3,特征提取器由7层网络结构构成:第一层(卷积层):它由8个映射(通道)组成,每个神经元指定一个3×3大小的接受域,神经元共享3×3个权值参数;第二层:批规范化,设置8个映射通道;第三层:池化层,将尺寸缩小4倍;第四层(卷积层):由16个映射(通道)组成,每个神经元指定一个3×3大小的接受域,神经元共享3×3个权值参数;第五层:批规范化,设置16个映射通道;第六层:池化层,将尺寸缩小4倍;第七层:输出函数前的全连接层,由18个输出神经元构成,18个这样的单元相互组合构成输出向量。域分类器由两层网络结构构成:第一层(全连接层):由18个神经元构成;引入激活函数relu;第二层:由2个神经元构成,引入softmax激活函数输出最终的分类结果。域判别器由三层网络结构构成:第一层(全连接层):由18个神经元构成;引入激活函数relu;第二层:由18个神经元构成,引入relu激活函数;第三层由2个神经元构成,输出域判别结果。步骤32:按照前述的训练方法在源域和目标域的训练集上对四个神经网络进行训练,其中,源域训练集包括时频谱和对于的故障标签;目标域训练集只包含正常和故障状态下的时频谱。算例实施的软件环境为ubuntu16.04,python3.5,pytorch0.3,硬件环境为两颗英特尔至强e5-2680v4@2.4ghz处理器,128gb内存,两颗英伟达gtx-1080图形处理器。步骤4:评估模型。步骤41:定义评价标准。为了方便衡量模型性能的优劣,用精确率、召回率和f1值作为评估标准。具体计算公式如式(12)-式(14)所示。式中,tp表示将正类预测为正类的样本数;fn表示将正类预测为负类的样本数;fp表示将负类预测为正类的样本数;tn表示将负类预测为负类的样本数。步骤42:将目标域测试集时频谱输入模型进行前向传播过程得到预测标签。经过步骤3,目标域特征提取器以及域分类器均已得到各自的模型参数。将目标域测试集中的时频谱输入目标域特征提取器,通过映射过程生成特征。然后将这部分特征输入到域分类器当中,由分类器输出最终的预测结果。预测结果的混淆矩阵如图7所示,其中右边的为归一化后的混淆矩阵。目标域测试集上的各评估指标如表3所示。表4目标域测试集上各评估指标实际状态精确率召回率调和均值f1样例数正常0.851.000.9256故障1.000.780.8845均值/总数0.920.900.90101通过表4可以看出,无论是通过精确率、召回率以及调和均值来评价,故障迁移诊断方法在风电机组齿轮箱故障诊断都实现了超过90%的准确率。其中,精确率和召回率分别从两个方面反映诊断的水平,而f1值是两者的评价,可以综合反映出分类器的好坏。从表4和图7中可以看到在正常和故障状态下f1值分别达到92%和88%,虽然仍有部分故障情况未能得到正确的判断,但是能在无监督学习模式下达到平均90%的水平,表明了该方法出色的迁移学习能力和特征分辨能力。此实施例仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本
技术领域
的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1