风机齿轮箱散热故障的早期诊断模型构建方法及诊断方法与流程

文档序号:20213024发布日期:2020-03-31 11:22阅读:236来源:国知局
风机齿轮箱散热故障的早期诊断模型构建方法及诊断方法与流程

本发明涉及风力发电机组(简称风机)故障诊断技术领域,尤其涉及一种风机齿轮箱散热故障的早期诊断模型构建方法及诊断方法。



背景技术:

温控阀用于调节流入油冷散热器和直流通路的润滑油流量,是实现齿轮箱油温调节的重要部件。随着温控阀使用时间的增加以及外部环境的影响,温控阀性能会逐渐退化直至完全失效。随着温控阀性能的逐渐退化,温控阀对齿轮箱润滑油通路调节的能力会减弱,而这将直接造成齿轮箱润滑油散热不充分。当温控阀性能退化严重甚至完全失效时,将会导致齿轮箱油温不断升高并最终造成风电机组故障停机。

风电机组齿轮箱油冷散热器主要包括管路、散热片、风扇等部件。随着风电机组在役运行时间的增加,空气中的灰尘以及飘飞的毛絮会粘附在散热片上,造成油冷散热器散热效率降低,严重时可能导致油冷散热器无法有效降低齿轮箱润滑油温度,造成风电机组限功运行甚至停机。

针对齿轮箱油冷散热器堵塞故障以及温控阀失效故障问题,目前一般采用的都是事后处理的方式。当未及时准备备件时,这种被动的处理方式可能造成风电机组长时间限功运行甚至停机,将严重影响风电机组的发电量指标。而且,齿轮箱长期工作在高温环境下,还可能会影响齿轮箱的使用寿命。

现有技术中的风电机组齿轮箱故障监测方法中,一般存在如下几个不足:如通过温差阈值判断温控阀故障与否的方法,其温差阈值的选择须通过温控阀在环境试验箱中的实验数据来确定。然而对于不同厂家、不同批次、不同型号的温控阀,可能均需在环境试验箱中进行实验,以确定温差阈值。该过程费时费力,成本较高。在确定温差阈值时,还需考虑一定的相关系数。通过额外安装流量计来实现温控阀的故障诊断,额外增加了成本。将流量计监测到的流量与设定状态的差别来判断温控阀是否出现故障,而设定状态往往比较难准确确定。

因此,有必要提出一种自动且有效的识别方法,用于识别温控阀及油冷散热器的早期故障,从而帮助运维人员提前做好配件准备、维修计划制定等工作,减小对发电量及齿轮箱使用寿命的影响。



技术实现要素:

本发明要解决的技术问题就在于:针对现有技术存在的技术问题,本发明提供一种不需要额外加装设备,成本低,并充分考虑了风机有功功率对油温的影响,能够及时、准确的诊断出故障的早期特征的风机齿轮箱散热故障的早期诊断模型构建方法及诊断方法。

为解决上述技术问题,本发明提出的技术方案为:一种风机齿轮箱散热故障的早期诊断模型构建方法,包括如下步骤:

s1.获取风电机组与散热故障相关的有效历史数据;

s2.将所述有效历史数据按照预设的第一时间周期进行分组,并按照所述分组分别计算每组有效历史数据的敏感特征值,并标记敏感特征值的故障状态,所述故障状态包括故障和非故障;

s3.构建诊断模型,并按照所述分组的敏感特征值及其故障状态构建训练集,通过所述训练集对所述诊断模型进行训练,得到诊断模型。

进一步地,所述有效历史数据中的每条数据包括多个数据项,所述数据项包括风电机组的齿轮箱进口油温、齿轮箱油池温度、风电机组有功功率;

所述有效历史数据是根据预设的第一筛选规则从历史数据中去除无效数据后得到的数据。

进一步地,所述预设的第一筛选规则包括:

当所述齿轮箱油池温度低于温控阀开启温度,则该条数据为无效数据;

当所述风电机组有功功率为0或大于额定功率值,则该条数据为无效数据;

当所述齿轮箱油池温度、和/或所述齿轮箱进口油温、和/或所述风电机组有功功率缺失,则该条数据为无效数据。

进一步地,所述敏感特征值包括皮尔逊相关系数和油池温度水平;

所述油池温度水平通过如下方式确定:

对所述风电机组有功功率按照预设的宽度进行分箱处理,分别计算各分箱内齿轮箱油池温度的平均值,对所述平均值进行拟合,得到功率-温度曲线,计算所述功率-温度曲线与功率轴所围面积值得到油池温度水平。

进一步地,所述诊断模型为基于逻辑回归分类算法的诊断模型;所述诊断模型的预测函数为如式(1)所示的sigmoid函数:

式(1)中,h(x)为预测函数计算得到的预测值,x=(a;b),x为样本特征,a为皮尔逊相关系数,b为油池温度水平,θ为模型参数,t为转置运算;

所述诊断模型的代价函数如式(2)所示:

式(2)中,l(θ)为代价函数的计算值,xi=(ai;bi),xi为样本特征,ai为皮尔逊相关系数,bi为油池温度水平,yi为由所述故障状态确定的样本标签,θ为模型参数,m为样本特征数。

进一步地,在所述步骤s3中还包括通过roc曲线来优化所述诊断模型的分类阈值,具体包括:按照预先确定的步长,设置从0至1的多个分类阈值,并以按照所述分组的敏感特征值及其故障状态构建验证集,以所述诊断模型对所述验证集中的数据进行分类,得到相应的roc曲线,以所述roc曲线中最靠近(0,1)点所对应的阈值为最优分类阈值,以所述最优分类阈值来优化所述诊断模型。

进一步地,所述验证集和所述训练集之间没有交集。

进一步地,所述预设的第一时间周期为一周。

一种风机齿轮箱散热故障的早期诊断方法,sa.获取风电机组在一个预设的第二时间周期内的运行数据,并按照预设的第二筛选规则去除其中的无效数据,得到有效运行数据;

sb.计算所述运行数据的敏感特征值,通过由如上述方法所构建的诊断模型对所述敏感特征值进行分类,得到所述风电机组的故障早期诊断结果。

进一步地,所述预设的第二时间周期与所述预设的第一时间周期相同;

所述预设的第二筛选规则与所述预设的第一筛选规则相同。

与现有技术相比,本发明的优点在于:

1、本发明采用齿轮箱进口油温与油池温度的皮尔逊相关系数及齿轮箱油池温度水平作为早期故障敏感特征,这两个敏感特征对油冷散热器堵塞早期故障及温控阀早期故障很敏感,因此所构建的诊断模型能够及时、准确表征风机齿轮箱散热故障的早期特征特征。通过本发明的诊断模型可以准确、及时对风机齿轮箱散热故障进行早期诊断。

2、本发明以功率-温度曲线与功率轴所围面积值定义油池温度水平,并以油池温度水平来表征油池温度特征,充分考虑了风电机组有功功率对油温的影响,能够综合的反应齿轮箱油池的真实温度水平,更符合风机的实际情况,对风机齿轮箱散热故障的诊断也更准确。

3、本发明以齿轮箱进口油温、齿轮箱油池温度、风电机组有功功率三个特征参数来构建诊断模型并进行诊断,使得数据处理过程更简单,运算时所占用的计算机资源更少,并且,这3个变量数据均来自scada,无需额外安装传感器,使得在实际工程应用中的成本更低。

4、本发明优选以“周”作为第一时间周期和第二时间周期,即以一周的数据构建反应油冷散热器及温控阀的敏感特征,一方面,符合风机齿轮箱散热器故障(包括散热器堵塞和温控阀故障)是一个缓变过程的特征,不需要实时监测诊断,降低了处理的数据量和复杂度,并节省诊断需要耗费的资源,又能够保证散热器故障能够得到及时的诊断。

5、本发明通过预设的筛选规则来过滤掉无效数据,可有效的避免无效的噪声数据对诊断结果的影响,保证的诊断结果的准确性。

6、本发明采用基于逻辑回归分类算法的诊断模型,并通过roc曲线来确定诊断模型的最优分类阈值,能够保证诊断模型具有较高的故障样本识别率。

附图说明

图1为本发明具体实施例的流程示意图。

图2为本发明具体实施例的齿轮箱油池温度与进口油温关系曲线示意图。

图3为本发明具体实施例的齿轮箱油池温度与进口油温关系曲线示意图。

图4为本发明具体实施例的出现早期故障时进口油温与油池温度的相关系数。

图5为本发明具体实施例功率——油池温度曲线示图。

图6为本发明具体实施例故障状态及非故障状态下的敏感特征值。

图7为本发明具体实施例完整实施过程示意图。

具体实施方式

以下结合说明书附图和具体优选的实施例对本发明作进一步描述,但并不因此而限制本发明的保护范围。

如图1所示,本实施例的风机齿轮箱散热故障的早期诊断模型构建方法,包括如下步骤:s1.获取风电机组与散热故障相关的有效历史数据;s2.将有效历史数据按照预设的第一时间周期进行分组,并按照分组分别计算每组有效历史数据的敏感特征值,并标记敏感特征值的故障状态,故障状态包括故障和非故障;s3.构建诊断模型,并按照分组的敏感特征值及其故障状态构建训练集,通过训练集对诊断模型进行训练,得到诊断模型。具体的,在本实施例中,有效历史数据中的每条数据包括多个数据项,数据项优选包括风电机组的齿轮箱进口油温、齿轮箱油池温度、风电机组有功功率;有效历史数据是根据预设的第一筛选规则从历史数据中去除无效数据后得到的数据。

在本实施例中,预设的第一筛选规则包括:当齿轮箱油池温度低于温控阀开启温度,则该条数据为无效数据;当风电机组有功功率为0或大于额定功率值,则该条数据为无效数据;当齿轮箱油池温度、和/或齿轮箱进口油温、和/或风电机组有功功率缺失,则该条数据为无效数据。

在本实施例中,敏感特征值包括皮尔逊相关系数和油池温度水平;油池温度水平通过如下方式确定:对风电机组有功功率按照预设的宽度进行分箱处理,分别计算各分箱内齿轮箱油池温度的平均值,对平均值进行拟合,得到功率-温度曲线,计算功率-温度曲线与功率轴所围面积值得到油池温度水平。

在本实施例中,诊断模型为基于逻辑回归分类算法的诊断模型;诊断模型的预测函数为如式(1)所示的sigmoid函数:

式(1)中,h(x)为预测函数计算得到的预测值,x=(a;b),,x为样本特征,a为皮尔逊相关系数,b为油池温度水平,θ为模型参数,t为转置运算;模型参数θ为一列向量,它由θ1、θ2两个标量元素构成。

诊断模型的代价函数如式(2)所示:

式(2)中,l(θ)为代价函数的计算值,xi=(ai;bi),xi为样本特征,ai为皮尔逊相关系数,bi为油池温度水平,yi为由故障状态确定的样本标签,θ为模型参数,m为样本特征数。模型参数θ的定义与式(1)中相同。样本特征即由前述敏感特征值构成的列向量。样本标签是由故障状态确定的值,非故障状态的数据确定的样本标签为0,故障状态的数据确定的样本标签为1。

在本实施例中,在步骤s3中还包括通过roc曲线来优化诊断模型的分类阈值,具体包括:按照预先确定的步长,设置从0至1的多个分类阈值,并以有效历史数据构建验证集,以诊断模型对验证集中的数据进行分类,得到相应的roc曲线,以roc曲线中最靠近(0,1)点所对应的阈值为最优分类阈值,以最优分类阈值来优化诊断模型。验证集和训练集之间没有交集。预设的第一时间周期为一周。

本实施例的风机齿轮箱散热故障的早期诊断方法,包括:sa.获取风电机组在一个预设的第二时间周期内的运行数据,并按照预设的第二筛选规则去除其中的无效数据,得到有效运行数据;sb.计算运行数据的敏感特征值,通过由上述方法所构建的诊断模型对敏感特征值进行分类,得到风电机组的故障早期诊断结果。预设的第二时间周期与预设的第一时间周期相同;预设的第二筛选规则与预设的第一筛选规则相同。

在本实施例中,通过一个具体的应用来加以说明。如图7所示,首先,通过风力发电机组的scada(supervisorycontrolanddataacquisition,数据采集与监视控制系统)来获取风力发电机组的历史数据,历史数据是按照时间,对风力发电机组的运行状态进行监测而得到的数据,每个监测采样时刻获得的一条监测数据,每条监测数据都包括有多个数据项。数据项包括但不限于风电机组的齿轮箱进口油温、齿轮箱油池温度、风电机组有功功率。在本实施例中,通过选择上述数据项,可以对齿轮箱的散热器故障和温控阀故障等散热故障进行早期诊断。当选择不同的数据项,可以对齿轮箱的不同类型的故障进行早期诊断。

在本实施例中,以风电机组的齿轮箱进口油温、齿轮箱油池温度、风电机组有功功率三个数据项按照预设的第一筛选规则进行筛选,对于每一条数据,如果齿轮箱油池温度低于温控阀开启温度,或者当风电机组有功功率为0或大于额定功率值,或者,齿轮箱进口油温、齿轮箱油池温度、风电机组有功功率三个数据项中存在一个数据项缺失时,将该条数据作为无效数据而删除。筛选后的数据作为有效历史数据。只选取了与油冷散热器及温控阀密切相关的3个变量,舍弃了环境温度,风速等次要变量,使得数据处理过程更简单,运算时所占用的计算机资源更少。而且,这3个变量数据均来自scada,无需额外安装传感器。筛选掉低于温控阀开启温度的油池温度数据,能够避免噪声数据对诊断结果的影响。而且,筛选掉超出0至额定功率范围之外的有功功率数据,以及其他异常、残缺数据也为避免噪声数据对诊断结果的影响。

在本实施例中,将筛选后的有效历史数据按照数据的采样时刻所记录的时间进行分组,具体的分组规则优选按“周”分组,即每7天的数据作为一组。当然,还可以选择其它的时间周期,如1天、2天。优选的周期为5天至10天。数据筛选与数据分组的顺序可以交换,即先分组,再按照第一筛选规则进行数据筛选。在本实施例中,对分组后的有效历史数据按组分别计算有效历史数据的敏感特征值,并标记敏感特征值的故障状态,故障状态包括故障和非故障,非故障数据设定标签为0,为故障数据设定标签为1。

在本实施例中,若齿轮箱油池温度低于温控阀开启温度,且齿轮箱油冷散热器未堵塞,那么齿轮箱进口油温与齿轮箱油池温度将表现出强相关性特征,如图2所示。若油池温度高于温控阀开启温度,且齿轮箱油冷散热器未堵塞,那么在油冷散热器的降温作用下,进口油温与油池温度原有的强相关性将会被破坏,皮尔逊相关系数会减小,相关性减弱,如图3所示。然而当出现温控阀早期故障或齿轮箱油冷散热器堵塞早期故障时,在油池温度高于温控阀开启温度的情况下,齿轮箱进口油温与油池温度仍将表现出很强的相关性特征,如图4所示;而且各功率段内油池温度水平都会存在不同程度的升高。

在本实施例中,定义油池温度水平为功率-油池温度曲线图中油池温度曲线与功率轴所围面积s。如图5所示中的斜线部分。本实施例中,优选将风电机组有功功率按照50kw等宽进行分箱处理,当然,也可以选择其它的功率宽度,优选为小于等于风电机组额定功率的1/10。所构建的这两个敏感特征对油冷散热器堵塞早期故障及温控阀早期故障很敏感,能够及时、准确反应早期故障特征。采用这种方法来表征齿轮箱油池温度水平,充分考虑了风电机组有功功率对油温的影响,能够综合的反应齿轮箱油池的真实温度水平。齿轮箱油冷散热器及温控阀出现早期故障时的敏感特征值,与无故障时的特征值存在明显的区别,如图6所示。

在本实施例中,将有效历史数据划分为训练集、验证集、测试集。优选这三个集合为互无交集的数据集合。其中,优选训练集、验证集、测试集中样本数据比例优选为6:2:2。优选训练集、验证集、测试集中样本保持同分布或近似同分布。

在本实施例中,通过训练集对所构建的诊断模型进行训练,采用随机梯度上升算法进行训练,得到逻辑回归分类模型参数θ,代价函数取最大值时所对应的θ值即为最佳模型参数。并采用roc(receiveroperatingcharacteristiccurve,受试者工作特征曲线)曲线来选取诊断模型中逻辑回归函数的最优分类阈值。具体地,分类阈值可在0~1之间选取,对于任意阈值均能在roc曲线上找到确定一点与之对应。采用训练好的逻辑回归分类模型对验证集数据进行分类,分类阈值分别取为0,0.01,0.02,0.03,…,0.99,1;最后得到相应的roc曲线。roc曲线上最靠近(0,1)点所对应的阈值即为最优分类阈值。本实施例中,通过验证集,可以对诊断模型的阈值进行更好的优化,使得诊断模型的诊断结果准确性更高。

在本实施例中,还可以基于训练好的逻辑回归分类模型及最优分类阈值,采用测试集数据进行模型的离线测试,测试结果将会标记出故障样本、非故障样本及对应的机组编号和时间,实现早期故障诊断的自动化。并对诊断模型对测试集数据的诊断结果进行核查,确认诊断正确率,当正确率低于设计要求时,通过加大训练集样本数据,或者进一步地重新对数据进行筛选,优化训练算法,进行进一步的训练,来提高诊断模型的诊断正确率。

在本实施例中,在建立并训练好诊断模型后,即可将诊断模型用于风力发电机组的在线诊断。具体的,通过scada获取风力发电机组的在线监测数据,优选为最近一个预设第二时间周期的数据,第二时间周期与第一时间周期为相同的周期。在线监测数据同样是对风力发电机组的运行状态进行监测而得到的数据,每个监测采样时刻获得的一条监测数据,每条监测数据同样包括但不限于风电机组的齿轮箱进口油温、齿轮箱油池温度、风电机组有功功率三个数据项,并按照第二筛选规则进行筛选,去除掉其中的无效数据,第二筛选规则是与第一筛选规则相同的筛选规则。将筛选后得到数据进行特征提取,计算其敏感特征值,敏感特征值包括皮尔逊相关系数和油池温度水平,其计算方法与构建诊断模型时计算敏感特征值的方法相同。通过将敏感特征值输入诊断模型,诊断模型根据输入的敏感特征值进行计算,输出所输入的敏感特征值为故障还是非故障,从而实现自动对故障的早期诊断。

上述只是本发明的较佳实施例,并非对本发明作任何形式上的限制。虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明。因此,凡是未脱离本发明技术方案的内容,依据本发明技术实质对以上实施例所做的任何简单修改、等同变化及修饰,均应落在本发明技术方案保护的范围内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1