一种基于机器学习算法平台的风电机组故障预测系统的制作方法

文档序号:17265340发布日期:2019-03-30 09:58阅读:1327来源:国知局
一种基于机器学习算法平台的风电机组故障预测系统的制作方法

本发明涉及互联网大数据技术及能源风力发电领域,具体涉及一种基于机器学习算法平台的风电机组故障预测系统。



背景技术:

由于风电场所处环境恶劣及风电机组负荷不稳定,导致对风电机组的安全性、经济性都产生了极大影响。传统风电机组故障与告警靠工作经验的积累诊断判断排查,设备检修优先级识别率低,往往浪费了故障处理的最有效时间,错过了设备检修的最佳时间,造成故障发生率高;同时每天上千条的重复无用的故障告警,导致真实的设备缺陷未能及时发现;没有针对性的检修计划编排、投入人力物力成本,造成资产浪费。

目前大部分故障预测系统利用的是例如决策树、线性方程等科学计算的方式,科学计算会使用历史数据来拟合这些方程式,但是科学计算也有一定的弊端和局限性,主要存在两个问题:1)解决复杂问题的能力有限,只能拟合一些简单的数据,遇到特别数据和业务情况会进行舍弃;2)结果不够精确,对于一些决策类的问题,经常会由于样本量少等原因产出偏颇的解果。



技术实现要素:

本发明的目的是针对目前风电机组故障预测存在的不足之处,提出一种基于机器学习算法平台的风电机组故障预测系统,实现风电机组故障的精准预测。

本发明总体构思在于在故障预测系统中引入了机器学习算法平台,机器学习是专门研究计算机怎样模拟或实现人类学习行为,以获取新的知识或者技能,可以重新组织已有的知识来不断改善自身性能的一种方法,机器学习算法平台具备了解决复杂问题的能力及能够实现千机千面,它可以通过不断的迭代,给出综合评判,可以进行海量数据与特征维度的计算,能够根据每一台风电机组的特性给出故障诊断、故障预测的具体化的建议。

本发明的技术方案是这样的:

一种基于机器学习算法平台的风电机组故障预测系统。该系统包括数据采集模块,数据存储及处理模块,机器学习算法平台,故障诊断、分析及预测模块。各部分的功能如下:

(1)数据采集模块:数据采集模块采集风电机组scada运行数据、机组大部件传感器监测数据、oa系统管理数据、互联网数据、天气数据、专家知识库数据等作为数据来源。

(2)数据存储及处理模块:数据存储及处理主要采用hadoop云计算平台,利用hdfs高容错率和吞吐量,可以很好满足海量,多样化数据低成本的存储要求,适合storm等基于流数据访问处理模式;并根据不同的计算需求分别运用storm流计算,spark内存计算和mr批计算。

(3)机器学习算法平台:在数据计算的基础上提取新的经验类、自学习类故障知识,存入专家知识库。使用各种数据挖掘算法,根据挖掘出来的知识,结合专家知识库,对风电机组设备进行在线故障诊断和报警,并提取故障特征,不断完善或扩展各类故障诊断、报警算法。

(4)故障诊断、分析及预测模块:选取gbdt(梯度迭代决策树)算法和lstm(长短期记忆网络)算法进行模型训练,输出训练好的机器学习模型用于诊断、分析及预测计算。

故障诊断、预测实现包括了如下步骤:

(1)数据挖掘。

传统的数据分析方式已经无能处理那么多大量的看似不相关的数据的处理,因此需要数据挖掘技术去提取各种数据和变量之间的相互关系,从而精炼数据。数据挖掘是从风电机组所有的数据信息(包含scada数据、气象数据、管理数据)中提取数据的模式和模型,实现数据的筛选及分类,即精选出最重要的信息,选择只保留那些与故障有强关联性的测点信号和有已知阈值的测点信号作为关键特征,然后以组合形式将所有的特征点作为一个组合进行数据输入,以用于后续机器学习算法平台数据使用。数据挖掘的核心目的是找到数据变量之间存在的隐形关系。

(2)故障诊断。

故障诊断是以数据为驱动,通过对于风机运行状态的观测,实时判断风机各大系统是否发生故障,故障诊断结果应该与故障的遥信信号一致。利用风电机组现有数据,将风电机组故障分为几大类,例如发电机系统故障,齿轮箱系统故障,和变桨系统故障等。

1)形成一定数量的数据训练集,构建机器学习算法平台,形成来自过往经验的“知识”储备;

2)机器学习结束后,如果有一个新的数据集x,需要诊断其故障,机器学习算法会根据这个新数据与学习后的“知识”相匹配(实际上,知识指的是学习后的模型),然后将这个数据集x进行诊断。

(3)故障诊断分类及流程。

故障诊断分为离线诊断和在线诊断两种模式,离线诊断是通过对历史数据的学习提升自身参数,而在线诊断指使用训练好的神经网络根据在线采集的风机运行状态进行实时故障诊断。

(4)诊断评价。

故障诊断评价使用漏警率,虚警率,和总精确度进行评测。它们公式如下:

漏警率=fn/(tp+fn)

虚警率=fp/(tn+fp)

总精确度=(fp+fn)/(tp+tn+fp+fn)

其中,有tp个类别为1(有故障)的案例被系统正确判定为类别1,fn个类别为1(有故障)的案例被系统误判定为类别0;有fp个类别为0(无故障)的案例被系统误判定为类别1,tn个类别为0(无故障)的案例被系统正确判定为类别0。漏警率评测的是有故障时未报警的比例,而虚警率测评的是在无故障时误报警的比例。在故障诊断中,漏警率和虚警率需要尽量平衡以避免虽然总精确度很高但却没有实现故障诊断功能的情况。

(5)故障预测。

故障预测是通过对当前风机运行状态的观测,预测未来10分钟至1小时内风机各大系统发生故障的概率。在风机运行中,现场工作人员可以根据预测的概率值及概率走向了解未来故障发生的位置,时间,以及可信度,为提前采取检修和维护措施提供了线索。

本发明优点在于:

1)解决风电场风电机组故障发生的不可预测性,利用机器学习算法平台实现风电机组的故障诊断、故障分析、故障预测,从而实现故障的提前预测,把重大障消除在萌芽状态,从而有效减少风电机组故障的发生频率和程度;

2)在风电机组剩余寿命区间内,及时对风电机组存在的潜在隐患和故障进行针对性检修维护,有效延长了设备的使用寿命,增加了设备运行的可靠性;

3)使风机运维人员有效掌握风机故障并提前干预,提高了运维人员工作效率,提高了风电机组运行绩效,增加了风电机组的发电量。

附图说明

图1为本发明各组成部分系统架构示意图。

图2为本发明故障诊断分类及流程图。

具体实施方式

一种基于机器学习算法平台的风电机组故障预测系统。该系统包括数据采集模块,数据存储及处理模块,机器学习算法平台,故障诊断、分析及预测模块。

该系统首先预测风力发电机在未来一段时间内发生故障停机的概率,并对即将发生的故障,通过分析模型的预测依据,实现对风力发电机的故障预测:

①选取样本:100台up82型号风机2015-2017年秒测点数据、故障导致风电机组停机记录数据、风电场气象数据;

②构造特征:最终选取上线与温度、转速、风速等当前及历史测量值有关系的数据构造特征,并生产组合特征、时序特征;

③模型训练:最终选用gbdt模型和lstm模型,进行优化调参。

gbdt模型是一个由很多棵回归树组成的决策森林,预测结果是所有决策树的预测结果加权之和。gbdt模型共包含6个可调参数,分别为:学习率、单棵树的最大深度、树的棵数、最小叶子权重、最小划分阈值、l2正则;

lstm(longshort-termmemory)是长短期记忆网络,是一种时间递归神经网络,适合于处理和预测时间序列中间隔和延迟相对较长的重要事件。它在算法中加入了一个判断信息有用与否的“处理器”,这个处理器作用的结构被称为cell。一个cell当中被放置了三扇门,分别叫做输入门、遗忘门和输出门。一个信息进入lstm的网络当中,可以根据规则来判断是否有用。只有符合算法认证的信息才会留下,不符的信息则通过遗忘门被遗忘。

调参工作是不断建模寻找更好结果的过程,项目组对gbdt模型和lstm模型进行多轮调参,最终选择到了一组最合适的参数配置,使得模型在训练集和评估集中表现稳定。

④模型评估:

某个分数阈值下:召回率=

召回率是一种算法模型评价指标,模型算法的准确度是根据召回率来计算结果来判断。召回率为提取出的正确信息条数与样本中的信息条数的比值,recall=tp/(tp+fn)(tp:被正确地划分为正例的个数,即实际为正例且被分类器划分为正例的实例数;fn:被错误地划分为负例的个数,即实际为正例但被分类器划分为负例的实例数)。

例如:预测发生故障且实际发生故障的次数为a,未预测发生故障但是实际发生故障的次数为b,则故障预测判定的召回率recall=a/(a+b)。

基于大数据平台并综合运用梯度决策树、长短期预测模型等方法对齿轮箱、发电机等重要部件构建故障矩阵预测模型,针对温油、传动、制动等方面影响较大的故障进行在线提前预测,实现风电机组重点故障诊断、预测等,且预测召回率达到98%以上。

系统故障处理:

基于风电机组故障预测结果,采取不处理、复位、维护、维修等不同的处理方式,根据需要检修或维护的机组状态,制订检修维护计划,并对检修维护的最佳时机、标准工艺以及备品备件管理等制订制定详细、具体、严格的处理措施,形成风电机组由事后、事中维护向事前预防性维护的转变,有效降低检修成本,提高设备可利用率,实现风电场的智能化设备检修。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1