基于数据驱动的风机故障识别方法

文档序号:33557920发布日期:2023-03-22 12:49阅读:58来源:国知局
基于数据驱动的风机故障识别方法

1.本发明涉及风力发电机领域,尤其涉及一种基于数据驱动的风机故障识别方法。


背景技术:

2.可再生能源在能源布局中赋予重要地位,由于环境、天气等因素的影响,风力发电机等发电设备容易发生损坏,及时发现故障、识别故障或预判设备状态是保障用户供电可靠性和电能质量的基础。现行的针对风机故障的识别方法存在以下弊端:1、频繁的检修会造成人力、物力的浪费;2、检修所造成的停电会影响用户用电需求;3、检修本身有可能影响设备健康;4、传统机理建模难以适应不同场景且方法较为复杂。
3.风机故障在线识别旨在基于风机发生故障前后运行数据,实现风机设备的运行状态分析,继而对风机进行故障识别,及时发现设备的潜在问题。在线评估相比计划检修而言,具有以下优势:1、以日常运行数据为主,不需要进行复杂机理建模,且泛化性强;2、不需要额外的停电检修安排;2、可实时识别风机状态、形成可视化平台。风机故障在线识别的痛点在于难以找到有效地找到普适的状态评价指标。传统的风机故障识别往往基于自身的单个或多个量进行测量,处于一个比较低的维度,难以利用设备多/高维数据继而形成有效(即标准差/波动较小)的设备故障状态识别指标。
4.风机故障识别的基础是状态检测和状态分析。状态检测即获取数据,状态分析即分析数据。状态监测的常用方法有:巡视检查、预防性试验、带电测试、在线监测。因此,在线监测不等于状态监测,它只是提供了数据的重要来源之一。设备状态评估除了要参考监测参数,还需考虑设备历次检修试验情况,以及同厂家同种设备性能及故障率等诸多因素,并通过对上述因素的综合分析方可得到。
5.综上,开展新型的基于数据驱动的风机故障识别方法研究成为当前的迫切需求。


技术实现要素:

6.有鉴于现有技术的上述缺陷,本发明提供了一种基于数据驱动的风机故障识别方法,包括:
7.s1、利用高维统计矩阵模型对风机数据建模;
8.s2、分析风机数据,进行特征降维;
9.s3、将风机数据进行可视化处理,通过机器学习模型,判断风机运行状态。
10.在本发明的较佳实施方式中,所述步骤s1包括:采集风机运行时的特征参量,建立风机数据的观测值和风机运行状态变化之间的关系,利用高维统计矩阵模型,将所述特征参量作为矢量进行拼接建模。
11.进一步地,所述特征参量包括:变桨桨距角、加速度峰值、加速度有效值、故障允许偏航等级、网侧有功功率、风速。
12.在本发明的一个优选实施方式中,所述步骤s2包括:
13.s21、将所述特征参量的历史数据进行预处理;
14.s22、通过机器学习模型对经过上述预处理的特征参量的历史数据进行筛选。
15.进一步地,所述步骤s21包括:将收集的特征参量的历史数据进行异常值删除和归一化处理,所述归一化处理包括将每个参量数据减去整体历史数据的统计均值,再除以整体历史数据的方差。
16.进一步地,所述步骤s21包括建立以采样时间窗口划分的数据矩阵。
17.进一步地,所述步骤s22通过xgboost模型实现。
18.进一步地,所述步骤s22包括:通过python内置函数将经过预处理的特征参量的历史数据随机平均分为n份,每份数据汇中包含一个时间段内的特征参量,轮流将其中的n-1份作为训练集,另一份作为验证集,n次评估结果的均值作为对算法精度的评估。
19.进一步地,所述评估具体包括:通过训练集训练xgboost模型,然后通过验证集评估从训练数据集计算的特征重要性;将xgboost模型封装在一个selectfrommodel实例中,选择训练集上的特征,使用所选择的特征子集训练模型,然后在相同的特征方案下对验证集进行评估。
20.在本发明的一个优选实施方式中,所述步骤s3包括:将历史数据的各个特征值随时间变化的趋势图示化,以显示正常状态与故障状态下的数据曲线;经步骤s2处理的数据被输入机器学习模型,机器学习模型经过学习后输出表示正常或故障的0/1标识符并在数据曲线上显示。
21.本发明的与现有技术相比具有以下有益效果:1、本发明利用采集的风机相关数据进行状态的学习和判别方法,不依赖于物理机理模型;通过分析风机历史数据,利用机器学习模型在训练集寻找特征参量与状态标签之间的内在联系。2、本发明基于大数据的高维统计特性,适用范围广泛、稳健度高和安全性可靠。3、本发明对于大力发展可再生能源,保证风机设备高效运维与稳定运行具有非常重要的实践价值。
22.以下将结合附图对本发明的构思、具体结构及产生的技术效果作进一步说明,以充分地了解本发明的目的、特征和效果。
附图说明
23.图1是本发明的基于数据驱动的风机故障识别方法的流程图;
24.图2是本发明的一个较佳实施例的特征筛选流程图。
具体实施方式
25.以下参考说明书附图介绍本发明的多个优选实施例,使其技术内容更加清楚和便于理解。本发明可以通过许多不同形式的实施例来得以体现,本发明的保护范围并非仅限于文中提到的实施例。
26.在附图中,结构相同的部件以相同数字标号表示,各处结构或功能相似的组件以相似数字标号表示。附图所示的每一组件的尺寸和厚度是任意示出的,本发明并没有限定每个组件的尺寸和厚度。为了使图示更清晰,附图中有些地方适当夸大了部件的厚度。
27.如图1所示,本发明的基于数据驱动的风机故障识别方法包括:
28.s1、利用高维统计矩阵模型对风机数据建模;
29.s2、分析风机数据,进行特征降维;
30.s3、将风机数据进行可视化处理,通过机器学习模型,判断风机运行状态。
31.上述步骤s1具体可以包括:采集风机运行时的特征参量,建立风机数据的观测值和风机运行状态变化之间的关系,利用高维统计矩阵模型,将所述特征参量作为矢量进行拼接建模。上述特征参量可以包括:变桨桨距角、加速度峰值、加速度有效值、故障允许偏航等级、网侧有功功率、风速。
32.上述步骤s2具体可以包括:
33.s21、将特征参量的历史数据进行预处理;
34.s22、通过机器学习模型对经过上述预处理的特征参量的历史数据进行筛选。
35.进一步地,步骤s21可以包括:将收集的特征参量的历史数据进行异常值删除和归一化处理,所述归一化处理包括将每个参量数据减去整体历史数据的统计均值,再除以整体历史数据的方差。优选地,可以建立以采样时间窗口划分的数据矩阵。
36.进一步地,步骤s22可以包括:通过python内置函数将经过预处理的特征参量的历史数据随机平均分为n份,每份数据汇中包含一个时间段内的特征参量,轮流将其中的n-1份作为训练集,另一份作为验证集,n次评估结果的均值作为对算法精度的评估。例如,可以通过python内置函数将经过预处理的特征参量的历史数据随机平均分为5份,每份数据汇中包含一个时间段内的特征参量,轮流将其中的4份作为训练集,另一份作为验证集,5次评估结果的均值作为对算法精度的评估。
37.根据本发明的实施方式,上述评估具体包括:通过训练集训练xgboost模型,然后通过验证集评估从训练数据集计算的特征重要性;将xgboost模型封装在一个selectfrommodel实例中,选择训练集上的特征,使用所选择的特征子集训练模型,然后在相同的特征方案下对验证集进行评估。
38.根据本发明的实施方式,通过机器学习模型对特征进行筛选,xgboost根据结构分数的增益情况计算出选择哪个特征作为分隔点,而某个特征的重要性可以根据在所有树中的平均增益来判断,即计算该特征在所有树中的平均增益,增益越大说明该特征越重要。如图2所示,特征筛选流程可以包括:
[0039]-输入某日历史数据;
[0040]-selectfrommodel模型输出用于特征选择的阈值;
[0041]-输出选择特征的索引值;
[0042]-输出选择特征的名称。
[0043]
上述步骤s3具体可以包括:将历史数据的各个特征值随时间变化的趋势图示化,以显示正常状态与故障状态下的数据曲线;经步骤s2处理的数据被输入机器学习模型,机器学习模型经过学习后输出表示正常或故障的0/1标识符并在数据曲线上显示。具体地,生成特征参量随时间变化的趋势图,即生成以横轴表示时间,纵轴表示特征参量数值的趋势图,以加速度作为特征参量为例,可以显示出故障发生前后加速度峰值、加速度有效值、x轴加速度、y轴加速度的幅值出现明显变化,并且在无故障时间段示出沿横轴延伸、纵轴数值为0的直线,在发生故障时间段示出沿横轴延伸、纵轴数值为1的直线,以将故障发生前后的对比明显化。
[0044]
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此,凡本技术领域中技术人员
依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1