一种改进RNN网络的风机结冰预测方法与流程

文档序号:31720752发布日期:2022-10-04 23:12阅读:201来源:国知局
一种改进RNN网络的风机结冰预测方法与流程
一种改进rnn网络的风机结冰预测方法
技术领域
1.本发明属于风电故障预测技术领域,具体涉及一种改进rnn网络的风机结冰预测方法。


背景技术:

2.低温环境下叶片结冰是风电设备维护中的一个全球性问题。叶片附着在大量冰块上,改变了风机叶片的共振频率,进而改变了叶片的动态响应,存在叶片断裂的风险,严重影响风机运行的安全性和效率。风机叶片scada(监控与采集)系统在实际功率和理论值与触发报警严重不一致时,一般会有结冰检测和除冰系统。然而,在大多数情况下,当系统触发报警时,冻结现象严重,风机叶片的运行已经处于极大的风险之中。为了提高除冰系统的效率、减少风机叶片容量损失和叶片运行风险,迫切需要一种风机叶片结冰故障预测算法。
3.随着计算机技术的不断发展,数据的采集和存储变得越来越便宜。通过对数据的挖掘和建模,可以预测和确定一定的后续缺陷,确保现有的顺从维修方式转化为主动预测维修方式,有效降低风电设备的人工成本和维修成本。与传统风机结冰故障检测方法相比,这种方法并不过分依赖专业知识。
4.风机scada数据必须考虑数据的真实性,在实际工业生产过程中,由于测量仪器或变送器的故障、测量数据与不真实数据、离群值、缺失点和异常样本的异常干扰和混合等原因,数据受到影响。此外,风力发电机叶片结冰故障需要及时预警,但是对于海量的高维风机scada系统数据,如果将收集到的大量数据不经分析就扔进学习模型中,无法充分发挥模型的作用,而且过多的冗余信息会造成预测结果的混乱和预测时间的增加。


技术实现要素:

5.为解决现有技术中存在的技术问题,本发明的目的在于提供一种改进rnn网络的风机结冰预测方法。
6.为实现上述目的,达到上述技术效果,本发明采用的技术方案为:
7.一种改进rnn网络的风机结冰预测方法,包括以下步骤:
8.首先进行数据预处理,随后采用miv评价指标与t-分布对scada特征进行降维,再输入rnn模型,用于对风力发电机的scada数据中的风速、功率、机舱温度进行时间序列上的有效预测,实现对叶片结冰故障机理进行评价。
9.进一步的,所述数据预处理的步骤包括:
10.对风机scada数据进行贴标签,结冰的标签为“1”,未冻结的标签为“0”,其余的被认为是标签为“2”的无效数据,剔除无效数据,采用smote算法处理不平衡数据。
11.进一步的,采用smote算法处理不平衡数据的公式为:
12.x
new
=xi+rand(0,1)
×
|x
i-xn|
13.式中,xi为某一少类样本,即覆冰样本,xn为xi的一个邻近样本,最终生成新样本x
new
,最终调整覆冰样本与正常样本比例为1∶1。
14.进一步的,所述miv评价指标通过以下方法计算得到:
15.首先,训练一个bp神经网络;然后在原值的基础上,对训练样本p中的每个自变量加减10%,形成两个新的训练样本p1和p2,作为模拟样本,利用建立的网络进行仿真,得到了两个仿真结果a1和a2,并计算出a1和a2的差值,即自变量对输出的影响变化值iv,求iv的平均值,得到miv值,计算每个自变量的miv值,来反映神经网络中权重矩阵的变化,按降序排序,剔除miv小于1的变量。
16.进一步的,所述t-分布对scada特征进行降维的步骤包括:
17.sne将欧几里德距离转换为条件概率来表示点之间的相似度。给定一个n(样本数)的高维数据x1,x2...xn,tsne首先计算概率p
ji
,与数据点xi和xj之间的相似度成正比,将高维欧氏距离转换为相似度的条件概率,即:
[0018][0019]
对于低维,指定高斯分布的均方差为0.5,因此,两者的相似之处如下:
[0020][0021]
通过优化两个概率分布之间的距离(kl散度),目标函数表示为:
[0022][0023]
其中,pi是在给定点xi处剩余数据点的条件概率分布;
[0024]
sne在参数选择时需要多次运行以确定一些难以优化的超参数,tsne采用t分布代替高斯分布来表示基于sne的两点之间的相似性,有效避免拥塞和优化问题。使用t分布后,概率p
ji
为:
[0025][0026]
进一步的,网络优化的梯度为:
[0027][0028]
与现有技术相比,本发明的有益效果为:
[0029]
本发明公开了一种改进rnn网络的风机结冰预测方法,为一种miv-tsne特征降维方法,首先进行数据预处理,随后采用miv评价指标与t-分布对scada特征进行降维,再输入rnn模型,用于对风力发电机的scada数据中的风速、功率、机舱温度进行时间序列上的有效预测,实现对叶片结冰故障机理进行评价,通过优化模型参数可提高预测精度。本发明采用miv评价指标与t-分布对scada特征进行降维,再输入rnn模型进行预测,建立一个预测风机叶片是否冻结的模型,从而实现对叶片结冰故障机理进行评价,将工业数据与基于特征选择、数据预处理和分类算法的技术相结合,增强了风机结冰预测能力,相较于传统基于数据驱动的风机结冰故障预测,可以有效减小模型不确定性带来的影响,缩短计算时间、提升预测效率,可用于离线scada数据故障预测,也可融入在线实时scada数据采集系统进行预测。
附图说明
[0030]
图1为本发明的流程图。
具体实施方式
[0031]
下面对本发明进行详细阐述,以使本发明的优点和特征能更易于被本领域技术人员理解,从而对本发明的保护范围做出更为清楚明确的界定。
[0032]
以下给出一个或多个方面的简要概述以提供对这些方面的基本理解。此概述不是所有构想到的方面的详尽综览,并且既非旨在指认出所有方面的关键性或决定性要素亦非试图界定任何或所有方面的范围。其唯一的目的是要以简化形式给出一个或多个方面的一些概念以为稍后给出的更加详细的描述之序。
[0033]
名词解释:
[0034]
rnn:循环神经网络。
[0035]
如图1所示,一种改进rnn网络的风机结冰预测方法,包括以下步骤:
[0036]
首先进行数据预处理,随后采用miv评价指标与t-分布对scada特征进行降维,再输入rnn模型进行预测,建立一个预测风机叶片是否冻结的模型,用于对风力发电机的scada数据中的风速、功率、机舱温度进行时间序列上的有效预测,实现对叶片结冰故障机理进行评价。具体来说,首先对数据进行预处理以消除明显的无冰数据,然后利用欠采样和过采样技术进一步平衡数据集。其次,根据miv评价结果以及特征分布情况对特征进行选择。最后,将特征值输入循环神经网络,对叶片结冰故障机理进行评价。
[0037]
scada数据中的每个样本,即数据矩阵的每一行,都有自己的时间戳,这些时间戳决定了风机叶片在每个时期是否冻结。每个数据都贴上了标签,结冰的标签为“1”,未冻结的标签为“0”,其余的被认为是标签为“2”的无效数据。计算每个变量的miv评价指标,按降序排序,剔除miv评价指标小于1的变量。使用tsne算法将上一步处理后的数据缩减到指定的维数。最后将数据输入rnn模型进行训练和预测。
[0038]
一种改进rnn网络的风机结冰预测方法,具体包括以下步骤:
[0039]
步骤1:处理不平衡数据
[0040]
类别不平衡即在分类任务中,两种类别的训练集数据的数目存在很大差异。在机器学习过程中,如果不同类别的样本数目差距过大,这种情况下训练出来的模型如果一直将输出判别为样本数目大的类别,就会得到很高的正确率,但实际上训练出的模型并没有起到分类作用。采用smote算法处理scada数据中的不平衡样本,其公式如下:
[0041]
x
new
=xi+rand(0,1)
×
|x
i-xn|
[0042]
式中,xi为某一少类样本,即覆冰样本,xn为xi的一个邻近样本,最终生成新样本x
new
,最终调整覆冰样本与正常样本比例为1∶1。
[0043]
每个样本,即数据矩阵的每一行,都有自己的时间戳,这些时间戳决定了风机叶片在每个时期是否冻结。每个数据都贴上了标签,结冰的标签为“1”,未冻结的标签为“0”,其余的被认为是标签为“2”的无效数据。
[0044]
步骤2:特征降维
[0045]
采用数据驱动方法时,数据样本数量多、检测变量多,计算量大,敏感特征源和风力机叶片结冰可能预测不准确。工业大数据的第三个特征是数据集特征之间明确或潜在的
耦合关系。风机检测系统采集26个变量。风速与有功功率的关系可以在一定程度上表征冰的存在。如果差异较大或时间轴极不稳定,叶片很可能已经冻结。风叶结冰影响发电机转速与风速的关系类似,发电机转速与风速的类似关系受到叶片结冰的影响。用同样的方法拟合法向速度曲线,计算出每组数据的速度差并将其作为一个参数来考虑。由于环境温度是影响风机叶片结冰的最关键因素,因此必须广泛考虑。随后,对其他变量的有效特征进行了分析,没有发现有冰和无冰条件之间有明显的区别。最终分析后,考虑电网侧有功功率、风速、舱室温度等三个变量进行特征选择。
[0046]
使用平均影响值(miv)来反映神经网络中权重矩阵的变化。具体计算过程如下:
[0047]
首先,训练一个bp神经网络;然后在原值的基础上,对训练样本p中的每个自变量加减10%,形成两个新的训练样本p1和p2,作为模拟样本。利用建立的网络进行仿真,得到了两个仿真结果a1和a2,并计算出a1和a2的差值,即自变量对输出的影响变化值iv。然后,根据观测到的粒子数求iv的平均值,即均值iv或miv值。计算每个自变量的miv值,以确定其影响程度。利用该方法对28维数据进行分析,计算出miv值。计算每个变量的miv评价指标后,按降序排序,剔除miv小于1的变量。
[0048]
sne将欧几里德距离转换为条件概率来表示点之间的相似度。给定一个n(样本数)的高维数据x1,x2...xn,tsne首先计算概率p
ji
,与数据点xi和xj之间的相似度成正比,将高维欧氏距离转换为相似度的条件概率,即:
[0049][0050]
对于低维,我们可以指定高四分布的均方差为0.5,因此,两者的相似之处如下:
[0051][0052]
通过优化两个概率分布之间的距离(kl散度),目标函数表示为:
[0053][0054]
其中,pi是在给定点xi处剩余数据点的条件概率分布。但sne在参数更新时,除了引入当前梯度外,还引入了以前梯度积累的指数衰减项,容易出现拥塞问题(集群聚在一起,无法区分)。sne在参数选择时需要多次运行以确定一些难以优化的超参数。tsne采用t分布代替高斯分布来表示基于sne的两点之间的相似性,可以有效地避免拥塞和优化问题。使用t分布后,p
ji
为:
[0055][0056]
步骤3:rnn预测
[0057]
最后将数据输入rnn模型进行训练和预测。
[0058]
最终,网络优化的梯度为:
[0059][0060]
与现有技术相比,本发明至少具有以下技术效果:
[0061]
风电场通常采集每台风机的scada数据,scada数据由多个特征组成。本发明通过对scada中有效特征的提取,将风场内的主要影响风机结冰因素考虑在内,并通过循环神经网络对风机的结冰故障进行预测,可用于离线scada数据故障预测,也可融入在线实时scada数据采集系统进行预测。
[0062]
本发明未具体描述的部分或结构采用现有技术或现有产品即可,在此不做赘述。
[0063]
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1