基于集成深度神经网络的风力发电机叶片结冰诊断方法与流程

文档序号:16934603发布日期:2019-02-22 20:35阅读:213来源:国知局
基于集成深度神经网络的风力发电机叶片结冰诊断方法与流程
本发明属于设备维护领域,进一步涉及风力发电设备的预测性维护,具体为一种基于集成深度神经网络的风力发电机叶片结冰诊断方法。可用于快速准确地对风力发电机进行故障诊断。
背景技术
:风力发电机通过叶片来获取风能,并将风能转化为机械能,从而驱动发电机发电,进而实现风能到电能的转化。因此,叶片是保证风力发电机可靠高效运转的核心组件之一。在不同地域中,风力发电机会面对不同环境,而我国的风力资源丰富区域多处于气温较低的西北部地区,同时随着现代风力发电机设计功率的不断提升,叶片和塔筒高度不断增加,往往能在冬季里触摸到较低的云层。在低温高湿环境下,风机叶片极容易出现结冰问题,这也是目前风力发电设备维护所面临的全球性难题之一。低温高湿环境所引发的叶片结冰问题通常会改变叶片叶形,破坏叶片气动特性,并造成叶片材料、结构性能以及载荷分布的改变,从而导致风机发电效能下降,并对风机的安全运行造成极大的威胁。因此,为了有效提高风机运行效率并保障运行安全,对风力发电机叶片结冰诊断进行深入研究是十分必要的。从目前的公开的资料来看,对风力发电机叶片结冰诊断主要通过在叶片上额外添加结冰监测装置。例如,申请公布号为cn207701300u,名称为“风力发电机叶片结冰在线监测装置”的专利申请,公开了一种风力发电机叶片结冰在线监测装置。该在线监测装置通过在叶片内表面上加装传感器,通过数据采集单元采集叶片载荷信号和振动信号,由此获得风机叶轮设备的运行状态信息。该方法虽然能够实现对叶片结冰状态的监测,然而,其在风力发电机叶片上加装传感器,不仅改变了风力发电机的叶片结构、增加了成本;而且由于加装的传感器长时间暴露于风力发电机叶片所处的恶劣环境之下,会加速传感器功能的退化,导致其使用寿命较短,若未及时更换还会严重影响结冰诊断的准确性。scada系统是风力发电机的标准配置,其采集的scada数据量巨大,且蕴含着与叶片结冰密切相关的有价值信息。挖掘scada数据中的有价值信息,仅靠人工方法几乎无法做到。目前,深度学习方法的兴起为故障诊断领域带来了新的研究方向。其中,堆栈式自编码器模型因其结构简单、表征能力强等特点已经广泛使用。例如,申请公布号为cn106919164a,名称为“基于堆栈自动编码器的水利机组故障分析方法”的专利申请,公开了一种基于堆栈自动编码器的水利机组故障分析方法。该方法采用堆栈式自编码器对水利机组的数据集进行深度学习和训练,实现了水利机组状态特征的自适应学习和水利机组健康状态的评估。然而,其不足在于堆栈式自编码器模型的泛化能力较弱,导致了评估结果的准确性较低,限制了堆栈式自编码器模型的实际工程应用。技术实现要素:本发明的目的在于克服上述现有技术存在的缺陷,提供了一种基于集成深度神经网络的风力发电机叶片结冰诊断方法,旨在不引入其他测量设备的前提下,实现对风力发电机叶片结冰的实时监测,并提高风力发电机叶片结冰诊断的准确率。为实现上述目的,本发明采取的技术方案包括如下步骤:(1)采集风力发电机运行的历史数据;(2)对采集到的历史数据进行数据预处理,得到预处理后的历史数据;(3)对预处理后的历史数据进行数据平衡处理,获得训练数据集x_label;(4)构建集成深度神经网络并利用训练数据集x_label对其进行训练,获取训练后的集成深度神经网络模型,具体如下:(4a)搭建堆栈式自编码器模型的基本结构:设定堆栈式自编码器模型的个数l、每个自编码器的输入层节点数ul以及隐层节点数vl,其中l=1,2,…,l,l≥3且为奇数,第k个堆栈式自编码器模型的编号为lk,且k=1,2,...,l;第一个自编码器的输出层节点数u1等于训练数据集的特征个数,第一个之后自编码器的输入层节点数ut与其前一个自编码器的隐含层节点数vt-1相等,其中t=2,3,…,l;(4b)训练堆栈式自编码器模型:(4b1)令k=1;(4b2)训练编号为lk的自编码器模型:(4b2a)初始化权重矩阵w,学习率η及偏移向量b'、b”,并设定最大循环次数为i;(4b2b)去除训练数据集x_label的类标签,得到无标签训练数据集x:x={xi,其中x∈ru,i∈{0,1,2,……,n-1,n}},其中,n为训练数据集的样本个数,i为样本序号,u为每个样本对应空间向量的维度;将无标签训练数据集x作为编号lk的自编码器模型的输入;(4b2c)根据如下公式计算得到编号为lk的自编码器模型隐含层的输出yk:根据如下公式计算得到编号为lk的自编码器模型输出层的输出:其中,wt为权重矩阵w的转置;(4b2d)令j=1;(4b2e)根据公式更新参数,其中为编号为lk的自编码器模型输出层的输出中样本序号为i的向量;wj+1,b′j+1,b″j+1为第j次参数更新的结果;(4b2f)判断j是否等于i,若是,则取第i次参数更新的结果得到训练后编号为lk的自编码器模型l'k并进入步骤(4b3);反之对j加1后返回步骤(4b2e);(4b3)将上一步训练后编号为lk的自编码器模型l'k的隐含层hk作为编号为lk+1的自编码器模型的输入层,重复步骤(4b2c)-(4b2f)得到编号lk+1训练后的自编码器模型l'k+1;(4b4)判断k是否等于l-1,若是则得到训练后的堆栈式自编码器模型q;反之,对k加1后返回步骤(4b3);(4c)搭建集成深度神经网络模型并进行训练:(4c1)令k=1;(4c2)提取训练后的堆栈式自编码器模型q中前k个自编码器模型,得到仅包含有k个自编码器模型的堆栈式自编码器模型nk,在模型nk的最后一个自编码器模型的隐含层hk后面连接一个softmax分类器mk,并将模型nk与softmax分类器mk作为集成深度神经网络模型的第lk个基分类器;(4c3)训练第lk个基分类器:定义假设函数hθ(x(i))表达式如下:其中:·t为转置操作,为类标签的取值,为类标签的取值为时数据样本属于该类的概率值;将训练数据集x_label作为第lk个基分类器的输入,利用bp算法对该基分类器进行训练,然后得到经过微调的自编码器模型以及参数θ,从而完成第lk个基分类器的训练;(4c4)判断k是否等于l,若是,则完成对l个基分类器的训练,即得到训练后的集成深度神经网络模型;反之,对k加1后返回步骤(4c2);(5)对新流入风力发电机的实时数据进行数据预处理,得到预处理后的实时数据data;(6)将经过预处理后的实时数据data输入训练后的集成深度神经网络模型中,通过该模型对风力发电机的叶片结冰状态进行诊断,具体步骤如下:(6a)设风力发电机的叶片状态为r且r∈{0,1},定义状态0为结冰状态、状态1为未结冰状态;(6b)将实时数据data输入集成深度神经网络模型,得到每个基分类器的输出hθ,λ(x(i))=[pλ(y'i=r|x'i;θ)],其中λ为基分类器的编号,λ=1,2,…,l,pλ(y'i=r|x'i)表示实时数据的第i个样本属于状态r的概率;(6c)分别取λ=1,2,…,l得到p1,p2,…,pl,即l个基分类器各自的输出;(6d)采用投票法对所有基分类器的输出结果进行最终判断:(6d1)统计p1(y'i=0|x'i),p2(y'i=0|x'i),…,pl(y'i=0|x'i)中数值大于0.5的个数,并将其个数记为s;(6d2)若则判定为风力发电机的叶片处于结冰状态,反之判定其为正常未结冰。本发明与现有技术相比,具有如下优点:第一、由于本发明采用对风力发电机已有运行信息进行分析处理的方式,获取该风力发电机叶片结冰诊断结果,从而无需在风力发电设备上增设额外的结冰测量装置;本发明不引入额外测量设备可大大降低设备维护人员的工作强度,并且节约不必要的硬件成本以及人工成本;第二、由于本发明采用集成深度神经网络模型实现风力发电机叶片结冰诊断,在诊断过程中,集成深度神经网络模型自适应地学习风力发电机运行数据的隐含信息,并训练多个基分类器,通过对多个分类器的结果进行综合分析,得到风力发电机叶片结冰的诊断结果;利用该模型与使用堆栈式自编码器等分类器相比具有更强的泛化能力和诊断精度,因此,本发明较大程度地提高了风力发电机叶片结冰诊断的准确率。附图说明图1为本发明的实现流程图;图2为本发明集成深度神经网络的结构示意图。具体实施方式以下结合附图和具体实施例,对本发明作进一步详细说明:本实例使用的数据集来源同一台风力发电机的连续两个月的scada数据和叶片结冰日志数据,其中scada数据中具体包含参数如表1所示。本实例采用第一个月的数据集作为采集的运行数据,建立集成深度神经网络模型,以第二个月的数据集作为新流入的实时数据,对模型进行测试。表1参照图1、一种基于集成深度神经网络的风力发电机叶片结冰诊断方法,包括如下步骤:步骤一:采集风力发电机运行的历史数据,包括风力发电机运行的scada数据和叶片结冰日志数据;步骤二:对采集到的历史数据进行数据预处理,得到预处理后的历史数据;(2a)去除采集到的历史数据中的异常点,得到无异常值的历史数据;(2b)对无异常值的历史数据进行无量纲化处理,得到预处理后的历史数据。步骤三:采用smote算法,对预处理后的历史数据进行数据平衡处理,获得训练数据集x_label;本步骤中的数据平衡处理亦可通过平衡随机森林算法、smoteboost算法、metacost算法或adacost算法来实现。步骤四:构建集成深度神经网络并利用训练数据集x_label对其进行训练,获取训练后的集成深度神经网络模型,具体如下:集成深度神经网络的基本结构由堆栈式自编码器连接分类器构成,其中每一个自编码器的隐藏层都连接着一个分类器,即:若干个自编码器堆叠形成的堆栈式自编码器与连接在每个自编码器隐藏层之后的分类器共同组成了集成深度神经网络。(4a)搭建堆栈式自编码器模型的基本结构:设定堆栈式自编码器模型的个数l、每个自编码器的输入层节点数ul以及隐层节点数vl,其中l=1,2,…,l,l≥3且为奇数,第k个堆栈式自编码器模型的编号为lk,且k=1,2,...,l;第一个自编码器的输出层节点数u1等于训练数据集的特征个数,第一个之后自编码器的输入层节点数ut与其前一个自编码器的隐含层节点数vt-1相等,其中t=2,3,…,l;本实施例取l=3,且3个自编码器的隐含层节点数分别是173、115、59。(4b)训练堆栈式自编码器模型:(4b1)令k=1;(4b2)训练编号为lk的自编码器模型:(4b2a)采用随机数法初始化权重矩阵w,取学习率η=0.001,偏移向量b'、b”设定为并设定最大循环次数i=200;(4b2b)去除训练数据集x_label的类标签,得到无标签训练数据集x:x={xi,其中x∈ru,i∈{0,1,2,……,n-1,n}},其中,n为训练数据集的样本个数,i为样本序号,u为每个样本对应空间向量的维度;本实例共有186626个训练数据集样本,每个样本对应空间向量的维度为17维;将无标签训练数据集x作为编号lk的自编码器模型的输入;(4b2c)根据如下公式计算得到编号为lk的自编码器模型隐含层的输出yk:根据如下公式计算得到编号为lk的自编码器模型输出层的输出其中,wt为权重矩阵w的转置;(4b2d)令j=1;(4b2e)根据公式更新参数,其中为编号为lk的自编码器模型输出层的输出中样本序号为i的向量;wj+1,b'j+1,b”j+1为第j次参数更新的结果;(4b2f)判断j是否等于200,若是,则取第200次参数更新的结果得到训练后编号为lk的自编码器模型l'k并进入步骤(4b3);反之对j加1后返回步骤(4b2e);(4b3)将上一步训练后编号为lk的自编码器模型l'k的隐含层hk作为编号为lk+1的自编码器模型的输入层,重复步骤(4b2c)-(4b2f)得到编号lk+1训练后的自编码器模型l'k+1;(4b4)判断k是否等于2,若是则得到训练后的堆栈式自编码器模型q;反之,对k加1后返回步骤(4b3);(4c)搭建集成深度神经网络模型并进行训练:集成深度神经网络模型由l个基分类器组成,对每个基分类器进行构建并训练后得到集成深度神经网络模型。(4c1)令k=1;(4c2)提取训练后的堆栈式自编码器模型q中前k个自编码器模型,得到仅包含有k个自编码器模型的堆栈式自编码器模型nk,在模型nk的最后一个自编码器模型的隐含层hk后面连接一个softmax分类器mk,并将模型nk与softmax分类器mk作为集成深度神经网络模型的第lk个基分类器;(4c3)训练第lk个基分类器:定义假设函数hθ(x(i))表达式如下:其中:·t为转置操作,为类标签的取值,为类标签的取值为时数据样本属于该类的概率值;将训练数据集x_label作为第lk个基分类器的输入,利用bp算法对该基分类器进行训练,然后得到经过微调的自编码器模型以及参数θ,从而完成第lk个基分类器的训练;(4c4)判断k是否等于3,若是,则完成对3个基分类器的训练,即得到训练后的集成深度神经网络模型,如图2所示;反之,对k加1后返回步骤(4c2);步骤五:对新流入风力发电机的实时数据进行数据预处理,得到预处理后的实时数据data,具体如下(5a)去除新流入的实时数据中的异常点,得到无异常值的实时数据;(5b)对所述无异常值的实时数据进行无量纲化处理,得到预处理后的实时数据data:data={(x'i,y'i),其中x'∈ru,i∈{0,1,2,……,n'-1,n'}},其中,n'为数据集data的样本个数,u为每个样本对应空间向量的维度;本实例共有187521个数据集data样本,每个样本对应空间向量的维度为17维;步骤六:将经过预处理后的实时数据data输入训练后的集成深度神经网络模型中,通过该模型对风力发电机的叶片结冰状态进行诊断,以2015年12月数据的第一条数据为例,具体判断步骤如下:(6a)设风力发电机的叶片状态为r且r∈{0,1},定义状态0为结冰状态、状态1为未结冰状态;(6b)将实时数据data输入集成深度神经网络模型,得到每个基分类器的输出hθ,λ(x(i))=[pλ(y'i=r|x'i;θ)],其中λ为基分类器的编号,本实施例中λ=1,2,3,pλ(y'i=r|x'i)表示实时数据的第i个样本属于状态r的概率;(6c)分别取λ=1,2,3得到p1,p2,p3,即3个基分类器各自的输出;(6d)采用投票法对所有基分类器的输出结果进行最终判断:(6d1)统计p1(y'i=0|x'i),p2(y'i=0|x'i),p3(y'i=0|x'i)中数值大于0.5的个数,并将其个数记为s,对于该条数据来说s=3;(6d2)判断s与的大小关系,若则判定为风力发电机的叶片处于结冰状态,反之判定其为正常未结冰。对于该条数据而言,由于3>1.5,故判定叶片处于结冰状态。本发明的效果可以通过以下仿真结果进一步说明:1.仿真条件和仿真内容:在中央处理器为intel(r)core(tm)i5-75003.40ghz、内存8g、windows7操作系统上,运用matlabr2014b软件进行仿真。将2015年12月采集的风力发电机相关数据输入到模型中,并把模型参数按照上述内容所设定的值输入到模型中,获取数据样本的输出结果并进行分析。2.结果分析:本发明应用采用对叶片结冰诊断的准确率和mcc系数进行评测。由于风力发电机新流入的实时数据为不平衡数据集,mcc系数适用于不平衡数据集的结果评价。因此采用准确率和mcc系数共同对结果进行评估,具有较高的准确性。准确率和mcc系数均可由混淆矩阵计算获得,混淆矩阵如表2所示。表2准确率和mcc系数计算公式为采用多组对比实验验证本发明的性能,具体的对比实验为:第一组,采用堆栈式自编码器模型对风力发电机叶片结冰进行诊断;第二组,采用随机森林和支持向量机对风力发电机叶片结冰进行诊断。训练模型所用的输入数据均为本实施例采集的运行数据,评估模型所用的输入数据均为本实施例新流入的实时数据,实验结果如表3所示。表3算法名称准确率mcc系数集成深度神经网络0.95110.7335堆栈式自编码器0.91120.6022随机森林0.92290.3838支持向量机0.92510.4568分析表4,由准确率结果可知,采用集成深度神经网络对风力发电机叶片结冰进行诊断,具有最高的准确性。由mcc系数结果可知,采用集成深度神经网络对风力发电机叶片结冰进行诊断,具有最高的mcc系数值,且相比于其他算法,mcc系数值得到了极大的提高,表明本发明对风力发电机叶片结冰诊断表现良好,具有较高的准确性和泛化能力。本发明未详细说明部分属于本领域技术人员公知常识。以上描述仅是本发明的一个具体实例,并未构成对本发明的任何限制。显然对于本领域的专业人员来说,在了解了本
发明内容和原理后,都可能在不背离本发明原理、结构的情况下,进行形式和细节上的各种修正和改变,但是这些基于本发明思想的修正和改变仍在本发明的权利要求保护范围之内。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1