一种基于状态参数重构误差的风电机组运行状态异常检测方法

文档序号:31606937发布日期:2022-09-21 11:02阅读:55来源:国知局
一种基于状态参数重构误差的风电机组运行状态异常检测方法

1.本发明属于新能源发电领域,具体涉及一种基于状态参数重构误差的风电机组运行状态异常检测方法。


背景技术:

2.风电场数据采集与监控系统提供了大量的风电机组运行数据,但其中绝大部分为机组健康运行数据,故障异常数据缺乏甚至难以获得,且当scada系统中风电机组状态参数发生越限报警时,机组的故障或异常往往已发展至一定程度。因此,如何有效地综合利用现有大量健康运行数据实现风电机组运行状态监测是所有风电研究者所要解决的难题。如果能够准确的辨识风电机组运行状态异常数据,对提高风电机组运行安全性、经济性和健康管理水平具有良好的实际应用价值。
3.目前基于scada数据的风电机组运行状态监测方法是通过对单一或少量机组状态参数的分析实现机组部件的运行状态监测和判断,难以全面反映机组整机的运行状态。


技术实现要素:

4.针对现有的基于scada数据的风电机组运行状态监测方法中通过单一或少量数据对机组运行状态判断结果低的问题,本发明提出了一种基于状态参数重构误差的风电机组运行状态异常检测方法,该方法包括:
5.s1:获取待检测数据;
6.s2:采用滑动窗口对待检测的数据进行处理,得到增广状态数据矩阵;
7.s3:将待检测数据输入训练好的sdae网络中,得到重构数据;
8.s4:根据增广状态数据矩阵和重构数据计算重构误差,根据重构误差计算监测指标;
9.s5:设置监测指标阈值和连续越限时间阈值;
10.s6:将计算出的监测指标与设置的监测指标阈值进行比较,若小大于设置的监测指标阈值,则执行步骤s7,否则返回步骤s1;
11.s7:计算重构数据的连续越限数,将连续越限数与设置的连续越限时间阈值进行对比,若大于连续越限时间阈值,则待检测数据为异常数据,否则待检测数据为噪声数据;所述连续越限数为:在监测的指标中出现连续多次超过设置的监测指标阈值的数量;
12.s8:根据异常数据得到风电机组运行状态的异常组件。
13.优选的,采用滑动窗口对待检测的数据进行处理的过程包括:
14.s21:设置滑动窗口的宽度和滑动窗口的数量;
15.s22:采用滑动窗口对待检测的数据进行采集;
16.s23:根据所有的滑动窗口采集的数据构建增广状态数据矩阵。
17.优选的,对sdae网络进行训练的过程包括:sdae网络包括第一dae模型和第二dae
模型;
18.步骤1:获取原始scada数据,采用滑动窗口对原始scada数据进行处理,得到原始数据的增广矩阵;
19.步骤2:初始化sdae网络参数,该参数包括初始加噪比c0、加噪比阈值cr20.步骤3:根据加噪比c0对增广矩阵进行加噪处理;
21.步骤4:将经过加噪处理后的增广矩阵数据输入到第一dae模型中口模型进行训练,得到第一权值,并更新加噪比;
22.步骤5:将更新后的加噪比与加噪比阈值进行对比,若不相等,则返回步骤3;若相等,则执行步骤6;
23.步骤6:将第一dae模型的隐藏层输出和初始加噪比c0输入到第二dae模型中进行训练,得到第二权值,并对加噪比进行更新;
24.步骤7:将更新后的加噪比与加噪比阈值进行对比,若小于加噪比阈值,则训练结束,输出训练参数,否则返回步骤6。
25.优选的,根据重构误差计算监测指标的公式为:
[0026][0027]
其中,tk表示监测指标,表示第k个正常样本的重构误差,n表示重构后的数据数量,u表示均值向量,cov-1
表示协方差矩阵的逆矩阵。
[0028]
优选的,设置监测指标阈值和连续越限时间阈值的过程包括:
[0029]
s51:获取系统正常运行的原始scada数据,并对数据进行预处理;对预处理后的数据进行相关性分析,得到机组各状态参数时间序列数据的短时自相关性;
[0030]
s52:采用滑动窗口对机组状态数据进行处理,得到系统正常运行的增广状态数据矩阵;
[0031]
s53:根据机组各状态参数时间序列数据的短时自相关性将scada数据数据输入到训练好的sdae网络中,得到第二重构数据;
[0032]
s54:根据重构数据和正常运行的增广状态数据矩阵计算机组正常数据的重构误差和监测指标;
[0033]
s55:根据机组正常数据的监测指标构确定监测指标阈值;
[0034]
s56:根据滑动窗口大小和监测指标连续越限的最大值构建连续越限数指标阈值。
[0035]
进一步的,对预处理后的数据进行相关性分析包括:采用综合相关性指标分析风电机组状态参数间的互相关性;采用自相关系数和偏自相关系数分析机组各状态参数时间序列数据的短时自相关性;根据scada系统采集的数据;计算时间序列延迟k阶的自相关系数;根据自相关系数计算数据的偏自相关系数。
[0036]
进一步的,偏自相关系数的表达为:
[0037][0038]
其中,表示第1个偏自相关系数,ρj表示第j个自相关系数,表示第k+1个偏自相关系数,k表示序列的长度。
[0039]
优选的,确定监测指标阈值的的过程包括:构建重构误差马氏距离的概率密度函数设置置信度α;根据概率密度函数计算机组状态监测指标小于监测指标阈值的概率值p(t《td);根据设置的置信度α和概率值p(t《td)反向确定监测指标阈值td。
[0040]
进一步的,计算机组状态监测指标小于监测指标阈值的概率值的公式为:
[0041][0042][0043]
其中,p表示机组状态小于监测指标阈值的概率值,表示重构误差马氏距离的概率密度函数,n表示样本个数数据,tk为样本数据中第k个样本数据点的监测指标,h为带宽参数,k(
·
)为核函数。
[0044]
优选的,连续越限数指标阈值的表达式为:
[0045]
qd=max(q
max
,β)
[0046]
其中,q
max
为训练数据的监测指标连续越限最大值,β为滑动窗口宽度。
[0047]
本发明的有益效果:
[0048]
本发明采用滑动窗口的方法对待检测的数据进行处理,得到增广状态数据矩阵,并将sdae网络重构后的数据与增广状态数据矩阵求取重构误差,将重构误差与设置的阈值进行比较,得到风电机组运行状态异常检测;将输入数据重构数据进行联系,使得最终的识别结果更准确;本发明设计了一种监测指标阈值和连续越限时间阈值的设置方法,通过该方式,使得设置阈值更精确,得到结果更准确;本发明对待检测的风电机组运行数据进行重构,通过重构误差和连续越限数判断运行数据异常状态,计算方便快捷,识别结果更准确。
附图说明
[0049]
图1为本发明的基于状态参数重构误差的风电机组运行状态异常检测方法流程图;
[0050]
图2为本发明的对对sdae网络进行训练的流程图。
具体实施方式
[0051]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完
整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0052]
一种基于状态参数重构误差的风电机组运行状态异常检测方法的具体实施方式,如图1所示,该方法包括:
[0053]
s1:获取待检测数据;
[0054]
s2:采用滑动窗口对待检测的数据进行处理,得到增广状态数据矩阵;
[0055]
s3:将待检测数据输入训练好的sdae网络中,得到重构数据;
[0056]
s4:根据增广状态数据矩阵和重构数据计算重构误差,根据重构误差计算监测指标;
[0057]
s5:设置监测指标阈值和连续越限时间阈值;
[0058]
s6:将计算出的监测指标与设置的监测指标阈值进行比较,若小大于设置的监测指标阈值,则执行步骤s7,否则返回步骤s1;
[0059]
s7:计算重构数据的连续越限数,将连续越限数与设置的连续越限时间阈值进行对比,若大于连续越限时间阈值,则待检测数据为异常数据,否则待检测数据为噪声数据;所述连续越限数为:在监测的指标中出现连续多次超过设置的监测指标阈值的数量;连续多次为至少qd次。
[0060]
s8:根据异常数据得到风电机组运行状态的异常组件。
[0061]
连续越限数:在采用scada系统对采集的原始运行数据进行不良数据识别和修正后得到的正常数据,在得到的数据中仍可能包含部分噪声数据,此类噪声数据会引起监测指标越限,但其连续越限时间较短,因此为了准确辨识机组运行状态,还需考虑监测指标的连续越限数指标q。q的阈值qd是根据正常样本数据的监测指标统计分布获得。在经过滑动窗口对数据进行处理后,得到增广状态数据矩阵,增广状态数据矩阵的连续β个数据点均包含原始数据的部分数据信息,因此当原始数据中某个数据为噪声数据时,将引起增广状态数据矩阵连续个数据点的监测指标越限,因此监测指标连续越限数最小值应为滑动窗口的宽度。
[0062]
采用滑动窗口对待检测的数据进行处理的过程包括:
[0063]
步骤(21)、采用机组正常状态的数据矩阵xn,设置滑动窗口的宽度为β,m个样本数量共有m-β+1个滑动窗口,记为第l个滑动窗口采集的第i个机组监测数据,则有公式:
[0064][0065]
其中,表示第(l+β-1)个滑动窗口采集的第i个监测数据,t表示转置。
[0066]
步骤(22)、得到的第l个滑动窗口数据s
l
为其中,表示第l个滑动窗口采集的第n个机组监测数据;
[0067]
步骤(23)、根据步骤(21)得到的第l个滑动窗口采集的第i个机组监测参量的数据和步骤(22)得到的第l个滑动窗口采集的数据,对状态参数数据采用滑动窗口处理,得到相
应的增广状态数据矩阵为y=[s
(1)
,s
(2)
,

,s
(m-β+1)
];其中,s
(m-β+1)
表示第m-β+1个滑动窗口采集的监测数据。
[0068]
如图2所示,对sdae网络进行训练的过程包括:sdae网络包括第一dae模型和第二dae模型;
[0069]
步骤1:获取原始scada数据,采用滑动窗口对原始scada数据进行处理,得到原始数据的增广矩阵;
[0070]
步骤2:初始化sdae网络参数,该参数包括初始加噪比c0、加噪比阈值c
t

[0071]
步骤3:根据加噪比c0对增广矩阵进行加噪处理;
[0072]
具体的,在得到增广状态数据矩阵yn后,根据初始加噪比c0,对矩阵yn加噪处理得到输入数据其中,c0表示初始加噪比,c
t
表示最终加噪比,c0》c1》

》c
t
,并且c
0-c1=

=c
t-1-c
t
=δc,δc》0;q()表示加噪处理的过程,δc表示两个加噪比的差值,是对加噪比的微调。
[0073]
步骤4:将经过加噪处理后的增广矩阵数据输入到第一dae模型中进行训练,得到第一权值,并更新加噪比;加噪比更新公式为:c
t
=c
t-1-δc。
[0074]
步骤5:将更新后的加噪比与加噪比阈值进行对比,若不相等,则返回步骤3;若相等,则执行步骤6;
[0075]
步骤6:将第一dae模型的隐藏层输出和初始加噪比c0输入到第二dae模型中进行训练,得到第二权值,并对加噪比进行更新;
[0076]
步骤7:将更新后的加噪比与加噪比阈值进行对比,若小于加噪比阈值,则训练结束,输出训练参数,否则返回步骤6。
[0077]
训练结束后模型输出的最优参数包括w1、b1、w2和b2及h,其中,w1表示第一个权值,b1表示第一个偏置量,w2表示第二个权值,b2表示第二个偏置量,h表示隐藏层。
[0078]
设置监测指标阈值和连续越限时间阈值的过程包括:
[0079]
步骤1:获取系统正常运行的原始scada数据,并对数据进行预处理;对预处理后的数据进行相关性分析,得到机组各状态参数时间序列数据的短时自相关性;
[0080]
步骤2:采用滑动窗口对机组状态数据进行处理,得到系统正常运行的增广状态数据矩阵;其中风电机组状态参数的自相关系数反映了状态参数先前时刻值与当前时刻值的线性相关程度;
[0081]
步骤3:根据机组各状态参数时间序列数据的短时自相关性将scada数据数据输入到训练好的sdae网络中,得到第二重构数据;
[0082]
步骤4:根据重构数据和正常运行的增广状态数据矩阵计算机组正常数据的重构误差和监测指标;
[0083]
步骤5:根据机组正常数据的监测指标构确定监测指标阈值;
[0084]
步骤6:根据滑动窗口大小和监测指标连续越限的最大值构建连续越限数指标阈值。
[0085]
对原始scada数据进行预处理和对预处理后的数据进行相关性分析的过程包括:
[0086]
步骤(11)、对scada系统所采集到的原始机组状态数据进行不良数据识别与修正,能够得到机组正常状态的数据矩阵,为能够得到机组正常状态的数据矩阵,为其
中,表示第j个状态参数的第i个样本数据,n为采集的样本数据数量,m为机组状态参数的个数。
[0087]
步骤(12)、采用综合相关性指标分析风电机组状态参数间的互相关性,其中的综合相关系数icc的计算公式为:
[0088][0089]
其中,为pearson相关系数,为kendall相关系数,为spearman相关系数,x
(k)
表示第k个状态参数的样本数据,x
(l)
表示第l个状态参数的样本数据。
[0090]
步骤(13)、采用自相关系数和偏自相关系数分析机组各状态参数时间序列数据的短时自相关性;根据scada系统采集的数据x1,x2,

,xn,定义时间序列{x
t
,t∈t},时间序列{x
t
}延迟k阶的自相关系数为:
[0091][0092]
偏自相关系数:
[0093][0094]
其中,ρk表示时间序列延迟k阶的自相关系数,x
t
表示时间序列,cov表示协方差矩阵,x
t-k
表示延迟k阶的时间序列,var()表示协方差概率密度的二阶矩,表示延迟k阶偏自相关系数为按j阶自回归模型对x
t
作线性最小方差估计的系数,表示延迟k+1阶偏自相关系数为按j阶自回归模型对x
t
作线性最小方差估计的系数。
[0095]
具体的,计算机组正常数据的重构误差en和机组正常数据的监测指标t的过程包括:
[0096]
步骤(41)、首先采集到原始数据xn后,滑动窗口处理得到增广状态数据矩阵yn,利用多重加噪比的sdae模型训练,得到重构数据zn,则得到重构误差为en=y
n-zn;
[0097]
步骤(42)、因为smdae模型的输入为多元状态数据,所以en为多元数据,为了实现机组异常状态,需从en中提取出状态监测指标;采用马氏距离,来度量未知数据与已知道数据间的相似性;
[0098]
步骤(43)、设置en的均值向量为μ=(μ1,μ2,

,μn),选取重构误差的马氏距离为监测所需指标,得到监测指标公式为
[0099][0100]
其中,表示第k个正常样本的重构误差,u表示均值向量,cov-1
表示协方差矩阵
的逆矩阵。
[0101]
确定监测指标的阈值td和监测指标连续越限时间阈值qd的过程包括:
[0102]
步骤(51)、确定机组正常运行数据的重构误差马氏距离概率密度函数
[0103][0104]
其中,tk为样本数据中第k个样本数据点的监测指标,n表示样本数据个数,h为带宽参数,k(
·
)为核函数,满足公式:
[0105][0106]
其中,k(u)表示u的核函数,u2(k)表示约束系数与核函数的乘积。
[0107]
步骤(52)、确定监测指标的阈值td,其过程包括:设置置信度α;根据概率密度函数计算机组状态监测指标小于监测指标阈值的概率值p(t《td);根据设置的置信度α和概率值p(t《td)反向确定监测指标阈值td;计算机组状态监测指标小于监测指标阈值的概率值的公式为:
[0108][0109][0110]
其中,p表示机组状态小于监测指标阈值的概率值,表示重构误差马氏距离的概率密度函数,n表示样本个数数据,tk为样本数据中第k个样本数据点的监测指标,h为带宽参数,k(
·
)为核函数。
[0111]
步骤(53)、噪声数据会造成监测指标越限,这类噪声的连续越限时间较短,为了能够准确辨识,因此需要进一步采用连续越限数指标q;连续越限数指标q的阈值qd公式满足:
[0112]
qd=max(q
max
,β)
[0113]
其中,q
max
为训练数据的监测指标连续越限最大值;β为滑动窗口宽度。
[0114]
一种基于状态参数重构误差的风电机组运行状态异常检测方法的具体实施方式,该方法包括:
[0115]
第一步,采用原始正常运行的scada数据,记为xn,状态参数间的互相关性采用综合相关性指标分析,采用自相关系数和偏自相关系数分析机组各状态参数时间序列数据的短时自相关性;采用滑动窗口技术处理机组状态数据,得到计算参数短时自相关性的增广状态数据矩阵yn;采用深度网络结构的sdae模型,sdae模型具有高强度非线性投射能力;在此,引入加噪比,他是dae网络十分重要的调优参数,因此,采用多重加噪比训练sdae模型,
并获得正常数据的重构输出zn;
[0116]
第二步,根据公式en=y
n-zn计算机组正常数据的重构误差en,根据重构误差计算监测指标的公式计算机组正常数据的监测指标t;根据机组状态监测指标小于监测指标阈值的概率值确定监测指标的阈值td,根据连续越限数指标阈值的表达式确定监测指标连续越限时间阈值qd;
[0117]
第三步,输入待检测数据xm,经滑动窗口处理获得相应的增广状态数据矩阵ym,根据正常样本训练得到的sdae网络计算待检测数据的重构输出zm,根据em=y
m-xm计算待检测数据的重构误差em,根据计算待检测数据的监测指标tm;判断tm》td,如果错误,则返回待检测数据,如果正确,则统计获得连续越限数qm,判断qm》qd,如果错误,则认定为噪声数据,如果正确,则表明是异常数据,接着计算个参数的贡献度以确定与机组状态异常最相关的状态参数或者部件。
[0118]
以上所举实施例,对本发明的目的、技术方案和优点进行了进一步的详细说明,所应理解的是,以上所举实施例仅为本发明的优选实施方式而已,并不用以限制本发明,凡在本发明的精神和原则之内对本发明所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1