一种风电机组异常风数据的识别方法及装置

文档序号:32692691发布日期:2022-12-27 19:36阅读:32来源:国知局
一种风电机组异常风数据的识别方法及装置

1.本公开涉及风电机组运行效能评估以及风电功率预测领域,具体涉及一种风电机组异常风数据的识别方法及装置。


背景技术:

2.随着当前风电行业的不断发展和不断增多的风力发电场,其产生的风机运行数据的数量和规模都在以指数提升,但在风机运行过程中由于风速风向随机变化,从而使得收集到的风速数据具有数量大,噪声多,不稳定等特征。为了对风电机组的正常运行提供重要支撑,需要对风速数据进行异常识别。
3.目前主要应用于风电机组异常数据识别的几种方法存在着许多不足:基于数理统计的检测方法精度不高,且会受到数据本身特点的限制;基于时间序列的检测方法对分析风电机组的故障状态有很好的辨识效果,但用于分析风速和功率序列的异常值时,运行数据中的异常值影响会建模精度,因此降低了准确度;基于数据挖掘的识别方法通过一种无监督的自主学习方法,在大量的数据中辨识超出特征表现异常数据,能够用于数据的分析处理,且具有较好的抗干扰能力,但仍有不足,如常用的四分位法在异常数据所占比重较大时,识别异常数据的效果变差,四分法与变点分组法联合算法可能会导致正常数据的误删等。


技术实现要素:

4.本公开的目的是为克服已有技术难以解决风速随机波动性强、异常数据的系统偏差不明显等异常数据识别难点,提出一种风电机组异常风数据的识别方法及装置。本公开提高了风电机组异常数据的识别精度,实现了对不同类型异常风速数据的高精度识别,有助于保障风电机组的正常运行。
5.本公开第一方面实施例提出一种风电机组异常风数据的识别方法,包括:
6.采集风电机组的历史风速数据序列;
7.利用所述历史风速数据序列训练变分自编码器模型,将训练完毕的所述变分自编码器模型作为异常风速数据识别模型;
8.获取所述风电机组待进行识别的原始风速数据序列,将所述原始风速数据序列输入所述异常风速数据识别模型,所述异常风速数据识别模型输出修正后的风速数据序列,以得到所述风电机组异常风数据的识别结果。
9.在本公开的一个具体实施例中,所述方法还包括:
10.根据预设的异常数据阈值,将所述修正后的风速数据序列与所述原始风速数据序列进行比较,将同一时刻修正后的风速数据与原始风速数据的差值大于所述阈值的所述原始风速数据判断为异常数据。
11.本公开第二方面实施例提出一种风电机组异常风数据的识别装置,包括:
12.数据采集模块,用于采集风电机组的历史风速数据序列;
13.变分自编码器训练模块,用于利用所述历史风速数据序列训练变分自编码器模型,将训练完毕的所述变分自编码器模型作为异常风速数据识别模型;
14.风速修正模块,用于获取所述风电机组待进行识别的原始风速数据序列,将所述原始风速数据序列输入所述异常风速数据识别模型,所述异常风速数据识别模型输出修正后的风速数据序列,以得到所述风电机组异常风数据的识别结果。
15.在本公开的一个具体实施例中,所述装置还包括:
16.异常数据识别模块,用于根据预设的异常数据阈值,将所述修正后的风速数据序列与原始风速数据序列进行比较,将同一时刻修正后的风速数据与原始风速数据的差值大于所述阈值的所述原始风速数据判断为异常数据。
17.本公开第三方面实施例提出一种电子设备,包括:
18.至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;
19.其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被设置为用于执行上述一种风电机组异常风数据的识别方法。
20.本公开第四方面实施例提出一种计算机可读存储介质,所述计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行上述一种风电机组异常风数据的识别方法。
21.本公开的特点及有益效果在于:
22.本公开提供一种风电机组异常风数据的识别方法及装置,针对风速随机波动性强、异常数据的系统偏差不明显等异常数据识别难点,使用变分自编码器模型,基于变分自编码器可以在隐空间中进行连续的插补,克服了数据不连续的缺点;本公开中变分自编码器提供了一个重构概率来辅助进行数据的识别工作,该方式优于重构误差的方法,重构概率比重构误差更具原则性和客观性,不需要特定的阈值来判断异常,通用性广,鲁棒性强,解决了风速数据异常随机分量不确定的特征问题,实现了对不同类型异常风速数据的高精度识别,有助于保障风电机组的正常运行。
附图说明
23.图1为本公开实施例的一种风电机组异常风数据的识别方法整体流程图;
24.图2为本公开一个具体实施例中mnist数据集数字在隐空间的分布示意图;
25.图3为本公开一个具体实施例中mnist数据集的生成结果示意图。
具体实施方式
26.本公开实施例提出一种风电机组异常风数据的识别方法及装置,下面结合附图和具体实施例进一步详细说明如下。
27.本公开第一方面实施例提出一种风电机组异常风数据的识别方法,包括:
28.采集风电机组的历史风速数据序列;
29.利用所述历史风速数据序列训练变分自编码器模型,将训练完毕的所述变分自编码器模型作为异常风速数据识别模型;
30.获取所述风电机组待进行识别的原始风速数据序列,将所述原始风速数据序列输入所述异常风速数据识别模型,所述异常风速数据识别模型输出修正后的风速数据序列,
以得到所述风电机组异常风数据的识别结果。
31.在本公开的一个具体实施例中,所述一种风电机组异常风数据的识别方法,整体流程如图1所示,包括以下步骤:
32.1)采集风电场中风电机组的历史风速数据序列;
33.所述待进行异常数据识别的风电机组可为一台或者多台。在本公开一个具体实施例中,所述历史风速数据从数据采集与监视控制系统(scada)中获取,所述历史风速数据越多越好,至少需要一个月的数据,通常选取一个月至六个月的数据。
34.2)利用步骤1)得到的历史风速数据序列训练一个变分自编码器模型,将训练完毕的变分自编码器模型作为异常风速数据识别模型。
35.3)获取所述风电机组待进行识别的原始风速数据序列,将所述原始风速数据序列输入异常风速数据识别模型,所述模型输出修正后的风速数据序列。
36.4)根据预设的异常数据阈值,将修正后的风速数据序列与原始风速数据序列进行比较,将同一时刻修正后的风速数据与原始风速数据的差值大于阈值的原始风速数据判断为异常数据。
37.需要说明的是,对于由数据传输不稳定或干扰导致的数据缺失、因故障导致某一时间风速保持不变、因故障导致某时刻风速落差梯度过大、因故障导致某时刻风速落差梯度过大的异常数据部分,生成的风速数据序列与原始风速数据序列不同。因此,将生成的风速数据序列与输入的原始风速数据序列进行比较,不同的部分即可判定为异常数据。
38.下面结合附图对本公开的具体实施方式作进一步的详细说明。
39.本公开一个具体实施例提出一种基于变分自编码器的风电机组异常风数据的识别方法,具体实施步骤如下:
40.1)采用scada收集两个月的历史风速数据,作为识别样本。
41.2)通过联合分布来更加便捷地推导变分自编码器理论框架,具体步骤如下:
42.2-1)变分自编码器的目的是希望借助隐变量z来描述目标变量x的概率分布p(x):
43.p(x)=∫p(x|z)p(z)dz
ꢀꢀꢀ
(1)
[0044][0045]
p(x,z)=p(x|z)p(z)
ꢀꢀꢀ
(3)
[0046]
式中,p(x)为x的概率模型,p(x|z)是基于隐变量重构出目标变量的近似概率分布,p(z为标准正态分布,p(z|x)为后验分布。
[0047]
2-2)不需要对后验分布p(z|x)进行推导,而对p(x,z)进行拟合,用一个新的联合概率分布q(x,z)来逼近p(x,z),再通过kl散度进行近似:
[0048][0049]
又因为:
[0050][0051]
可得:
[0052][0053]
因此,最小化kl(p(x,z)|q(x,z))等价于将l最小化。由于散度kl为非负数,c也为非负数,则l恒为正数。
[0054]
2-3)把公式(6)带入公式(5)得:
[0055]
q(x,z)=q(x|z)q(z)
ꢀꢀꢀ
(7)
[0056][0057]
式(7)为变分自编码器的损失函数,训练目的是找到合适的p(x|z)和p(z),使得损失函数最小。
[0058]
2-4)假设后验分布p(z|x)是正态分布,其均值μ和方差σ2由神经网络拟合得到,为了将p(z|x)向标准正态分布的方向训练,在训练过程中加入额外的loss。
[0059]
计算得出kl loss:
[0060][0061]
2-5)生成部分模型q(x|z),也可将其假设为正态分布模型,并且将方差固定为常数,则:
[0062][0063]
选用mse作为损失函数。
[0064]
因此,p(x|z)不仅可以计算kl(p(z|x)|q(z)),同时也可以计算
[0065]ez~p(z|x)
[-ln q(x|z)]。
[0066]
2-6)借助重参数技巧完成采样。
[0067]
2-7)综上,最后可得:
[0068]
l=e
x~p(x)
[[-ln q(x|z)]+kl(p(z|x)|q(z))]
ꢀꢀꢀꢀ
(11)
[0069]
上式的每个概率分布都为已知形式。
[0070]
3)根据变分自编码器框架推导,使用第三方编程软件anaconda3、python3.6,借用tensorflow作为后台环境的keras程序库进行编程;
[0071]
4)使用mnist数据集作为测试集观察模型运行结果,具体步骤如下:
[0072]
4-1)用mlp作为解码器,观察数字在隐空间中的分布,如附图2所示,其中,具有相同数字特征的为同一颜色;
[0073]
4-2)构建生成模型,并且输出图像,如图3所示。由附图3可知,具有相似特征的手写数字被归类到了一起,因此该模型具有可行性。
[0074]
5)进行异常风数据识别,具体步骤如下:
[0075]
5-1)将步骤1)采集到的风速数据分成两部分,使用前80%的数据作为训练集来训练变分自编码器模型,使用后20%的数据作为测试集。
[0076]
5-2)将测试集的原始风速数据序列输入训练完毕后变分自编码器模型,得到修正后的风速数据序列
[0077]
5-3)根据预设的异常数据阈值,将修正后的风速数据序列与原始风速数据序列进行比较,将同一时刻修正后的风速数据与原始风速数据的差值大于阈值的原始风速数据判断为异常数据。
[0078]
为实现上述实施例,本公开第二方面实施例提出一种风电机组异常风数据的识别装置,包括:
[0079]
数据采集模块,用于采集风电机组的历史风速数据序列;
[0080]
变分自编码器训练模块,用于利用所述历史风速数据序列训练变分自编码器模型,将训练完毕的所述变分自编码器模型作为异常风速数据识别模型;
[0081]
风速修正模块,用于获取所述风电机组待进行识别的原始风速数据序列,将所述原始风速数据序列输入所述异常风速数据识别模型,所述异常风速数据识别模型输出修正后的风速数据序列,以得到所述风电机组异常风数据的识别结果。
[0082]
在本公开一个具体实施例中,所述装置还包括:
[0083]
异常数据识别模块,用于根据预设的异常数据阈值,将所述修正后的风速数据序列与原始风速数据序列进行比较,将同一时刻修正后的风速数据与原始风速数据的差值大于所述阈值的所述原始风速数据判断为异常数据。
[0084]
需要说明的是,前述对一种风电机组异常风数据的识别方法的实施例解释说明也适用于本实施例的一种风电机组异常风数据的识别装置,在此不再赘述。根据本发明实施例提出的一种风电机组异常风数据的识别装置,通过采集风电机组的历史风速数据序列;利用所述历史风速数据序列训练变分自编码器模型,将训练完毕的所述变分自编码器模型作为异常风速数据识别模型;获取所述风电机组待进行识别的原始风速数据序列,将所述原始风速数据序列输入所述异常风速数据识别模型,所述异常风速数据识别模型输出修正后的风速数据序列。由此可提高风电机组异常数据的识别精度,实现了对不同类型异常风速数据的高精度识别,有助于保障风电机组的正常运行。
[0085]
为实现上述实施例,本公开第三方面实施例提出一种电子设备,包括:
[0086]
至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;
[0087]
其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被设置为用于执行上述一种风电机组异常风数据的识别方法。
[0088]
为实现上述实施例,本公开第四方面实施例提出一种计算机可读存储介质,所述计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行上述一种风电机组异常风数据的识别方法。
[0089]
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程
序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、rf(射频)等等,或者上述的任意合适的组合。
[0090]
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备执行上述实施例的一种风电机组异常风数据的识别方法。
[0091]
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如java、smalltalk、c++,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(lan)或广域网(wan)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
[0092]
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本技术的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
[0093]
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本技术的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
[0094]
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本技术的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本技术的实施例所属技术领域的技术人员所理解。
[0095]
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执
行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(ram),只读存储器(rom),可擦除可编辑只读存储器(eprom或闪速存储器),光纤装置,以及便携式光盘只读存储器(cdrom)。另外,计算机可读介质甚至可以是可在其上打印程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得程序,然后将其存储在计算机存储器中。
[0096]
应当理解,本技术的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(pga),现场可编程门阵列(fpga)等。
[0097]
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
[0098]
此外,在本技术各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
[0099]
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本技术的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本技术的限制,本领域的普通技术人员在本技术的范围内可以对上述实施例进行变化、修改、替换和变型。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1