本发明涉及电力工程,尤其涉及一种异常数据清洗方法、装置、电子设备及存储介质。
背景技术:
1、风能作为一种可再生能源,近年来受到世界各国的重视与广泛应用。不同于传统能源发电,利用风能进行发电能够减少环境污染,符合可持续发展战略。数据采集与监视控制(supervisory control and data acquisition,scada)系统从风力机采集数据,这些数据表明风力机的运行状况。然而,scada系统中包含的多种类型的异常数据给风电机组的运行维护带来了挑战。因此,风电机组异常数据的检测和清洗对于风电场的运行至关重要。
2、目前,现有的异常数据检测和清洗方法通常包括数据统计方法和风电功率曲线建模方法。统计方法是基于异常数据和正常数据统计特征的差异,包括聚类特征和分布。wpc建模方法利用大量scada数据提取的wpc特征对异常数据进行清理,可分为基于数值数据的方法和基于图像的方法。
3、然而,统计方法在处理零散数据时效果可以接受,但在处理堆叠的异常数据时产生较大误差,主要表现为忽略部分异常数据,将正常数据弄错。wpc建模方法的异常数据辨识效果依赖于参考图像和先验知识。
技术实现思路
1、本发明提供了一种异常数据清洗方法、装置、电子设备及存储介质,以实现不仅能准确地检测和标记不同类型的异常数据,而且可以最大程度地保证结果风电功率曲线平滑性的效果,提高了异常数据的清洗效率和准确率。
2、根据本发明的一方面,提供了一种异常数据清洗方法,该方法包括:
3、获取风电机组的原始运行数据;并基于所述原始运行数据,生成原始风电功率曲线图像;
4、基于所述原始运行数据和所述原始风电功率曲线图像,对所述原始运行数据中所包括的第一类异常数据和/或第二类异常数据进行标记和过滤,得到待处理运行数据;
5、基于所述待处理运行数据,生成待处理风电功率曲线图像,并基于所述待处理风电功率曲线图像,对所述待处理运行数据中所包括的第三类异常数据进行标记和过滤,得到与所述风电机组对应的目标运行数据。
6、根据本发明的另一方面,提供了一种异常数据清洗装置,该装置包括:
7、数据获取模块,用于获取风电机组的原始运行数据;并基于所述原始运行数据,生成原始风电功率曲线图像;
8、数据过滤模块,用于基于所述原始运行数据和所述原始风电功率曲线图像,对所述原始运行数据中所包括的第一类异常数据和/或第二类异常数据进行标记和过滤,得到待处理运行数据;
9、目标运行数据确定模块,用于基于所述待处理运行数据,生成待处理风电功率曲线图像,并基于所述待处理风电功率曲线图像,对所述待处理运行数据中所包括的第三类异常数据进行标记和过滤,得到与所述风电机组对应的目标运行数据。
10、根据本发明的另一方面,提供了一种电子设备,所述电子设备包括:
11、至少一个处理器;以及
12、与所述至少一个处理器通信连接的存储器;其中,
13、所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例所述的异常数据清洗方法。
14、根据本发明的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本发明任一实施例所述的异常数据清洗方法。
15、本发明实施例的技术方案,通过获取风电机组的原始运行数据;并基于原始运行数据,生成原始风电功率曲线图像,进一步的,基于原始运行数据和原始风电功率曲线图像,对原始运行数据中所包括的第一类异常数据和/或第二类异常数据进行标记和过滤,得到待处理运行数据,最后,基于待处理运行数据,生成待处理风电功率曲线图像,并基于待处理风电功率曲线图像,对待处理运行数据中所包括的第三类异常数据进行标记和过滤,得到与风电机组对应的目标运行数据,解决了现有技术中处理堆叠的异常数据时产生较大误差,忽略部分异常数据、误删正常数据以及依赖于参考图像和先验知识等问题,实现了不仅能准确地检测和标记不同类型的异常数据,而且可以最大程度地保证结果风电功率曲线平滑性的效果,提高了异常数据的清洗效率和准确率,并且,降低了对先验知识的需求,实现了在不依赖参考图像的前提下,辨别多种类型异常数据的效果。
16、应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
1.一种异常数据清洗方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述基于所述原始运行数据和所述原始风电功率曲线图像,对所述原始运行数据中所包括的第一类异常数据进行标记和过滤,包括:
3.根据权利要求1所述的方法,所述基于所述原始运行数据和所述原始风电功率曲线图像,对所述原始运行数据中所包括的第二类异常数据进行标记和过滤,包括:
4.根据权利要求3所述的方法,所述基于所述待处理图像,对所述原始运行数据中所包括的第二类异常数据进行标记和过滤,包括:
5.根据权利要求1所述的方法,其特征在于,所述基于所述待处理风电功率曲线图像,对所述待处理运行数据中所包括的第三类异常数据进行标记和过滤,包括:
6.根据权利要求5所述的方法,其特征在于,所述根据所述风电功率曲线掩膜图像,确定所述第三类异常数据在所述待处理功率曲线图像中的数据定位范围,包括:
7.根据权利要求1所述的方法,其特征在于,还包括:
8.一种异常数据清理装置,其特征在于,包括:
9.一种电子设备,其特征在于,所述电子设备包括:
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-7中任一项所述的异常数据清洗方法。