本发明涉及风力发电领域,具体涉及一种基于大数据驱动的风力发电机变频器预测运行技术。
背景技术:
在风力发电系统中,风电场变频器系统可能出现的故障类型,包括电源开关短路、开关开路、传感器故障以及通讯故障等。现有的变频器故障检测的方法均为基于某一时间点进行的预测,其检测准确率不高,且不能提前进行预测进行早期预警提前处理,同时具有虚警率过高的问题。
技术实现要素:
针对现有技术中的缺陷,本发明提供的一种基于大数据驱动的风力发电机变频器预测运行技术,提高检测准确率并争取达到提早预测,早期预警,提前处理的效果;同时降低噪声的影响,在保证检测准确率的前提下,尽可能降低虚警率。
为了实现上述目的,本发明通过如下技术方案来实现:本发明提供一种基于大数据驱动的风力发电机变频器预测运行技术,包括如下步骤:
s1、获取原始风机scada数据:scada数据为风电机组传感器采集的状态监测数据和运行数据;
s2、scada数据的预处理:对变频器系统相关参数进行预选,从获取的原始风机scada数据中剔除非正常状态下的数据;
s3、利用特征选择法进行特征选择:将预处理过后的scada数据参数作为输入特征,经过特征选择后输出与变频器相关变量的数据;
s4、变频器故障检测:建立变频器故障检测模型,采用故障检测算法对变频器的故障进行检测,输出一个表示当前风机故障概率的概率值。
进一步,步骤s2中非正常状态包括风机的故障、停机、维修或限功率中的任一项或多项。
进一步,步骤s3中的特征选择过程如下:
s31、对于任意决策树t,从总的数据d中随机挑选数据x作为训练样本,剩余数据x`作为测试样本,测试样本的预测误差定义为袋外误差errobbt;
s32、对于任意特征f,对数据x′中的f特征添加随机噪声θ,得到的袋外误差定义为errobb′t;
s33、若决策树的数量为n,重复上述两步,可以得到特征f的重要性分数如下:
从而从特征中抽取与变频器相关的变量的数据。
进一步,在步骤s33中与变频器相关的变量包括环境温度、变频器电网侧电流、变频器电网侧电压、变频器电网侧有功功率、变频器电网侧无功功率、变频器发电机侧功率、发电机电流、变频器扭矩、发电机运行频率、发电机转矩、变频器冷却液液位要求、发电机功率限幅值、发电机无功功率设定值、变频器入口温度、变频器出口温度、变频器入口压力、变频器出口压力、变频器控制状态、无功功率控制状态和变频器状态。
进一步,在步骤s4中故障检测算法包括如下步骤:
s41、与变频器相关的变量的数据有n个样本,有放回地选取n个样本,作为分类器的训练样本;
s42、每个样本有m个变量,则随机选择其中m个变量,作为训练分类器的特征;
s43、利用选取的样本和特征,训练分类器;
s44、重复s41~s43步骤,得到k个分类器,每个分类器都是独立存在的;
s45、利用k个分类器得到k个分类的结果,按照分类器投票的原则,得到输入数据的类别。
进一步,在变频器故障检测模型中设置一个阈值,当通过变频器故障检测算法输出的概率值超过阈值即进行故障预警。
本发明的有益效果:本发明提供一种基于大数据驱动的风力发电机变频器预测运行技术,包括如下步骤:s1、获取原始风机scada数据:scada数据为风电机组传感器采集的状态监测数据和运行数据;s2、scada数据的预处理:对变频器系统相关参数进行预选,从获取的原始风机scada数据中剔除非正常状态下的数据;s3、利用特征选择法进行特征选择:将预处理过后的scada数据参数作为输入特征,经过特征选择后输出与变频器相关变量的数据;s4、变频器故障检测:建立变频器故障检测模型,采用故障检测算法对变频器的故障进行检测,输出一个表示当前风机故障概率的概率值。针对变频器故障检测方法在噪声影响下虚警率过高的问题,使用相应的滤波算法和异常点检测,降低噪声的影响,在保证检测准确率的前提下,尽可能降低虚警率。同时提高检测准确率并争取达到提早预测,早期预警,提前处理的效果。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。在所有附图中,类似的元件或部分一般由类似的附图标记标识。附图中,各元件或部分并不一定按照实际的比例绘制。
图1为本发明提供的基于大数据驱动的风力发电机变频器预测运行技术的流程框图。
具体实施方式
下面将结合附图对本发明技术方案的实施例进行详细的描述。以下实施例仅用于更加清楚地说明本发明的技术方案,因此只作为示例,而不能以此来限制本发明的保护范围。
需要注意的是,除非另有说明,本申请使用的技术术语或者科学术语应当为本发明所属领域技术人员所理解的通常意义。
本发明提供一种基于大数据驱动的风力发电机变频器预测运行技术,包括如下步骤:
s1、获取原始风机scada数据:scada数据为风电机组传感器采集的状态监测数据和运行数据;
s2、scada数据的预处理:对变频器系统相关参数进行预选,从获取的原始风机scada数据中剔除非正常状态下的数据;预处理过程中采用孤立森林算法进行异常状态的剔除。
s3、利用特征选择法进行特征选择:将预处理过后的scada数据参数作为输入特征,经过特征选择后输出与变频器相关变量的数据;
特征选择过程如下:
s31、对于任意决策树t,从总的数据d中随机挑选数据x作为训练样本,剩余数据x`作为测试样本,测试样本的预测误差定义为袋外误差errobbt;
s32、对于任意特征f,对数据x′中的f特征添加随机噪声θ,得到的袋外误差定义为errobb′t;
s33、若决策树的数量为n,重复上述两步,可以得到特征f的重要性分数如下:
从而从特征中抽取与变频器相关的变量的数据。
s4、变频器故障检测:建立变频器故障检测模型,采用故障检测算法对变频器的故障进行检测,输出一个表示当前风机故障概率的概率值。
风机变频器故障检测算法基于python3.x开发,除python自带函数库外还需要安装的三方库名称为:os、numpy、json、pandas、matplotlib和pickle。
故障检测算法包括如下步骤:
s41、与变频器相关的变量的数据有n个样本,有放回地选取n个样本,作为分类器的训练样本;
s42、每个样本有m个变量,则随机选择其中m个变量,作为训练分类器的特征;
s43、利用选取的样本和特征,训练分类器;
s44、重复s41~s43步骤,得到k个分类器,每个分类器都是独立存在的;
s45、利用k个分类器得到k个分类的结果,按照分类器投票的原则,得到输入数据的类别。
在构建故障检测算法时,数据样本需要随机的选取,变量也需要随机的选取,首先,从原始的数据集中采取有放回的抽样,构造子数据集,子数据集的数据量是和原始数据集相同的。不同子数据集的元素可以重复,同一个子数据集中的元素也可以重复。第二,利用子数据集来构建子决策树,将这个数据放到每个子决策树中,每个子决策树输出一个结果。最后,如果有了新的数据需要得到分类结果,就可以通过对子决策树的判断结果的投票,得到输出结果。
作为对上述方案的进一步改进,步骤s2中非正常状态包括风机的故障、停机、维修或限功率中的任一项或多项。
作为对上述方案的进一步改进,在步骤s33中与变频器相关的变量包括环境参数、电气参数、控制参数、温度压力参数和状态参数,其中环境参数包括环境温度,电气参数包括变频器电网侧电流、变频器电网侧电压、变频器电网侧有功功率、变频器电网侧无功功率、变频器发电机侧功率和发电机电流,控制参数包括变频器扭矩、发电机运行频率、发电机转矩、变频器冷却液液位要求、发电机功率限幅值和发电机无功功率设定值,温度压力参数包括变频器入口温度、变频器出口温度、变频器入口压力和变频器出口压力,状态参数包括变频器控制状态、无功功率控制状态和变频器状态。
作为对上述方案的进一步改进,在变频器故障检测模型中设置一个阈值,当通过变频器故障检测算法输出的概率值超过阈值即进行故障预警。通过相关变频器参数的变化对变频器故障进行预警,从而达到风机故障检测的目的。
本发明中通过分析不同类型的变频器多参数之间的相关性和耦合性,包括电气参数、电路结构以及温度等外部因素的差异和影响,采用特征选取算法挖掘能表征变频器系统运行状况的特征参量,可以适用于多种风机的变频器故障检测。能够在线识别变频器系统运行中的异常状态并给出准确率较高的诊断结果和更好的预警效果,使得在故障发生前能对变频器系统相应部件进行维护,从而达到损失最小化的目的。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。