基于在历史数据中进行相似搜索的风电机组状态预测方法与流程

文档序号:12469413阅读:241来源:国知局
基于在历史数据中进行相似搜索的风电机组状态预测方法与流程

本发明涉及风电机组状态监测技术领域,尤其涉及一种基于在历史数据中进行相似搜索的风电机组状态预测方法。



背景技术:

目前,风电机组状态监测和故障诊断领域的研究处于起步阶段,已有的研究成果中,对于整机的研究侧重于状态评估和故障预测,对于机组的关键部件研究侧重于故障诊断。在风机状态评估中主要是残差分析,将SCADA(Supervisory Control And Data Acquisition,即数据采集与监视控制系统)的监测数据作为预测模型的输入,通过所建立如人工神经网络或支持向量机的预测模型获得预测值,进而将实际监测值与预测值结合求取残差,结合利用事先通过专家经验或正态分布等方法确定的残差阈值,通过检测是否超过阈值或通过残差趋势分析实现对故障预测,但是不能给出风机未来的运行状态的预测。在风机的故障诊断方法中主要方法包括振动分析和油液分析。振动分析对于低频信号具有一定的局限性,且在齿轮箱本体上安装传感器获取振动信号需增加投资和维护费用。油液分析因受限于监测硬件(传感器)设计和制造技术,存在测量误差较大、精度低因素,还没有在实际中实现在线油液监测。因此,现有的方法并不能够取得理想的效果。

中国专利CN201310098308,公开了一种基于相似度统计的风电机组状态评估预警方法和系统,以及中国专利CN201310107926,公开了一种基于历史故障数据的风电机组状态评估方法和系统,其公开的方法为:步骤1、根据风电机组历史运行数据生成风电机组的多个正常状态模型和所述风电机组的安全基准线;步骤2、获取所述风电机组的实时运行数据,将所述风电机组的实时运行数据与所述正常状态模型进行对比以确定所述实时运行数据与所述正常状态模型的相似度;将所述风电机组的实时运行数据与所述风电机组的安全基准线进行对比以在所述实时运行数据异常时报警;步骤3、对所述实时运行数据进行分析以对所述风电机组故障进行预估。该专利存在的主要问题在于风电机组长期工作在恶劣的自然环境中,受到正常和极限极端温度、太阳辐射、降雨、积雪、盐雾、沙尘、地形轮廓等因素影响随着运行环境的变化风机的运行状态存在着一定的起伏变动,生成的健康状态模型不一定能够反映风机在健康状态下的所有变化,存在着局限性。而且由于自然条件的变化,风机的安全基线也应该是随着季节,温度而改变的,单纯的固定基线并不能很好地标识风机的运行状态是否安全。



技术实现要素:

针对现有技术的缺陷,本发明提供一种基于在历史数据中进行相似搜索的风电机组状态预测方法,能够将风电机组的历史运行数据建立数据库,并通过实时的运行数据与风机自身以及与其相似的风机历史数据进行对比对风电机组的状态进行评估。

一种基于在历史数据中进行相似搜索的风电机组状态预测方法,包括以下步骤:

步骤1、获取足够长的风机传感器的历史运行数据,保证该历史运行数据能够包含风机可能存在的所有状态;

步骤2、对风电机组历史运行数据进行预处理,删除无用的变量和错误的数据,补全缺失的数据;

步骤3、利用随机森林算法对风机属性进行学习并提取重要性属性;

步骤4、利用主成分分析对风机属性进行降维,生成风机的一维时间序列综合指标;

步骤5、利用改进的K均值聚类算法对降维后的风机数据进行聚类分析,得到相似的风电机组;

步骤6、在风电机组运行的过程中,系统通过当前运行数据实时的计算数据间的动态时间弯曲距离,在自身及其相似的风电机组历史数据中进行匹配,找到与当前状态最相似的历史数据,用该历史数据下一时刻的数据作为风机之后运行状态的预测,并进行风机状态预警。

进一步地,所述步骤3的具体方法为:

步骤3.1、根据专家意见和文献,选取适当的变量作为输出值,其他的变量作为输入值,利用随机森林算法,在预先设定好的参数下进行机器学习;

步骤3.2、根据步骤3.1机器学习得到的结果,将各个属性按照均方误差增量进行排序,得到其他各个变量对选取为输出值变量的重要性,并选取重要性靠前的若干变量作为研究对象。

进一步地,所述步骤4的具体方法为:

步骤4.1、选取大量正常运行的风机的数据,进行主成分分析,得到特征向量和权值;

步骤4.2、利用得到的特征向量和权值对相应风机数据进行降维,生成一维时间序列综合指标;

步骤4.3、将风电机组降维后的数据存储在计算机中,作为风机状态的检索库。

由上述技术方案可知,本发明的有益效果在于:本发明提供的基于在历史数据中进行相似搜索的风电机组状态预测方法,能够将风电机组的历史运行数据建立数据库,并通过实时的运行数据与风机自身以及与其相似的风机历史数据进行对比对风电机组的状态进行评估。在采用海量历史数据相似度挖掘技术的基础上,通过降维得到风电机组综合属性,在线对风电机组当前状态和历史同工况状态进行相似搜索分析,定量计算出风电机组当前状态与历史状态的相似程度,搜索出与当前状态最相似的历史状态,利用历史状态对风机状态进行预测,同时综合实现风电机组实时运行状态的安全评估,同时对风机的故障进行预警诊断。

附图说明

图1为本发明实施例提供的基于在历史数据中进行相似搜索的风电机组状态预测方法流程图;

图2为本发明实施例提供的01300、01400和01500号风机的风机叶轮转速的对比曲线图;

图3为本发明实施例提供的01300、01400和01500号风机的发电机转速的对比曲线图;

图4为本发明实施例提供的01300、01400和01500号风机的发电机温度的对比曲线图;

图5为本发明实施例提供的01300、01400和01500号风机的齿轮箱轴承温度的对比曲线图;

图6为本发明实施例提供的01300、01400和01500号风机的齿轮箱油温的对比曲线图;

图7为本发明实施例提供的01300、01400和01500号风机的有功功率的对比曲线图;

图8为本发明实施例提供的01500号风机与查询数据一匹配的风机叶轮转速对比曲线图;

图9为本发明实施例提供的01500号风机与查询数据一匹配的发电机转速对比曲线图;

图10为本发明实施例提供的01500号风机与查询数据一匹配的发电机温度对比曲线图;

图11为本发明实施例提供的01500号风机与查询数据一匹配的齿轮箱轴承温度对比曲线图;

图12为本发明实施例提供的01500号风机与查询数据一匹配的齿轮箱油温对比曲线图;

图13为本发明实施例提供的01500号风机与查询数据一匹配的有功功率对比曲线图;

图14为本发明实施例提供的01300号风机与查询数据二匹配的风机叶轮转速对比曲线图;

图15为本发明实施例提供的01300号风机与查询数据二匹配的发电机转速对比曲线图;

图16为本发明实施例提供的01300号风机与查询数据二匹配的发电机温度对比曲线图;

图17为本发明实施例提供的01300号风机与查询数据二匹配的齿轮箱轴承温度对比曲线图;

图18为本发明实施例提供的01300号风机与查询数据二匹配的齿轮箱油温对比曲线图;

图19为本发明实施例提供的01300号风机与查询数据二匹配的有功功率对比曲线图。

具体实施方式

下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。

如图1所示,本实施例提供一种基于在历史数据中进行相似搜索的风电机组状态预测方法,包括如下步骤。

步骤1、获取足够长的风机传感器的历史运行数据,保证该历史运行数据包含各种气象条件,季节变化的数据,能够包含风机可能存在的所有状态。

步骤2、对现有的数据采集与监视控制系统收集的风电机组历史运行数据进行清洗预处理,删除无用的变量和错误的数据,补全缺失的数据。

步骤3、利用随机森林算法对风机属性进行学习并提取重要性属性,具体方法为:

步骤3.1、根据专家意见和文献,选取适当的变量作为输出值,其他的变量作为输入值,利用随机森林算法,在预先设定好的参数下进行机器学习;

步骤3.2、根据步骤3.1机器学习得到的结果,将各个属性按照均方误差增量进行排序,得到其他各个变量对选取为输出值变量的重要性,并选取重要性靠前的若干变量作为研究对象。

步骤4、利用主成分分析对风机属性进行降维,生成风机的一维时间序列综合指标,具体方法为:

步骤4.1、选取大量正常运行的风机的数据,进行主成分分析,得到特征向量和权值;

步骤4.2、利用得到的特征向量和权值对相应风机数据进行PCA降维,生成一维时间序列综合指标;

步骤4.3、将风电机组降维后的数据存储在计算机中,作为风机状态的检索库。

步骤5、利用改进的K均值聚类算法对降维后的风机数据进行聚类分析,将风机依照相似性进行分组,划归为一类的风机,在进行相似搜索时可以互相检索。

步骤6、在风电机组运行的过程中,系统通过当前运行数据实时的计算数据间的动态时间弯曲距离,在自身及其相似的风电机组历史数据中进行匹配,找到与当前状态最相似的历史数据,用该历史数据下一时刻的数据作为风机之后运行状态的预测,利用历史上此时段风机的状态对风机状态预警。

本实施例采用源于风场的真实风机数据,选取部分较好的风机样本,进行数据清洗,包括删除重复数据,删除常数列,空值填充等,对每个风机删除时间序列。

将齿轮箱油温值作为输出值,其他属性作为输入值,进行随机森林训练,得到均方误差增量(Increase in MSE)取均值,保留小数点后五位,归一化结果如表1所示。

表1

对齿轮箱油温影响因素比较大的前五个属性变量包括发电机转速、叶轮转速、齿轮箱轴承温度、发电机温度和有功功率,选取这五个属性变量及齿轮箱油温值作为研究对象。

由于风机数据并不都是完整可用,选取数据较为完好的四十台风机的数据,选取以上几个属性变量,构成40个多维时间序列矩阵,对于每一个矩阵,选取相同的时间片进行PCA降维,形成一维时序数列。

最后,利用改进的K均值聚类算法,对风机进行分类,分类结果如表2所示。

表2聚类分析的分类结果

选取01300、01400和01500号风机进行分析,正常状态下同组01300、01400和01500号风机运行状太具有很高的一致性和相似性。如图2至图7所示,为风机01300、01400和01500的风机叶轮转速、发电机转速、发电机温度、齿轮箱轴承温度、齿轮箱油温和有功功率的对比曲线图。

在外界环境稳定的情况下,风机的运行状态也具有一定的稳定性,利用风机当前时间段的运行情况进行历史数据搜索,找到历史中与当前时间段运行状态最相似的数据,利用历史上接下来风机的状态作为当前风机状态的预测。

由于风机数据量较大,先对风机进行聚类,在当前风机所属类中进行搜索,能够极大地提升搜索效率。

(1)在数据中取01300号风机的14501条至14600条数据作为查询数据一,在01300、01400、01500号风机的历史数据中搜索相似数据,得到如下结果:

01500号风机的4379条至4478条数据与上述查询数据一的匹配度最高(前100个是用于匹配的数据,后100个是预测值与真实值的比较),如图8至图13所示,为风机叶轮转速、发电机转速、发电机温度、齿轮箱轴承温度、齿轮箱油温和有功功率的匹配对比曲线图,从图中可以看出,搜索出的结果具有很高的相似性,尤其在有功功率、发动机转速和叶轮转速上有很大的相似性,并且01500号风机历史上在此时发生了故障,可以判断01300风机在此刻也有可能产生故障;

(2)采用01300号风机的30301条至30400条数据作为查询数据二,得到匹配度最高的数据是01300号风机的26336条至26435条数据,如图14至图19所示,可以看出,风机基本处于正常运行状态,有功功率、发电机转速和叶轮转速预测的比较好。

本实施例提供的方法能够将风电机组的历史运行数据建立数据库,并通过实时的运行数据与风机自身以及与其相似的风机历史数据进行对比对风电机组的状态进行评估。与基于规则的诊断系统不同,本方法系统在采用海量历史数据相似度挖掘技术的基础上,通过降维得到风电机组综合属性,在线对风电机组当前状态和历史同工况状态进行相似搜索分析,定量计算出风电机组当前状态与历史状态的相似程度,搜索出与当前状态最相似的历史状态,利用历史状态对风机状态进行预测,同时综合实现风电机组实时运行状态的安全评估,同时对风机的故障进行预警诊断。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明权利要求所限定的范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1