基于时间窗口混合模型的风机叶片预测方法及系统与流程

文档序号:18476096发布日期:2019-08-20 21:05阅读:234来源:国知局
基于时间窗口混合模型的风机叶片预测方法及系统与流程

本发明涉及机器学习技术领域,尤其是基于时间窗口混合模型的风机叶片预测方法及系统。



背景技术:

风能作为一种可再生清洁能源受到人们关注,大量风力发电厂被建造起来。在严寒地区或寒冷的时候,风力发电机会面临叶片结冰的问题。大量运行经验表明,风机叶片结冰会改变叶片叶形,破坏叶片气动特性,影响包括风机性能以及发电量在内的各种风机运行指标,导致风机效率下降并对电网的稳定运行产生影响,另外风机叶片结冰严重时导致叶片折断也给风电场带来的安全隐患。随着传感技术以及存储技术的发展,风机系统中存储的数据量级已经十分巨大,开始出现使用机器学习预测叶片结冰的手段,通过对结冰过程的演化规律进行分析,提取结冰演化过程中的统计特征和时序特征,才能更好的实现早期结冰预测。

现有的预测叶片结冰预测方法中,通过训练好的预测模型对所有待预测数据进行分析,过大的分析工作量导致效率较低;另外,现有的预测方法只能发出结冰预警,无法预测得到结冰时间,不够精确。



技术实现要素:

有鉴于此,本发明实施例提供一种效率高且精度高的,基于时间窗口混合模型的风机叶片预测方法及系统。

一方面,本发明实施例提供了一种基于时间窗口混合模型的风机叶片预测方法,包括以下步骤:

采用主成分分析技术对风机叶片监测数据进行特征压缩,得到目标特征;

采用滑动窗口技术对目标特征进行数据压缩,得到预测数据;

根据预测数据,通过基于时间窗口的混合模型确定结冰预测结果,所述结冰预测结果包括结冰预警时间。

进一步,所述采用主成分分析技术对风机叶片监测数据进行特征压缩,得到目标特征这一步骤,包括以下步骤:

通过主成分分析技术对风机叶片监测数据进行主成分分析,得到风机叶片监测数据中各个特征对应的预测结果影响指数;

对各个特征对应的预测结果影响指数进行排序;

根据排序结果,提取若干个特征作为目标特征。

进一步,所述采用滑动窗口技术对目标特征进行数据压缩,得到预测数据这一步骤,包括以下步骤:

根据第一时间窗尺度,对目标特征进行第一数据压缩处理,得到第一数据;

基于预设的第一阈值对第一数据进行第一筛选;

根据第二时间窗尺度,对第一筛选后的数据进行第二数据压缩处理,得到第二数据;

基于预设的第二阈值对第二数据进行第二筛选;

根据第三时间窗尺度,对第二筛选后的数据进行第三数据压缩处理,得到第三数据;

基于预设的第三阈值对第三数据进行第三筛选,得到预测数据。

进一步,所述根据预测数据,通过基于时间窗口的混合模型确定结冰预测结果这一步骤,包括以下步骤:

通过svm算法和朴素贝叶斯算法计算预测数据的结冰概率;

通过概率加权平均法对结冰概率进行概率加权;

判断概率加权后的结冰概率是否小于预设的结冰阈值,若是,则确定第一结冰预测结果;反之,则确定第二结冰预测结果。

进一步,所述基于预设的第二阈值对第二数据进行第二筛选这一步骤,其具体为:

根据lightgbm算法,删除第二数据中具有结冰迹象的数据。

进一步,还包括混合模型训练步骤。

进一步,所述通过概率加权平均法对结冰概率进行概率加权这一步骤中,所述概率加权的计算公式具体为:

其中,n是混合模型个数;weighti是第i个混合模型输出结果的权重;pi是第i个混合模型的输出概率。

另一方面,本发明实施例提供了一种基于时间窗口混合模型的风机叶片预测系统,包括:

特征压缩模块,用于采用主成分分析技术对风机叶片监测数据进行特征压缩,得到目标特征;

数据压缩模块,用于采用滑动窗口技术对目标特征进行数据压缩,得到预测数据;

预测模块,用于根据预测数据,通过基于时间窗口的混合模型确定结冰预测结果,所述结冰预测结果包括结冰预警时间。

进一步,所述数据压缩模块包括:

第一压缩单元,用于根据第一时间窗尺度,对目标特征进行第一数据压缩处理,得到第一数据;

第一筛选,用于基于预设的第一阈值对第一数据进行第一筛选;

第二压缩单元,用于根据第二时间窗尺度,对第一筛选后的数据进行第二数据压缩处理,得到第二数据;

第二筛选单元,用于基于预设的第二阈值对第二数据进行第二筛选;

第三压缩单元,用于根据第三时间窗尺度,对第二筛选后的数据进行第三数据压缩处理,得到第三数据;

第三筛选单元,用于基于预设的第三阈值对第三数据进行第三筛选,得到预测数据。

另一方面,本发明实施例提供了一种基于时间窗口混合模型的风机叶片预测系统,包括:

至少一个处理器;

至少一个存储器,用于存储至少一个程序;

当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现所述的基于时间窗口混合模型的风机叶片预测方法。

上述本发明实施例中的一个或多个技术方案具有如下优点:本发明的实施例通过特征压缩提取得到有效的目标特征,去除了多余的特征,能够减少特征识别时间,提高了效率;还通过数据压缩,减少了数据处理的工作量,进一步提高了效率;并通过基于时间窗口的混合模型确定结冰预测结果,能够确定结冰的时间,提高了预测的精确度。

附图说明

图1为本发明实施例的步骤流程图;

图2为本发明实施例的结冰预测过程示意图。

具体实施方式

下面结合说明书附图和具体实施例对本发明作进一步解释和说明。对于本发明实施例中的步骤编号,其仅为了便于阐述说明而设置,对步骤之间的顺序不做任何限定,实施例中的各步骤的执行顺序均可根据本领域技术人员的理解来进行适应性调整。

由于风机叶片结冰是一个缓慢的能量累积过程,在结冰早期由于现象不明显难以发现,但是早期结冰的检测对于机组健康运行至关重要。目前主要通过传统检测手段进行检测,很难在结冰严重之前及时检测到叶片的结冰情况。因此,本发明实现了一种基于时间窗口混合模型的风机叶片预测方法,该方法融合了各算法的优势,在快速、少花销的情况下提高了及时发现结冰迹象的能力,能够实现定位更精确的预警能力,从而实现高精度、高鲁棒性、灵活的叶片结冰预警时间节点判别。将该方法应用于风力发电厂,使用scada数据库所采集的风力发电厂风机叶片相关数据,获取风机叶片的各项特征,使用轻量级算法模型和传统统计模型成本低,使用概率加权防止过拟合情况出现,适用于风力发电厂对风机叶片的结冰预警工作,提高叶片结冰预警时间判别精确度和鲁棒性,同时加快模型计算速度。

参照图1,本发明实施例提供了一种基于时间窗口混合模型的风机叶片预测方法,包括以下步骤:

采用主成分分析技术对风机叶片监测数据进行特征压缩,得到目标特征;

采用滑动窗口技术对目标特征进行数据压缩,得到预测数据;

根据预测数据,通过基于时间窗口的混合模型确定结冰预测结果,所述结冰预测结果包括结冰预警时间。

进一步作为优选的实施方式,所述采用主成分分析技术对风机叶片监测数据进行特征压缩,得到目标特征这一步骤,包括以下步骤:

通过主成分分析技术对风机叶片监测数据进行主成分分析,得到风机叶片监测数据中各个特征对应的预测结果影响指数;

对各个特征对应的预测结果影响指数进行排序;

根据排序结果,提取若干个特征作为目标特征。

进一步作为优选的实施方式,所述采用滑动窗口技术对目标特征进行数据压缩,得到预测数据这一步骤,包括以下步骤:

根据第一时间窗尺度,对目标特征进行第一数据压缩处理,得到第一数据;

基于预设的第一阈值对第一数据进行第一筛选;

根据第二时间窗尺度,对第一筛选后的数据进行第二数据压缩处理,得到第二数据;

基于预设的第二阈值对第二数据进行第二筛选;

根据第三时间窗尺度,对第二筛选后的数据进行第三数据压缩处理,得到第三数据;

基于预设的第三阈值对第三数据进行第三筛选,得到预测数据。

其中,本实施例中的第一时间窗尺度为1小时,第二时间窗尺度为半小时,第三时间窗尺度为10分钟,

进一步作为优选的实施方式,所述根据预测数据,通过基于时间窗口的混合模型确定结冰预测结果这一步骤,包括以下步骤:

通过svm算法和朴素贝叶斯算法计算预测数据的结冰概率;

通过概率加权平均法对结冰概率进行概率加权;

判断概率加权后的结冰概率是否小于预设的结冰阈值,若是,则确定第一结冰预测结果;反之,则确定第二结冰预测结果。

进一步作为优选的实施方式,所述基于预设的第二阈值对第二数据进行第二筛选这一步骤,其具体为:

根据lightgbm算法,删除第二数据中具有结冰迹象的数据。

进一步作为优选的实施方式,还包括混合模型训练步骤。

进一步作为优选的实施方式,所述通过概率加权平均法对结冰概率进行概率加权这一步骤中,所述概率加权的计算公式具体为:

其中,n是混合模型个数;weighti是第i个混合模型输出结果的权重;pi是第i个混合模型的输出概率。

与图1的方法相对应,本发明实施例提供了一种基于时间窗口混合模型的风机叶片预测系统,包括:

特征压缩模块,用于采用主成分分析技术对风机叶片监测数据进行特征压缩,得到目标特征;

数据压缩模块,用于采用滑动窗口技术对目标特征进行数据压缩,得到预测数据;

预测模块,用于根据预测数据,通过基于时间窗口的混合模型确定结冰预测结果,所述结冰预测结果包括结冰预警时间。

进一步作为优选的实施方式,所述数据压缩模块包括:

第一压缩单元,用于根据第一时间窗尺度,对目标特征进行第一数据压缩处理,得到第一数据;

第一筛选,用于基于预设的第一阈值对第一数据进行第一筛选;

第二压缩单元,用于根据第二时间窗尺度,对第一筛选后的数据进行第二数据压缩处理,得到第二数据;

第二筛选单元,用于基于预设的第二阈值对第二数据进行第二筛选;

第三压缩单元,用于根据第三时间窗尺度,对第二筛选后的数据进行第三数据压缩处理,得到第三数据;

第三筛选单元,用于基于预设的第三阈值对第三数据进行第三筛选,得到预测数据。

与图1的方法相对应,本发明实施例提供了一种基于时间窗口混合模型的风机叶片预测系统,包括:

至少一个处理器;

至少一个存储器,用于存储至少一个程序;

当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现所述的基于时间窗口混合模型的风机叶片预测方法。

下面详细描述本发明基于时间窗口混合模型的风机叶片预测方法的具体实施步骤:

本发明基于不同的时间窗,运用统计学混合模型提出了一种快速、及时的叶片结冰预测方法(如图1所示)。相较于传统方法,本发明的风机叶片预测的预测速度以及精度得到明显提高。本发明在scada数据库中获取电厂风机叶片监测数据,通过对获取的监测数据的特征上进行主成分分析,获得对预测叶片结冰最重要的几项特征,从而降低特征维度。具体地,风机叶片结冰预测的工作流程如图1所示,其主要步骤如下:

1)、获取scada数据库中的风机叶片监测数据;

2)、对获取的监测数据进行预处理;

3)、将提取的主成分特征输入风机叶片结冰模型;

4)、判断风机叶片是否有结冰风险,如果是则执行步骤5);反之则返回执行步骤1);

5)、预警上报。

具体地,本实施例中所述步骤2)的数据预处理分为两个主要阶段:

1、由于采集数据的特征维度高达27个,但是有许多特征对于判断结冰趋势的贡献不大,且对判定结冰时间定位存在干扰作用;所以,本实施例首先对主成分进行分析,绘制风机叶片监测数据中各特征的结冰趋势判断影响图,然后提取在判断风机叶片结冰趋势上的有效特征,进行特征压缩,进而能够减少后期输入模型后的识别时间;

2、由于对风机叶片的数据采集频率为每秒采集多次,因此采集得到的待处理数据量十分巨大,所以本实施例采用滑动窗口技术进行数据切片,将数据量进行压缩,减少在建模及预测阶段由于数据量巨大引起的费时问题。

具体地,加入所述数据预处理过程后,本发明的完整步骤流程具体包括以下步骤:

1)、从scada中获取原始数据;

2)、对获取到的原始的特征数据运用pca进行主成分分析,根据影响指数曲线图提取重要特征数据;

3)、将2)中处理数据基础上以粗糙时间尺度进行时间窗切片;

4)、将3)中的数据输入叶片结冰预测混合模型;

5)、判断风机叶片是否有结冰风险,如果是则进入步骤6),反之则返回步骤1)以继续预测其他数据;

6)、预警上报。

对于一个时序问题,传统的方法是运用时间序列模型,应用时间序列模型的各种特点进行建模分析。但是,对于风机结冰的机组数据来说,每条数据的时间间隔过于短暂,几秒时间风机叶片的结冰情况几乎不会发生较大变化,导致数据区分较小,模型效果较差;而每十分钟到一小时内,叶片结冰的变化程度比较明显的,所以本实施例将预测工作分为多级进行,首先将数据进行粗糙时间窗切分,根据本级判断是否有结冰风险,有则设定阈值,确定下一级时间窗尺度,以此不断缩小预测范围。

对于刚获取的风机叶片监测数据,其数据量较大,因此运用运算速度较快的模型进行筛选,训练出模型,并进行判定是否结冰。根据判定结果筛选出结果为结冰的半小时内的数据,继续判定是否结冰,再切分成十分钟级别,继续上述操作;本实施例既能有效减少分析的数据量,又能结合业务背景,在较小的时间范围内找到有效特征。

具体地,如图2所示,本实施例所述采用滑动窗口技术对目标特征进行数据压缩,得到预测数据这一步骤,包括以下步骤:

1)、第一数据压缩:将提取完主要特征的数据按一小时级别进行压缩,根据压缩前的一小时内数据的结冰数据比例,定义小时级别数据的结冰标签的阈值(即第一阈值);

2)第一筛选:筛选出标签是结冰的数据进入步骤3),否则删除;

3)第二数据压缩:将一小时的时间分割成两个半小时,此时的数据是压缩到半小时级别,根据压缩前的半小时内数据的结冰数据比例(本实施例中通过0、1来对数据进行标记,0代表未结冰,1代表已结冰,定义半小时级别数据的结冰标签的阈值(即第二阈值);

4)第二筛选:筛选出标签是结冰的数据进入步骤5),否则删除;

5)第三数据压缩以及第三筛选:此时数据量较大,运用运算速度较快的模型进行筛选,训练出模型,并进行判定是否结冰。继续筛选出判定为结冰的半小时数据,切分成十分钟级别的第三数据。

接着,本实施例分别用svm和朴素贝叶斯算法计算结冰概率;

然后将获得概率进行概率加权,判断是否达到设定的结冰阈值,进而得到预测标签;

因为本实施例将十分钟级别数据作为最终结果,所以最后一步的判定通过不同模型各自的判定,运用了较为传统的概率加权平均法,将传统的分类问题转化成线性加权问题,具体公式如下:

其中,n是同一层的模型个数,weighti是第i个模型输出结果的权重,pi是第i个模型的输出概率。

具体地,假设有g1,g2,g3,…,gn这n个模型,将这n个模型融合的策略:该策略中g(x)的误差小于任一一个模型gn的误差。

其中,αt代表基本分类器gt(x)在最终分类其中的重要性,

et为gt(x)在训练数据集上的分类误差率。

t代表学习基本分类器的次数,t=1时表示第一次进行基本分类器学习,依次类推,直到t=t时,表示基本分类器学习完成,此时终止学习。

sign(x)为符号函数,其功能是取某个数的符号(正或负),具体地,

当x>0,sign(x)=1;

当x=0,sign(x)=0;

当x<0,sign(x)=-1。

下面结合混合模型训练步骤,进一步详细描述本发明的具体实施步骤:

s1、数据获取:

本发明获取的数据来自scada数据库,此数据库用来采集并存储风力发电厂各项被采集的数据。

s2、融合算法模型的风机叶片结冰预测步骤:

为了预测风机叶片是否处于结冰进行状态,首先需要离线训练叶片结冰预警判别模型,然后获取scada数据库中的叶片相关特征数据,确定结冰敏感特征是否发生变化。为了能快速定位结冰预警时间块,获取结冰初期时间比较精确的定位,在进一步确定设定阈值时间节点的同时防止过拟合的情况发生,提出了一种基于时间窗口混合模型的风机叶片预测方法。该方法主要包括3个模块,其中首先在一小时级数据处理模块使用lightgbm算法大致定位,在半小时和十分钟级时间窗数据模块,利用统计学习模型svm和朴素贝叶斯算法对小规模数据块进行概率计算和概率加权,最后输出叶片结冰预警判别结果。

具体地,混合模型的风机叶片结冰预测模型离线训练过程如下:

(1)、从scada中获取原始数据。

(2)、数据预处理(特征维度)。对获取到的原始的特征数据进行主成分分析,根据影响指数曲线图提取重要特征数据。

(3)、数据预处理(时间窗)。以一小时为尺度进行时间窗切片。

(4)、训练模型:使用lightgbm进行半小时级时间窗数据训练,再对筛选数据进行十分钟时间窗切块,使用svm和朴素贝叶斯算法进行混合模型训练。

(5)、模型检测:根据scada数据库提取的数据与训练一样的流程预处理提取特征和切分时间窗后输入上述混合模型从而判别叶片是否处于结冰阶段。

具体地,混合模型的风机叶片结冰预测模型在线判别步骤如下:

混合模型的风机叶片结冰预测模型在线识别过程包括:

1)、scada数据库提取的数据进行数据预处理(特征降维和一小时时间窗切片)。

2)、将处理的数据输入混合模型判断是否需要上报预警,有则上报,无则结束本组数据判别。

综上所述,本发明提出一种基于时间窗口混合模型的风机叶片预测方法,该方法主要包括3个处理模块:1)一小时级时间窗数据处理模块,使用传统方式对一小时级数据进行判别,输出本级判别情况;2)半小时级时间窗数据处理模块,使用lightgbm对半小时级数据进行判别,输出本级判别情况;3)十分钟级时间窗数据处理模块,分别使用svm与朴素贝叶斯算法进行数据结冰概率计算,将各自计算结果进行概率加权,将输出结果与设定好的阈值比较,输出判别结果。

本发明基于时间窗口的融合模型有以下优点:

1、本发明对模型的限制较低,能够融合各类预测模型和强弱学习器;

2、本发明摆脱了原数据固有的时间级别限制,可以做到层层推进,从粗糙的时间段到精细的时间段的数据进行分析,多层面分析数据特点;

3、通过传统的概率加权方法使融合模型不容易过拟合,保证了模型的稳定性。

4、本发明面向风机叶片结冰预测,提出一种基于时间窗口混合模型的风机叶片预测方法,该方法包括一小时级时间窗数据处理模块、半小时级时间窗数据处理模块和十分钟级时间窗数据处理模块,使用时间窗技术将多算法模型融合,结合各算法优势,通过传统的概率加权方法保护融合模型不发生过拟合,在花费很小的情况下加快判别速度,提高预测准确度。

以上是对本发明的较佳实施进行了具体说明,但本发明并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1