一种基于多源时变数据最优多核函数的分布式新能源出力预测方法与流程

文档序号:13237407阅读:532来源:国知局
一种基于多源时变数据最优多核函数的分布式新能源出力预测方法与流程

本发明涉及发一种基于多源时变数据最优多核函数的分布式新能源出力预测方法,属数据挖掘领域。



背景技术:

近几年来,随着计算机和信息技术的迅猛发展和普及应用,行业应用系统的规模迅速扩大,行业应用所产生的数据呈爆炸性增长。这种爆炸性增长的数据量对多源、异构、高维、分布、非确定性的数据提出了挑战,大数据思维就是此环境中的产物,大数据的显著特征之一就是多源异构特性。

影响分布式新能源预测的数据有很多,比如分布式新能源接入及运行信息、电网生产管理信息、地理气象信息等,这些数据就是多源数据,如果有效利用多源时变数据的分布特点进行分布式新能源出力预测,则能提高预测精度。

多核函数是实现多源异构数据融合的有效方法,其组成中的基核能够像一系列传感器一样对各自的信息进行感知,能够提供更加灵活和有效的信息组织与挖掘功能。目前关于多核函数构成选择的方法,主要有两种方法:

1、直接选取一个全局核函数和一个局部核函数,简单加权后构成混合核函数,这种方法的缺点是:①限制多核函数的构成只有两个单核函数;②没有考虑已有数据集中各个多源异构数据的特征;③常用的全局核函数有多项式核函数polynomial和sigmoid核函数,该方法选择全局核函数时通常是任选一个,具有盲目性。

2、首先利用单核svm进行预测或分类,然后选取精度最高的两种核函数进行组合形成多核函。这种方法忽略了来自不同数据源的不同种类特征,没有充分利用多核函数对多源异构数据进行有效处理。



技术实现要素:

本发明的目的是克服上述现有技术的不足,提供一种基于多源时变数据最优多核函数的分布式新能源出力预测方法,该方法通过多核函数构建、函数构成比较、函数性能比较三步来确定svm预测时的最优多核函数能够有效处理分布式新能源相关的多源时变数据,以解决目前支持向量机方法中核函数选择具有盲目性问题,提高预测精度。

本发明为解决上述技术问题的技术解决方案如下:

一种针基于多源时变数据最优多核函数的分布式新能源出力预测方法,具体步骤如下:

步骤1、确定影响分布式新能源出力预测的时变数据源:气象数据源、地理数据源、新能源运行信息数据源;

步骤2、从分布式新能源厂站的气象站采集气象数据源的a种气象数据,从gis系统采集地理数据源的b种地理数据,从scada系统采集新能源运行信息数据源的c种新能源运行数据,一共q=a+b+c种时变数据,组成集合为d代表任意一种时变数据,每天采集为xd=[x1,x2,…,xt]∈r1×t,t代表每天共采集t个时刻的数据,在新能源运行数据中,分布式新能源出力为yi=[y1,y2,…,yt]∈r1×t,共采集n天;

步骤3、利用多源时变数据分布特征法、单源数据支持向量机预测或分类法、核矩阵秩空间差异法,构建针对分布式新能源时变数据源分布特点的最优多核函数kopt(xi,xj),i,j表示每种时变数据任意两个时刻;

步骤4、步骤4、利用支持向量机svm对分布式新能源进行出力预测,核函数采用步骤3中得到的最优多核函数kopt(xi,xj)。

步骤3中构建针对分布式新能源时变数据源分布特点的最优多核函数,具体步骤如下:

(1)多核函数构建:

1a.对于第d种时变数据,将其共n天的时变数据xd的分布特点在相应坐标系下表示,根据图中数据的分布,判断第d个数据源时变数据的分布特性,根据分布特性,选择其对应最优单核函数kd1(xi,xj),对所有q个时变数据进行该操作,构建分布特征多核核函数k1(xi,xj):

其中:kd1(xi,xj)为线性核函数、多项式核函数、径向基核函数与sigmoid核函数中的一种;

1b.对于第d种时变数据,将其分别作为线性核函数、多项式核函数、径向基核函数与sigmoid核函数支持向量机的输入特征量,比较预测或分类精度,选择预测精度最高的核函数作为第d个数据源时变数据的核函数kd2(xi,xj),对所有q个时变数据进行该操作,构建svm多核核函数k2(xi,xj):

其中:kd2(xi,xj)为线性核函数、多项式核函数、径向基核函数与sigmoid核函数中的一种;

(2)多核函数构成比较:若k1(xi,xj)与k2(xi,xj)的核函数构成相同,则此多核函数为多源时变数据对应的最优多核函数:kopt(xi,xj)=k1(xi,xj)=k2(xi,xj),若k1(xi,xj)与k2(xi,xj)的构成不同,则转(3);

(3)多核函数性能比较:

3a.计算最优加权系数λ:

3b.对多核函数k1(xi,xj)与k2(xi,xj)进行加权,形成加权多核核函数k3(xi,xj):

其中:其中:kd3(xi,xj)为线性核函数、多项式核函数、径向基核函数与sigmoid核函数中的一种,λ为3a中计算的最优加权系数,0<λ<1;

3c.对于第d种数据源的时变数据,计算在kd1(xi,xj)、kd2(xi,xj)、kd3(xi,xj)核函数映射下的核矩阵:

其中:d=1,2,…,q,s=1,2,3,s表示k1(xi,xj)、k2(xi,xj)、k3(xi,xj)三种核函数对应的下标;

3d.利用核矩阵秩空间差异法法,计算由3b得到的a1,s,a2,s,…,aq,s,s=1,2,3的秩空间差异性度量:

其中:d=1,2,…,q,s=1,2,3,rank(a)为求矩阵a的秩;

3e.比较rsd1、rsd2与rsd3值的大小,选取最大值对应的函数作为多源时变数据融合的最优多核函数kopt(xi,xj)。

与现有技术相比,本发明的有益效果是:

传统支持向量机的核函数选择一直是未解决的问题,对于能够实现多源异构数据融合的多核函数选择更加具有盲目性,使得分布式新能源出力预测精度较低,本发明的采用多源时变数据分布特征法、单源数据支持向量机预测或分类法、核矩阵秩空间差异法,能够判断所有分布式新能源相关多源时变数据的分布特点,为每种数据选择局部核函数还是全局核函数提供依据,构造出最优多核函数,实现了多源时变数据的融合,提高分布式系能源出力预测精度。

附图说明

图1是基于多源时变数据最优多核函数的分布式新能源出力预测方法

图2是步骤3中采用多源时变数据分布特征法构造多核函数的流程图

图3是步骤3两个多核函数线性加权后选择最优多核函数的流程图

具体实施方式

为使本发明更明显易懂,兹以优选实施例子,并配合附图作详细说明如下。图1多源时变数据最优多核函数的分布式新能源出力预测方法整体流程图,即下述步骤1至步骤4。

步骤1、确定影响分布式新能源出力预测的时变数据源:气象数据源、地理数据源、新能源运行信息数据源;

步骤2、从分布式新能源厂站的气象站采集气象数据源的a种气象数据,从gis系统采集地理数据源的b种地理数据,从scada系统采集新能源运行信息数据源的c种新能源运行数据,一共q=a+b+c种时变数据,组成集合为d代表任意一种时变数据,每天采集为xd=[x1,x2,…,xt]∈r1×t,t代表每天共采集t个时刻的数据,共采集n天,待预测分布式新能源出力为yi=[y1,y2,…,yt]∈r1×t

步骤3、利用多源时变数据分布特征法、单源数据支持向量机预测或分类法、核矩阵秩空间差异法,构建针对分布式新能源时变数据源分布特点的最优多核函数kopt(xi,xj),i,j表示每种时变数据任意两个时刻,具体步骤如下:

(1)多核函数构建:

1a.对于第d种时变数据,将其共n天的时变数据xd的分布特点在相应坐标系下表示,根据图中数据的分布,判断第d个数据源时变数据的分布特性,根据分布特性,选择其对应最优单核函数kd1(xi,xj),对所有q个时变数据进行该操作,构建分布特征多核核函数k1(xi,xj):

其中:kd1(xi,xj)为线性核函数、多项式核函数、径向基核函数与sigmoid核函数中的一种;

1b.对于第d种时变数据,将其分别作为线性核函数、多项式核函数、径向基核函数与sigmoid核函数支持向量机的输入特征量,比较预测或分类精度,选择预测精度最高的核函数作为第d个数据源时变数据的核函数kd2(xi,xj),对所有q个时变数据进行该操作,构建svm多核核函数k2(xi,xj):

其中:kd2(xi,xj)为线性核函数、多项式核函数、径向基核函数与sigmoid核函数中的一种;

(2)多核函数构成比较:若k1(xi,xj)与k2(xi,xj)的核函数构成相同,则此多核函数为多源时变数据对应的最优多核函数:kopt(xi,xj)=k1(xi,xj)=k2(xi,xj),若k1(xi,xj)与k2(xi,xj)的构成不同,则转(3);

(3)多核函数性能比较:

3a.计算最优加权系数λ:

①在多核函数中,映射后的函数为:

式中:φ3、φ1、φ2分别为加权多核函数k3(xi,xj)、多源时变数据分布特征法多核函数k1(xi,xj)、单源数据支持向量机预测或分类法多核函数k2(xi,xj)所对应的函数映射;

②距离为:

③求关于λ的一元二次多项式:

④要使l(λ)最大化,即求一元二次多项式的最大值问题,则λ通过下式求得:

3b.对多核函数k1(xi,xj)与k2(xi,xj)进行加权,形成加权多核核函数k3(xi,xj):

其中:其中:kd3(xi,xj)为线性核函数、多项式核函数、径向基核函数与sigmoid核函数中的一种,λ为3a中计算的最优加权系数,0<λ<1;

3c.对于第d种数据源的时变数据,计算在kd1(xi,xj)、kd2(xi,xj)、kd3(xi,xj)核函数映射下的核矩阵:

其中:d=1,2,…,q,s=1,2,3,s表示k1(xi,xj)、k2(xi,xj)、k3(xi,xj)三种核函数对应的下标;

3d.利用核矩阵秩空间差异法法,计算由3b得到的a1,s,a2,s,…,aq,s,s=1,2,3的秩空间差异性度量:

其中:d=1,2,…,q,s=1,2,3,rank(a)为求矩阵a的秩;

3e.比较rsd1、rsd2与rsd3值的大小,选取最大值对应的函数作为多源时变数据融合的最优多核函数kopt(xi,xj)。

步骤4、利用支持向量机svm对分布式新能源进行出力预测,核函数采用步骤3中得到的最优多核函数kopt(xi,xj)。

本发明通过采用采用多源时变数据分布特征法、单源数据支持向量机预测或分类法、核矩阵秩空间差异法,构造出最优多核函数,实现了多源时变数据的融合,提高分布式新能源出力预测精度,适合于多源数据的分析。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1