基于分形理论与改进的最小二乘支持向量机潮汐流速预测方法与流程

文档序号:15737826发布日期:2018-10-23 21:47阅读:360来源:国知局

本发明涉及一种基于分形理论和蜻蜓算法改进的最小二乘支持向量机的海洋平台短期潮汐流速预测方法,属于潮汐能流速预测领域。



背景技术:

潮汐能是一种可再生的清洁能源,近些年在我国得到了大规模的发展,但是,可再生能源一般具有的间歇性,不可控性以及拓扑结构多样化等特点,潮汐能也同样存在。由于潮汐流的潮涨潮落而引发的潮汐流速的时大时小,会使对发电机功率输出存在随机性。准确的潮汐能功率预测可以为电力调度,电力系统的可靠性评估提供重要的保证,有效的减轻潮汐能对电网的影响。由于潮汐能功率与潮汐流速有直接确定的关系,功率预测可以在潮汐流速预测的基础上实现,所以准确的潮汐流速预测显得十分重要。

现有的谐波分析法和SHOM(Service hydrographique et océanographique de la marine)预测潮汐流速,但是这两种方法只考虑了潮流速度的规律性,无法模拟每一个时间点潮流速度的随机性。H.Chen,N.E.H.and M.Machmoum,"Marine tidal current systems:State of the art,"2012IEEE International Symposium on Industrial Electronics,Hangzhou,2012,pp.1431-1437;B.L.Polagye,J.Epler and J.Thomson,"Limits to the predictability of tidal current energy,"OCEANS 2010MTS/IEEE SEATTLE,Seattle,WA,2010,pp.1-9。使用统计学的方法捕捉潮流速度的概率特征,但是这种方法不能直接用于生成具有规律性和随机性的潮流速度时间序列。Mingjun Liu,Wenyuan Li,R.Billinton,C.Wang and Juan Yu,"Probabilistic modeling of tidal power generation,"2015IEEE Power&Energy Society General Meeting,Denver,CO,2015,pp.1-5。最小二乘支持向量机(least square support vector machine,LSSVM)是在统计学理论上发展起来的一种新型的学习方法,能够生成具有规律性和随机性的潮流速度时间序列,能有效的避免陷入局部最优,而且具有较强的泛化能力。在LSSVM预测建模过程中,影响预测模型精确度的参数主要是正则化参数和核函数宽度,但是这两个参数一般采用试凑法选取,造成预测麻烦且误差较大,因此有学者提出使用粒子群算法,遗传算法,蚁群算法等优化最小二乘支持向量机,但是上述的智能算法会出现建模速度慢,容易陷入局部最优,预测效率低等问题。



技术实现要素:

为了解决上述存在的问题,本发明提出了有一种基于分形理论与改进的蜻蜓算法(Improvement Dragonfly Algorithm,IDA)优化最小二乘支持向量机进行潮汐流速的预测模型,该方法首先基于分形理论,使用R/S分析法计算了时间序列的Hurst指数和V统计量,评价了潮汐流速的稳定性,判断了潮汐流速的自相似性与潮汐流速的非循环周期,然后使用改进的蜻蜓算法优化最小二乘支持向量机的正则化参数和核函数宽度两个参数,其全局搜索能力强,预测精度高,计算效率快。最后通过改进后的预测模型进行潮汐流速的预测,实验结果表明,该方法的预测精度更高。

本发明所提出的潮汐流速预测方法的具体步骤如下:

(1)在目标潮汐流能发电站利用潮汐流测速工具实时采集目标潮汐发电站的潮汐流速数据,获得潮汐流速的样本集合,作为试验的数据。

(2)利用R/S分析法分析潮流速度的自相关性和长程记忆性。

1)计算Hurst指数和V统计量。

对离散序列X={Xi:i=1,2,…,N},其中N为总离散点数,将其分成互不重叠M个长度为n子区间,分别标记为区间Im(m=1,2,…,M),则区间Im中各元素表示为Ni,m(i=0,1,2,…,n)。

对每个子区间分别求其平均值和标准差:

式(1)(2)中:n(2≤n≤N)为每个子区间观测值的个数。

计算对应的累计离差X(i,m)和极差Rm(n):

Rm(n)=max X(i,m)-min X(i,m) (4)

求出对应极差与标准差之比:

对所有的RSm(n)取平均值,得到RS(n)。

取不同的n值,求出不同区间长度n上的RS(n),设有:

lg(RS(n))=lg c+H lg n (6)

式(6)中:c为统计常数;H为R/S方法的Hurst指数。

V统计量定义为:

2)分析潮汐流速的自相关性和长程相关的特征。

根据离散序列X的Hurst指数,可以判断出该序列是否具有自相似形,具体如下:

当0<H<0.5时,表明该序列具有反相关性,是不独立的,其前后部分的发展趋势相反,同时此序列突变性和易变性较强;

当H=0.5时,表明该序列是不相关的、随机独立的,其前后部分的发展趋势没有任何联系,是不可预测的;

当0.5<H<1时,表明该序列具有正相关性和自相似性,系统具有持续性,其前后部分的发展趋势一致。H值越接近于1,正相关性越强,自相似程度越高,可预测性越强。当H=1时,该序列是确定的,不独立的,即完全可预测。

若V统计量在以log(n)为横坐标系中表现为向上倾斜,则时间序列表现为长程记忆性,曲线的拐点处对应该序列的非循环长度;若曲线是向下倾斜的,则时间序列具有反记忆性;若表现为水平直线时,则序列为独立随机过程。

(3)基于蜻蜓算法改进的最小二乘支持向量机建立预测模型。

1)将收集的潮汐流数据进行数据预处理,剔除其中的异常数据,对原始的样本数据进行归一化预处理,把采集到的历史数据压缩到[0,1]之间。

归一化处理的公式为:

其中,x*为归一化后的值;x为原始样本值;xmin为样本最小值;xmax为样本最大值。

2)确定最小二乘支持向量机的核函数及其模型。

径向基函数具备样本变换到高维空间,进行非线性规划的能力,而且径向基函数因为其参数舍取的束缚条件较少,使得计算的繁杂性降低,最后该函数具有非常明确的统计意义,完美利用了样本数据分布的先验知识。因此,选择的核函数为径向基核函数:

exp(-||x-xi||2/2σ2) (9)

式中x为输入向量,xi为径向基函数的中心,维数和输入量一致,σ为核函数宽度,该系数决定了此函数围绕中心点的宽度。

采用归一化预处理后的数据,构成训练样本数据,将其作为最小二乘支持向量机的训练样本,选择一个非线性函数φ(x)将输入样本映射到希尔伯特高维特征空间,基于结构风险最小化原则,最小二乘支持向量机的优化问题描述为求解最优化问题的目标函数,将该问题利用拉格朗日函数进行求解,建立LSSVM回归模型:

其中K为径向基核函数,b为偏差向量。

3)基于蜻蜓算法对最小二乘支持向量机回归模型的两个核心参数:正则化参数γ和核函数宽度σ两个参数寻优,找到最优的参数组合。

3-1)算法参数初始化。初始化求解问题维度d,最大迭代次数Mit,蜻蜓个体N,以及最小二乘支持向量机正则化参数γ和核函数宽度σ的上下限值ub、lb。

3-2)计算每种类型样本的每个特征初始中心点Zkj将需要优化的LSSVM正则化参数γ和核函数宽度σ组合作为蜻蜓求解的位置Xt,随机生成蜻蜓个体初始解(即蜻蜓位置)X0;随机初始化步长向量ΔXt;随机初始化蜻蜓个体5种行为的权重:分离权重S,对齐权重A,内聚力权重C,食物吸引力权重F,避敌权重E;随机初始化相邻半径r,惯性权重w。

3-3)计算适应值。将最小二乘支持向量机计算的分类准确率作为蜻蜓当前的适应值。

3-4)采用本发明提出的改进蜻蜓算法策略,将上一代(t-1)与本代(t)相关联,求出两代的优秀蜻蜓个体按映射排序,并计算保存对应最优适应值。

3-5)更新食物源、天敌位置。利用欧几里德距离公式计算食物来源X+和天敌位置X-

3-6)蜻蜓行为更新。根据公式(11)更新蜻蜓个体的分离(S)行为;根据公式(12)更新蜻蜓个体的对齐(A)行为;根据公式(13)更新蜻蜓个体的内聚(C)行为;根据公式(14)更新蜻蜓个体的食物吸引力(F)行为(15),根据公式(15)更新蜻蜓个体的避敌(E)行为。

Fi=X+-X (14)

Ei=X--X (15)

3-7)位置更新。若蜻蜓至少有一个邻近的蜻蜓,则利用公式(16)更新步长向量和位置向量;若没有临近蜻蜓,利用公式(17)更新位置向量。

3-8)算法迭代终止判断。若达到最大迭代次数Mit,则保存当前最优位置向量即最优最小二乘支持向量机的正则化参数γ和核函数宽度σ组合。若未达到最大迭代次数,则转到步骤3-4)。

Xt+1=Xt+ΔXt+1 (16)

Xt+1=Xt+Levy(d)×Xt (17)

ΔXt+1=(sSi+aAi+cCi+fFi+eEi)+wΔXt (18)

式中:X为当前蜻蜓个体位置;Xj为第j个相邻蜻蜓个体的位置;N为相邻蜻蜓个数;Vj表示第j个相邻蜻蜓个体飞行速度;X+表示食物位置;X-表示天敌位置;d表示位置向量的维度;Levy随机游走。

4)利用步骤2)中选择的径向基核函数以及步骤3)中基于蜻蜓算法寻优得到的最佳的正则化参数γ和核函数宽度σ,作为最小二乘支持向量机预测模型的参数组合,根据支持向量机回归原理,建立最佳的LSSVM潮汐流预测模型。

与现有技术相比,本发明的有益效果

(1)本发明所提出的潮汐流速预测方法,在潮汐能具有规律性和随机性的基础上,能够更好的诠释潮汐流速的自相关性,为分析预测提供更好的理论判据和有效途径。

(2)本发明所提出的改进的蜻蜓算法优化最小二乘支持向量机参数进行潮汐流速的预测,算法步骤简洁,全局搜索能力强,拥有更高的预测精度及更好的计算效率。

(3)本发明所提出的潮汐流速预测方法快速准确,对含有潮汐能的电力系统而言,能够更好的保证电力系统的优化调度,确保电力系统的可靠性与安全性。

附图说明

图1为基于分形理论和改进的最小二乘支持向量机的预测模型流程图;

图2为采集的潮汐流速Hurst指数计算结果图;

图3为V统计量的曲线图;

图4为蜻蜓算法优化最小二乘支持向量机参数流程图;

图5为潮汐流的预测速度与实际速度对比图;

具体实施方式

下面结合附图及实施案例,对本发明进行进一步详细说明,以使本发明的目的、技术方案及优点更加清楚明白。应当理解,此处所描述的具体实施案列仅用以解释本发明,不能理解为对本发明包括范围的限制,该领域的技术熟练人员可以依据上述本发明的内容做出一些非本质的改进和调整。

本发明方法的流程图如图1所示,具体步骤如下:

(1)以渤海地区某潮汐能发电站为例,获得样本数据集合点,设定采集以6分钟为间隔,一天采集240个点,采集32天的潮汐流速的数据作为试验数据。

(2)利用R/S分析法计算时间序列的Hurst指数和V统计量。

1)计算Hurst指数和V统计量。

以采集的某一天为例,计算Hurst指数,对采集的潮汐流速的离散序列样本X={Xi:i=1,2,…,N},其中N为总离散点数,N=240,将其分成M个长度为n等长子区间,采集一天的离散点N=240,则可划分M=[4,6,…],n=[60,40,…]。首先取M=4,n=60,分别计算每一个子区间的均值P(n)和标准差Sm(n),计算对应的累计离差X(i,m)和极差Rm(n),然后根据公式求取极差和标准差之比,得到平均取不同的n值,比如可以取值60,120等等,求出不同区间长度n上的RS(n),设有:

lg(RS(n))=lg c+Hlg n (20)

根据上述公式求取H参数Hurst指数,对应采集数据的每一天都可以求出一个Hurst指数,结果如图2所示。根据V统计量的定义,计算V统计量,结果如图3所示。

2)分析潮汐流速的自相关性和长程相关的特征。

当0.5<H<1时,表明该序列具有正相关性和自相似性,系统具有持续性,其前后部分的发展趋势一致。H值越接近于1,正相关性越强,自相似程度越高,可预测性越强。当H=1时,该序列是确定的,不独立的,即完全可预测。从图2中可以看出所有的Hurst指数属于0.5<H<1的范围,则表明该序列是具有正相关性和自相似性的,作为潮汐流速的预测的理论判据是成立的。

若V统计量在以log(n)为横坐标系中表现为向上倾斜,则时间序列表现为长程记忆性,曲线的拐点处对应该序列的非循环长度;从图3可以看出V统计量的曲线图,曲线向上倾斜,表示时间序列为长程记忆性,拐点处的log(N)=2.25可以计算非循环长度,根据计算结果刚好是一天的预测点,与我们的短期潮汐流速预测刚好符合。

(3)基于蜻蜓算法改进的最小二乘支持向量机建立预测模型。

1)将收集的潮汐流数据进行数据预处理,剔除其中的异常数据,对原始的样本数据进行归一化预处理,把采集到的历史数据压缩到[0,1]之间。

2)确定最小二乘支持向量机的核函数及其模型。

选取最小二乘支持向量机的核函数为径向基核函数:

exp(-||x-xi||2/2/σ2) (21)

式中x为输入向量,xi为径向基函数的中心,维数和输入量一致,σ为核函数宽度,该系数决定了此函数围绕中心点的宽度。

采用归一化预处理后的数据,构成训练样本数据,将其作为最小二乘支持向量机的训练样本,选择一个非线性函数φ(x)将输入样本映射到希尔伯特高维特征空间,基于结构风险最小化原则,最小二乘支持向量机的优化问题描述为求解最优化问题的目标函数,将该问题利用拉格朗日函数进行求解,建立LSSVM回归模型:

3)基于蜻蜓算法对最小二乘支持向量机回归模型的两个核心参数:正则化参数γ和核函数宽度σ两个参数寻优,找到最优的参数组合。流程图如图4所示:

3-1)算法参数初始化。例如将求解问题维度d设置为6,最大迭代次数Mit(100),蜻蜓个体N(300),最小二乘支持向量机的正则化参数γ和核函数宽度σ的上下限值ub、lb分别为1,100。

3-2)初始化蜻蜓行为参数。例如将蜻蜓个体位置的当前解Xt设置需要优化的LS-SVM正则化参数和核函数宽度组合,随机生成蜻蜓个体初始解(即蜻蜓位置)X0∈(0,1];随机初始化步长向量ΔXt=0.01;随机初始化蜻蜓个体5种行为的权重:分离权重S,对齐权重A,内聚力权重C,食物吸引力权重F,避敌权重E;随机初始化相邻半径r,惯性权重w,都在(0,1]范围内取值。

3-3)计算适应值。将最小二乘支持向量机计算的分类准确率作为蜻蜓当前的适应值。

3-4)采用本发明提出的改进蜻蜓算法策略,将上一代(t-1)与本代(t)相关联,求出两代的优秀蜻蜓个体按映射排序,并计算保存对应最优适应值。

3-5)更新食物源、天敌位置。利用欧几里德距离公式计算食物来源X+和天敌位置X-

3-6)蜻蜓行为更新。更新蜻蜓个体5种行为:分离S,对齐A,内聚力C,食物吸引力F,避敌E。

3-7)蜻蜓位置更新。若蜻蜓至少有一个邻近的蜻蜓,则利用公式ΔXt+1=(sSi+aAi+cCi+fFi+eEi)+wΔXt更新步长向量,同时根据公式Xt+1=Xt+ΔXt+1更新位置向量;若没有临近蜻蜓,利用公式Xt+1=Xt+Levy(d)×Xt更新位置向量。

3-8)算法迭代终止判断。若达到最大迭代次数Mit,则保存当前最优位置向量即最优最小二乘支持向量机的正则化参数γ和核函数宽度σ组合。若未达到最大迭代次数,则转到步骤3-4)。

4)利用步骤2)中选择的径向基核函数exp(-||x-xi||2/2σ2)以及步骤3)中基于蜻蜓算法寻优得到的最佳的正则化参数γ和核函数宽度,作为最小二乘支持向量机预测模型的参数,根据支持向量机回归原理,建立最佳的LSSVM潮汐流预测模型。选择第32天为待预测日的潮汐流速预测值,预测结果如图5所示:

为验证本方法的有效性,评估预测效果,需要适当的评价指标。我们选取平均绝对百分误差(Mean Absolute Percent Error,MAPE)和均方根相对误差(Root Mean Square Error,RMSE)作为预测模型评判指标。

平均绝对百分误差(MAPE):

均方根相对误差(RMSE):

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1