基于优化多核的lssvm脉动风速预测方法

文档序号:9217444阅读:1050来源:国知局
基于优化多核的lssvm脉动风速预测方法
【技术领域】
[0001] 本发明涉及一种采用已有核函数Lin_kernel、RBF_kernel、Poly_kernel组合 优化的最小二乘支持向量机的单点脉动风速预测方法,具体的说是一种基于优化多核的 LSSVM脉动风速预测方法。
【背景技术】
[0002] 支持向量机出色的学习性能,尤其针对于小样本问题,一直是机器学习以及数据 挖据算法的研宄热点。核函数在支持向量机中是至关重要的,它的引入极大地提高了学习 机器的非线性处理能力,保持了学习机器在高维空间中的内在线性,使得学习的过程容易 得到控制。显然支持向量机的性能在很大程度上取决于核函数的好坏,因此近年来关于支 持向量机的研宄大部分都集中在支持向量机核函数的研宄。目前国内外关于核函数的研宄 主要可概括为以下几个方面:(1)组合现有的核函数构造出新的核函数;(2)改进现有的核 函数设计新的核函数;(3)核函数参数优化问题;(4)针对参数优化的模型选择问题。
[0003] 多核Multiple Kernel支持向量机与标准的SVM的区别是标准SVM对所有特 征同样对待,使用了一个核函数,而多核支持向量机则通过不同核函数的凸组合作为 新的核函数,该方法相当于对特征进行分块,每一块使用一个核函数,尤其适用于多源 Heterogeneous特征。不恰当的核函数或参数会导致模型的泛化能力差,最简单的组合核函 数的方法就是取平均值。但是每个核函数匹配相同的权值并不合理,因此多核组合主要的 工作就是决定选用的核函数的最优的权值,来平衡学习能力和泛化能力,使两者性能达到 最优。相对于单核学习,多核学习可以达到更高的精度,且具有更强的鲁棒性。在应用多核 学习过程中,即使核函数的参数没有达到最优,也不会太多的影响学习效果。因为通过调整 各核的权值可以获得最合适的参数,这是多核学习稳定性更好的原因之一。
[0004] 在脉动风速实测和风洞试验方面,风速样本的实测不仅需要布置测量装置,而且 增加成本,而传统的数值模拟技术需要通过各个风速模拟点进行模拟,也非常费时。因此, 通过已知的风速样本来获得未知的风速样本非常有实际意义。通过LSSVM预测,我们可获 得风速样本的完整特征信息,节约风速实测成本,这样有助于我们把更多的科研资金运用 到更需要的地方。

【发明内容】

[0005] 本发明的目的在于提供一种基于优化多核的LSSVM脉动风速预测方法,其利用 AR (Auto-Regressive,自回归)模拟脉动风速样本,基于已有核函数Lin_kernel、RBF_ kernel、Poly_kernel,建立不同组合核函数的最小二乘支持向量机(LSSVM)的模型,改进 单一核函数的缺陷并对多核模型参数优化,利用该模型对单点风速进行预测。计算实际风 速与预测风速的平均误差(AE)、均方根误差(RMSE)以及相关系数(R)评价本方法的有效 性。
[0006] 根据上述发明构思,本发明采用下述技术方案:一种基于优化多核的LSSVM脉动 风速预测方法,其特征在于,其包括以下步骤:
[0007] 第一步:利用AR模型模拟生成垂直空间点的脉动风速样本,将每个空间点的脉动 风速样本分为训练集、测试集两部分,采用Matlab对空间点的脉动风速样本归一化处理;
[0008] 第二步:根据 Mercer 定理,将已有核函数 Lin_kernel、RBF_kernel、Poly_kernel 线性组合构造多核核函数,建立基于多核核函数的LSSVM模型;
[0009]第三步:引入PS0优化方法,对不同多核核函数的参数优化:核函数参数Y、 惩罚参数c、权重系数a进行寻优,确定最优模型参数,最优模型参数包括:RBF+Lin和 Poly+Lin,利用此模型对脉动风速测试样本进行预测;利用PS0优化后的多核核函数将脉 动风速训练样本变换成为核函数矩阵,映射到高维特征空间,得到脉动风速训练样本的非 线性模型,利用此模型对脉动风速测试样本进行预测;
[0010] 第四步:将测试样本和预测的脉动风速结果对比,计算预测风速与实际风速的平 均误差、均方根误差以及相关系数。
[0011] 优选地,所述第一步中,AR模型模拟m维脉动风速表示为下式:
[0013] 式中,U(t)为脉动风速A分别是mXm阶AR模型的系数矩阵;N(t)为零均值、方 差给定的随机向量;P为自回归阶数。
[0014] 优选地,所述第二步中,给定n个训练样本{xp x2,…xn},采用线性组合的方式,对 Lin_kernel与Poly_kernel和RBF_kernel与Lin_kernel分别组合,S卩如下两式:
[0015] Kj= a ? KLin+(l-a) ? KPoly
[0016] K2= a ? K Lin+(l_a) ? Kkbf。
[0017] 所述第三步中,设置粒子群规模m = 30和随机产生核参数的初始位置,确定待优 化参数的范围,并设置最大迭代速度;通过迭代优化不断更新粒子的速度和位置,最终根据 终止迭代次数或适应度条件确定最优参数,建立多核LSSVM模型。
[0018] 本发明基于优化多核的LSSVM脉动风速预测方法具有如下优点:多核核函数具有 不同核函数的性能,并且采用最优权重线性组合使其学习能力和泛化能力同时达到最优。 在应用多核学习过程中,即使核函数的参数没有达到最优,也不会太多的影响学习效果。因 为通过优化各核的权值可以获得最合适的参数,这是多核学习稳定性更好的原因之一。根 据运行结果表明,基于多核的LSSVM方法预测得到的脉动风速与实际脉动风速吻合很好, 可以作为脉动风速预测的一种有效方法。
【附图说明】
[0019] 图1是30米高度处脉动风速模拟样本示意图;
[0020] 图2是基于优化多核的LSSVM脉动风速预测方法设计框架图示意图;
[0021] 图3是30米Lin+Poly优化核函数LSSVM预测风速与实际风速对比示意图;
[0022] 图4是30米Lin+Poly优化核函数LSSVM预测风速与实际风速自相关函数对比示 意图;
[0023] 图5是30米Lin+Poly优化核函数LSSVM预测风速与实际风速功率谱密度函数对 比示意图。
[0024] 图6是30米Lin+RBF优化核函数LSSVM预测风速与实际风速对比示意图;
[0025] 图7是30米Lin+RBF优化核函数LSSVM预测风速与实际风速自相关函数对比示 意图;
[0026] 图8是30米Lin+RBF优化核函数LSSVM预测风速与实际风速功率谱密度函数对 比示意图。
【具体实施方式】
[0027] 本发明的构思如下:单一核函数往往很难同时满足很好的学习能力和较强的泛化 能力,而通过不同核函数的组合可以使多核核函数包含不同单核核函数所具有的优点,通 过优化各核的权值可以获得最合适的参数,使多核学习稳定性更好。根据Mercer定理,任 意核函数k( Xi,的Gram矩阵K对称且半正定,满足一定数目的包闭性质,即允许从简单 的核创立复杂的核。所以对RBF_kernel、Poly_kernel、Lin_kernel核函数线性组合,构造 出新的核函数,使预测模型既有具有很好的学习能力(训练误差小),也能有很强的泛化能 力(测试误差小),同时提高单一核函数学习的稳定性。多核函数的最小二乘支持向量机 (LSSVM)的参数包括:RBF核函数参数y、惩罚参数c、权重系数a,利用粒子群(PS0)优化 对上述三个参数进行优化,由于多项式核函数参数q过大时,使模型的计算量骤增,本文取 q = 3达到全局拟合能力以及计算时间的折中。利用优化多核函数LSSVM模型对脉动风压 进行预测,并与传统单一核函数预测结果进行对比分析。
[0028] 以下结合附图采用本发明对单点脉动风速预测作进一步详细说明,步骤如下:
[0029] 第一步,利用AR模型模拟生成垂直空间点的脉动风速样本,将每个空间点的脉动 风速样本分为训练集、测试集两部分,采用Matlab对空间点的脉动风速样本归一化处理; AR模型的自回归阶数p = 4。模拟某200米的超高层建筑,沿高度方向取每隔10米的点作 为各模拟风速点。其他相关参数见表1 :
[0030] 表1相关模拟参数表
[0032] 模拟功率谱采用Kaimal谱,只考虑高度方向的空间相关性。模拟生成30米脉动 风速样本分别见图1。
[0033] 所述第一步中,AR模型模拟m维脉动风速表示为下式(1):
[0035] 式中,t为时间;U(t)为脉动风速;化分别是mXm阶AR模型的系数矩阵;N(t)为 零均值、方差给定的随机向量;P为自回归阶数。
[0036] 求解式⑴中的系数矩阵化,需要对⑴同时右乘N(t)后取期望得到式⑵:
[0037]
[0038]根据相关函数定义穴(r)=五[)义(])知式⑵中左项=run(〇); 右一项
丨;右二项=LRN(o),所以解决(1)中系数问题关键要分别求相关 函数,而相关函数由功率谱通过维纳一辛钦公式算出下式(3):
[0040] 通过对公式(1)的矩阵变换,分别求解自回归系数八1,建立脉动风速表达式。 SijOl)为脉动风速功率谱函数;n为采样频率。
[0041] 第二步,根据 Mercer 定理,将已有核函数 Lin_kernel、RBF_kernel、Poly_kernel 线性组合构造多核核函数,建立基于多核核函数的LS
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1