基于改进灰狼算法优化支持向量机回归机的通信基站流量预测方法

文档序号:28688370发布日期:2022-01-29 11:03阅读:218来源:国知局
基于改进灰狼算法优化支持向量机回归机的通信基站流量预测方法

1.本发明涉及通信基站的流量预测技术领域,具体涉及一种通信基站流量预测方法。


背景技术:

2.高精度网络流量预测是现代网络智能管理的基础,针对支持向量机在网络流量预测建模过程中的参数优化难题,以改善网络流量预测结果为目标,越来越多的学者提出了改进灰狼算法优化支持向量机的网络流量预测模型。本发明基于这个技术背景,对灰狼算法进行改进优化,支持向量机回归机来提高通信基站流量预测精度。
3.随着移动通信技术的发展,4g、5g给人们带来了极大的便利,基站作为移动通讯、网络服务的载体,保证着人们的日常生活需求,用户对于通讯网络业务的需求逐渐增大。移动流量呈现爆炸式增长,从而基站的流量负荷问题变得越来越重要。频繁的数据传输在高密集度的活动区域中会对基站运营造成巨大的压力,同时在稀疏的远郊又会导致资源的浪费。因此,根据历史基站数据准确预测短期的流量变化对于基站运营方面合理调控基站开放有着重要作用。而且,城市移动通信基站流量的准确预测对于关键基站的拥堵控制、基站新址的选择有着重要作用。基站的流量数据不仅是区域的静态表现,同时也反映区域人员的流动特性。
4.基站流量具有非线性混沌特性,而传统的线性时间序列方法比如自回归移动平均模型难以有效地捕获实际基站流量序列中复杂的非线性因素。同时,仅考虑单个基站时间序列而忽略近邻基站的影响并不能反映基站流量的动态特征。


技术实现要素:

5.本发明是为了解决传统的线性时间序列方法难以有效地捕获实际基站流量序列中复杂的非线性因素的问题,从而导致对当前通信基站流量预测误差大的问题。
6.基于改进灰狼算法优化支持向量机回归机的通信基站流量预测方法,包括以下步骤:
7.获取通信基站流量数据,对基站流量数据进行归一化处理得到前n个时刻基站流量数据;将前n个时刻基站流量数据作为svr模型的输入,利用svr模型预测当前时刻的基站流量的输出结果,对输出结果进行反归一化处理,得到最终的通信基站流量的预测结果;
8.所述的svr模型的惩罚因子和核函数参数是利用改进灰狼算法确定的,具体过程包括以下步骤:
9.s1、设置维数dim,惩罚因子c和核函数参数γ的取值范围,设置改进灰狼优化算法参数;
10.s2、初始化灰狼种群;
11.s3、计算灰狼个体的适应度,更新迭代灰狼种群,并最终求出svr的惩罚因子和核
函数参数的最优值:
12.(3.1)将训练svr时输出的均方误差作为灰狼个体的适应度函数:
[0013][0014]
式中,y
p
为流量预测值,yr为流量真实值,s
t
是训练集样本数量;
[0015]
(3.2)计算种群中灰狼个体的适应度值并从小到大排序,将适应度值最小的灰狼个体的位置作为历史最优解x
α
,适应度值第二小的灰狼个体的位置作为第二最优解x
β
,适应度值第三小的灰狼个体的位置作为第三最优解x
δ

[0016]
(3.3)在灰狼优化算法中,α狼的位置代表最优解;在搜寻猎物的过程中,所有的灰狼个体均向最优解α狼靠近,利用莱维飞行对α狼进行位置更新的策略;通过引入levy飞行,新一代α狼位置的计算公式下所示:
[0017][0018]
式中,表示第t代时α狼个体的位置;为点对点乘法;b表示狼个体位置的随机数;levy(δ)代表随机搜索路径;
[0019]
(3.4)在狼群搜寻猎物的过程中,利用非线性变化策略对控制参数a进行改进,非线性控制参数记为a
*

[0020][0021]
式中:ai和af分别为控制参数的初始值和终值;t为当前的迭代次数;t
max
为最大迭代数目,由此更新收敛因子;
[0022]
(3.5)对除步骤(3.2)中确定的α狼、β狼、δ狼之外的灰狼个体按公式计算灰狼移动方向,计算公式如下:
[0023][0024][0025][0026]
其中,表示第i只灰狼在第d维的位置,其中为收敛因子,为摆动因子;
[0027]
(3.6)在灰狼位置更新引入灰狼个体的位置信息,灰狼位置更新公式:
[0028][0029][0030]
其中,g1、g2、g3由公式g=2
·
rand6得出;ω是[0,1]间的随机变量;rand3、rand4、rand5、rand6都是[0,1]间的随机变量,代表当前灰狼的位置;
[0031]
(3.7)判断算法的当前迭代次数是否达到最大迭代次数t
max
,若满足,则输出α狼的适应度值,否则返(3.2)处重新计算适应度值,更新x
α
、x
β
、x
δ

[0032]
进一步地,s1所述设置维数dim,惩罚因子c和核函数参数γ的取值范围,设置改进
灰狼优化算法参数的具体过程包括以下步骤:
[0033]
(1.1)设置维数dim=2,惩罚因子c和核函数参数γ的取值范围均为[1
×
10-7
,1
×
106]
[0034]
(1.2)设置种群规模n=50、最大迭代次数t
max
=100、非线性调节参数k、个体学习因子g1、g2、g3,非线性控制参数a
*
的初始值ai、终值af,莱维飞行参数delta。
[0035]
进一步地,s2所述初始化灰狼种群的过程是基于混沌反向学习策略实现的,具体包括以下步骤:
[0036]
(2.1)利用cat混沌映射产生n个介于[0,1]初始解;
[0037]
(2.2)利用反向学习理论为每个初始解均产生与之对应的反向解,公式如下:
[0038][0039]
其中,k为[0,1]间的随机变量;opi为每个初始解xi所对应的反向解;分别表示所有初始解中第d维向量的最小值和最大值;
[0040]
(2.3)对初始解和反向解进行合并;
[0041]
(2.4)按照适应度值从小到大进行排序,选取适应度值小的前n个解作为初始解,从而形成优良种群。
[0042]
进一步地,所述狼个体位置的随机数b=random(size(α_posion));
[0043]
其中,random表示取随机数,size表示α狼位置矩阵的维度,α_posion表示α狼的位置。
[0044]
进一步地,所述的
[0045]
其中,1《δ《3,表示历史最优α狼的位置;u、υ是服从正态分布的随机数:
[0046][0047][0048]
σu和σv分别如下:
[0049][0050]
σ
υ
=1
[0051]
其中,γ(
·
)是gamma函数;β是一个常数。
[0052]
优选地,所述β=1.5。所述δ=1.5。
[0053]
进一步地,所述收敛因子
[0054]
其中,rand1分别表示[0,1]间的随机数。
[0055]
进一步地,所述摆动因子
[0056]
其中,rand2分别表示[0,1]间的随机数。
[0057]
本发明与现有技术相比具有如下优点:
[0058]
本发明将改进的灰狼算法引入到svr的优化当中并解决了具体问题,第一利用cat混沌映射和反向学习相结合的初始化方法取代标准灰狼算法利用随机数初始化种群的方法,为算法的全局搜索过程中的种群多样性奠定了基础;第二利用粒子群算法的个体位置更新思想改进灰狼位置更新公式,降低算法陷入局部最优的风险;第三利用非线性控制参数代替标准灰狼算法的线性控制参数,使得收敛因子在前期缓慢下降,而在后期迅速下降,从而在算法前期提高了全局搜索能力,在算法后期提高了局部开发能力;第四在α狼位置更新时,利用莱维飞行理论对α狼进行全局搜索,防止狼群丧失多样性,降低算法后期过早收敛的风险;第五利用ligwo优化svr的惩罚因子和核函数参数。
[0059]
本发明可以很好地捕获实际基站流量序列中复杂的非线性因素,从而提高实际基站流量的预测准确率,因此可以实现更加有效地利用基站资源。
[0060]
ligwo_svr模型在相等条件下相比标准灰狼算法优化支持向量机回归机预测模型(gwo_svr)、模拟退火算法优化bp神经网络预测模型(sa_bp)、粒子群算法优化bp神经网络预测模型(pso_bp),与实际通信基站流量数据拟合程度更好本模型可以有效平衡全局搜索能力和局部开发能力,降低了寻优参数陷入局部最优解的风险。
附图说明
[0061]
图1为本发明的工作流程图;
[0062]
图2为改进灰狼部分算法的流程图;
[0063]
图3为通信基站a流量预测图;
[0064]
图4为通信基站b流量预测图;
[0065]
图5为4种模型对通信基站a流量数据预测的相对百分误差;
[0066]
图6为4种模型对通信基站b流量数据预测的相对百分误差。
具体实施方式
[0067]
具体实施方式一:
[0068]
本实施方式为基于改进灰狼算法优化支持向量机回归机的通信基站流量预测方法。
[0069]
本发明首先收集通信基站的流量数据并对其划分、处理,其次设置svr相关参数并设置改进灰狼优化算法参数,再用改进后的灰狼算法求出svr的惩罚因子和核函数参数的最优值,最后用优化后的svr对测试集数据进行预测,并对输出结果进行反归一化处理,得到通信基站流量的预测结果。本发明是将标准灰狼算法进行改进用于svr的参数优化,所得模型相较于标准灰狼算法优化支持向量机回归机预测模型、模拟退火算法优化bp神经网络预测模型等模型在基站流量预测时具有更高的预测精度。
[0070]
本发明针对当前通信基站流量预测误差大的问题,设计了改进灰狼算法(ligwo)优化支持向量机回归机(svr)通信基站流量预测模型,简称为ligwo_svr。第一利用cat混沌映射和反向学习相结合的初始化方法取代标准灰狼算法利用随机数初始化种群的方法,为算法的全局搜索过程中的种群多样性奠定了基础;第二利用粒子群算法的个体位置更新思想改进灰狼位置更新公式,降低算法陷入局部最优的风险;第三利用非线性控制参数代替标准灰狼算法的线性控制参数,使得收敛因子在前期缓慢下降,而在后期迅速下降,从而在
算法前期提高了全局搜索能力,在算法后期提高了局部开发能力;第四在α狼位置更新时,利用莱维飞行理论对α狼进行全局搜索,防止狼群丧失多样性,降低算法后期过早收敛的风险;第五利用ligwo优化svr的惩罚因子和核函数参数。利用哈尔滨市两座通信基站的流量数据进行仿真实验,结果证明,相较于标准灰狼算法优化支持向量机回归机预测模型(gwo_svr)、模拟退火算法优化bp神经网络预测模型(sa_bp)、粒子群算法优化bp神经网络预测模型(pso_bp),ligwo_svr流量预测模型在基站流量预测时具有更高的预测精度。
[0071]
结合图1、图2说明本实施方式,本实施方式所述的基于改进灰狼算法优化支持向量机回归机的通信基站流量预测方法,包括以下步骤:
[0072]
步骤一、收集通信基站流量历史数据,并将其划分为训练集和测试集,对基站流量数据进行归一化处理。
[0073]
步骤二、利用训练集训练利用ligwo算法优化后的svr模型:
[0074]
s1:设置维数dim,惩罚因子c和核函数参数γ的取值范围,设置改进灰狼优化算法参数。
[0075]
s2:初始化灰狼种群。
[0076]
s3:计算灰狼个体的适应度,更新迭代灰狼种群,并最终求出svr的惩罚因子和核函数参数的最优值。
[0077]
s4:针对确定惩罚因子和核函数参数的最优值的svr模型,利用训练集训练预测模型。
[0078]
步骤三、利用ligwo算法优化后的svr对测试集数据进行预测,并对输出结果进行反归一化处理,得到通信基站流量的预测结果。
[0079]
其中,
[0080]
步骤一所述收集通信基站流量历史数据,并将其划分为训练集和测试集,对基站流量数据进行归一化处理的具体过程包括以下步骤:
[0081]
(1)收集2020年11月3日至17日的通信基站每小时流量为流量数据,为了排除数据集划分对模型预测精度的影响,保证实施例中各模型在同一条件下进行仿真实验,本发明将11月3日到11月16日每日24小时的流量数据作为训练集,将11月17日24小时的流量数据作为测试集;
[0082]
(2)利用公式对基站流量数据x进行归一化处理,得到归一化数据矩阵x
*
,计算公式如下:
[0083][0084]
其中,max(x)、min(x)为基站流量数据中的最大值和最小值。
[0085]
s1所述设置维数dim,惩罚因子c和核函数参数γ的取值范围,设置改进灰狼优化算法参数的具体过程包括以下步骤:
[0086]
(1.1)设置维数dim=2,惩罚因子c和核函数参数γ的取值范围均为[1
×
10-7
,1
×
106]
[0087]
(1.2)设置种群规模n=50、最大迭代次数t
max
=100、非线性调节参数k、个体学习因子g1、g2、g3,非线性控制参数a
*
的初始值ai、终值af,莱维飞行参数delta。
[0088]
s2所述初始化灰狼种群的过程是基于混沌反向学习策略实现的,具体包括以下步
骤:
[0089]
(2.1)利用cat混沌映射产生n个介于[0,1]初始解;
[0090]
不同于多数学者采用logistic映射序列,本发明采用cat混沌映射方法和反向学习策略结合在一起初始化种群的策略,cat映射是一个二维的可逆混沌映射,其动力学方程如下所示:
[0091][0092]
其中,mod表示求余,xn中n代表维度1

.n,x为0-1之间的随机数,y是混沌映射的输出也是随机数,这样可以使y更加均匀。
[0093]
(2.2)利用反向学习理论为每个初始解均产生与之对应的反向解,计算公式如下所示:
[0094][0095]
其中,k为[0,1]间的随机变量;opi为每个初始解xi所对应的反向解;分别表示所有初始解中第d维向量的最小值和最大值;
[0096]
(2.3)对初始解和反向解进行合并;
[0097]
(2.4)按照适应度值从小到大进行排序,选取适应度值小的前n个解作为初始解,从而形成优良种群。
[0098]
s3所述计算灰狼个体的适应度,更新迭代灰狼种群最终求出svr的惩罚因子和核函数参数的最优值的具体过程包括以下步骤:
[0099]
(3.1)将训练svr时输出的均方误差作为灰狼个体的适应度函数:
[0100][0101]
式中,y
p
为流量预测值,yr为流量真实值,s
t
是训练集样本数量。
[0102]
(3.2)计算种群中灰狼个体的适应度值并从小到大排序,将适应度值最小的灰狼个体的位置作为历史最优解x
α
,适应度值第二小的灰狼个体的位置作为第二最优解x
β
,适应度值第三小的灰狼个体的位置作为第三最优解x
δ

[0103]
(3.3)在灰狼优化算法中,α狼的位置代表最优解。在搜寻猎物的过程中,所有的灰狼个体均向最优解α狼靠近,这会导致种群丧失多样性,出现早熟收敛现象。针对这一缺点,本发明利用莱维飞行对α狼进行位置更新的策略。通过引入levy飞行,新一代α狼位置的计算公式下所示:
[0104][0105]
式中,表示第t代时α狼个体的位置;为点对点乘法;
[0106]
b表示狼个体位置的随机数,由下式计算:
[0107]
b=random(size(α_posion))
[0108]
其中,random表示取随机数,size表示α狼位置矩阵的维度,α_posion表示α狼的位置;
[0109]
levy(δ)代表随机搜索路径,由下式计算:
[0110][0111]
公式中,δ的取值区间一般为1《δ《3,在本发明中,δ=1.5。表示历史最优α狼的位置;u、υ是服从正态分布的随机数:
[0112][0113][0114]
σu和σv分别如下:
[0115][0116]
σ
υ
=1
[0117]
其中,γ(
·
)是gamma函数;β是一个常数,本实施方式中β=1.5;
[0118]
由此更新α狼的位置;
[0119]
(3.4)灰狼算法主要通α狼、β狼、δ狼对猎物定位以及其余灰狼个体根据α狼、β狼、δ狼的位置朝猎物移动两个部分构成。标准灰狼算法可知,在狼群搜寻猎物的过程中,值随控制参数a的变化而不断变化,随迭代次数的增加从ai=2线性减小到af=0线性,因此算法的全局和局部搜索能力取决于a。a的线性变化不能体现算法复杂的寻优过程,无法协调算法的全局和局部搜索能力。因此,本发明借鉴非线性变化策略对控制参数a进行改进,为与线性控制参数a相区别,非线性控制参数记为a
*

[0120][0121]
式中:ai和af分别为控制参数的初始值和终值;t为当前的迭代次数;t
max
为最大迭代数目,由此更新收敛因子;
[0122]
(3.5)对除步骤(3.2)中确定的α狼、β狼、δ狼之外的灰狼个体按公式计算灰狼移动方向,计算公式如下:
[0123][0124][0125][0126]
其中,表示第i只灰狼在第d维的位置,其中为收敛因子,为摆动因子;
[0127][0128][0129]
其中rand1、rand2分别表示[0,1]间的随机数;
[0130]
由此得到其余狼移动方向;
[0131]
(3.6)本发明在灰狼位置更新引入灰狼个体的位置信息,将公式的灰狼位置更新公式进行调整得到公式
[0132][0133]
其中,灰狼个体位置更新公式如下:
[0134][0135]
g=2
·
rand6[0136]
其中,ω是[0,1]间的随机变量,ω取值在[0.6,1]间时,算法有更好的搜索性能;当ω较大时,算法有较好的全局搜索能力,ω较小时,算法局部搜索能力较强;rand3、rand4、rand5、rand6都是[0,1]间的随机变量,g1、g2、g3由公式g=2
·
rand6得出;可由上述步骤(3.5)中的三个公式分别得出;代表当前灰狼的位置,由此更新灰狼的位置。
[0137]
(3.7)判断算法的当前迭代次数是否达到最大迭代次数t
max
,若满足,则输出α狼的适应度值,否则返(3.2)处重新计算适应度值,更新x
α
、x
β
、x
δ

[0138]
s4所述针对确定惩罚因子和核函数参数的最优值的svr模型,利用训练集训练预测模型的过程中,将前n个时刻流量数据作为输入,将当前时刻的流量预测作为输出,svr模型的处理过程包括以下步骤:
[0139]
svr将回归问题转换为二次规划问题,适合处理样本容量较小的预测问题。svr利用非线性映射函数φ(xi)将输入样本xi(前n个时刻流量数据)映射到高维空间d中,并在d中建立如公式如下的特征函数:
[0140]
f(x)=hφ(xi)+b
[0141]
其中,h为权值向量,且有h∈d;b为偏差值,且有b∈r。
[0142]
针对回归拟合问题,引入不敏感损失函数ε和正、负松弛度λ、λ
*
,约束条件如下所示:
[0143][0144]
其中,c为惩罚因子(c》0);s为单个通信基站流量样本个数。
[0145]
为求解上述公式,引入拉格朗日函数,对其中各变量求偏导数,并通过对偶原理将需要解的问题转化如下公式:
[0146][0147]
其中,k(xixj)=φ(xi)φ(xj)为核函数;βi、β
i*
为拉格朗日乘数。此时,可得到回归函数如下:
[0148]
步骤三所述利用ligwo算法优化后的svr对测试集数据进行预测,并对输出结果进行反归一化处理,得到通信基站流量的预测结果的具体过程包括以下步骤:
[0149]
将前n个时刻流量数据作为输入,利用ligwo算法优化后的svr对测试集数据进行预测,并对输出结果进行反归一化处理,得到通信基站流量的预测结果。
[0150]
本实施方式中是利用将测试集测试tgwo-svr模型的性能,在实际使用时,可以直接利用ligwo算法优化后的svr进行预测,获得通信基站流量预测。
[0151]
实施例
[0152]
基于本发明进行仿真,同时对现有的模型进行对比,应用本发明的实验结果以及其余三种模型结果如下:
[0153]
为了验证本发明提出的的ligwo_svr预测模型的预测精度高,将该模型预测结果与gwo_svr模型预测结果、sa_bp模型预测结果、pso_bp模型结果和实际通信基站流量数据进行对比。其余模型参数设置如下:sa_bp模型的马尔可夫链长度为l=10,初始温度t
ini
=8,最终温度t
fin
=3,衰减参数dec=0.85,metropolis步长因子m=0.2。pso_bp模型种群数量n=50,最大迭代次数t
max
=100,个体学习因子c1=1.49,社会学习因子c2=1.49,惯性因子ω=0.2。sa_bp模型和pso_bp模型的bp神经网络隐藏层节点个数hid=5。通信基站a和b的预测结果如图3,图4所示。
[0154]
从图3,图4可以看出,ligwo_svr模型相比其它3种预测模型,与实际通信基站流量数据拟合程度更好。通过gwo_svr模型与ligwo_svr模型的对比,证明了ligwo可以有效平衡全局搜索能力和局部开发能力,降低了寻优参数陷入局部最优解的风险。11月17日真实流量数据和预测数据如表1和表2所示。表1为4种模型对通信基站a流量预测结果对比表;表2为4种模型对通信基站b流量预测结果对比表;
[0155]
表1
[0156]
4种模型对通信基站a流量预测结果对比
[0157][0158]
表2
[0159]
4种模型对通信基站b流量预测结果对比
[0160][0161]
相对百分误差可以有效体现出预测方法的精确性,相对百分误差σ计算公式如下:
[0162]
[0163]
式中为流量数据预测值,yi为流量数据真实值,相对百分误差对比结果如图5和图6所示。
[0164]
为了进一步体现预测模型的精确性和稳定性,本发明分别计算四个模型预测数据的均方误差(mse)、平均相对误差(mape)和平均绝对误差(mae),三个评价指标的计算公式如下:
[0165][0166][0167][0168]
计算结果如表3和表4所示,表3为4种预测模型的预测误差(通信基站a);表4为4种预测模型的预测误差(通信基站b)。
[0169]
表3
[0170]
4种预测模型的预测误差(通信基站a)
[0171][0172]
表4
[0173]
4种预测模型的预测误差(通信基站b)
[0174][0175]
本发明还可有其它多种实施例,在不背离本发明精神及其实质的情况下,本领域技术人员当可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1