一种基于PSO-DELM算法的比赛场馆内手机上网流量预测方法与流程

文档序号:21317648发布日期:2020-06-30 20:47阅读:939来源:国知局
一种基于PSO-DELM算法的比赛场馆内手机上网流量预测方法与流程

本发明涉及一种比赛场馆内手机上网流量的预测方法,涉及的是使用一种粒子群算法对深度极限学习机进行优化的网络流量预测方法。



背景技术:

随着互联网时代的快速发展和手机应用软件的多样化,以及4g网络正在向着5g网络时代的加速迈进,使全球的移动通信设备规模在近几年呈指数增长。移动通信设备在方便人们生活的同时也在移动网络中产生了海量的网络流量数据,这就使学者在针对网络流量的预测变得很有研究意义和研究价值。在赛事现场,为了防止观众使用手机上网产生的网络流量增多而导致网络的拥堵情况发生,影响观众的手机使用体验,所以当网络流量数值达到限定值后就要对场馆周围的基站进行扩容或者新建小型的移动基站。提前预测出流量的变化趋势,就可以提前做出部署,减少突发事件带来的危险。

手机产生的上网流量属于网络流量中的一种,网络流量具有非线性、自相似性、长相关性和多分型等特性,现有的网络流量预测模型很难准确的预测出流量的数值。传统方法的模型简单、预测速度快,但是预测的精度低。目前,比较常见的是使用现代的智能化方法进行预测,如神经网络、深度学习、机器学习理论等等。本文构建的预测模型是以深度极限学习机为基础,采用粒子群算法优化深度极限学习机中多个隐含层的神经元节点数。粒子群优化算法是一种性能良好的全局随机搜索优化算法,本文采用它去优化深度极限学习机多个隐含层的神经元个数,减少模型的预测误差,提升模型的预测精度。



技术实现要素:

本发明的目的是提供一种能够在短时间内实现对区域场所的手机上网流量的精准预测的方法。该发明为了解决现有的预测模型存在预测精度不高的问题,选用在2004年由南洋理工大学的黄广斌教授提出的极限学习机(elm)作为基础,极限学习机是一种单隐含层的前馈神经网络,它的提出是为了对反向传播算法(bp)进行改进以提升学习效率低并简化学习参数的设定,具有训练速度快、拟合精度高和泛化性能好的优点。但是当面对比较庞大的数据时,单隐含层elm对输入数据典型特征的学习能力有限,仅含有一层隐含层的单层极限学习机网络可能会导致部分的神经元成为无效神经元。为了使模型能够应对复杂的输入与输出关系,本发明采用了更加强大和复杂的深度极限学习机(deepelm)来处理数据的映射关系,但由于delm中的多个隐含层的节点数无法准确的设置,所以本发明采用粒子群优化算法对个隐含层的节点数进行选取,使得预测模型的准确率得到提升。

本发明实现发明目的采用如下技术方案:一种基于pso-delm算法对比赛场馆手机上网流量预测方法,具体包括如下步骤:

步骤1:把得到的数据(商场、小区、万达广场、汽车站的手机上网流量数据)进行整合,选取这几个地点的数据主要是为了增加样本的多样性,样本的时间粒度为每15分钟为一个节点,共11712个一维时间序列数据。

步骤2:分析可知,根据网络流量自身的自相似性、长相关性、多分性和非线性等特点,采用基于时间序列的方式对数据进行预处理,选取合适的输入变量维度和输出变量维度。

步骤3:根据网络流量的特性进行分解,分解方式是;用前1、2、3、4、5组数据作为输入和第6组数据作为输出,接下来是用第2、3、4、5、6组作为输入预测和第7组数据作为输出,以此类推。设n为第n组数据也是第n个数据(n≤11707,n∈n*),则5个输入变量分别为n、(n+1)、(n+2)、(n+3)、(n+4)和1个输出变量为(n+5),可以得到每组数据有5个输入变量和一个输出变量,一共11707组数据的新样本。

步骤4:对数据进行步骤3的方式处理,确定新的输入样本数据和输出样本数据。

步骤5:经过步骤4处理过的数据样本共11707组数据,其中选择前80%组数据作为训练数据,后20%组数据作为测试数据。

步骤6:建立深度极限学习机模型,在自下而上的逐层无监督训练过程中,引入自动编码器(ae)算法和正则化系数,逐层的优化输入层与隐含层之间的权重矩阵,以提高模型的预测精度和泛化能力。而采用粒子群优化算法对各个隐含层的神经元个数进行优化,把隐含层神经元个数作为粒子,设定粒子群优化算法的搜索维度d、种群规模n、学习因子c1和c2、惯性因子w、正则化系数lambda,随机初始化粒子群优化算法的粒子位置hj(1)及粒子速度初始值vj(1),迭代次数ger。

6.1计算粒子适应,采用网络流量预测值与实际值得均方误差(mse)作为适应度函数,公式如下所示:

其中,dj为期望输出、yj为实际输出、m为样本个数。

6.2求出每个粒子的个体最优,将粒子当前迭代下的最优位置设置为局部最优。

6.3求出整个群体的全局最优,比较种群中每个粒子的均方根误差,得到全局最优。

6.4更新粒子速度,其公式为:

其中vk分别对应第i个粒子在第k次迭代中的速度、位置、最优位置;代表在第k次迭代过程时粒子群的全局最优位置,rand()属于[0,1],随机均匀分布。

若v>vmax,则v=vmax;若v<-vmax,则v=-vmax,否则不变。

6.5对于非最优粒子给与随机变异,更新粒子位置,计算公式为:

xk+1=xk+vk+1

6.6判断是否适应度值达到目标值,若是则进入步骤6.7,否者返回步骤6.1。

6.7输出最优粒子,将达到要求的粒子对应到深度极限学习机的3个隐含层的神经元节点数。

6.8输入训练数据,训练pso-delm网络。

6.9输入测试数据;

6.10输出预测结果,并与真实值作比较。

本发明的有益效果是:本发明在使用神经网络进行预测,利用流量因素自身的特点实现预测,选用的深度极限学习机理论在开始对流量数据进行以时间序列的方式预处理,更好的分析了流量本身的特性。选取ga-bp算法作为预测方法,一方面是对于历史数据的训练能够更加的深入挖掘数据之间的关系,增强方法的鲁棒性。另外一方面是因为此方法的运算时间较快,反映迅速。并且本发明在以实际数据为基础,构建的模型能够解决预测速度慢、预测精确度不高的问题。

附图说明

图1为本发明中pso-delm方法的整体流程图。

图2为本发明所使用的部分原始网络流量数据图。

图3为本发明所使用的原始数据经过数据预处理的新样本部分数据图。

图4为使用pso-delm方法的预测与其它预测模型对比曲线图。

具体实施方式

以下通过具体实施例和附图对本发明的原理和特征做进一步解释说明。所举实例只用于解释本发明,并非用于限定本发明的范围。

如图1所示,本发明实施所述的一种粒子群算法优化深度极限学习机算法对比赛场馆的手机上网流量预测方法,整体的流程包括以下步骤:

步骤1:先对数据中的影响流量的因素进行分析,得出流量自身的特征性,部分原始的流量数据如图2所示。

步骤2:针对流量数据的特殊性质做出预处理并找到最合适的时序序列,经过误差测试发现输入与输出维度为5和1,处理后的新样本部分数据如图3所示。并且隐含层的层数为3时的优化效果最好,具体误差分析如下表1所示。选取这五个场所的手机上网流量数据进行训练模型,预测样本中部分的上网流量使用情况,共11712组数据。原始数据如图2所示,经过数据预处理的数据如图3所示。新的样本如下所示:

x2=[n6n7n8…n11707]

步骤3:把经过预处理好的新的样本数据进行归一化。

归一化的公式是:

式中:lmax、lmin分别为样本中的最大值和最小值;l为样本的归一化的值;i为时间点的值,其范围为[1,11707]。

表1误差测试数据表

步骤4:首先,确定极限学习机的网络结构。

4.1假设输入数据样本集合x={xi/1≤i≤n}和输出样本t={ti/1≤i≤n}。假设h={hi/1≤i≤n}为隐含层特征向量集合,hi为第i个样本对应的特殊向量。将输入数据从输入空间映射到隐含层特征空间,则x与h的关系为:

h=sf(wx+b)

式中:w为输入层节点到隐含层神经元的权重矩阵,b为隐含层神经元的阈值矩阵,其中权重和阈值可随机生成,且对结果不会产生恶化影响。sf为激活函数,经过模型的仿真测试和以往的经验可知,一般激活函数选择sigmoid函数,其具有良好的特征辨识度。

隐含层的输出为:

y=hβ

式中β为隐含层节点到输出层节点的权重矩阵。

elm算法的核心是求解输出权重矩阵使得误差函数最小:

min||hβ-t||

权重矩阵β可由下式近似求得:

β=h+t

式中:h+为矩阵h的moore-penrose广义逆矩阵。

4.2接下来确定深度极限学习机的网络结构。在深度极限学习机中引入了elm自动编码器(elm-ae)算法得到网络的参数,通过编码器将输入向量映射为隐含层中的特征向量,然后通过编码器将特征向量重构为原来的输入向量。在elm-ae中,首先利用elm算法产生正交随机权重和阈值,即:

将输入数据样本集合x映射到隐含层的特征空间,然后通过求解重构矩阵β将特征向量重构为原来的输入向量,即:

x=hβ

最后将重构矩阵β的转秩矩阵作为原网络结构输入层与隐含层的权重矩阵。

为了避免隐含层的节点数过多,出现过拟合的问题,增加深度极限学习机模型的泛化能力,引入了正则化系数,目标函数变为:

式中:λ为正则化系数,ε=βh-t为训练误差,通过构造拉格朗日方程,可求得输出权重矩阵:

4.3把粒子群算法优化隐含层神经元节点个数范围设置为[10,3000],对粒子群优化算法中的参数设置为:搜索维度d=3、种群规模n=40、学习因子c1=0.5和c1=1、惯性因子w=0.9,随机初始化粒子群优化算法的粒子位置hj(1)及粒子速度初始值vj(1),迭代次数ger=20。

步骤5:把这种类型的数据代入pso-delm的算法模型中。

步骤5:预测数据反归一化。

步骤6:得出pso-delm模型的预测值与真实值对比如图4所示。

步骤7:为了验证pso-delm模型的准确性,选取基于ga-bp模型、pso-elm模型和rbf模型对用户的手机上网流量进行预测,并且与pso-delm模型的预测结果比较,得到预测流量变化曲线与真实值曲线的对比图,如图4所示。并且选用平均绝对误差(mae)、均方根误差(rmse)、拟合度(r2)、时间(t)作为对比指标,仿真实验结果如下表2所示。

表2仿真实验结果

验证结论:

本发明根据比赛场馆所具有人口流动性小、活动范围确定的特点选取了与其相似的几个场所的手机上网数据进行测试分析,提出了一种基于pso-delm算法对手机上网流量预测模型。模型的优势在于:

(1)在针对比赛场馆内手机上网流量的预测,pso-delm模型相对其它对比模型能更好的处理具有明显非线性特征的网络流量数据,并取得了较好的预测效果。

(2)在数据预处理上,针对一维的流量数据(时间序列)进行重新构造,建立了多维的输入和一维的输出数据,而且模型的多隐含层结构能更好的挖掘出数据之间的非线性关系。

(3)这种基于比赛的场馆内的手机上网流量预测的,是消除了人员的流动性、外来因素干扰性等因素,所以在对流量这单一变量预测时会比较准确。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1