网络流量预测方法、设备、存储介质及装置与流程

文档序号:27766664发布日期:2021-12-04 01:10阅读:179来源:国知局
网络流量预测方法、设备、存储介质及装置与流程

1.本发明涉及互联网技术领域,尤其涉及一种网络流量预测方法、设备、存储介质及装置。


背景技术:

2.目前,针对网络流量预测问题,往往通过预测模型进行流量预测。但是,现有的预测模型运算量大、预测精度低,从而导致网络流量预测速度慢、准确性低。
3.上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。


技术实现要素:

4.本发明的主要目的在于提供一种网络流量预测方法、设备、存储介质及装置,旨在解决现有技术中预测模型运算量大、预测精度低,从而导致网络流量预测速度慢、准确性低的技术问题。
5.为实现上述目的,本发明提供一种网络流量预测方法,所述网络流量预测方法包括以下步骤:
6.获取待预测网络对应的历史时序流量数据;
7.对所述历史时序流量数据进行标准化处理,获得目标流量数据;
8.根据所述目标流量数据通过预设双向门控循环单元模型进行流量预测,获得所述待预测网络的预测流量数据。
9.可选地,所述获取待预测网络对应的历史时序流量数据的步骤之前,还包括:
10.获取初始时序流量数据,并对所述初始时序流量数据进行标准化处理,获得流量数据样本;
11.根据所述流量数据样本对初始双向门控循环单元模型进行训练,获得预设双向门控循环单元模型。
12.可选地,所述获取初始时序流量数据,并对所述初始时序流量数据进行标准化处理,获得流量数据样本的步骤,包括:
13.获取初始时序流量数据,并确定所述初始时序流量数据的均值和标准差;
14.根据所述均值和所述标准差对所述初始流量数据进行标准化处理,获得符合标准正态分布的流量数据样本。
15.可选地,所述根据所述流量数据样本对初始双向门控循环单元模型进行训练,获得目标双向门控循环单元模型的步骤,包括:
16.根据所述流量数据样本对初始双向门控循环单元模型进行训练,获得候选双向门控循环单元模型;
17.获取所述初始双向门控循环单元模型的训练次数,并判断所述训练次数是否大于预设次数;
18.在所述训练次数大于预设次数时,将所述候选双向门控循环单元模型作为预设双向门控循环单元模型。
19.可选地,所述在所述训练次数大于预设次数时,将所述候选双向门控循环单元模型作为预设双向门控循环单元模型的步骤,包括:
20.在所述训练次数大于预设次数时,获取所述候选双向门控循环单元模型的训练输出数据;
21.根据所述训练输出数据和实际流量数据确定所述候选双向门控循环单元模型的预测误差;
22.在所述预测误差小于预设误差阈值时,将所述候选双向门控循环单元模型作为预设双向门控循环单元模型车。
23.可选地,所述根据所述训练输出数据和实际流量数据确定所述候选双向门控循环单元模型的预测误差的步骤之后,还包括:
24.在所述预测误差大于或等于预设误差阈值时,对所述候选双向门控循环单元模型进行参数调整,直至所述预测误差小于所述预设误差阈值;
25.将调整后的候选双向门控循环单元模型作为预设双向门控循环单元模型。
26.可选地,所述根据所述训练输出数据和实际流量数据确定所述候选双向门控循环单元模型的预测误差的步骤,包括:
27.获取所述流量数据样本的样本总数,并根据所述训练输出数据、实际流量数据以及所述样本总数确定均方根误差和平均相对误差;
28.根据所述均方根误差和所述平均相对误差确定所述候选双向门控循环单元模型的预测误差。
29.此外,为实现上述目的,本发明还提出一种网络流量预测设备,所述网络流量预测设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的网络流量预测程序,所述网络流量预测程序配置为实现如上文所述的网络流量预测方法。
30.此外,为实现上述目的,本发明还提出一种存储介质,所述存储介质上存储有网络流量预测程序,所述网络流量预测程序被处理器执行时实现如上文所述的网络流量预测方法。
31.此外,为实现上述目的,本发明还提出一种网络流量预测装置,所述网络流量预测装置包括:数据获取模块、数据处理模块和流量预测模块;
32.所述数据获取模块,用于获取待预测网络对应的历史时序流量数据;
33.所述数据处理模块,用于对所述历史时序流量数据进行标准化处理,获得目标流量数据;
34.所述流量预测模块,用于根据所述目标流量数据通过预设双向门控循环单元模型进行流量预测,获得所述待预测网络的预测流量数据。
35.在本发明中,公开了获取待预测网络对应的历史时序流量数据,对历史时序流量数据进行标准化处理,获得目标流量数据,根据目标流量数据通过预设双向门控循环单元模型进行流量预测,获得待预测网络的预测流量数据;由于本发明中通过双向门控循环单元模型进行流量预测,而双向门控循环单元模型运算量小,预测精度高,从而提高了网络流量预测的预测速度和准确性。
附图说明
36.图1是本发明实施例方案涉及的硬件运行环境的网络流量预测设备的结构示意图;
37.图2为本发明网络流量预测方法第一实施例的流程示意图;
38.图3为本发明网络流量预测方法第二实施例的流程示意图;
39.图4为本发明网络流量预测方法第三实施例的流程示意图;
40.图5为本发明网络流量预测装置第一实施例的结构框图。
41.本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
42.应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
43.参照图1,图1为本发明实施例方案涉及的硬件运行环境的网络流量预测设备结构示意图。
44.如图1所示,该网络流量预测设备可以包括:处理器1001,例如中央处理器(central processing unit,cpu),通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(display),可选用户接口1003还可以包括标准的有线接口、无线接口,对于用户接口1003的有线接口在本发明中可为usb接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真(wireless

fidelity,wi

fi)接口)。存储器1005可以是高速的随机存取存储器(random access memory,ram),也可以是稳定的存储器(non

volatile memory,nvm),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
45.本领域技术人员可以理解,图1中示出的结构并不构成对网络流量预测设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
46.如图1所示,认定为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及网络流量预测程序。
47.在图1所示的网络流量预测设备中,网络接口1004主要用于连接后台服务器,与所述后台服务器进行数据通信;用户接口1003主要用于连接用户设备;所述网络流量预测设备通过处理器1001调用存储器1005中存储的网络流量预测程序,并执行本发明实施例提供的网络流量预测方法。
48.基于上述硬件结构,提出本发明网络流量预测方法的实施例。
49.参照图2,图2为本发明网络流量预测方法第一实施例的流程示意图,提出本发明网络流量预测方法第一实施例。
50.步骤s10:获取待预测网络对应的历史时序流量数据。
51.应当理解的是,本实施例方法的执行主体可以是具有数据处理、网络通信以及程序运行功能的终端设备,例如电脑或服务器等,或者是其他能够实现相同或相似功能的电子设备,本实施例对此不加以限制。在本实施例和其他实施例中,以服务器为例进行说明。
52.需要说明的是,待预测网络可以是虚拟化宽带远程接入服务器(virtualized broadband remote access server,vbras)和5g用户面功能(user plane function,upf)
等虚拟网元,也可以是网络功能虚拟化(network functions virtualization,nfv)管理编排(management and orchestration,mano)系统,也可以是数据中心,也可以是无线小区网络,本实施例对此不加以限制。
53.可以理解的是,在实际应用中,在待预测网络为vbras和5g upf等虚拟网元时,可以根据预测流量数据指定智能化扩缩容策略;在待预测网络为nfv mano系统时,可以根据预测流量数据对虚拟资源进行分配调整,以提高虚拟资源的利用率;在待预测网络为数据中心时,可以根据预测流量数据预测数据中心的负载变化情况,指定虚拟机迁移的策略并触发服务器休眠和唤醒操作,实现数据中心节能;在待预测网络为无线小区网络时,可以根据预测流量数据预测无线小区的业务量,结合场景识别等技术,可以给出无线侧载波关断、符号关断等节能操作的策略建议,辅助实现基站节能。
54.应当理解的是,根据上述场景可知,网络流量预测对于网络设计与规划、流量控制、协议设计、确保服务质量、研究拥塞控制和带宽分配机制、分析与评价网络性能以及进一步实施流量工程等都有着非常重要的意义。
55.需要说明的是,历史时序流量数据可以是前一时间段的时序流量数据。其中,前一时间段可以由用户预先设置,时序流量数据可以是具备时间相关性的流量数据。
56.应当理解的是,获取待预测网络对应的历史时序流量数据可以是在预设数据库中查找待预测网络对应的历史时序流量数据,并获取历史时序流量数据。其中,预设数据库用于存储流量数据。
57.步骤s20:对所述历史时序流量数据进行标准化处理,获得目标流量数据。
58.应当理解的是,由于历史时序流量数据的数值相差较大,从而导致无法直接对历史时序流量数据进行比较。因此,需要对历史时序流量数据进行标准化处理。
59.可以理解的是,对历史时序流量数据进行标准化处理,获得目标流量数据可以是通过预设标准化模型对历史时序流量数据进行标准化处理,获得目标流量数据。其中,预设标准模型如下所示:
[0060][0061]
式中,为目标流量数据中的第i个值,μ
z
为历史时序流量数据的均值,σ
z
为历史时序流量数据的标准差,z
i
为历史时序流量数据中的第i个值。
[0062]
应当理解的是,经过标准化处理后的历史时序流量数据(即目标流量数据)符合标准正态分布,从而提高了目标流量数据的可靠性。
[0063]
步骤s30:根据所述目标流量数据通过预设双向门控循环单元模型进行流量预测,获得所述待预测网络的预测流量数据。
[0064]
可以理解的是,现有技术中,存在通过传统的线性模型进行网络流量预测的方式,但是,传统的线性模型不能满足现代网络流量存在的突变性和多依赖性等非线性要求,无法有效描述网络流量的非平稳特性。其中,传统的线性模型可以是自回归模型(auto regressive,ar)模型、滑动平均模型(moving average model,ma)、自回归滑动平均(auto

regressive moving average,arma)模型、自回归合成滑动平均(autoregressive integrated moving average,arima)模型等。
[0065]
还存在通过非线性模型进行网络流量预测的方式,非线性模型虽然通过对历史数
据进行拟合训练和规律性学习,较好的考虑了网络流量的随机性和周期性,但是缺少对时序数据时间相关性的考虑,预测精度有限。其中,非线性模型可以是人工神经网络、最小二乘支持向量机(least squares support veotor maohine,lssvm)、梯度提升回归树模型(gradient boosting regression tree,gbrt)以及极限学习机(extreme learning machine,elm)等。
[0066]
还存在通过神经网络进行网络流量预测的方式。例如,循环神经网络(recurrent neural network,rnn)是一种引入循环反馈的深层神经网络,它包含自循环的神经元,可以将历史信息在神经元中进行传递,考虑到了时序相关性,但是随着时间间隔的不断增大,rnn会丧失学习过去较久远信息的能力,即梯度消失。长短期记忆(long short

term memory,lstm)循环神经网络是rnn的一种特殊模型,弥补了rnn梯度消失、梯度爆炸、长期记忆能力不足等问题,能够学习时序数据之间的长期依赖关系,有效地解决了常规rnn训练过程中的梯度消失和梯度爆炸问题,但是基于循环神经网络(包括lstm)的模型普遍都有难以训练难度大和计算量大的缺点。
[0067]
需要说明的是,双向门控循环单元模型(bidirectional gate recurrent unit,bigru)是由单向的、方向相反的两个门控循环单元(gate recurrent unit,gru)共同组成。在每一时刻,输入会同时提供两个方向相反的gru,而模型训练的输出结果则由这两个单向gru共同决定,从而有效地解决网络流量的时序预测问题。另外,由于gru是循环神经网络(recurrent neural network,rnn)的一种,具备计算速度快、参数少的特点。因此,bigru也具备运算速度快、输入参数少的特点。
[0068]
应当理解的是,本实施例通过引入双向门控循环单元(bidirectional gate recurrent unit,bigru)模型,缩小了输入参数,提高了模型运算速度,同时双向gru输出中隐含了较大时间跨度下的时序特征,使得进行后续计算时可以观察到更早的时序数据,以及分辨率更高的时序数据,从而提高了时序预测网络流量的准确性。
[0069]
在具体实现中,例如,网络流量序列在不同时间段呈现不同的变化规律,存在时段差异性,即多模态特性。本实施例中对训练数据集进行处理,训练数据取过去31天的流量数据,时间粒度为每5分钟,本实施例在这个数据集上将本模型与现有时间序列分析预测模型进行比较,最终证明本模型在解决实际问题时有较好表现。
[0070]
在本实施例输入数据中以每5分钟为一个时间步,每12个时间步(即每小时)采集一次数据,采用31天的历史数据,以5分钟一个时间步长划分8928个时间步,来预测288个时间步(24小时)之后的时间序列数据。
[0071]
为了说明bigru模型的实际效果,参考表1进行说明。表1为各模型对比结果表。
[0072]
表1各模型对比结果表
[0073][0074]
通过各模型对比结果表可知,双向门控循环单元(bidirectional gate recurrent unit,bigru)模型的网络流量预测的平均绝对误差(mae)和均方根误差(rmse)以及算法运行时间相比于其他几个模型效果更好,因此,本实施例提出的模型在预测的准确性和运行速度上都得到了明显的优化。
[0075]
在第一实施例中,公开了获取待预测网络对应的历史时序流量数据,对历史时序流量数据进行标准化处理,获得目标流量数据,根据目标流量数据通过预设双向门控循环单元模型进行流量预测,获得待预测网络的预测流量数据;由于本实施例中通过双向门控循环单元模型进行流量预测,而双向门控循环单元模型运算量小,预测精度高,从而提高了网络流量预测的预测速度和准确性。
[0076]
参照图3,图3为本发明网络流量预测方法第二实施例的流程示意图,基于上述图2所示的第一实施例,提出本发明网络流量预测方法的第二实施例。
[0077]
在第二实施例中,所述步骤s10之前,还包括:
[0078]
步骤s01:获取初始时序流量数据,并对所述初始时序流量数据进行标准化处理,获得流量数据样本。
[0079]
需要说明的是,初始时序流量数据可以是用于训练bigru模型的时序流量数据。
[0080]
应当理解的是,由于初始时序流量数据的数值相差较大,从而导致无法直接对初始时序流量数据进行比较。因此,需要对初始时序流量数据进行标准化处理。
[0081]
步骤s02:根据所述流量数据样本对初始双向门控循环单元模型进行训练,获得预设双向门控循环单元模型。
[0082]
可以理解的是,根据流量数据样本对初始双向门控循环单元模型进行训练,获得预设双向门控循环单元模型可以是将流量数据样本输入初始双向门控循环单元模型进行训练,获得预设双向门控循环单元模型。
[0083]
第二实施例通过获取初始时序流量数据,并对初始时序流量数据进行标准化处理,获得流量数据样本,根据流量数据样本对初始双向门控循环单元模型进行训练,获得预设双向门控循环单元模型,从而能够预先对双向门控循环单元模型进行训练,以提高双向门控循环单元模型的准确性和可靠性。
[0084]
参照图4,图4为本发明网络流量预测方法第三实施例的流程示意图,基于上述图2所示的第一实施例,提出本发明网络流量预测方法的第三实施例。
[0085]
在第三实施例中,所述步骤s01,包括:
[0086]
步骤s011:获取初始时序流量数据,并确定所述初始时序流量数据的均值和标准差。
[0087]
应当理解的是,可以通过预设均值公式计算初始时序流量数据的均值。
[0088]
其中,预设均值公式如下所示:
[0089][0090]
式中,μ为初始时序流量数据的均值,m为初始时序流量数据的数据总数,x
i
为初始时序流量数据中的第i个值。
[0091]
可以理解的是,可以通过预设标准差公式计算初始时序流量数据的标准差。其中,预设标准差公式可以如下所示:
[0092][0093]
式中,σ为初始时序流量数据的标准差,m为初始时序流量数据的数据总数,x
i
为初始时序流量数据中的第i个值,μ为初始时序流量数据的均值。
[0094]
步骤s012:根据所述均值和所述标准差对所述初始流量数据进行标准化处理,获得符合标准正态分布的流量数据样本。
[0095]
可以理解的是,根据均值和标准差对初始流量数据进行标准化处理,获得符合标准正态分布的流量数据样本可以是根据均值和标准差通过预设标准化处理公式计算流量数据样本。其中,预设标准化处理公式可以如下所示:
[0096][0097]
式中,为流量数据样本中的第i个值,μ为初始时序流量数据的均值,σ为初始时序流量数据的标准差,x
i
为初始时序流量数据中的第i个值。
[0098]
第三实施例通过获取初始时序流量数据,并确定初始时序流量数据的均值和标准差,根据均值和标准差对初始流量数据进行标准化处理,获得符合标准正态分布的流量数据样本,从而能够使得经过标准化处理后的流量数据样本符合标准正态分布,降低流量数据样本的样本差异,提高流量数据样本的可靠性。
[0099]
在第三实施例中,所述步骤s02,包括:
[0100]
步骤s021:根据所述流量数据样本对初始双向门控循环单元模型进行训练,获得候选双向门控循环单元模型。
[0101]
需要说明的是,初始双向门控循环单元模型可以预先在双向gru神经网络处理层中,确定前向传递子层与后向传递子层的输入层单元个数、输出层单元个数、隐藏层单元个数以及隐藏层参数,设置每次输入m个变量作为输入参数,n个变量作为输出参数。
[0102]
可以理解的是,分别将m个正反向排列的流量训练数据分别输入到正反向gru神经网络中,然后对前向传递和后向传递两个子gru网络的输出进行叠加,可得到双向gru模型输出。
[0103]
[0104][0105][0106]
式中,为经过gru模型正向训练的输出结果,为经过gru模型反向训练的输出结果,为双向门控循环单元模型的预测值。
[0107]
步骤s022:获取所述初始双向门控循环单元模型的训练次数,并判断所述训练次数是否大于预设次数。
[0108]
需要说明的是,预设次数可以由用户预先设置。例如,用户可以预先将t作为预设次数。
[0109]
应当理解的是,在初始双向门控循环单元模型的训练次数小于或等于预设次数时,说明初始双向门控循环单元模型并未训练完成,还需要继续对初始双向门控循环单元模型进行训练。
[0110]
步骤s023:在所述训练次数大于预设次数时,将所述候选双向门控循环单元模型作为预设双向门控循环单元模型。
[0111]
可以理解的是,在初始双向门控循环单元模型的训练次数大于预设次数时,说明初始双向门控循环单元模型训练完成,可以将候选双向门控循环单元模型作为预设双向门控循环单元模型。
[0112]
进一步地,为了使训练完成的预设双向门控循环单元模型的误差较小。
[0113]
所述步骤s023,包括:
[0114]
在所述训练次数大于预设次数时,获取所述候选双向门控循环单元模型的训练输出数据;
[0115]
根据所述训练输出数据和实际流量数据确定所述候选双向门控循环单元模型的预测误差;
[0116]
在所述预测误差小于预设误差阈值时,将所述候选双向门控循环单元模型作为预设双向门控循环单元模型。
[0117]
需要说明的是,训练输出数据可以是候选双向门控循环单元模型的模型预测值。
[0118]
应当理解的是,根据训练输出数据和实际流量数据确定候选双向门控循环单元模型的预测误差可以是根据训练输出数据和实际流量数据通过预设误差模型确定候选双向门控循环单元模型的预测误差。其中,预设误差模型用于确定预设数据与实际数据之间的差值。
[0119]
可以理解的是,在预测误差小于预设误差阈值时,说明候选双向门控循环单元模型的预测误差较小。此时,可以直接将候选双向门控循环单元模型作为预设双向门控循环单元模型。
[0120]
进一步地,为了能够准确计算候选双向门控循环单元模型的预测误差,所述根据所述训练输出数据和实际流量数据确定所述候选双向门控循环单元模型的预测误差,包括:
[0121]
获取所述流量数据样本的样本总数,并根据所述训练输出数据、实际流量数据以及所述样本总数确定均方根误差和平均相对误差;
[0122]
根据所述均方根误差和所述平均相对误差确定所述候选双向门控循环单元模型
的预测误差。
[0123]
应当理解的是,根据训练输出数据、实际流量数据以及样本总数确定均方根误差可以是根据训练输出数据、实际流量数据以及样本总数通过预设均方根误差公式计算均方根误差。其中,预设均方根误差公式如下所示:
[0124][0125]
式中,为均方根误差,n为流量数据样本的样本总数,y
j
为实际流量数据,为双向门控循环单元模型的预测值(即训练输出数据)。
[0126]
根据训练输出数据、实际流量数据以及样本总数确定平均相对误差可以是根据训练输出数据、实际流量数据以及样本总数通过预设平均相对误差公式计算平均相对误差。其中,预设平均相对误差公式如下所示:
[0127][0128]
式中,为平均相对误差,n为流量数据样本的样本总数,y
j
为实际流量数据,为双向门控循环单元模型的预测值(即训练输出数据)。
[0129]
可以理解的是,可以将均方根误差和平均相对误差作为候选双向门控循环单元模型的预测误差。
[0130]
在均方根误差小于预设均方根误差阈值,且平均相对误差小于预设平均相对误差阈值时,将候选双向门控循环单元模型作为预设双向门控循环单元模型。
[0131]
在具体实现中,例如,在时,停止训练和参数更新,将候选双向门控循环单元模型作为预设双向门控循环单元模型。其中,α和β可以由用户预先设置。
[0132]
进一步地,所述根据所述训练输出数据和实际流量数据确定所述候选双向门控循环单元模型的预测误差之后,还包括:
[0133]
在所述预测误差大于或等于预设误差阈值时,对所述候选双向门控循环单元模型进行参数调整,直至所述预测误差小于所述预设误差阈值;
[0134]
将调整后的候选双向门控循环单元模型作为预设双向门控循环单元模型。
[0135]
可以理解的是,在预测误差大于或等于预设误差阈值时,需要继续对候选双向门控循环单元模型进行训练,并对所述候选双向门控循环单元模型进行参数调整,直至所述预测误差小于所述预设误差阈值。
[0136]
应当理解的是,调整候选双向门控循环单元模型的参数可以是调整前向传递子层与后向传递子层的输入层单元个数、输出层单元个数、隐藏层单元个数以及隐藏层参数中的至少一个,本实施例对此不加以限制。
[0137]
第三实施例通过根据流量数据样本对初始双向门控循环单元模型进行训练,获得候选双向门控循环单元模型,获取初始双向门控循环单元模型的训练次数,并判断训练次数是否大于预设次数,在训练次数大于预设次数时,将候选双向门控循环单元模型作为预设双向门控循环单元模型,从而能够对双向门控循环单元模型进行充分训练,提高双向门
控循环单元模型的准确性。
[0138]
此外,本发明实施例还提出一种存储介质,所述存储介质上存储有网络流量预测程序,所述网络流量预测程序被处理器执行时实现如上文所述的网络流量预测方法。
[0139]
此外,参照图5,本发明实施例还提出一种网络流量预测装置,所述网络流量预测装置包括:数据获取模块10、数据处理模块20和流量预测模块30;
[0140]
所述数据获取模块10,用于获取待预测网络对应的历史时序流量数据。
[0141]
需要说明的是,待预测网络可以是虚拟化宽带远程接入服务器(virtualized broadband remote access server,vbras)和5g用户面功能(user plane function,upf)等虚拟网元,也可以是网络功能虚拟化(network functions virtualization,nfv)管理编排(management and orchestration,mano)系统,也可以是数据中心,也可以是无线小区网络,本实施例对此不加以限制。
[0142]
可以理解的是,在实际应用中,在待预测网络为vbras和5g upf等虚拟网元时,可以根据预测流量数据指定智能化扩缩容策略;在待预测网络为nfv mano系统时,可以根据预测流量数据对虚拟资源进行分配调整,以提高虚拟资源的利用率;在待预测网络为数据中心时,可以根据预测流量数据预测数据中心的负载变化情况,指定虚拟机迁移的策略并触发服务器休眠和唤醒操作,实现数据中心节能;在待预测网络为无线小区网络时,可以根据预测流量数据预测无线小区的业务量,结合场景识别等技术,可以给出无线侧载波关断、符号关断等节能操作的策略建议,辅助实现基站节能。
[0143]
应当理解的是,根据上述场景可知,网络流量预测对于网络设计与规划、流量控制、协议设计、确保服务质量、研究拥塞控制和带宽分配机制、分析与评价网络性能以及进一步实施流量工程等都有着非常重要的意义。
[0144]
需要说明的是,历史时序流量数据可以是前一时间段的时序流量数据。其中,前一时间段可以由用户预先设置,时序流量数据可以是具备时间相关性的流量数据。
[0145]
应当理解的是,获取待预测网络对应的历史时序流量数据可以是在预设数据库中查找待预测网络对应的历史时序流量数据,并获取历史时序流量数据。其中,预设数据库用于存储流量数据。
[0146]
所述数据处理模块20,用于对所述历史时序流量数据进行标准化处理,获得目标流量数据。
[0147]
应当理解的是,由于历史时序流量数据的数值相差较大,从而导致无法直接对历史时序流量数据进行比较。因此,需要对历史时序流量数据进行标准化处理。
[0148]
可以理解的是,对历史时序流量数据进行标准化处理,获得目标流量数据可以是通过预设标准化模型对历史时序流量数据进行标准化处理,获得目标流量数据。其中,预设标准模型如下所示:
[0149][0150]
式中,为目标流量数据中的第i个值,μ
z
为历史时序流量数据的均值,σ
z
为历史时序流量数据的标准差,z
i
为历史时序流量数据中的第i个值。
[0151]
应当理解的是,经过标准化处理后的历史时序流量数据(即目标流量数据)符合标准正态分布,从而提高了目标流量数据的可靠性。
[0152]
所述流量预测模块30,用于根据所述目标流量数据通过预设双向门控循环单元模型进行流量预测,获得所述待预测网络的预测流量数据。
[0153]
可以理解的是,现有技术中,存在通过传统的线性模型进行网络流量预测的方式,但是,传统的线性模型不能满足现代网络流量存在的突变性和多依赖性等非线性要求,无法有效描述网络流量的非平稳特性。其中,传统的线性模型可以是自回归模型(auto regressive,ar)模型、滑动平均模型(moving average model,ma)、自回归滑动平均(auto

regressive moving average,arma)模型、自回归合成滑动平均(autoregressive integrated moving average,arima)模型等。
[0154]
还存在通过非线性模型进行网络流量预测的方式,非线性模型虽然通过对历史数据进行拟合训练和规律性学习,较好的考虑了网络流量的随机性和周期性,但是缺少对时序数据时间相关性的考虑,预测精度有限。其中,非线性模型可以是人工神经网络、最小二乘支持向量机(least squares support veotor maohine,lssvm)、梯度提升回归树模型(gradient boosting regression tree,gbrt)以及极限学习机(extreme learning machine,elm)等。
[0155]
还存在通过神经网络进行网络流量预测的方式。例如,循环神经网络(recurrent neural network,rnn)是一种引入循环反馈的深层神经网络,它包含自循环的神经元,可以将历史信息在神经元中进行传递,考虑到了时序相关性,但是随着时间间隔的不断增大,rnn会丧失学习过去较久远信息的能力,即梯度消失。长短期记忆(long short

term memory,lstm)循环神经网络是rnn的一种特殊模型,弥补了rnn梯度消失、梯度爆炸、长期记忆能力不足等问题,能够学习时序数据之间的长期依赖关系,有效地解决了常规rnn训练过程中的梯度消失和梯度爆炸问题,但是基于循环神经网络(包括lstm)的模型普遍都有难以训练难度大和计算量大的缺点。
[0156]
需要说明的是,双向门控循环单元模型(bidirectional gate recurrent unit,bigru)是由单向的、方向相反的两个门控循环单元(gate recurrent unit,gru)共同组成。在每一时刻,输入会同时提供两个方向相反的gru,而模型训练的输出结果则由这两个单向gru共同决定,从而有效地解决网络流量的时序预测问题。另外,由于gru是循环神经网络(recurrent neural network,rnn)的一种,具备计算速度快、参数少的特点。因此,bigru也具备运算速度快、输入参数少的特点。
[0157]
应当理解的是,本实施例通过引入双向门控循环单元(bidirectional gate recurrent unit,bigru)模型,缩小了输入参数,提高了模型运算速度,同时双向gru输出中隐含了较大时间跨度下的时序特征,使得进行后续计算时可以观察到更早的时序数据,以及分辨率更高的时序数据,从而提高了时序预测网络流量的准确性。
[0158]
在具体实现中,例如,网络流量序列在不同时间段呈现不同的变化规律,存在时段差异性,即多模态特性。本实施例中对训练数据集进行处理,训练数据取过去31天的流量数据,时间粒度为每5分钟,本实施例在这个数据集上将本模型与现有时间序列分析预测模型进行比较,最终证明本模型在解决实际问题时有较好表现。
[0159]
在本实施例输入数据中以每5分钟为一个时间步,每12个时间步(即每小时)采集一次数据,采用31天的历史数据,以5分钟一个时间步长划分8928个时间步,来预测288个时间步(24小时)之后的时间序列数据。
[0160]
为了说明bigru模型的实际效果,参考表1进行说明。表1为各模型对比结果表。
[0161]
表1各模型对比结果表
[0162][0163]
通过各模型对比结果表可知,双向门控循环单元(bidirectional gate recurrent unit,bigru)模型的网络流量预测的平均绝对误差(mae)和均方根误差(rmse)以及算法运行时间相比于其他几个模型效果更好,因此,本实施例提出的模型在预测的准确性和运行速度上都得到了明显的优化。
[0164]
在本实施例中,公开了获取待预测网络对应的历史时序流量数据,对历史时序流量数据进行标准化处理,获得目标流量数据,根据目标流量数据通过预设双向门控循环单元模型进行流量预测,获得待预测网络的预测流量数据;由于本实施例中通过双向门控循环单元模型进行流量预测,而双向门控循环单元模型运算量小,预测精度高,从而提高了网络流量预测的预测速度和准确性。
[0165]
在一实施例中,所述网络流量预测装置还包括:模型训练模块;
[0166]
所述模型训练模块,用于获取初始时序流量数据,并对所述初始时序流量数据进行标准化处理,获得流量数据样本,根据所述流量数据样本对初始双向门控循环单元模型进行训练,获得预设双向门控循环单元模型;
[0167]
在一实施例中,所述模型训练模块,还用于获取初始时序流量数据,并确定所述初始时序流量数据的均值和标准差,根据所述均值和所述标准差对所述初始流量数据进行标准化处理,获得符合标准正态分布的流量数据样本;
[0168]
在一实施例中,所述模型训练模块,还用于根据所述流量数据样本对初始双向门控循环单元模型进行训练,获得候选双向门控循环单元模型,获取所述初始双向门控循环单元模型的训练次数,并判断所述训练次数是否大于预设次数,在所述训练次数大于预设次数时,将所述候选双向门控循环单元模型作为预设双向门控循环单元模型;
[0169]
在一实施例中,所述模型训练模块,还用于在所述训练次数大于预设次数时,获取所述候选双向门控循环单元模型的训练输出数据,根据所述训练输出数据和实际流量数据确定所述候选双向门控循环单元模型的预测误差,在所述预测误差小于预设误差阈值时,将所述候选双向门控循环单元模型作为预设双向门控循环单元模型;
[0170]
在一实施例中,所述模型训练模块,还用于在所述预测误差大于或等于预设误差阈值时,对所述候选双向门控循环单元模型进行参数调整,直至所述预测误差小于所述预设误差阈值,将调整后的候选双向门控循环单元模型作为预设双向门控循环单元模型;
[0171]
在一实施例中,所述模型训练模块,还用于获取所述流量数据样本的样本总数,并根据所述训练输出数据、实际流量数据以及所述样本总数确定均方根误差和平均相对误
差,根据所述均方根误差和所述平均相对误差确定所述候选双向门控循环单元模型的预测误差。
[0172]
本发明所述网络流量预测装置的其他实施例或具体实现方式可参照上述各方法实施例,此处不再赘述。
[0173]
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
[0174]
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。词语第一、第二、以及第三等的使用不表示任何顺序,可将这些词语解释为名称。
[0175]
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如只读存储器镜像(read only memory image,rom)/随机存取存储器(random access memory,ram)、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
[0176]
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1