基于变分自编码器估计无线局域网络接入点吞吐量的方法与流程

文档序号:20681268发布日期:2020-05-08 18:25阅读:307来源:国知局
基于变分自编码器估计无线局域网络接入点吞吐量的方法与流程

技术领域:

本发明涉及一种基于变分自编码器估计无线局域网络接入点吞吐量的方法,属于深度学习、时间序列预测领域,尤其涉及无线局域网络中接入点(ap)吞吐量预测的方法。



背景技术:

随着通信技术的进一步发展,无线局域网络已经覆盖到了人类生活的每个角落。现阶段,在公司、学校、商场各个角落都有着自己的无线局域网络,人们对于无线局域网络的依赖与日倍增。此外,随着5g技术的蓬勃发展,无线局域网络对于无人驾驶、无人机、智慧医疗、工业互联网等领域的发展也有着重大的促进作用,工业界对于无线局域网络通信的实时性、可靠性也提出了更高的要求。然而无线通信信道资源是有限的,随着无线局域网络接入点(ap)数量的增加,ap之间的相互干扰也日益严重,这极大地影响了用户体验,对工业界的影响更加严重。因此很多大型互联网公司或it设备服务提供商会采用优化无线局域网络参数配置的方法来提升网络性能与终端用户体验。

传统无线局域网络调优算法大部分是基于ap之间的邻居干扰进行调优,每个ap赋予相同的权值,通过分配网络参数降低无线局域网络干扰。但是,在实际应用中,每个ap权值是不一样的,这将极大的浪费无线频谱资源。若能够通过建立数学模型,有效预测每个ap的实际吞吐量,基于ap的实际吞吐量进行信道分配与带宽选择,即可以极大提升无线局域网络性能,提高无线频谱资源的利用率。

吞吐量序列预测,本质上是一种复杂的时间序列预测模型,目前已有的吞吐量预测方法有:状态空间模型(ssms)、α滤波等算法,但这些算法通常适用于简单的时间序列预测,面对复杂时间序列预测,该类算法预测精度与准确性难以得到保障,因此较难适用于吞吐量时间序列预测。近几年来学术界、工业界逐步有人提出用高斯过程回归预测模型(gpr)与xgboost算法进行时间序列预测,这类算法在时间序列预测的准确性与实时性方面,都有着很好的效果。在直接采用gpr、xgboost进行吞吐量预测时,因为时间序列具有一定的波动性,且样本中常含有异常值,这对无线局域网络ap吞吐量的预测带来了极大的挑战。



技术实现要素:

本发明的目的是克服现有技术不足,本发明的目的在于设计一种基于变分自编码器估计无线局域网络接入点吞吐量的方法,通过基于深度学习的vae-gpr网络对无线局域网络ap端吞吐量数据进行异常检测、过滤、预测,提高ap端吞吐量预测的准确度和效率。

上述目的通过以下技术方案来实现:

基于变分自编码器估计无线局域网络接入点吞吐量的方法,该方法包括如下步骤:

(1)获取无线局域网络中ap端的吞吐量作为样本,对吞吐量数据做预处理,制作数据集x;

(2)根据基于变分自编码器网络(vae)的异常值检测方法,训练数据集x,获得异常值检测模型;

(3)根据基于变分自编码器网络(vae)的异常值检测方法,对数据集x进行全网ap吞吐量数据异常值过滤,制作新的数据集x1

(4)根据数据集x1,采用传统时间序列预测算法对ap吞吐量进行预测。

所述的基于变分自编码器估计无线局域网络接入点吞吐量的方法,步骤(1)中所述制作数据集x的具体方法包括:

(11)读取所述预处理后含有噪声、异常值的ap吞吐量数据;

(12)对步骤(11)读取的ap吞吐量数据按照时间序列进行数据预处理,取窗,形成若干个以时间窗口为w的ap吞吐量数据时间序列戳;

(13)将ap吞吐量数据时间序列戳以7:3的比例分为训练集与测试集,训练集与测试集之间无交集。

所述的基于变分自编码器估计无线局域网络接入点吞吐量的方法,步骤(2)中所述基于变分自编码器(vae)的异常值检测方法,采用pytorch框架,在线性网络中加入常数项,防止方差项较小。

所述的基于变分自编码器估计无线局域网络接入点吞吐量的方法,步骤(3)中所述制作新的数据集x1的具体方法包括:

(31)对一个时间窗口为w的ap吞吐量数据时间序列戳x,通过吞吐量异常检测模型获得新的ap吞吐量数据时间序列戳x′与方差σx;

(32)若x∈[x′-λσx,x′+λσx],其中λ是正常数,保留x;

(33)若x<x′-λσx,则x=x′-λσx;

(34)若x>x′+λσx,则x=x′+λσx;

(35)制作新的数据集x1

所述的基于变分自编码器估计无线局域网络接入点吞吐量的方法,步骤(4)中,所述根据数据集x1,采用传统时间序列预测算法对ap吞吐量进行预测,传统的时间序列预测算法包括高斯过程回归、xgboost。

所述的基于变分自编码器估计无线局域网络接入点吞吐量的方法,步骤(1)中获取无线局域网络中ap端的吞吐量作为样本的时候过滤周末节假日数据。

有益效果:

本发明能够实现无线局域网络接入点(ap)吞吐量的快速预测。相比于传统的吞吐量预测方法,本发明提高了吞吐量预测的准确度,降低预测误差。相较于直接采用高斯过程回归模型(gpr),本发明可以提升5个百分点以上。在此基础上可以进行精确指导无线局域网络频谱资源分配,提升无线局域网络资源利用率。

附图说明:

图1为本发明实施例吞吐量预测方法流程图;

图2为本发明实施例制作数据的流程图;

图3为本发明实施例吞吐量异常检测网络与吞吐量预测流程图;

图4为本发明实施例异常检测网络流程图;

图5为本发明实施例吞吐量预测结果对比图。

具体实施方式:

下面结合附图和具体实施例对本发明作进一步的详细说明。

本实施例提供了一种基于变分自编码器估计无线局域网络接入点吞吐量的方法,解决了传统无线局域网络接入点(ap)吞吐量预测方法对于含噪声、异常值数据预测不准确、费时的问题。如图1所示,该方法包括:

步骤s10、获取含有噪声、异常值的ap吞吐量数据作为样本,通过对ap吞吐量数据时间序列进行数据预处理,取窗,形成大量的时间窗口为w的吞吐量时间序列戳,制作数据集。w窗口大小的设置取决于采集的吞吐量样本时间粒度,一般取为样本粒度的整数倍。本实施例中吞吐量的时间粒度为1min,因此w可以取为10,15,30,60等。所述数据预处理包括:对ap吞吐量数据分别进行某一时间粒度滑动平均、平均、取最值等方式。对预处理数据进行时间取窗,窗口一般取为吞吐量预测时间粒度的大小。在不改变原始数据统计特征情况下,对吞吐量数据取预测时间粒度大小的窗口,可以提高吞吐量异常检测模型的准确度与泛化能力。对于吞吐量数据进行统计分析,滑动平均都属于数据预处理。对预处理后的数据做任何与预测时间粒度大小有关的操作都属于取窗。

步骤s20、根据基于变分自编码器(vae)的异常值检测方法训练所述数据集,获得ap吞吐量数据异常检测模型,采用pytorch框架,在线性网络中加入常数项,防止方差项较小。所述基于变分自编码器(vae)的异常值检测方法并不局限于pytorch框架,只要能对预处理后、取窗的吞吐量数据进行训练,且在训练过程中迭代若干次(千次的数量级)后达到损失函数收敛并且最终能够获得输出数据集x′即可。

从数据中学得模型的过程称为训练或学习,把训练集输入到深度变分自编码器(vae)网络中,深度变分自编码器(vae)网络学习含有ap吞吐量数据的统计特征,经过上万次的迭代训练后,就可以得到深度变分自编码器(vae)网络模型即ap吞吐量异常检测模型。通过ap吞吐量异常检测模型就可以实现对含有异常值的ap吞吐量数据进行定位与替换。

步骤s30、采用ap吞吐量异常检测模型就可以实现对含有异常值的ap吞吐量数据进行定位与替换,制作新数据集x1

步骤s40、根据所述数据集x1,采用传统时间序列预测算法对ap吞吐量进行预测,传统的时间序列预测算法有高斯过程回归(gpr)、xgboost等。其采用vae-gpr方法与直接采用gpr方法对比效果图如图所示。

如图2所示,所述步骤s10包括:

步骤s101、读取所述预处理后含有噪声、异常值的ap吞吐量数据。

步骤s102、对ap吞吐量数据时间序列进行数据预处理,数据预处理包括对ap吞吐量数据分别进行某一时间粒度滑动平均、平均、取最值等方式。

步骤s103、对预处理的数据进行取窗,形成大量的时间窗口为w的ap吞吐量数据时间序列戳,窗口一般取为吞吐量预测时间粒度的大小。

步骤s104、将所述吞吐量时间序列戳以7:3的比例分为训练集和测试集,训练集和测试集之间无交集。训练过程中使用的数据称为训练数据,其中每个样本称为训练样本。训练样本组成的集合称为训练集。而测试集则被用来测试模型对于新样本的判别能力。可理解的,训练集和测试集中所述可读取文件的比例不限于7:3,可以设置成任意比例,但需要确保训练集中可读取文件数量至少是测试集的2倍,且训练集与测试集无交集。

如图3所示,所述步骤s20包括:

步骤s201、对ap吞吐量数据采用基于变分自编码器(vae)的异常值检测方法,训练数据集,获得吞吐量异常检测模型。

如图4所示,所述步骤s30包括:

步骤s301、对一个窗口为w的时间戳x,通过吞吐量异常检测模型获得新的时间戳x′与方差σx。

步骤s302、若x∈[x′-λσx,x′+λσx],其中λ是正常数,保留x;若x<x′-λσx,则x=x′-λσx;若x>x′+λσx,则x=x′+λσx。

步骤s303、制作新的数据集x1

如图3所示,所述步骤s40包括:

步骤s401、根据所述新数据集x1,采用传统时间序列预测算法对ap吞吐量进行预测,传统的时间序列预测算法有高斯过程回归、xgboost等;

如图5所示,采用上述算法对某公司某食堂ap某一天8:00-20:00吞吐量进行预测。全天预测误差为2.28mbps,95%置信水平的预测准确率为83.3%。在对全网ap采用vae-gpr算法进行预测,全网ap在白天时间段(8:00-20:00)预测的准确率在80%以上,全天(0:00-24:00)预测准确率在85%以上。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(read-onlymemory,rom)等。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1