本发明属于数据挖掘技术领域,特别涉及一种无线网络中的用户流量预测系统。
背景技术:
随着移动通信技术的发展和智能移动设备(如智能手机、无线传感器)的快速普及,用户越来越频繁地使用移动设备,产生大量无线网络流量。由于用户的活动范围随机性较高,在某一时段、某一区域必然会产生网络拥堵,而同时另一些区域通信顺畅,通信负载不均衡,这会影响用户体验、造成用户流失,甚至会干扰智能移动设备(例如无人车的网络模块)的正常工作,造成安全隐患。因此,预测区域内的网络流量分布这一问题引起了许多研究人员的关注,并且在未来将变得更加重要。
传统的流量预测方法都是根据流量的历史记录,使用回归预测等统计方法进行的。然而,这种方法过于粗糙,仅仅根据前一时段的流量大小进行连续性的预测,无法应对流量突变的情况,也无法发现流量中隐藏的用户习惯、周期性事件等显著影响流量变化的特征。事实上,区域流量是各个用户的流量的组合,如果不能考虑到单一用户的特征,就难以捕捉流量变化的细节,例如,某一时刻用户从a移动到b,必然会产生a地流量降低,b地流量相应地可能会升高,仅仅考虑流量记录的预测方法无法解释这种合理的变化。
技术实现要素:
为了克服上述现有技术的缺点,本发明的目的在于提供一种无线网络中的用户流量预测系统,一方面,考虑了单个用户的移动轨迹、使用习惯,得到更加精确的预测结果;另一方面,在预测整体流量的同时,还能完成单个用户的流量预测和轨迹预测任务。
为了实现上述目的,本发明采用的技术方案是:
无线网络中的用户流量预测系统,包括:
基本特征提取子系统,对用户流量进行分析,初步提取用户特征,包括区域内各个用户和各个无线接入点(ap)的特征;
用户移动轨迹预测子系统,根据用户在区域中的移动轨迹数据,基于卷积神经网络模型预测用户的下一步去向;
用户流量偏好分析子系统,根据用户在区域中使用流量的情况,基于循环神经网络模型预测用户的下一时段流量;
区域流量预测子系统,结合用户移动轨迹预测和流量预测,对整个区域下一时段的流量分布进行预测。
所述基本特征提取子系统从无线流量记录中提取出各个用户、各个无线接入点(ap)的特征。将用户和ap视为图中的节点,用户在ap的接入行为视为边,将用户在不同无线接入点(ap)使用流量的记录转化为二分图的形式,点代表用户和ap,边代表连接关系,然后使用图嵌入算法学习每个节点的隐含特征表示,得到用户与ap的向量化特征表示。
所述用户移动轨迹预测子系统以用户和ap的特征表示作为输入,将用户和ap的特征表示输入到一个卷积神经网络(cnn)中,同时将用户过去一段时间的移动轨迹作为输入,利用注意力机制挖掘针对不同用户的周期性移动习惯,输出用户下一个可能连接的ap。
所述用户流量偏好分析子系统以用户和ap的特征表示作为输入,将用户和ap的特征表示输入到一个循环神经网络(rnn)中,同时将用户过去一段时间的流量作为输入,利用注意力机制挖掘针对不同用户的周期性流量使用习惯,输出用户下一时刻可能产生的流量大小。
所述区域流量预测子系统结合上述用户移动轨迹预测子系统和用户流量偏好分析子系统获得的单一用户的轨迹预测和流量预测结果,将结果进行整合,形成一个行为用户,列为ap的矩阵,表示下一时段用户在每个ap的流量预期,最后按列相加,得到整个区域的流量预测结果。
本发明整个系统使用了端到端的学习框架,输入前一段时间的用户流量记录,输出下一时间段的区域流量分布。
与现有技术相比,本发明的有益效果是:
1、通过用户轨迹来推测用户的移动规律,处理细节的能力得到提高。
本发明考虑到单一用户的特征,可以捕捉到流量在不同地点之间的互补的细节变化。
2、发现用户的流量使用习惯,处理流量突变的能力得到明显提高。
本发明考虑了用户的周期性使用习惯,因此对于突然开始产生流量、流量突然消失这样的突变有了显著的处理能力。
3、能够同时预测单一用户的流量。
本发明相对于传统的流量预测方法,对单一用户使用的流量进行预测的准确度有明显提升。
附图说明
图1为本发明的系统整体结构图。
图2为本发明的基本特征提取子系统流程图。
图3为本发明的用户移动轨迹预测子系统流程图。
图4为本发明的用户流量偏好分析子系统流程图。
图5为本发明的区域流量预测子系统流程图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面结合附图和实施例详细说明本发明的实施方式。
如图1所示,本系统由四个子系统组成,分别是基本特征提取子系统、用户移动轨迹预测子系统、用户流量偏好分析子系统和区域流量预测子系统。系统的输入数据为包含用户、无线接入点(ap)的无线流量使用记录。为方便系统处理数据,将每一时刻的流量记录数据整理成以用户为行,ap为列的矩阵,这样就得到多个(与能够获取多长时间的流量记录有关)用户-ap流量矩阵,送入基本特征提取子系统。
在基本特征提取子系统中,将用户和ap视为图(graph)中的节点,用户在ap的接入行为视为边,将无线流量记录抽象为一张图,然后使用图嵌入算法学习每个节点的隐含特征表示。
将特征送入用户移动轨迹预测子系统,将用户和ap的特征表示输入到一个卷积神经网络(cnn)中,同时将用户过去一段时间连接过的ap作为输入,利用注意力机制挖掘针对不同用户的周期性移动习惯,输出用户下一个可能连接的ap。
同时,用户流量偏好分析子系统以用户和ap的特征表示作为输入,预测用户下一时刻的流量。该子系统将用户和ap的特征表示输入到一个循环神经网络(rnn)中,同时将用户过去一段时间的流量作为输入,利用注意力机制挖掘针对不同用户的周期性流量使用习惯,输出用户下一时刻可能产生的流量大小。
最后,区域流量预测子系统将整合上述用户移动轨迹预测子系统和用户流量偏好分析子系统获得的单一用户的轨迹预测和流量预测结果,预测区域内的整体流量分布。
本发明中各个子系统的详细介绍如下:
1、基本特征提取子系统
主要实现从无线流量记录中提取出各个用户、各个无线接入点(ap)的特征。
具体地,基本特征提取子系统对无线流量记录的处理过程如下:
用
此时就可以使用近几年流行的图嵌入算法(本发明使用了line算法)学习每个节点的隐含特征表示(line算法是业内常用的开源算法,使用以下网址可以获得line算法的源代码https://github.com/tangjianpku/line)。邻接矩阵gc可以直接应用line算法,而ht表示的是流量大小,因此需要将邻接矩阵gt中对应的元素替换成流量大小,使用加权的line方法学习特征表示,即可得到每个用户和ap基本的向量化特征表示:反映移动轨迹习惯的uc和vc,以及反映流量使用习惯的ut和vt。
uc、vc、ut和vt将作为用户移动轨迹预测子系统和用户流量偏好分析子系统的输入。
2、用户移动轨迹预测子系统
主要功能是利用用户和ap的特征表示u和v作为输入,预测用户下一步的移动轨迹。
具体地,用户移动轨迹预测子系统对用户和ap特征的分析过程如下:
对于用户u是否会在地点v出现,本发明使用一个卷积神经网络(cnn)进行判断。基于uc和vc,输入用户和ap的向量化特征表示ui和vj,同时,为了加入时间信息,本发明加入了一个移动轨迹历史特征矩阵vh,vh表示用户过去k时间段内连接过的ap的向量化特征,将以上三项输入到cnn模型中。这里为了体现用户的多样性,加入注意力机制层,学习每个用户不同的周期性移动习惯。然后将注意力层的输出用cnn网络进行学习,最后经过一层全连接层,得到判断结果。
3、用户流量偏好分析子系统
主要功能是利用用户和ap的特征表示u和v作为输入,预测用户下一步的移动轨迹。
具体地,用户流量偏好分析子系统对用户和ap特征的分析过程如下:
对于用户u会在地点v使用多少流量,本发明使用一个循环神经网络(rnn)进行判断。基于ut和vt,输入用户和ap的向量化特征表示ui和vj,同时,为了加入时间信息,本发明加入了一个流量使用的历史记录向量vr,vr表示用户过去k时间段内的流量使用记录,将以上三项输入到rnn模型中,vr作为输入,ui和vj作为初始状态。这里为了体现用户的多样性,加入注意力机制层,学习每个用户不同的周期性流量使用习惯。最后经过一层全连接层,得到流量预测结果。
4、区域流量预测子系统
主要功能是预测下一时段的区域整体流量。
本发明将前两个子系统的输出结合起来,形成一个行为用户,列为ap的矩阵,表示下一时段用户在每个ap的流量预期。最后按列相加,得到整个区域的流量预测结果。
综上,本发明提供的一种无线网络中的用户流量预测系统,通过对用户的行为模式进行分析,预测区域内的无线网络流量。本发明可用于无线网络中的流量预测;用户轨迹预测;以及针对用户的个人流量预测。