网络流量的预测方法、装置、设备及存储介质与流程

文档序号:26938128发布日期:2021-10-12 13:21阅读:65来源:国知局
网络流量的预测方法、装置、设备及存储介质与流程

1.本发明涉及无线通信领域,尤其涉及一种网络流量的预测方法、装置、设备及存储介质。


背景技术:

2.随着互联网的发展,网络用户数量逐渐增多,为保证网络安全以及用户的感知,通过对接入网络的整个目标位置如整个小区的网络流量进行预测,掌握网络流量动态变化的趋势,从而不断调整网络结构和带宽,在实际的网络管理应用中具有重要意义。
3.目前,相关技术中,对整个小区的网络流量进行预测时,一般采用基于网络或者小区自身业务量数据的分析与预测的方法,或者基于小区内单个用户的移动性分析来预测网络流量的方法。然而,上述两种预测方法仍存在一定的局限性,导致对整个小区的网络流量进行预测的精度降低。


技术实现要素:

4.为解决相关技术中存在的技术问题,本发明实施例提供一种网络流量的预测方法、装置、设备及存储介质,能够有效提高对整个目标位置的网络流量进行预测的精度。
5.本发明实施例的技术方案是这样实现的:
6.本发明实施例提供一种网络流量的预测方法,所述方法包括:
7.获取多个用户设备的历史业务相关数据;
8.对所述历史业务相关数据进行特征提取,得到对应各所述用户设备的业务相关特征;
9.基于所述多个用户设备中每两个用户设备之间的业务相关特征的相似度,对所述多个用户设备进行聚类划分,得到至少两个用户设备群;
10.将各用户设备群中用户设备的历史位置数据及历史网络流量数据作为训练样本数据,对相应的所述用户设备群分别进行位置及网络流量的预测模型训练,得到对应各所述用户设备群的位置与网络流量的预测模型;
11.其中,所述预测模型用于预测目标用户设备群的目标位置及网络流量,所述目标位置及网络流量用于供确定对应所述目标位置的总的网络流量预测值。
12.上述方案中,所述方法还包括:
13.基于各所述用户设备的业务相关特征,确定所述多个用户设备中每两个用户设备之间的业务相关特征的相似度。
14.上述方案中,所述基于各所述用户设备的业务相关特征,确定所述多个用户设备中每两个用户设备之间的业务相关特征的相似度,包括:
15.在所述业务相关特征包括运动轨迹、停留区域及业务流量的情况下,分别确定所述多个用户设备中每两个用户设备之间的运动轨迹相似度,以及
16.确定所述多个用户设备中每两个用户设备之间的停留区域相似度,以及
17.确定所述多个用户设备中每两个用户设备之间的业务流量相似度。
18.上述方案中,所述确定所述多个用户设备中每两个用户设备之间的运动轨迹相似度,包括:
19.获取同一时段内两个用户设备中第一用户设备对应的第一运动轨迹,以及第二用户设备对应的第二运动轨迹;
20.确定所述第一运动轨迹与所述第二运动轨迹中对应编号的轨迹点之间的距离;
21.基于所述第一运动轨迹与所述第二运动轨迹中对应编号的轨迹点之间的距离的求和,确定所述两个用户设备之间的运动轨迹相似度。
22.上述方案中,所述确定所述多个用户设备中每两个用户设备之间的停留区域相似度,包括:
23.获取同一时段内两个用户设备中第一用户设备对应的第一停留区域,以及第二用户设备对应的第二停留区域;
24.确定所述第一停留区域与所述第二停留区域的交集区域内停留点的数量;
25.确定所述第一停留区域与所述第二停留区域中总停留点的数量;
26.基于所述交集区域内停留点的数量与所述总停留点的数量的比值,确定所述两个用户设备之间的停留区域相似度。
27.上述方案中,所述确定所述多个用户设备中每两个用户设备之间的业务流量相似度,包括:
28.获取同一时段内两个用户设备中第一用户设备对应的第一业务类别,以及第二用户设备对应的第二业务类别;
29.确定与所述第一业务类别对应的第一业务流量,以及与所述第二业务类别对应的第二业务流量;
30.基于所述第一业务流量与所述第二业务流量之间的差异值,确定所述两个用户设备之间的业务流量相似度。
31.上述方案中,所述基于所述多个用户设备中每两个用户设备之间的业务相关特征的相似度,对所述多个用户设备进行聚类划分,得到至少两个用户设备群,包括:
32.基于所述多个用户设备中每两个用户设备之间的业务相关特征的相似度,确定所述多个用户设备中每两个用户设备之间的时空分布相似度;
33.基于所述多个用户设备中每两个用户设备之间的时空分布相似度的矩阵表示,构建相似性矩阵;
34.基于所述相似性矩阵建立图模型,并基于所述图模型中超边的权重大小,对所述多个用户设备进行聚类划分,得到至少两个用户设备群。
35.上述方案中,所述方法还包括:将所述相似性矩阵进行归一化处理,得到归一化后的相似性矩阵;
36.所述基于所述相似性矩阵建立图模型,包括:
37.将所述归一化后的相似性矩阵进行图转换,得到所述图模型。
38.上述方案中,所述方法还包括:
39.获取所述目标用户设备群在当前时刻的实时业务相关数据,所述实时业务相关数据至少包括实时位置数据及实时网络流量数据;
40.将所述实时位置数据与所述实时网络流量数据分别输入至所述预测模型,得到所述预测模型输出的所述目标用户设备群在目标时刻所处的目标位置,以及所述目标用户设备群在所述目标时刻的网络流量预测值;所述目标时刻用于表征以所述当前时刻为起始时间的任一时刻。
41.上述方案中,所述方法还包括:
42.基于所述目标用户设备群在所述目标时刻所处的目标位置,确定位于同一所述目标位置的目标用户设备群集合;
43.将位于同一所述目标位置的目标用户设备群集合中所有目标用户设备群的网络流量预测值进行汇总,得到对应所述目标位置的总的网络流量预测值。
44.本发明实施例还提供一种网络流量的预测方法,所述方法包括:
45.获取目标用户设备群在当前时刻的实时业务相关数据,所述实时业务相关数据至少包括实时位置数据及实时网络流量数据;
46.将所述实时位置数据与所述实时网络流量数据分别输入至预测模型,得到所述预测模型输出的所述目标用户设备群在目标时刻所处的目标位置,以及所述目标用户设备群在所述目标时刻的网络流量预测值;所述目标时刻用于表征以所述当前时刻为起始时间的任一时刻;
47.基于所述目标用户设备群在目标时刻所处的目标位置,以及所述目标用户设备群在所述目标时刻的网络流量预测值,确定所述目标位置的总的网络流量预测值;
48.其中,所述预测模型,基于用户设备群中用户设备的历史位置数据及历史网络流量数据作为训练样本数据进行模型训练得到。
49.上述方案中,所述基于所述目标用户设备群在目标时刻所处的目标位置,以及所述目标用户设备群在所述目标时刻的网络流量预测值,确定所述目标位置的总的网络流量预测值,包括:
50.基于所述目标用户设备群在所述目标时刻所处的目标位置,确定位于同一所述目标位置的目标用户设备群集合;
51.将位于同一所述目标位置的目标用户设备群集合中所有目标用户设备群的网络流量预测值进行汇总,得到对应所述目标位置的总的网络流量预测值。
52.上述方案中,所述方法还包括:
53.将所述目标位置的总的网络流量预测值与所述目标位置的总网络流量阈值进行比较,得到比较结果;
54.当所述比较结果表征所述目标位置的总的网络流量预测值大于所述总网络流量阈值时,对所述目标位置的网络设备进行维护与优化。
55.本发明实施例还提供一种网络流量的预测装置,所述装置包括:
56.第一获取单元,用于获取多个用户设备的历史业务相关数据;
57.特征提取单元,用于对所述历史业务相关数据进行特征提取,得到对应各所述用户设备的业务相关特征;
58.聚类划分单元,用于基于所述多个用户设备中每两个用户设备之间的业务相关特征的相似度,对所述多个用户设备进行聚类划分,得到至少两个用户设备群;
59.模型训练单元,用于将各用户设备群中用户设备的历史位置数据及历史网络流量
数据作为训练样本数据,对相应的所述用户设备群分别进行位置及网络流量的预测模型训练,得到对应各所述用户设备群的位置与网络流量的预测模型;
60.其中,所述预测模型用于预测目标用户设备群的目标位置及网络流量,所述目标位置及网络流量用于供确定对应所述目标位置的总的网络流量预测值。
61.上述方案中,所述装置还包括:
62.第一确定单元,用于基于各所述用户设备的业务相关特征,确定所述多个用户设备中每两个用户设备之间的业务相关特征的相似度。
63.上述方案中,所述第一确定单元,具体用于:
64.在所述业务相关特征包括运动轨迹、停留区域及业务流量的情况下,分别确定所述多个用户设备中每两个用户设备之间的运动轨迹相似度,以及
65.确定所述多个用户设备中每两个用户设备之间的停留区域相似度,以及
66.确定所述多个用户设备中每两个用户设备之间的业务流量相似度。
67.上述方案中,所述第一确定单元,具体用于:
68.获取同一时段内两个用户设备中第一用户设备对应的第一运动轨迹,以及第二用户设备对应的第二运动轨迹;
69.确定所述第一运动轨迹与所述第二运动轨迹中对应编号的轨迹点之间的距离;
70.基于所述第一运动轨迹与所述第二运动轨迹中对应编号的轨迹点之间的距离的求和,确定所述两个用户设备之间的运动轨迹相似度。
71.上述方案中,所述第一确定单元,具体用于:
72.获取同一时段内两个用户设备中第一用户设备对应的第一停留区域,以及第二用户设备对应的第二停留区域;
73.确定所述第一停留区域与所述第二停留区域的交集区域内停留点的数量;
74.确定所述第一停留区域与所述第二停留区域中总停留点的数量;
75.基于所述交集区域内停留点的数量与所述总停留点的数量的比值,确定所述两个用户设备之间的停留区域相似度。
76.上述方案中,所述第一确定单元,具体用于:
77.获取同一时段内两个用户设备中第一用户设备对应的第一业务类别,以及第二用户设备对应的第二业务类别;
78.确定与所述第一业务类别对应的第一业务流量,以及与所述第二业务类别对应的第二业务流量;
79.基于所述第一业务流量与所述第二业务流量之间的差异值,确定所述两个用户设备之间的业务流量相似度。
80.上述方案中,所述聚类划分单元,具体用于:
81.基于所述多个用户设备中每两个用户设备之间的业务相关特征的相似度,确定所述多个用户设备中每两个用户设备之间的时空分布相似度;
82.基于所述多个用户设备中每两个用户设备之间的时空分布相似度的矩阵表示,构建相似性矩阵;
83.基于所述相似性矩阵建立图模型,并基于所述图模型中超边的权重大小,对所述多个用户设备进行聚类划分,得到至少两个用户设备群。
84.上述方案中,所述装置还包括:归一化单元,用于将所述相似性矩阵进行归一化处理,得到归一化后的相似性矩阵;
85.所述聚类划分单元,具体用于:
86.将所述归一化后的相似性矩阵进行图转换,得到所述图模型。
87.上述方案中,所述装置还包括:
88.第二获取单元,用于获取所述目标用户设备群在当前时刻的实时业务相关数据,所述实时业务相关数据至少包括实时位置数据及实时网络流量数据;
89.数据输入单元,用于将所述实时位置数据与所述实时网络流量数据分别输入至所述预测模型,得到所述预测模型输出的所述目标用户设备群在目标时刻所处的目标位置,以及所述目标用户设备群在所述目标时刻的网络流量预测值;所述目标时刻用于表征以所述当前时刻为起始时间的任一时刻。
90.上述方案中,所述装置还包括:
91.第二确定单元,用于基于所述目标用户设备群在所述目标时刻所处的目标位置,确定位于同一所述目标位置的目标用户设备群集合;
92.汇总单元,用于将位于同一所述目标位置的目标用户设备群集合中所有目标用户设备群的网络流量预测值进行汇总,得到对应所述目标位置的总的网络流量预测值。
93.本发明实施例还提供一种网络流量的预测装置,所述装置包括:
94.第二获取单元,用于获取目标用户设备群在当前时刻的实时业务相关数据,所述实时业务相关数据至少包括实时位置数据及实时网络流量数据;
95.数据输入单元,用于将所述实时位置数据与所述实时网络流量数据分别输入至预测模型,得到所述预测模型输出的所述目标用户设备群在目标时刻所处的目标位置,以及所述目标用户设备群在所述目标时刻的网络流量预测值;所述目标时刻用于表征以所述当前时刻为起始时间的任一时刻;
96.第三确定单元,用于基于所述目标用户设备群在目标时刻所处的目标位置,以及所述目标用户设备群在所述目标时刻的网络流量预测值,确定所述目标位置的总的网络流量预测值;
97.其中,所述预测模型,基于用户设备群中用户设备的历史位置数据及历史网络流量数据作为训练样本数据进行模型训练得到。
98.上述方案中,所述第三确定单元,具体用于:
99.基于所述目标用户设备群在所述目标时刻所处的目标位置,确定位于同一所述目标位置的目标用户设备群集合;
100.将位于同一所述目标位置的目标用户设备群集合中所有目标用户设备群的网络流量预测值进行汇总,得到对应所述目标位置的总的网络流量预测值。
101.上述方案中,所述装置还包括:
102.比较单元,用于将所述目标位置的总的网络流量预测值与所述目标位置的总网络流量阈值进行比较,得到比较结果;
103.管理单元,用于当所述比较结果表征所述目标位置的总的网络流量预测值大于所述总网络流量阈值时,对所述目标位置的网络设备进行维护与优化。
104.本发明实施例还提供一种网络流量的预测设备,包括:第一处理器和用于存储能
够在处理器上运行的计算机程序的第一存储器;
105.其中,所述第一处理器用于运行所述计算机程序时,执行上述模型训练侧任一方法的步骤。
106.本发明实施例还提供一种网络流量的预测设备,包括:第二处理器和用于存储能够在处理器上运行的计算机程序的第二存储器;
107.其中,所述第二处理器用于运行所述计算机程序时,执行上述模型应用侧任一方法的步骤。
108.本发明实施例还提供一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述模型训练侧任一方法的步骤,或者上述模型应用侧任一方法的步骤。
109.本发明实施例提供的网络流量的预测方法、装置、设备及存储介质,通过对多个用户设备的历史业务相关数据进行特征提取,得到对应各用户设备的业务相关特征,然后基于多个用户设备中每两个用户设备之间的业务相关特征的相似度,对多个用户设备进行聚类划分,得到至少两个用户设备群,并针对划分的各用户设备群分别进行位置及网络流量的预测模型训练,得到对应各用户设备群的位置与网络流量的预测模型,该预测模型用于预测目标用户设备群的目标位置及网络流量。如此,基于用户设备对网络流量变化的影响的考虑,充分挖掘不同用户设备之间的业务相关特征的相似性,借助该相似性实现用户设备群的划分,针对划分的各用户设备群分别进行位置及网络流量的关联建模,进而可以确定对应目标位置的总网络流量,能够有效提高对整个目标位置的网络流量进行预测的精度。
附图说明
110.图1为本发明实施例提供的一种网络流量的预测方法的流程示意图;
111.图2为本发明实施例提供的一种业务相关特征的相似度的组成结构示意图;
112.图3为本发明实施例提供的一种运动轨迹的示意图;
113.图4为本发明实施例提供的一种停留区域的示意图;
114.图5为本发明实施例提供的一种针对用户设备群进行位置与网络流量预测的流程示意图;
115.图6为本发明实施例提供的另一种网络流量的预测方法的流程示意图;
116.图7为本发明实施例提供的另一种网络流量的预测方法的流程示意图;
117.图8为本发明实施例提供的一种网络流量的预测装置的结构示意图;
118.图9为本发明实施例提供的另一种网络流量的预测装置的结构示意图;
119.图10为本发明实施例提供的一种网络流量的预测设备的结构示意图;
120.图11为本发明实施例提供的另一种网络流量的预测设备的结构示意图。
具体实施方式
121.为了使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,所描述的实施例不应视为对本发明的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
122.在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且本发明实施例所记载的技术方案之间,可以在不冲突的情况下相互结合。
123.下面分析相关技术提供的关于对目标位置的网络流量进行预测的方案。
124.在相关技术的一些方案中,对目标位置的网络流量进行预测时,采用基于网络或者小区自身业务量数据的分析与预测的方法,该方法主要包括:
125.1、基于传统算法模型的网络流量预测,例如采用马尔可夫(markov)模型,或者自回归滑动平均(arma,auto regressive moving average)模型来实现网络流量的预测。然而,采用markov模型进行网络流量的预测的过程中,网络流量的未来动向只跟当前的状态有关,而与过去的状态无关,无法保证预测的精准性;arma模型属于一种线性模型,随着网络流量复杂度的增加,网络流量往往是一种非平稳的混沌时间序列,此时,类似于arma模型的线性模型已无法保证预测的精准性。
126.2、基于神经网络的网络流量预测,该预测方法通过对网络或小区的历史网络流量数据进行挖掘与建模,学习出神经网络模型,然后利用得到的神经网络模型来预测下一时间粒度的网络流量。
127.3、基于时间序列的网络流量预测,包括基于传统时间序列的网络流量预测方法,例如,基于长短期记忆网络(lstm,long short-term memory)实现网络流量的预测,以及在此基础之上,考虑网络流量特性与社会因素之间的关联性,将网络流量预测分为工作日和休息日两个不同的角度进行预测的方法等。
128.然而,上述的基于网络或者小区自身业务量数据的分析与预测的几种实现方法中,都没有从用户的角度去分析移动用户的行为规律对网络流量的影响,存在网络流量的预测精度低下的问题。这是因为,网络流量的变化主要是由移动用户决定的,若不考虑移动用户的业务相关特征对网络流量的影响,将很难保证预测网络流量的精准性。
129.在相关技术的另一些方案中,对目标位置如目标小区的网络流量进行预测时,采用基于目标小区内单个用户的移动性分析来预测网络流量的方法,该方法主要是通过分析单个用户的流入、流出、驻留及业务量等数据,来判断其对目标小区的网络流量带来的影响。
130.虽然从理论上来讲,该方法可以提高网络流量的预测的精准度,但是在实际应用时仍然存在局限性:一方面是预测模型应用的局限性,由于需要对每个用户分别进行建模与分析,这样当用户的数量级别很高时,需要耗费大量的计算资源与计算时间,同时,预测模型的泛化能力差;另一方面是数据集的局限性,由于预测场景或数据集的局限性,如果单个用户的移动性数据有缺失,则无法应用该方法;又一方面,该方法没有充分考虑以及挖掘用户之间的关系对网络流量的影响,导致无法保证预测网络流量的精准性。
131.基于此,在本发明的各种实施例中,基于多个用户设备中每两个用户设备之间的业务相关特征的相似度,实现用户设备群的分析与建模,从而基于群体识别来预测目标位置的总网络流量。
132.采用本发明实施例的方案,基于用户设备对网络流量变化的影响的考虑,充分挖掘不同用户设备之间的业务相关特征的相似性,借助该相似性实现用户设备群的划分,针对划分的各用户设备群分别进行位置与网络流量的关联建模,进而可以确定对应目标位置
的总网络流量,能够有效提高对整个目标位置的网络流量进行预测的精度。
133.下面对本发明实施例提供的网络流量的预测方法的实现进行说明。
134.参见图1,图1为本发明实施例提供的一种网络流量的预测方法的流程示意图,该网络流量的预测方法可由网络流量的预测设备实施,本发明实施例的网络流量的预测设备可以实施为各种类型的终端设备,例如笔记本电脑、台式计算机等,也可以实施为网络管理服务器,例如用于网络管理的云端服务器或用于网络管理的本地服务器等。下面以网络管理服务器实施为例,结合图1示出的步骤,对本发明实施例提供的网络流量的预测方法进行说明。
135.步骤101,获取多个用户设备的历史业务相关数据。
136.这里,多个用户设备可以是接入网络的多个移动用户各自所持有的移动设备,其中,多个移动用户包括两个或两个以上的移动用户,多个用户设备包括两个或两个以上的用户设备。
137.实际应用时,移动设备可以为移动用户在实现业务需求时所使用的智能手机、平板电脑、笔记本电脑等各种类型的便携式设备。历史业务相关数据,包括在历史时间段内为实现业务需求所产生的数据,也就是说,历史业务相关数据与历史时间段内移动用户选用的业务关联。
138.在一些实施例中,网络管理服务器可通过如下方式获取多个用户设备的历史业务相关数据:获取多个用户设备发送的历史业务相关数据,该历史业务相关数据由通过调用多个用户设备的采集装置获得。
139.具体地,可以先通过调用用户设备自身的采集装置,来采集移动用户的历史业务相关数据,即采集多个用户设备的历史业务相关数据,然后将采集到的历史业务相关数据分别通过网络发送至网络管理服务器,从而网络管理服务器就可以获取到多个用户设备的历史业务相关数据。其中,网络管理服务器与多个用户设备通过网络连接,网络可以是广域网或者局域网,又或者是二者的组合,使用无线链路实现数据传输。
140.这里,实际应用时,网络管理服务器获得的历史业务相关数据可以为按照时间维度的,与移动用户选用的业务关联的数据。历史业务相关数据至少包括历史位置数据和历史业务数据。其中,历史位置数据用于表征用户设备在历史时间段内所经过的位置信息,多个用户设备的历史位置数据可构成历史位置数据列表;历史业务数据用于表征用户设备在历史时间段内所采用的业务信息,多个用户设备的历史业务数据可构成历史业务数据列表。
141.表1为历史位置数据列表,通过表1的每条信息可获知各用户设备在某历史时间段内所经过的位置信息,如表1所示,每条信息中可包括用户设备id、开始时间、结束时间、小区id、小区名、基站位置及经纬度信息(gps,可选的):
[0142][0143]
表1
[0144]
表2为历史业务数据列表,通过表2的每条信息可获知各用户设备在某历史时间段内所采用的业务类别(包括业务大类和业务小类)及相应的业务流量(包括上行流量和下行流量)等信息,如表2所示,每条信息中可包括用户设备id、开始时间、结束时间、业务大类、业务小类、业务流量及业务经纬度信息(业务gps,可选的):
[0145][0146]
表2
[0147]
步骤102,对历史业务相关数据进行特征提取,得到对应各用户设备的业务相关特征。
[0148]
这里,实际应用时,业务相关特征包括运动轨迹、停留区域及业务流量。
[0149]
具体地,运动轨迹可以用用户设备在某一历史时间段内经过的轨迹点组合而成,这里的轨迹点可通过上述表1中用户设备到达的小区id或小区名来表示;通常将停留时间大于时间阈值t
d
的地点的集合定义为用户设备的停留区域,也就是说,用户设备的停留区域中包括多个停留点,停留点可用停留时间大于时间阈值t
d
的地点来表示;这里的业务流量包括用户设备在历史时间段内为实现业务需求所产生的上行流量和下行流量。
[0150]
步骤103,基于多个用户设备中每两个用户设备之间的业务相关特征的相似度,对多个用户设备进行聚类划分,得到至少两个用户设备群。
[0151]
实际应用时,网络管理服务器还需要确定多个用户设备中每两个用户设备之间的业务相关特征的相似度。
[0152]
基于此,在一些实施例中,在网络管理服务器执行步骤103之前,该方法还包括:基于各用户设备的业务相关特征,确定多个用户设备中每两个用户设备之间的业务相关特征的相似度。
[0153]
这里,实际应用时,基于各用户设备的业务相关特征,确定多个用户设备中每两个
用户设备之间的业务相关特征的相似度,可通过如下方式实现:
[0154]
在业务相关特征包括运动轨迹、停留区域及业务流量的情况下,分别确定多个用户设备中每两个用户设备之间的运动轨迹相似度,以及
[0155]
确定多个用户设备中每两个用户设备之间的停留区域相似度,以及
[0156]
确定多个用户设备中每两个用户设备之间的业务流量相似度。
[0157]
参见图2,图2为本发明实施例提供的一种业务相关特征的相似度的组成结构示意图,本发明实施例中业务相关特征的相似度包括运动轨迹相似度、停留区域相似度及业务流量相似度。
[0158]
具体地,网络管理服务器可基于两两用户设备之间的运动轨迹,来确定多个用户设备中两两用户设备之间的运动轨迹相似度;基于两两用户设备之间的停留区域,来确定多个用户设备中两两用户设备之间的停留区域相似度;基于两两用户设备之间的业务流量,来确定多个用户设备中两两用户设备之间的业务流量相似度。
[0159]
下面分别对运动轨迹相似度、停留区域相似度及业务流量相似度的确定方式进行说明。
[0160]
在一些实施例中,确定多个用户设备中每两个用户设备之间的运动轨迹相似度,包括:
[0161]
获取同一时段内两个用户设备中第一用户设备对应的第一运动轨迹,以及第二用户设备对应的第二运动轨迹;
[0162]
确定第一运动轨迹与第二运动轨迹中对应编号的轨迹点之间的距离;
[0163]
基于第一运动轨迹与第二运动轨迹中对应编号的轨迹点之间的距离的求和,确定两个用户设备之间的运动轨迹相似度。
[0164]
这里,实际应用时,对应编号的轨迹点之间的距离可以为欧式距离,在确定出第一运动轨迹与第二运动轨迹中对应编号的轨迹点之间的欧式距离后,将这些欧式距离进行求和以得到求和距离,并将该求和距离的倒数确定为两个用户设备之间的运动轨迹相似度。
[0165]
举例来说,参见图3,图3为本发明实施例提供的一种运动轨迹的示意图,图3中包括两条运动轨迹,分别为用户设备a的第一运动轨迹及用户设备b的第二运动轨迹,用户设备a和用户设备b在某一时间段内的运动轨迹可以用网络节点表示,用户设备a对应的第一运动轨迹可表示为集合la={la1,la2,...,la
n
},用户设备b对应的第二运动轨迹可表示为集合lb={lb1,lb2,...,lb
n
},其中,n表示轨迹点的数量,la
n
表示用户设备a经过的轨迹点,lb
n
表示用户设备b经过的轨迹点。
[0166]
实际应用时,可通过如下公式确定用户设备a与用户设备b之间的运动轨迹相似度:
[0167][0168]
其中,sim(la,lb)表示用户设备a与用户设备b之间的运动轨迹相似度;d(la
i
,lb
i
)表示第一运动轨迹与第二运动轨迹中对应编号的轨迹点之间的距离,具体可以为欧式距离。通过计算用户设备a的第一运动轨迹与用户设备b的第二运动轨迹中对应编号的轨迹点之间的欧式距离后,将得到的所有欧式距离进行求和,以得到求和距离,并将该求和距离的
倒数确定为用户设备a与用户设备b之间的运动轨迹相似度。
[0169]
在一些实施例中,确定多个用户设备中每两个用户设备之间的停留区域相似度,包括:
[0170]
获取同一时段内两个用户设备中第一用户设备对应的第一停留区域,以及第二用户设备对应的第二停留区域;
[0171]
确定第一停留区域与第二停留区域的交集区域内停留点的数量;
[0172]
确定第一停留区域与第二停留区域中总停留点的数量;
[0173]
基于交集区域内停留点的数量与总停留点的数量的比值,确定两个用户设备之间的停留区域相似度。
[0174]
举例来说,用户设备a和用户设备b在某一时间段内的停留区域可以用以下集合表示,用户设备a对应的第一停留区域可表示为集合ta={ta1,ta2,...,ta
p
},用户设备b对应的第二停留区域可表示为集合tb={tb1,tb2,...,tb
q
},其中,p表示用户设备a在第一停留区域的停留点数量;q表示用户设备b在第二停留区域的停留点数量;ta
p
表示用户设备a在第一停留区域的停留点;tb
q
表示用户设备b在第二停留区域的停留点。
[0175]
参见图4,图4为本发明实施例提供的一种停留区域的示意图,图4中包括两个停留区域,分别为用户设备a对应的第一停留区域ta,以及用户设备b对应的第二停留区域tb,实际应用时,可通过如下公式确定用户设备a与用户设备b之间的停留区域相似度:
[0176][0177]
其中,sim(ta,tb)表示用户设备a与用户设备b之间的停留区域相似度;ta表示用户设备a对应的第一停留区域;tb表示用户设备b对应的第二停留区域。
[0178]
在实际应用时,先确定用户设备a对应的第一停留区域ta与用户设备b对应的第二停留区域tb的交集区域内停留点的数量,以及第一停留区域ta与第二停留区域tb中总停留点的数量,然后基于交集区域内停留点的数量与总停留点的数量的比值,就可以确定用户设备a与用户设备b之间的停留区域相似度。
[0179]
在一些实施例中,确定多个用户设备中每两个用户设备之间的业务流量相似度,包括:
[0180]
获取同一时段内两个用户设备中第一用户设备对应的第一业务类别,以及第二用户设备对应的第二业务类别;
[0181]
确定与第一业务类别对应的第一业务流量,以及与第二业务类别对应的第二业务流量;
[0182]
基于第一业务流量与第二业务流量之间的差异值,确定两个用户设备之间的业务流量相似度。
[0183]
这里,实际应用时,当确定第一业务流量及第二业务流量后,可以先确定各业务类别对应的业务流量的差异值,然后将这些差异值进行求和得到总差异值,并将总差异值的倒数确定为两个用户设备之间的业务流量相似度。
[0184]
举例来说,用户设备a和用户设备b在某一时间段内选取的业务类别可以用以下集合表示,用户设备a对应的第一业务类别可表示为集合sa={sa1,sa2,...,sa
k
},用户设备b对应的第二业务类别可表示为集合sb={sb1,sb2,...,sb
k
},第一业务类别对应的第一业务
流量可表示为集合fa={fa1,fa2,...,fa
k
},第二业务类别对应的第二业务流量可表示为集合fb={fb1,fb2,...,fb
k
},其中,fa
k
为业务类别sa
k
对应的业务流量,fb
k
为业务类别sb
k
对应的业务流量。
[0185]
实际应用时,可通过如下公式确定用户设备a与用户设备b之间的业务流量相似度:
[0186][0187]
其中,sim(fa,fb)表示用户设备a与用户设备b之间的业务流量相似度,用于衡量用户设备a与用户设备b之间使用业务流量的差异;fa
i
表示用户设备a采用的业务流量;fb
i
表示用户设备b采用的业务流量。
[0188]
表3为用户设备a的历史业务数据列表,如下所示:
[0189][0190][0191]
表3
[0192]
表4为用户设备b的历史业务数据列表,如下所示:
[0193]
开始时间结束时间业务小类业务流量2017-05-25-07202017-05-25-0721微信10k2017-05-25-07252017-05-25-0726墨迹天气4k2017-05-25-07302017-05-25-0731微信6k2017-05-25-07352017-05-25-0736新浪微博10k2017-05-25-07402017-05-25-0741淘宝20k
[0194]
表4
[0195]
通过上述表3和表4的数据显示可知,用户设备a的第一业务流量可表示为集合fa={10,5,8,10,15},用户设备b的第二业务流量可表示为集合fb={10,4,6,10,20},则即可确定用户设备a与用户设备b之间的业务流量相似度为1/8。
[0196]
需要说明的是,实际应用时,运动轨迹相似度、停留区域相似度及业务流量相似度也可采用其他形式的公式分别进行计算,并不仅限于上述计算公式,本发明实施例对此不作限定。
[0197]
实际应用时,由于特征提取到的业务相关特征具有高维度、复杂性以及稀疏性的特点,例如运动轨迹具有很高的维度,业务流量具有较复杂的属性,如果直接应用聚类算法
对多个用户设备进行聚类划分,则将耗费巨大的计算资源与计算时间,同时,冗余的数据也会严重影响聚类的效果,从而降低聚类的精准度。
[0198]
基于此,在一些实施例中,网络管理服务器可先确定多个用户设备中每两个用户设备之间的业务相关特征的相似度,然后基于多个用户设备中每两个用户设备之间的业务相关特征的相似度,即多个用户设备中每两个用户设备之间的运动轨迹相似度、停留区域相似度及业务流量相似度,对多个用户设备进行聚类划分,以实现不同用户设备群的划分。上述这种综合多种业务相关特征的相似度实现用户设备群的划分的方法,不仅有利于降低数据维度,减少计算量,从而节省计算资源与计算时间,还能够提高聚类的精准度,以解决高维度、复杂数据类型的聚类问题。
[0199]
在一些实施例中,基于多个用户设备中每两个用户设备之间的业务相关特征的相似度,对多个用户设备进行聚类划分,得到至少两个用户设备群,包括:
[0200]
基于多个用户设备中每两个用户设备之间的业务相关特征的相似度,确定多个用户设备中每两个用户设备之间的时空分布相似度;
[0201]
基于多个用户设备中每两个用户设备之间的时空分布相似度的矩阵表示,构建相似性矩阵;
[0202]
基于相似性矩阵建立图模型,并基于图模型中超边的权重大小,对多个用户设备进行聚类划分,得到至少两个用户设备群。
[0203]
这里,在业务相关特征包括运动轨迹、停留区域及业务流量的情况下,可基于多个用户设备中每两个用户设备之间的运动轨迹相似度、停留区域相似度及业务流量相似度的平方,来确定多个用户设备中每两个用户设备之间的时空分布相似度。在本发明实施例中,时空分布相似度用来表示多个用户设备中每两个用户设备分别在时间和空间上的相似度。
[0204]
仍以上述用户设备a和用户设备b为例,两个用户设备之间的运动轨迹相似度为sim(la,lb),两个用户设备之间的停留区域相似度为sim(ta,tb),两个用户设备之间的业务流量相似度为sim(fa,fb),实际应用时,在确定出上述sim(la,lb)、sim(ta,tb)及sim(fa,fb)之后,可通过如下公式确定用户设备a与用户设备b之间的时空分布相似度:
[0205][0206]
其中,sim(a,b)表示用户设备a与用户设备b之间的时空分布相似度,也可表示为sim
ab
。通过计算运动轨迹相似度、停留区域相似度及业务流量相似度的平方和,然后将平方和对应的值开根号,即可确定出用户设备a与用户设备b之间的时空分布相似度。
[0207]
这里,实际应用时,通过上述公式确定出两两用户设备之间的时空分布相似度后,可基于所有不同用户设备之间的时空分布相似度构建相似性矩阵,相似性矩阵可表示为sim,相似性矩阵的表现形式为:
[0208][0209]
其中,sim
mn
表示用户设备m与用户设备n之间的时空分布相似度。
[0210]
实际应用时,为了减少后续网络管理服务器处理的计算量负担,可将相似性矩阵进行归一化处理,即将相似性矩阵归一化到0至1的范围内,以得到归一化后的相似性矩阵。
[0211]
基于此,在一些实施例中,该方法还包括:将相似性矩阵进行归一化处理,得到归一化后的相似性矩阵。相应地,基于相似性矩阵建立图模型,包括:将归一化后的相似性矩阵进行图转换,得到图模型。
[0212]
这里,基于相似性矩阵建立图模型,然后通过对图模型进行分割实现对多个用户设备的聚类划分,能够有效处理高维数据和复杂属性的数据。实际应用时,将高维空间的相似性矩阵的关系转化为图模型,利用图模型中超边的权重来描述空间点之间的关系,然后基于图模型的分割算法,将权重大的超边中包含的空间点尽量放在一个类中,从而利用图模型的分割来实现多个用户设备的聚类划分过程,最终得到至少两个用户设备群。
[0213]
步骤104,将各用户设备群中用户设备的历史位置数据及历史网络流量数据作为训练样本数据,对相应的用户设备群分别进行位置及网络流量的预测模型训练,得到对应各用户设备群的位置与网络流量的预测模型;该预测模型用于预测目标用户设备群的目标位置及网络流量,目标位置及网络流量用于供确定对应目标位置的总的网络流量预测值。
[0214]
这里,历史位置数据及历史网络流量数据均与历史业务相关数据关联,具体地,历史业务相关数据中包括历史网络流量数据及历史位置数据。
[0215]
实际应用时,该位置与网络流量的预测模型为一个联合预测模型,既可以预测目标用户设备群在目标时刻的目标位置,还可以预测目标用户设备群在目标时刻的网络流量。这里,可以基于深度学习方法构建该位置与网络流量的预测模型,比如可以是随机森林模型、深层神经网络模型等。
[0216]
这里,可以将用户设备群中用户设备的带有标注的历史位置数据,以及用户设备群中用户设备的带有标注的历史网络流量数据作为训练样本数据,对各用户设备群分别进行位置与网络流量的预测模型训练,即对各用户设备群分别进行位置与网络流量的关联建模,以得到对应用户设备群的位置与网络流量的预测模型。实际应用时,可基于预设的周期对该位置与网络流量的预测模型的模型参数进行更新。
[0217]
实际应用时,该位置与网络流量的预测模型还可以替换为两个预测模型,即位置预测模型和流量预测模型,具体地,将各用户设备群中用户设备的历史位置数据及历史网络流量数据作为训练样本数据,对相应的用户设备群分别进行位置及网络流量的预测模型训练,得到对应各用户设备群的位置预测模型与流量预测模型;位置预测模型用于预测目标用户设备群的目标位置,流量预测模型用于预测目标用户设备群的网络流量。
[0218]
在一些实施例中,将各用户设备群中用户设备的历史位置数据及历史网络流量数据作为训练样本数据,对相应的用户设备群分别进行位置及网络流量的预测模型训练,得到对应各用户设备群的位置预测模型与流量预测模型,包括:
[0219]
将各用户设备群中用户设备的带有标注的历史位置数据作为第一训练样本数据,对各用户设备群分别进行位置的预测模型训练,以得到对应各用户设备群的位置预测模型;
[0220]
将各用户设备群中用户设备的带有标注的历史网络流量数据作为第二训练样本数据,对各用户设备群分别进行网络流量的预测模型训练,以得到对应各用户设备群的流量预测模型。
[0221]
具体来说,在进行网络流量的预测模型训练过程中,将用户设备群中用户设备的带有标注的历史网络流量数据作为第二训练样本数据,输入至流量预测模型,得到流量预
测模型输出的对应第二训练样本数据的预测网络流量;基于输出的预测网络流量及历史网络流量数据,确定流量预测模型的损失函数的值;基于损失函数的值更新流量预测模型的模型参数。
[0222]
实际应用时,可以基于深度学习方法预先构建流量预测模型,比如随机森林模型、深层神经网络模型,流量预测模型包括输入层、隐藏层及输出层,用于预测目标用户设备群的网络流量,在流量预测模型构建完成后,基于采集的第二训练样本数据对该流量预测模型进行训练,以得到优化的流量预测模型参数。
[0223]
在对模型进行训练之前,可以将采集的大量样本按照一定的比例划分为训练集和测试集,将训练集中的用户设备群中用户设备的带有标注的历史网络流量作为第一训练样本数据,输入至流量预测模型中,以得到流量预测模型输出的预测到的目标用户设备群的网络流量。进一步地,模型训练的过程即是对模型中各参数的更新调整过程,将第二训练样本数据输入至流量预测模型的输入层,经过隐藏层,最后达到输出层并输出结果,由于流量预测模型的输出结果与实际结果可能有误差,则需要计算输出结果与实际值之间的误差,并将误差从输出层向隐藏层进行反向传播,直至传播到输入层,进而在反向传播的过程中,根据误差调整模型参数的值;整个训练过程不断迭代上述步骤,直至收敛,以减小模型输出的误差。
[0224]
基于此,实际应用时,为了降低流量预测模型输出的预测网络流量与历史网络流量之间可能存在的误差,引入了损失函数,基于流量预测模型输出的预测网络流量及历史网络流量,确定损失函数的值;基于损失函数的值,运用反向传播算法逐层更新流量预测模型的参数,直至损失函数收敛,以实现对流量预测模型的参数的约束和调整,从而得到计算精度高的流量预测模型,以基于该流量预测模型确定目标时刻时目标用户设备群的网络流量。
[0225]
需要说明的是,位置预测模型的训练过程与上述的流量预测模型的训练过程类似,这里不再赘述。
[0226]
在一些实施例中,该方法还包括:
[0227]
获取目标用户设备群在当前时刻的实时业务相关数据,实时业务相关数据至少包括实时位置数据及实时网络流量数据;
[0228]
将实时位置数据与实时网络流量数据分别输入至位置与网络流量的预测模型,得到该预测模型输出的目标用户设备群在目标时刻所处的目标位置,以及目标用户设备群在目标时刻的网络流量预测值;目标时刻用于表征以当前时刻为起始时间的任一时刻。
[0229]
参见图5,图5为本发明实施例提供的一种针对用户设备群进行位置与网络流量预测的流程示意图,以预测模型为联合预测模型,即为位置与网络流量的预测模型为例进行说明,针对每一个用户设备群,以该用户设备群中用户设备的历史时间-位置数据,以及该用户设备群中用户设备的历史时间-流量数据作为训练样本数据,对各用户设备群进行位置与网络流量的预测模型训练,得到对应各用户设备群的位置与网络流量的预测模型,然后将实时时间-位置数据及实时时间-流量数据输入至该位置与网络流量的预测模型,以预测目标用户设备群中用户设备在目标时刻的平均位置,以及目标用户设备群中用户设备在目标时刻的平均网络流量。这里在对该位置与网络流量的预测模型进行训练的过程中,可采用用户设备群中的部分用户设备的历史业务相关数据作为训练样本,这样如果缺失了用
户设备群中的某些用户设备的历史业务相关数据,本方案依旧适用,可实现性强,如此,降低了对数据集的要求,解决了因数据集中数据量少或数据缺失而影响模型训练的效果的问题。
[0230]
实际应用时,假设目标用户设备群中所包括的用户设备的数量为n
c
,预测出的目标用户设备群中用户设备在目标时刻的平均位置为l
next
,各用户设备在目标时刻的平均网络流量为f
next
,则该目标用户设备群在目标时刻的目标位置为l
next
=l
next
,目标用户设备群在目标时刻的网络流量为f
next
=f
next
*n
c

[0231]
实际应用时,可基于预设的周期对位置预测模型的模型参数及流量预测模型的模型参数进行更新。
[0232]
在一些实施例中,该方法还包括:
[0233]
基于目标用户设备群在目标时刻所处的目标位置,确定位于同一目标位置的目标用户设备群集合;
[0234]
将位于同一目标位置的目标用户设备群集合中所有目标用户设备群的网络流量预测值进行汇总,得到对应目标位置的总的网络流量预测值。
[0235]
这里,目标用户设备群的目标位置可以为目标小区,例如,表5为基于位置与网络流量的预测模型得到的目标用户设备群在目标时刻的目标位置以及网络流量,如表5所示:
[0236]
目标用户设备群标识目标位置网络流量1小区1100k2小区148k
………
s小区3250k
[0237]
表5
[0238]
实际应用时,将预测到的出现在同一目标小区,如小区1的所有目标用户设备群的网络流量预测值进行求和汇总,即可得到对应该目标小区的总的网络流量预测值。同样,本发明实施例的网络管理服务器还可以基于各目标小区的总的网络流量预测值,确定包括各目标小区的目标区域所对应的总的网络流量预测值。
[0239]
实际应用时,当预测到目标位置的总的网络流量预测值超出总网络流量阈值时,表明该目标位置的未来网络负载状况不是很好,需要预先对该目标位置的网络设备进行调整,以保证网络安全及网络用户的感知。
[0240]
基于此,在一些实施例中,该方法还包括:将目标位置的总的网络流量预测值与目标位置的总网络流量阈值进行比较,得到比较结果;当比较结果表征目标位置的总的网络流量预测值大于总网络流量阈值时,对目标位置的网络设备进行维护与优化。
[0241]
对应地,本发明实施例还提供了另一种网络流量的预测方法,该网络流量的预测方法为针对上述位置与网络流量的预测模型的应用提出的一个实施例。
[0242]
参见图6,图6为本发明实施例提供的另一种网络流量的预测方法的流程示意图,该网络流量的预测方法可由网络流量的预测设备实施,本发明实施例的网络流量的预测设备可以实施为各种类型的终端设备,例如笔记本电脑、台式计算机等,也可以实施为网络管理服务器,例如用于网络管理的云端服务器或用于网络管理的本地服务器等。下面以网络管理服务器实施为例,结合图6示出的步骤,对本发明实施例提供的网络流量的预测方法进
行说明。对于下文各步骤的说明中未尽的细节,可以参考上文而理解。
[0243]
步骤601,获取目标用户设备群在当前时刻的实时业务相关数据,实时业务相关数据至少包括实时位置数据及实时网络流量数据。
[0244]
步骤602,将实时位置数据与实时网络流量数据分别输入至位置与网络流量的预测模型,得到该预测模型输出的目标用户设备群在目标时刻所处的目标位置,以及目标用户设备群在目标时刻的网络流量预测值。
[0245]
这里,目标时刻用于表征以当前时刻为起始时间的任一时刻。
[0246]
实际应用时,位置与网络流量的预测模型,基于用户设备群中用户设备的历史位置数据及历史网络流量数据作为训练样本数据进行模型训练得到,
[0247]
具体地,网络管理服务器可通过如下方式训练得到位置与网络流量的预测模型:将各用户设备群中用户设备的历史位置数据及历史网络流量数据作为训练样本数据,对相应的用户设备群分别进行位置及网络流量的预测模型训练,得到对应各用户设备群的位置与网络流量的预测模型。用户设备群可基于多个用户设备中每两个用户设备之间的业务相关特征的相似度进行聚类划分。
[0248]
这里,历史位置数据及历史网络流量数据均与历史业务相关数据关联,具体地,历史业务相关数据中包括历史位置数据及历史网络流量数据。该位置与网络流量的预测模型用于预测目标用户设备群的目标位置及网络流量。
[0249]
步骤603,基于目标用户设备群在目标时刻所处的目标位置,以及目标用户设备群在目标时刻的网络流量预测值,确定目标位置的总的网络流量预测值。
[0250]
在一些实施例中,基于目标用户设备群在目标时刻所处的目标位置,以及目标用户设备群在目标时刻的网络流量预测值,确定目标位置的总的网络流量预测值,包括:
[0251]
基于目标用户设备群在目标时刻所处的目标位置,确定位于同一目标位置的目标用户设备群集合;
[0252]
将位于同一目标位置的目标用户设备群集合中所有目标用户设备群的网络流量预测值进行汇总,得到对应目标位置的总的网络流量预测值。
[0253]
这里,目标用户设备群的目标位置可以为目标小区。实际应用时,将预测到的出现在同一目标小区,如上述表5中的小区1的所有目标用户设备群的网络流量预测值进行求和汇总,即可得到对应该目标小区的总的网络流量预测值。同样,本发明实施例的网络管理服务器还可以基于各目标小区的总的网络流量预测值,确定包括各目标小区的目标区域所对应的总的网络流量预测值。
[0254]
实际应用时,当预测到目标位置的总的网络流量预测值超出总网络流量阈值时,表明该目标位置的未来网络负载状况不是很好,需要预先对该目标位置的网络设备进行调整,以保证网络安全及网络用户的感知。
[0255]
基于此,在一些实施例中,该方法还包括:将目标位置的总的网络流量预测值与目标位置的总网络流量阈值进行比较,得到比较结果;当比较结果表征目标位置的总的网络流量预测值大于总网络流量阈值时,对目标位置的网络设备进行维护与优化。
[0256]
下面结合应用实施例对本发明再作进一步详细的描述。
[0257]
参见图7,图7为本发明实施例提供的另一种网络流量的预测方法的流程示意图,该网络流量的预测方法包括离线训练和在线预测两个部分,离线训练部分主要是利用多个
用户设备的历史业务相关数据进行用户设备群的识别与划分,并且针对各用户设备群构建其对应的位置与网络流量的预测模型;在线预测部分主要是将当前时刻的实时业务相关数据输入至训练完成的位置与网络流量的预测模型中,以预测出目标用户设备群在目标时刻所处的目标小区,以及目标用户设备群在目标时刻的网络流量。
[0258]
具体地,在离线训练过程中,通过对获取到的多个用户设备的历史业务相关数据进行特征提取,得到对应各用户设备的业务相关特征,这里的业务相关特征包括运动轨迹、停留区域及业务流量,然后确定多个用户设备中每两个用户设备之间的业务相关特征的相似度,即分别确定多个用户设备中每两个用户设备之间的运动轨迹相似度,以及确定多个用户设备中每两个用户设备之间的停留区域相似度,以及确定多个用户设备中每两个用户设备之间的业务流量相似度,接下来依据业务相关特征的相似度对多个用户设备进行聚类,得到划分的不同的用户设备群;接下来,对各用户设备群进行位置与网络流量的关联建模,得到对应各用户设备群的位置与网络流量的预测模型。
[0259]
在在线预测过程中,先获取目标用户设备群在当前时刻的实时业务相关数据,该实时业务相关数据至少包括实时位置数据及实时网络流量数据,将实时位置数据及实时网络流量数据分别输入至位置与网络流量的预测模型,得到目标用户设备群在目标时刻所处的目标位置,即目标用户设备群在目标时刻所处的目标小区,以及得到目标用户设备群在目标时刻的网络流量;接下来,汇总同一目标小区的目标用户设备群集合的所有网络流量,从而得到该目标小区对应的总的网络流量预测值,并将该目标小区对应的总的网络流量预测值进行输出,以基于该目标小区对应的总的网络流量预测值对目标小区的网络设备进行管理。
[0260]
为了实现本发明实施例模型训练侧的方法,本发明实施例还提供了一种网络流量的预测装置,参见图8,图8为本发明实施例提供的一种网络流量的预测装置的结构示意图,该装置包括:
[0261]
第一获取单元81,用于获取多个用户设备的历史业务相关数据;
[0262]
特征提取单元82,用于对所述历史业务相关数据进行特征提取,得到对应各所述用户设备的业务相关特征;
[0263]
聚类划分单元83,用于基于所述多个用户设备中每两个用户设备之间的业务相关特征的相似度,对所述多个用户设备进行聚类划分,得到至少两个用户设备群;
[0264]
模型训练单元84,用于将各用户设备群中用户设备的历史位置数据及历史网络流量数据作为训练样本数据,对相应的所述用户设备群分别进行位置及网络流量的预测模型训练,得到对应各所述用户设备群的位置与网络流量的预测模型;
[0265]
其中,所述预测模型用于预测目标用户设备群的目标位置及网络流量,所述目标位置及网络流量用于供确定对应所述目标位置的总的网络流量预测值。
[0266]
在一些实施例中,该装置还包括:
[0267]
第一确定单元,用于基于各所述用户设备的业务相关特征,确定所述多个用户设备中每两个用户设备之间的业务相关特征的相似度。
[0268]
在一些实施例中,所述第一确定单元,具体用于:
[0269]
在所述业务相关特征包括运动轨迹、停留区域及业务流量的情况下,分别确定所述多个用户设备中每两个用户设备之间的运动轨迹相似度,以及
[0270]
确定所述多个用户设备中每两个用户设备之间的停留区域相似度,以及
[0271]
确定所述多个用户设备中每两个用户设备之间的业务流量相似度。
[0272]
在一些实施例中,所述第一确定单元,具体用于:
[0273]
获取同一时段内两个用户设备中第一用户设备对应的第一运动轨迹,以及第二用户设备对应的第二运动轨迹;
[0274]
确定所述第一运动轨迹与所述第二运动轨迹中对应编号的轨迹点之间的距离;
[0275]
基于所述第一运动轨迹与所述第二运动轨迹中对应编号的轨迹点之间的距离的求和,确定所述两个用户设备之间的运动轨迹相似度。
[0276]
在一些实施例中,所述第一确定单元,具体用于:
[0277]
获取同一时段内两个用户设备中第一用户设备对应的第一停留区域,以及第二用户设备对应的第二停留区域;
[0278]
确定所述第一停留区域与所述第二停留区域的交集区域内停留点的数量;
[0279]
确定所述第一停留区域与所述第二停留区域中总停留点的数量;
[0280]
基于所述交集区域内停留点的数量与所述总停留点的数量的比值,确定所述两个用户设备之间的停留区域相似度。
[0281]
在一些实施例中,所述第一确定单元,具体用于:
[0282]
获取同一时段内两个用户设备中第一用户设备对应的第一业务类别,以及第二用户设备对应的第二业务类别;
[0283]
确定与所述第一业务类别对应的第一业务流量,以及与所述第二业务类别对应的第二业务流量;
[0284]
基于所述第一业务流量与所述第二业务流量之间的差异值,确定所述两个用户设备之间的业务流量相似度。
[0285]
在一些实施例中,所述聚类划分单元,具体用于:
[0286]
基于所述多个用户设备中每两个用户设备之间的业务相关特征的相似度,确定所述多个用户设备中每两个用户设备之间的时空分布相似度;
[0287]
基于所述多个用户设备中每两个用户设备之间的时空分布相似度的矩阵表示,构建相似性矩阵;
[0288]
基于所述相似性矩阵建立图模型,并基于所述图模型中超边的权重大小,对所述多个用户设备进行聚类划分,得到至少两个用户设备群。
[0289]
在一些实施例中,该装置还包括:归一化单元,用于将所述相似性矩阵进行归一化处理,得到归一化后的相似性矩阵;
[0290]
所述聚类划分单元,具体用于:
[0291]
将所述归一化后的相似性矩阵进行图转换,得到所述图模型。
[0292]
在一些实施例中,该装置还包括:
[0293]
第二获取单元,用于获取所述目标用户设备群在当前时刻的实时业务相关数据,所述实时业务相关数据至少包括实时位置数据及实时网络流量数据;
[0294]
数据输入单元,用于将所述实时位置数据与所述实时网络流量数据分别输入至所述预测模型,得到所述预测模型输出的所述目标用户设备群在目标时刻所处的目标位置,以及所述目标用户设备群在所述目标时刻的网络流量预测值;所述目标时刻用于表征以所
述当前时刻为起始时间的任一时刻。
[0295]
在一些实施例中,该装置还包括:
[0296]
第二确定单元,用于基于所述目标用户设备群在所述目标时刻所处的目标位置,确定位于同一所述目标位置的目标用户设备群集合;
[0297]
汇总单元,用于将位于同一所述目标位置的目标用户设备群集合中所有目标用户设备群的网络流量预测值进行汇总,得到对应所述目标位置的总的网络流量预测值。
[0298]
实际应用时,第一获取单元81可由网络流量的预测装置中的通信接口实现;特征提取单元82、聚类划分单元83及模型训练单元84可由网络流量的预测装置中的处理器结合通信接口实现。
[0299]
为了实现本发明实施例模型应用侧的方法,本发明实施例还提供了另一种网络流量的预测装置,参见图9,图9为本发明实施例提供的另一种网络流量的预测装置的结构示意图,该装置包括:
[0300]
第二获取单元91,用于获取目标用户设备群在当前时刻的实时业务相关数据,所述实时业务相关数据至少包括实时位置数据及实时网络流量数据;
[0301]
数据输入单元92,用于将所述实时位置数据与所述实时网络流量数据分别输入至预测模型,得到所述预测模型输出的所述目标用户设备群在目标时刻所处的目标位置,以及所述目标用户设备群在所述目标时刻的网络流量预测值;所述目标时刻用于表征以所述当前时刻为起始时间的任一时刻;
[0302]
第三确定单元93,用于基于所述目标用户设备群在目标时刻所处的目标位置,以及所述目标用户设备群在所述目标时刻的网络流量预测值,确定所述目标位置的总的网络流量预测值;
[0303]
其中,所述预测模型,基于用户设备群中用户设备的历史位置数据及历史网络流量数据作为训练样本数据进行模型训练得到。
[0304]
在一些实施例中,所述第三确定单元,具体用于:
[0305]
基于所述目标用户设备群在所述目标时刻所处的目标位置,确定位于同一所述目标位置的目标用户设备群集合;
[0306]
将位于同一所述目标位置的目标用户设备群集合中所有目标用户设备群的网络流量预测值进行汇总,得到对应所述目标位置的总的网络流量预测值。
[0307]
在一些实施例中,该装置还包括:
[0308]
比较单元,用于将所述目标位置的总的网络流量预测值与所述目标位置的总网络流量阈值进行比较,得到比较结果;
[0309]
管理单元,用于当所述比较结果表征所述目标位置的总的网络流量预测值大于所述总网络流量阈值时,对所述目标位置的网络设备进行维护与优化。
[0310]
实际应用时,第二获取单元91可由网络流量的预测装置中的通信接口实现;数据输入单元92和第三确定单元93可由网络流量的预测装置中的通信接口结合处理器实现。
[0311]
需要说明的是,上述实施例提供的网络流量的预测装置在进行网络流量预测时,仅以上述各程序模块的划分进行举例说明,实际应用中,可以根据需要而将上述处理分配由不同的程序模块完成,即将装置的内部结构划分成不同的程序模块,以完成以上描述的全部或者部分处理。另外,上述实施例提供的网络流量的预测装置与网络流量的预测方法
实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
[0312]
基于上述程序模块的硬件实现,且为了实现本发明实施例模型训练侧的方法,本发明实施例还提供了一种网络流量的预测设备,参见图10,图10为本发明实施例提供的一种网络流量的预测设备的结构示意图,该网络流量的预测设备1000包括:
[0313]
第一通信接口1001,用于获取多个用户设备的历史业务相关数据;
[0314]
第一处理器1002,与第一通信接口1001连接,用于运行计算机程序时,执行上述模型训练侧一个或多个技术方案提供的方法。而所述计算机程序存储在第一存储器1003上。
[0315]
具体地,第一处理器1002,用于对所述历史业务相关数据进行特征提取,得到对应各所述用户设备的业务相关特征;基于所述多个用户设备中每两个用户设备之间的业务相关特征的相似度,对所述多个用户设备进行聚类划分,得到至少两个用户设备群;将各用户设备群中用户设备的历史位置数据及历史网络流量数据作为训练样本数据,对相应的所述用户设备群分别进行位置及网络流量的预测模型训练,得到对应各所述用户设备群的位置与网络流量的预测模型;其中,所述预测模型用于预测目标用户设备群的目标位置及网络流量,所述目标位置及网络流量用于供确定对应所述目标位置的总的网络流量预测值。
[0316]
在一些实施例中,第一处理器1002,还用于基于各所述用户设备的业务相关特征,确定所述多个用户设备中每两个用户设备之间的业务相关特征的相似度。
[0317]
在一些实施例中,第一处理器1002,具体用于:
[0318]
在所述业务相关特征包括运动轨迹、停留区域及业务流量的情况下,分别确定所述多个用户设备中每两个用户设备之间的运动轨迹相似度,以及
[0319]
确定所述多个用户设备中每两个用户设备之间的停留区域相似度,以及
[0320]
确定所述多个用户设备中每两个用户设备之间的业务流量相似度。
[0321]
在一些实施例中,第一处理器1002,具体用于:
[0322]
获取同一时段内两个用户设备中第一用户设备对应的第一运动轨迹,以及第二用户设备对应的第二运动轨迹;
[0323]
确定所述第一运动轨迹与所述第二运动轨迹中对应编号的轨迹点之间的距离;
[0324]
基于所述第一运动轨迹与所述第二运动轨迹中对应编号的轨迹点之间的距离的求和,确定所述两个用户设备之间的运动轨迹相似度。
[0325]
在一些实施例中,第一处理器1002,具体用于:
[0326]
获取同一时段内两个用户设备中第一用户设备对应的第一停留区域,以及第二用户设备对应的第二停留区域;
[0327]
确定所述第一停留区域与所述第二停留区域的交集区域内停留点的数量;
[0328]
确定所述第一停留区域与所述第二停留区域中总停留点的数量;
[0329]
基于所述交集区域内停留点的数量与所述总停留点的数量的比值,确定所述两个用户设备之间的停留区域相似度。
[0330]
在一些实施例中,第一处理器1002,具体用于:
[0331]
获取同一时段内两个用户设备中第一用户设备对应的第一业务类别,以及第二用户设备对应的第二业务类别;
[0332]
确定与所述第一业务类别对应的第一业务流量,以及与所述第二业务类别对应的第二业务流量;
[0333]
基于所述第一业务流量与所述第二业务流量之间的差异值,确定所述两个用户设备之间的业务流量相似度。
[0334]
在一些实施例中,第一处理器1002,具体用于:
[0335]
基于所述多个用户设备中每两个用户设备之间的业务相关特征的相似度,确定所述多个用户设备中每两个用户设备之间的时空分布相似度;
[0336]
基于所述多个用户设备中每两个用户设备之间的时空分布相似度的矩阵表示,构建相似性矩阵;
[0337]
基于所述相似性矩阵建立图模型,并基于所述图模型中超边的权重大小,对所述多个用户设备进行聚类划分,得到至少两个用户设备群。
[0338]
在一些实施例中,第一处理器1002,还用于:将所述相似性矩阵进行归一化处理,得到归一化后的相似性矩阵;
[0339]
相应地,第一处理器1002,具体用于:将所述归一化后的相似性矩阵进行图转换,得到所述图模型。
[0340]
需要说明的是,第一通信接口1001和第一处理器1002的具体处理过程详见方法实施例,这里不再赘述。
[0341]
当然,实际应用时,网络流量的预测设备1000中的各个组件通过总线系统1004耦合在一起。可理解,总线系统1004用于实现这些组件之间的连接通信。总线系统1004除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图10中将各种总线都标为总线系统1004。
[0342]
本发明实施例中的第一存储器1003用于存储各种类型的数据以支持网络流量的预测设备1000的操作。这些数据的示例包括:用于在网络流量的预测设备1000上操作的任何计算机程序。
[0343]
上述本发明实施例揭示的方法可以应用于第一处理器1002中,或者由第一处理器1002实现。第一处理器1002可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过第一处理器1002中的硬件的集成逻辑电路或者软件形式的指令完成。上述的第一处理器1002可以是通用处理器、数字信号处理器(dsp,digital signal processor),或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。第一处理器1002可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本发明实施例所公开的方法的步骤,可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于存储介质中,该存储介质位于第一存储器1003,第一处理器1002读取第一存储器1003中的信息,结合其硬件完成前述方法的步骤。
[0344]
在示例性实施例中,网络流量的预测设备1000可以被一个或多个应用专用集成电路(asic,application specific integrated circuit)、dsp、可编程逻辑器件(pld,programmable logic device)、复杂可编程逻辑器件(cpld,complex programmable logic device)、现场可编程门阵列(fpga,field-programmable gate array)、通用处理器、控制器、微控制器(mcu,micro controller unit)、微处理器(microprocessor)或者其他电子元件实现,用于执行前述方法。
[0345]
基于上述程序模块的硬件实现,且为了实现本发明实施例模型应用侧的方法,本
发明实施例还提供了另一种网络流量的预测设备,参见图11,图11为本发明实施例提供的另一种网络流量的预测设备的结构示意图,该网络流量的预测设备1100包括:
[0346]
第二通信接口1101,获取目标用户设备群在当前时刻的实时业务相关数据,所述实时业务相关数据至少包括实时位置数据及实时网络流量数据;
[0347]
第二处理器1102,与第二通信接口1101连接,用于运行计算机程序时,执行上述模型应用侧一个或多个技术方案提供的方法。而所述计算机程序存储在第二存储器1103上。
[0348]
具体地,第二处理器1102,用于将所述实时位置数据与所述实时网络流量数据分别输入至预测模型,得到所述预测模型输出的所述目标用户设备群在目标时刻所处的目标位置,以及所述目标用户设备群在所述目标时刻的网络流量预测值;所述目标时刻用于表征以所述当前时刻为起始时间的任一时刻;还用于基于所述目标用户设备群在目标时刻所处的目标位置,以及所述目标用户设备群在所述目标时刻的网络流量预测值,确定所述目标位置的总的网络流量预测值;其中,所述预测模型,基于用户设备群中用户设备的历史位置数据及历史网络流量数据作为训练样本数据进行模型训练得到。
[0349]
在一些实施例中,第二处理器1102,具体用于:基于所述目标用户设备群在所述目标时刻所处的目标位置,确定位于同一所述目标位置的目标用户设备群集合;将位于同一所述目标位置的目标用户设备群集合中所有目标用户设备群的网络流量预测值进行汇总,得到对应所述目标位置的总的网络流量预测值。
[0350]
在一些实施例中,第二处理器1102,还用于将所述目标位置的总的网络流量预测值与所述目标位置的总网络流量阈值进行比较,得到比较结果;当所述比较结果表征所述目标位置的总的网络流量预测值大于所述总网络流量阈值时,对所述目标位置的网络设备进行维护与优化。
[0351]
需要说明的是,第二通信接口1101和第二处理器1102的具体处理过程详见方法实施例,这里不再赘述。
[0352]
当然,实际应用时,网络流量的预测设备1100中的各个组件通过总线系统1104耦合在一起。可理解,总线系统1104用于实现这些组件之间的连接通信。总线系统1104除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图11中将各种总线都标为总线系统1104。
[0353]
本发明实施例中的第二存储器1103用于存储各种类型的数据以支持网络流量的预测设备1100的操作。这些数据的示例包括:用于在网络流量的预测设备1100上操作的任何计算机程序。
[0354]
上述本发明实施例揭示的方法可以应用于第二处理器1102中,或者由第二处理器1102实现。第二处理器1102可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过第二处理器1102中的硬件的集成逻辑电路或者软件形式的指令完成。上述的第二处理器1102可以是通用处理器、dsp,或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。第二处理器1102可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本发明实施例所公开的方法的步骤,可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于存储介质中,该存储介质位于第二存储器1103,第二处理器1102读取第二存储器1103中的信息,结合其硬
件完成前述方法的步骤。
[0355]
在示例性实施例中网络流量的预测设备1100可以被一个或多个asic、dsp、pld、cpld、fpga、通用处理器、控制器、mcu、microprocessor、或其他电子元件实现,用于执行前述方法。
[0356]
可以理解,本发明实施例的存储器(第一存储器1003、第二存储器1103)可以是易失性存储器或者非易失性存储器,也可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(rom,read only memory)、可编程只读存储器(prom,programmable read-only memory)、可擦除可编程只读存储器(eprom,erasable programmable read-only memory)、电可擦除可编程只读存储器(eeprom,electrically erasable programmable read-only memory)、磁性随机存取存储器(fram,ferromagnetic random access memory)、快闪存储器(flash memory)、磁表面存储器、光盘、或只读光盘(cd-rom,compact disc read-only memory);磁表面存储器可以是磁盘存储器或磁带存储器。易失性存储器可以是随机存取存储器(ram,random access memory),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的ram可用,例如静态随机存取存储器(sram,static random access memory)、同步静态随机存取存储器(ssram,synchronous static random access memory)、动态随机存取存储器(dram,dynamic random access memory)、同步动态随机存取存储器(sdram,synchronous dynamic random access memory)、双倍数据速率同步动态随机存取存储器(ddrsdram,double data rate synchronous dynamic random access memory)、增强型同步动态随机存取存储器(esdram,enhanced synchronous dynamic random access memory)、同步连接动态随机存取存储器(sldram,sync link dynamic random access memory)、直接内存总线随机存取存储器(drram,direct rambus random access memory)。本发明实施例描述的存储器旨在包括但不限于这些和任意其它适合类型的存储器。
[0357]
在示例性实施例中,本发明实施例还提供了一种存储介质,即计算机存储介质,具体为计算机可读存储介质,例如包括存储计算机程序的第一存储器1003,上述计算机程序可由网络流量的预测设备1000的第一处理器1002执行,以完成前述模型训练侧方法所述的步骤。再比如包括存储计算机程序的第二存储器1103,上述计算机程序可由网络流量的预测设备1100的第二处理器1102执行,以完成前述模型应用侧方法所述的步骤。计算机可读存储介质可以是fram、rom、prom、eprom、eeprom、flash memory、磁表面存储器、光盘或cd-rom等存储器;也可以是包括上述存储器之一或任意组合的各种设备。
[0358]
在本发明实施例中,所涉及的术语“第一”、“第二”等仅仅是用于区别类似的对象,不代表针对对象的特定的顺序或先后次序,可以理解地,“第一”、“第二”等在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本发明实施例能够以除了在这里图示或描述的以外的顺序实施。
[0359]
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1