网络流量分析方法、装置、电子设备及介质与流程

文档序号:37190859发布日期:2024-03-01 13:00阅读:13来源:国知局
网络流量分析方法、装置、电子设备及介质与流程

本公开涉及互联网领域,具体地涉及一种网络流量分析方法、装置、电子设备及介质。


背景技术:

1、随着计算机网络技术的发展和使用,人们对网络的性能和安全要求也越来越高,所以网络管理人员对网络进行合理规划、对网络安全进行管理也变得越来越重要。随着相关技术发展,网络规模越来越大,同时网络数据流量也越来越复杂,所以在此基础上开展ipv4网络环境下的流量数据分析十分有必要。

2、而在现有的网络流量数据的分析技术中,数据的处理性能并不能满足日益增长的网络流量数据需求。


技术实现思路

1、鉴于上述问题,本公开提供了一种网络流量分析方法、装置、电子设备及介质。

2、根据本公开的第一个方面,提供了一种网络流量分析方法,包括:基于分布式的旁路流量采集方式采集ipv4网络的流量数据和用户数据;基于流量数据和用户数据,预测用户的流量带宽数据;从流量带宽数据中筛选出符合预设条件的流量带宽数据作为待分类流量数据;对待分类流量数据进行分类,获得分类结果。

3、根据本公开的实施例,基于分布式的旁路流量采集方式采集ipv4网络的流量数据和用户数据包括:基于骨干网节点和国际网节点建立端口镜像,端口镜像用于从骨干网节点和国际网节点中复制ipv4网络的流量数据;基于分布式的旁路流量采集方式,采集端口镜像复制的ipv4网络的流量数据;基于流量数据,获取用户数据。

4、根据本公开的实施例,对用户流量数据进行分类,获得分类结果:建立随机森林初始模型;基于预先采集的历史用户流量数据,利用自助聚合算法训练随机森林初始模型,获得训练后的随机森林模型;基于随机森林模型,对用户流量数据进行分类,获得分类结果。

5、根据本公开的实施例,基于预先采集的历史用户流量数据,利用自助聚合算法训练随机森林初始模型,获得训练后的随机森林模型包括:从历史用户流量数据中选取训练样本;利用自助聚合算法将训练样本划分为多个训练子集和袋外数据集;基于训练样本的样本特征,从训练子集中建立多个随机决策树;根据随机决策树和袋外数据集对随机森林初始模型进行训练,获得训练后的随机森林模型。

6、根据本公开的实施例,样本特征包括数据流时间特征,数据量报文数量特征,数据流大小特征以及数据流双向报文标志位特征。

7、根据本公开的实施例,ipv4网络的流量数据包括访问时间、源ip、源端口、目标ip、目标端口、第三层协议类型、入流量和出流量。

8、根据本公开的实施例,分类结果包括域名分类结果,端口分类结果,活跃程度分类结果以及出入流量分类结果。

9、本公开的第二方面提供了一种网络流量分析装置,包括:采集模块,用于基于分布式的旁路流量采集方式采集ipv4网络的流量数据和用户数据;预测模块,用于基于流量数据和用户数据,预测用户的流量带宽数据;筛选模块,用于从流量带宽数据中筛选出符合预设条件的流量带宽数据作为待分类流量数据;以及,分类模块,用于对待分类流量数据进行分类,获得分类结果。

10、本公开的第三方面提供了一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序,其中,当一个或多个程序被一个或多个处理器执行时,使得一个或多个处理器执行上述网络流量分析方法。

11、本公开的第四方面还提供了一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行上述网络流量分析方法。

12、根据本公开的实施例,本公开提供的一种网络流量分析方法、装置、电子设备及介质至少具有以下有益效果中的之一:建立关于ipv4网络流量的预测模型和分类模型,实现对ipv4网络流量的全方位监测,有的放矢地实现预测ipv4网络流量的流量使用趋势和教育网站各院校的ipv4网络流量互联网应用情况;基于分布式的旁路流量采集方式采集网络数据,均衡采集服务器之间的资源压力;利用自助聚合算法和袋外数据集对预测模型以及分类模型进行训练,使得对ipv4网络流量预测和分类的精准度。



技术特征:

1.一种网络流量分析方法,其特征在于,包括:

2.根据权利要求1所述的网络流量分析方法,其特征在于,所述基于分布式的旁路流量采集方式采集ipv4网络的流量数据和用户数据包括:

3.根据权利要求1所述的网络流量分析方法,其特征在于,所述对所述待分类流量数据进行分类,获得分类结果:

4.根据权利要求1所述的网络流量分析方法,其特征在于,所述基于预先采集的历史用户流量数据,利用自助聚合算法训练随机森林初始模型,获得训练后的随机森林模型包括:

5.根据权利要求4所述的网络流量分析方法,其特征在于,所述样本特征包括数据流时间特征,数据量报文数量特征,数据流大小特征以及数据流双向报文标志位特征。

6.根据权利要求1所述的网络流量分析方法,其特征在于,所述ipv4网络的流量数据包括访问时间、源ip、源端口、目标ip、目标端口、第三层协议类型、入流量和出流量。

7.根据权利要求1所述的网络流量分析方法,其特征在于,所述分类结果包括域名分类结果、端口分类结果、活跃程度分类结果以及出入流量分类结果中的至少一个。

8.一种网络流量分析装置,其特征在于,包括:

9.一种电子设备,其特征在于,包括:

10.一种计算机可读存储介质,其特征在于,其上存储有可执行指令,该指令被处理器执行时使处理器执行根据权利要求1~7中任一项所述的方法。


技术总结
本公开提供了一种网络流量分析方法,可以应用于互联网领域技术领域。该网络流量分析方法包括:基于分布式的旁路流量采集方式采集IPv4网络的流量数据和用户数据;基于流量数据和用户数据,预测用户的流量带宽数据;从流量带宽数据中筛选出符合预设条件的流量带宽数据作为待分类流量数据;对流量带宽数据进行分类,获得分类结果。本公开还提供了一种网络流量分析装置、设备、存储介质和程序产品。

技术研发人员:李春辉,李星,吴建平,李威,邓斌,王飞,郝子剑,杜孟佳
受保护的技术使用者:赛尔网络有限公司
技术研发日:
技术公布日:2024/2/29
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1