本发明属于网络安全,特别是一种基于幂律分割长度序列的异构任务流量智能分析方法。
背景技术:
1、随着互联网规模的急剧扩大和数字化程度的不断深化,网络流量数据呈现出爆炸性增长的趋势。这种激增背后隐藏着多种源头:用户数量的激增、智能设备和物联网的广泛应用、云服务的普及等,共同促成了网络流量数据的几何级增长。然而,这庞大的数据量却给网络运维和安全管理带来了巨大的挑战。
2、传统的网络流量分析方法依赖人工干预和基于规则的匹配技术。这些方法存在着显著的局限性,主要体现在两个方面:效率和准确性。人工分析方法受限于处理速度,无法满足海量数据的快速分析需求;同时,规则匹配方法过于僵化,在面对快速演化的网络威胁和多样化的数据形态时,难以提供足够准确的结果。
技术实现思路
1、本发明的目的在于针对现有技术存在的问题,提供一种基于幂律分割长度序列的异构任务流量智能分析方法,一方面提取元表征各个层级的元表征进行对长度序列进行幂律分割生成预处理数据集,一方面根据需要实现流量识别、模式分类和流量预测的多通道任务。
2、实现本发明目的的技术解决方案为:第一方面,本发明提供一种基于幂律分割长度序列的异构任务流量智能分析方法,包括以下步骤:
3、步骤1,基于五元组信息将输入流量样本分流处理为n条会话流量,并依据流量类型对其进行标记、分组、编号预处理操作;所述五元组为源地址、目的地址、源端口、目的端口、协议五元组;
4、步骤2,在任务选择模块中对目标任务进行选择:流量识别任务、模式分类任务和时序预测任务;
5、步骤3,逐流在包级、流级和主机级层面提取长度序列、时间序列和字段特征,将其转化为常量序列,构建流量样本的元表征矩阵;
6、步骤4,基于步骤2的元表征矩阵,将元表征转换为常量类型数据,并且依据常量出现的频次进行索引重排,根据索引的幂律分布情况对数据集进行分割,生成预处理数据集;
7、步骤5,利用步骤4生成的预处理数据集,将其输入至混合模态神经网络架构中,根据步骤2中所选任务的不同进入相应的训练网络通道,进行模型的训练。
8、第二方面,本发明提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现第一方面所述的方法的步骤。
9、第三方面,本发明提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面所述的方法的步骤。
10、本发明与现有技术相比,其显著优点为:
11、1)本发明能够处理异构任务流量,其基于幂律分割长度序列的特征提取方法,有助于适用于不同类型的网络流量,而不仅仅局限于特定类型的任务。
12、2)利用幂律分割长度序列进行特征提取,有助于更好地捕捉网络流量数据中的重要模式和特征,从而提供更准确和全面的信息;相对于传统的特征提取方法,该方法能够更全面地描述流量数据的属性。
13、3)幂律分割长度序列方法可以提供更强的鲁棒性,特别是在检测和应对异常网络流量时;传统方法往往在处理突发性和未知性异常数据方面表现不佳,而本发明在这方面具有更好的性能,提高网络安全的水平。
14、通过构建幂律分割长度序列为主要特征的预处理数据集和多通道深度学习训练网络,能够解决多分析任务的流量需求,对流量分析任务更加具有泛用性,使用门槛更进一步降低。
15、下面结合附图对本发明作进一步详细描述。
1.一种基于幂律分割长度序列的异构任务流量智能分析方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于幂律分割长度序列的异构任务流量智能分析方法,其特征在于,步骤1中对输入流量进行分流处理的同时,将ip、端口、mac这些字节信息均置为0。
3.根据权利要求1所述的基于幂律分割长度序列的异构任务流量智能分析方法,其特征在于,步骤1中在进行编号之前,需除去负载长度为0的数据包。
4.根据权利要求1所述的基于幂律分割长度序列的异构任务流量智能分析方法,其特征在于,步骤3构建流量样本的元表征矩阵original_f,具体为:
5.根据权利要求1所述的基于幂律分割长度序列的异构任务流量智能分析方法,其特征在于,步骤4所述基于步骤2的元表征矩阵original_f生成的预处理数据集input f,具体为:
6.根据权利要求1所述的基于幂律分割长度序列的异构任务流量智能分析方法,其特征在于,步骤5利用步骤4生成的预处理数据集input_f,根据任务的选择进入不同深度学习训练通道,具体包括为:
7.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1-6中任一所述的方法的步骤。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-6中任一所述的方法的步骤。