一种网络流量识别方法、装置、电子设备及存储介质与流程

文档序号:35919535发布日期:2023-11-04 01:03阅读:19来源:国知局
一种网络流量识别方法、装置、电子设备及存储介质与流程

本申请属于互联网,具体涉及一种网络流量识别方法、装置、电子设备及存储介质。


背景技术:

1、随着互联网的发展,网络流量识别面临诸多挑战:流量种类越来越复杂,更新频率越来越快,加密程度越来越高。传统基于规则的网络流量识别技术如深度报文检测(deeppacket inspection,dpi),需要长期人工投入来手动提取流量特征,效率与准确率都不高。

2、相关基于机器学习(machine learning,ml)的流量识别技术,一般是在收集带有标签的监督学习流量样本后,构造机器学习模型提取流量的行为特征,如包长与传包间隔等,来实现流量分类,但其模型训练使用的流量样本通常是离线的,与在线推理使用时遇到的流量情况通常会存在差异,导致其分类能力完全依赖于线下监督样本的收集,识别准确率也不高。


技术实现思路

1、本申请实施例提供一种网络流量识别方法、装置、电子设备及存储介质,能够适应推理环境下的实际流量分布,提高流量识别的准确率。

2、第一方面,本申请实施例提供了一种网络流量识别方法,包括:根据第一样本数据,确定第一流量模型,其中,所述第一样本数据包括多条离线流量数据和每条所述离线流量数据对应的流量标签数据,所述第一流量模型包括编码网络和分类网络,所述编码网络用于对所述第一样本数据进行编码,所述分类网络用于对编码后的所述第一样本数据进行分类;根据第二样本数据,确定第二流量模型,其中,所述第二样本数据包括预定时间内的多条实时流量数据,所述第二流量模型的结构与所述编码网络的结构相同,所述第二流量模型的初始权值与所述编码网络的权值相同;根据所述第二流量模型,对所述第一流量模型进行调整;基于所述调整后的第一流量模型,对所述第一样本数据进行分类。

3、第二方面,本申请实施例提供了一种网络流量识别装置,包括:离线训练模块,用于根据第一样本数据,确定第一流量模型,其中,所述第一样本数据包括多条离线流量数据和每条所述离线流量数据对应的流量标签数据,所述第一流量模型包括编码网络和分类网络,所述编码网络用于对所述第一样本数据进行编码,所述分类网络用于对编码后的所述第一样本数据进行分类;在线学习模块,用于根据第二样本数据,确定第二流量模型,其中,所述第二样本数据包括预定时间内的多条实时流量数据,所述第二流量模型的结构与所述编码网络的结构相同,所述第二流量模型的初始权值与所述编码网络的权值相同;调整模块,用于根据所述第二流量模型,对所述第一流量模型进行调整;分类模块,用于基于所述调整后的第一流量模型,对所述第一样本数据进行分类。

4、第三方面,本申请实施例提供了一种电子设备,该电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面所述的网络流量识别方法的步骤。

5、第四方面,本申请实施例提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面所述的网络流量识别方法的步骤。

6、第五方面,本申请实施例提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现如第一方面所述的网络流量识别方法的步骤。

7、在本申请实施例中,通过根据第一样本数据,确定第一流量模型,其中,所述第一样本数据包括多条离线流量数据和每条所述离线流量数据对应的流量标签数据,所述第一流量模型包括编码网络和分类网络,所述编码网络用于对所述第一样本数据进行编码,所述分类网络用于对编码后的所述第一样本数据进行分类;根据第二样本数据,确定第二流量模型,其中,所述第二样本数据包括预定时间内的多条实时流量数据,所述第二流量模型的结构与所述编码网络的结构相同,所述第二流量模型的初始权值与所述编码网络的权值相同;根据所述第二流量模型,对所述第一流量模型进行调整;基于所述调整后的第一流量模型,对所述第一样本数据进行分类,能够适应推理环境下的实际流量分布,提高流量识别的准确率。



技术特征:

1.一种网络流量识别方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,在所述根据所述第二流量模型,对所述第一流量模型进行调整之前,所述方法还包括:

3.根据权利要求2所述的方法,其特征在于,在所述基于所述调整后的第一流量模型,对所述第一样本数据进行分类之后,所述方法还包括:

4.根据权利要求1所述的方法,其特征在于,在所述根据第一样本数据,确定第一流量模型之前,所述方法还包括:

5.根据权利要求1所述的方法,其特征在于,所述编码网络包括文本卷积神经网络text-cnn,所述第二流量模型包括语言模型lm,其中,所述text-cnn包括多通道卷积神经网络。

6.一种网络流量识别装置,其特征在于,所述装置包括:

7.根据权利要求6所述的装置,其特征在于,所述调整模块,用于:

8.根据权利要求7所述的装置,其特征在于,所述分类模块,还用于:

9.一种电子设备,其特征在于,包括处理器,存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如权利要求1-5任一项所述的网络流量识别方法的步骤。

10.一种可读存储介质,其特征在于,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如权利要求1-5任一项所述的网络流量识别方法的步骤。


技术总结
本申请公开了一种网络流量识别方法、装置、电子设备及存储介质,属于互联网技术领域。所述方法包括:根据第一样本数据,确定第一流量模型,其中,所述第一样本数据包括多条离线流量数据和每条所述离线流量数据对应的流量标签数据,所述第一流量模型包括编码网络和分类网络;根据第二样本数据,确定第二流量模型,其中,所述第二样本数据包括预定时间内的多条实时流量数据,所述第二流量模型的结构与所述编码网络的结构相同,所述第二流量模型的初始权值与所述编码网络的权值相同;根据所述第二流量模型,对所述第一流量模型进行调整;基于所述调整后的第一流量模型,对所述第一样本数据进行分类。

技术研发人员:李茂桂
受保护的技术使用者:中国移动通信集团湖南有限公司
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1