基于深度学习的Web攻击检测与分类识别方法及装置

文档序号：34905224发布日期：2023-07-27 13:50阅读：196来源：国知局

本发明属于通信，具体涉及一种基于深度学习的web攻击检测与分类识别方法及装置。

背景技术：

1、随着互联网技术的不断发展，越来越多的web应用程序出现在人们的生活中。web应用程序给日常生活带来便利的同时，也给使用者带来了风险。可用性和过度使用使web应用程序成为了网络攻击的目标。攻击者还可以使用多种手段攻击web应用程序、破坏特定的资源、从数据库中窃取数据或者中断应用服务，给社会带来重大的经济损失和伤害。而现有的基于黑名单、基于异常和基于启发式的网络攻击防御方法都只对已知攻击有效，无法防御新的攻击手段，并且很容易被绕过。因此，检测清楚攻击者所使用的攻击手段，对于事后应急响应处理有重要的指导作用。

2、目前，现有的web攻击检测方案在对web攻击的检测和识别上，主要有以下几种方式：

3、第一种是基于行为规则匹配的web攻击检测和防御方法。该方法通过预设一个包含多种防御规则的规则防御库，将web应用防护系统的访问请求与防御规则库中的记录进行匹配，匹配的记录作为样本数据来建立分析模型。通过建立用户数据库，通过分析模型对用户的访问行为进行学习，从而更新和修正防御规则库中的防御规则，根据设定的规则对用户的访问行为进行拦截。然而防御规则库中的防御规则往往基于专家经验，具有局限性。其所依赖的规则库只能识别和防御已知的漏洞威胁，在面对未知的新型攻击时很容易被绕过，随着新型攻击层出不穷，攻击更加隐匿且难以识别，给安全防御带来严峻的挑战。

4、第二种是基于动态特征提取的攻击url检测方法。该方法通过对采集到的url数据进行标记，并对url数据进行预处理，即将url分割为字符集，统计每一种字符集的总数，丢弃数量小于预设值的字符，然后对每一个字符向量化，按行拼接为数值矩阵，输入循环神经网络进行训练。使用训练好的模型对未知url判定是否为攻击url。这种方法在一定程度上能够识别未知攻击，但仅对url进行检测容易忽略通过post进行攻击的方式，比如，sql注入和文件上传等。因此，该模型检测web攻击的准确度较低，在面对多种攻击手段的情况下，不具备很好的检测和防御效果。

5、第三种是基于nlp的web攻击检测方法。该方法使用fasttext文本分类算法将获取的html请求分类，然后通过规则进行批量标注，将文本向量化处理，再选出特殊字符进行向量化，通过深度学习模型得到独热编码的分类输出，然后将独热编码标签映射到二分类标签上。然而，该方法所使用的文本分类算法无法捕捉词序信息，对长文本的检测效果不佳。同时，该方法流程复杂，所需花费的时间较长，成本较高且仅能将攻击进行二分类，无法准确判断攻击类型并及时做出响应。

6、综上所述，现有的网络攻击检测和防御方法都只对已知攻击有效，无法防御新的攻击手段，并且很容易被绕过；且大多数的攻击检测方案只能进行异常识别，无法对攻击手段进行准确的分类识别。由此，现有web攻击检测方法在模型的可靠性、准确性、实用性和成本开销上均不能很好地满足web攻击检测的实际需要。

技术实现思路

1、为了解决现有技术中存在的上述问题，本发明提供了基于深度学习的web攻击检测与分类识别方法。本发明要解决的技术问题通过以下技术方案实现：

2、第一方面，本发明提供了一种基于深度学习的web攻击检测与分类识别方法，包括：

3、步骤1：获取web日志信息并将其标记为不同类型；

4、步骤2：对所述web日志信息进行解码，并对解码后的web日志信息进行分词，并转换为词向量；

5、步骤3：基于textcnn算法、bi-lstm网络以及注意力机制构建web攻击检测与分类识别的深度学习模型；

6、步骤4：利用所述词向量对所述深度学习模型进行训练，并保存训练好的模型；

7、步骤5：利用训练好的深度学习模型对未知的web日志进行检测以判定攻击类型。

8、第二方面，本发明提供了一种基于深度学习的web攻击检测与分类识别装置，包括：

9、数据采集模块，用于获取web日志信息并将其标记为不同类型；

10、数据预处理模块，用于对所述web日志信息进行解码，并对解码后的web日志信息进行分词，并转换为词向量；

11、模型构建模块，用于基于textcnn算法、bi-lstm以及注意力机制构建用于web攻击检测与分类识别的深度学习模型；

12、训练模块，用于利用所述词向量对所述深度学习模型进行训练，并保存训练好的模型；

13、检测模块，用于利用训练好的深度学习模型对未知的web日志进行检测以判定攻击类型。

14、本发明的有益效果：

15、本发明提供的基于深度学习的web攻击检测与分类识别方法结合textcnn算法、bi-lstm网络以及注意力机制构建了深度学习模型，利用深度学习模型端到端的特性，不需要人工进行特征提取，不再依赖专家知识，消除了先验知识对模型偏差的影响，避免人为因素造成偏差的同时减少了工作量和成本；且该模型可以在充分提取web日志局部特征的同时提取语序特征，并输出多种攻击类型；因而使得该方法对web攻击的检测和分类识别的准确率较高、速度较快；此外，该方法不仅可以识别多种web攻击类型，还能对未知的web攻击进行检测和多分类识别，识别出具体的攻击类型能够帮助运维人员快速定位和响应，提升了针对web攻击的安全防护能力，具有较高的安全性和广泛适用性。

16、以下将结合附图及实施例对本发明做进一步详细说明。

技术特征：

1.一种基于深度学习的web攻击检测与分类识别方法，其特征在于，包括：

2.根据权利要求1所述的基于深度学习的web攻击检测与分类识别方法，其特征在于，在步骤1中，所述类型包括正常访问、结构化查询语言注入、跨站脚本攻击、远程代码执行、目录遍历和命令执行攻击。

3.根据权利要求1所述的基于深度学习的web攻击检测与分类识别方法，其特征在于，步骤2包括：

4.根据权利要求1所述的基于深度学习的web攻击检测与分类识别方法，其特征在于，在步骤3中，构建的深度学习模型包括局部特征提取模块、语序特征提取模块、特征融合模块以及分类输出模块；其中，

5.根据权利要求4所述的基于深度学习的web攻击检测与分类识别方法，其特征在于，所述局部特征提取模块采用textcnn模型，其包括一个卷积层、一个batchnorm层以及一个最大池化层；其中，

6.根据权利要求4所述的基于深度学习的web攻击检测与分类识别方法，其特征在于，所述语序特征提取模块采用基于注意力机制的bi-lstm模块，依次包括输入层、词嵌入层、bi-lstm层以及单层注意力层；且该模块的输出特征维度设计为128维，激活函数使用tanh。

7.根据权利要求4所述的基于深度学习的web攻击检测与分类识别方法，其特征在于，所述分类输出模块包括两层线性层，输出维度为类型的个数。

8.根据权利要求1所述的基于深度学习的web攻击检测与分类识别方法，其特征在于，步骤4包括：

9.根据权利要求1所述的基于深度学习的web攻击检测与分类识别方法，其特征在于，步骤5包括：

10.一种基于深度学习的web攻击检测与分类识别装置，其特征在于，包括：

技术总结
本发明公开了一种基于深度学习的Web攻击检测与分类识别方法，包括：获取web日志信息并将其标记为不同类型；对web日志信息进行解码，并对解码后的web日志信息进行分词，并转换为词向量；基于textCNN算法、Bi‑LSTM网络以及注意力机制构建Web攻击检测与分类识别的深度学习模型；利用词向量对深度学习模型进行训练，并保存训练好的模型；利用训练好的深度学习模型对未知的web日志进行检测以判定攻击类型。该方法对web攻击的检测和分类识别的准确率较高、速度较快；且该方法不仅可以识别多种web攻击类型，还能对未知的web攻击进行检测和多分类识别，具有较高的安全性和广泛适用性。

技术研发人员：李兴华,苗春雨,周芷慧,叶方庆
受保护的技术使用者：西安电子科技大学
技术研发日：
技术公布日：2024/1/13

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李兴华苗春雨周芷慧叶方庆
技术所有人：杭州安恒信息技术股份有限公司
我是此专利的发明人

上一篇：一种拖链盖板的快拆结构及拖链的制作方法
上一篇：双边式ADSS光缆耐张线夹的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。