一种域名检测方法、装置及电子设备与流程

文档序号:37279776发布日期:2024-03-12 21:17阅读:11来源:国知局
一种域名检测方法、装置及电子设备与流程

本技术涉及网络安全,尤其涉及一种域名检测方法、装置及电子设备。


背景技术:

1、随着网络安全技术的发展,内容发布网络(英文全称:content deliverynetwork,简称为:cdn)的安全防护也逐渐受到人们的重视,cdn往往通过全球范围内分布式部署的边缘服务器将物联网各类数据从网络中心缓存到各个用户相关的边缘服务器上,在cdn接收到大规模的网络攻击数据的场景中,为了使得cdn能够处于正常工作状态,需要cdn利用边缘服务器过滤网络攻击数据。

2、在上述cdn的网络安全防护中,cdn只有对域名进行有效识别,才会使得cdn面临网络攻击数据时,能够及时采取有效的调度策略,目前的cdn检测模型的域名识别方式如下所示:

3、通过大容量的数据库对cdn域名进行检测,当检测到与该数据库中的cdn域名一致时,则识别出cdn域名。

4、基于上述描述的方式,大容量的数据库的数据覆盖范围有限,使得cdn域名识别的准确率受限于数据库的大小,当cdn域名不在该数据库中时,则无法识别出该域名,并且,对于数据库中的新增域名无法进行判断,需要依靠人工构建完备的数据库,需要耗费大量的时间,从而导致cdn检测模型的泛化性低。


技术实现思路

1、本技术提供了一种域名检测方法、装置及电子设备,用以提高域名识别的准确性,以及提高cdn检测模型的泛化性。

2、第一方面,本技术提供了一种域名检测方法,所述方法包括:

3、获得目标特征数据,其中,所述目标特征数据中至少包括一个域名;

4、将所述目标特征数据分别并行输入不同的预设模型,得到至少一个域名特征表集,其中,所述域名特征表集中至少包括:域名特征表、解析时间特征表、ip特征表、图表示特征表以及时序特征表;

5、按照预设合并方式将各个域名特征表集分别进行合并,得到每个域名对应的序列特征矩阵;

6、将各个序列特征矩阵输入目标卷积神经网络中进行分类检测,得到所述目标特征数据中各个域名的属性类别。

7、通过上述的方法,对目标特征数据进行监督学习,基于目标特征数据提取出序列特征矩阵,建立了序列特征矩阵到属性类别的多元映射,确保了能够准确识别出cdn域名,从而能够提高cdn检测模型的泛化性。

8、在一种可能的设计中,所述获得目标特征数据,包括:

9、获取初始解析数据,其中,所述初始解析数据至少包括:各个域名的第一解析记录、第二解析记录、解析次数、解析位置以及解析生存时间;

10、提取出所述初始解析数据中的异常数据,将所述异常数据从初始解析数据中删除,以及将所述初始解析数据中各类数据的数据格式修改为预设格式,得到目标特征数据。

11、通过上述的方法,对初始解析数据进行预设格式的统一,以及删除初始解析数据中的异常数据,确定出目标特征数据,有利于确保基于目标特征数据提取出的域名特征表的准确性。

12、在一种可能的设计中,所述将所述目标特征数据分别并行输入不同的预设模型,得到至少一个域名特征表集,包括:

13、将所述目标特征数据输入预设静态模型中进行特征提取,得到域名特征表、解析时间特征表以及ip特征表;以及

14、将所述目标特征数据输入预设图模型中进行特征提取,得到图表示特征表;以及

15、将所述目标特征数据输入预设时序模型中进行特征提取,得到时序特征表;

16、将各个域名分别对应的所述域名特征表、所述解析时间特征表、所述ip特征表、所述图表示特征表以及所述时序特征表的集合作为域名特征表集。

17、通过上述的方法,基于不同的预设模块从不同的维度出发,从目标特征数据中确定出域名特征表集,使得域名特征表集中的特征具有完整性,有利于域名识别准确率的提高以及cdn检测模型泛化性的提高。

18、在一种可能的设计中,所述按照预设合并方式将各个域名特征表集分别进行合并,得到每个域名对应的序列特征矩阵,包括:

19、针对所述目标特征数据中的单个域名作出如下操作:

20、确定出所述域名对应的域名特征表、解析时间特征表、ip特征表、图表示特征表以及时序特征表;

21、将所述域名的所述域名特征表、所述解析时间特征表、所述ip特征表、所述图表示特征表以及所述时序特征表按照横向合并方式进行合并,得到序列特征矩阵。

22、通过上述的方法,将每个域名的域名特征表集中的各个特征表进行融合,得到每个域名对应的序列特征矩阵,使得序列特征矩阵能够代表域名的所有特征,有利于提高域名识别的准确性。

23、在一种可能的设计中,在将各个序列特征矩阵输入目标卷积神经网络中进行分类检测之前,还包括:

24、获得训练特征矩阵;

25、将所述训练特征矩阵输入初始卷积神经网络中进行训练,输出所述训练特征矩阵中各类域名分别对应的训练属性类别;

26、确定出所述训练属性类别的准确度值,检测所述准确度值是否超过预设阈值;

27、若是,则将所述初始卷积神经网络作为目标卷积神经网络;

28、若否,则基于预设算法确定出所述训练特征矩阵对应的目标特征矩阵,并所述目标特征矩阵输入所述初始卷积神经网络进行训练。

29、通过上述的方法,对初始卷积神经网络进行训练,得到目标卷积神经网络,确保了目标卷积神经网络进行分类检测的准确性。

30、在一种可能的设计中,所述基于预设算法确定出所述训练特征矩阵对应的目标特征矩阵,包括:

31、基于预设算法计算出所述训练特征矩阵中各个训练特征各自对应的贡献度值,其中,所述贡献度值表示在每一种训练属性类别中每一个特征在域名对应的所有特征中的贡献比率;

32、筛选出各个贡献度值低于预设贡献度值分别对应的第一数据特征列,并从所述训练特征矩阵中删除所有第一数据特征列,得到目标特征矩阵。

33、通过上述的方法,基于贡献度值对训练特征矩阵中训练特征进行筛选,删除对分类检测存在负面影响的训练特征,有利于提高目标卷积神经网络进行分类检测的准确性。

34、在一种可能的设计中,在将各个序列特征矩阵输入目标卷积神经网络中进行分类检测,得到所述目标特征数据中各个域名的属性类别之后,还包括:

35、确定出各个域名各自对应的图表示特征表,并基于各个图表示特征表构建所述各个域名对应的特征图;

36、按照预设融合方式将各个域名的属性类别与所述各个域名对应的特征图进行融合,生成所述目标特征数据对应的目标可视拓扑图。

37、通过上述的方法,确定出目标特征数据的目标可视拓扑图,实现了目标特征数据中域名的可视化。

38、第二方面,本技术提供了一种域名检测装置,所述装置包括:

39、获得模块,用于获得目标特征数据,其中,所述目标特征数据中至少包括一个域名;

40、输入模块,用于将所述目标特征数据分别并行输入不同的预设模型,得到至少一个域名特征表集,其中,所述域名特征表集中至少包括:域名特征表、解析时间特征表、ip特征表、图表示特征表以及时序特征表;

41、矩阵模块,用于按照预设合并方式将各个域名特征表集分别进行合并,得到每个域名对应的序列特征矩阵;

42、检测模块,用于将各个序列特征矩阵输入目标卷积神经网络中进行分类检测,得到所述目标特征数据中各个域名的属性类别。

43、在一种可能的设计中,所述获得模块,具体用于获取初始解析数据,提取出所述初始解析数据中的异常数据,将所述异常数据从初始解析数据中删除,以及将所述初始解析数据中各类数据的数据格式修改为预设格式,得到目标特征数据。

44、在一种可能的设计中,所述输入模块,具体用于将所述目标特征数据输入预设静态模型中进行特征提取,得到域名特征表、解析时间特征表以及ip特征表,以及将所述目标特征数据输入预设图模型中进行特征提取,得到图表示特征表,以及将所述目标特征数据输入预设时序模型中进行特征提取,得到时序特征表,将各个域名分别对应的所述域名特征表、所述解析时间特征表、所述ip特征表、所述图表示特征表以及所述时序特征表的集合作为域名特征表集。

45、在一种可能的设计中,所述矩阵模块,具体用于针对所述目标特征数据中的单个域名作出如下操作:确定出所述域名对应的域名特征表、解析时间特征表、ip特征表、图表示特征表以及时序特征表,将所述域名的所述域名特征表、所述解析时间特征表、所述ip特征表、所述图表示特征表以及所述时序特征表按照横向合并方式进行合并,得到序列特征矩阵。

46、在一种可能的设计中,所述检测模块,具体用于获得训练特征矩阵,将所述训练特征矩阵输入初始卷积神经网络中进行训练,输出所述训练特征矩阵中各类域名分别对应的训练属性类别,确定出所述训练属性类别的准确度值,检测所述准确度值是否超过预设阈值,若是,则将所述初始卷积神经网络作为目标卷积神经网络,若否,则基于预设算法确定出所述训练特征矩阵对应的目标特征矩阵,并所述目标特征矩阵输入所述初始卷积神经网络进行训练。

47、在一种可能的设计中,所述检测模块,还用于基于预设算法计算出所述训练特征矩阵中各个训练特征各自对应的贡献度值,其中,所述贡献度值表示在每一种训练属性类别中每一个特征在域名对应的所有特征中的贡献比率,筛选出各个贡献度值低于预设贡献度值分别对应的第一数据特征列,并从所述训练特征矩阵中删除所有第一数据特征列,得到目标特征矩阵。

48、在一种可能的设计中,所述检测模块,还用于确定出各个域名各自对应的图表示特征表,并基于各个图表示特征表构建所述各个域名对应的特征图,按照预设融合方式将各个域名的属性类别与所述各个域名对应的特征图进行融合,生成所述目标特征数据对应的目标可视拓扑图。

49、第三方面,本技术提供了一种电子设备,包括:

50、存储器,用于存放计算机程序;

51、处理器,用于执行所述存储器上所存放的计算机程序时,实现上述的一种域名检测方法步骤。

52、第四方面,一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述的一种域名检测方法步骤。

53、上述第一方面至第四方面中的各个方面以及各个方面可能达到的技术效果请参照上述针对第一方面或第一方面中的各种可能方案可以达到的技术效果说明,这里不再重复赘述。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1