在多个标签页并发访问场景下的暗网网站识别方法及装置

文档序号:33713455发布日期:2023-04-01 01:59阅读:来源:国知局

技术特征:
1.一种在多个标签页并发访问场景下的暗网网站识别方法,其特征在于,包括以下步骤:获取待识别网站被浏览的网络流量包,并提取所述网络流量包中的方向序列特征;基于多滑动窗口将所述方向序列特征划分为多个子序列特征,将所述多个子序列特征输入神经网络模型提取得到预设模式特征;利用目标网站识别模型对所述预设模式特征的相关性进行分析,以得到目标网站被访问的概率计算结果;基于所述概率计算结果和预设的分类模型,得到所述待识别网站中的目标网站识别结果。2.根据权利要求1所述的方法,其特征在于,所述分类模型包括多个二分类器,所述二分类器用于识别待识别网站中是否包含所述目标网站。3.根据权利要求1所述的方法,其特征在于,所述基于多滑动窗口将所述方向序列特征划分为多个子序列特征,包括:将所述方向序列特征拼接得到流量环路特征;利用多个滑动窗口从不同位置对所述流量环路特征进行分割得到多个子序列特征。4.根据权利要求1所述的方法,其特征在于,所述神经网络模型包括第一分析模块和第二分析模块;所述将多个子序列特征输入神经网络模型提取得到预设模式特征,包括:将所述多个子序列特征输入第一分析模块的卷积层和batch norm层,输出得到第一局部特征向量,将所述第一局部特征向量与所述多个子序列特征连接后输入第一分析模块的最大池化层,输出得到第一局部模式特征;将所述第一局部模式特征输入第二分析模块的卷积层和batch norm层,输出得到第二局部特征向量,将所述第二局部特征向量与所述第二局部特征向量连接后输入第二分析模块的最大池化层,输出得到第二局部模式特征。5.根据权利要求4所述的方法,其特征在于,所述目标网站识别模型包括多头top-m注意力层;所述利用目标网站识别模型对所述预设模式特征的相关性进行分析,以得到目标网站被访问的概率计算结果,包括:基于第二局部模式特征和多头top-m注意力层得到第预设数量个头的投影矩阵,基于所述投影矩阵和第一预设公式得到所述第预设数量个头的输出结果;基于所述第预设数量个头的输出结果和线性投射函数,并利用第二预设公式得到所述多头top-m注意力层的输出结果;根据所述多头top-m注意力层的输出结果和预设的网络规则,并利用第三预设公式得到目标网站被访问的概率计算结果。6.一种在多个标签页并发访问场景下的暗网网站识别装置,其特征在于,包括:初始特征获取模块,用于获取待识别网站被浏览的网络流量包,并提取所述网络流量包中的方向序列特征;关键特征提取模块,用于基于多滑动窗口将所述方向序列特征划分为多个子序列特征,将所述多个子序列特征输入神经网络模型提取得到预设模式特征;访问概率计算模块,用于利用目标网站识别模型对所述预设模式特征的相关性进行分析,以得到目标网站被访问的概率计算结果;
目标网站识别模块,用于基于所述概率计算结果和预设的分类模型,得到所述待识别网站中的目标网站识别结果。7.根据权利要求6所述的装置,其特征在于,所述分类模型包括多个二分类器,所述二分类器用于识别待识别网站中是否包含所述目标网站。8.根据权利要求6所述的装置,其特征在于,所述关键特征提取模块,还用于:将所述方向序列特征拼接得到流量环路特征;利用多个滑动窗口从不同位置对所述流量环路特征进行分割得到多个子序列特征。9.根据权利要求6所述的装置,其特征在于,所述神经网络模型包括第一分析模块和第二分析模块;所述关键特征提取模块,还用于:将所述多个子序列特征输入第一分析模块的卷积层和batch norm层,输出得到第一局部特征向量,将所述第一局部特征向量与所述多个子序列特征连接后输入第一分析模块的最大池化层,输出得到第一局部模式特征;将所述第一局部模式特征输入第二分析模块的卷积层和batch norm层,输出得到第二局部特征向量,将所述第二局部特征向量与所述第二局部特征向量连接后输入第二分析模块的最大池化层,输出得到第二局部模式特征。10.根据权利要求9所述的装置,其特征在于,所述目标网站识别模型包括多头top-m注意力层;所述访问概率计算模块,还用于:基于第二局部模式特征和多头top-m注意力层得到第预设数量个头的投影矩阵,基于所述投影矩阵和第一预设公式得到所述第预设数量个头的输出结果;基于所述第预设数量个头的输出结果和线性投射函数,并利用第二预设公式得到所述多头top-m注意力层的输出结果;根据所述多头top-m注意力层的输出结果和预设的网络规则,并利用第三预设公式得到目标网站被访问的概率计算结果。

技术总结
本发明公开了在多个标签页并发访问场景下的暗网网站识别方法及装置,其中,该方法包括:获取待识别网站被浏览的网络流量包,并提取网络流量包中的方向序列特征;基于多滑动窗口将方向序列特征划分为多个子序列特征,将多个子序列特征输入神经网络模型提取得到预设模式特征;利用目标网站识别模型对预设模式特征的相关性进行分析,以得到目标网站被访问的概率计算结果;基于概率计算结果和预设的分类模型,得到待识别网站中的目标网站识别结果。本发明能够在混淆的暗网流量中有效提取被访问的暗网网站的关键信息,实现多个标签页的网站准确识别,并且在动态和防御场景下具有较好的鲁棒性。的鲁棒性。的鲁棒性。


技术研发人员:李琦 邓欣豪 赵溪远 殷其雷 刘卓涛 徐明伟 徐恪 吴建平
受保护的技术使用者:清华大学
技术研发日:2022.11.18
技术公布日:2023/3/31
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1