基于时序空间特征和偏好波动的网络安全工具智能推荐方法及装置

文档序号:37475656发布日期:2024-03-28 18:58阅读:30来源:国知局
基于时序空间特征和偏好波动的网络安全工具智能推荐方法及装置

本发明属于网络安全和推荐,特别涉及一种基于时序空间特征和偏好波动的网络安全工具智能推荐方法及装置。


背景技术:

1、在当今数字化时代,网络安全是组织和个人面临的持续挑战之一。随着网络攻击和威胁不断演化和增加,选择合适的网络安全工具变得至关重要。传统网络安全工具选择方法通常依赖于专业安全人员的建议,或者是基于静态规则和特定的网络情境来选择工具。这些方法可能无法充分考虑用户和组织的实际需求和偏好。因此,有必要基于用户的历史交互序列来推荐适合的网络安全工具。

2、在网络安全领域,推荐技术的应用还相对较少,尤其是针对网络安全工具的选择。当前的网络安全工具选择通常受限于基于静态规则和专业建议,而较少考虑用户的历史交互信息,无法更全面地理解用户的偏好和需求,提供更加个性化、实时的网络安全工具建议。并且现有的序列推荐技术对时空信息的利用不足,挖掘用户项特征的交互性不全面,处理长序列数据的效果不理想,并且生成的下一个推荐不够个性化,推荐的质量和准确性有待提高。

3、针对以上情况提出一种基于时序空间特征和偏好波动的网络安全工具智能推荐方法。通过在传统gru网络的基础上加入了时间转换矩阵和距离转换矩阵,时间转换矩阵能够捕捉历史中最近元素的影响,能够更好地理解和预测用户行为在不同时间段的变化;距离转换矩阵计算了用户在坐标系下的两个地理位置之间的欧氏距离,它衡量了用户在不同地点的移动距离,可以帮助模型从时空角度考虑用户的行为变化。通过考虑时间和空间因素,能够更准确地捕捉用户的长期行为特征;再通过注意力机制捕获用户近期的特征作为短期偏好;将用户特征、长期和短期偏好以及偏好波动向量融合,避免了特征表示单一的问题,可以更全面的理解用户的偏好和需求,得到完整的用户偏好特征,从而进行个性化、高质量的推荐。


技术实现思路

1、发明目的:针对背景技术中指出的现有的序列推荐系统对时空信息的利用不足,挖掘用户项特征的交互性不全面,处理长序列数据的效果不理想,推荐的质量和准确性有待提高等问题,公开了一种基于时序空间特征和偏好波动的网络安全工具智能推荐方法及装置,通过改进的gru算法将连续时间因子离散化,并引入了特定的时间转换矩阵和距离转换矩阵,输出向量融合了偏好、位置和时间这些更丰富的特征,从而更准确地捕捉用户的长期行为特征。

2、技术方案:本发明提出一种基于时序空间特征和偏好波动的网络安全工具智能推荐方法,包括如下步骤:

3、步骤1:对收集到的用户使用网络安全工具的数据进行清洗和预处理,构建用户的历史行为序列,包括用户嵌入矩阵以及用户行为序列嵌入矩阵,所述用户嵌入矩阵、用户行为序列嵌入矩阵中分别包括用户特征向量、用户行为序列嵌入向量;

4、步骤2:以用户行为序列嵌入矩阵为输入,通过改进的时空gru算法学习用户使用网络安全工具的长期偏好;所述改进的时空gru算法将连续时间因子离散化,并引入了特定的时间转换矩阵和距离转换矩阵;

5、步骤3:以用户行为序列嵌入矩阵为输入,通过多头注意力机学习用户近期的使用网络安全工具偏好,表示用户的短期偏好;

6、步骤4:计算用户的使用网络安全工具偏好波动值fu;

7、步骤5:融合用户的长期偏好、短期偏好、用户特征向量以及偏好波动向量,得到用户的使用网络安全工具行为的综合特征表达并进行推荐。

8、进一步地,所述步骤1的具体方法为:

9、步骤1.1:定义用户集合u={u1,u2,...,ua,...ulen(u)},ua为u中第a个待清洗信息数据,其中,len(u)为u中数据数量,变量a∈[1,len(u)];

10、步骤1.2:定义网络安全工具集合i={i1,i2,...,ib,...ilen(i)},ib为i中第b个待清洗信息数据,其中,len(i)为i中数据数量,变量b∈[1,len(i)];

11、步骤1.3:对数据集u、i中的数据进行去重和去空操作;

12、步骤1.4:得到清洗后的数据集u1={u1,u2,...,ua,...ulen(u)},ua为u1中第a个信息数据,其中,len(u)为u中数据数量,变量a∈[1,len(u)]和数据集i1={i1,i2,...,ib,...ilen(i)},ib为i1中第b个信息数据,其中,len(i1)为i1中数据数量,变量b∈[1,len(i1)];

13、步骤1.5:定义用户的历史行为序列为其中表示用户之前交互过的网络安全工具,的下标i表示网络安全工具在序列中出现的顺序;

14、步骤1.6:对于用户集合u1,通过高维稀疏独热码嵌入到低维稠密特征向量中的方法得到用户嵌入矩阵为eu,eu是用户嵌入矩阵eu中的一个向量,表示用户特征向量;

15、步骤1.7:对于用户的历史行为序列通过高维稀疏独热码嵌入到低维稠密特征向量中的方法,得到用户行为序列嵌入矩阵为ex∈rn×k,其中n×k表示矩阵的维度,ex是用户行为序列嵌入矩阵中的一个向量,表示用户行为序列嵌入向量。

16、进一步地,所述步骤2的具体方法为:

17、步骤2.1:输入用户行为序列嵌入矩阵ex∈rn×k;

18、步骤2.2:定义循环变量i,且i赋初值为1;

19、步骤2.3:如果i≤len(xu)则跳转到步骤2.4,否则跳转到步骤2.13;

20、步骤2.4:获取用户行为序列嵌入矩阵ex∈rn×k中的第i行向量ex;

21、步骤2.5:根据用户行为序列嵌入向量ex得到表示的用户u在时间t的访问位置的向量,定义用户在前一时间为t-1时的隐状态向量为ht-1;

22、步骤2.6:定义特定的时间变换矩阵用于表示两个时间点t和ti之间的时间间隔t-ti,其中ti表示历史时间点;

23、步骤2.7:定义特定的距离转换矩阵用来表示两地理坐标间的欧几里得距离,计算公式为其中,和表示用户u在时刻t所访问位置的坐标,和表示用户u历史时刻ti所访问位置的坐标;

24、步骤2.8:计算输入门其中wi1、wi2是变换矩阵,wi3、wi4是和的转移矩阵,bi是偏置向量,σ是激活函数,ht-1是前一个时刻的gru的隐状态向量;

25、步骤2.9:计算遗忘门其中wf1、wf2是变换矩阵,wf3、wf4是和的转移矩阵,bf是偏置向量;

26、步骤2.10:根据时间转换矩阵和距离转换矩阵计算新的gru候选隐状态向量其中ht-1表示前一个时刻的gru的隐状态向量,wc1、wc4是变换矩阵和wc2、wc3是和的转移矩阵,bc是偏置向量;

27、步骤2.11:根据输入门it和候选隐状态向量更新隐状态向量

28、步骤2.12:增加循环变量i的值,跳转到步骤2.4;

29、步骤2.13:结束循环,通过tanh非线性激活函数获得最终gru的输出即用户长期偏好gt=tanh(ct)。

30、进一步地,所述步骤3的具体方法为:

31、步骤3.1:输入用户行为序列嵌入矩阵ex∈rn×k;

32、步骤3.2:循环变量i2,且i2赋初值为1;

33、步骤3.3:如果i2≤len(xu)则跳转到步骤3.4,否则跳转到步骤3.10;

34、步骤3.4:获取用户行为序列嵌入矩阵ex∈rn×k中的第i2行向量ex;

35、步骤3.5:在头空间h中,通过三种不同的线性变换将用户行为嵌入向量ex映射到查询向量键向量和值向量计算公式为:其中表示可训练的参数矩阵;

36、步骤3.6:用点乘计算查询向量和键向量之间的相似度,得到相似度得分函数其中dh为头空间的维度大小;

37、步骤3.7:将得分函数通过softmax归一化得到注意力权重

38、步骤3.8:通过注意力权重ai,j对值向量进行加权求和得到ex在头部空间h高阶特征表示

39、步骤3.9:增加循环变量i2的值,跳转到步骤3.4;

40、步骤3.10:结束循环,将所有头空间学习到的高阶特征向量进行拼接,然后再进行线性变换得到用户的短期偏好表示其中n是头空间数量,并且wn是线性投影矩阵。

41、进一步地,所述步骤4的具体方法为:

42、步骤4.1:定义时间区间集合t={e,w,m,s}分别表示日、周、月、季;

43、步骤4.2:定义用户集合u,项目集合i,定义用户u在时间t内对网络安全工具项的评分为rui;

44、步骤4.3:定义循环变量i3,且i3赋初值为1;

45、步骤4.4:如果i3≤len(t)则跳转到步骤4.4,否则跳转到步骤4.8;

46、步骤4.5:计算用户u在时间区间t内对网络安全工具类别j的加权评分频数其中it表示用户u在时间区间t内对网络安全工具评分过的集合,bij表示i是否属于类别j,是为1,否为0;

47、步骤4.6:计算时间区间t内用户u对各类别网络安全工具评分的方差其中表示用户u对类别j的加权评分,c为类别数目;

48、步骤4.7:增加循环变量i3的值,跳转到步骤4.4;

49、步骤4.8:结束循环,将不同时间区间的评分方差取平均,得到用户u的整体的评分方差其中p表示时间区间集t的大小;

50、步骤4.9:用户的偏好波动值为

51、进一步地,所述步骤5的具体方法为:

52、步骤5.1:将偏好波动值fu映射为一个向量fu_vec,使用全连接层进行矢量转换,得到长度相同的fu_vec;

53、步骤5.2:将用户的长期偏好、短期偏好、用户特征向量以及偏好波动值进行多模态融合,得到目标特征向量其中,concat表示拼接操作,表示用户的短期偏好,gt表示用户的长期偏好,eu表示用户特征向量,fu_vec表示用户的偏好波动向量;

54、步骤5.3:将目标特征向量g输入全连接神经网络进行非线性变换;

55、步骤5.4:网络隐藏层使用dice激活函数来学习非线性关系;

56、步骤5.5:输出层使用softmax函数计算预测概率其中wh为可训练参数矩阵,bh为偏置向量,dh为第h层的隐层输出,表示推荐下一个网络安全工具的概率。

57、本发明还公开一种基于时序空间特征和偏好波动的网络安全工具智能推荐装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述计算机程序被加载至处理器时实现上述基于时序空间特征和偏好波动的网络安全工具智能推荐方法。

58、有益效果:

59、本发明主要通过时空gru算法、注意力机制和偏好波动技术来学习用户的长期偏好、短期偏好和偏好波动值来学习用户的整体偏好,从而更准确、高效的进行下一个位置的推荐。具体的通过改进的gru算法将连续时间因子离散化,并引入了特定的时间转换矩阵和距离转换矩阵,通过考虑时间和空间因素,能够更准确地捕捉用户的长期行为特征,还能够避免传统循环神经网络模型中的梯度下降问题。同时,通过多头注意力机制,我们能够从用户的短期行为中提取出最相关的特征,以准确表示用户的短期兴趣。偏好波动通过分析不同时间用户偏好变化趋势,对用户当前兴趣预测更准确;最重要的是,将时空信息、用户特征、长期和短期偏好以及偏好波动向量综合融合,以生成全面的用户兴趣特征,可以更准确地进行个性化、高质量的网络安全工具推荐,进一步提高了网络安全性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1