基于页面分析用户异常、模型训练的方法、设备和介质与流程

文档序号:35467065发布日期:2023-09-16 07:10阅读:35来源:国知局
基于页面分析用户异常、模型训练的方法、设备和介质与流程

本技术涉及计算机,特别是涉及一种基于页面分析用户异常的方法、一种基于页面的模型训练方法、一种电子设备和一种存储介质。


背景技术:

1、随着计算机技术的发展,越来越多的用户在网络上执行各种操作,例如购物、打游戏、浏览新闻等。用户可以通过浏览器访问各种页面,也可通过应用程序(application,app)访问页面。

2、但是,如果用户在访问页面中出现问题,例如无法找到想要的内容,又如页面出现问题等,通常需要用户单独联系客服,用户可以通过在线的客服页面联系客服,也可以通过电话或其他应用反馈联系客服。通过客服可以给用户提供所需的客户服务,解决相应的问题,从而提高用户体验。

3、但是,目前的客户服务通常都是被动式的,即需要用户主动联系客服,才能提供客户服务,使得问题无法及时得到解决。


技术实现思路

1、本技术实施例提供了一种基于页面分析用户异常的方法,以能够及时发现异常用户。

2、相应的,本技术实施例还提供了一种基于页面的模型训练方法、一种电子设备和一种存储介质,用以保证上述系统的实现及应用。

3、为了解决上述问题,本技术实施例公开了一种基于页面分析用户异常的方法,其中,所述方法包括:通过日志解析器对日志数据进行解析,确定访问数据,访问数据包括:页面数据、用户标识、时间戳和会话标识;筛选用户标识相同且会话标识相同的至少两个页面数据,在字典中查询所述至少两个页面数据对应的页面代码;基于时间戳,采用页面编码器对页面代码、用户标识和会话标识进行编码处理,生成页面序列;将所述页面序列输入到分析模型中进行分析,输出所述用户的异常分值,所述分析模型包括:编码器、投影层和池化层;在所述异常分值满足预设条件的情况下,将对应用户作为异常用户;为所述异常用户提供与异常相关的信息。

4、可选的,所述分析模型对页面序列执行以下分析处理步骤:将所述页面序列输入到编码器中,输出对应的第一分值;将所述第一分值输入到投影层进行降维处理,输出对应的第二分值;

5、将所述第二分值输入到池化层中,输出对应的异常分值。

6、可选的,所述分析模型还包括:嵌入层,所述将所述页面序列输入到编码器之前,还包括:

7、将所述页面序列输入到所述嵌入层中,得到对应页面向量;基于所述页面序列中各页面的顺序确定位置向量;将所述位置向量和所述页面向量拼接,得到对应的拼接向量。

8、可选的,所述编码器包括:注意力层、归一化层和前向传播层;所述将所述页面序列输入到编码器中,输出对应的第一分值,包括:将所述页面序列输入到注意力层,确定各页面的第三分值;将所述页面序列和第三分值输入到第一归一化层中,确定所述页面序列的第四分值;

9、将所述第四分值输入到所述前向传播层,确定对应的第五分值;将所述第三分值和第五分值输入到第二归一化层中,确定所述页面序列的第一分值。

10、可选的,所述为所述异常用户提供与异常相关的信息,包括:基于所述页面序列分析异常原因,基于所述异常原因分析建议信息;提供所述建议信息。

11、可选的,将所述将对应用户作为异常用户之前,还包括:获取所述用户的历史页面序列,所述历史页面序列可基于历史日志数据确定;将所述页面序列和历史页面序列进行匹配,确定相似信息;若所述相似信息不满足相似条件,则将对应用户作为异常用户。

12、可选的,所述为所述异常用户提供与异常相关的信息,包括:基于页面序列的特征分析异常类型,基于所述异常类型提供以下至少一种信息:提示信息、客服入口信息。

13、本技术实施例还公开了一种基于页面的模型训练方法,其中,所述方法包括:通过日志解析器对历史日志数据进行解析,确定访问数据,访问数据包括:页面数据、用户标识、时间戳和会话标识;筛选用户标识相同且会话标识相同的至少两个页面数据,在字典中查询所述至少两个页面数据对应的页面代码;基于时间戳,采用页面编码器对页面代码、用户标识和会话标识进行编码处理,生成页面序列,作为训练数据;将所述页面序列输入到分析模型中进行分析,输出所述用户的异常分值,所述分析模型包括:编码器、投影层和池化层;基于损失函数对所述用户访问信息进行计算,基于计算结果调整所述分析模型,得到满足设定条件的分析模型,以对页面序列进行分析,确定用户的异常分值,并在所述异常分值满足预设条件的情况下,将对应用户作为异常用户,提供与异常相关的信息。

14、可选的,所述分析模型包括:编码器、投影层和池化层,所述将所述页面序列输入到分析模型中进行分析,输出所述用户的异常分值,包括:将所述页面序列输入到分析模型中,通过所述编码器进行处理,输出对应的第一分值;将所述第一分值输入到投影层进行降维处理,输出对应的第二分值;将所述第二分值输入到池化层中,输出对应的异常分值,作为用户访问信息。

15、可选的,所述分析模型还包括:嵌入层,所述将所述页面序列输入到编码器之前,还包括:

16、将所述页面序列输入到所述嵌入层中,得到对应页面向量;基于所述页面序列中各页面的顺序确定位置向量;将所述位置向量和所述页面向量拼接,得到对应的拼接向量。

17、可选的,所述编码器包括:注意力层、归一化层和前向传播层;所述将所述页面序列输入到编码器中,输出对应的第一分值,包括:将所述页面序列输入到注意力层,确定各页面的第三分值;将所述页面序列和第三分值输入到第一归一化层中,确定所述页面序列的第四分值;

18、将所述第四分值输入到所述前向传播层,确定对应的第五分值;将所述第三分值和第五分值输入到第二归一化层中,确定所述页面序列的第一分值。

19、本技术实施例还公开了一种基于日志的用户检测方法,所述方法包括:从日志数据中提取页面访问的日志记录;依据所述页面访问的日志记录,确定用户访问页面的页面序列;对所述页面序列进行分析,确定用户的用户访问信息;在所述用户访问信息满足预设条件的情况下,将对应用户作为异常用户;为所述异常用户提供与异常相关的信息。

20、可选的,所述依据所述页面访问的日志记录,确定用户访问页面的页面序列,包括:从所述页面访问的日志记录中获取访问页面的访问数据,所述访问数据包括:页面数据、用户标识、时间戳和会话标识;按照所述访问数据,生成对应用户访问页面的页面序列。

21、可选的,所述按照所述访问数据,生成对应用户访问页面的页面序列,包括:对所述访问数据进行分析,确定用户标识相同且会话标识相同的至少两个页面数据;将所述至少两个页面数据按照时间戳排序,生成对应的页面序列。

22、可选的,所述将所述至少两个页面数据按照时间戳排序,生成对应的页面序列,包括:在字典中查询所述页面数据对应的页面代码;将各页面代码按照时间戳的先后顺序进行排列,并拼接用户标识和会话标识,生成页面序列。

23、可选的,所述对所述页面序列进行分析,确定用户的用户访问信息,包括:将所述页面序列输入到分析模型中进行分析,输出所述用户的异常分值,作为用户访问信息。

24、可选的,所述分析模型包括:编码器、投影层和池化层,所述分析模型对页面序列执行以下分析处理步骤:将所述页面序列输入到编码器中,输出对应的第一分值;将所述第一分值输入到投影层进行降维处理,输出对应的第二分值;将所述第二分值输入到池化层中,输出对应的异常分值。

25、可选的,所述分析模型还包括:嵌入层,所述将所述页面序列输入到编码器之前,还包括:将所述页面序列输入到所述嵌入层中,得到对应页面向量;基于所述页面序列中各页面的顺序确定位置向量;将所述位置向量和所述页面向量拼接,得到对应的拼接向量。

26、可选的,所述编码器包括:注意力层、归一化层和前向传播层;所述将所述页面序列输入到编码器中,输出对应的第一分值,包括:将所述页面序列输入到注意力层,确定各页面的第三分值;将所述页面序列和第三分值输入到第一归一化层中,确定所述页面序列的第四分值;

27、将所述第四分值输入到所述前向传播层,确定对应的第五分值;将所述第三分值和第五分值输入到第二归一化层中,确定所述页面序列的第一分值。

28、可选的,所述为所述异常用户提供与异常相关的信息,包括:基于所述页面序列分析异常原因,基于所述异常原因分析建议信息;提供所述建议信息。

29、可选的,所述依据所述页面访问的日志记录,确定用户访问页面的页面序列,包括:通过日志解析器对日志数据进行解析,确定访问数据,访问数据包括:页面数据、用户标识、时间戳和会话标识;在字典中查询页面数据对应的页面代码;基于时间戳,采用页面编码器对页面代码、用户标识和会话标识进行编码处理,生成页面序列。

30、可选的,还包括:获取所述用户的历史页面序列,所述历史页面序列可基于历史日志数据确定;将所述页面序列和历史页面序列进行匹配,确定相似信息;基于所述相似信息确定是否满足预设条件。

31、可选的,所述为所述异常用户提供与异常相关的信息,包括:基于页面序列的特征分析异常类型,基于所述异常类型提供以下至少一种信息:提示信息、客服入口信息。

32、本技术实施例还提供了一种基于日志的模型训练方法,所述方法包括:基于日志数据确定训练数据,所述训练数据包括页面序列;将所述页面序列输入到分析模型中进行分析,输出所述用户的用户访问信息;基于损失函数对所述用户访问信息进行计算,基于计算结果调整所述分析模型,得到满足设定条件的分析模型,以对页面序列进行分析,确定用户的用户访问信息,并在用户访问信息满足预设条件的情况下,将对应用户作为异常用户,提供与异常相关的信息。

33、可选的,所述分析模型包括:编码器、投影层和池化层,所述将所述页面序列输入到分析模型中进行分析,输出所述用户的用户访问信息,包括:将所述页面序列输入到分析模型中,通过所述编码器进行处理,输出对应的第一分值;将所述第一分值输入到投影层进行降维处理,输出对应的第二分值;将所述第二分值输入到池化层中,输出对应的异常分值,作为用户访问信息。

34、可选的,所述分析模型还包括:嵌入层,所述通过所述编码器进行处理之前,还包括:将所述页面序列输入到所述嵌入层中,得到对应页面向量;基于所述页面序列中各页面的顺序确定位置向量;将所述位置向量和所述页面向量拼接,得到对应的拼接向量。

35、可选的,所述编码器包括:注意力层、归一化层和前向传播层;所述通过所述编码器进行处理,输出对应的第一分值,包括:将所述拼接向量输入到注意力层,确定各页面的第三分值;将所述拼接向量和第三分值输入到第一归一化层中,确定所述拼接向量的第四分值;将所述第四分值输入到所述前向传播层,确定对应的第五分值;将所述第三分值和第五分值输入到第二归一化层中,确定所述拼接向量的第一分值。

36、可选的,基于损失函数对所述用户访问信息进行计算,基于计算结果调整所述分析模型,包括:基于交叉熵函数对所述用户访问信息计算损失信息,基于所述损失信息调整所述分析模型的参数。

37、可选的,所述依据所述页面访问的日志记录,确定用户访问页面的页面序列,包括:通过日志解析器对日志数据进行解析,确定访问数据,访问数据包括:页面数据、用户标识、时间戳和会话标识;在字典中查询页面数据对应的页面代码;基于时间戳,采用页面编码器对页面代码、用户标识和会话标识进行编码处理,生成页面序列。

38、可选的,所述依据所述页面访问的日志记录,确定用户访问页面的页面序列,包括:从所述页面访问的日志记录中获取访问页面的访问数据,所述访问数据包括:页面数据、用户标识、时间戳和会话标识;按照所述访问数据,生成对应用户访问页面的页面序列。

39、可选的,所述按照所述访问数据,生成对应用户访问页面的页面序列,包括:对所述访问数据进行分析,确定用户标识相同且会话标识相同的至少两个页面数据;将所述至少两个页面数据按照时间戳排序,生成对应的页面序列。

40、可选的,所述将所述页面数据按照时间戳排序,生成对应的页面序列,包括:在字典中查询所述页面数据对应的页面代码;将各页面代码按照时间戳的先后顺序进行排列,并拼接用户标识和会话标识,生成页面序列。

41、本技术实施例还公开了一种电子设备,包括:处理器,以及与所述处理器通信连接的存储器;所述存储器存储计算机执行指令;所述处理器执行所述存储器存储的计算机执行指令,以实现如本技术实施例所述的方法。

42、本技术实施例还公开了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如本技术实施例所述的方法。

43、与现有技术相比,本技术实施例包括以下优点:

44、本技术实施例中,通过日志解析器对日志数据进行解析,确定访问数据,访问数据包括:页面数据、用户标识、时间戳和会话标识,然后筛选用户标识相同且会话标识相同的至少两个页面数据,在字典中查询所述至少两个页面数据对应的页面代码,再基于时间戳,采用页面编码器对页面代码、用户标识和会话标识进行编码处理,生成页面序列,该页面序列能够体验用户针对页面的访问顺序,然后将所述页面序列输入到分析模型中进行分析,输出所述用户的异常分值,所述分析模型包括:编码器、投影层和池化层,在所述异常分值满足预设条件的情况下,将对应用户作为异常用户,能够基于页面分析存在异常的用户,并且为所述异常用户提供与异常相关的信息,无需用户自行寻求解决的方式,能够及时发现异常并提供对应的信息,提高了访问效率和用户体验。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1