日志模板获取方法、装置、计算机设备及存储介质与流程

文档序号:33987518发布日期:2023-04-29 13:54阅读:38来源:国知局
日志模板获取方法、装置、计算机设备及存储介质与流程

本申请属于计算机,具体涉及一种日志模板获取方法、装置、计算机设备及存储介质。


背景技术:

1、计算机系统、云服务器以及智能手机、笔记本电脑等系统在运行时经常会出现故障和安全事件等异常情况,日志作为上述系统运行时的一部分,是人们获取上述异常情况的重要途径之一,而对日志模板进行提取是异常检测、故障诊断等运维工作不可或缺的重要手段。

2、目前,主要通过日志分词长度对日志进行分组聚合后,再对日志模板进行提取,而不同日志事件或者相同的日志事件产生的日志消息可能具有相同的日志消息长度,造成变长变量日志场景下日志模板的增加和重读,导致提取的日志模板准确率较低。

3、该背景技术部分中包括的信息仅用于增强对本公开的一般背景的理解,并且不能被视为对该信息构成本领域技术人员已知的现有技术的承认或任何形式的暗示。


技术实现思路

1、本申请提供一种日志模板获取方法、装置、计算机设备及存储介质,以提高日志模板提取的准确率。

2、一种日志模板获取方法,所述方法包括:

3、获取当前日志数据,并进行预处理,得到待处理日志数据;

4、对所述待处理日志数据中的每条当前日志进行分词处理,得到每条所述当前日志对应的当前日志分词组;

5、获取预设的词频统计信息,并根据所述预设的词频统计信息和每条所述当前日志对应的当前日志分词组对每条所述当前日志进行分组,得到多个日志分组;

6、根据所述预设的词频统计信息、所述日志分组和预设的日志模板数据库,获取目标日志模板。

7、一种日志模板获取装置,所述装置包括:

8、第一预处理模块,用于获取当前日志数据,并进行预处理,得到待处理日志数据;

9、第一分词处理模块,用于对所述待处理日志数据中的每条当前日志进行分词处理,得到每条所述当前日志对应的当前日志分词组;

10、日志分组模块,用于获取预设的词频统计信息,并根据所述预设的词频统计信息和每条所述当前日志对应的当前日志分词组对每条所述当前日志进行分组,得到多个日志分组;

11、模板确定模块,用于根据所述预设的词频统计信息、所述日志分组和预设的日志模板数据库,获取目标日志模板。

12、一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述日志模板获取方法。

13、一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述日志模板获取方法。

14、上述日志模板获取方法、装置、计算机设备及存储介质,获取当前日志数据,并进行预处理,得到待处理日志数据;对待处理日志数据中的每条当前日志进行分词处理,得到每条当前日志对应的当前日志分词组;获取预设的词频统计信息,并根据预设的词频统计信息和每条当前日志对应的当前日志分词组对每条当前日志进行分组,得到多个日志分组;通过预设的词频统计信息和当前日志的当前日志分词组对当前日志进行准确分组,有效避免在变长变量日志场景下由于日志事件的当前日志的长度不同,造成当前日志分类不准确的问题,然后根据预设的词频统计信息、每个日志分组和预设的日志模板数据库,获取目标日志模板,从而提高日志模板提取的准确率。



技术特征:

1.一种日志模板获取方法,其特征在于,所述方法包括:

2.根据权利要求1所述的日志模板获取方法,其特征在于,所述获取预设的词频统计信息之前,所述方法还包括:

3.根据权利要求1所述的日志模板获取方法,其特征在于,所述根据所述预设的词频统计信息和每条所述当前日志对应的当前日志分词组对每条所述当前日志进行分组,得到多个日志分组,包括:

4.根据权利要求1所述日志模板获取方法,其特征在于,所述预设的日志模板数据库包括多个索引信息和每个所述索引信息关联的日志模板;

5.根据权利要求4所述的日志模板获取方法,其特征在于,所述根据所述日志分组包含的每条所述当前日志对应的当前日志分词组、所述预设的词频统计信息和所述待比较日志模板,获取所述目标日志模板,包括:

6.根据权利要求5所述的日志模板获取方法,其特征在于,所述根据所述日志分组包含的每条所述当前日志对应的当前日志分词组、所述预设的词频统计信息和所述待比较日志模板确定所述日志分组与所述待比较日志模板的相似度值,包括:

7.根据权利要求5所述的日志模板获取方法,其特征在于,所述根据所述相似度值、所述待比较日志模板和所述日志分组包含的每条所述当前日志对应的日志分词组,获取所述目标日志模板,包括:

8.一种日志模板获取装置,其特征在于,所述装置包括:

9.一种计算机设备,其特征在于,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的日志模板获取方法。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的日志模板获取方法。


技术总结
本申请提供日志模板获取方法、装置、计算机设备及存储介质,应用于计算机技术领域,该方法包括:获取当前日志数据,并进行预处理,得到待处理日志数据;对待处理日志数据中的每条当前日志进行分词处理,得到每条当前日志对应的当前日志分词组;获取预设的词频统计信息,并根据预设的词频统计信息和每条当前日志对应的当前日志分词组对每条当前日志进行分组,得到多个日志分组,实现对当前日志进行准确分组,有效避免在变长变量日志场景下由于日志事件的当前日志的长度不同,造成当前日志分类不准确的问题,然后根据预设的词频统计信息、每个日志分组和预设的日志模板数据库,获取目标日志模板,从而提高日志模板提取的准确率。

技术研发人员:隋毅,赵硕,王宇,范潇,李翔,肖莉
受保护的技术使用者:中国电信股份有限公司
技术研发日:
技术公布日:2024/1/11
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1