本申请涉及关联分析,具体涉及一种关联分析方法及装置。
背景技术:
1、事件关联分析是对历史数据中事件与事件关联关系的挖掘,产生的结果表示了历史数据中的事件与事件之间的关联程度,即在一定规则下共同频繁出现的程度。
2、在智能运维领域,通常是从告警日志或事件日志中获取事件之间的关联关系,而对于告警日志或事件日志,其中的事件是一整个大的基于时间顺序的长事件序列,即带有时间属性的有序长事件序列。
3、但当前常见的关联分析算法有的是针对一个个独立的无序短事件序列,因此算法本身的复杂度较高,有的需要针对事件序列提取前缀树,在处理长事件序列时会提高算法的复杂度,又由于长事件序列相比短事件序列更容易出现重复的子序列,当前算法不具备去重能力,在重复处理相同子序列时会损失计算性能。因此,当前关联分析算法在智能运维领域都不适用。
技术实现思路
1、本申请实施例提供一种关联分析方法及装置,用以解决当前关联分析算法复杂度较高,不适用于长事件序列且不具备去重能力,在重复处理相同子序列时会损失计算性能的技术问题。
2、第一方面,本申请实施例提供一种关联分析方法,包括:
3、将长事件序列拆分为多个子序列;所述长事件序列是从系统日志中抽取的,所述长事件序列包括多个按照时间顺序排列的事件;
4、将任一子序列和所述任一子序列中的起始事件进行组合,得到二维事件;
5、将所有二维事件进行组合,并剔除重复的二维事件,得到二维事件集;
6、对所述二维事件集进行挖掘,得到频繁情节;
7、生成多个频繁情节之间的关联规则。
8、在一个实施例中,所述将长事件序列拆分为多个子序列,包括:
9、计算所述长事件序列中每个事件的出现频度,得到第一出现频度;
10、若所述第一出现频度大于或等于第一频度阈值,则将所述第一出现频度对应的事件确定为起始事件;
11、将任一起始事件和所述任一起始事件的跟随事件进行组合,得到所述长事件序列的子序列;所述跟随事件是所述任一起始事件与下一个相同的起始事件之间的事件。
12、在一个实施例中,所述对所述二维事件集进行挖掘,得到频繁情节,包括:
13、将所述二维事件集中的任一子序列中的起始事件确定为起始项;
14、将所述起始项与所述任一子序列中所述起始项的下一个事件进行组合,得到目标情节;
15、根据所述目标情节的出现频度确定所述目标情节是否为频繁情节;
16、若是,则将所述目标情节确定为起始项,返回将所述起始项与同一子序列中所述起始项的下一个事件进行组合,得到目标情节的步骤,直至得到所述任一子序列中的所有频繁情节。
17、在一个实施例中,所述根据所述目标情节的出现频度确定所述目标情节是否为频繁情节,包括:
18、计算所述目标情节在目标子序列集中的出现频度,得到第二出现频度;所述目标子序列集为与所述目标情节具有相同起始事件的子序列的集合;
19、计算所述第二出现频度,与所述目标子序列集中子序列的数量的比值,得到所述目标情节的相对频度;
20、若所述相对频度大于或等于第二频度阈值,则将所述目标情节确定为频繁情节。
21、在一个实施例中,所述生成多个频繁情节之间的关联规则,包括:
22、根据目标子序列集中各频繁情节的相对频度计算各频繁情节之间的条件概率,得到多个频繁情节之间的关联规则。
23、在一个实施例中,所述得到所述长事件序列的子序列之后,包括:
24、对所述子序列叠加时间窗口,并剔除所述子序列中不属于所述时间窗口内的事件。
25、在一个实施例中,所述将所有二维事件进行组合,并剔除重复的二维事件,得到二维事件集,包括:
26、将所有二维事件中起始事件相同的二维事件进行组合,得到同类二维事件;
27、将所有同类二维事件进行组合,并剔除重复的二维事件,得到二维事件集。
28、第二方面,本申请实施例提供一种关联分析装置,包括:
29、序列拆分模块,用于:将长事件序列拆分为多个子序列;所述长事件序列是从系统日志中抽取的,所述长事件序列包括多个按照时间顺序排列的事件;
30、二维事件生成模块,用于:将任一子序列和所述任一子序列中的起始事件进行组合,得到二维事件;
31、二维事件集生成模块,用于:将所有二维事件进行组合,并剔除重复的二维事件,得到二维事件集;
32、频繁情节挖掘模块,用于:对所述二维事件集进行挖掘,得到频繁情节;
33、关联规则生成模块,用于:生成多个频繁情节之间的关联规则。
34、第三方面,本申请实施例提供一种电子设备,包括处理器和存储有计算机程序的存储器,所述处理器执行所述程序时实现第一方面所述的关联分析方法的步骤。
35、第四方面,本申请实施例提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现第一方面所述的关联分析方法的步骤。
36、本申请提供的关联分析方法及装置,将长事件序列拆分为多个子序列,将任一子序列和任一子序列中的起始事件进行组合,得到二维事件,将所有二维事件进行组合,并剔除重复的二维事件,得到二维事件集,对二维事件集进行挖掘,得到频繁情节,生成多个频繁情节之间的关联规则。一方面,剔除了重复的二维事件,在后续进行频繁情节挖掘和关联规则生成过程中,能够保证挖掘到所有频繁情节的同时,不会因为对相同的二维事件进行重复处理而损失计算性能,另一方面,由于长事件序列中的事件是按照时间顺序排列的,将长事件序列进行拆分后的子序列也带有时间顺序,因此是将对长事件序列的处理转换为对有序短序列的处理,从而降低算法复杂度。因此,本申请能够适配智能运维场景中对事件关联信息的学习和挖掘。
1.一种关联分析方法,其特征在于,包括:
2.根据权利要求1所述的关联分析方法,其特征在于,所述将长事件序列拆分为多个子序列,包括:
3.根据权利要求1所述的关联分析方法,其特征在于,所述对所述二维事件集进行挖掘,得到频繁情节,包括:
4.根据权利要求3所述的关联分析方法,其特征在于,所述根据所述目标情节的出现频度确定所述目标情节是否为频繁情节,包括:
5.根据权利要求4所述的关联分析方法,其特征在于,所述生成多个频繁情节之间的关联规则,包括:
6.根据权利要求2所述的关联分析方法,其特征在于,所述得到所述长事件序列的子序列之后,包括:
7.根据权利要求1所述的关联分析方法,其特征在于,所述将所有二维事件进行组合,并剔除重复的二维事件,得到二维事件集,包括:
8.一种关联分析装置,其特征在于,包括:
9.一种电子设备,包括处理器和存储有计算机程序的存储器,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7任一项所述的关联分析方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7任一项所述的关联分析方法的步骤。