1.一种系统故障预测方法,其特征在于,包括以下步骤:
获取系统实时日志;
将实时日志解析获得包含多个日志序列的矢量化特征集,并通过预设的聚类分析的算法从所述特征集中获得满足预设条件的代表性日志序列;
计算代表性日志序列与知识库中预存的原始代表性日志序列的相似度;
若相似度高于预设阈值,则生成即将发生故障的信息。
2.根据权利要求1所述的系统故障预测方法,其特征在于,所述将实时日志进行解析获得包含多个日志序列的矢量化特征集,并通过预设的聚类分析的算法从所述特征集中获得满足预设条件的代表性日志序列的步骤,具体包括:
将实时日志解析成结构化文本;
根据所述结构化文本提取日志特征,并形成特征集;
将所述特征集进行矢量化;
使用k-means算法对矢量化的特征集进行聚类分析,并形成多个数据集;
通过计算每个数据集的质心提取每个数据集中的代表性日志序列。
3.根据权利要求2所述的系统故障预测方法,其特征在于,将所述特征集进行矢量化的步骤,具体包括:
使用会话窗口将实时日志链接为多个日志序列;
根据日志序列中每个日志事件出现的次数将日志序列转化为日志事件计数向量;
将所述计数向量进行加权计算,形成矢量化特征集。
4.根据权利要求2所述的系统故障预测方法,其特征在于,所述通过计算每个数据集的质心提取每个数据集中的代表性日志序列的步骤,具体包括:
对于每个数据集:
计算数据集中每个日志序列与其它日志序列的距离;
计算每个日志序列与其它日志序列的距离的平均值;
将距离平均值最小的日志序列作为每个数据集的质心,并提取为代表性日志序列。
5.根据权利要求1所述的系统故障预测方法,其特征在于,所述获取系统实时日志的步骤之前,还包括:
获取系统原始日志;
将原始日志进行解析,并通过预设的聚类分析的算法提取原始代表性日志序列;
根据原始代表性日志序列创建知识库。
6.根据权利要求5所述的系统故障预测方法,其特征在于,所述生成即将发生故障的信息的步骤之后,还包括:
确认是否发生故障;
若是,则将所述代表性日志序列更新至知识库。
7.一种系统故障预测装置,其特征在于,包括:
日志获取模块,用于获取系统实时日志;
日志解析模块,用于将实时日志进行解析获得包含多个日志序列的矢量化特征集,并通过预设的聚类分析的算法从所述特征集中获得满足预设条件的代表性日志序列;
故障计算模块,用于计算代表性日志序列与知识库中预存的原始代表性日志序列的相似度;
信息发送模块,用于生成即将发生故障的信息。
8.一种电子设备,包括存储器、处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述权利要求1至6任一项所述的方法的步骤。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有机器可运行指令,所述计算机可运行指令在被处理器调用和运行时,所述计算机可运行指令促使所述处理器运行所述权利要求1至6任一项所述的方法。