1.一种带状态流计算系统中的异常监控及预测方法,包括以下步骤:
S1:对带状态流计算系统的运行状态进行实时监控,采集系统运行时的特征属性E,并将这些特征属性存储在历史样本集中;
S2:对历史样本集中的数据进行归一化处理,将归一化处理后的数据进行降维处理,得到降维空间F;
S3:对降维空间F的特征向量进行分类处理;将降维空间F的特征向量作为SVM分类器的输入,输出最优分类平面S1,得到训练好的SVM分类器。
S4:利用马尔科夫模型计算历史样本集的转移概率并得到转移矩阵,然后统计初始时刻数据的分布状况并对系统下一时刻运行状态进行预测;根据预测的系统下一时刻运行状态,输出系统状态所构成的平面S2;
S5:对系统状态所构成的平面S2与最优分类平面S1进行比较,如果系统状态构成的平面S2与最优分类平面S1之间的距离大于阈值β,则进行预警,判定系统状态为异常;
S6:如果判定系统状态为异常,则将异常样本数据回溯到历史样本集,并随机去掉当前历史样本集中正常样本数据,更新分类器。
2.根据权利要求1所述一种带状态流计算系统中的异常监控及预测方法,其特征在于:步骤S1中所述特征属性E包括,E=[可用字节,平均磁盘队列长度,数据包速率,线程数,当前磁盘队列长度,处理器时间,状态转换,系统响应时间,吞吐量,CPU占用率,内存使用率,磁盘I/O,网络I/O,进程数,每个进程的消耗时间,虚拟内存字节数,每个元组的处理时间,原子事件实例序列长度,状态机处理速率,事件响应时间,事件到达率]。
3.根据权利要求1所述一种带状态流计算系统中的异常监控及预测方法,其特征在于:步骤S2所述降维处理的步骤如下:
S21:将特征属性E利用核函数抽象到高维空间中;
S22:将高维空间进行归一化处理;
S23:按照多种划分方式分别划分高维空间,然后在每个空间中进行降维处理;
S24:重复S23的过程,直到当前降维空间与前一降维空间相差小于阈值λ,则停止;
S25:得到最终的降维空间F。
4.一种带状态流计算系统中的异常监控及预测系统,其特征在于:包括系统监控模块、数据处理模块、系统预测模块和结果检测模块;
所述系统监控模块用于对带状态流计算系统的运行状态进行实时监控,采集系统运行时的特征属性E,并将这些特征属性存储在历史样本集中;
所述数据处理模块用于对历史样本集中的数据进行归一化处理,将归一化处理后的数据进行降维,训练出分类器;
所述系统预测模块利用马尔科夫模型计算历史样本集的转移概率并得到转移矩阵,然后统计初始时刻数据的分布状况并对系统下一时刻运行状态进行预测;
所述结果检测模块用于判断系统是否处于异常状态。
5.根据权利要求4所述一种带状态流计算系统中的异常监控及预测系统,其特征在于:还包括分类器更新模块,用于在系统状态异常时,更新分类器,使其能够自适应系统运行状态的变化。
6.根据权利要求4所述一种带状态流计算系统中的异常监控及预测系统,其特征在于:所述系统预测模块包括状态机预判断模块和系统运行状态预测模块;
状态机预判断模块预判断下一时刻状态机的事件到达率的概率,如果预测状态机状态正常,则系统运行状态预测模块根据历史样本集中的数据计算系统下一时刻状态的转移概率和转移矩阵,得到系统下一时刻运行状态,并得到该时刻系统运行状态所构成的状态平面;否则认为系统下一时刻出现异常,直接进行预警。
7.根据权利要求4所述一种带状态流计算系统中的异常监控及预测系统,其特征在于:所述判断系统是否处于异常状态为:对系统预测模块中的系统状态所构成的平面S2与数据处理模块中的最优分类平面S1进行比较,如果系统状态构成的平面S2与最优分类平面S1之间的距离大于阈值β,则进行预警,判定系统状态为异常。