一种故障预测方法及装置与流程

文档序号:15817937发布日期:2018-11-02 22:49阅读:209来源:国知局
一种故障预测方法及装置与流程

本申请涉及电子信息领域,尤其涉及一种故障预测方法及装置。

背景技术

目前,在运营商的移动业务支撑领域以及业务支撑领域,排查故障的过程为:通过人工方式查询代码进行分析,使用人工排除的模式逐步定位问题。运营时遇到的故障,事后对收集到的数据进行人工分析,得到故障原因。

现有的故障排查方式,只能在故障发生后进行,而不具备预测的前瞻性。因此,如何有效对故障进行预测,成为目前亟待解决的问题。



技术实现要素:

本申请提供了一种故障预测方法及装置,目的在于解决如何有效对故障进行预测的问题。

为了实现上述目的,本申请提供了以下技术方案:

一种故障预测方法,包括:

从实时关键绩效指标kpi数据中提取特征数据;

将提取的所述特征数据拟合为曲线;

在所述曲线的幅值不在预设范围的情况下,输出故障的类型概率。

可选的,在所述输出故障的类型概率之前,还包括:

在所述曲线的幅值不在预设范围的情况下,发出故障提示。

可选的,在所述从实时关键绩效指标kpi数据中提取特征数据之前,还包括:

采用根因分析法,确定待提取的所述特征数据的类型。

可选的,所述采用根因分析法包括:

使用决策树进行根因分析,或者,将根问题转化成多个分类问题,使用神经网络,得到各个分类问题导致根问题的概率。

可选的,所述在所述曲线的幅值不在预设范围的情况下,输出故障的类型概率包括:

使用经过预先的分类器,在所述曲线的幅值不在预设范围的情况下,输出故障的类型概率;

所述分类器的预先训练过程包括:

从历史kpi数据中提取特征数据;

获取人工提供的所述特征数据的标记信息;

使用所述特征数据以及所述特征数据的标记信息,训练所述分类器。

一种故障预测装置,包括:

提取模块,用于从实时关键绩效指标kpi数据中提取特征数据;

拟合模块,用于将提取的所述特征数据拟合为曲线;

输出模块,用于在所述曲线的幅值不在预设范围的情况下,输出故障的类型概率。

可选的,还包括:

提示模块,用于在所述曲线的幅值不在预设范围的情况下,发出故障提示。

可选的,所述提取模块还用于:

在所述从实时关键绩效指标kpi数据中提取特征数据之前,采用根因分析法,确定待提取的所述特征数据的类型。

可选的,所述提取模块用于采用根因分析法包括具体用于:

所述提取模块具体用于,使用决策树进行根因分析,或者,将根问题转化成多个分类问题,使用神经网络,得到各个分类问题导致根问题的概率。

可选的,所述输出模块用于在所述曲线的幅值不在预设范围的情况下,输出故障的类型概率包括:

所述输出模块具体用于,使用经过预先的分类器,在所述曲线的幅值不在预设范围的情况下,输出故障的类型概率;所述分类器的预先训练过程包括:从历史kpi数据中提取特征数据;获取人工提供的所述特征数据的标记信息;使用所述特征数据以及所述特征数据的标记信息,训练所述分类器。

本申请所述的故障预测方法及装置,将从实时kpi数据中提取的特征数据拟合为一条曲线,在曲线的幅值不在预设范围的情况下,发出故障提示,并输出故障的类型概率。与现有的故障排查方式相比,能够预测故障,并且,减少人工分析带来的压力和滞后性,具有较高的实时性和准确性,能够降低漏告警和误告警的可能性。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例公开的一种故障预测方法的流程图;

图2为使用决策树分析响应时间srt的示例图;

图3为将根问题转化成多个分类问题,得到各个分类问题导致根问题的概率的示例图;

图4为本申请实施例公开的对分类器进行训练的过程的流程图;

图5为本申请实施例公开的标记交互界面的示意图;

图6为本申请实施例公开的一种故障预测装置的结构示意图。

具体实施方式

本申请提供的故障预测方法,可以应用在对于运营商的移动业务支撑领域以及业务支撑领域的故障预测场景中。从实时关键绩效指标(keyperformanceindicators,kpi)数据中提取特征数据,并将特征数据拟合为一条曲线,在系统运行的过程中,曲线幅值超出预设范围视为故障,并输出故障类型的概率。

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

图1为本申请实施例公开的一种故障预测方法,包括以下步骤:

s101:从实时kpi数据中提取特征数据。

本实施例中,采用根因分析法,确定出需要提取出哪些类型的特征数据。

根因分析,是指分析出导致事件的原因,针对本实施例,即分析出导致各个故障的特征数据的类型。从kpi数据中提取的特征数据所属的类型,即为导致各个故障的特征数据的类型组成的类型集合的子集。

具体的,本实施例中,根因分析方包括两种具体的实现方式:

1、使用决策树进行根因分析:即搜集向量,不同的影响因素的数据构成一个向量。根据搜集到的向量,构造出决策树,具体的构造方式可以参见现有技术,这里不再赘述。

图2为使用决策树分析响应时间(searchresponsetime,srt)的示例,图2中,针对网页响应慢(其中,lowsrt表示低系统响应时间,highsrt表示高系统响应时间)的问题,从打开网页的四个属性{#images(图片数量),browserengine(浏览器引擎),isp(网络提供商),是否响应慢}搜集向量,例如{12,webkit,chinatelecom,是}。根据搜集到的向量集,构造出如图2所示的决策树。图中放大部分表示:当#images>32且browserengine=webkit且isp=chinatelecom时候,highsrt概率是38%。

2、将根问题转化成多个分类问题,得到各个分类问题导致根问题的概率。

如图3所示,将特征值向量输入神经网络,在经过神经网络中的权重w以及偏移量b的运算后,神经网络的分类函数softmax输出导致根问题的各个原因(即分类问题)的概率y。

例如,使用根因分析法确定出需要提取的特征数据的类型分别为cpu占用率、内存占用率和i/o利用率,则从实时kpi数据中提取出的特征数据为:(60%,30%,40%),其中,60%为cpu占用率,30%为内存占用率,40%为i/o利用率。

其中,可以依据经验将根问题转化成多个分类问题。

s202:使用经过训练的分类器,依据提取的特征数据确定故障的类型。

经过训练的分类器的功能为:1、将提取的特征数据拟合为一条曲线。2、在曲线的幅值不在预设范围的情况下,发出故障提示。3、输出故障的类型概率。例如,输出:故障的类型为“缴费接口忙”的概率为90%,故障的类型为“缴费流程故障”的概率为10%。

具体的,如图4所示,对分类器进行训练的过程包括以下步骤:

s401:从历史kpi数据中提取特征数据。

具体的,从历史kpi数据中提取的特征数据的类型,为前述使用根因分析法确定的导致各个故障的特征数据的类型组成的类型集合的子集。

s402:获取运维人员提供的特征数据的标记信息。

所述特征数据的标记信息是指,将提取的特征数据归类为故障类型的概率。例如,提取的特征数据为(60%,30%,40%),其中,60%为cpu占用率,30%为内存占用率,40%为i/o利用率,则该特征数据的标记信息为:缴费接口忙的概率为90%,缴费流程故障的概率为10%。

具体的,可以依据根因分析的结果确定各个体征数据的标记信息。例如,使用图3所示的神经网络,得到导致根问题的各个原因的概率。

具体的,可以显示图5所示的标记交互界面,用于接收用户输入的标记信息。其中,曲线依据特征数据绘制,灰度条为用户标记的故障事件窗口,用户可以输入故障类型的概率(输入界面图5中未画出)。

人工标记的优点在于,对于假告警进行过滤,即不标记为故障;减少漏掉故障特征数据的可能性;对于历史kpi数据中的故障特征数据进行有效比标记。

s403:使用特征数据以及特征数据的标记信息,训练分类器。

具体的,分类器可以使用随机森林算法模型。完成训练的分类器的作用为:1、将提取的特征数据拟合为一条曲线。2、在曲线的幅值不在预设范围的情况下,发出故障提示。3、输出故障的类型概率。

其中,预设范围的上限和下限为阈值,训练的过程中,依据不同故障类型的标记,确定出不同故障类型的阈值,从而确定所述阈值。

对于随机森林算法模型的训练过程,可以参见现有技术,这里不再赘述。

从以上过程可以看出,本实施例中,使用人工标记的历史kpi中的特征数据,训练分类器,并使用训练后的分类器,将从实时kpi数据中提取的特征数据拟合为一条曲线,在曲线的幅值不在预设范围的情况下,发出故障提示,并输出故障的类型概率。与现有的故障排查方式相比,能够预测故障,并且,减少人工分析带来的压力和滞后性,具有较高的实时性和准确性,能够降低漏告警和误告警的可能性。

图6为本申请实施例公开的一种故障预测装置,包括:提取模块、拟合模块和输出模块,可选的,还可以包括提示模块。

其中,提取模块用于从实时关键绩效指标kpi数据中提取特征数据。拟合模块用于将提取的所述特征数据拟合为曲线。输出模块用于在所述曲线的幅值不在预设范围的情况下,输出故障的类型概率。提示模块用于在所述曲线的幅值不在预设范围的情况下,发出故障提示。

上述各个模块的功能实现可以参考上述方法实施例,这里不再赘述。

本实施例公开的故障预测装置,依据特征数据,使用数据拟合技术以及幅值判断技术输出故障的类型,与现有的故障预测方法相比,具有较高的实时性和准确性,能够降低漏告警和误告警的可能性。

本申请实施例方法所述的功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算设备可读取存储介质中。基于这样的理解,本申请实施例对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一台计算设备(可以是个人计算机,服务器,移动计算设备或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1