智能运维方法及装置与流程

文档序号:33193165发布日期:2023-02-04 09:36阅读:110来源:国知局
智能运维方法及装置与流程

1.本技术涉及系统运维技术领域,尤指一种智能运维方法及装置。


背景技术:

2.目前,it运维管理是时下信息领域最热门的话题之一。随着it建设的不断深入和完善,计算机硬软件系统的运行维护已经成为了各行各业的信息服务部门普遍关注和不堪重负的问题。随着数据量的迅速增加、设备数的不断上升、软硬件系统的愈发复杂。早期的运维工作大部分是由运维人员手工完成的,这被成为手工运维或人肉运维;这种落后的生产方式,在互联网业务快速扩张、人力成本高企的时代难以维系。同时,传统的运维方式给运维工程师带来的工作压力越来越重,大型企业对运维的人力、物力的需求也越来越大。
3.通常,在aiops(artificial intelligence for it operations,智能运维)场景下的故障检测功能通常是一个分类任务。而在一个分类任务的数据集中,如果来自不同类别的训练样例数目差别很大,则认为该数据集是类别不平衡的。在不同的任务中,数据的不平衡比可能不同,范围从小于十到数千不等。将基于这类数据的分类任务统称为样本不平衡分类。
4.在许多实际任务中,数据通常规模庞大并且包含大量噪声,并且不同类别样本的数量差别巨大。与多数类别样本相比,少数类别样本的数量只占很小的比例。以一个现实任务为例:在点击率预估(click-through rate prediction)任务中,每条展示给用户的广告都产生一条新样本,而用户最终是否点击了这条广告决定了样本的标签。在实际中只有很少一部分的用户会去点击网页里的嵌入广告,这就导致最终得到的训练数据集中正/负例样本的数量差距悬殊。同样的情况也发生在很多实际应用场景中,如金融欺诈检测(正常/欺诈),医疗辅助诊断(正常/患病),网络入侵检测(正常连接/攻击连接)等等。
5.而aiops场景下的故障检测(正常/故障)也是一个不同类别样本数量差别巨大的场景,实际的运维场景下故障出现的次数较之正常运行的次数是很少的,这也会使得到的训练数据集中正/负例样本的数量差距悬殊;而模型在训练的过程中更加关注的是整体样本的预测准确率,这两方面也最终导致训练得到的模型在对少量样本的检测效果会有一定程度上的不理想。


技术实现要素:

6.针对现有技术中存在的问题,本技术实施例的主要目的在于提供一种智能运维方法及装置,实现准确的智能运维,提高运维效果与效率。
7.为了实现上述目的,本技术提供一种智能运维方法,所述方法包括:获取运维系统采集到的实时运行数据;通过基于样本均衡损失技术构建的故障检测模型分析所述实时运行数据获得故障检测结果;根据所述故障检测结果获得运维策略,根据所述运维策略进行对应的运维处理。
8.本技术提供一种智能运维方法,可选的,所述方法还包含:获取历史系统运行数
据,对所述历史系统运行数据预处理生成训练样本数据;通过预设的损失函数采样所述训练样本数据获得正负样本均衡的有效样本;根据所述损失函数和所述有效样本通过树类型算法构建所述故障检测模型。
9.本技术提供一种智能运维方法,可选的,通过预设的损失函数采样所述训练样本数据获得正负样本均衡的有效样本包含:通过预设的损失函数定义采样的无重权和反向类频率重权之间的类平衡项;根据所述类平衡项采样所述训练样本数据获得正负样本均衡的有效样本。
10.本技术提供一种智能运维方法,可选的,根据所述损失函数和所述有效样本通过树类型算法构建所述故障检测模型包含:根据所述有效样本中样本数量确定不同类别样本对应的有效样本数量;根据不同类别样本对应的有效样本数量对预设的损失函数进行参数更新;根据所述训练样本数据中的有效样本及参数更新后的损失函数通过树类型算法构建获得所述故障检测模型。
11.本技术提供一种智能运维方法,可选的,根据所述训练样本数据中的有效样本及参数更新后的损失函数通过树类型算法构建获得所述故障检测模型包括:利用提升树类型算法及参数更新后的损失函数,确定每一有效样本对应的损失函数负梯度值;利用提升树类型算法及损失函数负梯度值对所述有效样本进行样本遍历获得约束参数;根据所述约束参数调整初始梯度提升算法回归模型构建所述故障检测模型。
12.本技术提供一种智能运维方法,可选的,利用提升树类型算法及损失函数负梯度值对所述有效样本进行样本遍历获得约束参数包括:利用提升树类型算法及损失函数负梯度值进行样本遍历获得损失函数最小值;根据所述损失函数最小值进行残差拟合获得约束参数。
13.本技术提供一种智能运维方法,可选的,根据所述约束参数调整初始梯度提升算法回归模型构建所述故障检测模型包含:根据每轮所述梯度提升算法回归模型计算得到的所述约束参数训练后一轮梯度提升算法回归模型;所述初始梯度提升算法回归模型通过预设迭代次数的训练获得所述故障检测模型。
14.本技术还提供一种智能运维装置,所述装置包括:采集模块,用于获取运维系统采集到的实时运行数据;分析模块,用于通过基于样本均衡损失技术构建的故障检测模型分析所述实时运行数据获得故障检测结果;处理模块,用于根据所述故障检测结果获得运维策略,根据所述运维策略进行对应的运维处理。
15.本技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行所述程序时实现上述方法。
16.本技术还提供一种计算机可读存储介质,计算机可读存储介质存储有执行上述方法的计算机程序。
17.本技术还提供一种计算机程序产品,包括计算机程序/指令,计算机程序/指令被处理器执行时实现上述方法的步骤。
18.本技术通过建立故障检测模型解决样本不均衡的问题,使得故障检测模型对数量占比极小的异常样本拥有更好的检测效果,在进行故障智能预警及检测的同时,可以在故障影响范围较小、甚至在故障发生以前监测到异常并进行告警,使运行维护工作更加顺利地进行,并且降低运维人力及物力,提高运维效果与效率。
附图说明
19.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
20.图1a为本技术实施例一种智能运维方法的流程图;
21.图1b为本技术实施例提供的故障检测模型训练的流程图;
22.图2为本技术实施例中有效样本采样的流程图;
23.图3为本技术实施例中故障检测模型的构建流程图;
24.图4为本技术实施例中损失函数的更新流程示意图;
25.图5为本技术实施例中约束参数的获取流程图;
26.图6为本技术实施例中故障检测模型迭代训练流程图;
27.图7为本技术实施例中智能运维装置的结构示意图;
28.图8为本技术实施例中智能运维装置的应用逻辑示意图;
29.图9为本技术另一实施例中智能运维装置的结构示意图;
30.图10为本技术一实施例所提供的电子设备的结构示意图。
具体实施方式
31.本技术实施例提供一种智能运维方法及装置,可用于金融领域及其他领域,需要说明的是,本技术的智能运维方法及装置可用于金融领域,也可用于除金融领域之外的任意领域,本技术的智能运维方法及装置应用领域不做限定。
32.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
33.如图1a所示为本技术实施例一种智能运维方法的流程图,本技术实施例提供的智能运维方法的执行主体包括但不限于计算机。本技术通过建立故障检测模型解决样本不均衡的问题,使得故障检测模型对数量占比极小的异常样本拥有更好的检测效果,在进行故障智能预警及检测的同时,可以在故障影响范围较小、甚至在故障发生以前监测到异常并进行告警,使运行维护工作更加顺利地进行,并且降低运维人力及物力,提高运维效果与效率。图1a中所示方法包括:
34.步骤s1,获取运维系统采集到的实时运行数据。
35.作为本技术的一个实施例,实时运行数据和后续采用的历史系统运行数据可包括:系统成功率、cpu使用率、内存使用率、服务响应时间、服务耗时、网络速率及监控报文。
36.其中,收集it系统运行过程中的各类历史系统运行数据,包括系统级信息(cpu使用率、内存使用率、网速等),以及应用级信息(交易成功率、交易响应时间等),以及使用积累的巨量原始告警信息和相对应的告警人工标注信息。收集历史系统运行数据后,将历史系统运行数据作为模型的训练样本数据。
37.作为本技术的一个实施例,方法还包括:对历史系统运行数据进行预处理;其中,
预处理包括噪声过滤、数据清洗及数据分析。
38.其中,对实时运行数据和历史系统运行数据进行预处理,具体的,预处理包括噪声过滤、数据清洗、数据相关性分析、主成分分析、pca降维等数据预处理过程。
39.步骤s2,通过基于样本均衡损失技术构建的故障检测模型分析所述实时运行数据获得故障检测结果。
40.步骤s3,根据所述故障检测结果获得运维策略,根据所述运维策略进行对应的运维处理。
41.其中,由于智能运维场景下故障出现的次数较之正常运行的次数是很少的,这会使得到的训练数据集中正/负例样本的数量差距悬殊,故本技术采用基于样本不均衡的学习技术方法提升模型对于少量故障场景下的数据的检测效果提升,故障智能预警/检测使用lightgbm分类器实现。在上述步骤s3中,故障检测结果包括系统当前的故障检测结果,也可以包括系统故障的预测结果;基于该结果可结合提前设定的运维策略进行对应运维处理,该过程可根据实际需要,由本领域相关技术人员设定,本技术在此并不做进一步限定。
42.作为本技术的一个实施例,如图1b所示,本技术所提供的故障检测模型的构建方法具体包含:
43.步骤s4,获取历史系统运行数据,对所述历史系统运行数据预处理生成训练样本数据;
44.该预处理流程已在前述实施例中详细说明,在此就不再一一详述。
45.步骤s5,通过预设的损失函数采样所述训练样本数据获得正负样本均衡的有效样本;
46.步骤s6,根据所述损失函数和所述有效样本通过树类型算法构建所述故障检测模型。
47.作为本技术的一个实施例,如图2所示,通过预设的损失函数采样所述训练样本数据获得正负样本均衡的有效样本包括:
48.步骤s21,通过预设的损失函数定义采样的无重权和反向类频率重权之间的类平衡项;
49.步骤s22,根据所述类平衡项采样所述训练样本数据获得正负样本均衡的有效样本。
50.在上述实施例中,主要是基于样本不均衡的学习技术方法是通过定义特殊的预设的损失函数(loss)来实现的,该loss的计算方式如公式(1)所示。
[0051][0052]
其中,n_y是类别y的有效样本数的数量。β=0对应没有重新加权,β

1对应于反向频率进行加权。在该损失函数中,利用β作为类平衡项来实现正负样本均衡的采集,具体实现方式及原理将在后续实施例中详细说明,在此就不再一一举例。
[0053]
在本本技术一实施例中,如图3所示,根据所述损失函数和所述有效样本通过树类型算法构建所述故障检测模型包括:
[0054]
步骤s31,根据所述有效样本中样本数量确定不同类别样本对应的有效样本数量;
[0055]
步骤s32,根据不同类别样本对应的有效样本数量对预设的损失函数进行参数更
新;
[0056]
步骤s33,根据所述训练样本数据中的有效样本及参数更新后的损失函数通过树类型算法构建获得所述故障检测模型。
[0057]
其中,如图4所示,在步骤s33中根据所述训练样本数据中的有效样本及参数更新后的损失函数通过树类型算法构建获得所述故障检测模型可包括:
[0058]
步骤s41,利用提升树类型算法及参数更新后的损失函数,确定每一有效样本对应的损失函数负梯度值;
[0059]
步骤s42,利用提升树类型算法及损失函数负梯度值对所述有效样本进行样本遍历获得约束参数;
[0060]
步骤s43,根据所述约束参数调整初始梯度提升算法回归模型构建所述故障检测模型。
[0061]
具体的,en表示样本的有效数量,为了简化问题,本技术将一个新采样的数据点限定为只能以两种方式与之前的采样数据交互:完全在之前的采样数据集中,概率为p,或完全在原来的数据集之外的概率为1-p;因此,有效数字的定义为en=(1-β^n)/(1-β),其中,β=(n-1)/n。
[0062]
具体的,假设已经有n-1个样本,并且即将对第n个样本进行采样,现在先前采样数据的期望体积为en-1,而新采样的数据点与先前采样点重叠的概率为p=e(n-1)/n。因此,第n个实例采样后的期望体积如公式(2)所示。
[0063][0064]
此时:
[0065]en-1=(1-β
n-1)
/(1-β)
ꢀꢀꢀ
(3)
[0066]
则有:
[0067][0068]
上述命题表明有效果样本数量是n的指数函数,超参数β∈[0,1)控制en随着n的增长有多快。
[0069]
其中,表示正常的损失函数,这里的损失函数采用softmax,给定一个标号为y的样本,该样本的softmax交叉熵(ce)损失记为公式(5)。
[0070][0071]
综上,假设类y有n_y个训练样本,类别平衡交叉熵损失(cb_softmax)如公式(6)所示。
[0072][0073]
此外,这里提出的有效样本数的新概念能够使用一个超参数β来平滑地调整无重
权和反向类频率重权之间的类平衡项。
[0074]
请参考图5所示,在本技术一实施例中,利用提升树类型算法及损失函数负梯度值对所述有效样本进行样本遍历获得约束参数包括:
[0075]
步骤s51,利用提升树类型算法及损失函数负梯度值进行样本遍历获得损失函数最小值;
[0076]
步骤s52,根据所述损失函数最小值进行残差拟合获得约束参数。
[0077]
其中,再请参考图6所示,步骤s51根据所述约束参数调整初始梯度提升算法回归模型构建所述故障检测模型可包含:
[0078]
步骤s61,根据每轮所述梯度提升算法回归模型计算得到的所述约束参数训练后一轮梯度提升算法回归模型;
[0079]
步骤s62,所述初始梯度提升算法回归模型通过预设迭代次数的训练获得所述故障检测模型。
[0080]
在上述实施例中,主要是将前述实施例中定义的损失函数即约束参数β再用于之后gbdt模型的训练过程中,以克服样本不均衡所带来的问题;具体实例如约束参数的获取方式以及通过约束参数调整梯度提升算法回归模型的方法将在后续实施例中详细说明,在此就不再一一详述。
[0081]
作为本技术的一个实施例,方法还包括:获取并存储运维反馈信息,并利用运维反馈信息对故障检测模型进行更新。
[0082]
其中,获取并存储系统运维反馈信息,具体的,运维反馈信息可以为运维人员输入的信息,包括系统检测错误的事件以及新奇事件。此外,将运维反馈信息加入it系统运维信息库,再次进行新一轮的模型训练,使模型的检测准确率不断提升。
[0083]
在本技术一具体实施例中,如图7所示为本技术实施例中应用智能运维方法的系统结构示意图。本技术克服现有传统运维系统在阈值设置、故障检测需要大量人力干预、响应慢等方面的不足,同时利用一种小样本学习技术,针对it运维场景下正负样本不均衡的问题进行解决,提供一种基于创新小样本学习技术的故障智能检测系统,相较于使用传统的机器学习、深度学习算法训练得到的故障检测系统效果会更好,在下文中将该系统称为“aiops智能运维系统”。
[0084]
其中,aiops,即artificial intelligence for it operations,智能运维,将人工智能应用于运维领域,基于已有的运维数据(日志、监控信息、应用信息等),通过机器学习、深度学习等方式来进一步解决传统运维没办法解决的问题。aiops不依赖人为指定规则,主张由人工智能算法自动地从海量运维数据(包括事件本身、各类信息数据以及运维人员的人工处理日志)中不断学习,不断地提炼并总结规则。
[0085]
通常,在aiops场景下的故障检测功能通常是一个分类任务。而在一个分类任务的数据集中,如果来自不同类别的训练样例数目差别很大,则认为该数据集是类别不平衡的。在不同的任务中,数据的不平衡比可能不同,范围从小于十到数千不等。将基于这类数据的分类任务统称为样本不平衡分类。
[0086]
本技术涉及的aiops智能运维系统通过获取到it系统运行过程中的各类系统级、应用级、告警信息数据,其中包括系统级信息(cpu使用率、内存使用率、网速等),以及应用级信息(交易成功率、交易响应时间等),以及使用积累的巨量原始告警信息和相对应的告
警人工标注信息;然后通过深度学习训练得到的故障预警/检测模块、报警信息处理模块,可以进行故障智能预警/检测,使系统可以在故障影响范围较小、甚至在故障发生以前监测到异常并进行告警,使运行维护工作更加顺利地进行;并且在模型训练过程中使用一种创新的小样本学习技术,使得模型对数量占比极小的异常样本拥有更好的检测效果;同时,aiops智能运维系统可在运维过程中不断收集运维人员反馈的错误信息、新奇事件等,将系统的检测模型进行迭代训练更新。
[0087]
在本实施例中,图7所示系统通过获取各类信息数据以及相应的智能处理模块,实现针对it运维信息进行的故障智能预警/检测,相较于传统的监控平台可解决大量人力、物力的问题;并且在模型训练过程中使用一种创新的小样本学习技术,使得本技术中涉及的模型相较于传统的异常检测模型,对数量占比极小的异常样本拥有更好的检测效果。然后根据相应的预/告警进行后续的运维处理;此外,系统可以收集运维人员反馈的错误信息、新奇事件等,将系统的检测模型进行迭代训练更新,不断提升预/告警准确率。
[0088]
其中,运维信息采集与预处理单元:运维信息采集与预处理单元通过收集it系统运行过程中的各类信息数据,并将其进行预处理传递给故障智能预警/检测单元。此单元负责收集业务成功率、系统成功率、cpu使用率、内存使用率、服务响应时间、服务耗时、网络速率、监控报文,以及积累的原始告警信息和相对应的告警人工标注信息等;并且该模块会将这些信息进行噪声过滤、数据清洗、数据相关性分析、主成分分析、pca降维等数据预处理。
[0089]
故障智能预警/检测单元:故障智能预警/检测单元获取到运维信息采集与预处理单元传递到数据后进行故障智能预警模块、故障智能检测模块、报警信息智能去重的模块,并将最终的故障信息传递给后续运维处理单元。在模型训练的过程中使用一种创新小样本学习技术,使得模型对数量占比极小的异常样本拥有更好的检测效果,实现对故障的提前预警、实时检测,可以避免人为难以设置固定监控阈值等问题的发生,故障智能预警/检测模块使用lightgbm分类器实现模型的训练;
[0090]
后续运维处理单元:后续运维处理单元接收到故障智能预警/检测单元发送的故障信息后,主要负责根据预/告警信息进行后续运维操作的进行,包括告警信息展现、短信发送、信息记录、负载均衡、网络限流、服务限流、资源动态扩容、主备切换、运维人员反馈。
[0091]
在本实施例中,如图8所示为基于aiops的智能运维系统中产生运维信息获取、模型训练、模型智能预/告警及后续操作的过程。
[0092]
步骤一:运维信息获取。获取it系统历史运行过程中积累的各类运维数据信息,这些信息包括:业务成功率、系统成功率、cpu使用率、内存使用率、服务响应时间、服务耗时、网络速率、监控报文,原始告警信息,运维人员的操作、反馈信息,和相应的标注信息;并将这些信息进行噪声过滤、数据清洗、数据相关性分析、主成分分析、pca降维等数据预处理;之后,使用这些原始信息数据以及已经预处理过、经过标注的数据构建it系统运维信息库。
[0093]
步骤二:训练故障智能预警/检测模型。使用步骤一中得到的it系统运维信息库进行训练,得到故障智能预警、检测判别模型和报警信息智能去重模型,使得报警阈值可不再人为设定等;由于aiops场景下故障出现的次数较之正常运行的次数是很少的,这会使得到的训练数据集中正/负例样本的数量差距悬殊,故本技术采用基于样本不均衡的学习技术方法提升模型对于少量故障场景下的数据的检测效果提升;故障智能预警/检测使用lightgbm分类器实现。
[0094]
其中,gbdt算法介绍如下:boosting方法是一种常用的集成学习方法,它通过比较每次迭代结果的错误情况,调整样本的权重,训练新一轮的学习器,从而得到多个模型按权重相加的结果。gbdt就是利用boosting思想将若干个决策树进行组合,采用梯度下降的方式计算损失函数,最终形成一个强学习器,因此称为梯度提升树。
[0095]
进一步的,gbdt(gradient boosting decision tree)属于提升树类型算法,由于它是基于上一轮建立的模型,以损失函数按负梯度下降最快的方式,建立新一轮学习模型的,故称为梯度提升树。gbdt可看作由若干个弱学习组合而来的强学习器,假设t轮前得到的弱学习器集成结果为f
t-1
(x),损失函数为l(y,f
t-1
(x)),其中,y为样本的真实值,x标识输入样本的字段,那么目标是找到一个决策树弱学习器h
t
(x),使t轮的损失函数最小,即使该公式最小l(y,f
t
(x))=l(y,f
t-1
(x)+h
t
(x))。
[0096]
具体的,如何使损失函数不断以取值最小的方向发展是gbdt的重点,故freidman提出了负梯度下降最快的方式确定损失函数值,作为回归问题中的提升树残差的近似值,从而训练下一轮决策树。因此,第t轮第i个样本的负梯度表达式如公式(7)所示。
[0097][0098]
故一个完整的梯度提升算法回归模型可用以下流程表示:
[0099]
输入训练样本t={(x1,y1),(x2,y2),...,(xn,yn),},初始化一颗回归决策树f0(x),如公式(8)所示。
[0100][0101]
其中,c为使损失函数最小化的结果输出值,n表示输入样本总数,yi为第i个样本的真实值;
[0102]
2)对每一个样本i,用此时损失函数的负梯度值作为每个样本在当前模型下的残差值,将得到的结果用于训练一个新的回归树。
[0103]
3)遍历叶子节点里的所有样本,确定使损失函数最小的,第t棵树的输出值如公式(9)所示。
[0104][0105]
从而得到第t轮回归树的拟合函数,如公式(10)所示。
[0106][0107]
第t轮后的强学习器表达式如公式(11)所示。
[0108][0109]
重复上述2)~4)步骤,即可得到最终gbdt强学习器的表达式。
[0110]
进一步的,gbdt通过不断迭代方式,每次按负梯度最小值的方法拟合残差,从而达到收敛真实值和预测值的目的。gbdt作为boosting的结果,能灵活处理各类型数据,预测精
度高。
[0111]
步骤三:故障智能预警/检测。在实际运行过程中,系统获取即时的运维信息,经训练好的故障智能预警/检测模型检测后得到相应的预警/故障信息,并进行相关报警信息去重。
[0112]
步骤四:后续运维处理。根据步骤三传出的预警/故障信息,系统或运维人员进行相应的运维操作,包括:告警信息展现、短信发送、信息记录、负载均衡、网络限流、服务限流、资源动态扩容、主备切换、向运维人员反馈。
[0113]
步骤五:it系统运维信息库完善、模型迭代更新。运维人员不断地补充反馈信息,包括系统检测错误的事件以及新奇事件,加入it系统运维信息库,之后新一轮的模型训练,使模型的检测准确率不断提升。
[0114]
至此,本技术系统可实现系统故障的提前预警和智能检测、实现模型迭代更新功能。
[0115]
本技术涉及的aiops智能运维系统通过获取到it系统运行过程中的各类系统级、应用级、告警信息数据,其中包括系统级信息(cpu使用率、内存使用率、网速等),以及应用级信息(交易成功率、交易响应时间等),以及使用积累的巨量原始告警信息和相对应的告警人工标注信息;然后通过深度学习训练得到的故障预警/检测模块、报警信息处理模块,可以进行故障智能预警/检测,使系统可以在故障影响范围较小、甚至在故障发生以前监测到异常并进行告警,使运行维护工作更加顺利地进行;并且在模型训练过程中使用一种创新的基于样本均衡损失技术,使得模型对数量占比极小的异常样本拥有更好的检测效果;同时,aiops智能运维系统可在运维过程中不断收集运维人员反馈的错误信息、新奇事件等,将系统的检测模型进行迭代训练更新。
[0116]
如图9所示为本技术实施例一种智能运维装置的结构示意图,图中所示装置包括:
[0117]
采集模块10,用于获取运维系统采集到的实时运行数据;
[0118]
分析模块20,用于通过基于样本均衡损失技术构建的故障检测模型分析所述实时运行数据获得故障检测结果;
[0119]
处理模块30,用于根据所述故障检测结果获得运维策略,根据所述运维策略进行对应的运维处理。
[0120]
本技术通过建立故障检测模型解决样本不均衡的问题,使得故障检测模型对数量占比极小的异常样本拥有更好的检测效果,在进行故障智能预警及检测的同时,可以在故障影响范围较小、甚至在故障发生以前监测到异常并进行告警,使运行维护工作更加顺利地进行,并且降低运维人力及物力,提高运维效果与效率。
[0121]
本技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述方法。
[0122]
本技术还提供一种计算机程序产品,包括计算机程序/指令,所述计算机程序/指令被处理器执行时实现上述方法的步骤。
[0123]
本技术还提供一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述方法的计算机程序。
[0124]
如图10所示,该电子设备600还可以包括:通信模块110、输入单元120、音频处理器130、显示器160、电源170。值得注意的是,电子设备600也并不是必须要包括图10中所示的
所有部件;此外,电子设备600还可以包括图10中没有示出的部件,可以参考现有技术。
[0125]
如图10所示,中央处理器100有时也称为控制器或操作控件,可以包括微处理器或其他处理器装置和/或逻辑装置,该中央处理器100接收输入并控制电子设备600的各个部件的操作。
[0126]
其中,存储器140,例如可以是缓存器、闪存、硬驱、可移动介质、易失性存储器、非易失性存储器或其它合适装置中的一种或更多种。可储存上述与失败有关的信息,此外还可存储执行有关信息的程序。并且中央处理器100可执行该存储器140存储的该程序,以实现信息存储或处理等。
[0127]
输入单元120向中央处理器100提供输入。该输入单元120例如为按键或触摸输入装置。电源170用于向电子设备600提供电力。显示器160用于进行图像和文字等显示对象的显示。该显示器例如可为lcd显示器,但并不限于此。
[0128]
该存储器140可以是固态存储器,例如,只读存储器(rom)、随机存取存储器(ram)、sim卡等。还可以是这样的存储器,其即使在断电时也保存信息,可被选择性地擦除且设有更多数据,该存储器的示例有时被称为eprom等。存储器140还可以是某种其它类型的装置。存储器140包括缓冲存储器141(有时被称为缓冲器)。存储器140可以包括应用/功能存储部142,该应用/功能存储部142用于存储应用程序和功能程序或用于通过中央处理器100执行电子设备600的操作的流程。
[0129]
存储器140还可以包括数据存储部143,该数据存储部143用于存储数据,例如联系人、数字数据、图片、声音和/或任何其他由电子设备使用的数据。存储器140的驱动程序存储部144可以包括电子设备的用于通信功能和/或用于执行电子设备的其他功能(如消息传送应用、通讯录应用等)的各种驱动程序。
[0130]
通信模块110即为经由天线111发送和接收信号的发送机/接收机110。通信模块(发送机/接收机)110耦合到中央处理器100,以提供输入信号和接收输出信号,这可以和常规移动通信终端的情况相同。
[0131]
基于不同的通信技术,在同一电子设备中,可以设置有多个通信模块110,如蜂窝网络模块、蓝牙模块和/或无线局域网模块等。通信模块(发送机/接收机)110还经由音频处理器130耦合到扬声器131和麦克风132,以经由扬声器131提供音频输出,并接收来自麦克风132的音频输入,从而实现通常的电信功能。音频处理器130可以包括任何合适的缓冲器、解码器、放大器等。另外,音频处理器130还耦合到中央处理器100,从而使得可以通过麦克风132能够在本机上录音,且使得可以通过扬声器131来播放本机上存储的声音。
[0132]
本领域内的技术人员应明白,本技术的实施例可提供为方法、系统、或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0133]
本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产
生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0134]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0135]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0136]
本技术中应用了具体实施例对本技术的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本技术的方法及其核心思想;同时,对于本领域的一般技术人员,依据本技术的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本技术的限制。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1