一种网络告警处理方法、装置及存储介质与流程

文档序号:20487350发布日期:2020-04-21 21:46阅读:103来源:国知局
一种网络告警处理方法、装置及存储介质与流程
本发明涉及计算机及通信
技术领域
,尤其涉及一种网络告警处理方法、装置及存储介质。
背景技术
:网络故障造成的损失随着网络规模的扩大日趋严重,当网络设备发生故障时,就会触发告警上报,呈现告警事件在网络管理界面上;当故障排除后,设备会上报告警恢复,把告警事件从网络管理界面上清除。因此,对网络故障的处理可以转化为对网络告警事件的处理。现有的网络告警事件处理一般采用人工的方式来完成,即网络运维人员通过监视当前告警信息,根据告警信息和故障现象分析故障产生的原因,再对网络故障进行人工处理。但是,现有的网络告警事件处理受限于运维人员的个人能力和经验,出错率较高;并且采用人工的方式可能会由于忽略了某些关键告警信息而导致整个故障的处理出现极大的拖延;再者,面对网络的成千上万条告警,需要投入大量人力。技术实现要素:为解决现有存在的技术问题,本发明实施例提供一种网络告警处理方法、装置及存储介质。一种网络告警处理方法,所述方法包括:获取第一设备的设备画像;其中,所述设备画像包括表征设备特征的至少一个特征参数;根据所述第一设备的设备画像确定所述第一设备所在的设备集;当所述第一设备发生告警事件时,基于所述设备集所对应的备选告警处理规程,确定目标告警处理规程;以及利用所述目标告警处理规程对所述第一设备进行故障处理。一种网络告警处理装置,所述装置包括:获取单元,用于获取第一设备的设备画像;其中,所述设备画像为表征设备特征的至少一个特征参数;确定单元,用于根据所述第一设备的设备画像确定所述第一设备所述的设备集;还用于当所述第一设备发生告警事件时,基于所述设备集所对应的备选告警处理规程,确定目标告警处理规程;处理单元,用于利用所述目标告警处理规程对所述第一设备进行故障处理。本发明实施例还提供了一种计算机存储介质,所述存储介质中有计算机可执行指令,所述计算机可执行指令被处理器执行实现本发明任一实施例所提供的网络告警处理方法。本发明实施例提供的网络告警处理方法、装置及存储介质,通过获取第一设备的设备画像;其中,所述设备画像包括表征设备特征的至少一个特征参数;根据所述第一设备的设备画像确定所述第一设备所在的设备集。如此,可以根据所述设备画像将与所述第一设备特征趋于相似或相同的设备确定到一个设备集中。当所述第一设备发生告警事件时,基于与所述设备集所对应的备选告警处理规程,确定目标告警处理规程;利用所述目标告警处理规程对所述第一设备进行故障处理。如此,当所述第一设备发生告警事件时,可从设备集中寻找发生同样故障的相同或相似设备,将相同或相似设备的告警处理规程应用到所述第一设备,从而实现对所述第一设备的告警事件的处理,即处理所述第一设备的所发生的故障;如此,不用为每一个设备都单独设置其处理故障时就按的告警规程,从而减少人工设置告警规程的所需的时间和精力,也实现了设备的告警事件的自动化处理;且可以大大降低人工排查的所需的时间,减少人力投入。并且,由于其所实现故障处理的目标告警规程不依赖运维人员的个人能力和经验,是依据相同或相似设备处理过相同故障的告警处理规程,因而也减少了人工处理的出错率。附图说明图1为本发明网络告警处理方法实施例的流程示意图;图2为本发明网络告警处理方法实施例的流程示意图;图3为本发明网络告警处理方法实施例的流程示意图;图4为本发明一实施例中网络告警处理方法的流程示意图;图5为本发明一实施例中网络告警处理方法的流程示意图;图6为本发明一实施例中网络告警处理装置结构示意图;图7为本发明一实施例中网络告警处理装置的硬件结构示意图。具体实施方式本发明实施例提供的网络告警处理方法,主要应用于电信、移动、联通等网络系统中;具体地,还可以应用于交通网络系统、电力网络系统、水利控制网络系统、或其它各种工业、农业等控制网络系统中。本发明的实现、功能特点及优点将结合实施例,参照附图做进一步说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。如图1所述,本发明实施例提供了一种网络告警处理方法,应用于终端,该方法主要包括以下步骤。这里,所述终端为执行所述网络告警处理方法的设备,可以为个人电脑(personalcomputer,pc)机或其它电子设备。步骤101,获取第一设备的设备画像;其中,所述设备画像包括表征设备特征的至少一个特征参数。这里,所述第一设备可以为网络系统中硬件结构;可以是指网络系统中的计算机或服务器或交换器等等。所述第一设备为网络系统中的任一设备。这里,所述设备画像为表征所述设备特征参数的数据;所述设备画像可以用数组、向量、矩阵的形式表示,或者其它可表示包含一个或多个特征参数的任一方式。进一步地,所述设备画像包括以下特征参数至少之一:设备的地理位置、设备的网络位置、设备的服务时长、设备的性能指标、设备的日志、以及设备的运行状态。在一些实施例中,所述地理位置可包括:经纬度或行政区域等位置信息。所述网络位置,可指示:设备所在的网络的类型、网络的区域。例如,设备是归属于无线网的无线网设备、还是归属于核心网的核心网设备、或者,归属于传输网的传输网设备。再例如,设备归属的网络切片或网络子切片。所述设备的服务时长,可包括以下至少之一:设备从投入使用到当前时间的时长;设备从投入使用之后处于开机状态的时长。设备的性能指标,可包括:指示设备的软硬件性能的参数,例如,处理器的类型,(例如,是中央处理器(cpu)还是图像处理器(gpu))、处理器的核数等。设备的日志可包括:设备的系统日志和/或设备的应用日志。系统日志可为设备的操作系统产生的日志,设备的应用日志可为设备内应用程序产生的日志。所述设备的运行状态,可包括:指示设备当前状况的各种状态信息,包括但不限于:指示设备是否处于运行状态的信息,例如,处于运行状态表明设备当前上电开机了,否则可认为设备未上电或未开机;指示设备是否正常的信息,例如,是否出现死机现象,某一个硬件是否故障等;指示设备的负荷信息,例如,是否超负荷运行等。当然以上仅是对各种信息的举例,具体实现时不局限于上述举例。这里,所述设备画像还可以包括其它的特征参数,例如设备的软硬件配置参数。总之,所述设备的设备画像包括但不限于至少以上之一,可以为表征所述设备的性能指标以及行为模式等的任一参数。在另一些实施例中,所述设备的网络位置为设备在网络系统中所处的节点位置,例如处于第一级网络的第n个节点。n为正整数。所述设备的服务时长可为所述设备出厂到当前所使用的时长。所述设备的性能指标可以为设备中cpu的运算速度、内存的容量、外存的容量、字长,等等。所述设备的日志为所述设备发生某事件的记录。例如,设备运行状况的日志:在某个时间执行的某个业务或在某个时间发生了何种故障,等等。所述设备的运行状态为所述设备是否处于工作模式。例如所述运行状态包括但不限于处于工作模式、睡眠模式、关机模式等的状态。在一实施例中,所述设备画像的表示方式为:设备a(locationa1,servicetimea2,kpi_modela3,config_argsa4,log_a5);其中,所述locationa1表征设备a所在的地理位置,所述servicetimea2表征设备a的服务时长,所述kpi_modela3表征所述设备a的性能指标,所述config_argsa4表征所述设备a的配置参数,所述log_a5表征所述设备a的日志。具体地,所述第一设备依赖于数据库中数据源,将表征所述设备的特征的数据提取出来,例如将所述设备的地理位置、配置参数等基本信息的数据,和/或者性能指标、和/或告警、日志等行为模式信息的数据提取出来;经过对所述数据进行清洗、补全等操作,去掉不合理的数据,形成设备的特征参数;根据所述特征参数建立设备的设备画像。步骤103,根据所述第一设备的设备画像确定所述第一设备所在的设备集。可选地,所述终端根据所述第一设备的设备画像所包括的特征参数,将相差不大的一个或几个特征参数所对应的设备确定为一个设备集。具体地,根据各设备的设备画像建立设备画像库。具体地,可根据获取的各设备的特征参数,对当前网络系统中各设备都建立设备画像;例如,所述设备画像中都包括相同类型的参数,例如设备1、设备2、设备3……设备m中设备画像都包括设备的地理地址、设备的服务时长、设备的性能指标、设备的日志的特征参数;其中,所述第一设备为设备1。根据所述各设备的设备画像建立设备画像库,例如下表1所示;根据所述设备画像库,将与所述设备1的特征参数相近至少一个特征参数的几个设备确定为一个设备集h,则所述设备集h为所述第一设备所述在的设备集;其中,所述m、h为自然数;所述m为网络系统中设备的总个数;所述h为一设备集的标号。设备设备画像设备1(location11,servicetime12,kpi_model13,log14)设备2(location21,servicetime22,kpi_model23,log24)设备3(location31,servicetime32,kpi_model33,log34)设备4(location41,servicetime42,kpi_model43,log44)设备5(location51,servicetime52,kpi_model53,log54)…………设备m-1(locationm-11,servicetimem-12,kpi_modelm-13,logm-14)设备m(locationm1,servicetimem2,kpi_modelm3,logm4)表1设备画像库可根据建立的设备画像库,比较各设备与所述设备1的特征参数,根据比较结果,确定所述第一设备所在的设备集。例如,设备3和设备4、设备m的各特征参数与设备1中对应的各特征参数比较相近,则,确定所述第一设备即设备1所在的设备集为设备1、设备3、设备4和设备m组成的设备集,定义为设备集h。可表示如下:设备集h(设备1、设备3、设备4、设备m)。步骤105,当所述第一设备发生告警事件时,基于所述设备集所对应的备选告警处理规程,确定目标告警处理规程。这里,所述告警事件可以为:所述的设备发生链路断开、或所述设备所使用的带宽不足、或所述设备退出小区服务、或所述设备超负荷运行,等等。具体地,当网络系统中的设备发生故障时,就会触发告警上报,将设备发生故障的告警事件呈现在网络管理界面上;当终端检测到所述第一设备发生告警事件时,查找所述设备集各设备对应的告警处理规程,从中找出与所述第一设备发生过相同告警事件的设备,将该相同告警事件的设备上使用的告警处理规程确定为目标告警处理规程。在一实施例中,如上表1所示的设备画像库;若所述第一设备为设备1,设备1在设备集h中。则若设备1中发生告警事件,可通过查找设备3、设备4和设备m对应的告警处理规程,确定所述设备3、设备4和设备m中是否有与设备1发生同样告警事件的告警处理规程,若有,从中确定一告警处理规程作为所述第一设备的目标告警处理规程。这里,可以理解的是,不同的故障对应不同的告警事件,以及不同的告警事件对应不同的告警处理规程。例如对于链路断开的故障,对应为链路断开的告警事件;其处理该链路断开的故障为链路断开的告警处理规程。这里,基于所述设备集所对应的备选告警处理规程,确定目标告警处理规程,是针对所述对应的告警事件的类别,选取与该类别对应的目标告警处理规程。这里,所述备选告警处理规程保存于数据库中;所述数据库可以是终端的本地数据库,或者其它外存储器上的数据库;所述各备选告警处理规程与设备建立对应关系,保存于数据库中。这里,可以理解的是,各设备对应保存的,可以包括多个告警处理规程。例如,设备3对应的告警处理规程,可以包括关于链路断开的告警处理规程1、关于退出小区服务的告警处理规程2,等等。步骤107,利用所述目标告警处理规程对所述第一设备进行故障处理。在一实施例中,若所述第一设备为设备1,设备1在所述设备集h中,所述设备集h包括设备1、设备3、设备4和设备m;若所述第一设备发生链路断开的告警事件,则可选取所述设备3中发生了相同告警事件,即链路断开告警事件所对应的告警处理规程1,作为所述第一设备的目标告警处理规程;终端根据所述告警处理规程1对所述第一设备进行故障处理。本实施例中,由于根据所述第一设备的设备画像确定其所在的设备集,可以将与所述第一设备的特征趋于相似的设备确定为一个设备集中;当所述第一设备发生告警时,可根据所述特征相似的设备所发生同样的告警事件,来确定所述第一设备的目标告警规程。如此,可实现设备的协同处理,将所述相似的设备的告警处理规程应用到所述第一设备的上,进行故障的处理。如此,可以大大降低人工排查的时间,减少人力投入。本实施例中,由于其所实现故障处理的目标告警规程不依赖运维人员的个人能力和经验,是依据相似设备处理过相同故障的告警处理规程,因而也减少了人工处理的出错率。本实施例中,能够面对成千上万条告警事件,及时的进行处理,大大提高了整个系统对于故障运维的效率。本实施例中,还可以随着告警事件出现的越多,积累越多的告警处理规程,因而可以基于历史数据,更加智能化地处理网络系统中所发生的故障事件。上述方案中,如图2所示,所述步骤103,还包括:步骤1031,根据所述第一设备的设备画像确定所述第一设备与第二设备的相似度值;将所述第一设备划分到与所述第一设备的相似度值满足预定条件的所述第二设备所在的设备集。这里,所述第二设备为网络系统中硬件结构;可以为网络系统中除第一设备的其它设备。这里,确定设备与设备之间的相似度值,可以根据欧几里得距离、皮而森相关系数、余弦相似度等方法来确定。具体地,根据所述欧几里得距离来确定设备与设备之间的相似度值,可以通过计算设备与设备所对应的特征参数的数值之间的差的平方和、再开平方根,来确定所述设备与设备之间的相似度值。具体可采用以下计算公式:相似度值d=srqt((x1-x2)∧+(y1-y2)∧+……(z1-z2)∧);其中,所述x1、y1、……z1分别为一设备的各特征参数所对应的值;所述x2、y2、……z2为另一设备的各特征参数所对应的值。其中,根据所述皮尔森系数来确定设备与设备之间的相似度值,可通过设备的特征参数的观测值与均值来计算。其中,根据所述余弦相似度来确定设备与设备之间的相似度值,可以通过计算两个设备的特征参数的夹角来评估而获取。具体地,利用第一设备的设备画像和第二设备的设备画像,计算第一设备画像和第二设备画像之间的相似度值;将所述第一设备划分到与所述第一设备的相似度值满足预定条件的所述第二设备所在的设备集。在一实施例中,确定出设备集可以表示为如下形式:similairty1(current_equipment,equipment_1,equipment_2,equipment_3,equipment_4);其中,所述similairty表征设备集;所述current_equipment表征所述第一设备;所述equipment_1、equipment_2、equipment_3、equipment_4表征所述第二设备。这里,所述与所述第一设备的相似度满足预定条件可以为与所述第一设备的相似度值较大的n个数。这里,设备与设备之间的相似度值越大,表征所述该两个设备之间的基本配置和/或行为模式越相近。进一步地,所述将所述第一设备划分到与所述第一设备的相似度值满足预定条件的所述第二设备所在的设备集,包括:选取与所述第一设备相似度值较大的n个所述第二设备,由所述第一设备和选择的n个所述第二设备构成所述第一设备所在的设备集;其中,所述n为自然数,所述n小于或等于1%×m;所述m为网络的所有设备个数。本实施中,可以根据设备与设备之间的设备画像来确定相似度值,根据相似度值确定所述设备集,更具体地,可以根据较大的相似度值确定所述第一设备所在的设备集。如此,可以基于设备配置参数、和/或性能指标、和/或行为模式等来确定所述第一设备的相似或相同的一些设备,从而可以使得所确定的设备集更加可靠、准确。本实施例中,由于确定所述设备集的第二设备个数小于网络系统中所有设备的个数的百分之一,因而可以使得所确定的设备集更加合理;其不会由于所确定的设备集的设备个数太少而导致当所述第一设备发生告警事件时,根本无法查到发生相同告警事件的设备,从而无法实现协同处理;也不会由于所确定的设备集的设备个数太多而加大查找发生相同告警事件的设备的难度。上述方案中,如图2所示,所述步骤105,还包括:步骤1051,根据所述告警事件,查找所述设备集中发生相同告警事件的第三设备;根据查找到的所述第三设备,选取与所述第一设备相似度值最大的所述第三设备作为所述第一设备的相似设备;根据所述相似设备成功处理所述告警事件所使用的告警处理规程,确定所述第一设备的目标告警处理规程。这里,所述第三设备为与所述第一设备发生过相同告警事件的设备。这里,在一个设备集中发生相同告警事件的设备可能有多个;其中,将所述多个设备分别与所述第一设备的相似度值进行比较,选取相似度值最大的所述设备作为所述第一设备的相似设备;再通过选取所述相似设备处理与所述第一设备发生的相同告警事件的告警处理规程,作为所述第一设备的目标处理规程。本实施例中,由于是选取与所述第一设备的相似度值最大的设备作为所述第一设备的相似设备,因而在实现故障处理时,能够更加有利于实现对所述第一设备发生的故障的成功处理。需要说明的是,若选取与所述第一设备的相似度值最大的设备所对应的告警处理规程,作为处理所述第一设备的故障目标告警处理规程,若不能成功处理所述第一设备的故障;还可以再一次选取与所述第一设备的相似度值次大的设备所对应的告警处理规程,作为处理所述第一设备的故障的目标告警处理规程,若仍然不能成功处理所述第一设备的故障,则一般还可以再选取一至两次所述设备集中发生了相同告警事件的设备所对应的告警处理规程作为所述第一设备的目标告警处理规程。如此,可以进一步有利于保证网络设备的故障的清除。上述方案中,如图2所示,所述步骤107还包括:步骤1071,若所述目标告警处理规程的执行方式为第一执行方式,则基于所述目标告警处理规程对所述第一设备进行故障自动排除处理。这里,所述第一执行方式可以为自动化执行方式。可选地,目标告警处理规程可被配置为自动执行处理;当所述终端查找到所述目标告警规程时,可通过自动运行所述目标告警处理规程,实现基于所述目标告警处理规程对所述第一设备进行故障自动排出处理。本实施例中,可以通过自动将所述目标告警处理规程应用到所述第一设备上的故障处理,实现自动处理故障。如此,可以进一步提高终端的智能化。上述方案中,如图2所示,所述步骤107还包括:步骤1072,若所述目标告警处理规程的执行方式为第二执行方式,在网络管理界面输出所述目标告警处理规程的预定信息;基于作用于预定信息的确认指令,基于所述目标告警处理规程对所述第一设备进行故障自动排除处理。这里,所述第二执行方式可以为触发执行方式。具体地,目标告警处理规程可被配置为触发执行方式;当所述终端查找到所述目标告警规程时,终端将所述目标告警处理规程上报到网络管理界面,使在网络管理界面输出所述目标告警处理规程的预定信息;终端基于作用于预定信息的确认指令,基于所述目标告警处理规程对所述第一设备进行故障自动排出处理。本实施中,可通过目标告警处理规程配置的触发执行处理方式,将所述目标告警处理规程推送到网络管理界面,通过在网络管理界面上输出所述目标告警处理规程的预定信息;再通过终端确认所述预定信息,来基于所述目标告警处理规程实现对所述第一设备的故障清除操作。如此,可以当目标告警处理规程配置为触发执行时,也可基于该规程对故障设备进行故障清除的操作。上述步骤中,如图3所示,所述方法还包括:步骤109,若利用所述目标告警处理规程能成功处理所述第一设备的故障,则建立所述第一设备与所述目标告警处理规程的对应关系。这里,若利用所述目标告警处理规程成功处理所述第一设备的故障,则所述第一设备会上报告警恢复,并将所述告警事件从所述网络管理界面中清除。可选地,若利用所述目标告警处理规程成功处理所述第一设备的故障,则建立所述第一设备与所述目标告警处理规程的对应关系,将所述对应关系保存于数据库中;更新整个网络系统的设备所对应的告警处理规程。本实施中,可以通过不断积累设备遇到故障时的告警处理规程,实现更强大的协同工作,当所述数据库中保存的设备的对应的告警处理规程越多,若网络发生故障中,越能找到与之相应的目标处理规程,越能快速、有效的对网络出现的告警事件进行处理。需要说明的是,若利用所述目标告警处理规程不能处理所述第一设备的故障,则可重新选取合适的告警处理规程作为目标告警处理规程,或者,转用人工处理方式进行处理;其中,所述人工处理方式一般可以为通过运维人员根据告警信息以及故障线性分析而进行的人工处理故障方式。为了进一步解释本发明,以下例举三种应用场景,分别是基于所述告警处理规程被配置为自动化执行、触发执行以及在设备集中找不到发生相同告警事件的场景。应用场景一网络系统中的告警处理规程的执行方式为第一执行方式,在实际应用中,所述网络告警处理方法具体包括以下步骤。步骤s101:终端根据设备的地理位置location、配置参数config_args的静态特征参数、以及设备的服务时长servicetime1、性能指标kpi_model、日志log的动态特征参数,构建设备画像库。设备设备画像设备1(location11,servicetime12,kpi_model13,config_args14,log14)设备2(location21,servicetime22,kpi_model23,config_args24,log24)设备3(location31,servicetime32,kpi_model33,config_args34,log34)设备4(location41,servicetime42,kpi_model43,config_args44,log44)设备5(location51,servicetime52,kpi_model53,config_args54,log54)步骤s102:终端根据设备画像计算设备之间的相似度值。例如,使用欧几里得距离计算每个设备与其它设备的相似度。相似度值设备1设备2设备3设备4设备5设备1/0.30.80.90.6设备20.3/0.70.60.3设备30.80.7/0.50.2设备40.90.60.5/0.8设备50.60.30.20.8/步骤s103:终端选取相似度值最大的两个设备作为当前设备的对应的设备集;那么,对于设备1,对应的设备集为{设备3,设备4};对于设备2,对应的设备集为{设备3,设备4};对于设备3,对应的设备集为{设备1,设备2};对于设备4,对应的设备集为{设备1,设备5};对于设备5,对应的设备集为{设备1,设备4}。步骤s104:若设备1收到一条告警事件——s1链路断开;终端查找知识库中设备3和设备4的告警事件处理记录,发现设备4也发生过s1链路断开告警时使用了处理规程p1;则终端选取告警处理规程p1,按照规程p1处理设备上的s1链路断开告警事件。其中,所述知识库为保存在本地或者其它存储器中的数据库;所述数据库中记录了各设备的已经发生过的告警事件及其对应的处理规程、所述规程的执行方式。设备4在知识库的记录如下:设备告警事件处理规程是否自动化执行设备4s1链路断开p1yes这里,所述告警处理规程配置为自动化执行为第一执行方式;这里,用“yes”表示。步骤s105:对于设备1应用规程p1,自动化处理故障后,若故障恢复,将操作告警处理规程记入知识库。知识库的记录如下:设备告警事件处理规程是否自动化执行设备4s1链路断开p1yes设备1s1链路断开p1yes应用场景二在一实施例中,网络系统中的告警处理规程的执行方式为第二执行方式,在实际应用中,所述网络告警处理方法具体包括以下步骤。步骤s201-s203,即上述步骤s101至s103。步骤s204:若设备1收到一条告警事件——s1链路断开;终端查找知识库中设备3和设备4的告警事件处理记录,发现设备4也发生过s1链路断开告警时使用了处理规程p2;则终端选取告警处理规程p2,按照规程p2处理设备上的s1链路断开告警事件。其中,所述知识库为保存在本地或者其它存储器中的数据库;所述数据库中记录了各设备的已经发生过的告警事件及其对应的处理规程、所述规程的执行方式。设备4在知识库的记录如下:设备告警事件处理规程是否自动化执行设备4s1链路断开p2no这里,所述告警处理规程配置为触发执行为第二执行方式;这里,用“no”表示。步骤s205:告警处理规程p2不能自动化执行,则终端将所述告警处理规程p2推送到网络管理界面、在网络界面输出所述告警处理规程2p的预定信息。步骤s206:终端基于作用于预定信息的确认指令,利用所述告警处理规程p2对所述设备1进行故障清除;若故障恢复,终端将操作告警处理规程记入知识库。知识库的记录如下:设备告警事件处理规程是否自动化执行设备4s1链路断开p2no设备1s1链路断开p2no应用场景三:在一实施例中,发生故障的设备在相似集中找不到对应的告警处理规程,则可采用人工处理,所述网络告警处理方法具体包括以下步骤。步骤301-s303,即上述步骤s101-s103。步骤s304:若设备2发生告警事件——s2小区退出服务;终端查找知识库中设备3和设备4的告警处理记录,发现设备3和设备4中均没有发生过小区退出服务时使用的处理规程,则需要人工处理。步骤s305:人工排查后,使用规程p3处理故障;若故障恢复,则将该处理规程也记录到知识库中。如下记录:设备告警事件处理规程是否自动化执行设备2s2小区退出服务p3no为了进一步解释说明,本发明还提出了一种网络告警处理方法,如图4所示,所述方法包括以下步骤。步骤s001:告警上报;可选地,所网络系统中设备a发生故障,则终端将所述发生故障的告警事件上报到网络管理界面。步骤s002:相似设备是否发生同样告警;可选地,终端通过预先建立的设备集,找到所述设备a对应的设备集h,查找设备集h中是否存在发生了同样告警事件的相似设备;若是,则执行步骤s003;若否,则执行步骤s010。步骤s003:相似协同,查找告警规程p;可选地,若设备h中存在发生同样告警事件的相似设备b;则终端查找设备b在数据库中对应的告警处理规程p。步骤s004:规程p是否可自动化执行;可选地,终端判断所述设备b对应的告警处理规程p是否配置为可自动化执行的处理方式;若是,则执行步骤s005;若否,则执行步骤s006。步骤s005:自动执行规程p;可选地,若告警处理规程p被配置为自动化执行的处理方式,则可以自动将所述告警处理规程p应用到处理设备a发生的故障上。步骤s006:推送规程p给网络管理界面;可选地,若告警处理规程p被配置为触发执行的处理方式,则将所述告警处理规程p推送网络管理界面。步骤s007:人工处理并确认;可选地,通过确认网络管理界面的输出的预定信息,将所述告警处理规程p应用到处理设备a发生的故障上。步骤s008:设备是否上报恢复消息;可选地,终端判断所述设备是否上报故障恢复消息;若上报恢复消息,即网络管理界面上的设备a的告警事件消失,则执行步骤s009;若未上报恢复消息,即网络管理界面上仍存在所述故障a的告警事件,则结束。步骤s009:自动更新知识库;可选地,终端建立所述设备a与对应告警处理规程p的对应关系,并将该对应关系保存在知识库中。步骤s010:人工处理告警;可选地,若终端在设备a所在的设备集h中未找到相似设备,则转人工处理;其中,所述人工处理方式为根据告警事件以及故障现象分析,采用的人工排查处理故障等的方式。步骤s011:添加新的处理流程到知识库。可选地,若人工处理后,所述网络管理界面上的设备a的告警事件消失;则同样将该人工处理所使用的流程p’与设备a建立对应关系;将所述对应关系保存到知识库中。在实施例中,若某一设备发生故障时,可通过查找所述设备对应的设备集,查找到与所述设备发生通过告警事件的相似设备,通过该相似设备中处理所述同样告警事件的告警处理规程来实现所述设备的故障处理规程。如此,实现了设备的协同管理,具体的实现了设备的告警处理规程的协同管理,只要当所述设备所在的设备集中各设备发生过相同的告警事件,则可直接调用该告警事件对应的告警处理规程处理故障,无需建立新的告警处理规程或者以人工处理的方式一一排查故障。如此,能够大大降低人工排查时间、减少人力投入;能够简便操作流程,提高故障清除的效率。本实施例中,可根据告警处理规程配置的执行方式,具体地,为自动执行或不自动执行方式(例如触发执行方式),针对性的实现基于告警处理规程对所述设备发生故障的处理。本实施例中,由于可以将成功清除故障的告警处理规程或者人工处理方式的处理规程与所述设备建立对应的关系,并将其保存在数据库中。如此,当后续网络系统中发生故障时,能够利用历史数据,使得该网络系统运行时间越长,所保存的告警处理规程越全面,更有利于工作人员更快、更准确的处理网络系统中发生的故障。这里需要指出的是:以下网络告警处理装置项的描述,与上述网络告警处理方法描述是类似的,同方法的有益效果描述,不做赘述。对于本发明网络告警处理装置实施例中未披露的技术细节,请参照本发明网络告警处理方法实施例的描述。本发明实施例还提供了一种告警处理装置,所述告警处理方法应用于所述告警处理装置,请参阅图5,所述告警处理装置包括:数据清洗单元11,用于对数据源进行清洗;其中,所述数据源为表征网络系统中设备的特征参数的数据;具体地,可用于对数据源1、数据源2、……、数据源n进行处理,对所述数据源1、数据源2、……、数据源n中多余数据删除、缺失的数据进行补全;所述n为自然数。画像生成单元12,用于基于清洗后的数据源对设备建立设备画像;将所述设备画像存储到设备画像库中;具体地,对于设备统一采用几个特征参数,以所述特征参数作为标准,建立设备的设备画像。例如,对于网络系统中的设备都以服务时长、日志和运行状态作为特征参数,来建立设备画像。相似设备计算单元13,用于计算设备与设备之间特征参数的相似度值,将与当前设备相似度值较大的n个设备确定为所述当前设备的设备集;知识选取单元14,用于根据设备集,从知识库中查找所述设备对应的告警处理规程;其中,所述知识库记录设备与其对应的告警处理规程。本发明实施例还提供了一种网络告警处理装置,请参阅图6,所述装置包括:获取单元21、确定单元22、处理单元23;其中,所述获取单元21,用于获取第一设备的设备画像;其中,所述设备画像为表征所述设备特征的至少一个特征参数;所述确定单元22,用于根据所述第一设备的设备画像确定所述第一设备所述的设备集;还用于当所述第一设备发生告警事件时,基于所述设备集所对应的备选告警处理规程,确定目标告警处理规程;所述处理单元23,用于利用所述目标告警处理规程对所述第一设备进行故障处理。可选地,所述设备画像包括以下特征参数至少之一:设备的地理位置、设备的网络位置、设备的服务时长、设备的性能指标、设备的日志、以及设备的运行状态。可选地,所述确定单元22还包括第一确定子单元221;其中,所述第一确定子单元221,还用于根据所述第一设备的设备画像确定所述第一设备与第二设备的相似度值;将所述第一设备划分到与所述第一设备的相似度值满足预定条件的所述第二设备所在的设备集。可选地,所述第一确定子单元221,还用于选取与所述第一设备相似度值较大的n个所述第二设备,由所述第一设备和选择的n个所述第二设备构成所述第一设备所在的设备集;其中,所述n为自然数,所述n小于或等于1%×m;所述m为网络的所有设备个数。可选地,所述确定单元22还包括第二确定子单元222;所述第二确定子单元222,还用于根据所述告警事件,查找所述设备集中发生相同告警事件的第三设备;根据查找到的所述第三设备,选取与所述第一设备相似度值最大的所述第三设备作为所述第一设备的相似设备;根据所述相似设备成功处理所述告警事件所使用的告警处理规程,确定所述第一设备的目标告警处理规程。可选地,所述处理单元23,还用于若所述目标告警处理规程的执行方式为第一执行方式,则基于所述目标告警处理规程对所述第一设备进行故障自动排除处理。可选地,所述处理单元23,还用于若所述目标告警处理规程的执行方式为第二执行方式,在网络管理界面输出所述目标告警处理规程的预定信息;基于作用于预定信息的确认指令,基于所述目标告警处理规程对所述第一设备进行故障自动排除处理。可选地,所述处理单元23,还用于若利用所述目标告警处理规程能成功处理所述第一设备的故障,则建立所述第一设备与所述目标告警处理规程的对应关系。本发明一实施例还公开了一种终端,如图7所示,所述终端包括处理器31和用于存储能够在处理器上运行的计算机程序的存储器32;其中,所述处理器用于运行计算机程序时,实现本发明任一实施例所提供的网络告警处理方法。在一些实施例中,本发明实施例中的存储器32可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(read-onlymemory,rom)、可编程只读存储器(programmablerom,prom)、可擦除可编程只读存储器(erasableprom,eprom)、电可擦除可编程只读存储器(electricallyeprom,eeprom)或闪存。易失性存储器可以是随机存取存储器(randomaccessmemory,ram),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的ram可用,例如静态随机存取存储器(staticram,sram)、动态随机存取存储器(dynamicram,dram)、同步动态随机存取存储器(synchronousdram,sdram)、双倍数据速率同步动态随机存取存储器(doubledataratesdram,ddrsdram)、增强型同步动态随机存取存储器(enhancedsdram,esdram)、同步连接动态随机存取存储器(synchlinkdram,sldram)和直接内存总线随机存取存储器(directrambusram,drram)。本文描述的系统和方法的存储器32旨在包括但不限于这些和任意其它适合类型的存储器。而处理器31可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器31中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器31可以是通用处理器、数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现成可编程门阵列(fieldprogrammablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器32,处理器31读取存储器32中的信息,结合其硬件完成上述方法的步骤。在一些实施例中,本文描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现,处理单元可以实现在一个或多个专用集成电路(applicationspecificintegratedcircuits,asic)、数字信号处理器(digitalsignalprocessing,dsp)、数字信号处理设备(dspdevice,dspd)、可编程逻辑设备(programmablelogicdevice,pld)、现场可编程门阵列(field-programmablegatearray,fpga)、通用处理器、控制器、微控制器、微处理器、用于执行本申请所述功能的其它电子单元或其组合中。对于软件实现,可通过执行本文所述功能的模块(例如过程、函数等)来实现本文所述的技术。软件代码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。本发明又一实施例还提供了一种计算机存储介质,该计算机可读存储介质存储有可执行程序,所述可执行程序被处理器31执行时,可实现网络告警处理方法的以下步骤:获取第一设备的设备画像;其中,所述设备画像包括表征设备特征的至少一个特征参数;根据所述第一设备的设备画像确定所述第一设备所在的设备集;当所述第一设备发生告警事件时,基于所述设备集所对应的备选告警处理规程,确定目标告警处理规程;利用所述目标告警处理规程对所述第一设备进行故障处理。其中,所述设备画像包括以下特征参数至少之一:设备的地理位置、设备的网络位置、设备的服务时长、设备的性能指标、设备的日志、设备的运行状态。可选地,所述可执行程序被处理器31执行时,可实现网络告警处理方法的以下步骤:根据所述第一设备的设备画像确定所述第一设备与第二设备的相似度值;将所述第一设备划分到与所述第一设备的相似度值满足预定条件的所述第二设备所在的设备集。可选地,所述可执行程序被处理器31执行时,可实现网络告警处理方法的以下步骤:选取与所述第一设备相似度值较大的n个所述第二设备,由所述第一设备和选择的n个所述第二设备构成所述第一设备所在的设备集;其中,所述n为自然数,所述n小于或等于1%×m;所述m为网络的所有设备个数。可选地,所述可执行程序被处理器31执行时,可实现网络告警处理方法的以下步骤:根据所述告警事件,查找所述设备集中发生相同告警事件的第三设备;根据查找到的所述第三设备,选取与所述第一设备相似度值最大的所述第三设备作为所述第一设备的相似设备;根据所述相似设备成功处理所述告警事件所使用的告警处理规程,确定所述第一设备的目标告警处理规程。可选地,所述可执行程序被处理器31执行时,可实现网络告警处理方法的以下步骤:若所述目标告警处理规程的执行方式为第一执行方式,则基于所述目标告警处理规程对所述第一设备进行故障自动排除处理。可选地,所述可执行程序被处理器31执行时,可实现网络告警处理方法的以下步骤:若所述目标告警处理规程的执行方式为第二执行方式,在网络管理界面输出所述目标告警处理规程的预定信息;基于作用于预定信息的确认指令,基于所述目标告警处理规程对所述第一设备进行故障自动排除处理。可选地,所述可执行程序被处理器31执行时,可实现网络告警处理方法的以下步骤:若利用所述目标告警处理规程能成功处理所述第一设备的故障,则建立所述第一设备与所述目标告警处理规程的对应关系。在一些实施例中,所述计算机存储介质可以包括:u盘、移动硬盘、只读存储器(rom,readonlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本
技术领域
的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1