一种基于权重的设备状态判断方法及其系统的制作方法

文档序号:6625342阅读:216来源:国知局
一种基于权重的设备状态判断方法及其系统的制作方法
【专利摘要】一种基于权重的设备状态判断方法及其系统,其方法为:将监控代理设备部署为网状结构;监控设备与两台以上所述监控代理设备连接;所述监控代理设备与监控控制台连接;为所述监控设备定义监控事件的权重;并定义所述监控事件的关联事件的权重;所述监控代理设备获取故障的监控设备的监控事件;根据所述监控事件的权重及所述关联事件的权重,计算出故障的监控设备的优先级;根据所述优先级,进行根据故障信息查找预设定故障库,解决了现有树状结构模式下因某一监控代理出现问题时可能导致的故障设备事件监控事件无法上报问题;本发明首创了一种事件模型库,并通过事件范例追溯技术,快速定位事件原因以及处理方法,更快定位和解决设备故障。
【专利说明】一种基于权重的设备状态判断方法及其系统

【技术领域】
[0001] 本发明涉及计算机设备权重分配的【技术领域】,尤其是涉及一种基于权重的设备状 态判断方法。

【背景技术】
[0002] 在常见的设备监控系统中,基本上都是基于监控事件触发报警,当监控系统探测 到预先定义的事件到达报警阀值后,就触发报警,根据事件的严重程度,报警级别分为一 般,警告,严重等级别。在设备数量较少的情形下,这种模式没有问题,管理员根据报警进行 相应处理即可以解决设备的监控需求。但随着网络规模的扩大,当监控的设备达到一定的 数量级比如上万台并且每台设备监控的事件种类较多,管理员在一个监控周期内可能同时 收到上百条甚至几百条需要响应或处理的报警事件,此时管理员就只能根据报警信息的严 重级别来选择处理,但报警级别相同的事件,其实重要性往往是不一样的。比如两台服务器 宕机,虽然报警级别都标记为严重,其中一台服务器是普通WEB服务器,而另外一台是调度 服务器,普通服务器宕机只影响到自身的服务响应,但调度服务器宕机影响的可能是与之 相关的多台其他设备。现有的监控系统基本上都解决了监控的问题,但在决策支持上往往 不尽人意。
[0003] 其次,目前的监控代理设备通常采用树状结构,在这种模式下,如果其中的一台监 控代理发生链路故障,该监控代理所监控到的报警信息将不能及时传递到上层的监控代理 设备,这将极大地影响到设备监控系统的时效性及可靠性,而时效性及可靠性是评判设备 监控系统非常注重的要素。而对于整个设备监控系统来说,也将无法形成完整的报警信息。
[0004] 最后,对于设备监控系统来说,发现报警事件只是发现问题的一个过程,最终的目 的是要找到事件原因,并最终解决问题。目前常见的设备监控系统只是对已经发生的故障 现象进行了简单的罗列,并不能够对故障原因进行深层次的分析,需要维护人员通过现场 或者远程的方式登录到故障设备中,了解故障原因。因此,现有设备监控系统因未能对故障 原因提供有效的线索,这直接影响了故障处理的速度。
[0005] 此外现有方案中需要人工逐条分析事件原因、逐一寻找解决办法,在大规模网络 应用环境中,尤其涉及上万台设备时,需要投入更多的人力与物力。现有的方案不能满足大 规模的设备监控场景下的故障处理要求。


【发明内容】

[0006] 本发明的目的在于设计一种基于权重的设备状态判断方法,解决上述问题。
[0007] 为了实现上述目的,本发明采用的技术方案如下:
[0008] 一种基于权重的设备状态判断方法,包括如下步骤:
[0009] 将监控代理设备部署为网状结构;监控设备与两台以上所述监控代理设备连接; 所述监控代理设备与监控控制台连接;
[0010] 为所述监控设备定义监控事件;为所述监控事件定义权重;为所述监控事件的关 联事件定义权重;
[0011] 所述监控代理设备获取故障的监控设备的监控事件;根据所述监控事件的权重及 所述关联事件的权重,计算出故障的监控设备的优先级;
[0012] 根据所述优先级,进行根据故障信息查找预设定故障库;
[0013] 若匹配到相同的所述故障信息,则采用故障库中的解决方案进行处理;并将所述 故障信息及处理结果发送到所述监控控制台;
[0014] 若未匹配到相同的所述故障信息,则根据故障信息的关键字在所述故障库中查找 关键字解决方案;如果找到所述关键字解决方案,将所述故障信息及所述关键字解决方案 发送到所述监控控制台;如果未找到所述关键字解决方案,则直接将所述故障信息发送到 所述监控控制台。
[0015] 优选的,所述监控事件的权重和所述关联事件的权重均包括事件权重、绝对权重 和相对权重;
[0016] 所述事件权重为整型数值,用于决定所述监控事件的处理优先级;
[0017] 所述绝对权重为已触发的所述监控事件的权重值;
[0018] 所述相对权重为已触发的所述关联事件的合计权重值。
[0019] 优选的,所述事件权重=所述绝对权重+所述相对权重。
[0020] 优选的,所述监控代理设备的台数为三台以上;三台以上所述监控代理设备之间 通过心跳机制获取链路状态;并将所述链路状态上传到所述监视控制台,所述监视控制台 通过所述链路状态实现监控代理设备的监控。
[0021] 优选的,三台以上所述监控代理设备之间通过心跳机制获取链路状态;并将所述 链路状态上传到所述监视控制台的方法为:
[0022] 三台以上所述监控代理设备之间互相通告与所述监控控制台的链路状态,设其中 一台所述监控代理设备为p监控代理设备,并所述p监控代理设备将选取临近的两台所述 监控代理设备保存为备用代报服务器;
[0023] 若所述P监控代理设备与所述监控控制台的链路畅通;则所述P监控代理设备将 所述P监控代理设备的链路状态直接上传到所述监控控制台;
[0024] 若三台以上所述监控代理设备监测到所述P监控代理设备无链路相应;则选取- 台所述备用代报服务器将所述P监控代理设备的链路状态上传到所述监控控制台。
[0025] ~种基于权重的设备系统,为网状结构;包括监控设备、监控代理设备、故卩早库和 监控控制台;一台所述监控设备与两台以上所述监控代理设备连接;所述监控代理设备与 监控控制台连接;
[0026] 所述监控设备为包括监控事件的监控设备;
[0027] 所述监控代理设备为根据所述监控事件区分所述监控设备优先级的监控代理设 备;
[0028] 所述故障库为根据所述优先级处理所述监控设备故障的故障库;
[0029] 所述监控控制台为获取到所述优先级的故障处理信息并执行报警的监控控制台。
[0030] 优选的,所述监控设备为含有权重的监控设备。
[0031] 优选的,所述监控事件为含有权重的监控事件。
[0032] 优选的,所述监控设备的权重值+所述监控事件的权重值之和越大,所述监控设 备的优先级别越高。
[0033] 优选的,两台以上所述监控代理设备之间相互连接;两台以上所述监控代理设备 通过心跳机制获取链路状态;所述监控代理设备将获取到的所述链路状态发送到所述监视 控制台,所述监视控制台通过所述链路状态实现监控代理设备的监控。
[0034] 本发明的有益效果可以总结如下:
[0035] 与现有的监控报警系统相比,本发明实现了灵活、可管理的监控决策机制,可根据 预定义的绝对权重及自动计算的相对权重,实现设备状态的决策优化级智能判断,从而使 管理人员有效的先响应处理优先级别更高的事件;本发明创造了一种网状部署架构,实现 各设备监控代理之间的信息共享,解决了现有树状结构模式下因某一监控代理出现问题时 可能导致的故障设备事件监控事件无法上报问题;本发明首创了一种事件模型库,并通过 事件范例追溯技术,快速定位事件原因以及处理方法,更快定位和解决设备故障。

【专利附图】

【附图说明】
[0036] 图1为现有技术中的监控系统结构示意图;
[0037] 图2为现有技术中的监控系统定义监控事件架构示意图;
[0038] 图3为本发明的监控系统的监控事件架构示意图;
[0039] 图4为前现有技术方案中监控代理设备的树形结构示意图;
[0040]图5为本发明的网状部署结构示意图;
[0041] 图6为本发明中的事件范例推理示意图;
[0042] 图7为本发明监控处理事件的结构示意图;
[0043] 图8为本发明中具体实施的事件权重定义及关联事件定义结构示意图。

【具体实施方式】
[0044] 为了使本发明所解决的技术问题、技术方案及有益效果更加清楚明白,以下结合 附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用 以解释本发明,并不用于限定本发明。
[0045] 如图1所示现有的监控系统实现方案示意图,为方便描述,假设监控系统监控设 备A,B,C三台设备,都需要进行设备负载是否过载的事件X及服务端口是否可访问的事件 Y进行监控。假定其中设备A为调度服务器,B及C两台设备为普通服务器。同时假定三台 设备的X及Y事件都发生。
[0046] 整个监控过程如下:
[0047] 被监控设备及监控事件注册,先将被监控的设备注册到控制台后,再将宕机监控 事件X及Y注册到监控台并且与设备绑定,同时定义监控事件的特征,如服务端口无响应, CPU使用率超过90%等,级别都设定为严重。
[0048] 监控控制台将定义的监控事件X及Y发布到被监控设备所在的对应的监控代理 上。
[0049] 监控代理根据宕机事件X及Y的特征,对设备进行定时状态数据查询、获取及分析 监控结论。
[0050] 监控代理将分析的结论上报给监控控制台。
[0051] 监控控制台调用报警处理模块根据预定义的报警规则执行报警动作。
[0052] 在此方案中,监控代理捕捉到X及Y事件后,上报给监控控制台,控制台会依据收 到的顺序分六次调用报警处理模块来发布报警通知。如果三台设备的处理优先级没有要 求,则此方案可以满足监控要求。
[0053] 但如果三个设备的处理优先级不一致,比如设备A是调度服务器,当发生负载高 及端口不能访问,则可能影响到其他依赖于A的其他设备,而B及C是普通服务器,可以先 处理完A再处理。则此方案中就要求管理员清楚了解应该优先处理的设备,否则只能按主 观顺序来挑选处理,在监控的设备数量较多的情况下,则管理人员的选择难度明显增加,处 理效率会显著下降。
[0054] 同时三个设备之间各自独立与监控控制台进行数据交换,无法进行相互间的数据 共享,如果其中任何一台设备发生故障,其监控到的数据则无法正常上报到监控控制台,从 而影响故障处理的速度。
[0055] 此外现有方案中需要人工逐条分析事件原因、逐一寻找解决办法,在大规模网络 应用环境中需要投入较多的人力与物力。因此,现有的方案不能满足大规模的设备监控场 景下的故障处理要求。
[0056] 如图2所示现有技术方案的监控事件定义,现有技术中,一般的监控事件,一般都 包含以下几个基本属性,事件级别,触发条件、报警规则。
[0057] 事件级别用来定义一个监控事件的严重程度,常见的级别有一般,告警,严重等。
[0058]触发条件是指要触发监控事件需要满足的条件,比如设备负载高的触发条件是 CPU使用率>80%
[0059]报警规则是指监控事件触发后的进行的报警动作,如发送消息、邮件等。
[0060]为了实现灵活可管理的监控决策方案,需要为监控事件额外引入事件权重属性及 关联事件属性。
[0061]事件权重:为一个整型数值,事件权重决定一个监控事件的处理优先级。
[0062] 关联事件:用来定义一个事件与另外一个事件或多个事件之间显式的或隐式的 关系。一般指一个事件的触发,可能会引起其他的事件触发。比如当发生设备负载过高的 事件时,同时可能引起服务无响应等相关的事件触发。关联事件的作用,主要是为了合并报 警的次数,同时参与权重的计算来提升一个事件的处理优先级。
[0063] 事件权重由绝对权重及相对权重两部分构成。
[0064]绝对权重:一个监控事件的权重基础值。绝对权重越大,此事件的处置优先级就越 高。
[0065]相对权重:由监控事件的关联事件中已触发的事件的绝对权重值合计出来。
[0066]如图3所示,本发明中添加权重及关联事件后的监控事件属性,引入事件的权重, 一个事件的权重值计算公式如下:
[0067] 事件权重=绝对权重+相对权重;
[0068]相对权重二SUM(已触发关联事件的绝对权重)
[0069]例如:事件X的绝对权重Xw= 10,该事件有三个关联事件〇,p,Q,三个关联事件绝 对权重〇w、Pw和Qw ;
[0070] 〇w = 5, Pw = 6, Qw = 7。假定事件X的计算最终合计权重为Sw ;
[0071] 情形一:事件X被触发,但关联事件未触发。
[0072] Sw = Xw+SUM(0w, Pw, Qw) = 10+sum(0, 0, 0) = 10+0 = 10
[0073] 由于关联事件未触发,则相对权重值为0。所以合计权重SW为事件X的绝对权重 值。
[0074] 情形二:事件X被触发,关联事件0也被触发。
[0075] Sw = Xw+SUM(Ow, Pw, Qw) = 10+sum(5, 0, 0) = 10+5 = 15
[0076] 由于关联事件0被触发,但其他两个关联事件未触发,则相对权重的值只能计算 事件0的绝对权重值5。更多关联事件的触发的事件权重的计算方式同情形二。
[0077] 如图4所示,目前现有技术方案中相关监控代理设备采用的树状部署结构,
[0078] 在图4中,监控代理设备A与监控代理设备C、D之间形成父层与子层的部署关系, 其中A为父层,C、D子层,C、D、E、F等子层监控代理设备分别负责相关设备的状态监测,每 个子层监控代理所监测的设备是不一样的。父层与子层监控代理之间的监控事件上报流程 是这样的,C与D分别将各自监测到的监控事件上报到A,,由A进行统一汇总,最后由A将 汇总后的监控事件提交到监控控制台,在这个过程中,C与D之间不进行信息的共享,也就 是说C无法将监控事件分享给D,D也无法将监控事件分享给C。同样的道理,B与E、F之 间也是通过这种方式实现监控事件的逐层传递。
[0079] 这种方式的弊端是,一旦其中的某一台监控代理设备链路出现故障,将会直接影 响到监控事件的及时上报,比如当C出现故障,则C所监控到的监控事件不能上报到A,因 此A只能接收到D所上报的监控事件。同样如多A出现故障,则A不能接收C和D监测到 的监控事件,在这种情况下,监控控制台只能对B发送过来的监控事件进行处理。
[0080] 如图5所示,本发明中提供的网状部署结构能很好地解决图4中存在的问题;
[0081] 在本发明中,所有的监控代理以网状形态部署,各监控代理之间相互开放活跃探 测端口,每台代理以心跳机制与监控控制台保持联系,另外还至少与其他两台代理以相同 机制保持联系,通告自己到监控控制台是否通畅。当某代理到自己到监控控制台的链路有 问题影响上报及时性时,将需要上报的事件转报给链路正常的一台代理,由链路正常的代 理代为上报。这种网状部署结构极大地降低了监控上报事件的失败概率。
[0082] 具体的探测及上报过程是这样的,使用心跳机制与监控控制台联系并记录状态 值,同时联系其他至少三台自己连接的代理,互相通告自己到监控控制台的链路状态,并保 存其中两台链路较优的代理作为自己的替代上报代理。当自身到监控控制台通畅时,直接 上报到控制台。当到控制台链路不通畅,则将需要上报的事件转交给备选上报代理代为上 报。通过这种方式,即使一台代理或多台代理出现故障或链路不通,都能尽可能的在指定的 上报周期内达到及时事件上报的目的,防止了逐层上报中单点故障导致上报失败的问题, 这样就有效地解决了前面所提到的现有技术方案中的弊端。
[0083] 关于决策的处理,现有技术中的设备监测事件需要根据维护人员的技术及经验进 行处理,这种方式对于几十台、几百台设备来说不是太大的问题,但是如果在几千台设备甚 至几万台的应用环境下,监控设备维护的工作量是巨大的。而在实际故障处理中,很多故障 的现象、原因以及处理方式都是相同的,比如某一台设备出现内存方面的问题,并出现相应 的故障现象,而当其他同一批次,同一型号的设备出现同样的故障现象时,我们就可以考虑 是不是同样的原因(内存问题)导致的故障,进而可以参照第一次出现故障时的解决办法 进行解决。根据以上论述,我们在决策处理模块中构建一个问题处理模型,在这个模型中, 我们将事件现象作为一个关键索引,通过该索引可以非常方便地查询到故障现象的原因以 及针对该现象的解决办法,这样节省了故障原因分析以及故障处理的时间,大大提高了故 障处理的效率。
[0084]如图6所示,在本发明中,以上提到的事件现象、事件原因以及解决办法我们称之 为一个范例,随着故障事件的不断发生,当有新的故障得到解决时,我们以同样的方式将范 例加入到问题处理模型中,所有的范例最后形成一个完整的范例库,作为今后分析原因、解 决冋题的参考依据。
[0085]在图6中,当有新的故障现象发生时,系统将事件现象中的关键字作为搜索条件, 并且在范例库中进行匹配,自动查询出符合条件的事件现象,如:根据搜索结果,范例库中 范例A中的事件现象A与搜索条件相符合,根据事件现象A,系统可以提供事件产生的原 因-事件原因 A,以及相应的处理办法-解决方法A。维护人员可参考以上结果进行相应的 处理。
[0086]如图7所示,本发明采用的一种基于权重的设备状态判断方法,包括如下步骤:
[0087]将监控代理设备部署为网状结构;监控设备与两台以上监控代理设备连接;监控 代理设备与监控控制台连接;
[0088]为监控设备定义监控事件;为监控事件定义权重;为监控事件的关联事件定义权 重;
[0089]监控代理设备获取故障的监控设备的监控事件;根据监控事件的权重及关联事件 的权重,计算出故障的监控设备的优先级;
[0090] 根据优先级,进行根据故障信息查找预设定故障库;
[0091]若匹配到相同的故障信息,则采用故障库中的解决方案进行处理;并将故障信息 及处理结果发送到监控控制台;
[0092]若未匹配到相同的故障信息,则根据故障信息的关键字在故障库中查找关键字解 决方案;如果找到关键字解决方案,将故障信息及关键字解决方案发送到监控控制台;如 果未找到关键字解决方案,则直接将故障信息发送到监控控制台。
[0093] 监控事件的权重和关联事件的权重均包括事件权重、绝对权重和相对权重;
[0094] 事件权重为整型数值,用于决定监控事件的处理优先级;
[0095] 绝对权重为已触发的监控事件的权重值;
[0096] 相对权重为已触发的关联事件的合计权重值。
[0097] 事件权重=绝对权重+相对权重。
[0098]三台以上监控代理设备之间通过心跳机制获取链路状态;并将链路状态上传到监 视控制台,监视控制台通过链路状态实现监控代理设备的监控。
[0099] 三台以上监控代理设备之间通过心跳机制获取链路状态;并将链路状态上传到监 视控制台的方法为:
[0100] 三台以上监控代理设备之间互相通告与监控控制台的链路状态,设其中一台监控 代理设备为P监控代理设备,并P监控代理设备将选取临近的两台监控代理设备保存为备 用代报服务器;
[0101] 若P监控代理设备与监控控制台的链路畅通;则P监控代理设备将P监控代理设 备的链路状态直接上传到监控控制台;
[0102] 若三台以上监控代理设备监测到p监控代理设备无链路相应;则选取一台备用代 报服务器将P监控代理设备的链路状态上传到监控控制台。
[0103] 一种基于权重的设备系统,为网状结构;包括监控设备、监控代理设备、故障库和 监控控制台;一台监控设备与两台以上监控代理设备连接;监控代理设备与监控控制台连 接;
[0104] 监控设备为包括监控事件的监控设备;
[0105]监控代理设备为根据监控事件区分监控设备优先级的监控代理设备;
[0106] 故障库为根据优先级处理监控设备故障的故障库;
[0107] 监控控制台为获取到优先级的故障处理信息并执行报警的监控控制台。
[0108] 监控设备为含有权重的监控设备。
[0109] 监控事件为含有权重的监控事件。
[0110] 监控设备的权重值+监控事件的权重值之和越大,监控设备的优先级别越高。
[0111] 两台以上监控代理设备之间相互连接;两台以上监控代理设备通过心跳机制获取 链路状态;监控代理设备将获取到的链路状态发送到监视控制台,监视控制台通过链路状 态实现监控代理设备的监控。
[0112] 本发明改进监控系统的监控机制,引入事件权重及决策处理机制,智能分析报警 事件的优先级别,从而解决大规模监控场景下的大量报警出现时,管理人员响应负担过重, 事件处理优先级不合理的问题。
[0113] 改进的基于事件权重、监控代理网状结构、事件处理模型的监控系统方案主要有 以下几部分。
[0114] 1)改进的带权重的事件注册模块;监控控制台
[0115] 2)改进的监控代理
[0116] 3)决策处理模块
[0117] 4)报警及状态展示模块
[0118] 方案主要的变化在四个方面
[0119] 1)带权重的事件注册模块主要变化在于在为设备注册一个监控事件时,必须要定 义一个事件的绝对权重,同一种事件,注册到被监控设备上时,根据设备的重要性,绝对权 重的值不一样,更重要的设备,事件的绝对权重更大。另外可选的可以对事件进行关联事件 定义,一个事件的关联事件越多,则表明该事件的相对权重值在参与计算时可能会更大。 [0 120] 2)改进的监控代理
[0121] 监控代理采用网状结构部署,在出现链路故障或代理故障时,用较少的代价保证 了事件能及时上报。同时,改进的监控代理在对设备进行监控事件捕获时,需要额外计算 设备单个事件的权重合计值后再上报给监控控制台。
[0122] 3)决策处理模块
[0123] 决策处理模块是一个核心模块,处理从各个监控代理上报上来的监控事件汇总分 析,在一个分析计算周期内,对周期内的捕捉到的监控事件进行按设备分析、合并计算,计 算出每个设备的响应处理的优先级并排序,并且按权重值调用报警及展示模块进行处理。 计算规则如下:
[0124]设备的事件响应优先级二MAX(代理上报的单个事件的权重合计)
[0125]即单台设备如果有多个事件上报,取单个事件的权重合计值中最大者。
[0126] 同时在决策处理模块中采用事件模型库,并通过事件范例追溯技术,快速定位事 件原因以及处理方法,更快定位和解决设备故障。
[0127] 4)报警及展示模块
[0128]改进的报警及展示模块主要变化在执行告警的顺序变化,由于设备监控事件有各 自的权重值,可以让高权重值的事件优先报警,这在大规模的监控事件处理中特别重要。
[0129]另外,事件的展现方式也由只能按事件等级展现改进为按事件等级加上权重值展 现,使得管理人员更容易聚焦在更重要的事件响应处理上。
[0130]本发明提供一种网状的监控代理设备部署架构,替代通常使用的树状结构。在这 种架构下,所有的监控代理设备以网状形态部署,监控代理设备与监控代理设备之间通过 心跳机制相互通知到监视控制台的链路状态。当其中的某一台监控代理设备发生链路故障 时,其采集到的监控事件会通过其他链路正常监控代理设备发送到监控控制台,从而实现 了监控事件的及时上报。
[0131]如图8所示,为方便描述,假设监控系统监控设备a,B,C三台设备,都需要进行 设备负载是否过载的事件X及服务端口是否可访问的事件Y进行监控。假定其中设备A为 调度服务器,B及C两台设备为普通服务器。同时假定三台设备的事件χ,γ都发生。 A,B, C三台设备之间采用网状部署,并通过相应的端口实现数据共享。
[0132]图8设备绑定的事件权重定义及关联事件定义
[0133] 1)为被监控设备ABC分别注册事件X及Y,并将设备A及B的X事件的关联事件 设置为Y。
[0134] 事件X,Y的默认绝对权重为20,10
[0135] 由于设备A为调度服务器,如果发生故障引发的后果更严重,故将A设备的X事件 绝对权重加5,其他两设备的绝对权重不变。此时A、B、C权重定义如下表:
[0136]

【权利要求】
1. 一种基于权重的设备状态判断方法,其特征在于,包括如下步骤: 将监控代理设备部署为网状结构;监控设备与两台以上所述监控代理设备连接;所述 监控代理设备与监控控制台连接; 为所述监控设备定义监控事件;为所述监控事件定义权重;为所述监控事件的关联事 件定义权重; 所述监控代理设备获取故障的监控设备的监控事件;根据所述监控事件的权重及所述 关联事件的权重,计算出故障的监控设备的优先级; 根据所述优先级,进行根据故障信息查找预设定故障库; 若匹配到相同的所述故障信息,则采用故障库中的解决方案进行处理;并将所述故障 信息及处理结果发送到所述监控控制台; 若未匹配到相同的所述故障信息,则根据故障信息的关键字在所述故障库中查找关键 字解决方案;如果找到所述关键字解决方案,将所述故障信息及所述关键字解决方案发送 到所述监控控制台;如果未找到所述关键字解决方案,则直接将所述故障信息发送到所述 监控控制台。
2. 根据权利要求1所述的基于权重的设备状态判断方法,其特征在于:所述监控事件 的权重和所述关联事件的权重均包括事件权重、绝对权重和相对权重; 所述事件权重为整型数值,用于决定所述监控事件的处理优先级; 所述绝对权重为已触发的所述监控事件的权重值; 所述相对权重为已触发的所述关联事件的合计权重值。
3. 根据权利要求2所述的基于权重的设备状态判断方法,其特征在于:所述事件权重 =所述绝对权重+所述相对权重。
4. 根据权利要求1所述的基于权重的设备状态判断方法,其特征在于:所述监控代理 设备的台数为三台以上;三台以上所述监控代理设备之间通过心跳机制获取链路状态;并 将所述链路状态上传到所述监视控制台,所述监视控制台通过所述链路状态实现监控代理 设备的监控。
5. 根据权利要求4所述的基于权重的设备状态判断方法,其特征在于:三台以上所述 监控代理设备之间通过心跳机制获取链路状态;并将所述链路状态上传到所述监视控制台 的方法为: 三台以上所述监控代理设备之间互相通告与所述监控控制台的链路状态,设其中一台 所述监控代理设备为P监控代理设备,所述P监控代理设备将选取临近的两台所述监控代 理设备保存为备用代报服务器; 若所述P监控代理设备与所述监控控制台的链路畅通;则所述P监控代理设备将所述 P监控代理设备的链路状态直接上传到所述监控控制台; 若三台以上所述监控代理设备监测到所述P监控代理设备无链路相应;则选取一台所 述备用代报服务器将所述P监控代理设备的链路状态上传到所述监控控制台。
6. -种基于权重的设备系统,为网状结构;其特征在于:包括监控设备、监控代理设 备、故障库和监控控制台;一台所述监控设备与两台以上所述监控代理设备连接;所述监 控代理设备与监控控制台连接; 所述监控设备为包括监控事件的监控设备; 所述监控代理设备为根据所述监控事件区分所述监控设备优先级的监控代理设备; 所述故障库为根据所述优先级处理所述监控设备故障的故障库; 所述监控控制台为获取到所述优先级的故障处理信息并执行报警的监控控制台。
7. 根据权利要求6所述的基于权重的设备系统,其特征在于:所述监控设备为含有权 重的监控设备。
8. 根据权利要求7所述的基于权重的设备系统,其特征在于:所述监控事件为含有权 重的监控事件。
9. 根据权利要求8所述的基于权重的设备系统,其特征在于:所述监控设备的权重值+ 所述监控事件的权重值之和越大,所述监控设备的优先级别越高。
10. 根据权利要求6所述的基于权重的设备系统,其特征在于:两台以上所述监控代理 设备之间相互连接;两台以上所述监控代理设备通过心跳机制获取链路状态;所述监控代 理设备将获取到的所述链路状态发送到所述监视控制台,所述监视控制台通过所述链路状 态实现监控代理设备的监控。
【文档编号】G06F11/30GK104252401SQ201410436306
【公开日】2014年12月31日 申请日期:2014年8月29日 优先权日:2014年8月29日
【发明者】彭扬 申请人:北京阅联信息技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1