一种节点监控方法和装置与流程

文档序号:13984313阅读:234来源:国知局
一种节点监控方法和装置与流程

本发明涉及计算机互联网技术,尤指一种节点监控方法和装置。



背景技术:

在云计算时代,海量数据存储传输处理需要占用巨大的服务器资源,比较大型的单位都会有成百上千个服务器节点,每个节点会有多达几百个监测项,高并发以及海量数据处理,是智能监测要面对的重大问题及挑战,提高监测性能成为智能监测的首要目标。

比较大型的单位会有成百上千个服务器节点,每个节点会有多达几百个监测项,假设添加大量的服务器(如10000台),每台机器按照100个监控项,则需要在监控机上对这1000000个监控项进行轮询检查,当发现其中监控项出现异常,则产生告警,通过短信、邮件或第三方告警平台转发,这种情况下,一方面大量数据处理影响监控机上云海性能,严重影响系统的稳定性;另一方面,因为告警的出现是偶发性的,因此监控机器上很大一部分数据处理是“没有必要”的,对告警的产生是没有效果的,因此高并发以及海量数据处理,是智能监测要面对的重大问题及挑战,提高监测性能成为智能监测的首要目标。



技术实现要素:

为了解决上述技术问题,本发明提供了一种节点监控方法和装置,系统工作于主动监控和被动监控两种模式之下,将部分数据收集分析任务下放到被监控节点,缓解了监控节点工作压力,提高了监控执行效率,解决了监控节点数据处理量大、运行压力过高的问题。

为了达到本发明目的,本发明提供了一种节点监控方法,包括:

系统中的节点收集监控数据;

在收集到的监控数据表明存在异常时,所述节点发送告警信息。

优选的,所述系统中的节点具体为监控节点,系统中的节点收集监控数据的步骤包括:

所述监控节点向至少一个被监控节点发送监控数据请求,接收所述至少一个被监控节点返回的监控数据。

优选的,在收集到的监控数据表明存在异常时,所述节点发送告警信息的步骤包括:

所述监控节点分析收集得到的所述监控数据;

在发现数据异常时,所述监控节点发送告警信息。

优选的,所述系统中的节点具体为被监控节点,系统中的节点收集监控数据的步骤具体为:

所述被监控节点收集自身的监控数据。

优选的,在收集到的监控数据表明存在异常时,所述节点发送告警信息的步骤包括:

所述被监控节点分析自身的所述监控数据;

所述被监控节点在发现数据异常时,向监控节点发送告警信息。

本发明还提供了一种节点监控装置,包括:

数据采集模块,用于收集监控数据;

数据处理模块,用于在收集到的监控数据表明存在异常时,发送告警信息。

优选的,所述数据采集模块包括:

被监控数据收集单元,用于向至少一个被监控节点发送监控数据请求,接收所述至少一个被监控节点返回的监控数据。

优选的,所述数据处理模块包括:

被监控数据分析单元,用于分析收集得到的所述监控数据;

告警单元,用于在发现数据异常时,发送告警信息。

优选的,所述数据采集模块还包括:

自分析告警接收单元,用于接收被监控节点收集自身的监控数据,并分析自身的所述监控数据发现数据异常时,发送的告警信息。

本发明提供了一种节点监控方法和装置,系统中的节点收集监控数据,在收集到的监控数据表明存在异常时,所述节点发送告警信息。可由监控节点收集监控数据后分析发现异常,也可由被监控节点对自身的监控数据进行分析,在发现异常时通报给监控节点。通过两种工作模式,更好的适应了网络环境,缓解监控节点工作压力,提高了监控执行效率,解决了监控节点数据处理量大、运行压力过高的问题。

本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。

附图说明

附图用来提供对本发明技术方案的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本发明的技术方案,并不构成对本发明技术方案的限制。

图1为本发明的实施例一提供的一种节点监控系统在主动监控模式下的工作原理示意图;

图2为本发明的实施例一提供的一种节点监控系统在被动监控模式下的工作原理示意图;

图3为本发明的实施例二提供的一种节点监控方法的流程示意图;

图4为本发明的实施例三提供的一种节点监控装置的结构示意图;

图5为图4中数据采集模块401的结构示意图;

图6为图4中数据处理模块402的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白,下文中将结合附图对本发明的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。

在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行。并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。

比较大型的单位会有成百上千个服务器节点,每个节点会有多达几百个监测项,假设添加大量的服务器(如10000台),每台机器按照100个监控项,则需要在监控机上对这1000000个监控项进行轮询检查,当发现其中监控项出现异常,则产生告警,通过短信、邮件或第三方告警平台转发,这种情况下,一方面大量数据处理影响监控机上云海性能,严重影响系统的稳定性;另一方面,因为告警的出现是偶发性的,因此监控机器上很大一部分数据处理是“没有必要”的,对告警的产生是没有效果的,因此高并发以及海量数据处理,是智能监测要面对的重大问题及挑战,提高监测性能成为智能监测的首要目标。

为了解决上述问题,本发明的实施例提供了一种节点监控方法和装置。系统工作于主动监控和被动监控两种模式之下,将部分数据收集分析任务下放到被监控节点,缓解了监控节点工作压力,提高了监控执行效率,解决了监控节点数据处理量大、运行压力过高的问题。

下面结合附图,对本发明的实施例一进行说明。

本发明实施例提供了一种节点监控系统,包括监控节点与被监控节点,监控节点与被监控节点分别安装对应装置,监控节点包括数据采集模块以及数据处理模块,被监控节点包括数据采集模块以及数据处理模块。

一般情况下,监控节点的数据采集模块定时轮流向被监控节点发动监控请求,被监控节点接收请求后进行数据处理,将监控节点需要的数据返回给监控节点,监控节点获取监控数据后由数据处理模块进行处理,对监控项进行保存,告警等操作。主动监控的流程具体如图1所示:

1、监控节数据采集模块点定时向被监控端发送请求。

2、被监控节点返回需要的监控数据。

3、监控节点将监控数据传输给数据处理模块处理

4、最终产生告警。

当被监控节点数量较多,监控节点处理数据大量增加,系统采用被动接收方式进行监控:监控节点不再定时向被监控节点发动请求,而是由被监控节点自监控,即被监控节点定时对自身节点对应数据进行分析,当产生告警后,由被监控节点则向监控节点发送告警,监控节点获取告警信息后,则对告警数据进行处理。被动监控的流程具体如图2所示:

(1)被监控节数据采集模块定时收集数据,并交由本机数据处理模块处理。

(2)若数据正常,则本轮监控终止;若出现告警,数据处理模块会吧告警数据返回给数据采集模块。

(3)被监控节点将监控告警数据传输给监控节点数据采集模块

(4)最终产生告警发送给数据处理模块。

(5)数据处理模块将告警数据发送。

通过这种方式,被监控节点本身过滤掉大量正常的无危害数据,监控节点仅仅处理少量告警数据即可,一方面提高了系统对告警的反应速度,即从最多要等一个轮询周期才能发现故障,到几乎立即就可以发现故障病告警;另一方面,通过此种操作为监控节点过滤了大量无效数据,减轻了监控节点压力,变相提高了系统性能。

下面结合附图对本发明的实施例二进行说明。

本发明实施例提供了一种节点监控方法,使用该方法完成节点监控的流程如图3所示,包括:

步骤301、系统中的节点收集监控数据;

本发明实施例中,一般情况下,监控节点向被监控节点发动监控请求,获取监控数据,并对监控数据进行分析。当被监控节点数量较多,监控节点处理数据大量增加时,被监控节点进行自监控。

在监控节点进行主动监控的情况下,本步骤中,监控节点向至少一个被监控节点发送监控数据请求,接收所述至少一个被监控节点返回的监控数据。

在监控节点进行被动监控,即被监控节点自行处理监控数据,分析是否存在异常的情况下,本步骤中,被监控节点收集自身的监控数据。

步骤302、在收集到的监控数据表明存在异常时,所述节点发送告警信息;

本步骤中,在主动监控模式下,监控节点分析收集得到的所述监控数据,在发现数据异常时,所述监控节点发送告警信息。

在被动监控模式下,所述被监控节点分析自身的所述监控数据,在发现数据异常时,向监控节点发送告警信息,向监控节点通报异常,以便于监控节点进行告警。

下面结合附图,对本发明的实施例三进行说明。

本发明实施例提供了一种节点监控装置,其结构如图4所示,包括:

数据采集模块401,用于收集监控数据;

数据处理模块402,用于在收集到的监控数据表明存在异常时,发送告警信息。

优选的,所述数据采集模块401的结构如图5所示,包括:

被监控数据收集单元4011,用于向至少一个被监控节点发送监控数据请求,接收所述至少一个被监控节点返回的监控数据。

优选的,所述数据处理模块402的结构如图6所示,包括:

被监控数据分析单元4021,用于分析收集得到的所述监控数据;

告警单元4022,用于在发现数据异常时,发送告警信息。

优选的,所述数据采集模块401还包括:

自分析告警接收单元4012,用于接收被监控节点收集自身的监控数据,并分析自身的所述监控数据发现数据异常时,发送的告警信息。

本发明的实施例提供了一种节点监控方法和装置,系统中的节点收集监控数据,在收集到的监控数据表明存在异常时,所述节点发送告警信息。可由监控节点收集监控数据后分析发现异常,也可由被监控节点对自身的监控数据进行分析,在发现异常时通报给监控节点。通过两种工作模式,更好的适应了网络环境,缓解监控节点工作压力,提高了监控执行效率,解决了监控节点数据处理量大、运行压力过高的问题。采用主被动相结合的方式,在监控节点以及监控项数量巨大的情况下,将监控节点的压力分散在各个被监控节点,减轻了监控节点压力,增加了监控系统的稳定性。

针对上述问题,主要解决方案为是提高监控节点性能,增加处理能力;或者减少监控节点数据处理量,减少监控节点压力。

虽然本发明所揭露的实施方式如上,但所述的内容仅为便于理解本发明而采用的实施方式,并非用以限定本发明。任何本发明所属领域内的技术人员,在不脱离本发明所揭露的精神和范围的前提下,可以在实施的形式及细节上进行任何的修改与变化,但本发明的专利保护范围,仍须以所附的权利要求书所界定的范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1