分布式监控系统及方法

文档序号:9219670阅读:602来源:国知局
分布式监控系统及方法
【技术领域】
[0001]本发明涉及计算机领域,具体来说,涉及一种分布式监控系统及方法。
【背景技术】
[0002]随着互联网技术、大数据、云计算的高速发展,数据中心服务器集群的规模也在不断的扩大。在大规模的应用中,集群中服务器节点的个数已经达到上万,并且,仍然在以指数级的速度持续增长。因此,大规模集群的监控管理变得更加复杂。集群监控管理平台也由传统的单一管理点模式向分布式管理平台演变。
[0003]为了满足大规模服务器集群的监控需求,已经出现了一些分布式架构的集群监控平台。这些平台能够根据服务器集群规模建立若干个分管理点,每个分管理点负责采集与之连接的服务器的监控数据,再将这些监控数据汇总到上层总管理点。这种方式虽然在一定程度上缓解了监控规模局限的问题,但是仍然存在以下几个问题:
[0004](I)规模扩展灵活性差。分管理节点与其所管理的服务器资源的对应关系固定,因此,当所监控服务器规模发生变化时,需要人为增减分管理点,并调整对应关系。
[0005](2)若分管理节点发生故障,会直接导致其所监控管理的服务器监控数据无法及时采集和存储,甚至会造成漏报告警信息。
[0006](3)总管理点和分管理点间的通信大多采用同步通信,性能低下,数据的收集影响其他业务功能使用。
[0007]针对上述相关技术中的问题,目前尚未提出有效的解决方案。

【发明内容】

[0008]针对相关技术中的问题,本发明提出一种分布式监控及方法,能够将监控资源动态分配给数量可变的分管理节点,并且使总管理节点和分管理节点能够通过消息中间件的通信方式实现高效的异步数据传输。
[0009]本发明的技术方案是这样实现的:
[0010]根据本发明的一个方面,提供了一种分布式监控系统。
[0011]该系统包括:
[0012]总管理节点、多个分管理节点、多个服务器、消息中间件、映射模块;
[0013]其中,总管理节点,用于监控分管理节点的状态信息,根据状态信息指定各分管理节点与各服务器间的通信连接关系,并将通信连接关系记录至映射模块。
[0014]并且,总管理节点进一步用于获取消息中间件中存储的由各分管理节点发送的服务器的监控数据信息,并将监控数据信息进行存储。
[0015]以及,分管理节点,用于根据映射模块中的通信连接关系监控与分管理节进行通信连接的服务器,并收集被监控服务器的监控数据信息,以及,向消息中间件周期性发送监控数据信息。
[0016]在本发明的一个优选的实施例中,消息中间件与映射模块设置于总管理节点中。
[0017]在本发明的一个优选的实施例中,分管理节点的状态信息包括以下至少之一:
[0018]分管理节点的数量、工作状态、性能。
[0019]在本发明的一个优选的实施例中,总管理节点进一步用于提供一可视界面,通过可视界面显示监控数据信息。
[0020]根据本发明的另一方面,提供了一种分布式监控方法。
[0021]该方法包括:
[0022]总管理节点根据多个分管理节点的状态信息指定各分管理节点与各服务器间的通信连接关系,并将通信连接关系记录至映射模块;
[0023]各分管理节点根据映射模块中的通信连接关系监控对应的服务器,并收集被监控服务器的监控数据信息,以及向消息中间件周期性发送监控数据信息;
[0024]总管理节点从消息中间件中获取监控数据信息,并将监控数据信息进行存储。
[0025]在本发明的一个优选的实施例中,总管理节点根据多个分管理节点的状态信息指定各分管理节点与各服务器间的通信连接关系,并将通信连接关系记录至映射模块,进一步包括:
[0026]总管理节点实时监控各分管理节点的状态信息,若任一分管理节点的状态信息发生异常,则总管理节点重新指定各分管理节点与各服务器间的通信连接关系,并将通信连接关系更新至映射模块;
[0027]在本发明的一个优选的实施例中,分管理节点的状态信息包括以下至少之一:
[0028]分管理节点的数量、工作状态、性能。
[0029]在本发明的一个优选的实施例中,总管理节点将通信连接关系更新至映射模块之后,进一步包括:
[0030]分管理节点周期性检测映射模块中的通信连接关系,若通信连接关系发生变化,则分管理节点根据更新后的通信连接关系监控对应的服务器。
[0031]在本发明的一个优选的实施例中,通过总管理节点提供一可视界面,并根据可视界面显示监控数据信息。
[0032]在本发明的一个优选的实施例中,总管理节点将监控数据信息与预置的监控阈值进行比较,若监控数据信息不符合预定监控范围,则发出告警。
[0033]本发明通过使总管理节点和分管理节点能够通过消息中间件的通信方式,实现了分管理节点向总管理节点传输监控数据时的高效异步数据传输,并且,通过将通信连接关系记录到映射模块,并且分管理节点根据映射模块中的通信连接监控与之通信连接的服务器的技术手段,能够使总管理节点将监控资源动态分配给数量可变的分管理节点,从而避免了单点故障时,监控数据采集不及时,造成监控数据丢失的情况。
【附图说明】
[0034]为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0035]图1是根据本发明实施例的分布式监控系统的示意图;
[0036]图2是根据本发明实施例的分布式监控方法的流程图;
[0037]图3是根据本发明一具体实施例的分布式监控方法的流程示意图;
[0038]图4是根据本发明又一具体实施例的分布式监控方法的流程示意图;
[0039]图5是根据本发明再一具体实施例的分布式监控方法的流程示意图。
【具体实施方式】
[0040]下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。
[0041]根据本发明的实施例,提供了一种分布式监控系统。
[0042]如图1所示,根据本发明实施例的分布式监控系统,该系统包括:总管理节点11、多个分管理节点12-14、多个服务器15-17、消息中间件、映射模块。其中,消息中间件设置于总管理节点11中,为总管理节点11和分管理节点12进行监控数据传输时提供一异步传输通道,分管理节点可将收集到的监控数据发送到消息中间件的消息队列中,总管理节点可从消息中间件中获取分管理节点发送的监控数据,从而实现了
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1