一种获取分布式集群系统告警的系统和方法

文档序号:7812858阅读:219来源:国知局
一种获取分布式集群系统告警的系统和方法
【专利摘要】本发明提供了一种获取分布式集群系统告警的系统和方法,包括:一个或一个以上分布式集群系统客户端和服务端;其中,分布式集群系统客户端,用于监控分布式集群系统的状态;当监控到分布式集群系统的状态不在预设的正常状态阈值范围内时,向已确定的服务端发送告警信息;服务端,用于接收各个分布式集群系统客户端发送的告警信息,并根据告警信息进行告警处理。本发明技术方案减少了网络带宽的占用,提高了分布式集群系统的性能。
【专利说明】一种获取分布式集群系统告警的系统和方法

【技术领域】
[0001]本发明涉及互联网【技术领域】,尤指一种获取分布式集群系统告警的系统和方法。

【背景技术】
[0002]在计算机领域,尤其是分布式集群网络应用环境中,对分布式集群系统进行监控,保证分布式集群系统能够长时间正常运行,减少系统故障引发的损失是非常必要的。然而,如何在最短的时间内获取到分布式集群系统的告警,成为了亟待解决的问题。
[0003]目前,业内获取分布式集群系统的告警的解决方法是部署一台管理站(即服务端),对分布式系统轮询发送状态查询消息。然而,轮询操作占用了很多网络带宽,容易造成网络拥堵,直接影响到分布式集群系统的性能。


【发明内容】

[0004]为了解决上述技术问题,本发明提供了一种获取分布式集群系统告警的系统和方法,能够减少网络带宽的占用,提高分布式集群系统的性能。
[0005]为了达到本发明目的,本发明提供了一种获取分布式集群系统告警的系统,包括:一个或一个以上分布式集群系统客户端和服务端;其中,
[0006]分布式集群系统客户端,用于监控分布式集群系统的状态;当监控到分布式集群系统的状态不在预设的正常状态阈值范围内时,向已确定的服务端发送告警信息;
[0007]服务端,用于接收各个分布式集群系统客户端发送的告警信息,并根据告警信息进行告警处理。
[0008]进一步地,分布式集群系统客户端在监控分布式集群系统的状态之前,还用于:读取配置文件信息,根据读取的配置文件信息确定需要连接的服务端。
[0009]进一步地,配置文件信息包括:每个分布式集群系统客户端需要连接的服务端的IP地址和端口号和告警触发阈值以及告警日志标识位(log)。
[0010]进一步地,分布式集群系统客户端还用于:当log显示为是(yes)时,保留该告警日志;当log显示为不是(no)时,不保留该告警日志。
[0011]进一步地,分布式集群系统客户端具体用于:
[0012]获取配置文件信息中的分布式集群系统客户端需要连接的服务端的IP地址和端□号;
[0013]根据获得的分布式集群系统客户端需要连接的服务端的IP地址和端口号确定分布式集群系统客户端需要连接的服务端。
[0014]进一步地,当监控到分布式集群系统的状态不在预设的正常状态阈值范围内时,分布式集群系统客户端具体用于:
[0015]实时获取预先设置的各个分布式集群系统的状态;
[0016]判断获得的预先设置的各个分布式集群系统的状态是否在预设的正常状态阈值范围内;
[0017]当获得的某个预先设置的分布式集群系统的状态不在预设的正常状态阈值范围内,则将该获得的某个预先设置的分布式集群系统的状态和所述分布式集群系统的标识信息转化为告警信息,发送给确定的服务端;
[0018]其中,所述预先设置的各个分布式集群系统的状态包括=Apache服务或者网卡状态或者CPU利用率或者磁盘使用率。
[0019]进一步地,分布式集群系统的标识信息,包括:分布式集群系统的名称和IP地址以及端口号。
[0020]进一步地,服务端具体用于:
[0021]根据告警信息中的分布式集群系统的标识信息,确定需要进行告警处理的分布式集群系统;
[0022]通知管理员处理需要进行告警处理的分布式集群系统的告警信息。
[0023]本发明还提供了一种获取分布式集群系统告警的方法,涉及一个或一个以上分布式集群系统客户端和服务端,包括:
[0024]分布式集群系统客户端,监控分布式集群系统的状态;当监控到分布式集群系统的状态不在预设的正常状态阈值范围内时,向已确定的服务端发送告警信息;
[0025]服务端,接收各个分布式集群系统客户端发送的告警信息,并根据告警信息进行告警处理。
[0026]进一步地,在监控分布式集群系统的状态之前,该方法还包括:读取配置文件信息,根据读取的配置文件信息确定需要连接的服务端。
[0027]进一步地,配置文件信息包括:每个分布式集群系统客户端需要连接的服务端的IP地址和端口号和告警触发阈值以及告警日志标识位(log)。
[0028]进一步地,,当log显示为是(yes)时,保留该告警日志;当log显示为不是(no)时,不保留该告警日志。
[0029]进一步地,读取配置文件信息,根据读取的配置文件信息确定需要连接的服务端,具体包括:
[0030]获取配置文件信息中的分布式集群系统客户端需要连接的服务端的IP地址和端□号;
[0031]根据获得的分布式集群系统客户端需要连接的服务端的IP地址和端口号确定分布式集群系统客户端需要连接的服务端。
[0032]进一步地,当监控到分布式集群系统的状态不在预设的正常状态阈值范围内时,向已确定的服务端发送告警信息,具体包括:
[0033]实时获取预先设置的各个分布式集群系统的状态;
[0034]判断获得的预先设置的各个分布式集群系统的状态是否在预设的正常状态阈值范围内;
[0035]当获得的某个预先设置的分布式集群系统的状态不在预设的正常状态阈值范围内,则将该获得的某个预先设置的分布式集群系统的状态和分布式集群系统的标识信息转化为告警信息,发送给确定的服务端;
[0036]其中,预先设置的各个分布式集群系统的状态包括:Apache服务或者网卡状态或者CPU利用率或者磁盘使用率。
[0037]进一步地,分布式集群系统的标识信息,包括:所述分布式集群系统的名称和IP地址以及端口号。
[0038]进一步地,接收各个分布式集群系统客户端发送的告警信息,并根据告警信息进行告警处理,包括:
[0039]根据告警信息中的分布式集群系统的标识信息,确定需要进行告警处理的分布式集群系统;
[0040]通知管理员处理需要进行告警处理的分布式集群系统的告警信息。
[0041]本发明技术方案包括:一个或一个以上分布式集群系统客户端和服务端;其中,分布式集群系统客户端,用于监控分布式集群系统的状态;当监控到分布式集群系统的状态不在预设的正常状态阈值范围内时,向已确定的服务端发送告警信息;服务端,用于接收各个分布式集群系统客户端发送的告警信息,并根据告警信息进行告警处理。本发明技术方案减少了网络带宽的占用,提高了分布式集群系统的性能。

【专利附图】

【附图说明】
[0042]此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
[0043]图1为本发明获取分布式集群系统告警的系统的结构示意图;
[0044]图2为本发明获取分布式集群系统告警的方法的流程图。

【具体实施方式】
[0045]为使本发明的目的、技术方案和优点更加清楚明白,下文中将结合附图对本发明进行详细说明。需要说明的是,在不冲突的情况下,本申请中的的特征可以相互任意组合。
[0046]图1为本发明获取分布式集群系统告警的系统的结构示意图,如图1所示,包括:一个或一个以上分布式集群系统客户端和服务端。其中,
[0047]分布式集群系统客户端,用于监控分布式集群系统的状态;当监控到分布式集群系统的状态不在预设的正常状态阈值范围内时,向已确定的服务端发送告警信息。
[0048]进一步地,在监控分布式集群系统的状态之前,分布式集群系统客户端还用于:读取配置文件信息,根据读取的配置文件信息确定需要连接的服务端。具体用于:
[0049]获取配置文件信息中的分布式集群系统客户端需要连接的服务端的IP地址和端□号;
[0050]根据获得的所述分布式集群系统客户端需要连接的服务端的IP地址和端口号确定所述分布式集群系统客户端需要连接的服务端。
[0051]其中,配置文件信息包括:分布式集群系统客户端需要连接的服务端的IP地址和端口号和告警触发阈值以及告警日志标识位(log)。
[0052]进一步地,分布式集群系统客户端还用于:当log显示为是(yes)时,保留该告警日志;当log显示为否(no)时,不保留该告警日志。
[0053]需要说明的是,分布式集群系统用户可以根据实际需要修改配置文件信息。分布式集群系统客户端与服务端采用用户数据报协议(UDP)进行通信。
[0054]当监控到分布式集群系统的状态不在预设的正常状态阈值范围内时,分布式集群系统客户端具体用于:
[0055]实时获取预先设置的各个分布式集群系统的状态;
[0056]判断获得的预先设置的各个分布式集群系统的状态是否在预设的正常状态阈值范围内;
[0057]当获得的某个预先设置的分布式集群系统的状态不在预设的正常状态阈值范围内,则将该获得的某个预先设置的分布式集群系统的状态和所述分布式集群系统的标识信息转化为告警信息,发送给确定的服务端;
[0058]其中,预先设置的各个分布式集群系统的状态包括:Apache服务或者网卡状态或者CPU利用率或者磁盘使用率等。
[0059]需要是说明的是,每个分布式集群系统都有自己的监控程序,监控程序的功能可能是不一样,比如对于分布式集群系统I来说Apache服务很重要,那么监控程序就监控Apache ;对于分布式集群系统2来说,网卡服务很重要,那么监控程序就监控网卡的状态。各个分布式集群系统的监控程序是根据需要配置的,即侧重点不同。每个分布式集群系统的监控程序只监控自己的服务器,即每个分布式集群系统的监控程序只监控预先设置的分布式集群系统的状态。
[0060]其中,分布式集群系统的标识信息,包括:分布式集群系统的名称和IP地址以及端口号。
[0061]服务端,用于接收分布式集群系统客户端发送的告警信息,并根据告警信息进行告警处理。
[0062]其中,服务端具体用于:
[0063]根据告警信息中的所述分布式集群系统的标识信息,确定需要进行告警处理的分布式集群系统;
[0064]通知管理员处理所述需要进行告警处理的分布式集群系统的告警信息。
[0065]需要说明的是,本发明装置中的服务端,还用于绑定特定的IP地址和端口号(即设置自身的IP地址和端口号),并将该IP地址和端口号发送给分布式集群系统客户端,分布式集群系统客户端依据该IP地址和端口号设置配置文件。此为本领域技术人员所熟知的惯用技术手段,在此不再赘述。
[0066]图2为本发明获取分布式集群系统告警的方法的流程图,如图2所示,涉及多个分布式集群系统客户端和服务端,包括以下步骤:
[0067]步骤201:分布式集群系统客户端监控分布式集群系统的状态;当监控的分布式集群系统的状态不在预设的正常状态阈值范围内时,向已确定的服务端发送告警信息。
[0068]需要是说明的是,每个分布式集群系统都有自己的监控程序,监控程序的功能可能是不一样,比如对于分布式集群系统I来说Apache服务很重要,那么监控程序就监控Apache ;对于分布式集群系统2来说,网卡服务很重要,那么监控程序就监控网卡的状态。各个分布式集群系统的监控程序是根据需要配置的,即侧重点不同。每个分布式集群系统的监控程序只监控自己的服务器,即每个分布式集群系统的监控程序只监控预先设置的分布式集群系统的状态。当监控程序被启动后,分布式集群系统客户端开始监控分布式集群系统的状态。
[0069]在步骤201之前,该方法还包括:读取配置文件信息,根据读取的配置文件信息确定需要连接的服务端。具体包括:
[0070]获取配置文件信息中的分布式集群系统客户端需要连接的服务端的IP地址和端□号;
[0071]根据获得的分布式集群系统客户端需要连接的服务端的IP地址和端口号确定分布式集群系统客户端需要连接的服务端。
[0072]其中,配置文件信息包括:分布式集群系统客户端需要连接的服务端的IP地址和端口号和告警触发阈值以及告警日志标识位(log)。
[0073]需要说明的是,分布式集群系统用户可以根据实际需要修改配置文件信息。每个分布式集群系统客户端与服务端采用用户数据报协议(UDP)进行通信。
[0074]当log显示为是(yes)时,保留该告警日志;当log显示为不是(no)时,不保留该告警日志。
[0075]本步骤中,当监控的分布式集群系统的状态不在预设的正常状态阈值范围内时,向已确定的服务端发送告警信息具体包括:
[0076]实时获取预先设置的各个分布式集群系统的状态;
[0077]判断获得的预先设置的各个分布式集群系统的状态是否在预设的正常状态阈值范围内;
[0078]当获得的某个预先设置的分布式集群系统的状态不在预设的正常状态阈值范围内,则将该获得的某个预先设置的分布式集群系统的状态和所述分布式集群系统的标识信息转化为告警信息,发送给确定的服务端;
[0079]其中,预先设置的各个分布式集群系统的状态包括:Apache服务或者网卡状态或者CPU利用率或者磁盘使用率等。
[0080]其中,分布式集群系统的标识信息包括:分布式集群系统的名称和IP地址以及端口号。
[0081]步骤202:服务端接收各个分布式集群系统客户端发送的告警信息,并根据告警信息进行告警处理。具体包括:
[0082]服务端根据告警信息中的所述分布式集群系统的标识信息,确定需要进行告警处理的分布式集群系统;
[0083]通知管理员处理所述需要进行告警处理的分布式集群系统的告警信息。
[0084]需要说明的是,本发明方法中的服务端,还要绑定特定的IP地址和端口号(即设置自身的IP地址和端口号),并将该IP地址和端口号发送给分布式集群系统客户端,分布式集群系统客户端依据该IP地址和端口号设置配置文件。此为本领域技术人员所熟知的惯用技术手段,在此不再赘述。
[0085]本领域普通技术人员可以理解上述方法中的全部或部分步骤可通过程序来指令相关硬件完成,所述程序可以存储于计算机可读存储介质中,如只读存储器、磁盘或光盘等。可选地,上述实施例的全部或部分步骤也可以使用一个或多个集成电路来实现。相应地,上述实施例中的各模块/单元可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。本申请不限制于任何特定形式的硬件和软件的结合。
[0086]虽然本发明所揭露的实施方式如上,但所述的内容仅为便于理解本发明而采用的实施方式,并非用以限定本发明。任何本发明所属领域内的技术人员,在不脱离本发明所揭露的精神和范围的前提下,可以在实施的形式及细节上进行任何的修改与变化,但本发明的专利保护范围,仍须以所附的权利要求书所界定的范围为准。
【权利要求】
1.一种获取分布式集群系统告警的系统,其特征在于,包括:一个或一个以上分布式集群系统客户端和服务端;其中, 分布式集群系统客户端,用于监控分布式集群系统的状态;当监控到分布式集群系统的状态不在预设的正常状态阈值范围内时,向已确定的服务端发送告警信息; 服务端,用于接收各个分布式集群系统客户端发送的告警信息,并根据告警信息进行告警处理。
2.根据权利要求1所述的系统,其特征在于,分布式集群系统客户端在监控分布式集群系统的状态之前,还用于:读取配置文件信息,根据读取的配置文件信息确定需要连接的服务端。
3.根据权利要求1所述的系统,其特征在于,所述配置文件信息包括:每个分布式集群系统客户端需要连接的服务端的IP地址和端口号和告警触发阈值以及告警日志标识位logo
4.根据权利要求3所述的系统,其特征在于,所述分布式集群系统客户端还用于:当所述log显示为是yes时,保留该告警日志;当所述log显示为不是no时,不保留该告警日
O
5.根据权利要求2或3所述的系统,其特征在于,所述分布式集群系统客户端具体用于: 获取配置文件信息中的分布式集群系统客户端需要连接的服务端的IP地址和端口号; 根据获得的所述分布式集群系统客户端需要连接的服务端的IP地址和端口号确定所述分布式集群系统客户端需要连接的服务端。
6.根据权利要求1或3所述的系统,其特征在于,所述当监控到分布式集群系统的状态不在预设的正常状态阈值范围内时,所述分布式集群系统客户端具体用于: 实时获取预先设置的各个分布式集群系统的状态; 判断获得的预先设置的各个分布式集群系统的状态是否在预设的正常状态阈值范围内; 当获得的某个预先设置的分布式集群系统的状态不在预设的正常状态阈值范围内,则将该获得的某个预先设置的分布式集群系统的状态和所述分布式集群系统的标识信息转化为告警信息,发送给确定的服务端; 其中,所述预先设置的各个分布式集群系统的状态包括=Apache服务或者网卡状态或者CPU利用率或者磁盘使用率。
7.根据权利要求6所述的系统,其特征在于,所述分布式集群系统的标识信息,包括:所述分布式集群系统的名称和IP地址以及端口号。
8.根据权利要求7所述的系统,其特征在于,所述服务端具体用于: 根据告警信息中的所述分布式集群系统的标识信息,确定需要进行告警处理的分布式集群系统; 通知管理员处理所述需要进行告警处理的分布式集群系统的告警信息。
9.一种获取分布式集群系统告警的方法,涉及一个或一个以上分布式集群系统客户端和服务端,其特征在于,包括: 分布式集群系统客户端,监控分布式集群系统的状态;当监控到分布式集群系统的状态不在预设的正常状态阈值范围内时,向已确定的服务端发送告警信息; 服务端,接收各个分布式集群系统客户端发送的告警信息,并根据告警信息进行告警处理。
10.根据权利要求9所述的方法,其特征在于,在所述监控分布式集群系统的状态之前,该方法还包括:读取配置文件信息,根据读取的配置文件信息确定需要连接的服务端。
11.根据权利要求9所述的方法,其特征在于,所述配置文件信息包括:每个分布式集群系统客户端需要连接的服务端的IP地址和端口号和告警触发阈值以及告警日志标识位log。
12.根据权利要求11所述的方法,其特征在于,当所述log显示为是yes时,保留该告警日志;当所述log显示为不是no时,不保留该告警日志。
13.根据权利要求10所述的方法,其特征在于,所述读取配置文件信息,根据读取的配置文件信息确定需要连接的服务端,具体包括: 获取配置文件信息中的分布式集群系统客户端需要连接的服务端的IP地址和端口号; 根据获得的所述分布式集群系统客户端需要连接的服务端的IP地址和端口号确定所述分布式集群系统客户端需要连接的服务端。
14.根据权利要求9或11所述的方法,其特征在于,所述当监控到分布式集群系统的状态不在预设的正常状态阈值范围内时,向已确定的服务端发送告警信息,具体包括: 实时获取预先设置的各个分布式集群系统的状态; 判断获得的预先设置的各个分布式集群系统的状态是否在预设的正常状态阈值范围内; 当获得的某个预先设置的分布式集群系统的状态不在预设的正常状态阈值范围内,则将该获得的某个预先设置的分布式集群系统的状态和所述分布式集群系统的标识信息转化为告警信息,发送给确定的服务端; 其中,所述预先设置的各个分布式集群系统的状态包括=Apache服务或者网卡状态或者CPU利用率或者磁盘使用率。
15.根据权利要求14所述的方法,其特征在于,所述分布式集群系统的标识信息,包括:所述分布式集群系统的名称和IP地址以及端口号。
16.根据权利要求15所述的方法,其特征在于,所述接收各个分布式集群系统客户端发送的告警信息,并根据告警信息进行告警处理,包括: 根据告警信息中的所述分布式集群系统的标识信息,确定需要进行告警处理的分布式集群系统; 通知管理员处理所述需要进行告警处理的分布式集群系统的告警信息。
【文档编号】H04L12/24GK104202212SQ201410433002
【公开日】2014年12月10日 申请日期:2014年8月28日 优先权日:2014年8月28日
【发明者】钱鑫, 袁鹏飞, 周龙飞, 何中辰, 张书宁, 文中领 申请人:浪潮(北京)电子信息产业有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1