集群服务器监控系统及方法与流程

文档序号:14409635阅读:619来源:国知局
集群服务器监控系统及方法与流程
本发明涉及一种监控系统及监控方法,特别是应用于集群服务器的监控系统及方法。
背景技术
:目前,高性能集群服务器系统应用非常广泛,集群的规模也在不断扩大。然,在集群服务器系统部署后,如果该系统中的其中一个服务器节点的服务发生异常时,其他节点的服务仍然能够正常运作。因此,使用者在使用过程中并不容易发现有服务错误。此外,当有节点的服务发生异常时,会浪费节点的效能,而且会失去不中断服务排除问题的时机。技术实现要素:鉴于以上内容,有必要提供一种能够及时监控到集群服务器内的节点的服务发生错误的监控系统及监控方法。一种集群服务器监控系统,包括一监控模块,所述监控模块用于与一服务器模块进行通信,所述服务器模块包括至少一服务器节点,每个节点位于一相应的ip网段内,每个节点提供至少一服务,所述监控模块包括一扫描单元、一侦测单元、一访问单元、一判断单元及一设定单元,所述扫描单元用于扫描一目标ip网段内的每个节点及扫描对应所述每个节点的服务,所述侦测单元用于侦测是否产生一触发事件,所述访问单元用于在所述侦测单元侦测到所述触发事件后访问对应所述每个节点的服务,所述判断单元用于判断对应所述每个节点的服务是否有错误;当所述判断单元判断其中一个节点的服务有错误时,所述设定单元提供解决所述错误的方案。一种集群服务器监控方法,包括以下步骤:扫描单元扫描一目标ip网段上的每个节点;扫描单元扫描对应所述每个节点的服务;侦测单元侦测到一触发事件;访问单元访问对应所述每个节点的服务;判断单元判断对应所述每个节点的服务是否有错误;当所述判断单元判断其中一个节点中的服务有错误时,设定单元提供解决所述错误的方案。与现有技术相比,上述集群服务器监控系统及方法中,所述访问单元访问对应所述每个节点的服务后,所述判断单元判断对应所述每个节点的服务是否有错误,当所述判断单元判断其中一个节点的服务有错误时,所述设定单元提供解决所述错误的方案,从而使用者能够及时监控到服务发生错误、并通过获取解决错误的方案而能够及时解决错误。附图说明图1是一种集群服务器监控系统的一功能模块图。图2是图1的集群服务器监控系统一节点显示界面的一示意图。图3是图1的集群服务器监控系统一服务显示界面的一示意图。图4是图1的集群服务器监控系统一错误显示界面的一示意图。图5是图1的集群服务器监控系统的监控方法的一流程图。主要元件符号说明监控模块10设定单元11扫描单元12侦测单元13访问单元14判断单元15发送单元16服务器模块20如下具体实施方式将结合上述附图进一步说明本发明。具体实施方式请参阅图1,一集群服务器监控系统,包括一监控模块10和一服务器模块20。所述监控模块10用于通过网络与所述服务器模块20进行通信。所述服务器模块20为一集群服务器,并包括多个服务器,每一服务器对应一个节点,每一服务器具有多个服务。所述监控模块10用于监控对应每一服务器节点的服务。所述服务器模块20的多个节点分别为:一第一节点n1、一第二节点n2、一第三节点n3,…一第n节点nn。每个节点对应一唯一的ip地址。每一ip地址位于一相应的网段内,例如:ip地址为172.1.1.7与ip地址为172.1.1.8的两个ip地址位于同一网段内。所述监控模块10包括一设定单元11、一扫描单元12、一侦测单元13、一访问单元14、一判断单元15及一发送单元16。所述服务器模块20内的每个节点对应一ip网段。所述设定单元11用于设定一目标ip网段及一目标客户。所述监控模块10用于通过所述目标ip网段访问位于所述目标ip网段内的多个节点,例如第一节点n1、第二节点n2、第三节点n3、第四节点n4、第五节点n5、第六节点n6,…第m节点nm。所述扫描单元12用于扫描所述目标ip网段内的每个节点。所述扫描单元12扫描到的每个节点显示在一节点显示界面w1上。所述节点显示界面w1显示有扫描到的每个节点的图标及对应所述节点的ip地址。所述扫描单元12还用于扫描对应每个节点的所有服务,从而获取对应每个节点的所有服务。所述设定单元11还用于将具有相同服务的节点进行标记,例如,将具有相同服务的节点对应的节点图标排列在一起进行显示。如图2所示,在一实施例中,所述扫描单元12扫描到的节点个数为6,分别为所述第一节点n1、所述第二节点n2、所述第三节点n3、所述第四节点n4、所述第五节点n5及所述第六节点n6,这6个节点对应的ip地址分别为:172.1.1.2、172.1.1.3、172.1.1.4、172.1.1.5、172.1.1.6及172.1.1.7;所述设定单元11将具有相同服务的第一节点n1与第二节点n2排列在一起、将具有相同服务的第三节点n3与第四节点n4排列在一起、将具有相同服务的第五节点n5与第六节点n6排列在一起,从而显示在所述节点显示界面w1上。当所述扫描单元12获取对应每个节点的服务后,使用者可以选择多个默认的服务,也可以选择其他的服务,还可以新增其他的服务。具体地,如图3所示,每个节点对应的服务显示在一服务显示界面w2上,所述服务显示界面w2上显示有多个服务、一附加选项按钮b1及一执行按钮b2,使用者可以选择默认的服务,也可以从所述多个服务中选择需要的服务,还可以通过触发附加选项按钮b1来新增需要的服务。当使用者选择需要的服务后,可以通过触发所述执行按钮b2来产生一触发事件。所述侦测单元13用于侦测是否产生所述触发事件。在一实施例中,使用者可以双击所述第二节点n2的图标,从而获取对应所述第二节点n2的服务,所述第二节点n2对应的服务包括有mariadb、cinder、keystone、rabbitmq、ceilometer及mongodb,所述服务显示在所述服务显示界面w2上,其中cinder、keystone、及mongodb为默认的服务,使用者可以根据需求更换服务,也可以通过点击所述附加选项按钮b1新增其他的服务。当使用者选择好需要的服务后,使用者可以通过触发所述执行按钮b2,从而产生所述触发事件。所述侦测单元13还用于在侦测到所述触发事件后发送一通知信号给所述访问单元14。所述访问单元14用于在接收到所述通知信号后访问所述扫描单元12扫描到的每个节点的服务。所述判断单元15用于判断所述访问单元14访问的每个节点对应的服务是否有错误。当所述判断单元15判断其中一个节点对应的一个服务有错误时,所述设定单元11将有错误的服务对应的节点的图标的颜色进行更换,其他没有错误的服务对应的节点的图标的颜色保持不变,并且,所述设定单元11提供解决对应所述错误的方案。使用者可以通过触发所述第二节点n2的图标,来获取对应所述第二节点n2的错误信息,所述错误信息及解决对应所述错误的服务的方案显示在一错误显示界面w3上。所述发送单元16用于在所述设定单元11提供解决对应所述错误的方案后发送相关信息及邮件给所述目标客户,以通知所述目标客户。具体地,所述发送单元16发送的所述相关信息可以是对应所述错误的节点的ip地址,也可以是所述错误信息,还可以是解决所述错误的方案。如图4所示,在一实施例中,当所述第二节点n2的服务有错误,所述设定单元11将所述节点n2的图标的颜色更换为红色,其他没有错误的服务对应的节点的图标的颜色保持为绿色;使用者可以将鼠标放置在所述第二节点n2的图标上,对应所述第二节点n2的错误信息及解决所述错误的方案显示在所述错误显示界面w3上。具体地,对应所述第二节点n2的错误信息为:openstack-cinder-volume、openstack-cinder-scheduler和openstack-cinder-api,对应解决所述错误的方案为:restartallservicesonabovelist。请参阅图5,一种集群服务器监控方法包括如下步骤:s101:所述设定单元11设定一目标ip网段。s102:所述扫描单元12扫描所述目标ip网段内的每个节点。s103:所述扫描单元12扫描所述目标ip网段内的每个节点对应的服务,从而获取对应每个节点的多个服务。s104:所述侦测单元13侦测是否产生一触发事件,如果是,进行步骤s105;否则,系统等待。具体地,所述触发事件是在使用者选择服务后产生的。在一实施例中,使用者可以选择多个默认的服务,使用者也可以选择其他需要的服务,使用者还可以新增其他需要的服务;当使用者选择好需要的服务后,通过触发所述执行按钮b2产生所述触发事件。s105:所述侦测单元13发送一通知信号给所述访问单元14。s106:所述访问单元14访问对应每个节点的服务。s107:所述判断单元15判断对应每个节点的服务是否有错误,如果其中有一节点的服务有错误,则进行步骤s108;否则,进行步骤s110。s108:所述设定单元11将对应服务有错误的节点的图标的颜色进行更换,及提供解决对应所述错误的方案。s109:所述发送单元16发送相关信息及邮件给所述目标客户。s110:所述设定单元11设定没有错误的服务对应的节点的图标的颜色保持不变。在上述集群服务器监控系统及方法中,所述扫描单元12通过扫描所述目标ip网段内的每个节点对应的服务,从而所述访问单元14访问对应每个节点的服务后,所述判断单元15能够判断对应每个节点的服务是否有错误,当所述判断单元15判断存在有错误的服务时,所述设定单元11可以将对应有错误的服务的节点的图标的颜色进行更换,以方便使用者观察;并且所述设定单元11自动提供解决对应所述错误的方案,以方便使用者根据所述方案及时解决相关的问题;此外,所述发送单元16通过发送相关信息及邮件给所述目标客户,能够及时通知所述目标客户。对本领域的技术人员来说,可以根据本发明的发明方案和发明构思结合生产的实际需要做出其他相应的改变或调整,而这些改变和调整都应属于本发明所公开的范围。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1