管理服务器、服务器集群、以及管理方法与流程

文档序号:11156717阅读:380来源:国知局
管理服务器、服务器集群、以及管理方法与制造工艺

本发明涉及管理服务器、服务器集群、以及管理方法,特别涉及能够快速恢复异常节点的管理服务器、服务器集群、以及管理方法。



背景技术:

现在,与“大数据”有关的技术正在快速发展。随着物联网、移动应用的兴起,数据量相比过去会有几何级的提升,因此数据库所需要解决的问题不再仅仅是记录程序正确的处理结果,还需要解决横向扩展等各种挑战。

面对上述挑战一个显而易见的办法是将多个服务器组成一组集群,这样一来就可以充分利用每一台服务器的资源并将客户端负载分发到不同服务器上,随着应用程序负载的增加,只需要将新的服务器添加到集群即可。

服务器集群就是指将很多服务器集中起来一起进行同一种服务,在客户端看来就像是只有一个服务器。集群可以利用多个计算机进行并行计算从而获得很高的计算速度,也可以用多个计算机做备份,从而使得任何一个计算机坏了整个系统还是能正常运行。

一旦在服务器上安装并运行了集群服务,该服务器即可作为节点加入群集。集群化操作可以减少单点故障数量,并且实现了群集化资源的高可用性。

在集群中配置服务时,管理服务器会使用该服务所需的一个或多个功能(一般称为角色)配置集群中的服务器。角色确定哪些服务在给定服务器上运行。

在大数据平台的集群中,经常出现单个节点出现异常的情况。现有的集群已经能做到在单个节点出现异常时,集群可以继续正常的运转,但是集群的计算性能已经发生了变化。为了维持性能,管理服务器需要新增加节点。但目前新节点的系统配置和在集群中的角色配置需要手动配置,需要耗费很长时间,甚至有可能由于配置已经丢失而导致无法做到。

现在企业和大型机构在寻求解决大数据问题时,往往会使用开源软件基础架构,如Hadoop的服务。大数据管理系统提供一个可扩展、灵活、集成的平台,可用来方便地管理企业中快速增长的多种多样的数据。但是在上述系统的集群管理中也存在当集群中的服务器出现故障需要切换时,管理服务器为了进行角色配置而导致切换时间长的问题。

尤其是,在多个其它服务器结点连接而构成服务器集群中,没有专门的用于存储其它服务器的系统配置信息和/或集群角色配置信息的管理服务器。因此,在其它服务器中产生了修改配置信息的情况下,不能及时对修改的配置信息进行记录。进而,在有新增服务器的情况下,也不能快速准确地对新增服务器进行配置。



技术实现要素:

本发明是鉴于上述问题而提出的,目的是提供一种能够自动对所有节点的配置信息进行记录,实时地保持集群中所有节点的配置信息,并迅速进行更新的管理服务器及其管理方法。

本发明提供一种管理服务器,通过网络与多个其它服务器结点连接而构成服务器集群,该管理服务器包括:通信单元,与服务器集群中的其它服务器结点进行通信;以及存储单元,存储其它服务器中的至少一个服务器的配置信息。

进一步,在上述管理服务器中,存储单元存储至少一个其它服务器的系统配置信息和/或集群角色配置信息。

进一步,在上述管理服务器中还包括:处理器,用于监测其它服务器中是否有第一服务器修改配置信息的情况,在有修改配置信息的情况下,获取第一服务器的修改后的第一配置信息,对存储单元中存储的第一服务器的原有配置信息进行更新。

进一步,在上述管理服务器中,处理器还用于监测服务器集群中是否有新增的第二服务器,在有新增的第二服务器的情况下,判断是否需要应用存储单元中存储的其它服务器中的第三服务器的第三配置信息,在判断为需要应用第三配置信息的情况下,将第三配置信息发送到第二服务器,以使第二服务器基于第三配置信息进行配置。

按照上述的管理服务器,在多个其它服务器结点连接而构成服务器集群中,设置专门的用于存储其它服务器的系统配置信息和/或集群角色配置信息的管理服务器。因此,在其它服务器中产生了修改配置信息的情况下,也能够及时对修改的配置信息进行记录。而且,在有新增服务器的情况下,也能快速准确地对新增服务器进行配置。

本发明还提供一种服务器集群,包含了上述任意一项的管理服务器。

本发明还提供一种管理服务器的管理方法,管理服务器通过网络与多个其它服务器结点连接而构成服务器集群,其特征在于,方法包括:管理服务器的通信单元与服务器集群中的其它服务器结点进行通信的步骤;以及管理服务器的存储单元存储其它服务器中的至少一个服务器的配置信息的步骤。

技术效果

通过使用本发明的管理服务器、服务器集群以及管理方法,能够实时地对服务器集群中服务器的配置信息进行记录。而且,在有新增服务器的情况下,也能快速准确地对新增服务器进行配置,从而达到让集群快速恢复原有的计算性能的效果。

附图说明

图1是表示本发明的第1实施方式的服务器集群的结构图。

图2是表示本发明的第1实施方式的管理服务器的结构图。

图3是表示本发明的第1实施方式的管理服务器的管理方法的一个流程图。

图4是表示本发明的第1实施方式的管理服务器的管理方法的另一个流程图。

图5是表示本发明的第2实施方式的数据管理系统的结构图。

图6是表示本发明的第2实施方式的管理服务器的结构图。

图7是表示本发明的第2实施方式的管理服务器的管理方法的流程图。

具体实施方式

下面将参照附图更详细地描述本公开的具体实施例。虽然附图中显示了本公开的多个具体实施例,然而应该理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了使本公开被理解得更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。

(第1实施方式)

图1是表示本发明的第1实施方式的服务器集群1的结构图。

如图1所示,在服务器集群1中,主要包括管理服务器2和其它服务器3。其中管理服务器2和其它服务器3通过通信线路进行连接并构成服务器集群1的各个节点,在服务器集群1中还可以包括新增其它服务器3'。

图2是表示本发明的第1实施方式的管理服务器2的结构图。

管理服务器2用于部署、管理、监控Hadoop等大数据工具和其他相关开放源代码项目部署并诊断问题。管理服务器2提供基于Web的用户界面,使数据管理简单而直接。上述管理服务器2不仅可以通过硬件,也可以通过应用程序来实现。

管理服务器2中至少包括通信单元21和存储单元22,还包括处理单元23等其它单元。

其中,通信单元21与服务器集群1中的其它服务器3进行通信,与其它服务器3之间进行指令、数据、响应等信号的发送接收。

存储单元22存储服务器集群1中的其它服务器3中的至少一个服务器的配置信息。

在上述配置信息中,包括系统配置信息和/或集群角色配置信息。

其中,系统配置信息是安装在集群的所有节点上,负责启动和关闭各个管理服务器2管理的服务进程,解压和安装管理服务器2管理的服务,进行自动配置,以及通过心跳机制等监视集群服务器状态等的配置信息。集群角色配置信息是为了使各个服务器节点完成服务任务所需的一个或多个功能(也称为角色)而被配置的信息。

处理单元23用于监测其它服务器3中是否有某些(第一服务器)修改配置信息的情况,在有服务器修改配置信息的情况下,获取这些服务器的修改后的配置信息(第一配置信息),对存储单元22中存储的该服务器的原有配置信息进行更新。

同时,处理单元23还用于监测服务器集群中是否有新增的服务器(第二服务器),在有新增的服务器的情况下,判断是否需要应用存储单元22中存储的其它服务器中的某个服务器(第三服务器)的配置信息(第三配置信息),在判断为需要应用该配置信息的情况下,将其发送到新增的服务器,以使该新增的服务器基于该配置信息进行配置。

具体来说,处理单元23包括多个子单元,如:集群管理单元231、服务管理单元232、角色管理单元233、服务器管理单元234等。处理单元23具有的各个功能也可由这些子单元完成。

其中,集群管理单元231在成功安装集群后,可添加其他运行相同或不同版本的集群。然后,可独立管理每个集群及其服务。

服务管理单元232能够管理各个项目和受管服务的部署和配置。

角色管理单元233使用服务所需的一个或多个功能即角色来配置集群中的服务器。其中角色用于确定哪些功能在给定服务器上运行。

服务器管理单元234能够配置和管理服务器集群中的服务器。

以下,重点说明角色管理单元233的工作。

角色管理单元233可以在创建服务后向服务添加角色。在将群集升级到新版本时,角色管理单元233也可以为添加到新版本中的服务器创建一个角色。每个角色包含了各个服务器节点系统配置或集群角色配置信息。

角色管理单元233还对服务器分配角色。角色管理单元233首先评估服务器的硬件配置,以确定每个角色的最佳服务器。这些分配通常是可接受的,但可以根据需要进行重新分配。

并且角色管理单元233在添加和分配角色之后,还根据系统和服务器的运行状态,对服务器的角色执行启动、停止、解除、删除等操作。

在服务器集群中开始运行应用后,角色管理单元233监测服务器集群中各个服务器节点的运行状况,存储所述各个服务器节点系统配置或集群角色配置信息的修改,保持最新的信息。

假设在集群中的应用在一个服务器3上运行,如果这个应用出现故障,其它的某台服务器3会重新启动这个应用,接管位于共享磁盘柜上的数据区,进而使应用重新正常运转。整个应用的接管过程大体需要三个步骤:侦测并确认故障、新增服务器3'重新启动该应用、接管共享的数据区。

在将新增服务器3'加入群集时,管理服务器2中的角色管理单元233需要对其角色进行重新设定,以使其应用原来的服务器3的系统配置和角色配置信息,从而让集群恢复原有的计算性能。

具体来说,首先在监测过程中发现所述集群中原有服务器节点丢失,新增加服务器3'替代原有服务器3的情况下,角色管理单元233判断是否需要应用原有服务器节点的角色配置,在判断为需要应用原有服务器节点的角色配置的情况下,角色管理单元233通过通信单元21,自动将存储的原有服务器3的系统配置和/或集群角色配置信息发送到新增服务器3';在判断为不需要应用原有服务器节点的角色配置的情况下,对其分配新的角色配置。

以下,参照附图3和图4说明第1实施方式的管理服务器的管理方法。

图3是表示本发明的第1实施方式的管理服务器的管理方法的一个流程图。

在步骤11中,管理服务器2的通信单元21与服务器集群中的其它服务器结点3进行通信。

在步骤12中,管理服务器2的存储单元22存储其它服务器3中的至少一个服务器的配置信息。

在步骤13中,管理服务器2的处理单元23监测其它服务器3中是否有某个第一服务器修改配置信息。

在步骤14中,在有修改所述配置信息的情况下,获取所述第一服务器的修改后的第一配置信息,对所述存储单元22中存储的所述第一服务器的原有配置信息进行更新。

按照附图3中的管理服务器的管理方法,可以通过管理服务器2随时监视并更新其它服务器3中的配置信息。

图4是表示本发明的第1实施方式的管理服务器2的管理方法的另一个流程图。

在步骤21中,管理服务器2的处理单元23监测服务器集群中是否有新增的第二服务器3'。

在步骤22中,在有新增的第二服务器3'的情况下,判断是否需要应用存储单元22中存储的其它服务器3中的某个第三服务器的第三配置信息。

在步骤23中,在判断为需要应用第三配置信息的情况下,将所述第三配置信息发送到第二服务器3',以使第二服务器3'基于第三配置信息进行配置。

按照附图4中的管理服务器2的管理方法,在服务器集群中有新增的服务器节点的情况下,可以自动地迅速对其配置信息进行配置。

本发明还提供一种具有上述管理服务器2的服务器集群1。

在该服务器集群1中存在多个管理服务器2时,各所述管理服务器2负责存储其配置信息的其它服务器3相同或不同。

在各管理服务器2负责存储其配置信息的其它服务器3互不相同的情况下,各管理服务器2中的第一管理服务器监测到有其它服务器的配置信息的更新的时候,判断产生该更新配置的所述其它服务器是否与自己存储了配置信息的所述其它服务器相匹配,在相匹配的情况下,对存储的所述其它服务器的原有配置信息进行更新;在不匹配的情况下,保留原有的配置。这样,通过管理服务器2分别负责不同的其它服务器3并分别更新,可以加快作为服务器集群1整体的更新速度。

在各个管理服务器2负责存储其配置信息的其它服务器3相同的情况下,监测到有其它服务器的配置信息的更新的时候,对本身存储的所述其它服务器的原有配置信息进行更新,同时对其它管理服务器2发出更新通知,以使其它管理服务器2同时对存储的配置信息进行更新。通过管理服务器2共同负责相同的其它服务器3并同时更新,可以是服务器集群1整体的更新的可靠性提高。

在各管理服务器2负责存储其配置信息的所述其它服务器3互不相同的情况下,在所述服务器集群中有新增的第二服务器3'时,各所述管理服务器2中的第一管理服务器判断所述第二服务器3'要使用的配置信息是否与自己存储的配置信息相匹配,在相匹配的情况下,将自己存储的配置信息发送到所述第二服务器3',以使所述第二服务器进行配置;在不匹配的情况下,不对第二服务器3'发送自己存储的配置信息。

在各管理服务器2负责存储其配置信息的所述其它服务器3相同的情况下,在所述服务器集群中有新增的第二服务器3'时,各管理服务器2中的一个将自己存储的配置信息发送到所述第二服务器3',以使所述第二服务器3'进行配置。

在以往的管理服务器中,在成功添加服务器后,需要由管理员手动添加角色,一次一个服务,或应用服务器模板(可以为多个角色定义角色配置)。但是,这样的过程需要花费很多时间,并且容易出错。

而通过本发明的上述管理服务器、服务器集群及其管理方法,可以自动记录服务器集群中的各个服务器节点的最新配置信息,并且能够将记载的原节点的系统配置和/或集群角色配置信息发送到新增节点,可以方便快速地重新配置新节点,从而能够使集群快速回复原有的计算性能。

(第2实施方式)

在第1实施方式中,通过管理服务器2记录各个服务器节点系统配置或集群角色配置信息的修改并对新增服务器节点进行角色设定。但是在第2实施方式中,管理服务器2'通过在将一台以上的其它服务器4设置为配置记录功能的服务器节点,替代管理服务器2的上述角色设定功能。以下,以与第1实施方式的区别为中心,说明本发明的第2实施方式。

图5是表示本发明的第2实施方式的服务器集群1'的结构图。

如图5所示,第2实施方式的管理服务器2'将服务器集群1'中的一台以上的其它服务器3设置为配置记录功能的服务器4',替代管理服务器2中处理单元23的角色管理单元233来监测服务器集群中其它服务器节点的系统配置或集群角色配置信息,在有服务器节点修改系统配置或集群角色配置信息的情况下,存储对系统配置或集群角色配置信息的修改。

图6是表示本发明的第2实施方式的管理服务器2'的结构图。

一般来说,对角色的配置设置以角色组的形式进行组织。角色组包含针对特定组的一组配置属性,以及与该角色组相关联的角色列表。角色组提供两种类型的属性:影响服务本身配置的属性以及影响监控服务的属性。

因此,进一步还可以将这些配置记录功能的服务器4'构成为角色管理组4。管理服务器2'可以通过修改现有的默认角色组的设置,或者也可以创建新的角色组来构成具有上述的角色管理单元233的功能的角色管理组4。该角色管理组4具有影响监控服务的属性,因此能够监测服务器集群中其它服务器节点的系统配置或集群角色配置信息,实时地发现并存储系统配置或集群角色配置信息的变动。

如图5所示,在设定了角色管理组4的情况下,在管理服务器2'中的处理单元23中可以去除角色管理单元233。

图7是表示本发明的第2实施方式的管理服务器的管理方法的流程图。

在步骤31中,管理服务器的处理单元将一台以上的其它服务器节点设置为配置记录功能的服务器节点。

在步骤32中,配置记录功能的服务器节点监测服务器集群中其它服务器节点的系统配置或集群角色配置信息,在有服务器节点修改系统配置或集群角色配置信息的情况下,存储对系统配置或集群角色配置信息的修改。

在步骤33中,配置记录功能的服务器节点在监测过程中发现所述集群中原有服务器节点丢失,新增加服务器节点替代原有服务器节点的情况下,将该情况通知管理服务器的处理单元。

在步骤34中,管理服务器的处理单元判断是否需要对新增加服务器节点应用原有服务器节点的配置。

在步骤35中,在管理服务器的处理单元判断为需要对新增加服务器节点应用原有服务器节点的配置的情况下,通过通信单元,指示配置记录功能的服务器节点通过网络自动将存储的原有服务器节点的系统配置或集群角色配置信息发送到新增服务器节点。

在步骤36中,在管理服务器的处理单元判断为不需要应用原有服务器3的配置的情况下,对新增服务器节点分配新的角色配置。

在现有技术中没有专门负责记录角色的节点,因此只能通过管理服务器来监控和记录记录服务器节点的角色变更,但是由于管理服务器需要管理众多的节点,因此不能及时对服务器节点的角色变更进行监控和记录。

本发明的上述管理服务器2'通过创建具有监控记录角色的服务器节点4',并将其作为角色管理组4进行统一管理,因此能够及时对所有服务器节点的角色进行监控和记录,保持集群中所有节点角色的信息,同时减少管理服务器的负担。

而且,在第2实施方式中,在集群中某个原有服务器节点3丢失,新增加服务器节点3'替代原有服务器节点3、管理服务器2'判断为需要应用原有服务器节点3的配置的情况下,处理单元23指示上述角色管理组4的服务器节点4'通过网络自动将存储的原有服务器节点3的系统配置或集群角色配置信息发送到新增服务器节点3'。

第2实施方式的上述管理服务器2'通过使配置记录角色的服务器节点4'以及角色管理组4自动将记录的原有服务器节点3的系统配置或集群角色配置信息发送到新增服务器节点3',能够快速对新增服务器节点进行配置。

以上已经描述了本公开的各实施方式。本领域的技术人员应该知道,本公开的各个实施方式中的各个单元(功能模块、芯片等)的连接关系和构成关系不对本公开的保护范围构成限制,它们可以合并为单独一个单元来实现,或者其中的特定单元也可以被分割为功能更小的多个单元来实现。

附图中的各个框图显示了根据本公开实施例的管理服务器可能实现的结构、功能和操作。在这点上,框图中的每个方框可以代表一个模块,所述模块包含一个或多个用于实现规定的逻辑功能的可执行指令。在作为替换的实现方式中,方框中所标注的功能也可以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图中的每个方框可以用执行规定功能或动作的专用的基于硬件的ASIC来实现,或者可以用专用硬件与计算机指令的组合来实现。

上述实施方式中的说明是示例性的,并非穷尽性的,并且也不限于所披露的各个实施方式。在不偏离所说明的各个实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各个实施方式的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其它普通技术人员能理解本文披露的各个实施例。

工业适用性

本发明通过创建具有配置记录角色的节点,能够对所有节点的角色进行记录,保持集群中所有节点角色的信息,随时更新系统配置或集群角色的变化,方便快速地重新配置新节点,从而达到让集群快速回复原有的计算性能。因此可以应用于大数据管理系统中。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1