民主自治的集群管理方法和系统的制作方法

文档序号:9202700阅读:461来源:国知局
民主自治的集群管理方法和系统的制作方法
【技术领域】
[0001] 本发明涉及一种集群管理方法,具体涉及基于集群子系统间民主自治策略的集群 管理系统,W提高集群系统的可用性、可管理性及可扩展性。
【背景技术】
[0002] 随着信息技术的发展,计算机技术的应用已经到达了一种前所未有的广泛程度, 系统和应用规模成倍增加。在该种情况下,可提供更高并发量访问、更稳定服务质量的系统 集群技术就应运而生,目前的集群技术多WMaster-Slave模式为基础,Master-Slave集群 管理方法在集群系统中定义一个Mater管理子系统(节点)和若干Slave服务提供子系统 (节点),Master节点可提供集群管理服务(部分集群系统也将其设计为可提供业务服务), Slave节点仅能提供业务服务,该种集群模式保证了集群管理的唯一性,同时集群内节点可 并行对外提供服务,但该种方案具有W下问题:
[0003]UMaster节点存在单点故障的风险。由于为了保障集群管理的唯一性,集群系统 中仅设计了一个Master(-些改进型Master-Slave集群系统设计了备用Master,但也不 能避免Master和备用Master都出现故障的情况),而管理功能只由Master提供,所W当 Master故障时,整个集群系统虽能正常对外提供业务服务,当丧失了管理功能,在Master 修复前都不可对集群进行管理;
[0004] 2、Master-Slave集群系统缺乏弹性伸缩的灵活性。Master-Slave集群在集群 启动时为每个节点定义了角色,Master仅管理预先定义好的Slave节点,当由于访问量激 增而需要临时增加节点W加快服务响应时、或访问量激降而需要临时减少节点W节约资源 时,Master-Slave集群管理模式都难W实现对临时节点的管理。
[0005] 经对现有技术进行检索,发现如下相关文献。
[0006] 申请号;CN201310058640. 3,名称;一种用于分布式服务的集群管理方法和系统。 该发明公开了一种用于分布式服务的集群管理方法和系统,每个服务器向Zookeeper服务 发送注册请求;Zookeeper服务根据注册请求对每个服务器进行注册,并根据先后顺序选 定其中的一个服务器作为Master;每个已注册的服务器判断是否被选定为Master,如果是 则被选定为Master的服务器作为集群管理者对所有的服务器进行管理,并等待其它没有 被选定为Master的服务器来注册,否则没有被选定为Master的服务器向选定为Master的 服务器进行注册。集群所有服务器启动后首先通过Zookeeper来选举Master,Worker主动 联系Master,从而实现Master对集群中所有服务器的管理。
[0007] 该发明设计了一种集群中Master服务器的管理办法,通过向指定的Zookeeper服 务发送注册请求、根据注册先后顺序来确定Master服务器。但该发明对Master的选择需 要第H方服务,不能通过民主自治选取产生,需依赖第H方服务,存在第H方服务出现故障 时的单点风险;且该发明只能存在一个大集群限制,容错性和可管理性较低。

【发明内容】

[000引针对现有技术中的缺陷,本发明主要解决的问题是,在保留现有Master-Slave集 群管理唯一性、并发提供服务访问的前提下,同时解决集群管理单点故障风险、加强集群系 统的弹性伸缩灵活性,使得集群系统具备更好的可管理性和更高的服务提供质量。
[0009] 根据本发明提供的一种民主自治的集群管理方法,包括如下步骤:
[0010] 步骤1 ;集群启动;
[0011] 步骤2;集群运行自治;
[001引步骤3;集群分裂自治;
[001引步骤4;集群融合自治;
[0014] 步骤5 ;集群动态伸缩自治;
[0015] 步骤6;集群管理员治理,其中,集群管理员用户集群管理的最高权限,各节点均 提供管理员入口,W执行主席节点检修升级、追加服务节点、调整全局策略参数操作。
[0016] 优选地,所述步骤1包括如下步骤:
[0017] 步骤101 ;集群初始化启动时,根据系统管理员的指定指令产生主席节点,其中, 所述指定指令在确定主席过程中拥有最高权限;
[001引步骤102 ;除主席节点外,其余节点自动将本节点角色Role置为別ave节点;
[0019] 步骤103;主席节点管理集群的全局配置策略,并将全局策略初始化派送给各 Slave节点,其中,所述全局策略初始化包括;全局节点数量、集群标识、各节点名称、各节 点角色、各节点监听地址、各节点服务地址、健康检查策略、不信任策略、信息同步策略、信 息同步时间间隔、信息同步时间、民主选举策略、各节点当前状态、集群伸缩策略。
[0020] 优选地,节点状态包括:
[0021] 启动状态BOOTING;当启动失败时,转入脱离状态;当启动成功时,转入控制状态;
[0022] 脱离状态DISC0NN;当收到信息同步指令时,转入控制状态;
[0023] 控制状态CONN;当被认为不健康时,转入脱离状态;当收到隔离指令时,转入隔离 状态;当收到待机指令时,转入待机状态;当收到关闭指令时,转入关闭进行状态;
[0024] 关闭进行状态S皿TD0WING;当关闭结束后,转入关闭结束状态;
[00巧]隔离状态ISOLATED;当收到集合指令时,转入控制状态;
[002引待机状态IDLE;当收到隔离指令时,转入隔离状态;当收到恢复指令时,转入控制 状态;当收到关闭指令时,转入关闭进行状态;
[0027] 未定义状态UNASSIGNED;当收到启动指令时,转入启动状态;当收到信息同步指 令时,转入控制状态。
[0028] 优选地,所述步骤2包括如下步骤:
[0029] 步骤201 ;各节点按照信息同步策略及信息同步时间间隔,将自身状态信息块同 步给集群中其他节点,其中,所述信息同步策略包括增量同步和海量同步;
[0030] 步骤202 ;主席节点将全局信息按照信息同步策略及信息同步时间间隔,将集群 全局信息同步给所有Slave节点,信息同步策略包括增量同步和海量同步;
[003。步骤203 ;所有节点接收到其他节点的同步信息后,在BBS中更新相应节点信息存 储内存块中;
[0032]步骤204;Slave节点在接收到主席节点全局同步信息时,更新BBS中主席节点 信息存储内存块及全局配置变化的参数,比较其余节点更新时间与全局信息包中子项的时 间,将BBS中Slave节点信息内存块的信息更新为最新状态值;
[0033] 步骤205;所有节点按照全局健康检查策略检查各自BBS块中其他节点状态,并维 护管理节点状态,其中,健康检查策略由检查周期化、状态裁定周期n*化决定;
[0034] 步骤206;主席节点执行步骤205操作,当裁定Slave节点状态为脱离状态 DISC0NN、或者未定义状态UNASSIGNED时,对Slave执行Boot指令;
[00巧]步骤207 ;Slave节点执行步骤205,根据不信任策略,当裁定主席节点状态为脱离 状态DISOWN时,执行步骤208选举操作;不信任策略为健康检查策略与管理员操作的综合
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1