一种集群系统管理优化方法及平台与流程

文档序号:12363166阅读:298来源:国知局
一种集群系统管理优化方法及平台与流程

本发明涉及集群管理技术领域,特别涉及一种集群系统管理优化方法及平台。



背景技术:

当前,随着计算机技术和网络技术的快速发展,集群系统以其强大的运算能力和健壮的容错机制逐渐成为了计算机行业的焦点。

然而,在传统集群系统中,同一个集群管理器下的所有主机无法作为一个DRS域(DRS,即Distributed Resource Scheduler,分布式资源调度)或HA域(HA,即High Available,高可用)来使用,每次为该集群管理器下的所有主机配备高可用时,均需要进一步指定DRS域或HA域,还需要从不同的共享存储区域中对相应的资源进行迁移操作,这样需要消耗大量的时间,从而影响了集群系统的DRS性能和HA性能。

综上所述可以看出,如何进一步提升集群系统的DRS性能和HA性能是目前亟待解决的问题。



技术实现要素:

有鉴于此,本发明的目的在于提供一种集群系统管理优化方法及平台,进一步提升了集群系统的DRS性能和HA性能。其具体方案如下:

一种集群系统管理优化方法,包括:

在集群系统中创建N个共享存储区域,N为正整数,并分别为每个共享存储区域设置相应的对该共享存储区域进行集群管理的sanlock分布式锁管理器;其中,所述集群系统中包括N个子集群,所述N个子集群与所述N个共享存储区域一一对应;

将从每个共享存储区域上划分出的一块存储空间确定为该共享存储区域上sanlock分布式锁管理器的ids空间;

将每个子集群中的所有主机挂载至与该子集群对应的共享存储区域中,并且当需要将任一主机挂载至任一共享存储区域,则控制该主机在该共享存储区域上执行add_lockspace操作,以将该主机的主机ID以及该主机的sanlock标识符保存至该共享存储区域上的ids空间。

优选的,所述集群系统管理优化方法,还包括:

在任一ids空间中,将该ids空间中所有主机的主机ID保存至预设的主机ID列表,并将该ids空间中所有主机的sanlock标识符保存至预设的sanlock标识符列表。

优选的,所述集群系统管理优化方法,还包括:

在任一ids空间中,根据相应主机ID列表中每个主机ID所属的时间戳,来判断相应子集群中所有主机的在线状态;其中,当任一主机ID所属的时间戳超时,则判定与该主机ID对应的主机处于离线状态,当任一主机ID所属的时间戳未超时,则判定与该主机ID对应的主机处于在线状态。

优选的,所述集群系统管理优化方法,还包括:

当任一ids空间中的任一主机ID所属的时间戳超时,则发送轻量级的杀死进程命令到与该主机ID对应的主机,以轻度杀掉该主机在相应共享存储区域上所占用的共享资源。

优选的,所述集群系统管理优化方法,还包括:

当任一共享存储区域上的任一主机与该共享存储区域断开连接后,则依次向该主机发送轻量级的杀死进程命令、强制性的杀死进程命令以及主机重启命令,以重度杀掉该主机在该共享存储区域上所占用的共享资源。

优选的,在将主机挂载至共享存储区域中时,允许将同一台主机同时挂载至不同的共享存储区域上。

优选的,所述将同一台主机同时挂载至不同的共享存储区域上的过程,包括:

将同一台主机上不同的虚拟操作系统挂载至不同的共享存储区域。

本发明还公开了一种集群系统管理优化平台,包括:

共享存储区域建立模块,用于在集群系统中创建N个共享存储区域,N为正整数,并分别为每个共享存储区域设置相应的对该共享存储区域进行集群管理的sanlock分布式锁管理器;其中,所述集群系统中包括N个子集群,所述N个子集群与所述N个共享存储区域一一对应;

空间确定模块,用于将从每个共享存储区域上划分出的一块存储空间确定为该共享存储区域上sanlock分布式锁管理器的ids空间;

主机挂载模块,用于将每个子集群中的所有主机挂载至与该子集群对应的共享存储区域中,并且当需要将任一主机挂载至任一共享存储区域,则控制该主机在该共享存储区域上执行add_lockspace操作,以将该主机的主机ID以及该主机的sanlock标识符保存至该共享存储区域上的ids空间。

优选的,所述主机挂载模块在将主机挂载至共享存储区域中时,允许将同一台主机同时挂载至不同的共享存储区域上。

本发明中,集群系统管理优化方法,包括:在集群系统中创建N个共享存储区域,并分别为每个共享存储区域设置相应的对该共享存储区域进行集群管理的sanlock分布式锁管理器;其中,集群系统中包括N个子集群,上述N个子集群与上述N个共享存储区域一一对应;将从每个共享存储区域上划分出的一块存储空间确定为该共享存储区域上sanlock分布式锁管理器的ids空间;将每个子集群中的所有主机挂载至与该子集群对应的共享存储区域中,并且当需要将任一主机挂载至任一共享存储区域,则控制该主机在该共享存储区域上执行add_lockspace操作,以将该主机的主机ID以及该主机的sanlock标识符保存至该共享存储区域上的ids空间。

可见,本发明中,集群系统中的每个共享存储区域上均由一个与其对应的sanlock分布式锁管理器对其进行集群管理,并且,与任一共享存储区域对应的子集群下的所有主机均挂载至该共享存储区域中,任一主机挂载至某一共享存储区域时,该主机需要在该共享存储区域上执行add_lockspace操作,以上技术方案使得与同一个sanlock分布式锁管理器对应的所有主机均挂载到同一个共享存储区域中,从而使得同一个sanlock分布式锁管理器下的所有主机可作为一个DRS域或HA域,无需在为同一个sanlock分布式锁管理器下的所有主机配备高可用时进一步指定DRS域或HA域,并且由于是挂载到同一个共享存储区域中,所以也无需在为同一个sanlock分布式锁管理器下的所有主机配备高可用时进行存储资源的迁移,从而进一步提升了集群系统的DRS性能和HA性能。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1为本发明实施例公开的一种集群系统管理优化方法流程图;

图2为本发明实施例公开的一种集群系统管理优化平台结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明实施例公开了一种集群系统管理优化方法,参见图1所示,该方法包括:

步骤S11:在集群系统中创建N个共享存储区域,N为正整数,并分别为每个共享存储区域设置相应的对该共享存储区域进行集群管理的sanlock分布式锁管理器;其中,集群系统中包括N个子集群,上述N个子集群与上述N个共享存储区域一一对应。

需要说明的是,上述sanlock分布式锁管理器是一个基于SAN(即Storage Area Network)的分布式锁管理器。

另外需要说明的是,上述每个子集群中均包括至少两台主机,并且,同一台主机可以只属于同一个子集群,也可以分别属于不同的子集群。

步骤S12:将从每个共享存储区域上划分出的一块存储空间确定为该共享存储区域上sanlock分布式锁管理器的ids空间。

也即,本实施例中的每个共享存储区域上均设有一块存储空间用作相应sanlock分布式锁管理器的ids空间。其中,上述所谓的ids空间也即是指sanlock分布式锁管理器的ids leases空间。

步骤S13:将每个子集群中的所有主机挂载至与该子集群对应的共享存储区域中,并且当需要将任一主机挂载至任一共享存储区域,则控制该主机在该共享存储区域上执行add_lockspace操作,以将该主机的主机ID以及该主机的sanlock标识符保存至该共享存储区域上的ids空间。

可以理解的是,在同一台主机分别属于不同的子集群的情况下,同一台主机便可以挂载至相应的不同共享存储区域上。可见,本实施例中,在将主机挂载至共享存储区域中时,可允许将同一台主机同时挂载至不同的共享存储区域上。这意味着,本实施例中的同一台主机可以归属于多个DRS域或多个HA域,当与这种主机对应的某个共享存储区域出现问题后,这种主机上的其他共享存储区域的业务不会因此而受到影响。

本实施例中,将同一台主机同时挂载至不同的共享存储区域上的过程具体可以为:将同一台主机上不同的虚拟操作系统挂载至不同的共享存储区域。例如,假设一台主机上安装了两套不同的虚拟操作系统,则这台主机可以挂载到两个不同的共享存储区域上,其余的以此类推。

本发明实施例中,集群系统管理优化方法,包括:在集群系统中创建N个共享存储区域,并分别为每个共享存储区域设置相应的对该共享存储区域进行集群管理的sanlock分布式锁管理器;其中,集群系统中包括N个子集群,上述N个子集群与上述N个共享存储区域一一对应;将从每个共享存储区域上划分出的一块存储空间确定为该共享存储区域上sanlock分布式锁管理器的ids空间;将每个子集群中的所有主机挂载至与该子集群对应的共享存储区域中,并且当需要将任一主机挂载至任一共享存储区域,则控制该主机在该共享存储区域上执行add_lockspace操作,以将该主机的主机ID以及该主机的sanlock标识符保存至该共享存储区域上的ids空间。

可见,本发明实施例中,集群系统中的每个共享存储区域上均由一个与其对应的sanlock分布式锁管理器对其进行集群管理,并且,与任一共享存储区域对应的子集群下的所有主机均挂载至该共享存储区域中,任一主机挂载至某一共享存储区域时,该主机需要在该共享存储区域上执行add_lockspace操作,以上技术方案使得与同一个sanlock分布式锁管理器对应的所有主机均挂载到同一个共享存储区域中,从而使得同一个sanlock分布式锁管理器下的所有主机可作为一个DRS域或HA域,无需在为同一个sanlock分布式锁管理器下的所有主机配备高可用时进一步指定DRS域或HA域,并且由于是挂载到同一个共享存储区域中,所以也无需在为同一个sanlock分布式锁管理器下的所有主机配备高可用时进行存储资源的迁移,从而进一步提升了集群系统的DRS性能和HA性能。

本发明实施例公开了一种具体的集群系统管理优化方法,相对于上一实施例,本实施例对技术方案作了进一步的说明和优化。具体的:

为了便于对主机ID和sanlock标识符进行统一管理,本实施例中,在任一个共享存储区域上的所有主机均执行完add_lockspace操作后,可以将相应ids空间中所有主机的主机ID保存至预设的主机ID列表,并将该ids空间中所有主机的sanlock标识符保存至预设的sanlock标识符列表。或者是在任一个共享存储区域上的任一台主机执行完add_lockspace操作后,将该台主机相应的主机ID保存至上述预设的主机ID列表,并将相应的sanlock标识符保存至上述预设的sanlock标识符列表。

另外,在任一ids空间中,可以根据相应主机ID列表中每个主机ID所属的时间戳,来判断相应子集群中所有主机的在线状态;具体的,当任一主机ID所属的时间戳超时,则判定与该主机ID对应的主机处于离线状态,当任一主机ID所属的时间戳未超时,则判定与该主机ID对应的主机处于在线状态。

为了提升集群系统中的资源保护能力,本实施例中的集群系统管理优化方法,还可以包括:

当任一ids空间中的任一主机ID所属的时间戳超时,则发送轻量级的杀死进程命令到与该主机ID对应的主机,以轻度杀掉该主机在相应共享存储区域上所占用的共享资源。

为了进一步提升集群系统中的资源保护能力,本实施例中的集群系统管理优化方法,还可以包括:

当任一共享存储区域上的任一主机与该共享存储区域断开连接后,则依次向该主机发送轻量级的杀死进程命令、强制性的杀死进程命令以及主机重启命令,以重度杀掉该主机在该共享存储区域上所占用的共享资源。

相应的,本发明实施例还公开了一种集群系统管理优化平台,参见图2所示,该集群系统管理优化平台包括:

共享存储区域建立模块21,用于在集群系统中创建N个共享存储区域,N为正整数,并分别为每个共享存储区域设置相应的对该共享存储区域进行集群管理的sanlock分布式锁管理器;其中,集群系统中包括N个子集群,N个子集群与N个共享存储区域一一对应;

空间确定模块22,用于将从每个共享存储区域上划分出的一块存储空间确定为该共享存储区域上sanlock分布式锁管理器的ids空间;

主机挂载模块23,用于将每个子集群中的所有主机挂载至与该子集群对应的共享存储区域中,并且当需要将任一主机挂载至任一共享存储区域,则控制该主机在该共享存储区域上执行add_lockspace操作,以将该主机的主机ID以及该主机的sanlock标识符保存至该共享存储区域上的ids空间。

其中,上述主机挂载模块在将主机挂载至共享存储区域中时,允许将同一台主机同时挂载至不同的共享存储区域上。

关于上述各个模块更加详尽的工作过程可参考前述实施例的相关内容,在此不再进行一一赘述。

可见,本发明实施例中,集群系统中的每个共享存储区域上均由一个与其对应的sanlock分布式锁管理器对其进行集群管理,并且,与任一共享存储区域对应的子集群下的所有主机均挂载至该共享存储区域中,任一主机挂载至某一共享存储区域时,该主机需要在该共享存储区域上执行add_lockspace操作,以上技术方案使得与同一个sanlock分布式锁管理器对应的所有主机均挂载到同一个共享存储区域中,从而使得同一个sanlock分布式锁管理器下的所有主机可作为一个DRS域或HA域,无需在为同一个sanlock分布式锁管理器下的所有主机配备高可用时进一步指定DRS域或HA域,并且由于是挂载到同一个共享存储区域中,所以也无需在为同一个sanlock分布式锁管理器下的所有主机配备高可用时进行存储资源的迁移,从而进一步提升了集群系统的DRS性能和HA性能。

最后,还需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上对本发明所提供的一种集群系统管理优化方法及平台进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1