一种加固服务器高可用集群管理系统的制作方法

文档序号:37457882发布日期:2024-03-28 18:41阅读:10来源:国知局
一种加固服务器高可用集群管理系统的制作方法

本发明涉及加固服务器,具体涉及一种加固服务器高可用集群管理系统。


背景技术:

1、随着装备信息化的不断发展,服务器的使用种类和数量变得越来越庞大,如何提高服务器的使用效率、降低软硬件故障对业务连续性的影响变得日益突出,在实际的应用中,各系统服务器担负着大量重要信息的处理、存储和传递的任务,一旦服务器发生故障,将会带来无可估量的损失,因此,保证关键服务器连续、稳定的运行已成为服务器应用中的迫切需要,为避免因故障导致的停机和服务的中断,需要提高业务系统的稳定性和可用性,提高系统对硬件故障的容错能力。


技术实现思路

1、有鉴于此,本发明提供了一种加固服务器高可用集群管理系统,能够保证业务系统的稳定性和可用性,提高系统对硬件故障的容错能力。

2、为实现上述目的,本发明技术方案如下:

3、一种加固服务器高可用集群管理系统,包括物理层、操作系统层、集群业务层和应用系统层;其中,物理层作为应用系统和高可用集群运行的基础设施;操作系统层实现对物理硬件的驱动支持,提供应用系统软件运行环境支持;集群业务层包括集群逻辑控制系统和集群管理子系统,集群逻辑控制系统实现对应用运行所需要的应用程序、服务程序、共享存储资源、网络、数据库和中间件进行监控,并在发现异常时通过决策,将失效业务动态迁移到集群中备机上进行运行,消除单点故障,保证核心业务的持续性和高可用性;集群管理子系统实现对高可用集群的配置管理、状态监控、日志查看、异常报警和集群服务器管理;应用系统层进行具体应用。

4、其中,集群逻辑控制系统包括集群资源管理模块和心跳通讯模块;集群管理子系统包括集群管理控制台模块和图形管理界面模块;

5、集群资源管理模块实现对集群配置信息的管理、集群各种状态项的管理、资源管理和监控;心跳通讯模块用于心跳监测、接收上层消息并分发、日志系统,该模块实现集群内多服务器单元之间的通讯;

6、集群管理控制台模块介于图形管理界面和集群资源管理模块之间,用于接收用户界面或者命令行终端发送的命令,并转发到对应的服务器集群中;图形管理界面模块作为集群管理服务系统的最上层,进行集群的配置,传送用户的指令到集群服务管理控制台模块,实时显示集群的状态和异常。

7、其中,集群资源管理模块包括集群调度管理模块以及本地资源管理模块;集群调度管理模块以及本地资源管理模块均包括多个子模块,子模块之间通过调用的方法实现对集群资源的管理;

8、其中,在每个节点上,集群调度管理模块都维护一份包含所有集群选项、节点、资源及其关系和当前状态的集群信息库,如果选择集群中的某个节点的集群资源管理模块为指定协调程序,则它具有主集群信息库;集群中的所有其他集群信息库是主集群信息库的复本;对集群信息库的常规读写操作通过主集群信息库进行排序;本地资源管理模块代表集群资源管理模块调用的本地资源代理,执行创建或启动或停止或监视操作并将结果报告给集群资源管理模块。

9、其中,集群调度管理模块中包括脑裂处理模块,脑裂是指集群中某个服务器因为某种原因造成节点的心跳通讯异常,不能和集群中其他节点正常通信,成为孤立节点。

10、其中,心跳采用udp网络包的形式。

11、其中,集群管理控制台模块包括命令分级转发模块、多集群管理模块和系统日志服务端模块;命令分级转发模块作为枢纽,将用户图形界面下发的命令按照策略转发给特定集群的集群资源管理模块,并将集群资源管理模块返回的消息接收转发给图形界面模块以便用户及时获取集群状态;对于命令请求的参数处理置于控制模块中,降低与之交互的图形界面管理模块和集群资源资源管理模块的耦合度;管理控制台模块对参数进行有效性的判断,如果经过判断参数有效,则将用户界面传回的参数进行有效的封装,传递给集群资源管理模块,如果判断参数无效,对出错参数进行提示,请求用户重新输入,对于没有错误的参数,在请求重新建立过程中保持默认填充。

12、其中,图形管理界面功能包括集群参数配置、集群状态监控、集群管理、组管理、资源管理、日志管理、服务器管理和配置管理;具体地,集群参数配置是通过图形化的方式实现对集群的配置;集群状态监控是用来显示集群中各个元素的状态;集群管理是负责对多个集群进行管理;组管理是负责启动、停止和迁移某个组;资源管理是负责启动停止组中的某个资源或者监控资源;日志管理是负责进行日志的显示和日志检索;服务器管理是负责具体某个节点的管理;配置管理是负责将保存用户的集群配置、通过配置文件生成集群配置、上传配置文件和下载配置文件。

13、有益效果:

14、1、本发明集群管理系统的集群业务层基于物理设备和操作系统的基础平台,保障应用系统的持续运行,为服务器的作业系统提供高可用集群管理。通过集群逻辑控制系统和集群管理子系统实现,集群逻辑控制系统实现对应用运行所需要的应用程序、服务程序、共享存储资源、网络(包括ip地址)以及数据库、中间件等进行监控,并在发现异常时通过决策,将失效业务动态迁移到集群中备机上进行运行,消除单点故障,保证核心业务的持续性和高可用性;集群管理子系统实现对高可用集群的配置管理、状态监控、日志查看、异常报警和集群服务器管理等功能。

15、2、本发明优选实施方式中,集群资源管理模块实现对集群配置信息的管理、集群各种状态项的管理、资源管理和监控等功能。具体地,集群资源管理模块包括集群调度管理模块以及本地资源管理模块(lrm);集群调度管理模块以及本地资源管理模块均包括多个子模块,子模块之间通过调用的方法实现对集群资源的管理。

16、3、本发明优选实施方式中,在资源分配中执行的每个操作都要经过集群调度管理模块。如果其他组件(或更高层中的组件)需要通讯,则它们也通过集群调度管理模块进行。在每个节点上,集群调度管理模块都维护了一份集群信息库(cib),包含所有集群选项、节点、资源及其关系和当前状态。如果选择集群中的某个节点的集群资源管理模块为指定协调程序(dc),则它具有主cib。集群中的所有其他cib是主cib的复本。对cib的常规读写操作通过主cib进行排序。dc是集群中唯一可以决定需要在整个集群执行动作和状态更改的实体。集群调度管理模块是集群动作和状态变化更新的管理核心,它维护着集群状态表,控制着集群的状态变更。集群调度管理模块以集群信息库为依托,集群的调度直接对集群信息库进行更新。

17、4、本发明优选实施方式中,集群管理控制台模块介于图形管理界面和集群资源管理模块之间,用于接收用户界面或者命令行终端发送的命令,并转发到对应的服务器集群中。具体地,集群管理控制台模块一方面用于接收用户图形界面或者命令行终端发送的命令请求,解析命令消息并分级转发给相应节点的集群资源管理模块;一方面作为整个高可用集群系统的日志接收模块管理日志信息。



技术特征:

1.一种加固服务器高可用集群管理系统,其特征在于,包括物理层、操作系统层、集群业务层和应用系统层;其中,物理层作为应用系统和高可用集群运行的基础设施;操作系统层实现对物理硬件的驱动支持,提供应用系统软件运行环境支持;集群业务层包括集群逻辑控制系统和集群管理子系统,集群逻辑控制系统实现对应用运行所需要的应用程序、服务程序、共享存储资源、网络、数据库和中间件进行监控,并在发现异常时通过决策,将失效业务动态迁移到集群中备机上进行运行,消除单点故障,保证核心业务的持续性和高可用性;集群管理子系统实现对高可用集群的配置管理、状态监控、日志查看、异常报警和集群服务器管理;应用系统层进行具体应用。

2.如权利要求书1所述的系统,其特征在于,集群逻辑控制系统包括集群资源管理模块和心跳通讯模块;集群管理子系统包括集群管理控制台模块和图形管理界面模块;

3.如权利要求书2所述的系统,其特征在于,集群资源管理模块包括集群调度管理模块以及本地资源管理模块;集群调度管理模块以及本地资源管理模块均包括多个子模块,子模块之间通过调用的方法实现对集群资源的管理;

4.如权利要求书3所述的系统,其特征在于,集群调度管理模块中包括脑裂处理模块,脑裂是指集群中某个服务器因为某种原因造成节点的心跳通讯异常,不能和集群中其他节点正常通信,成为孤立节点。

5.如权利要求书2-4任意一项所述的系统,其特征在于,心跳采用udp网络包的形式。

6.如权利要求书2-4任意一项所述的系统,其特征在于,集群管理控制台模块包括命令分级转发模块、多集群管理模块和系统日志服务端模块;命令分级转发模块作为枢纽,将用户图形界面下发的命令按照策略转发给特定集群的集群资源管理模块,并将集群资源管理模块返回的消息接收转发给图形界面模块以便用户及时获取集群状态;对于命令请求的参数处理置于控制模块中,降低与之交互的图形界面管理模块和集群资源资源管理模块的耦合度;管理控制台模块对参数进行有效性的判断,如果经过判断参数有效,则将用户界面传回的参数进行有效的封装,传递给集群资源管理模块,如果判断参数无效,对出错参数进行提示,请求用户重新输入,对于没有错误的参数,在请求重新建立过程中保持默认填充。

7.如权利要求书2-4任意一项所述的系统,其特征在于,图形管理界面功能包括集群参数配置、集群状态监控、集群管理、组管理、资源管理、日志管理、服务器管理和配置管理;具体地,集群参数配置是通过图形化的方式实现对集群的配置;集群状态监控是用来显示集群中各个元素的状态;集群管理是负责对多个集群进行管理;组管理是负责启动、停止和迁移某个组;资源管理是负责启动停止组中的某个资源或者监控资源;日志管理是负责进行日志的显示和日志检索;服务器管理是负责具体某个节点的管理;配置管理是负责将保存用户的集群配置、通过配置文件生成集群配置、上传配置文件和下载配置文件。


技术总结
本发明涉及加固服务器技术领域,本发明提供了一种加固服务器高可用集群管理系统,能够保证业务系统的稳定性和可用性,提高系统对硬件故障的容错能力。本发明集群管理系统的集群业务层基于物理设备和操作系统的基础平台,保障应用系统的持续运行,为服务器的作业系统提供高可用集群管理。通过集群逻辑控制系统和集群管理子系统实现,集群逻辑控制系统实现对应用运行所需要程序和其他应用进行监控,并在发现异常时通过决策,将失效业务动态迁移到集群中备机上进行运行,消除单点故障,保证核心业务的持续性和高可用性;集群管理子系统实现对高可用集群的配置管理、状态监控、日志查看、异常报警和集群服务器管理等功能。

技术研发人员:王晓哲,高夫太,刘兆军,张帅,曲朋
受保护的技术使用者:河北汉光重工有限责任公司
技术研发日:
技术公布日:2024/3/27
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1