一种强实时计算机集群动态调度系统的制作方法

文档序号:9527701阅读:722来源:国知局
一种强实时计算机集群动态调度系统的制作方法
【技术领域】
[0001]本发明设计航天发射应用领域涉及到的大中型强实时、高可靠性的数据处理系统,具体是一种强实时计算机集群动态调度系统。
【背景技术】
[0002]在实时性、可靠性和安全性要求高的信息处理应用系统,至少需要符合三个要素保障:一是整个系统的设计均能体现出较高的冗余能力,在信息处理系统中的任何一个节点均需保证无任何单点故障,若一个信息处理系统由于设计的缺陷产生单点故障,则对整个系统都是致命性地并随时都有可能由于单点故障的缺陷影响到了整个系统的正常运行;二是提升整个系统的运行效率和应急水平,对一个大中型信息系统运行是否高效及应急水平是否体现出“及时、精准”的目标,关键在于系统建立什么样的模型和采用什么样的技术路线;三是提高整个信息处理应用系统的自动化和管理水平,采用由分散式监控手段过渡到集中式监控,立体式地收集系统运行状态信息、告警信息。采用自动和人工辅助相结合的方式,极大提高信息处理系统的自动化水平。针对上述应用需求,设计了一种强实时计算机集群动态调度策略,分别从软硬件体系结构模型,动态软双工的设计,作业动态分配策略设计及在双工切换过程中“轻量级”的资源开销保证了系统的强实时性、安全性及高可靠性等特点。

【发明内容】

[0003]针对现有技术的不足,提出了一种强实时性、高可靠性、安全性要求比较高的强实时计算机集群动态调度系统。本发明的技术方案如下:一种强实时计算机集群动态调度系统,其包括:硬件体系结构模型及软件体系结构模型;其中硬件体系结构模型包括三层硬件体系模型及三层网络模型,所述软件体系结构模型包括调度管理操控终端层,调度管理层及调度代理层;
[0004]所述硬件体系结构模型:用于构建动态调度的硬件支撑平台,包括三层硬件体系模型和三层网络模型,三层硬件体系模型的第一层为调度管理控制终端层:用于对计算机管理服务器层进行终端控制;第二层为调度管理服务器层:用于对计算机集群层发起的服务进行管理调度;第三层为计算机集群层,包括若干台服务器;
[0005]所述三层网络模型包括调度管理终端接入层、调度管理汇聚层及调度代理核心层,其中调度代理核心层与三层硬件体系模型的计算机集群层通过交换机相连接,所述调度管理服务器层通过交换机与调度管理汇聚层相连接,所述调度管理终端接入层通过交换机与调度管理控制终端层相连接;
[0006]所述软件体系结构模型包括三层软件模型:调度管理操控终端层,调度管理层及调度代理层;其中调度管理操控终端:主要负责对服务的申请,服务的启动,软硬件资源的系统监视,软双工的动态切换,服务器集群中运行作业即进程的操控,业务流程的控制,信息系统的应急措施及服务的释放;调度管理层:主要负责对服务器集群的在线工作状态检测,对服务器集群之间动态软双工的分配,对运行在服务器集群内的作业即进程分配策略,调度管理服务器之间的数据及状态的同步,操作命令、服务器集群软硬件资源统计及回证的转发;调度代理层主要负责对服务器集群中运行的作业即进程之间命令的执行及回证的交互,收集集群内部系统软硬件资源运行状态,收集作业运行状态,网络注册及报文的转发,作业之间的信息交互。
[0007]进一步的,所述调度管理控制终端层由两台调度管理控制终端组成,且两台调度管理控制终端互为热备;所述调度管理服务器层由两台基于对服务器集群进行管理的调度管理服务器组成,且两台服务器互为热备。
[0008]进一步的,所述调度代理核心层与计算机集群层通过交换机相连接的台数为两台,且互为热备份;所述调度管理服务器层通过交换机与调度管理汇聚层相连接的交换机台数为两台且互为热备份,所述调度管理终端接入层通过交换机与调度管理控制终端层相连接的交换机台数为两台且互为热备份。
[0009]进一步的,所述计算机集群层的若干台服务器中的每台服务器所在的独立网卡接入一台交换机,单独成网构成小型局域网。
[0010]进一步的,所述软件体系结构模型的调度管理操控终端层与调度管理层之间通过TCP协议点对点进行通信,调度管理层和调度代理之间通过UDP协议任意源组播进行通信。
[0011]进一步的,所述计算机集群层的服务器集群中,对于相同的业务作业即进程均要求采用动态双软工法,即相同的业务作业即进程存在于主机和副机两台服务器中,任何一台服务器的软硬件出现故障时,系统均会执行自动和人工两种结合的方式进行双工切换,。
[0012]进一步的,所述动态双软工法具体为:
[0013]假定某一个信息处理应用系统服务器集群有m台在线服务器,在集群中运行有η个作业,分配的原则是要求每一个作业必须在两台服务器运行,如果集群服务器个数为奇数,那么第m台服务器以单机状态存在,作为系统的冗余空闲服务器,如果n〈 = m/2,至少要求每个作业能独立在两个服务器中运行,如果n>m/2,根据作业的安全等级,把安全级别低为D级的作业进行组合到一起运行在互为热备份的服务器中,把安全级别为A级、B级、C级且对软硬件资源要求高的作业单独运行在互为热备份的服务器中。
[0014]本发明的优点及有益效果如下:
[0015]硬件结构模型设计为三层服务器模型,网络结构模型也是设计为三层模型。每一层操控终端、调度管理服务器、交换机都是热备份,网卡接入交换机方式采用双网卡虚拟技术。每一个系统节点均无单点故障,每一节点体现了冗余设计。
[0016]软件模型按照三层结构进行划分,每一层无单点故障,层与层之间分工明确,调度管理操控终端层与调度管理层之间通过TCP协议点对点进行通信,调度管理层和调度代理之间通过UDP协议任意源组播进行通信。层与层之间增加了信息的回证机制,保证了命令与报文传输的安全性和可靠性。
[0017]在服务器集群中,对于相同的业务作业(进程)均要求存在于主机和副机两台服务器中,任何一台服务器的软硬件出现故障时,系统均会执行自动和人工两种结合的方式进行双工切换,保证了系统的可靠性。
[0018]作业(进程)在服务器集群中的分配策略能够保证每一个作业(进程)均能运行在任意两台互为热备份的服务器中,保证了作业运行的稳定性和可靠性。
[0019]本发明适用于对实时性,可靠性,安全性及对系统冗余设计能力要求较高的数据处理系统。以航天发射场数据处理中心系统建设为原型进行说明其效果,服务器集群共有10台中型数据处理服务器,运行共有5个数据处理配置项和一个代理部件组成,每一台数据处理服务器静态部署的软件完全一样,软件的运行和分配根据服务器是否为在线状态作为依据,针对5个作业在1至10台服务器中组成的集群中进行分配。每两台服务器可以任意组成双工,增强其系统的实时性和可靠性。
【附图说明】
[0020]图1是本发明提供优选实施例实时服务器集群调度策略硬件体系结构模型图;[0021 ] 图2实时服务器集群调度策略软件模型图;
[0022]图3实时服务器集群调度策略的作业分配策略流程图;
[0023]图4实时服务器集群调度策略软双工切换流程图。
【具体实施方式】
[0024]以下结合附图,对本发明作进一步说明:
[0025]本发明的目的是对计算机集群动态调度策略涉及到的软硬件体系结构模型,动态软双工,作业动态分配模型及实时性的保障等技术问题进行论述。对强实时性、高可靠性、安全性要求比较高的信息系统,很有借鉴和参考意义。尤其是对于像航天发射应用领域涉及到的大中型强实时、高可靠性的数据处理系统,更符合现实需求,其主要内容:
[0026]1、实时计算机集群动态调度软硬件模型设计
[0027](1)硬件体系结构模型
[0028]①三层硬件体系模型
[0029]三层硬件体系模型:第一层由两台调度管理控制终端组成,两台操控终端互为热备;第二层由两台基于对服务器集群进行管理的调度管理服务器组成,两台服务器互为热备;第三层为计算机集群,由多台台服务器构成。(图1)
[0030]②三层体系的网络模型
[0031]网络模型:三层网络体系模型,分别为调度管理终端接入层、调度管理汇聚层及调度代理核心层。两台调度管理终端接入由两台互为热备份的接入层交换机,两台调度管理服务器接入由两台互为热备份的汇聚层交换机,计算机集群中的每一台服务器接入由两台互为热备份的核心层交换机。另外对服务器集群中的每一台服务器用独立网卡接入一台交换机,单独成网构成局域网,主要用于双工心跳信息交换使用。其中,每台终端和服务器接入交换机都是采用双网卡绑定技术。
[0032]③此方法的效果
[0033]硬件结构模型设计为三层服务器模型,网络结构模型也是设计为三层模型。每一层操控终端、调度管理服务器、交换机都是热备份,网卡接入交换机方式采用双网卡虚拟技术。每一个系统节点均无单点故障,每一节点体现了冗余设计。
[0034](2)软件体系结构模型
[0035]①三层软件模型
[0036]三层软件模型:调度管理操控终端层,调度管理层及调度代理层。(图2)
[0037]调度管理操控终端主要负责服务的申请,服务的启动,软硬件资源的系统监视,软双工的动态切换,服务器集群运行作业(进程)的操控,业务流程的控制,信息处理系统的应急及服务的释放等功能。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1