无代理自动化服务器系统的制作方法_2

文档序号:9828306阅读:来源:国知局
>[0045] 图4是根据本发明的判断本服务器负荷状况的流程图。
[0046] 图5是根据本发明实施负荷分散的流程图。
[0047] 图6是根据本发明的作业继续执行并同步结果的流程图。
[0048] 图7是根据本发明的服务器A移交管理权的流程图。
[0049] 图8是根据本发明的服务器A接收同步信息的流程图。
[0050] 图9是根据本发明的第一实施例的服务器A-等待队列的示意图。
[0051] 图10是根据本发明的第一实施例的服务器A-资源负载的示意图。
[0052] 图11是根据本发明的第二实施例的服务器A执行状况-1的示意图。
[0053] 图12是根据本发明的第二实施例的服务器A执行状况-2的示意图。
[0054] 图13是根据本发明的第二实施例的服务器B执行状况的示意图。
[0055] 图14是根据本发明的第二实施例的服务器C执行状况-1的示意图。
[0056] 图15是根据本发明的第二实施例的服务器C执行状况-2的示意图。
【具体实施方式】
[0057] 根据本发明的具体实施例的无代理自动化服务器系统,包含:两个以上服务器,被 配置成能够相互通信、并分别能够与多个客户端进行通信从而对多个客户端执行管理权以 管理多个客户端中的作业的执行,其中当系统中的一个服务器出现运行超载时,出现运行 超载的一个服务器将对应于运行超载部分的作业的管理权移交给两个以上服务器中运行 未超载的目标服务器。
[0058] 并且,在本发明的实施例中,两个以上服务器中连接有显示器的服务器被作为主 服务器,而其他服务器被称为副服务器,这样的话,两个以上服务器可以由一个主服务器和 一个以上副服务器组成,其中,主服务器又称为第1服务器或者服务器A,副服务器又称为 第2服务器或者服务器B、服务器C等等。应该注意,任意一个服务器均有可能发生或者最 先发生超载,与是否为主服务器无关。一个以上副服务器中的每一个服务器所管理的多个 客户端中的作业的执行情况都被同步给主服务器。而且,操作人员能够通过连接在主服务 器上的显示器来监控两个以上服务器中的每一个服务器所管理的多个客户端中的作业的 执行情况。作业的执行情况包含作业开始执行时间、作业结束执行时间、以及作业执行结 果。
[0059] 且本发明中所称的运行超载指的是,作业的并发执行个数超过所限个数,或者CPU 使用率和内存使用率超过阈值,即负荷超载。在一个实施例中,如果作业并发执行个数超过 所限,作业的状态会设为"保留",如果CPU、内存的使用率超过阈值,则作业状态会设为"中 断"。
[0060] 运行超载取决于作业的个数超过预先设定的作业个数阈值,或者取决于一个服务 器的CPU和/或内存使用率超过预先设定的CPU和/或内存使用率阈值。
[0061] 在根据本发明的具体实施例的无代理自动化服务器系统中,两个以上服务器中的 每一个服务器都具有各自的状态表,状态表包含每一个服务器的作业个数、以及CPU和/或 内存使用率,每一个服务器的状态表可以被两个以上服务器中的其他服务器读取。
[0062] 当一个服务器(例如,主服务器A)出现运行超载时,该一个服务器读取两个以上 服务器中的其他服务器(例如,副服务器,如服务器B、C等)的状态表,其中,当其他服务器 的状态表中的作业个数都超过作业个数阈值时,则主服务器不对其他服务器移交对应于运 行超载部分的作业的管理权;当其他服务器的状态表中的作业个数不都超过作业个数阈值 时,若状态表中的作业个数最少的服务器只有一个,则主服务器将对应于运行超载部分的 作业的管理权移交给状态表中作业个数最少的服务器,若状态表中的作业个数最少的服务 器有两个以上,则主服务器将对应于运行超载部分的作业的管理权移交给空余处理能力最 高的服务器。
[0063] 这里,空余处理能力是CPU处理能力,或者是内存处理能力。
[0064] 以下根据运行超载的不同情况进行分别的说明。
[0065] 在运行超载取决于作业的个数超过预先设定的作业个数阈值的情形中,在根据本 发明的具体实施例的无代理自动化服务器系统中,如果作业的个数超过预先设定的作业个 数阈值,则对应于运行超载部分的作业的状态被设为保留。
[0066] 如果作业的个数超过预先设定的作业个数阈值,则在运行超载的主服务器将对应 于运行超载部分的作业的管理权移交给目标服务器的同时,将对应于运行超载部分的作 业、对应于运行超载部分的作业的前任作业的输出参数、以及对应于运行超载部分的作业 的客户端信息移交给目标服务器。
[0067] 在运行超载取决于服务器的CPU和/或内存使用率超过预先设定的使用率阈值的 情形中,如果主服务器的CPU和/或内存使用率超过预先设定的CPU和/或内存使用率阈 值,则对应于运行超载部分的作业的状态被设为中断。
[0068] 如果主服务器的CPU和/或内存使用率超过预先设定的CPU和/或内存使用率阈 值,则在出现运行超载的主服务器将对应于运行超载部分的作业的管理权移交给目标服务 器的同时,将对应于运行超载部分的作业、以及对应于运行超载部分的作业的客户端信息 移交给目标服务器。在完成至目标服务器的移交之后,被设为中断的对应于运行超载部分 的作业在目标服务器的管理下在该作业对应的客户端被继续执行。
[0069] 最后,当运行超载的主服务器将对应于运行超载部分的作业的管理权移交给运行 未超载的目标服务器时,执行对应于运行超载部分的作业的客户端接收到服务器变更通 知。
[0070] 下面参考【附图说明】根据本发明的具体实施例的无代理自动化服务器系统的详细 运转过程。
[0071] 作为本发明的一个实施例,在如图1所示的系统中,有五台计算机(Computer), 其中两台为服务器(Server),三台为客户端(Client),服务器A(Server,1000)和服务 器B (Server, 1100),上有服务和作业的管理模块(Manager Module, 1010),检测其他 服务器的检测模块(Detection Module, 1020),与其他计算机通信的通信模块(Com-S Module,1030)。在管理模块中又有服务和作业管理DB (Manager DB,1011),作业调度模块 (Scheduling Module, 1012),服务器A与服务器B的构造完全相同。三台客户端分别为以 三种操作系统为平台的计算机,分别为Windows, Linux, Unix。以Windows平台的客户端 为例(Client,1200),其上有用户的业务系统(Business system,1210),运行的作业(Job, 1220),作业的形态可能是脚本或者命令的组合,与服务器通信的通讯模块(Com-C Module, 1230)。其他操作系统平台的客户端,内部构造与之相同。
[0072] 实施过程:
[0073] 参考图2至图6,本发明的技术的一个优选的应用过程为:
[0074] 检测同网域服务器(200)
[0075] 执行服务和作业(图3)
[0076] 判断本服务器负荷状况(400)
[0077] 实施负荷分散(500)
[0078] 作业继续执行并同步结果(600)
[0079] 过程说明
[0080] 1.检测同网域服务器(200)
[0081] 参考图2,该模块设有开启与关闭开关,分别可由用户手动进行切换。参考如下表 1,当开启服务器检测模块时,系统会自行收集同一个网域内其他服务器的信息,具体有
[0082] 1)主机 UUID (UUID of host)
[0083] 2)主机 CPU 信息(CPU of host)
[0084] 3)主机内存信息(Memory of host)
[0085] 4)主机 IP 地址(IP address of host)
[0086] 5)主机名(Name of host)
[0087] 6)活动区分(Active Flag)
[0088] 7)负荷信息 I-CPU 使用率(Workload of CPU Usage)
[0089] 8)负荷信息 2_ 内存使用率(Workload of Mem Usage)
[0090] 9)负荷信息 3_ 等待队列(Workload of Waiting queue)
[0091] 10)负荷信息 4_ 执行队列(Workload of Running queue)
[0092] 11)更新时间(Update time)

[0094] 表1.服务器状态信息表
[0095] 下面参考图2对各个步骤进行说明:
[0096] 1)检测本服务器状态信息(作为状态表的实例)(201)
[0097] 检测本服务器的状态信息以便其他服务器读取。服务器的状态信息包括:服务器 上的主机UUID,主机CPU,主机内存,主机IP地址,主机名,活动区分,负荷信息,更新时间。 其中主机UUID是唯一区分主机的标识信息,活动区分固定设为2(0表示非活动,1表示活 动),负荷信息包括CPU使用率,内存使用率,等待队列,执行队列四个。等待队列的意思是 该服务器上处于等待状态的作业队列,执行队列意思是该服务器上处于执行状态的作业队 列。更新时间表示最近一次以上信息更新的时间。
[0098] 检测本地服务器状态信息的命令:
[0099] 主机 IP 地址:ifcon 图(Linux),ipcon 图(Windows)
[0100] 主机名:hostname (Linux/Windows)
[0101] CPU 和 / 或内存使用率:top (Linux),WMI 接口函数(Windows)
[0102] 等待队列和执行队列:管理模块所提供的接口
[0103] 其中主机UUID第一次检测到信息(即建立一条记录)以后就不再做检测,同理主 机CPU和主机内存也只做一次检测,因为该信息均为静态信息。主机IP地址和主机名以及 活动区分每隔24小时检测更新一次,因为该信息相对静止。CPU和/或内存使用率每隔1 分钟检测一次,每隔10分钟对记录更新一次,更新值为10分钟之内
当前第2页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1