一种Linux作业管理方法及其Windows客户端与流程

文档序号:12786209阅读:756来源:国知局
一种Linux作业管理方法及其Windows客户端与流程

本发明涉及计算机应用技术领域,具体涉及一种Linux作业管理方法及其Windows客户端。



背景技术:

在高性能计算领域,计算作业主要由Linux系统组成的计算机集群完成。而普通用户主要使用Windows系统进行工作。在计算时,用户通过SSH客户端(比如PuTTY)登录到Linux集群的管理节点,上传或编写输入文件,提交计算作业到作业调度系统,监控作业,查看并下载完成的作业结果。这一系列过程都需要输入命令,对于习惯于Windows图形界面的普通用户非常困难。另一方面,作业提交过程是相对重复和繁琐的,可以通过一个图形应用程序来完成这个过程,从而方便了普通用户的使用。

目前一些集群系统上安装有基于http协议的Web作业管理系统,它在Linux集群的管理节点上安装一个Web服务器,用户通过Web浏览器登录Linux集群,上传输入文件,提交作业,监控作业运行状态,下载计算结果。这种方法极大地方便了Linux集群的使用。但是,这种Web作业管理系统必须在管理节点安装,启动httpd服务,并且只能由管理员进行操作,按照管理员设定的方式,使用管理员安装好的程序。因此,这种方式远远不能满足计算用户的多样化计算所带来的个性化需求。



技术实现要素:

为了给科学计算用户提供个性化的Linux集群作业管理系统,本发明公开了一种基于SSH协议的Linux作业管理方法及其Windows客户端。

为了达到上述目的,本发明的技术方案是如下方式实现的。

步骤1. 在Windows计算机上安装ssh和scp命令,在Linux集群的管理节点上启动sshd服务。

步骤2. 在Windows计算机上编写图形客户端,用于通过图形方式制作计算作业所需的输入文件,监控作业运行状态,查看计算结果。

步骤3. 通过scp命令自动从Windows计算机上传输入文件和从Linux集群下载计算结果。

步骤4. 通过ssh命令从Windows计算机向Linux集群发送命令,完成作业提交、作业监控和终止作业等一系列工作。

本发明的有益效果有以下三个方面。

1. Windows图形客户端与普通用户所用的各种常用Windows图形界面相似,用户非常容易操作和使用。

2. Windows客户端安装在用户的个人计算机上,用户可以对客户端的各种界面、参数和命令进行按需更改,完全不依赖于Linux集群管理员。

3. 本发明只使用基于SSH协议的sshd服务,它是Linux集群上必备的服务。因此在Linux集群是不需要启动额外的服务,具有普遍的适用性。

4. 用户的输入文件的上传和计算结果的下载都是在后台自动进行的,减轻了用户的工作量。

附图说明

图1是高性能计算Linux集群的网络拓扑图。

图2是作业管理方法的Windows界面和基本运行过程图。

具体实施方式

为了使本发明的目的,技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。

附图1是高性能计算Linux集群的网络拓扑图。在常见的科学计算中,用户主要在Windows计算机上工作,生成输入文件后,使用ftp或sftp上传到Linux集群管理节点上,再登录到Linux集群管理节点,通过作业调度系统(比如PBS和Platform LSF等)提交到Linux集群计算节点。作业运行期间,用户可以通过命令监控作业是否运行,运行状态,是否完成等。作业完成之后,用户再通过ftp或sftp把输出结果下载到Windows计算机中,进行后续处理和分析。

可见,常见的科学计算的过程比较程序化,可以使用程序完成这个作业管理过程。

附图2是作业管理方法的Windows界面和基本运行过程图。我们以最常见的matlab作业的管理进行说明。

首先要在Windows计算机上安装所必需的软件,包括PuTTY软件包的plink和pscp命令(它们分别对应于Linux系统下的ssh和scp命令),使用java语言编写图形客户端。本界面包括作业输入界面,作业监控界面和作业结果界面。

在Linux集群的管理节点和计算节点上安装并配置作业调度系统,为普通用户建立用户名和密码。这些需要Linux集群的管理员进行专业的安装和配置,无需普通用户进行操作的。在本实施例中,假定Linux管理主机地址为192.168.1.100,作用调度系统为PBS。

下面描述使用Windows下的图形客户端进行matlab作业管理的完整过程。

1. 在图形客户端的界面上编写matlab的输入文件input.m。

2. 在图形界面上点击提交作业,则input.m文件被保存在Windows计算机中,并且在后台执行两个命令以提交并运行作业。

(1)用pscp命令把输入文件input.m自动传输到Linux集群的用户主目录的工作目录work下:pscp -l 用户名 -pw 用户密码 input.m 192.168.1.100:work/ 。

(2)用plink命令在Linux管理节点提交到作业队列里:plink -l 用户名 -pw 用户密码 192.168.1.100 qsub matlab work/input.m > work/output.log 。

3.在图形界面上刷新监控作业状态时,在后台向Linux系统发送下列命令以查看作业运行状态:plink -l 用户名 -pw 用户密码 192.168.1.100 qstat 。

4.在作业完成后,在后台通过plink命令把计算结果output.log传回Windows计算机,并且在图形界面上进行查看和处理: pscp -l 用户名 -pw 用户密码 192.168.1.100:work/output.log . 。

通过上述过程,用户就可以在Windows计算机的图形界面上向Linux集群提交Matlab任务,并且在本Windows计算机上查看计算结果。

根据用户需要,还可以增加类似于matlab的其它计算程序的提交作业和查看作业结果的模块,比如计算化学Gaussian,材料化学VASP,流体力学软件ANSYS等。这样就能满足不同专业用户的个性化需求。

以上所述仅为本发明的一个实施例而已,并不用以限制本发明。凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1