机群系统结点动态配置的方法和装置的制作方法

文档序号:6370418阅读:128来源:国知局
专利名称:机群系统结点动态配置的方法和装置的制作方法
技术领域
本发明涉及计算机机群监控,具体涉及机群系统结点动态配配置的方法和装置。
但是机群系统中各结点,如计算结点、登录结点、IO(存储)结点等多是异构的,机柜中结点的数目、结点的类型更是不同,这就要求监控系统具有动态配置的特性。
中国专利申请97199765.9“允许动态系统配置和诊断的自引导装置”中公开了一种可远程对计算机系统进行动态配置和/或诊断的装置。计算机系统从数据源获取程序的指令代码。该指令代码被中央处理单元(CPU)执行时,可以进行必要的擦写和编程操作,将固件程序嵌入闪速存储器中。该固件程序可用于进行配置或诊断。
在中国专利申请01106482.X“集群服务器的IP(网络地址)容错方法”中公开了一种集群服务器的IP(网络地址)容错方法。它是在由负载平衡机、高速交换机、物理服务器、互联网和用户现有技术的构成基础上,添加备份机和控制台而实现的,并包含双机热备份软件、物理服务器的自动监控软件、集群服务器的远程动态配置软件。负载平衡机与备份机能自动地互为备份,即当负载平衡机出故障时,备份机能及时发现并接管它的工作,使得集群服务器不会中断对用户的服务;在控制台上会出现报警信息使得系统管理员能及时知道故障信息。
这些专利申请或涉及“机群”或涉及“动态配置”,都没有公开在机群上的多结点动态配置。
但是,机群系统中结点的规模和类型都是变化的,结点的规模可以是几台服务器,也可以是上千台服务器,结点的类型更是多变,因此有必要采用一种合理的动态配置实现方式,能够适应机群内结点数目和结点类型的变化。
为了使监控系统更好的适应机群规模形式的变化,具有更好的可扩展性和易用性,更好的体现了机群系统单一系统映像的特点,希望能有机群系统结点动态配置的方法和装置。

发明内容
本发明的目的是针对机群系统现有技术中的自动配置问题,提供解决方案,本发明采用分级策略,按照机群,机柜,结点这样的物理布局组织配置的内容,并且以初始化文件的方式将配置)内容进行保存,当机群系统规模和形式变化时,管理员只需修改配置文件后,重新启动监控系统,即可立即实现监控系统对新机群的监控。采用分级策略进行结点的动态配置,保证了监控系统的可扩展性和易用性,使得监控系统不再受限于机群的规模和类型。
本发明提供一种机群系统结点动态配配置的装置,包括监控主机,包括基本服务提供者(BSP)装置,用于实现对机群中每个结点机的数据采集,并将上层界面的控制机群结点的信息发送给各个结点;存储装置,用于存储基本服务提供者(BSP)装置提供的数据于数据库中,及存储机群系统配置的结构;显示装置(GCM)和配置装置,用于根据所述机群的结构配置系统;通信网络,用于所述监控主机与所述机群系统的各结点机的机柜的信息交互;其中,机柜中包括结点采集模块,用于完成各结点的数据采集;和结点代理模块,用于把采集到的数据收集汇总,传递给所述监控主机的BSP。
可选地,所述结点采集模块包括数据采集卡,其中包括模拟信息采集部件与数字信息采集部件,分别用于采集结点的模拟与数字信息;所述结点代理模块包括数据汇集卡,用于将所述采集卡采集的数据汇集后通过所述网络发送给所述监控主机。
优选地,所述基本服务提供者装置包括监控装置,用于监控系统采集信息和实现控制;其中,还包括配置分发装置,用于分发配置信息。
可选地,所述配置装置包括配置信息获取装置,用于从初始化文件中获取配置信息,所述配置分发装置通过指令的方式将所述获取的配置信息分发给所述结点采集模块和所述结点代理模块。
优选地,所述结点采集模块根据配配置信息确定采集的硬件信息,设定阈值、结点的状态;NA根据配置信息确定采集的软件数据信息,配置状态;所述显示装置根据配置信息,确定页面的显示内容和方式。
可选地,装置还包括机群系统历史结构记录装置,用于保存所述机群的结构的历史数据,以在系统需要恢复某一状态时,由所述系统主机根据机群系统历史结构记录装置恢复,或在所述系统主机改变状态时,记录改变前的状态。
本发明还提供一种实现机群系统结点动态配置的方法,包括步骤存储所述机群系统的配置文件,以确定机群的初始结构;获取所述机群的配置信息,根据所述配置信息修改所述配置文件;分发所述修改的配置文件中的对应参数给所述机群的结点采集模块和所述结点代理模块;所述机群的结点采集模块和所述结点代理模块根据所述分发的信息修改结点结构。
可选地,在执行修改所述配置文件的步骤前,还包括步骤存储修改前的配置文件。
优选地,所述获取所述机群的配置信息的步骤包括获取机群系统中的网络类型、结点类型,机柜数目,机柜中结点数目、电压电流检测、开关结点机方式、容错方式,获取机柜配置信息,包括机柜编号,机柜名称,机柜类型,配置状态,结点总数;获取结点配置信息,包括结点编号,结点名称,结点类型,结点配置状态,结点网络地址。
可选地,所述获取网络类型的步骤包括判断网络为管理网络或系统网络;获取结点类型包括判断结点为计算结点,存储结点,或登录结点。
优选地,所述分发所述修改的配置文件中的对应参数的步骤包括分发机群系统中的网络类型、结点类型,机柜数目,机柜中结点数目、电压电流检测、开关结点机方式、容错方式,分发机柜配置信息,包括机柜编号,机柜名称,机柜类型,配置状态,结点总数;分发结点配置信息,包括结点编号,结点名称,结点类型,结点配置状态,结点网络地址。
利用本发明,监控系统能适应机群规模形式的变化,易于扩展和使用。
具体实施例方式
为了便于本领域一般技术人员理解和实现本发明,现结合附图描绘本发明的实施例。
首先参照

图1,图1示出了本发明的实现机群监控系统动态配置的装置以文件形式表现的原理框图。在实施例中,采用的结点动态配置的装置采用分级策略,按照机群、机柜、结点来组织配置内容,并且将配置内容保存在初始化文件中。机群系统结点数目众多,结点的类型也各不相同,本发明通过组织和表现不同数目,不同结点类型,不同监控内容的机群监控系统,在机群系统变化时,通过简单的修改来进行动态配置,实现对新机群系统的监控。本发明采用了分级策略,按照机群、机柜、结点这样的机群系统的物理布局来组织配置的内容,主要包括机群配置信息,机柜配置信息和结点配置信息。机群配置信息反映了机群当前的构成情况,包括机群系统中的网络类型(管理网络、系统网络等)、结点类型(计算结点、存储结点等),机柜数目,机柜中结点数目、电压电流检测、开关结点机方式、容错方式等许多内容;机柜配置信息反映了机柜当前的构成情况,包括机柜编号,机柜名称,机柜类型,配置状态,结点总数等;结点配置信息反映了机群中结点的构成情况,包括结点编号,结点名称,结点类型,结点配置状态,结点网络地址等内容。这些参数的确定决定了机群系统的结构,本发明通过修改以文件形式表现的系统结构,可以动态配置机群系统。在本发明中,为了保证系统的可靠性,在配置文件中还维护了一个配置版本的参数,用于对应当前机群状态,若机群中配置内容改变后,想查询以前配置的信息内容,可能造成混乱,但是维护了配置版本这一参数,即可实现结点信息的正确查询。虽然以配置文件的形式描绘本发明,本领域技术人员知道,配置文件中含有许多参数,任何参数的修改导致系统结构的变化,因此,配置文件不应被理解为文件,而应是以文件形式表述的系统结构,正如专利文献中以文字表述的系统结构不应认为是一种作品。
图2描绘了实现机群监控系统动态配置的装置的实现配置的分发过程的装置的结构的原理框图。图中,每个机柜的基本结构是类似的,因此,以一个为主描绘本发明。其中,NP及汇集卡与BSP分别通过以太网络和485串行网络通信。本领域一般技术人员知道,通信的协议和网络可以采用许多种,因此,本发明并不仅限于说明书中公开的在实施例中使用的网络。
在机群的每个结点上都安装有采集卡,负责采集结点的硬件健康信息,由每个机柜内的汇集卡收集机柜内所有结点的硬件信息统一传递给监控主机上运行的BSP(基本服务提供者),同时在每个结点上都运行NA、NP两个模块,其中NA(结点采集模块)完成数据采集任务,NP(结点代理模块)作为NA与BSP的中间层,负责把NA采集到的数据收集汇总,然后统一传递给监控主机上运行的BSP。BSP运行在监控主机端,收集并分析处理结点的软硬件信息,存放于数据库内。
BSP运行在监控主机端,是监控系统采集信息和实现控制的核心部分。配置信息的分发也是由BSP主动进行的。监控系统启动后,BSP首先从初始化文件中获取配置信息,通过指令的方式将对应的配置信息分发给NP,NA,汇集卡、采集卡,并将配置信息插入数据库,采集卡根据配置信息确定采集的硬件信息,设定阈值、结点的状态;NA根据配配置信息确定采集的软件数据信息,配置状态;GCM则根据数据库中的配置信息,确定页面的显示内容和方式。
概言之,结点采集模块NA采集结点机上的运行状态信息,采集卡采集结点机上的硬件健康信息。结点代理模块(NP)汇总它所管理的结点机的所有运行状态信息(结点代理模块所管理的结点机通常是一个机柜中的所有结点机);汇集卡汇总它所管理的结点机的所有硬件健康信息(汇集卡所管理的结点机通常是一个机柜中的所有结点机)。BSP汇总所有结点代理模块和汇集卡的信息。在本发明的实施例中,结点采集模块包括硬件采集卡和控制该采集卡和从该采集卡读取数据的软件,在实施例中,采集卡采集的数据存储在存储器中,通过软件控制接口来读取这些数据。汇集卡汇集和存储采集的数据,根据需要读取这些数据。虽然实施例中采用读取数据的方式,实际上也可以采用软件根据具体条件触发采集数据,或硬件触发采集数据,如通过中断。
下面以一个具体例子并参照图1和图2描绘本发明。表1为根据本发明设计的机群系统的具体例子的详细布置图。其中计算结点、存储结点、登录结点结点类型各不相同,但所有计算结点结点类型都相同,所有存储结点类型都相同,所有登录结点类型都相同。
表1

机柜1 机柜2 机柜3 机柜4 机柜5 机柜6
在这个例子中,首先,采用分级策略,按照机群、机柜、结点来组织的配置内容如下。
机群配置信息(1)存在系统网络,系统网络类型为以太网络;(2)结点类型为计算结点、存储结点、登录结点;(3)机柜数目为6;(4)机柜中结点的最大个数为30;(5)计算结点总数为120个,登录结点总数为4个,存储结点总数为4个;(6)硬件信息获取途径计算结点、登录结点和存储结点硬件信息获取途径都为串口网络;(7)不监控机柜电压(8)CPU风扇个数计算结点、登录结点和存储结点CPU风扇个数都为2个;(9)主板风扇个数计算结点主板风扇个数为0,登录结点主板风扇个数为2,存储结点主板风扇个数为2个。
(10)BSP开关机方式硬件关机;(11)BSP采样频率30s;(12)BSP容错次数3;(13)BSP串口网络重试次数10次;(14)BSP的等待时间1000ms;(15)BSP的重发延时300ms;(16)NP的等待时间500ms;(17)NP重发延时2.5s;(18)NA的采样频率500ms
机柜配置信息(1)机柜名称Frame1-Frame6;(2)机柜编号1-6;(3)机柜中结点数量机柜1、2、4、5结点数量为30,机柜3和6结点数量为4;(4)机柜类型机柜1、2、4、5为计算机柜,机柜3为登录机柜,机柜6为存储机柜;(5)机柜配置状态机柜不隔离;结点配置信息(1)结点在机柜中的编号1-30;(2)结点名称如机柜1结点1为c0101,机柜3结点1为ln01;(3)结点网络地址如机柜1结点1(网络地址)为192.168.1.1;(4)结点类型如机柜1中结点类型为计算结点,机柜3中结点类型为登录结点,机柜6中结点类型为存储结点;(5)结点配置状态结点配置不隔离;监控系统启动后,BSP读取这些配置信息,根据规则生成不同的配置表插入到数据库中,如机群配置表(PARA_CONFIG),机柜配置表(CAB_CONFIG),结点配置表(NODE_CONFIG),同时根据配置信息相应的维护数据表,作业表和基础表内容,以供GCM调用使用,同时将结点配置信息通过以太网络和串口网络分别传送给NP和NA,采集卡和汇集卡,将机柜的配置信息传送给汇集卡。采集卡根据配置信息确定采集的硬件信息,设定阈值、结点的状态;NA根据配置信息确定采集的软件数据信息,配置状态;
利用本发明,监控系统具有可扩展性,能够适应机群规模和类型的变化;监控系统具有易用性,使管理员可以仅通过修改初始化文件,即可适应机群系统的扩展;体现了整个机群系统的单一映像的特点。
虽然通过实施例描绘了本发明,本领域普通技术人员知道,本发明有许多变形和变化而不脱离本发明的精神,希望所附的权利要求包括这些变形和变化而不脱离本发明的精神。
权利要求
1.一种机群系统结点动态配配置的装置,包括监控主机,包括基本服务提供者(BSP)装置,用于实现对机群中每个结点机的数据采集,并将上层界面的控制机群结点的信息发送给各个结点;存储装置,用于存储基本服务提供者(BSP)装置提供的数据于数据库中,及存储机群系统配置的结构;显示装置(GCM)和配置装置,用于根据所述机群的结构配置系统;通信网络,用于所述监控主机与所述机群系统的各结点机的机柜的信息交互;其中,机柜中包括结点采集模块(NA),用于采集结点机上的运行状态信息;和结点代理模块(NP),用于汇总它所管理的结点机的所有运行状态信息,并传递给所述监控主机的BSP。
2.如权利要求1所述的装置,其中,所述结点采集模块还包括数据采集卡,其中包括模拟信息采集部件与数字信息采集部件,分别用于采集采集结点机上的模拟与数字硬件信息;所述结点代理模块还包括数据汇集卡,用于汇总它所管理的结点机的由所述采集卡采集的所有硬件信息,以通过所述网络发送给所述监控主机。
3.如权利要求1所述的装置,其中,所述基本服务提供者装置包括监控装置,用于监控系统采集信息和实现控制;其中,还包括配置分发装置,用于分发配置信息。
4.如权利要求3所述的装置,其中,所述配置装置包括配置信息获取装置,用于从初始化文件中获取配置信息,所述配置分发装置通过指令的方式将所述获取的配置信息分发给所述结点采集模块和所述结点代理模块。
5.如权利要求4所述的装置,其中,所述结点采集模块根据配配置信息确定采集的硬件信息,设定阈值、结点的状态;NA根据配置信息确定采集的软件数据信息,配置状态;所述显示装置根据配置信息,确定页面的显示内容和方式。
6.如权利要求1所述的装置,还包括机群系统历史结构记录装置,用于保存所述机群的结构的历史数据,以在系统需要恢复某一状态时,由所述系统主机根据机群系统历史结构记录装置恢复,或在所述系统主机改变状态时,记录改变前的状态。
7.一种实现机群系统结点动态配置的方法,包括步骤存储所述机群系统的配置文件,以确定机群的初始结构;获取所述机群的配置信息,根据所述配置信息修改所述配置文件;分发所述修改的配置文件中的对应参数给所述机群的结点采集模块和所述结点代理模块;所述机群的结点采集模块和所述结点代理模块根据所述分发的信息修改结点结构。
8.如权利要求7所述的方法,其中,在执行修改所述配置文件的步骤前,还包括步骤存储修改前的配置文件。
9.如权利要求7所述的方法,其中,所述获取所述机群的配置信息的步骤包括获取机群系统中的网络类型、结点类型,机柜数目,机柜中结点数目、电压电流检测、开关结点机方式、容错方式,获取机柜配置信息,包括机柜编号,机柜名称,机柜类型,配置状态,结点总数;获取结点配置信息,包括结点编号,结点名称,结点类型,结点配置状态,结点网络地址;所述分发所述修改的配置文件中的对应参数的步骤包括分发机群系统中的网络类型、结点类型,机柜数目,机柜中结点数目、电压电流检测、开关结点机方式、容错方式,分发机柜配置信息,包括机柜编号,机柜名称,机柜类型,配置状态,结点总数;分发结点配置信息,包括结点编号,结点名称,结点类型,结点配置状态,结点网络地址。
10.如权利要求9所述的方法,其中,所述获取网络类型的步骤包括判断网络为管理网络或系统网络;获取结点类型包括判断结点为计算结点,存储结点,或登录结点。
全文摘要
本发明提供了一种机群系统结点动态配置的装置。其中监控主机包括基本服务提供者(BSP)装置,用于实现对机群中每个结点机的数据采集,并将上层界面的控制机群结点的信息发送给各个结点;存储装置,用于存储基本服务提供者(BSP)装置提供的数据于数据库中,及存储机群系统配置的结构;显示装置(GCM)和配置装置,用于根据所述机群的结构配置系统。通信网络,用于所述监控主机与所述机群系统的各结点机的机柜的信息交互;其中,机柜中包括结点采集模块,用于完成各结点的数据采集;和结点代理模块,用于把采集到的数据收集汇总,传递给所述监控主机的BSP。利用本发明,监控系统能适应机群规模形式的变化,易于扩展和使用。
文档编号G06F13/14GK1475912SQ03146288
公开日2004年2月18日 申请日期2003年7月8日 优先权日2003年7月8日
发明者金正操, 程菊生, 崔吉顺, 田宏萍, 蒋晓华, 彭涛 申请人:联想(北京)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1