一种自动收集计算机集群节点信息并分析的方法及系统的制作方法_3

文档序号:9914282阅读:来源:国知局
t;/CI>
[0095]<CI>Solut1n->Server->SAN Switch</CI>
[0096]<CI>Solut1n->Server->Database->Server->LUN->Storage->SAN
[0097]Switch</CI>
[0098]〈/DependsOn〉
[0099]〈/CIType〉
[0100]根据上面示例的预设关系设定,通过遍历节点信息存储模块中存储的硬件节点信息,生成树形节点信息数据链,保存在XML文件中。参照图4,为一种树形节点信息数据链的XML文件示例,系统硬件架构图动态生成模块将处理好的XML文件,传入到图形生成单元中,图形生成单元根据传入的XML文件中列出的节点信息,生成最终的硬件架构图。
[0101]图5为依据图4的XML文件生成的系统硬件架构图示例。其中,
[0102]节点MES的平台类型为业务流程(business-process);节点FactoryWorks和节点Tuxedo分别表示业务应用系统,其平台类型为解决方案(Solut1n);节点mes7app0、节点mes7appl、节点cim7tuxl、节点cim7tux2、节点mes7pdb3的平台类型为服务器(Server);节点fab7_switchl和节点fab7_switch2的平台类型为以太网交换机(NetworkSwitch);节点fab7_sanl和节点fab7_san2的平台类型为SAN交换机(SAN Switch);节点uspvm-1和节点uspvm-2的平台类型为存储设备(Storage);节点uspvm-Ι:1和节点uspvm-1:2分别表示存节点uspvm-1划分给主机的第一逻辑磁盘和第二逻辑磁盘,节点uspvm-2:1和节点uspvm-2:2分别表示节点uspvm-2划分给主机的第一逻辑磁盘和第二逻辑磁盘,其平台类型为逻辑磁盘(Logical Unit Number, LUN)。节点mes7db的平台类型为数据库(Database);具体应用时,冗余信息分析模块通过依据对应的检测策略对各节点逐个进行冗余分析,其中,在检测节点mes7db时,参照图5,由于节点mes7db只运行在节点mes7pdb3 一个主机上,不满足数据库冗余检查的检测规则,即数据库是否可以运行在两个或多个主机上,因而判断存在单点风险,需要系统管理员进行修复。
[0103]以上所述仅为本发明较佳的实施例,并非因此限制本发明的实施方式及保护范围,对于本领域技术人员而言,应当能够意识到凡运用本发明说明书及图示内容所作出的等同替换和显而易见的变化所得到的方案,均应当包含在本发明的保护范围内。
【主权项】
1.一种自动收集计算机集群节点信息并分析的方法,其特征在于,包括以下步骤: 步骤Si,获取计算机集群中的所有节点信息; 步骤s2,存储所述节点信息; 步骤s3,从存储的所述节点信息中获取未检测的节点,依据相应的检测策略对所述节点进行冗余分析并生成一分析结果; 步骤s4,循环所述步骤s3直至所有节点完成冗余分析; 步骤s5,依据所述分析结果判断是否有节点存在单点风险,并生成一检测结果。2.根据权利要求1所述的一种自动收集计算机集群节点信息并分析的方法,其特征在于,步骤s3具体如下: 步骤s31,获取待检测节点的平台类型; 步骤s32,获取与所述平台类型对应的检测策略; 步骤s33,利用检测策略对待检测节点进行冗余信息检测,并生成分析结果。3.根据权利要求2所述的一种自动收集计算机集群节点信息并分析的方法,其特征在于,每一种平台类型对应一种检测策略,每一种检测策略包括至少一个检测规则;步骤s5中,当被检测节点不满足相应的检测策略的任意一个检测规则时,则判断被检测节点存在单点风险。4.根据权利要求1所述的一种自动收集计算机集群节点信息并分析的方法,其特征在于,在所述步骤s2之后所述步骤s5之前,还包括步骤s6,依据一预设的拓扑关系将所述计算机集群中的节点生成一节点信息数据链,所述节点信息数据链包含的节点信息通过一图形生成单元生成系统硬件架构图。5.根据权利要求4所述的一种自动收集计算机集群节点信息并分析的方法,其特征在于,步骤s6具体如下: 步骤s61,获取所述节点的平台类型; 步骤s62,获取与所述平台类型对应的拓扑关系; 步骤s63,依据所述拓扑关系形成一树形结构的节点信息数据链,保存在一设定格式的文件中; 步骤s64,所述图形生成单元获取所述设定格式的文件,并依据所述设定格式的文件中包含的节点信息动态生成所述系统硬件架构图。6.根据权利要求2所述的一种自动收集计算机集群节点信息并分析的方法,其特征在于,所述检测策略包括系统硬件冗余检测策略,所述系统硬件冗余检测策略的检测规则包括硬件是否为双硬盘及硬盘是否做了镜像,和/或是否是双电源,和/或双电源是否连接到不同的不间断电源。7.根据权利要求2所述的一种自动收集计算机集群节点信息并分析的方法,其特征在于,所述检测策略包括网络链路冗余检测策略,所述网络链路冗余检测策略的检测规则包括是否是双网卡,和/或双网卡是否连接到了不同网络管理设备上,和/或所连接的网络管理设备是否冗余。8.根据权利要求2所述的一种自动收集计算机集群节点信息并分析的方法,其特征在于,所述检测策略包括光纤链路冗余检测策略,所述光纤链路冗余检测策略的检测规则包括是否是双主机总线适配器卡;和/或双主机总线适配器卡是否连接到了不同的光纤管理设备上;和/或所连接的光纤管理设备是否冗余。9.根据权利要求2所述的一种自动收集计算机集群节点信息并分析的方法,其特征在于,所述检测策略包括业务应用系统冗余检测策略,所述业务应用系统冗余检测策略的检测规则包括核心业务应用系统是否存在于至少两个主机上。10.根据权利要求5所述的一种自动收集计算机集群节点信息并分析的方法,其特征在于,所述设定格式的文件采用可扩展标记语言格式文件,所述节点信息数据链保存在可扩展标记语言格式文件中。11.一种自动收集计算机集群节点信息并分析的系统,其特征在于, 包括, 节点信息收集模块,用于获取计算机集群中的节点信息; 节点信息存储模块,与所述节点信息收集模块连接,用于存储所述节点信息收集模块收集的节点信息; 冗余信息分析模块,与所述节点信息存储模块连接,依据设定的检测策略对节点进行冗余分析,并生成一分析结果。12.根据权利要求11所述的一种自动收集计算机集群节点信息并分析的系统,其特征在于,所述冗余信息分析模块包含一报表生成单元,用于依据所述分析结果生成一冗余信息分析报表,所述冗余信息分析报表至少包含所有检查失败的节点名称和检查项目。13.根据权利要求11所述的一种自动收集计算机集群节点信息并分析的系统,其特征在于,还包括,系统硬件架构信息生成模块,与所述节点信息存储模块连接,用于依据计算机集群节点之间预设的拓扑关系形成一树形结构的节点信息数据链。14.根据权利要求13所述的一种自动收集计算机集群节点信息并分析的系统,其特征在于,还包含一图形生成单元,所述图形生成单元与所述系统硬件架构信息生成模块连接,通过获取所述节点信息数据链包含的节点信息生成系统硬件架构图。
【专利摘要】本发明涉及集成电路芯片制造技术领域,具体涉及一种计算机集群系统。一种自动收集计算机集群节点信息并分析的方法,步骤s1,获取计算机集群中的所有节点信息;步骤s2,存储节点信息;步骤s3,从存储的节点信息中获取未检测的节点,依据相应的检测策略对节点进行冗余分析并生成一分析结果;步骤s4,循环步骤s3直至所有节点完成冗余分析;步骤s5,依据分析结果判断是否有节点存在单点风险,并生成一检测结果。本发明可以有效的降低系统管理员的工作量,避免手工输入的错误和遗漏,为集群平台的监控分析提供数据基础,降低集群系统出现单点故障的风险,提高系统的可靠性。
【IPC分类】H04L12/24
【公开号】CN105681070
【申请号】
【发明人】刘晓东, 姜宇征, 陈 峰, 李中平
【申请人】中芯国际集成电路制造(天津)有限公司, 中芯国际集成电路制造(上海)有限公司
【公开日】2016年6月15日
【申请日】2014年11月21日
当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1