基于集群服务器故障处理技术的制作方法

文档序号:14942772发布日期:2018-07-13 21:27阅读:129来源:国知局

本研究方法主要涉及到信息技术领域。



背景技术:

随着计算机技术和网络通信技术的快速发展,服务器集群得到了广泛的应用,采用服务器集群的系统通常是为了提高系统的稳定性和网络中心的数据处理能力及服务能力,服务器集群网络规模和服务器数量随着企业业务发展而不断升级,集群系统内服务器数量和各组件不断增加,在不同的种类设备配置导致网络管理信息分布不均且容易出现故障,它的不足主要表现在以下几个方面:

1、服务器集群系统的自动化监控预警系统以及远程维护管理系统的缺失,人为的手工维护系统效率不高,对系统故障难以发现。

2、处理不及时,对管理人员的技术水平和操作能力要求过低,导致处理效率慢,系统死板,不能跟以前的数据做对比分析只能看到当前状态,不能正确评估分析。

原有的系统故障存在滞后性,一般是在发生问题后才去解决,且是通过人工监控的方式进行处理,对人力和财力方面造成了很大的浪费。



技术实现要素:

1、基于集群服务器故障处理技术,主要对管理端模块进行处理,它为系统提供web管理界面为浏览器和服务器结构,管理端后台和代理处理网络管理数据为客户机和服务器结构,主要引入了snmp网络管理报文传输格式,snmp报文在传输层通过udp协议传输,udp将snmp报文封装后传递给ip层,ip层继续封装后传递给底层网络接口传输。使交换数据更加便捷,脱离数据内部格式建立内部以外的格式,不管在说明情况下都能接收都消息做出及时的处理。

2、基于集群服务器故障处理技术,主要方法为对每台服务器安装代理,代理端对管理端进行网络通信,管理端对接到的信息进行相应的操作,管理端在规定时间内对接收到的信息进行过滤,做出正确的判断,即时做出故障预警,它的具体操作方法为由理站发送get-request报文请求查询某个被管对象的信息,代理将被查询对象信息封装到get-response报文中进行响应,set-request对管理对象进行设置。

3、基于集群服务器故障处理技术,主要运用到snmp、agentx和ipmi多种协议,分别对管理端、代理端以及通信模块进行了具体技术实现,主要包含对管理端的状态监测、预警判定、预警过滤、预警通知和设备管理模块。

4、基于集群服务器故障处理技术,snmp协议是运用到网络管理中,管理工作站在不断监听接收trap信息的同时还可以对代理端发送命令。通过管理信息库中查询或设置后返回结果给管理站;在被管代理设备出现异常状况时,主动发送trap告警信息给管理站。

5、基于集群服务器故障处理技术,agentx协议完成mib的动态变化,其通过将单一代理模式变为单一主代理和多个子代理协同工作的模式,灵活地解决了mib和代理功能的动态扩展问题。

6、基于集群服务器故障处理技术,ipmi协议跟管理端完全结合,根据现有的网络管理系统连接起来,实现高级版和精准的服务管理功能,pmi集群管理软件可以为服务器提供各种传感器数据,来完成故障预警处理,ipmi规范还定义了一套通信协议用于服务器平台和系统管理软件之间的通信以及服务器设备之间的通信。



技术特征:

技术总结
基于集群服务器故障处理技术,主要方法是在每个服务器中安装代理,通过网络系统进行交流反馈,管理端对接受的信息进行采集,对预警时间进行通知,xCAT用来进行功率循环和引导计算节点,设计了用于Linux 服务器集群的故障预警系统,主要从采用服务器设备状态监测模型设计,管理端和代理端通信机制采用了SNMP 和 Agent X技术,管理端核心是引擎层,包含外壳程序执行模块、IPMI 模块、Agent X 子代理模块。引擎层通过系统 API、SHELL 命令以及 IPMI 与设备操作系统进行交互。系统总体架构框架为分层次设计,把系统划分预警通知模型、状态监测模型、预警判定模型、预警过滤模型、以及设备管理模型。从而实现对服务器集群的全方面监测预警。

技术研发人员:不公告发明人
受保护的技术使用者:湖南移商动力网络技术有限公司
技术研发日:2017.01.05
技术公布日:2018.07.13
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1