本研究方法主要涉及到信息技术领域。
背景技术:
随着计算机技术和网络通信技术的快速发展,服务器集群得到了广泛的应用,采用服务器集群的系统通常是为了提高系统的稳定性和网络中心的数据处理能力及服务能力,服务器集群网络规模和服务器数量随着企业业务发展而不断升级,集群系统内服务器数量和各组件不断增加,在不同的种类设备配置导致网络管理信息分布不均且容易出现故障,它的不足主要表现在以下几个方面:
1、服务器集群系统的自动化监控预警系统以及远程维护管理系统的缺失,人为的手工维护系统效率不高,对系统故障难以发现。
2、处理不及时,对管理人员的技术水平和操作能力要求过低,导致处理效率慢,系统死板,不能跟以前的数据做对比分析只能看到当前状态,不能正确评估分析。
原有的系统故障存在滞后性,一般是在发生问题后才去解决,且是通过人工监控的方式进行处理,对人力和财力方面造成了很大的浪费。
技术实现要素:
1、基于集群服务器故障处理技术,主要对管理端模块进行处理,它为系统提供web管理界面为浏览器和服务器结构,管理端后台和代理处理网络管理数据为客户机和服务器结构,主要引入了snmp网络管理报文传输格式,snmp报文在传输层通过udp协议传输,udp将snmp报文封装后传递给ip层,ip层继续封装后传递给底层网络接口传输。使交换数据更加便捷,脱离数据内部格式建立内部以外的格式,不管在说明情况下都能接收都消息做出及时的处理。
2、基于集群服务器故障处理技术,主要方法为对每台服务器安装代理,代理端对管理端进行网络通信,管理端对接到的信息进行相应的操作,管理端在规定时间内对接收到的信息进行过滤,做出正确的判断,即时做出故障预警,它的具体操作方法为由理站发送get-request报文请求查询某个被管对象的信息,代理将被查询对象信息封装到get-response报文中进行响应,set-request对管理对象进行设置。
3、基于集群服务器故障处理技术,主要运用到snmp、agentx和ipmi多种协议,分别对管理端、代理端以及通信模块进行了具体技术实现,主要包含对管理端的状态监测、预警判定、预警过滤、预警通知和设备管理模块。
4、基于集群服务器故障处理技术,snmp协议是运用到网络管理中,管理工作站在不断监听接收trap信息的同时还可以对代理端发送命令。通过管理信息库中查询或设置后返回结果给管理站;在被管代理设备出现异常状况时,主动发送trap告警信息给管理站。
5、基于集群服务器故障处理技术,agentx协议完成mib的动态变化,其通过将单一代理模式变为单一主代理和多个子代理协同工作的模式,灵活地解决了mib和代理功能的动态扩展问题。
6、基于集群服务器故障处理技术,ipmi协议跟管理端完全结合,根据现有的网络管理系统连接起来,实现高级版和精准的服务管理功能,pmi集群管理软件可以为服务器提供各种传感器数据,来完成故障预警处理,ipmi规范还定义了一套通信协议用于服务器平台和系统管理软件之间的通信以及服务器设备之间的通信。