一种应用于集群系统中故障报警短信管理的方法

文档序号:7684153阅读:115来源:国知局
专利名称:一种应用于集群系统中故障报警短信管理的方法
技术领域
本发明涉及计算机或网络通讯技术领域,具体的说是一种应用于集群系统中 短信报警监控管理的智能化方法。
技术背景伴随着计算机和网络技术的不断发展,越来越多的计算机,服务器被广泛应 用到各个领域。服务器能否正常稳定的工作影响到社会生活的方方面面。为确保 网络的重要组成部分一服务器能够正常运行,及时了解服务器运行状态是否异常, 初步分析出异常得原因,并且能够在最短的时间内通知管理员以便解决问题,减 少损失,保障整个系统的健康运行,服务器监管起着非常大得作用。在高性能集 群系统中,智能化监管方案和相关软硬件设备的需求是与日俱增,然而当前智能 化短信报警监管的管理方法和方法还是空白。目前市场上的集群系统故障报警装置,大都采用电子邮件报警,电话报警和 界面报警这样三种方式,这三种方式要么需要值班人员不能离岗的高度关注,要 么只听到报警的嗡鸣声,而难以定位故障节点的位置和故障信息的缘由。目前的 这种故障报警装置这就直接导致给管理人员和相关技术人员的维护和管理集群系统带来极大不便。随着GSM/GPRS移动通讯网络的发展,却没有一种利用手机短信 来及时对集群系统故障信息报警的装置。短信报警能够不受地域的限制,只要 GSM/GPRS网络覆盖的地方,就可以获得集群系统的故障信息,并能获得报警的内 容及其节点定位,大大縮短集群系统问题处理周期,及时并比较准确的掌握故障 信息,通知管理员解决问题,最大程度的减少由于集群系统问题带来的损失,并 且降低系统管理员的劳动强度,解放劳动力。当前的各种报警方式都很难把人从 管理中解放出来,也很难把故障信息在第一时间内通知系统管理人员和相关技术 人员,报警的实效性比较差,市场的满意度不高,这就造成了管理的繁杂和维护 成本的提高。 发明内容本发明的目的就是提供一种应用于集群系统的智能化短信报警方法,更充分的 利用手机的便捷性,及时的让管理人员处理集群系统的故障问题。本发明通过以下技术方法来实现系统包括节点管理模块函,子管理模块SM,服务器总管理模块MOM,用户接口模块UI和GSM模块,根据信息通信协议进行信 息通讯,并通过系统总线和用户接口模块UI与GSM模块相连接,集群系统服务器 总管理模块MOM获得各子管理模块SM和节点管理模块丽传递的故障信息,通过 用户接口模块UI将信息传送给GSM模块,当报警信息传送到用户接口管理模块UI, 通过事件触发,报警信息就被传递给GSM模块,GSM模块最后报警信息通过 GSM/GPRS网络发送给管理员,管理员针对接收到报警信息,分析报警缘由并做屮, 处理意见,通过手机发出处理指令,处理指令的发送过程是报警信息传递的逆向 过程,通过构建的通信协议精确定位并触发执行,完成了管理员的维护操作,从 而形成了集群系统和管理人员的信息和处理的交互,实现来智能化故障管理。 各管理模块的报警信息流和故障信息流交互处理,包括发送报警信息。 集群系统和管理人员遵循各自的交互通信协议进行交互信息,实现准确寻址和 信息交互的操作。交互通信包括根据既定协议进行协商,对故障信息智能化发送和接受管理员指 令触发执行、显示报警信息,并远程监控和管理集群系统的各种配置和参数。 管理人员通过GSM/GPRS网络跟集群进行短信交互。本发明的优异效果是,由于采用了GSM/GPRS移动通讯网络,总线技术,信息 交互技术,并自建立相应的信息协商机制,在集群系统中增加短信发送和接受装 置模块,简化了管理流程,及时解决问题和调整配置等也减少系统故障,降低维 护和管理成本,使得故障报警和监控处理维护变得更加便捷。


图l集群管理系统短信报警架构图;图2集群管理系统的短信报警和短信维护交互通信结构图; 图3报警故障信息包结构图; 图4处理故障信息指令结构图。
具体实施方式
下面结合附图对本发明的方法作进一步说明在交互通信中提出这样的协商信息数据包机制,如图3和图4: 在交互通信当中通过自行建立的协商机制来实现,从而解决了有效的寻址和 信息封装和拆封信息包的难题,有效的提髙了信息故障的处理效率。故障信息由两部分组成,信息数据头和信息数据正文组成。信息数据头包括了发送到目的地址的管理手机号码,GSM模块地址号码,编码方法,校验方式等等信 息。信息数据正文大致包括以下内容报警类型,报警节点,报警时间,报警内容。处理信息也有两部分组成,处理信息数据头和信息数据正文组成。信息数 据头包括了 GSM模块地址号码,管理员手机号码,编码方式等等。信息数据正文 由两部分组成报警节点,报警处理指令参考如图l和图2l.节点管理模块醒2.子管理模块SM3.服务器总管理模块M0M 4.用户接口 模块UI 5. GSM模块。当集群系统节点管理模块或子管理模块等软硬件放生故障,自动触发产生故 障信息,将信息传递给服务器总管理模块,服务器总管理模块通过对信息的封装 环节将数据传送给用户管理接口模块,用户管理模块此时检测是否有GSM模块与 其互联,当检测到GSM模块与其互联时,就将报警信息传递给GSM模块。GSM模块 加载管理员手机号,封装附加信息,并进行GSM/GPRS网络通信的相应编码,将手机信息发送给管理员。此时管理员手机 收到故障信息内容,为管理员提供参考,内容包括节点信息,报警类型,报警时 间,报警内容等相关信息。当管理员获得报警信息内容后,经过分析,得出解决方案,比如通过短信 进行简单处理,通过其他手段比如远程登录,前往集群系统本地端现场解决等等。而当管理人员判断短信故障完全可以通过短信处理时,根据报警类型和报警的节 点,发出相应的操作指令。此时操作指令发送给GSM模块,GSM模块进行解码并拆 包,并通过用户接口模块将信息转发给服务器总管理模块,服务器总管理模块根 据信息包中返回的节点位置,将数据信息转发给相关的故障节点,故障节点接受 到相应的指令,执行相应的操作。当执行完成后,根据执行结果的状态,及时反 馈给管理人员,顺利处理完成。实现了简单的确认。这就完成了一个故障信息发 送,故障信息维护和处理结果确认的全过程。从而实现了集群系统的短信管理和 维护,为解放人力和降低成本提供了好的帮助。
权利要求
1、一种应用于集群系统中故障报警短信管理的方法,包括节点管理模块NM,子管理模块SM,服务器总管理模块MOM,用户接口模块UI和GSM模块,其特征在于,根据信息通信协议进行信息通讯,并通过系统总线和用户接口模块UI与GSM模块相连接,集群系统服务器总管理模块MOM获得各子管理模块SM和节点管理模块NM传递的故障信息,通过用户接口模块UI将信息传送给GSM模块,当报警信息传送到用户接口管理模块UI,通过事件触发,报警信息就被传递给GSM模块,GSM模块最后报警信息通过GSM/GPRS网络发送给管理员,管理员针对接收到报警信息,分析报警缘由并做出处理意见,通过手机发出处理指令,处理指令的发送过程是报警信息传递的逆向过程,通过构建的通信协议精确定位并触发执行,完成了管理员的维护操作,从而形成了集群系统和管理人员的信息和处理的交互,实现来智能化故障管理。
2、 根据权利1要求的智能化短信报警方法,其特征在于各管理模块的报 警信息流和故障信息流交互处理,包括发送报警信息。
3、 根据权利1和要求的智能化短信报警方法,其特征在于集群系统和管 理人员遵循各自的交互通信协议进行交互信息,实现准确寻址和信息交互的操 作。
4、 根据权利3的要求的智能化短信报警方法,其特征在于交互通信包括 根据既定协议进行协商,对故障信息智能化发送和接受管理员指令触发执行、 显示报警信息,并远程监控和管理集群系统的各种配置和参数。
5、 根据权利3要求的短信报警智能化方法,其特征在于管理人员通过 GSM/GPRS网络跟集群进行短信交互。
全文摘要
本发明公开了一种当集群系统发生故障而自动短信报警方法,该方法包括节点管理模块(NM),子管理模块(SM),服务器总管理模块(MOM),用户接口模块(UI)和GSM模块。集群系统各个部件通过系统相应总线把报警故障信息传送到用户接口管理模块并同步写到数据库。当报警信息传送到用户接口管理模块,通过事件触发,报警信息就被传递给GSM模块,GSM模块最后报警信息通过GSM/GPRS网络发送给管理员,管理人员针对接收到报警信息,分析报警缘由并做出处理意见,通过手机发出处理指令。系统采用了GSM/GPRS移动通讯网络,并通过通信协议实现交互通讯,在集群系统中增加短信发送和接受装置模块,集群系统的管理流程大大简化,维护成本也随之降低,故障报警和监控处理维护变得更加方便。
文档编号H04L12/24GK101232411SQ20081001464
公开日2008年7月30日 申请日期2008年2月25日 优先权日2008年2月25日
发明者宁雄雁, 刚 李, 王守昊, 健 魏 申请人:浪潮电子信息产业股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1