一种系统性能监控及告警方法和系统的制作方法

文档序号:7757707阅读:123来源:国知局
专利名称:一种系统性能监控及告警方法和系统的制作方法
技术领域
本发明涉及通讯领域,特别涉及一种系统性能监控及告警方法和系统。
背景技术
在通讯系统中,软件的运行经常涉及到系统性能方面的问题,如果在系统性能出 现瓶颈时,进行有效的告警,并及时通知相关人员,能减少现场故障从发生到处理的时间, 防止故障范围的扩大。目前的通信系统监控及告警方面仍存在如下问题一、监控程序部署复杂,需要专门的程序开发才能满足不断增加的监控需要;二、监控数据只是在界面显示,缺少有效的远程通知手段。三、没有充分利用目前局方提供的通讯接口提供有效的短信及语音通知手段。

发明内容
本发明的目的在于提供一种系统性能监控及告警方法和系统,能更好地解决向用 户及时有效告警的问题。根据本发明的一个方面,提供的一种系统性能监控及告警方法包括性能监控数据采集端使用SHELL程序获取系统性能数据,并通过与告警阈值比 较,得到告警数据,并将所述告警数据写入数据库;告警消息发送端读取数据库中的所述告警数据,通过短信方式和/或语音方式向 用户告警。根据本发明的另一个方面,提供的一种告警系统包括性能监控数据采集端,用于采集系统性能数据,并通过与告警阈值比较,得到告警 数据,并将所述告警数据写入数据库中;告警消息发送端,用于读取数据库中的所述告警数据,并通过短信方式和/或语 音方式向用户告警。与现有技术相比较,本发明的有益效果在于本发明提高了采集系统性能数据的 方便性,而且通过短信方式和语音方式向用户告警,减少了从故障发生到故障处理的时间, 提高了处理现场故障的工作效率。


图1是本发明实施例提供的系统性能数据采集和告警数据入库方法流程图;图2是本发明实施例提供的短信告警方法流程图;图3是本发明实施例提供的语音告警方法流程图;图4是本发明实施例提供的告警系统结构示意图;图5是本发明实施例提供的告警方法流程示意图。
具体实施例方式以下结合附图对本发明的优选实施例进行详细说明,应当理解,以下所说明的优 选实施例仅用于说明和解释本发明,并不用于限定本发明。图1显示了本发明实施例提供的系统性能数据采集和告警数据入库方法流程图, 如图1所示,包括以下步骤步骤SlOl 性能监控数据采集端使用SHELL程序获取系统性能数据,所述SHELL 程序的运行采用系统任务调度的方式;步骤S102 所述SHELL程序获取系统性能数据后,通过与配置文件中相应告警项 的告警阈值比较,得到告警数据;步骤S103将所述告警数据写入数据库的告警记录表中,所述告警记录表具有告 警数据和用于标记短信告警和语音告警的告警标志。上述步骤SlOl中,所述系统性能数据包括但不限于系统CPU占有率、内存总大小、 内存剩余量、硬盘总容量、硬盘剩余空间和数据库设备剩余空间。上述步骤S103中,所述告警数据写入告警记录表可以采用命令行程序调用的方 式,命令行程序调用数据库客户端函数连接到数据库后,使用数据库客户端提供的函数插 入告警数据;所述告警数据写入告警记录表还可以直接调用数据库客户端程序完成告警数 据的入库。图2显示了本发明实施例提供的短信告警方法流程图,如图2所示,包括以下步 骤步骤S201 告警消息发送端读取数据库的告警记录表中的告警数据及告警标志, 若判断存在短信告警的告警标志,则将包含告警数据的告警消息发送到短信接口机;步骤S202 所述短信接口机根据连接的短信网关或短信中心,以短信形式向用户 发送告警消息;步骤S203 短信告警成功后,如果判断不存在语音告警的告警标志,则将告警数 据从告警记录表移入历史告警记录表中,否则,进入语音告警流程。上述步骤S201中,告警消息发送端从数据库的告警记录表中读取需要发送的告 警数据,并读取需要发送所述告警消息的用户号码列表中的用户号码,为每个用户组装一 条告警短信,发送到短信接口机。上述步骤S203中,用户号码列表中的用户号码可以是一个或一个以上,如果有一 个用户返回短信告警成功的响应,则认为告警成功,否则,在告警记录表中保持该条告警数 据的记录,待下次重新执行短信告警。上述步骤S203中,如果短信发送成功,则判断该条告警数据的记录是否存在语音 告警的告警标志,如果无语音告警,则认为告警处理完毕,把告警数据移动到历史告警记录 表中,作为以后的备查,否则进入语音通知告警流程。图3显示了本发明实施例提供的语音告警方法流程图,如图3所示,包括以下步 骤步骤S301 告警消息发送端读取数据库的告警记录表中的告警数据及告警标志, 若判断存在语音告警的告警标志,或短信告警成功后,若告警消息发送端读取数据库的告 警记录表中存在语音告警的告警标志,则进行步骤S302 ;
步骤S302 将包含告警数据的告警消息发送到业务控制点触发语音业务,语音业 务通过业务交换点向用户终端发起呼叫;步骤S303 告警消息发送端接收语音业务返回的响应,即语音告警成功,将告警 数据从数据库告警记录表移入历史告警记录表中。告警消息发送端从数据库的告警记录表中读取需要进行语音告警的用户号码列 表中的用户号码,用户号码可以是一个或一个以上,只要一个用户的语音告警成功,则认为 语音告警成功,如果全部用户的语音告警均失败,则在告警记录表中保持该条告警数据的 记录不变,待下次重新执行语音告警。图4显示了本发明实施例提供的告警系统结构示意图,如图4所示,本发明的系统 性能监控及告警系统包括性能监控数据采集端41,用于使用SHELL程序获取系统性能数据,所述系统性能 数据与配置文件中相应告警项的告警阈值比较,得到告警数据,并把告警数据写入数据库 的告警记录表中;告警消息发送端42,用于读取所述告警记录表中的告警数据和告警标志,并根据 告警标志向用户进行短信方式和/或语音方式的告警。所述性能监控数据采集端41包括数据生成模块411,用于使用SHELL程序获取包括但不限于CPU占有率、内存总大 小、内存剩余量、硬盘总容量、硬盘剩余空间和数据库设备剩余空间的系统性能数据;数据比较模块412,根据配置文件中相应告警项的告警阈值,得到告警数据;数据入库模块413,用于通过调用命令行程序或直接调用客户端程序向数据库发 送告警数据。所述命令行程序调用数据库客户端函数连接数据库后,调用相应的数据库语句插 入告警数据。所述告警数据发送端42包括告警读取模块421,用于定时读取数据库的告警记录表中的告警数据;短信通知模块422,用于在所述告警读取模块421读取到的告警标志是短信告警 时,将告警消息发送到短信接口机,由短信接口机根据连接的短信网关或短信中心,向用户 发送告警短信;语音通知模块423,用于在所述告警读取模块421读取的告警标志是语音告警时, 将告警消息发送至业务控制点触发语音业务,由语音业务通过业务交换点向用户终端发起 呼叫;数据清除模块424,用于上述短信告警成功且不需要语音通知,或者语音告警成功 后,把所述告警数据由告警记录表移入历史告警记录表中。所述系统性能监控及告警系统的工作原理如下数据生成模块411使用SHELL程序获取包括但不限于CPU占有率、内存总大小、内 存剩余值、硬盘总容量、硬盘剩余空间、数据库设备剩余空间的系统性能数据,通过数据比 较模块422,与相应告警项的告警阈值比较,得到告警数据,并将告警数据写入数据库入库 模块413的告警记录表中。告警读取模块421读取数据库入库模块413的告警记录表中的 告警数据和告警标志,若告警标志是短信告警,则短信通知模块422将告警消息发送到短信接口机,由短信接口机根据连接的短信网关或短信中心,以短信的形式向用户发送告警 消息;如果短信通知模块422接收到短信接口机返回的短信告警成功的响应后,如果不存 在语音告警标志,且告警读取模块421将告警数据标记为已告警,则数据清除模块424将所 述告警数据从数据入库模块413的告警记录表移入历史告警记录表中;如果短信通知模块 422没有接收到短信接口机返回的短信告警成功的响应,则在告警记录表中保持该条告警 数据,等待下一次定时时间到达后,重新执行短信告警操作。若存在语音告警的告警标志, 则语音通知模块423将告警消息发送到业务控制点触发语音业务,语音业务通过业务交换 点向用户终端发起呼叫;语音通知模块423接收到语音业务返回的语音告警成功的响应 后,告警读取模块421中将告警数据记录为已告警,数据清除模块424将所述告警数据从数 据入库模块413的告警记录表移入历史告警记录表中;如果全部语音告警均失败,则该条 告警数据的记录保持不变,等待下一次定时时间到达后,重新执行语音告警操作。图5显示了本发明实施例提供的告警方法流程示意图,如图5所示,包括以下步 骤步骤S501 性能监控数据采集端的数据生成模块使用SHELL程序获取系统性能数 据,包括但不限于系统CPU占有率、内存总大小、内存剩余值、硬盘总容量大小、硬盘剩余空 间、数据库设备剩余空间;步骤S502 数据比较模块将得到的所述系统性能数据与配置文件中对应告警项 的告警阀值比较,得到告警数据,并把所述告警数据写入告警数据入库模块的告警记录表 中;步骤S503 告警数据发送端的告警读取模块读取告警记录表中的告警数据和告 警标志;步骤S504 如果存在的告警标志是短信告警,则进行步骤S505,否则进行步骤 S506 ;步骤S505 短信通知模块将告警消息发送到短信接口机,短信接口机根据对外的 短信接口协议,通过连接的短信网关或短信中心,以短信形式向用户发送告警消息;步骤S506 如果存在的告警标志是语音告警,则进行步骤S507,否则进行步骤 S509 ;步骤S507 语音通知模块将告警消息发送至业务控制点触发语音业务,由语音业 务通过业务交换点向用户终端发起呼叫;步骤S508 业务交换点对用户进行语音告警呼叫;步骤S509 将告警数据从告警记录表移入历史告警记录表中;步骤S510 告警数据发送端再次扫描数据库的告警记录表中是否还有告警数据, 如果有,则返回步骤S503,如果没有,则结束流程,重新设置一个定时器,到定时时间后,再 扫描告警记录表中的告警记录;上述步骤S502中,所述配置文件中的告警项可由现场操作人员随时调整。上述步骤S502中,所述告警数据通过调用命令行程序写入数据库的告警记录表 中,所述命令行程序调用数据库客户端函数连接到数据库后,调用相应的数据库语句插入 告警数据,或者直接调用数据库的客户端程序完成告警数据的入库操作。上述步骤S507中,告警数据发送端通过数据库的告警记录表中读取需要进行短
7信通知和/或语音通知的用户号码列表中的用户号码。综上所述,本发明具有以下技术效果1、本发明使用的简便的SHELL程序获取系统性能数据,提高了采集系统性能数据 的方便性。2、本发明只对符合告警的系统性能数据入库,即告警数据入库,减小了数据库的 压力。3、本发明使用短信告警和语音告警,能够有效减少从故障发生到故障处理的时 间,提高了现场处理故障的工作效率。尽管上文对本发明进行了详细说明,但是本发明不限于此,本技术领域技术人员 可以根据本发明的原理进行各种修改。因此,凡按照本发明原理所作的修改,都应当理解为 落入本发明的保护范围。
权利要求
一种系统性能监控及告警方法,其特征在于,包括A)性能监控数据采集端使用SHELL程序获取系统性能数据,并通过与告警阈值比较得到告警数据,并将所述告警数据写入数据库;B)告警消息发送端读取数据库中的所述告警数据,通过短信方式和/或语音方式向用户告警。
2.根据权利要求1所述的方法,其特征在于,所述数据库包含用于保存告警数据的告 警记录表,所述告警数据记录表中具有告警数据和用于标记短信告警和语音告警的告警标志。
3.根据权利要求2所述的方法,其特征在于,所述步骤B)具体为告警消息发送端读取数据库的告警记录表中的告警数据和告警标志,所述告警标志为 短信告警时,将包含所述告警数据的告警消息通过短信方式由短信接口机发送给用户。
4.根据权利要求2所述的方法,其特征在于,所述步骤B)具体为告警消息发送端读取数据库的告警记录表中的告警数据和告警标志,所述告警标志为 语音告警时,使用包含所述告警数据的告警消息触发语音业务向用户发起呼叫。
5.根据权利要求2所述的方法,其特征在于,所述步骤B)具体为告警消息发送端读取数据库的告警记录表中的告警数据和告警标志,所述告警标志为 短信告警和语音告警时,先将包含所述告警数据的告警消息通过短信方式由短信接口机发 送给用户,并收到短信接口机返回的响应后,使用包含所述告警数据的告警消息触发语音 业务向用户发起呼叫。
6.根据权利要求3、4、5任意一项所述的方法,其特征在于,所述数据库还包含历史告 警记录表,告警消息发送端接收到告警消息发送成功的响应后,将所述告警数据从告警记 录表移入所述历史告警记录表中。
7.根据权利要求6所述的方法,其特征在于,告警消息发送端没有接收到告警消息发 送成功的响应,则保持告警记录表中的所述系统性能信息,等待重新发送告警消息。
8.一种系统性能监控及告警系统,其特征在于,包括性能监控数据采集端,用于采集系统性能数据,并通过与告警阈值比较得到告警数据, 并将所述告警数据写入数据库中;告警消息发送端,用于读取数据库中的所述告警数据,并通过短信方式或语音方式向 用户告警。
9.根据权利要求8所述的系统,其特征在于,所述性能监控数据采集端包括数据生成模块,用于使用SHELL程序获取包括系统CPU占有率、内存总大小、内存剩余 值、硬盘总容量、硬盘剩余空间和数据库设备剩余空间的系统性能数据;数据比较模块,用于比较所述系统性能数据和告警阈值,得到告警数据;告警数据入库模块,用于将所述告警数据保存在数据库的告警记录表中。
10.根据权利要求8所述的系统,其特征在于,所述告警消息发送端包括告警读取模块,用于读取数据库的告警记录表中的所述告警数据和告警标志;短信通知模块,用于在告警标志是短信告警时,将包含所述告警数据的告警消息通过 短信方式由短信接口机发送出去;语音通知模块,用于在告警标志是语音告警时,使用包含所述告警数据的告警消息触发语音业务向用户发起呼叫;数据清除模块,用于将数据库的告警记录表中的所述告警数据移入数据库的历史告警 记录表中。
全文摘要
本发明公开了一种系统性能监控及告警方法和系统,方法包括性能监控数据采集端使用SHELL程序获取系统性能数据,并通过与告警阈值比较,得到告警数据,并将所述告警数据写入数据库;告警消息发送端读取数据库中的所述告警数据,通过短信方式或语音方式向用户告警。本发明使用SHELL程序采集系统性能数据,提高了现场获取系统性能数据的方便性,同时利用目前局方提供的通讯接口进行短信告警和语音告警,减少了从故障发生到处理的时间,提高了处理现场故障的工作效率。
文档编号H04L12/24GK101938374SQ20101026097
公开日2011年1月5日 申请日期2010年8月24日 优先权日2010年8月24日
发明者刘美霞, 程敏, 葛全民, 魏霄鹏 申请人:中兴通讯股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1