一种基于smc的监控报警装置制造方法

文档序号:13820阅读:604来源:国知局
专利名称:一种基于smc的监控报警装置制造方法
【专利摘要】本实用新型公开了一种基于SMC的监控报警装置,包括K1系统的SMC和各节点的BMC;SMC与各节点的BMC进行交互通信,各节点的BMC中设置信息收集模块,SMC中设置信息监控模块、报警模块和通知模块;各节点的BMC通过信息收集模块收集节点操作系统信息,并将收集信息发送给SMC的信息监控模块,SMC对各类信息进行分析归类,确认报警信息并通过报警模块进行报警,同时通过通知模块将报警信息传递给运维人员;能够实现通过SMC界面监控各节点系统运行情况,不必再进入系统或使用第三方软件监控系统,确保报警及时接受及处理,将报警问题影响最小化;极大地方便K1系统的运维管理,提高了用户体验。
【专利说明】一种基于SMC的监控报警装置

【技术领域】
[0001]本实用新型涉及监控报警技术,具体地说是一种基于SMC的监控报警装置。

【背景技术】
[0002]随着计算机信息技术的飞速发展,信息系统越来越成为经济社会发展的需要。这就为计算机系统的运维带来巨大挑战,其中对系统进行监控是运维中最重要的步骤。
[0003]Kl自带的SMC (系统管理控制器)能够实现远程对Kl系统的监控管理,监控所有计算板上的BMC (Baseboard Management Controller,基板管理控制器)、电源模组的状态、风扇、NR等芯片的工作状态、监控系统错误状态,可使系统实现开关机、复位等操作以及实现各板卡的热插拔和热添加等RAS特性,但是其中SMC对操作系统的监控内容不多。现在有很多软件能做到对主机、数据库进行监控,比如Nag1s、Cacti等工具,也可以写脚本来完成工作,但有SMC这样的平台可以利用,完全可以将SMC作为操作系统、数据库以及应用程序监控中心,这样将极大方便Kl的管理和后期维护。
实用新型内容
[0004]本实用新型针对SMC进行开发,提供一种基于SMC的监控报警装置。
[0005]本实用新型所述一种基于SMC的监控报警装置,其解决所述技术问题采用的技术方案是:所述基于SMC的监控报警装置包括Kl系统的SMC和各节点的BMC ;其中,SMC与各节点的BMC进行交互通信,各节点的BMC中设置有用于收集操作系统信息的信息收集模块,SMC中设置有信息监控模块,所述信息监控模块包括服务器监控模块、数据库监控模块和网络监控模块,所述信息收集模块分别上述三个监控模块相连进行通信,SMC还包括报警模块和通知模块,上述三个监控模块均与报警模块相连,且所述报警模块与通知模块连接传递报警信息;各节点的BMC通过信息收集模块收集节点操作系统信息,并将收集信息发送给SMC的信息监控模块,SMC对各类信息进行分析归类,确认报警信息并通过报警模块进行报警,同时通过通知模块将报警信息传递给运维人员。
[0006]优选的,所述服务器监控模块包含监测器,通过监测器监控CPU使用率、内存使用率、磁盘使用情况、进程状态、服务状态以及报错日志等方面;所述数据库监控模块负责监控当前kl适配数据库;所述网络监控模块包含监测器,通过监测器监控网络连通、网卡流量、网络端口等方面。
[0007]优选的,所述服务器监控模块的监测器和网络监控模块的监测器上均设置有报警灯,当监控到操作系统信息符合报警要求时,报警灯会发出提示亮光。
[0008]优选的,所述报警模块提供阀值报警模块或事件报警模块,通过所述报警模块,若一个监测量达到某个用户设定的阀值条件或者触发用户定义的报警事件条件,则产生报警信息。
[0009]优选的,通过所述阀值报警模块,设置错误阀值、告警阀值以及正常状态条件;若监测器亮起红灯,则表示达到错误阀值为错误状态,报警模块发出错误报警;若监测器亮起黄灯,则表示达到警告阀值为警告状态,报警模块发出警告报警。
[0010]优选的,所述通知模块包括邮件网关或短信网关,通过邮件网关发送邮件报警信息,通过短信网关发送短信报警信息。
[0011]优选的,所述基于SMC的监控报警装置还包括终端显示模块,所述终端显示模块连接所述通知模块接收并显示报警信息,所述终端显示模块包括终端显示屏。
[0012]本实用新型的一种基于SMC的监控报警装置和现有技术相比具有的有益效果是:所述基于SMC的监控报警装置,能够实现通过SMC界面即可监控各节点系统运行情况,不必再进入系统或者使用第三方软件来对系统监控,并且及时对报警信息进行报警,将报警信息发送至运维人员,方便运维人员对问题进行处理,确保报警及时接受及时处理,将报警问题影响最小化;极大地方便Kl系统的运维管理,提高了用户体验,提升了 Kl系统的产品形象。

【附图说明】

[0013]附图1为所述基于SMC的监控报警装置的结构框图。

【具体实施方式】
[0014]下面结合附图和具体实施例,对本实用新型所述一种基于SMC的监控报警装置的特点和设计内容,作进一步详细说明。
[0015]本实用新型所述基于SMC的监控报警装置,主要是针对SMC进行开发,在SMC平台中加入操作系统、数据库等监控信息,并实现报警功能。通过所述基于SMC的监控报警装置,SMC通过各节点的BMC进行信息收集,在BMC中加入对节点操作系统等信息的信息收集模块,在SMC中加入信息监控模块,BMC中收集到的各类信息经过SMC的分析归类,确认哪些信息符合报警要求,进行报警,同时将报警以电子邮件或者短信的方式发送至运维人员,运维人员收到报警信息后对问题进行处理。
[0016]实施例:
[0017]本实施例所述基于SMC的监控报警装置,是基于TSKl SMC提出的监控报警装置,针对SMC进行开发,在SMC平台中加入操作系统、数据库等监控信息,并实现报警功能,如附图1所示,其结构包括:K1系统的SMC和各节点的BMC ;其中,SMC与各节点的BMC进行交互通信,各节点的BMC中设置有用于收集操作系统信息的信息收集模块,SMC中设置有信息监控模块,所述信息监控模块包括服务器监控模块、数据库监控模块和网络监控模块,所述信息收集模块分别与所述服务器监控模块、数据库监控模块和网络监控模块相连通信,SMC还包括报警模块和通知模块,所述服务器监控模块、数据库监控模块和网络监控模块均与报警模块相连,所述报警模块与通知模块连接传递报警信息;各节点的BMC通过信息收集模块对节点操作系统等进行信息收集,并将收集的各类信息发送给SMC的信息监控模块,SMC对各类信息进行分析归类,确认哪些信息符合报警要求,通过报警模块进行报警,同时通过通知模块将报警信息传递给运维人员。
[0018]如附图1所示,本实施例中所述服务器监控模块包含监测器,通过监测器所述服务器监控模块监控CPU使用率、内存使用率、磁盘使用情况、进程状态、服务状态以及报错日志等方面;所述数据库监控模块负责监控当前kl适配数据库;所述网络监控模块包含监测器,通过监测器所述网络监控模块监控网络连通、网卡流量、网络端口等方面。并且,所述服务器监控模块的监测器和网络监控模块的监测器上均设置有报警灯,当监控到操作系统信息符合报警要求时,报警灯会发出亮光来提醒运维人员及时检查系统情况。
[0019]本实施例中,所述服务器监控模块的监测器包括CPU监测器:监测CPU的平均利用率;Disk Space监测器:监测指定磁盘的剩余空间及利用率;Mem0ry监测器:监测内存(包括虚拟内存)的利用率及剩余空间process监测器:监测指定进程的实例总数、线程总数及内存总占用量;Processes进程黑白名单:进程必须存在的为白名单、进程不允许存在的为黑名单,根据白名单可以判断进程是否在线Service监测器:监测指定服务是否启动;日志监测器:监测错误日志的变化。
[0020]本实施例中,所述数据库监控模块实现了对当前kl适配数据库的监控,所述数据库包括:0RACLE (甲骨文公司的一款关系数据库管理系统)、SYBASE (Sybase公司的一种关系型数据库系统)、INFORMIX (IBM公司的关系数据库管理系统家族)、DB2 ( IBM公司的一系列关系型数据库管理系统)等;对各个数据库监控的技术指标有:数据库锁表、表空间、连接数、高速Cache命中率等,根据数据库的不同,监控指标有所区别。以ORACLE为例,ORACLE监控指标有:
[0021]-ORACLE数据库表空间的空间的使用情况:总量、已用空间、剩余空间、剩余空间百分比;
[0022].0RACLE数据库表空间表索引的扩展数;
[0023].0RACLE数据库的锁数量;
[0024]-ORACLE数据库的库缓冲率、缓冲区高速缓存命中率、数据字典高速缓存命中率;
[0025].0RACLE数据库的调度进程忙闲比率;
[0026]-ORACLE数据库回退段系统打开头比率、回退段系统打开段比率;
[0027].0RACLE数据库的连接数等等。
[0028]本实施例中,所述网络监控模块的监测器包括:网络连通监测器:监测指定IP设备和被监控主机之间的网络是否通畅,指定的IP设备是否在线;网卡流量监测器:监测网卡的流量,包括流入、流出和错误的数据包总数;网络端口监测器:监测指定IP设备的指定端口(仅限TCP端口)服务是否开启,支持自定义请求及匹配应答;接口丢包监测器:监测接口输入丢包率、接口输出丢包率、接口输入错误率、接口输出错。
[0029]本实施例所述基于SMC的监控报警装置中,所述报警模块提供阀值报警模块或事件报警模块,同时通过设置在监控器上的报警灯显示为红灯或黄灯,能够判断系统中各个设备的工作状态。通过所述报警模块,若一个监测量达到某个用户设定的阀值条件或者触发用户定义的报警事件条件,则产生报警信息。其中,阀值报警模块包括,设定一个监测量达到某个用户设定的阀值条件时产生报警;事件报警模块包括,管理服务器接收到一个用户设定的报警事件条件时产生报警。
[0030]对于上述阀值报警模块,设置错误阀值、告警阀值以及正常状态条件;所述阀值报警模块的各种情况如下:1、若监测器亮起红灯,则表示达到错误阀值为错误状态,报警模块发出错误报警,如CPU使用率大于98 %;2、若监测器亮起黄灯,则表示达到警告阀值为警告状态,报警模块发出警告报警,如CPU使用率大于80% ;3、若监测器不发亮,则显示正常状态符合正常使用条件,如CPU使用率大于等于0%。
[0031]本实施例所述基于SMC的监控报警装置中,所述通知模块包括邮件网关或短信网关,通过邮件网关进行邮件发送报警信息,通过短信网关进行短信发送报警信息。所述基于SMC的监控报警装置还包括终端显示模块,所述终端显示模块连接所述通知模块接收并显示报警信息,所述终端显示模块包括终端显示屏。当SMC判断出信息符合报警要求后,通过报警模块进行报警,并通过通知模块以电子邮件或短信方式发送报警信息;运维人员通过定时查看终端显示屏,接收电子邮件或短信得知各个节点操作系统等信息的警报情况,进而及时采取维护措施,确保报警及时接受及时处理,将报警问题影响最小化。
[0032]除说明书所述的技术特征外,均为本专业技术人员的已知技术。
【权利要求】
1.一种基于SMC的监控报警装置,其特征在于,其结构包括Kl系统的SMC和各节点的BMC ;其中,SMC与各节点的BMC进行交互通信,各节点的BMC中设置有用于收集操作系统信息的信息收集模块,SMC中设置有信息监控模块,所述信息监控模块包括服务器监控模块、数据库监控模块和网络监控模块,所述信息收集模块分别上述三个监控模块相连进行通信,SMC还包括报警模块和通知模块,上述三个监控模块均与报警模块相连,且所述报警模块与通知模块连接传递报警信息;所述服务器监控模块包含监测器,所述数据库监控模块负责监控当前kl适配数据库;所述网络监控模块包含监测器。2.根据权利要求1所述的一种基于SMC的监控报警装置,其特征在于,所述服务器监控模块的监测器和网络监控模块的监测器上均设置有报警灯,当监控到操作系统信息符合报警要求时,报警灯会发出提示亮光。3.根据权利要求2所述的一种基于SMC的监控报警装置,其特征在于,所述报警模块提供阀值报警模块或事件报警模块。4.根据权利要求3所述的一种基于SMC的监控报警装置,其特征在于,所述通知模块包括邮件网关或短信网关,通过邮件网关发送邮件报警信息,通过短信网关发送短信报警信息。5.根据权利要求4所述的一种基于SMC的监控报警装置,其特征在于,所述基于SMC的监控报警装置还包括终端显示模块,所述终端显示模块连接所述通知模块接收并显示报警信息,所述终端显示模块包括终端显示屏。
【文档编号】G06F11-32GK204270291SQ201420539750
【发明者】任启立 [申请人]浪潮电子信息产业股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1