服务器监控系统及监控方法

文档序号:7696151阅读:112来源:国知局
专利名称:服务器监控系统及监控方法
技术领域
本发明涉及计算机技术领域,特别涉及一种服务器监控系统及监控 方法。
背景4支术
服务器是指在网络环境下运行相应的应用软件、为网上用户提供共 享信息资源和各种服务的 一种高性能计算机。
在现代化的大规模自动化生产中,每一生产设备中均设置有微处理
器以及显示装置、输入/输出装置等,相当于一台普通的PC,不同的生产
设备通过网络连接,并通过服务器对生产设备进行控制,实现不同生产 设备之间通讯以及数据共享等管理服务,以实现自动化生产。在某一生 产工厂中,可能需要多台所述的服务器。半导体集成电路制造工厂就是 这样的自动化生产工厂的一个例子。
服务器的核心管理地位要求其具有高速度的运算能力、长时间的可 靠运行、强大的外部数据吞吐能力以及足够的安全性和稳定性。基于此,
需要对服务器的安全性以及稳定性进行监控,以监控服务器的CPU、存
储器、磁盘空间、通讯总线、网络连接等的状态,判断服务器是否工作 在稳定状态。
在公开号为CN101072123A的中国专利申请文件中,公开了 一种服务 器监控系统。图1为所述的中国专利申请文件公开的监控系统的示意图。
请参考图l,所述的监控系统包括被监控服务器IO、通讯网络20、监 控服务器30和移动终端40。所述监控服务器30与被监控服务器10通过通 讯网络20连接,监控服务器30可以实时地发出不同的监控指令以监控被 监控服务器10的运行状态。监控服务器30与移动终端40保持无线连接, 当监控服务器30检测到被监控服务器10出现异常时,会不断地对移动终 端40发出与具体故障相关联的报警信号,直至该移动终端40对该监控服 务器30发出停止报警的指令为止。
5但是,图l所示的监控系统在发出报警信号时,无法为用户提供追龙 该报警信号的相关信息,从而无助于用户寻找该具体故障的具体原因, 并解决该故障,或者会延长用户解决该故障的时间,不利于提高效率。

发明内容
本发明提供一种服务器监控系统,可以为用户提供追踪该报警信号 的相关信息,有利于用户寻找具体故障发生的原因。
本发明提供的一种服务器监控系统,包括监控服务器、监控终端和 至少一被监控服务器,所述监控服务器与所述监控终端、被监控服务器 通过通讯网络连接,所述监控服务器包括监控子系统、报警子系统和数
据存储与处理子系统;其中,
所述监控子系统用于执行监控指令,向被监控服务器发送监控信 息,接收被监控服务器发送的数据信息;
所述数据存储与处理子系统用于存储并向用户提供被监控服务器 发送的当前数据信息以及历史数据信息;
所述报警子系统用于比较数据存储与处理子系统中的当前数据信 息与其相应的阈值的大小,并在超出阈值时向所述的监控终端发送报警 消息。
可选的,还包括查询终端,用于接收查询请求,向所述数据存储与 处理子系统发送查询信息,并接收来自所述数据存储与处理子系统响应 的数据信息。
可选的,所述数据存储与处理子系统包括存储单元和数据处理单
元;
所述存储单元用于存储被监控服务器发送的当前数据信息以及历 史数据信息;
所述数据处理单元用于接收查询请求,调用所述的当前数据信息以 及历史数据信息,并转换成用户可识别的数据格式。
可选的,所述数据处理单元包括格式转换单元以及显示单元;
所述格式转换单元用于将所述的历史数据信息和当前数据信息转换成用户可识别的数据^^式;
所述显示单元用于将所述的用户可识别的数据信息发送至所述的 查询终端。
可选的,所述监控子系统包括执行单元、信息交互单元和传输转换
单元;其中,
所述执行单元用于执行监控指令;
所述信息交互单元用于向所述被监控服务器发送监控信息,接收被 监控服务器发送的数据信息;
所述传输转换单元用于将接收来自监控服务器的数据信息,并发送 至所述数据存储与处理子系统。
可选的,所述交互单元包括发送单元和接收单元; 所述发送单元用于向所述被监控服务器发送监控信息; 所述接收单元用于接收所述被监控服务器发送的数据信息。 可选的,所述报警子系统包括阈值设置单元、当前数据获取单元、 比较单元和报警信号发送单元;
所述阈值设置单元用于设置被监控服务器的被监控指标的报警阈
值;
所述当前数据获取单元用于获取数据存储与处理子系统存储的被 监控服务器的当前数据信息;
所述比较单元用于比较所述当前数据获取单元获得的当前数据信 息与其相应的阈值的大小;
所述报警信号发送单元用于在当前数据信息超出其相应的阈值时 向所述的监控终端发送报警消息。
可选的,所述的监控终端包括电子邮件接收装置、CT2接收装置或 短消息接收装置。
可选的,所述报警子系统还包括报警消息分类单元,用于对所述报 警消息分类,以决定发送至电子邮件接收装置、CT2接收装置或短消息接收装置。
可选的,所述的监控服务器和被监控服务器通过SNMP协议进行信
息交互。
可选的,所述监控服务器通过有线或无线通讯网络与所述监控终端 连接。
本发明还提供一种服务器监控方法,包括 向被监控服务器发送监控信息;
接收被监控服务器对所述监控信息响应而发送的数据信息;
将接收的所述数据信息存储为当前数据信息和历史数据信息;
比较所述当前数据与其相应的阈值的大小,当所述的当前数据大于 其相应的阈值时,发送报警消息;
接收用户查询,将与所述报警消息相关的当前数据信息和历史数据 信息反馈至查询用户。
可选的,在发送报警消息之前,对所述报警消息分类,决定发送至 电子邮件接收装置或CT2接收装置或短消息接收装置。
与现有技术相比,上述技术方案的其中 一个至少具有以下优点
根据本发明的其中一个方面,监控服务器包括监控子系统,数据存 储与处理子系统和报警子系统;所述的监控子系统用于向被监控服务器 发送监控信息,获得该被监控服务器的工作状态的数据信息;所述的数 据存储与处理子系统用于存储并向用户提供被监控服务器发送的当前 数据信息以及历史数据信息;所述报警子系统用于比较数据存储与处理 子系统中的当前数据信息与其相应的阈值的大小,并在超出阈值时向所 述的监控终端发送报警消息;通过所述的服务器监控系统,在用户收到 报警信息后,可以查询数据存储与处理子系统中与该报警信息相关的当 前数据和历史数据,通过对历史数据进行追踪,可以为用户提供追踪该 报警信号的相关信息,对消除服务器故障提供参考,有利于用户寻找具 体故障发生的原因,缩短用户解决该故障的时间,可提高效率;
此外,用户也可以实时的查询数据存储与处理子系统中的历史数据
8和当前数据,判断数据趋势,有利于消除服务器故障隐患,对服务器维 护以及升级提供参考;
此外,通过对所述的报警消息分类别发送, 一方面可使用户对紧急 重要的报警及时处理,而又不会被频繁被打扰,待有空余时间时处理普 通的报警信息,方便用户处理。


图1为现有的一种的服务器监控系统的示意图2为本发明的服务器监控系统的实施例的示意图3为本发明的服务器监控系统的数据存储及处理子系统的实施例 的示意图4为本发明的服务器监控系统的监控子系统的实施例的示意图; 图5为本发明的服务器监控系统的报警子系统的实施例的示意图; 图6为本发明的服务器监控方法的实施例的流程图。
具体实施例方式
下面结合附图对本发明的具体实施方式
做详细的说明。
在下面的描述中阐述了很多具体细节以便于充分理解本发明。但是 本发明能够以很多不同于在此描述的其它方式来实施,本领域技术人员 可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公 开的具体实施的限制。
在本发明的服务器监控系统中,包括监控服务器、监控终端和至少 一个被监控服务器,所述监控服务器和监控终端、监控服务器通过通讯 网络连接,所述的监控服务器包括监控子系统、报警子系统和数据存储 与处理子系统。
所述监控子系统用于执行监控指令,向被监控服务器发送监控信 息,接收被监控服务器发送的数据信息;例如,监控子系统执行询问被 监服务器状态的指令(即监控指令)后,向被监控服务器发送询问信息 (即监控信息),被监控服务器将自身的状态信息(即数据信息)反馈
9至监控子系统。
所述数据存储与处理子系统用于存储并向用户提供被监控服务器 发送的当前数据信息以及历史数据信息;
所述报警子系统用于比较数据存储与处理子系统中的当前数据信 息与其相应的阈值的大小,并在超出阈值时向所述的监控终端发送^^艮警 消息。
通过监控服务器的监控子系统可周期性地或实时性地向所述被监 控服务器发送监控信息,获得该被监控服务器的工作状态的数据信息, 将该凄t据信息存储于所述数据存储与处理子系统中。
在被监控服务器发送的数据信息超出设定的阈值时,所述的报警子 系统可向监控终端发送报警信息,用户可以查询数据存储与处理子系统 中与该报警信息相关的当前数据信息和历史数据信息,通过对历史数据 信息进行追踪,可以对消除服务器故障提供参考。
此外,用户也可以实时的查询数据存储与处理子系统中的历史数据 信息和当前数据信息,判断数据趋势,有利于消除服务器故障隐患,对 服务器维护以及升级提供参考。
下面结合实施例和示意图对本发明的服务器监控系统进行详细说
明。图2为本发明的服务器监控系统的实施例的示意图。应当说明的是, 下面的实施例中对一些细节的描述仅仅是示意性的,其不应当不当的限 制权利要求的保护范围,本领域技术人员在不脱离本发明的精神和实质 的情况下可以做出相应的修改、删除和替换。
请参考图2,本发明的实施例的服务器监控系统包括监控服务器 200、监控终端300和至少一个被监控服务器100,为说明方便,本实施 例中净皮监控服务器100为两个,其也可以是多个。在本发明的实施例中, 不对被监控服务器100的具体配置以及其中的操作系统、应用软件等有 关的具体个体信息做出限制,其可以是任何配置、任何操作系统或应用 软件等。
其中,所述的监控服务器200包括监控子系统201 、数据存储与处理子系统204和报警子系统206。
所述的监控子系统201用于执行监控服务器200的监控指令,向被 监控服务器100发送监控信息,以及接收被监控服务器100发送的数据 信息。其中,该监控信息携带有目标被监控服务器IOO的标识,,在接 收的被监控服务器100发送的数据信息中,也携带有该标识,该标识用 于识别是哪一个服务器。
通过所述的监控子系统201可实现监控服务器200和被监控服务器 100之间的信息交互,获得被监控服务器100的状态数据信息,例如, 系统冗余、CPU是否耗尽、磁盘空间、内存占用状况等。
其中,所述的监控子系统201可以周期性的向被监控服务器100发 送监控信息,获得被监控服务器100的数据信息,实现二者的信息交互。 例如,可以每隔5分钟发送一次监控信息。此外,也可以采用基于中断 的方式实现监控服务器200和被监控服务器IOO的信息交互,即,在被 监控服务器100出现故障时自动向监控服务器200发送数据信息。当然, 也可以上述的两种方式相结合,这里不再赘述。
作为实例,所述监控服务器200和被监控服务器IOO之间可以通过 简单网络管理协议(SNMP)实现信息交互,在监控服务器200上设置 SNMP主代理,在被监控服务器IOO上设置从代理,被监控服务器IOO 的从代理将被监控服务器的信息管理库(MIB)中的被监控服务器100 的状态数据信息发送至监控服务器200。
此外,若被监控服务器IOO不支持简单网络管理协议,还可以通过 第三方服务器间接访问所述的被监控服务器100,实现被监控服务器100 与监控服务器200之间的信息交互,这里不再详细描述。在这里,所述 SNMP主代理相当于监控子系统201。当然,也可以使用其它协议实现 监控服务器200和被监控服务器100之间的信息交互。
所述的数据存储与处理子系统204用于存储并向用户提供被监控服 务器100发送的当前数据信息以及以前发送的历史数据信息;
例如可以接收用户查询请求,调用所述的当前数据信息和历史数据信息,将其转换为用户可识别的数据格式,反馈至查询用户。
其中,所述的监控子系统201获取被监控服务器100的状态数据信
息后,将其存储至该数据存储与处理子系统204,其存储格式可能不是 用户可识别的格式,例如,具体地,可以采用RRDtool存储所述的数 据信息,存储格式为rrd格式。在用户需要获取该数据信息时,RRDtool 可将所述的rrd格式的数据转换成图表或图像格式, 一目了然,便于用 户查看。在这里,所述的RRD tool可相当于所述的数据存储与处理子 系统204。当然,还可以^f吏用其它的工具,这里不再进行列举。
所述的报警子系统206用于比较数据存储与处理子系统204中的当 前数据信息与该信息相应的阈值的大小,并在超出阈值时向所述的监控 终端300发送报警消息。
所述的报警子系统206中设置有#1监控服务器100待监控指标的阈 值, 一旦被监控服务器100被监控指标超出其相应的阈值,即可由该报 警子系统206向监控终端300发送报警信息,以通知用户,被监控服务 器100可能出现或已经出现故障。
所述的监控终端300包括电子邮件接收装置或CT2接收装置或短 消息接收装置。
所述监控终端300可以通过有线或无线方式与所述监控服务器200 连接。
此外,本发明的实施例的服务器监控系统还可以包括查询终端400。 所述查询终端400用于接收用户查询请求,向所述数据存储与处理子系 统204发送查询信息,并接收来自所述数据存储与处理子系统204响应 的数据。
例如,所述的查询终端400可以通过网页方式实现查询梯:作。
请参考图3,所述的数据存储与处理子系统204还可以包括存储单 元2041和数据处理单元2042。
所述存储单元2041用于存储被监控服务器100发送的当前数据信 息以及历史数据信息。所述数据处理单元2042用于接收用户请求、调用所述的当前数据信息以及历史数据信息、并转换成用户可识别的数据格式。
所述数据处理单元2042还可以包括格式转换单元和显示单元(未图示)。
所述格式转换单元用于将所述的历史数据信息和当前数据信息转换成用户可识别的数据格式。
所述显示单元用于将所述的用户可识别的数据信息发送至所述的查询终端。
请参考图4,所述监控子系统201还可以包括执行单元2011、信息交互单元2013和传输转换单元2015。其中,
所述执行单元2011用于执行监控指令。
所述交互单元2013用于向被监控服务器100发送监控信息、接收被监控服务器发送的数据信息。
所述传输转换单元2014用于将接收自被监控服务器100的数据信息发送至所述数据存储与处理子系统204。必要时,转换所述数据信息的格式,使其成为易于存储或可被所述数据存储及处理子系统204能够识别的数据格式,例如rrd格式或其它格式。
述发送单元用于向被监控服务器发送监控信息;所述接收单元用于接收被监控服务器发送的数据信息。
请参考图5,所述报警子系统206还可以包括阈值设置单元2063、当前数据获取单元2061 、比较单元2065和才艮警信号发送单元2067。
所述阈值设置单元2063用于设置被监控服务器100被监控指标的报警阈值。
所述当前数据获取单元2061用于获取数据存储与处理子系统204存储的被监控服务器100的当前数据信息。
所述比较单元2065用于比较所述当前数据获取单元2061获得的当前数据信息与其相应的阈值的大小。
13所述报警信号发送单元2067用于向所述的监控终端300发送报警消息。
此外,所述报警子系统206还可以包括报警消息分类单元(未图示),用于对所述报警消息分类,决定发送至电子邮件接收装置或CT2接收装置或短消息接收装置。通过对服务器的报警消息根据重要性和紧迫性进行分类,以决定以何种方式发送。例如,将所述的报警消息分为非常紧急、紧急和普通,对于普通的报警消息,可发送至电子邮件接收装置,即使用户没有及时查看,也无关紧要;对于紧急的报警消息,可通过CT2接收装置接收;而对于非常紧急的报警消息,可通过短消息接收装置接收,便于用户第一时间获悉,以便于采用必要措施。
通过对所述的报警消息分类别发送, 一方面可使用户对紧急重要的报警及时处理,而又不会被频繁被打扰,待有空余时间时处理普通的报警信息,方便用户处理。
此外,本发明还提供一种服务器监控方法,图6为本发明的服务器监控方法的其中 一 个实施例的工作流程图。
请参考图6,步骤SIOO,向被监控服务器发送监控信息。
步骤S110,接收被监控服务器对所述监控信息响应而发送的数据信息。
步骤S120,将接收的所述数据信息存储为当前数据信息和历史数据信息。
步骤S130,获fl所述当前数据以及与其相应的阈值。步骤S140,判断所述的当前数据是否大于所述的阈值,若是,执行步骤S150,若否,返回步骤S130。
步骤S150,向用户发送报警消息。
步骤S160,用户接收所述的报警消息,并发出查询请求。步骤S170,接收用户查询,将与所述报警消息相关的当前数据信息和历史数据信息转换为用户可识别格式。步骤S180,反々贵至查询用户。
14此外,在发送报警消息的步骤之前,还可以包括对所述报警消息分
类的步骤,以决定发送至电子邮件接收装置或CT2接收装置或短消息
接收装置。这里不再详细描述。
本发明虽然以较佳实施例公开如上,但其并不是用来限定本发明,任何本领域技术人员在不脱离本发明的精神和范围内,都可以做出可能的变动和修改,因此本发明的保护范围应当以本发明权利要求所界定的范围为准。
权利要求
1、一种服务器监控系统,包括监控服务器、监控终端和至少一被监控服务器,所述监控服务器与所述监控终端、被监控服务器通过通讯网络连接,其特征在于所述监控服务器包括监控子系统、报警子系统和数据存储与处理子系统;其中,所述监控子系统用于执行监控指令,向被监控服务器发送监控信息,接收被监控服务器发送的数据信息;所述数据存储与处理子系统用于存储并向用户提供被监控服务器发送的当前数据信息以及历史数据信息;所述报警子系统用于比较数据存储与处理子系统中的当前数据信息与其相应的阈值的大小,并在超出阈值时向所述的监控终端发送报警消息。
2、 如权利要求1所述的服务器监控系统,其特征在于还包括查 询终端,用于接收查询请求,向所述数据存储与处理子系统发送查询信 息,并接收来自所述数据存储与处理子系统响应的数据信息。
3、 如权利要求2所述的服务器监控系统,其特征在于所述数据 存储与处理子系统包括存储单元和数据处理单元;所述存储单元用于存储被监控服务器发送的当前数据信息以及历 史数据信息;所述数据处理单元用于接收查询请求,调用所述的当前数据信息以 及历史数据信息,并转换成用户可识别的数据格式。
4、 如权利要求3所述的服务器监控系统,其特征在于所述数据 处理单元包括格式转换单元以及显示单元;所述格式转换单元用于将所述的历史数据信息和当前数据信息转 换成用户可识别的数据格式;所述显示单元用于将所述的用户可识别的数据信息发送至所述的 查询终端。
5、 如权利要求1至4任一权利要求所述的服务器监控系统,其特 征在于所述监控子系统包括执行单元、信息交互单元和传输转换单元;其中,所述执行单元用于执行监控指令;所述信息交互单元用于向所述被监控服务器发送监控信息,接收被监控服务器发送的数据信息;所述传输转换单元用于将接收自监控服务器的数据信息发送至所 述数据存储与处理子系统。
6、 如权利要求5所述的服务器监控系统,其特征在于所述交互 单元包括发送单元和接收单元;所述发送单元用于向所述被监控服务器发送监控信息;所述接收单元用于接收所述被监控服务器发送的数据信息。
7、 如权利要求1至4任一权利要求所述的服务器监控系统,其特 征在于所述报警子系统包括阈值设置单元、当前数据获取单元、比较 单元和报警信号发送单元;所述阈值设置单元用于设置被监控服务器的被监控指标的报警阈值;所述当前数据获取单元用于获取数据存储与处理子系统存储的被 监控服务器的当前数据信息;所述比较单元用于比较所述当前数据获取单元获得的当前数据信 息与其相应的阈值的大小;所述报警信号发送单元用于在当前数据信息超出其相应的阈值时 向所述的监控终端发送报警消息。
8、 如权利要求7所述的服务器监控系统,其特征在于所述的监 控终端包括电子邮件接收装置、CT2接收装置或短消息接收装置。
9、 如权利要求8所述的服务器监控系统,其特征在于所述报警 子系统还包括报警消息分类单元,用于对所述报警消息分类,以决定发 送至电子邮件接收装置、CT2接收装置或短消息接收装置。
10、 如^f又利要求l或2或3或4或5或6或8或9所述的月l务器监控系统,其特征在于所述的监控服务器和被监控服务器通过SNMP协议进行信息交互。
11、 如权利要求1所述的服务器监控系统,其特征在于所述监控服务器通过有线或无线通讯网络与所述监控终端连接。
12、 一种服务器监控方法,其特征在于,包括向被监控服务器发送监控信息;接收被监控服务器对所述监控信息响应而发送的数据信息;将接收的所述数据信息存储为当前数据信息和历史数据信息;比较所述当前数据与其相应的阈值的大小,当所述的当前数据大于其相应的阈值时,发送报警消息;接收用户查询,将与所述才艮警消息相关的当前数据信息和历史数据信息反馈至查询用户。
13、 如权利要求11所述的服务器监控方法,其特征在于在发送报警消息之前,对所述报警消息分类,决定发送至电子邮件接收装置或CT2接收装置或短消息接收装置。
全文摘要
服务器监控系统,包括监控服务器、监控终端和至少一被监控服务器,所述监控服务器与所述监控终端、被监控服务器通过通讯网络连接,所述监控服务器包括监控子系统、报警子系统和数据存储与处理子系统;所述监控子系统用于执行监控指令、向被监控服务器发送监控信息,接收被监控服务器发送的数据信息;所述数据存储与处理子系统用于存储并向用户提供被监控服务器发送的当前数据信息以及历史数据信息;所述报警子系统用于比较数据存储与处理子系统中的当前数据信息与其相应的阈值的大小,并在超出阈值时向所述的监控终端发送报警消息。本发明还提供一种服务器监控方法。可以为用户提供追踪该报警信号的相关信息,有利于用户寻找具体故障发生的原因。
文档编号H04L12/24GK101651556SQ20081011840
公开日2010年2月17日 申请日期2008年8月14日 优先权日2008年8月14日
发明者张海燕, 桂培培, 虹 武, 琮 胡, 玲 邹, 陈延年 申请人:中芯国际集成电路制造(北京)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1