一种基于模式匹配的集群系统监控方法

文档序号:6370463阅读:171来源:国知局
专利名称:一种基于模式匹配的集群系统监控方法
技术领域
本发明涉及一种服务器、存储监控领域,具体地说是一种基于模式匹配的集群系统监控方法。
背景技术
·
目前,整个IT业界关于大规模存储的讨论已经蔚然成风。实现存储系统监控的方式有很多,包括硬件和软件方法。由于存储系统的规模越来越大,网络存储发展迅速,对大规模甚至超大规模存储的硬件及服务的实时监控告警就成为一个难点及热点问题,企业、科研院所都将它视为一个重要的研究领域。同时,随着存储系统规模的增大,整个存储的内外部环境异常复杂。服务器、存储监控技术是指从设备安全和数据安全的角度出发,用来监控硬件、月艮务及数据的实时信息、降低服务器、存储设备的设备损坏、服务及数据丢失危险的技术。服务器、存储监控技术的核心是实时发现硬件设备以及服务的异常、危险信息,并及时告警。服务器、存储监控技术涉及所有服务器、存储软硬件监控技术,包括磁盘容量监控、IPMI硬件信息监控、网络监控、CPU监控、内存监控,文件服务和逻辑卷容量监控等可以降低风险,及时告警,并降低建设成本和运行成本的服务器、存储技术,其目的是提高服务器、存储设备及服务的安全性。目前较为流行的集群服务器、集群存储监控软件如ganglia等大多需要在配置文件中指明需要监控的具体设备及具体服务,以硬盘为例,需要在配置文件中填写被监控硬盘在系统中的设备名。在大规模集群监控中,需要监控的硬件设备及服务数量极大,需要大规模填写监控配置文件,并且当今服务器、存储设备多实现了硬件设备热插拔方式,集群存储也多采用高可用方法实现在线迁移服务,因此硬件设备及服务常常动态变化,采用原有方式在热插拔硬件,人工修改监控配置文件,会对整个集群系统的实时监控不利,同时高可用软件自动迁移服务后,在人工修改监控配置文件之前,迁移的服务在目标节点上无法监控。集群服务器、集群存储上使用的原有监控方式需要在配置文件中具体的指明需要监控哪一个设备,这对大规模集群来说,要监控的设备众多,逐一填写不利于大规模的实施,同时随着存储系统规模的增大,整个存储的环境异常复杂,硬件设备的热插拔及服务的自动迁移,实现了大规模系统的高可扩展性及高可用性,如果仍按照原先方式,管理员需要逐一修改改变的硬件及服务信息,从而无法实现监控的实时性、可靠性,这种监控策略应变性差的问题仍需要解决。

发明内容
本发明的技术任务是提供一种保证监控的实时性、可靠性,应变性好的一种基于模式匹配的集群系统监控方法。
本发明的技术任务是按以下方式实现的,在目前的集群服务器、集群存储设备中利用模式方法设计来实现对硬件设备及服务的监控,将各类硬件设备及各类软件服务按预定义的模式分类,动态监控指定模式的具体硬件设备及服务信息,以此来实现服务器、存储设备的大规模动态实时监控,包括模式分析模块、设备及服务检测模块,模式分析模块分析用户填写的模式监控配置文件,并依据分析的结果即时检测系统中存在的属于用户指定模式的具体硬件设备及服务,并将具体硬件设备及服务信息填入具体设备及服务监控配置文件;设备及服务检测模块动态方式监控,动态监测硬件设备热插拔及服务迁移,并将已经改变的硬件及服务环境信 息反映到具体设备监控配置文件中去,在用户改变系统硬件配置或服务迁移时,不需要自己修改配置文件。模式分析模块是已有监控方式的改进,目前的监控方式需要用户写入具体的需要被监控的设备及服务在系统中的名字,改进后,用户只需要写入希望被监控的某类或某几类设备及服务在系统中的定义,模式分析模块分析该模式监控配置文件,并依据此在系统中搜索具体的满足模式监控配置文件内的模式的硬件设备及服务,并写入具体设备及服务监控配置文件,以备监控模块使用。设备及服务检测模块是对硬件设备热插拔及服务迁移的检测及报告模块,在如今服务器及存储设备中,部分硬件设备如硬盘都实现了热插拔,当热插拔操作发生时,该模块可以检测到热插拔操作,得到热插拔设备的具体信息,然后按照用户配置,或者通知模式分析模块重新分析生成具体设备及服务监控配置文件或对直接修改具体设备及服务监控配置文件,并通知监控模块。集群环境中,多采用高可用方法,发生故障时实现服务的在线迁移,当服务迁移时,设备及服务检测模块可以检测到被迁移走或迁入的服务,然后按照用户配置,或者通知模式分析模块重新分析生成具体设备及服务监控配置文件或对直接修改具体设备及服务监控配置文件,并通知监控模块。 用户需要监控某类硬件设备或服务时,仅需要在模式监控配置文件中填写该类硬件设备或服务的模式,模式分析模块分析该文件并即时检测系统中符合该模式的所有硬件设备或服务,生成系统中相应设备的设备文件名或服务名并写入具体设备及服务监控配置文件,当发生硬件热插拔或服务在线迁移操作(如数据卷在线迁移)时,设备及服务检测模块被触发获取被热插拔的设备或自动迁移的服务,并自动修改配置文件。本发明的一种基于模式匹配的集群系统监控方法,实现了监控的动态性、实时性、可靠性、更好的扩展能力和可管理性,因而,具有很好的推广使用价值。


下面结合附图对本发明进一步说明。附图I为一种基于模式匹配的集群系统监控方法的模式分析及实时检测策略;附图2为一种基于模式匹配的集群系统监控方法的集群模式监控框图。
具体实施例方式参照说明书附图和具体实施例对本发明的一种基于模式匹配的集群系统监控方法作以下详细地说明。实施例本发明的一种基于模式匹配的集群系统监控方法,在目前的集群服务器、集群存储设备中利用模式方法设计来实现对硬件设备及服务的监控,将各类硬件设备及各类软件服务按预定义的模式分类,动态监控指定模式的具体硬件设备及服务信息,以此来实现服务器、存储设备的大规模动态实时监控,包括模式分析模块、设备及服务检测模块,模式分析模块分析用户填写的模式监控配置文件,并依据分析的结果即时检测系统中存在的属于用户指定模式的具体硬件设备及服务,并将具体硬件设备及服务信息填入具体设备及服务监控配置文件;设备及服务检测模块动态方式监控,动态监测硬件设备热插拔及服务迁移,并将已经改变的硬件及服务环境信息反映到具体设备监控配置文件中去,在用户改变系统硬件配置或服务迁移时,不需要自己修改配置文件。模式分析模块是已有监控方式的改进,目前的监控方式需要用户写入具体的需要被监控的设备及服务在系统中的名字,改进后,用户只需要写入希望被监控的某类或某几类设备及服务在系统中的定义,模式分析模块分析该模式监控配置文件,并依据此在系统中搜索具体的满足模式监控配置文件内的模式的硬件设备及服务,并写入具体设备及服务监控配置文件,以备监控模块使用。 设备及服务检测模块是对硬件设备热插拔及服务迁移的检测及报告模块,在如今服务器及存储设备中,部分硬件设备如硬盘都实现了热插拔,当热插拔操作发生时,该模块可以检测到热插拔操作,得到热插拔设备的具体信息,然后按照用户配置,或者通知模式分析模块重新分析生成具体设备及服务监控配置文件或对直接修改具体设备及服务监控配置文件,并通知监控模块。集群环境中,多采用高可用方法,发生故障时实现服务的在线迁移,当服务迁移时,设备及服务检测模块可以检测到被迁移走或迁入的服务,然后按照用户配置,或者通知模式分析模块重新分析生成具体设备及服务监控配置文件或对直接修改具体设备及服务监控配置文件,并通知监控模块。编写模式分析模块,分析模式配置文件,并实现在整个系统内的扫描,并将发现的符合指定模式的硬件设备或服务写入具体设备及服务监控配置文件;
编写设备及服务检测模块,检测设备热插拔操作或服务迁移动作,并按用户指定方式,或者直接修改具体设备及服务监控配置文件,或者触发模式分析模块重新生成具体设备及服务监控配置文件;
系统启动后,模式分析模块及设备及服务检测模块以守护进程方式运行。本发明的一种基于模式匹配的集群系统监控方法,除说明书所述的技术特征外,均为本专业技术人员的已知技术。
权利要求
1.一种基于模式匹配的集群系统监控方法,其特征在于在目前的集群服务器、集群存储设备中利用模式方法设计来实现对硬件设备及服务的监控,将各类硬件设备及各类软件服务按预定义的模式分类,动态监控指定模式的具体硬件设备及服务信息,以此来实现服务器、存储设备的大规模动态实时监控,包括模式分析模块、设备及服务检测模块,模式分析模块分析用户填写的模式监控配置文件,并依据分析的结果即时检测系统中存在的属于用户指定模式的具体硬件设备及服务,并将具体硬件设备及服务信息填入具体设备及服务监控配置文件;设备及服务检测模块动态方式监控,动态监测硬件设备热插拔及服务迁移,并将已经改变的硬件及服务环境信息反映到具体设备监控配置文件中去,在用户改变系统硬件配置或服务迁移时,不需要自己修改配置文件。
2.根据权利要求I所述的一种基于模式匹配的集群系统监控方法,其特征在于模式分析模块用户只需要写入希望被监控的某类或某几类设备及服务在系统中的定义,模式分析模块分析该模式监控配置文件,并依据此在系统中搜索具体的满足模式监控配置文件内的模式的硬件设备及服务,并写入具体设备及服务监控配置文件,以备监控模块使用。
3.根据权利要求I所述的一种基于模式匹配的集群系统监控方法,其特征在于设备及服务检测模块是对硬件设备热插拔及服务迁移的检测及报告模块,当热插拔操作发生时,该模块可以检测到热插拔操作,得到热插拔设备的具体信息,然后按照用户配置,或者通知模式分析模块重新分析生成具体设备及服务监控配置文件或对直接修改具体设备及服务监控配置文件,并通知监控模块。
全文摘要
本发明公开了一种基于模式匹配的集群系统监控方法,属于服务器、存储监控领域,在目前的集群服务器、集群存储设备中利用模式方法设计来实现对硬件设备及服务的监控,将各类硬件设备及各类软件服务按预定义的模式分类,动态监控指定模式的具体硬件设备及服务信息,以此来实现服务器、存储设备的大规模动态实时监控,包括模式分析模块、设备及服务检测模块。本发明的一种基于模式匹配的集群系统监控方法,实现了监控的动态性、实时性、可靠性、更好的扩展能力和可管理性。
文档编号G06F11/30GK102708035SQ20121017217
公开日2012年10月3日 申请日期2012年5月30日 优先权日2012年5月30日
发明者王通 申请人:浪潮电子信息产业股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1