一种基于云数据中心的分层式资源监控方法

文档序号:7822890阅读:651来源:国知局
一种基于云数据中心的分层式资源监控方法
【专利摘要】本发明公开了一种基于云数据中心的分层式资源监控方法,其具体实现过程为:设置资源类型管理模块、资源类型分层模块、资源监控模块和资源故障定位模块,其中资源故障定位模块按层对监控信息进行分析,采集自上而下、逐层循环的方式查找到最根本的故障原因,实现对云数据中心中的设备资源的细粒度监控、精细化分析和准确的资源故障原因定位。该一种基于云数据中心的分层式资源监控方法与现有技术相比,有效提高了数据中心监控故障定位的效率,实现对云数据中心中的设备资源的细粒度监控、精细化分析和准确的资源故障原因定位,在大规模云数据中心的监控应用中,具有很高的技术价值。
【专利说明】一种基于云数据中心的分层式资源监控方法

【技术领域】
[0001]本发明涉及计算机监控【技术领域】,具体地说是一种实用性强、基于云数据中心的分层式资源监控方法。

【背景技术】
[0002]随着互联网的飞速发展,大规模的云数据中心越来越成为现代社会发展的需要。这就为数据中心的监控难度带来巨大挑战,一个拥有几万资源的云数据中心的监控难度已非常大,更何况目前的发展趋势下几十万资源、甚至几百万资源的云数据中心正在逐步产生。现有技术的资源监控系统如附图1所示,一个具有十万资源的数据中心的监控,用传统的资源监控方式已经无法满足,往往造成管理员每天收到成千上万条故障告警,但其中大部分为假故障,无法准确地定位到故障原因,浪费了大量的人力物力,也使数据中心管理员一直处于超负荷运转中。并且,由于监控的设备、机房等资源类型划分不明确,监控项目无法进行细粒度设计,导致监控不能精细化、细致化和准确化。以上挑战为大规模云数据中心的监控时故障问题的定位、故障问题原因的分析等均带来了极大的局限性,严重影响大规模云数据中心监控的发展,基于此,现提供一种可解决上述问题、基于云数据中心的分层式资源监控方法,实现对云数据中心中的设备资源的细粒度监控、精细化分析和准确的资源故障原因定位。


【发明内容】

[0003]本发明的技术任务是针对以上不足之处,提供一种实用性强、基于云数据中心的分层式资源监控方法。
[0004]一种基于云数据中心的分层式资源监控方法,其具体实现过程为:
设置资源类型管理模块、资源类型分层模块、资源监控模块、资源故障定位模块;其中:
资源管理模块,用于建立基于云数据中心的资源类型分层模块;
资源类型分层模块,基于资源类型库,将不同用途的资源类型进行按层次划分,生成以资源层级为依据的分层资源类型库,然后再以分层资源类型的方式去分析、处理资源监控信息,查找资源故障原因的过程;
资源监控模块设计,将物理设备、虚拟资源和应用系统以资源的角度分成不同的资源类型进行监控,然后以此种角度进行各种类型资源的数据采集,完成监控;
资源故障定位模块,当资源进行监控时出现了故障后,资源监控模块采集完成监控信息,按层对监控信息进行分析,当故障所在资源类型层不是最下边的层时,逐层的进行向下查找,直到找到最根本的故障原因;当故障所在资源类型层向下的各层均运行正常时,则可确定当前层中的故障原因即为此次故障的根本原因。
[0005]所述的分层资源类型库自上而下划分为Web服务层、数据库应用层、操作系统层、虚拟资源层、网络设备层、硬件资源层和机房环境层,每层负责一个业务应用运行时自上而下的不同部分。
[0006]所述资源故障的逐层故障定位采用自上而下、逐层循环的方式,即当第一层资源监控不正常时,先查找其下各层中是否有不正常的资源存在,若没有,则直接确定此次故障的根本原因即为第一层资源的问题;若有,则进行第二层资源查找,依此类推,直到定位到故障根本原因。
[0007]本发明的一种基于云数据中心的分层式资源监控方法,具有以下优点:
该发明的一种基于云数据中心的分层式资源监控方法解决了传统的资源监控方式使管理员每天收到成千上万条假故障告警,无法准确地定位到故障原因,浪费了大量的人力物力的问题;大大提高了资源监控中故障定位的真实性和准确性,避免了因各资源类型之间相对独立监控时的故障误报或监控不到根本故障原因的问题,最终实现了当云数据中心中的资源监控到故障后,可以逐级、逐层的按资源类型层详细地、明确地查找定位到故障原因,便于故障的分析和解决,实用性强,适用范围广泛,易于推广。

【专利附图】

【附图说明】
[0008]附图1为现有的资源监控原理示意图。
[0009]附图2为本发明的资源类型分层模块示意图。
[0010]附图3为本发明的资源故障定位模块示意图。
[0011 ] 附图4为本发明的分层式资源监控示意图。

【具体实施方式】
[0012]下面结合附图和具体实施例对本发明作进一步说明。
[0013]本发明提供一种基于云数据中心的分层式资源监控方法,充分发挥资源类型可按层划分的特点,运用资源故障逐层依赖、自上而下关联的机制,采用资源类型管理模块和资源类型分层模块,以及资源监控模块和资源故障定位模块相结合的设计方法,实现资源监控按类型划分后,再由资源类型分层模块进行按层划分,组成自上而下依赖存在的监控体系。当资源进行监控时出现了故障后,资源故障定位模块先由故障基本信息开始,逐层进行故障定位,直到查找出真正的故障原因。采用这种以资源类型库为基础生成分层资源类型库,然后再按层次分析各资源类型层采集到的监控信息,定位出最根本故障原因,从而大大提高了资源监控中故障定位的真实性和准确性。如附图2、图3、图4所示,其具体实现过程为:
设置资源类型管理模块、资源类型分层模块、资源监控模块、资源故障定位模块;其中:
资源管理模块,用于建立基于云数据中心的资源类型分层模块;
资源类型分层模块,基于资源类型库,将不同用途的资源类型进行按层次划分,生成以资源层级为依据的分层资源类型库,然后再以分层资源类型的方式去分析、处理资源监控信息,查找资源故障原因的过程;
资源监控模块设计,将物理设备、虚拟资源和应用系统以资源的角度分成不同的资源类型进行监控,然后以此种角度进行各种类型资源的数据采集,完成监控;比如将一台Oracle数据库服务器分为Oracle数据库、Windows操作系统、网络交换机、小型机和所在机房运行环境等资源类型,然后以此种角度去进行各种类型资源的数据采集,最终经过灵活的、精细化的分析处理后实现对此Oracle数据库服务器的完整监控。
[0014]资源故障定位模块,当资源进行监控时出现了故障后,资源监控模块采集完成监控信息,按层对监控信息进行分析,当故障所在资源类型层不是最下边的层时,逐层的进行向下查找,直到找到最根本的故障原因;当故障所在资源类型层向下的各层均运行正常时,则可确定当前层中的故障原因即为此次故障的根本原因。
[0015]所述的分层资源类型库自上而下划分为Web服务层、数据库应用层、操作系统层、虚拟资源层、网络设备层、硬件资源层和机房环境层,每层负责一个业务应用运行时自上而下的不同部分。
[0016]所述资源故障的逐层故障定位采用自上而下、逐层循环的方式,即当第一层资源监控不正常时,先查找其下各层中是否有不正常的资源存在,若没有,则直接确定此次故障的根本原因即为第一层资源的问题;若有,则进行第二层资源查找,依此类推,直到定位到故障根本原因。
[0017]下面结合附图对本发明的内容以分层式监控一个拥有30种资源类型的云数据中心为例,采用30种资源类型划分为6种资源类型层的方式来描述这一设计方法的实现过程。
[0018]基于云数据中心的分层式资源监控方法设计包括:资源类型管理模块、资源类型分层模块、资源监控模块和资源故障定位模块,如图4所示,首先,资源类型管理模块建立该云数据中心的资源类型库,其中包括Apache/Tomcat Web服务器、0racle/DB2数据库应用、Windows/Linux操作系统、Vmware/Xen虚拟资源、Cisco/H3C网络设备和IBM/ΗΡ服务器等30种资源类型。然后,资源类型分层模块将这30种资源类型划分为自上而下的Web服务层、数据库应用层、操作系统层、虚拟资源层、网络设备层和硬件资源层共七层资源类型层,组成该云数据中心的分层资源类型库。由资源监控模块调动数据中心内各种类型资源完成监控数据采集后,当有问题产生时,便产生相应的资源故障信息,再由资源故障定位模块按照自上而下、逐层循环查找的原则,对各分层资源进行逐级定位,当硬件资源层资源有故障时,可以直接定位故障原因为硬件资源;当网络设备层资源有故障时,则需要自上而下查找了网络设备层和硬件资源层后才能确定最根本的故障原因;当虚拟资源层有故障时,则需要自上而下查找了虚拟资源层、网络设备层和硬件资源层后才能确定最根本的故障原因;以此类推,该云数据中心中的资源故障信息均可逐层完成故障定位和故障原因分析。
[0019]上述【具体实施方式】仅是本发明的具体个案,本发明的专利保护范围包括但不限于上述【具体实施方式】,任何符合本发明的一种基于云数据中心的分层式资源监控方法的权利要求书的且任何所述【技术领域】的普通技术人员对其所做的适当变化或替换,皆应落入本发明的专利保护范围。
【权利要求】
1.一种基于云数据中心的分层式资源监控方法,其特征在于,其具体实现过程为: 设置资源类型管理模块、资源类型分层模块、资源监控模块、资源故障定位模块;其中: 资源管理模块,用于建立基于云数据中心的资源类型分层模块; 资源类型分层模块,基于资源类型库,将不同用途的资源类型进行按层次划分,生成以资源层级为依据的分层资源类型库,然后再以分层资源类型的方式去分析、处理资源监控信息,查找资源故障原因的过程; 资源监控模块设计,将物理设备、虚拟资源和应用系统以资源的角度分成不同的资源类型进行监控,然后以此种角度进行各种类型资源的数据采集,完成监控; 资源故障定位模块,当资源进行监控时出现了故障后,资源监控模块采集完成监控信息,按层对监控信息进行分析,当故障所在资源类型层不是最下边的层时,逐层的进行向下查找,直到找到最根本的故障原因;当故障所在资源类型层向下的各层均运行正常时,则可确定当前层中的故障原因即为此次故障的根本原因。
2.根据权利要求1所述的一种基于云数据中心的分层式资源监控方法,其特征在于,所述的分层资源类型库自上而下划分为Web服务层、数据库应用层、操作系统层、虚拟资源层、网络设备层、硬件资源层和机房环境层,每层负责一个业务应用运行时自上而下的不同部分。
3.根据权利要求1所述的一种基于云数据中心的分层式资源监控方法,其特征在于,所述资源故障的逐层故障定位采用自上而下、逐层循环的方式,即当第一层资源监控不正常时,先查找其下各层中是否有不正常的资源存在,若没有,则直接确定此次故障的根本原因即为第一层资源的问题;若有,则进行第二层资源查找,依此类推,直到定位到故障根本原因。
【文档编号】H04L29/08GK104486406SQ201410769643
【公开日】2015年4月1日 申请日期:2014年12月15日 优先权日:2014年12月15日
【发明者】陆峰, 刘成平, 李锋 申请人:浪潮电子信息产业股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1