一种云资源智能监控告警方法

文档序号:7823687阅读:693来源:国知局
一种云资源智能监控告警方法
【专利摘要】本发明公开了一种云资源智能监控告警方法,其具体实现过程包括:定义云资源实体,异构资源架构,性能采集,告警策略,其中:定义云资源实体是该方案实现云资源监控告警的前提;异构资源架构是该方案兼容各类异构虚拟化平台的核心环节;性能采集是该方案的数据采集环节;告警策略是体现本方案智能告警的环节。该一种云资源智能监控告警方法与现有技术相比,方便用户及时发现资源异常并进行修复,具备高扩展性、兼容性、适用性、科学性,实用性强。
【专利说明】一种云资源智能监控告警方法

【技术领域】
[0001]本发明涉及计算机【技术领域】,具体地说是一种实用性强、云资源智能监控告警方法。

【背景技术】
[0002]随着信息科技的发展,云计算逐步成为业界的发展热点,国内外各大厂商的云计算服务平台也开始纷纷投入到科学、教育、文化、卫生、政府、高性能计算、电子商务、物联网等多个领域进行使用。
[0003]在云计算的竞争大潮中,VMware、亚马逊、微软等厂家逐渐崭露头角,它们的产品由于具有稳定性高、性能好等优势,逐步发展成为云计算的主流虚拟化产品。然而,由于云计算缺乏统一的设计标准,不同厂家开发的虚拟化产品大相径庭,很难被统一管理、监控起来。
[0004]在云服务平台中,高效的资源监控不仅是必需的,而且已经成为企业成功的先决条件。主机、虚拟机、存储或软件出现故障,将对企业的整个经营活动产生巨大影响。
[0005]传统的云数据中心,对于不同厂商、类型的云资源,都需要进行单独的性能监控,甚至需要人工手动记录,步骤十分繁琐复杂。而且不同厂商、不同型号、不同类型的资源,监控方法截然不同,每次采集性能信息时,运维人员都需要在各个资源上进行采集,操作过程异常繁琐,更不要说统一监控管理。
[0006]为了有效的降低运维成本,统一监控异构云计算资源,更早地发现资源异常,减轻运维者在管理数据中心时的繁琐工作,现提出了一种易扩展、易开发、易维护的云数据中心资源智能监控告警方法。


【发明内容】

[0007]本发明的技术任务是针对以上不足之处,提供一种实用性强、云资源智能监控告警方法。
[0008]一种云资源智能监控告警方法,其具体实现过程为:
首先定义云资源实体:抽象各类云数据中心资源,定义虚拟控制中心、集群、虚拟数据中心、主机、存储、虚拟机六大资源实体,为各种虚拟化平台的云资源统一定义资源类型格式,分类监控和告警;
搭建异构资源架构:设置虚拟化适配器,且该架构从下到上划分为虚拟化层、虚拟化适配层、业务层三大层,对下层虚拟化层适配虚拟化类型、对上层业务层暴露统一的调用接Π ;
进行性能采集:每个采集线程只与数据库交互;当数据中心有若干资源时,配置多个采集线程共存,以降低采集压力;通过配置文件,设置每个采集线程采集的云资源实体类型,实现采集线程无状态特性及资源采集对象的自定义;
设置告警策略:设置告警阈值,达到该告警阈值时自动报警并处理。
[0009]所述定义云资源实体的具体过程为:
51、定义虚拟控制中心,即虚拟化软件的管理端;
52、定义集群,该集群为若干主机的集合;
53、定义虚拟数据中心,该虚拟数据中心为CPU、内存、存储容量的集合,即资源池;
54、定义主机,该主机位安装虚拟化操作系统的物理机;
55、定义存储,该存储为挂载在主机上,保存虚拟机磁盘文件的数据存储设备;
56、定义虚拟机,该虚拟机为运行在主机上的,用软件模拟的计算机系统。
[0010]所述异构管理架构中,虚拟化层包含各虚拟化厂商的接口 API,通过调用API,采集各类资源的性能信息;虚拟化适配层对下层虚拟化层的虚拟化资源接口进行封装,并对上层业务层暴露统一的资源管理接口,实现异构虚拟化适配的功能;业务层通过调用下层虚拟化适配层提供的统一接口,实现虚拟控制中心、集群、虚拟数据中心、主机、存储、虚拟机各类云资源的性能监控。
[0011]所述性能采集是云资源监控的数据采集环节,其具体实现过程为:
1)对每个性能采集线程初始化,通过读取配置文件中的配置属性,确定本线程采集的资源实体类型;通过修改配置文件,动态调配各采集线程的监控实体;
2)为每个采集线程配备守护线程,采集线程与守护线程定时相互检测对方状态,一方宕掉后,另一方将其重启;
3)采集线程定时采集性能信息并直接保存到性能数据库;
4)其余API服务器直接调用业务层的接口管理数据库中的信息,与底层采集线程解率禹。
[0012]所述告警策略详细设置过程为:
设置各类资源各类监测项的告警阈值设置,且告警比对符设置大于、小于或等于某个阈值;
告警处理程序在性能数据库中读取资源性能数据,与相应资源类型的监控项阈值进行比对;
性能数据符合告警阈值时,仅记录最高级别的告警信息,更新到实时告警数据库中;
性能数据不符合告警阈值时,自动确认之前保存的实时告警信息,并移至历史告警中记录;
上述告警记录表中只保存告警参数,不保存告警详情,以缓解数据库存储压力。
[0013]本发明的一种云资源智能监控告警方法,具有以下优点:
该发明的一种云资源智能监控告警方法通过引入虚拟化适配器,将异构厂商、型号的云计算资源进行抽象,在上层统一监控管理。屏蔽底层资源的差异,使得运维人员不必关心底层资源的具体情况,直接通过界面操作即可监控管理整个云数据中心的资源,管理更加简便快捷;通过智能的告警策略和数据分析,方便用户及时发现资源异常并进行修复,简单、通用、科学、实用;易于推广。

【专利附图】

【附图说明】
[0014]附图1为本方法的系统架构图。
[0015]附图2为云资源实体示意图。
[0016]附图3为异构管理层次图。
[0017]附图4为性能采集流程示意图。
[0018]附图5为守护线程示意图。
[0019]附图6为告警流程图。
[0020]附图7为告警阈值表。
[0021]附图8为告警记录表。

【具体实施方式】
[0022]下面结合附图和具体实施例对本发明作进一步说明。
[0023]本发明提出一种云资源智能监控告警方法,通过引入自主设计的异构资源适配器,将不同厂商、品牌、类型的云资源接口进行封装,对外暴露统一的管理接口,屏蔽虚拟化层差异,节省系统运维成本;通过使用智能的告警策略和数据分析方法,方便用户及时发现资源异常并进行修复,具备高扩展性、兼容性、适用性、科学性。
[0024]如附图1所示,其具体实现过程为:
首先定义云资源实体:抽象各类云数据中心资源,定义虚拟控制中心、集群、虚拟数据中心、主机、存储、虚拟机六大资源实体,为各种虚拟化平台的云资源统一定义资源类型格式,分类监控和告警;
搭建异构资源架构:设置虚拟化适配器,且该架构从下到上划分为虚拟化层、虚拟化适配层、业务层三大层,对下层虚拟化层适配虚拟化类型、对上层业务层暴露统一的调用接口,实现对各种虚拟化平台的无缝兼容;
进行性能采集:每个采集线程只与数据库交互,具有无状态特性;对于资源多的数据中心,可以配置多个采集线程共存,以降低采集压力;通过配置文件,可设置每个采集线程采集的云资源实体类型,使得性能采集过程更加简单化、灵活化;
设置告警策略:通过灵活的告警阈值策略,实现对不同资源类型、不同监测项的告警阈值设置;通过自动的告警发现、处理机制,便于用户及时发现并解决资源异常。
[0025]其中,定义云资源实体描述云数据中心的监控资源集合,是该方案的实施基础。通过广泛调研各大云计算厂商的虚拟化产品,将云资源实体划分为六大类:虚拟控制中心、集群、虚拟数据中心、主机、存储、虚拟机。如附图2,各实体定义如下:
S1虚拟控制中心:虚拟化软件的管理端,如VMware的vCenter Server ;
S2集群:若干主机的集合;
S3虚拟数据中心:CPU、内存、存储容量的集合,即资源池;
S4主机:安装虚拟化操作系统的物理机;
S5存储:挂载在主机上,保存虚拟机磁盘文件的数据存储;
S6虚拟机:运行在主机上的,用软件模拟的计算机系统。
[0026]异构管理架构实现统一管理异构资源的功能,是本发明的基础系统架构。如附图3,整个资源监控架构从下到上划分为虚拟化层、虚拟化适配层、业务层三大层,其中各层次的功能职责如下:
S1虚拟化层:包含各虚拟化厂商的接口 API,通过调用API,采集各类资源的性能信息; S2虚拟化适配层:对下层(虚拟化层)的虚拟化资源接口进行封装,并对上层(业务层)暴露统一的资源管理接口,实现异构虚拟化适配的功能;
S3业务层:通过调用下层(虚拟化适配层)提供的统一接口,实现虚拟控制中心、集群、虚拟数据中心、主机、存储、虚拟机等各类云资源的性能监控。
[0027]性能采集是云资源监控的数据采集环节,其实现流程示意图如附图4:
S1对于每个性能采集线程,初始化时通过读取配置文件中的配置属性,确定本线程采集的资源实体类型。通过修改配置文件,可以动态调配各采集线程的监控实体,灵活易扩展;
S2如附图5,采用双保险的守护策略,为每个采集线程配备守护线程,采集线程与守护线程定时相互检测对方状态,一方宕掉后,另一方将其重启,达到高可靠效果;
S3采集线程定时采集性能信息并直接保存到性能数据库,具有无状态的特性,因此可实现多采集线程的共存、多活;
S4 Rest API Server直接调用业务层的接口管理数据库中的信息,与底层采集线程解率禹。
[0028]告警策略是体现本方案智能、自动告警的环节。如附图6,告警流程如下:
S1如附图7的告警阈值表,本方案提供灵活的告警策略,支持各类资源各类监测项的告警阈值设置,且告警比对符可设置大于、小于或等于某个阈值;
S2告警处理程序在性能数据库中读取资源性能数据,与相应资源类型的监控项阈值进行比对;
S3性能数据符合告警阈值时,仅记录最高级别的告警信息,更新到实时告警数据库中;
S4性能数据不符合告警阈值时,自动确认之前保存的实时告警信息,并移至历史告警中记录;
S5如附图8,告警记录表中只保存告警参数,不保存告警详情,以缓解数据库存储压力。
[0029]上述【具体实施方式】仅是本发明的具体个案,本发明的专利保护范围包括但不限于上述【具体实施方式】,任何符合本发明的一种云资源智能监控告警方法的权利要求书的且任何所述【技术领域】的普通技术人员对其所做的适当变化或替换,皆应落入本发明的专利保护范围。
【权利要求】
1.一种云资源智能监控告警方法,其特征在于,其具体实现过程为: 首先定义云资源实体:抽象各类云数据中心资源,定义虚拟控制中心、集群、虚拟数据中心、主机、存储、虚拟机六大资源实体,为各种虚拟化平台的云资源统一定义资源类型格式,分类监控和告警; 搭建异构资源架构:设置虚拟化适配器,且该架构从下到上划分为虚拟化层、虚拟化适配层、业务层三大层,对下层虚拟化层适配虚拟化类型、对上层业务层暴露统一的调用接Π ; 进行性能采集:每个采集线程只与数据库交互;当数据中心有若干资源时,配置多个采集线程共存,以降低采集压力;通过配置文件,设置每个采集线程采集的云资源实体类型,实现采集线程无状态特性及资源采集对象的自定义; 设置告警策略:设置告警阈值,达到该告警阈值时自动报警并处理。
2.根据权利要求1所述的一种云资源智能监控告警方法,其特征在于,所述定义云资源实体的具体过程为: 51、定义虚拟控制中心,即虚拟化软件的管理端; 52、定义集群,该集群为若干主机的集合; 53、定义虚拟数据中心,该虚拟数据中心为CPU、内存、存储容量的集合,即资源池; 54、定义主机,该主机位安装虚拟化操作系统的物理机; 55、定义存储,该存储为挂载在主机上,保存虚拟机磁盘文件的数据存储设备; 56、定义虚拟机,该虚拟机为运行在主机上的,用软件模拟的计算机系统。
3.根据权利要求1所述的一种云资源智能监控告警方法,其特征在于,所述异构管理架构中,虚拟化层包含各虚拟化厂商的接口 API,通过调用API,采集各类资源的性能信息;虚拟化适配层对下层虚拟化层的虚拟化资源接口进行封装,并对上层业务层暴露统一的资源管理接口,实现异构虚拟化适配的功能;业务层通过调用下层虚拟化适配层提供的统一接口,实现虚拟控制中心、集群、虚拟数据中心、主机、存储、虚拟机各类云资源的性能监控。
4.根据权利要求1所述的一种云资源智能监控告警方法,其特征在于,所述性能采集是云资源监控的数据采集环节,其具体实现过程为: 1)对每个性能采集线程初始化,通过读取配置文件中的配置属性,确定本线程采集的资源实体类型;通过修改配置文件,动态调配各采集线程的监控实体; 2)为每个采集线程配备守护线程,采集线程与守护线程定时相互检测对方状态,一方宕掉后,另一方将其重启; 3)采集线程定时采集性能信息并直接保存到性能数据库; 4)其余API服务器直接调用业务层的接口管理数据库中的信息,与底层采集线程解率禹。
5.根据权利要求1所述的一种云资源智能监控告警方法,其特征在于,所述告警策略详细设置过程为: 设置各类资源各类监测项的告警阈值设置,且告警比对符设置大于、小于或等于某个阈值; 告警处理程序在性能数据库中读取资源性能数据,与相应资源类型的监控项阈值进行比对; 性能数据符合告警阈值时,仅记录最高级别的告警信息,更新到实时告警数据库中; 性能数据不符合告警阈值时,自动确认之前保存的实时告警信息,并移至历史告警中记录; 上述告警记录表中只保存告警参数,不保存告警详情,以缓解数据库存储压力。
【文档编号】H04L29/08GK104410535SQ201410806959
【公开日】2015年3月11日 申请日期:2014年12月23日 优先权日:2014年12月23日
【发明者】吕广杰, 刘正伟, 朱波 申请人:浪潮电子信息产业股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1