用于对云计算服务进行监控的系统及方法

文档序号:7887114阅读:350来源:国知局
专利名称:用于对云计算服务进行监控的系统及方法
技术领域
本发明涉及分布式计算领域,特别涉及一种用于对云计算服务进行监控的系统及方法。
背景技术
云计算(Cloud Computing)是网格计算(Grid Computing)、分布式计算 (Distributed Computing)、并行计算(Parallel Computing)、效用计算(Utility Computing) > N ^ # fit (Network Storage Technologies)、J^(Virtualization)、 负载均衡(Load Balance)等传统计算机技术和网络技术发展融合的产物。它旨在通过网络把多个成本相对较低的计算实体整合成一个具有强大计算能力的完美系统,并借助 SaaS (Software-as-a-service,软件艮口月艮务)、PaaS (Platform-as—a—Service,平台艮口服务)、IaaS (Infrastructure as a Service,基础设施即服务)、MSP (Managed Service Provider,管理服务提供商)等先进的商业模式把这强大的计算能力分布到终端用户手中。为了了解并提高云计算服务的性能,需要对云计算服务进行监控。由于云计算服务本身的特点,使得不同地域的用户访问云计算服务器时会因为网络速度不同而得到不同的服务。因此,为了准确、完整地监控云计算服务的性能,需要在很多不同的地域部署监测节点来进行监控。在现有技术中,针对诸如计算机群等分布式计算系统已经存在相应的监控系统。 这些监控系统一般部署少量的高性能的服务器作为监测节点,运营成本很高,以一个服务器费用支出为1万元/每年来计算,10万元只能最多部署10个监测节点。运营成本高的缺陷也使得监控系统中的监测节点的数量不可能很多,一个监测地点通常只有一个监测节点,这也使得整个监控系统的鲁棒性很低,一旦有监测节点发生故障,整个监控系统的监测结果就会受到影响。此外,现有的监控系统仅仅针对一般的网络服务,并没有针对云计算服务领域,因此它无法自动创建云服务节点,无法自动监控云服务节点,更无法根据监测结果自动调整云服务的性能。

发明内容
本发明的目的是现有的监控系统布设成本高、鲁棒性低,不适用于云计算服务领域的缺陷,从而提供一种成本低廉、鲁棒性高,适用于云计算服务领域的监控系统。为了实现上述目的,本发明提供了一种用于对云计算服务进行监控的系统,对包含有云服务节点的云计算服务系统进行监控;包括至少一个云管理节点,多个监测节点,至少一个主监控节点以及监测结果选择模块;其中,所述的监测节点根据从所述主监控节点所接收到的监控命令对所述云计算服务系统中的云服务节点进行监测,并将监测结果返回给所述主监控节点;所述的主监控节点用于向所述的监测节点发送监控命令,收集各个监测节点所返回的监测结果,并展示给管理员;所述的云管理节点用于提供管理功能,所述管理功能包括创建或删除所述云服务节点、主监控节点、监测节点;动态调整所述云服务节点的配置;所述的监测结果选择模块用于对监测节点所返回的监测结果进行选择,在所述主监控节点的帮助下根据需要将管理员感兴趣的监测结果展示给管理员。上述技术方案中,还包括有至少一个从监控节点,所述从监控节点为所述主监控节点的备份,当所述主监控节点发生故障时,所述从监控节点代替所述主监控节点进行工作。上述技术方案中,所述的监测节点采用虚拟主机实现,所述云服务节点至少有一个对应的监测节点。上述技术方案中,所述的主监控节点根据监控任务表向所述的监测节点发送监控命令,所述的主监控节点根据监测节点状态表从所述的多个监测节点中选择需要发送监控命令的监测节点;其中,所述的监控任务表包括所要监测的云服务节点的ID、监控类型、云服务访问信息、 监控任务启动时间、是否为重复监控任务标识、监控任务周期;所述的监测节点状态表记录了监测节点处于空闲、忙碌、故障三种状态中的哪一种。上述技术方案中,所述的从监测节点定期向主监控节点发送应答请求,当主监控节点超过一定时间持续无应答时,从监控节点通知所述云管理节点;由云管理节点删除主监控节点,并将从监控节点提升为主监控节点,最后创建一个新的从监控节点以作为备份。本发明还提供了一种应用于所述的云计算服务监控系统的云计算服务监控方法, 包括步骤1)、所述主监控节点查询监控任务表以获取监控任务;步骤2、、所述主监控节点检查监测节点状态表,根据所述监控任务的要求从所述监测节点状态表中选择能够满足监控任务的且状态为“空闲”的监测节点;步骤幻、所述主监控节点根据所述监控任务向步骤2~)得到的空闲的监测节点发送监控命令;步骤4)、所述的空闲的监测节点接收到监控命令后,向所述主监控节点返回状态 “忙碌”,并开始监测过程;步骤5)、所述的监测节点在监测过程中返回监测数据,直到满足所述监控任务的终止条件;步骤6)、所述监测节点向所述主控制节点返回监控任务完成的信息,所述主控制节点在监测节点状态表中将这些节点的状态改为“空闲”。上述技术方案中,在所述的步骤1)之前还包括在所述监控任务表中添加监控任务的步骤,该步骤包括当要为一新创建的或者已有的云服务节点设立新的监控任务时,根据所述云服务节点的类型以及管理员所设定的监控频率生成监控任务,并将该监控任务添加到所述监控任务表中。上述技术方案中,该方法还包括当一监测节点发生故障时,对故障监测节点进行冗余替换的步骤;该步骤包括所述的主监控节点将发生故障的监测节点的状态设置为“故障”,然后查找监测节点状态表,从余下的状态为“空闲”的监测节点中选择一个替代的监测节点,并向该替代的监测节点发送监控命令,由该监测节点执行监测过程。上述技术方案中,该方法还包括根据监测结果对云服务节点的性能进行调整的步骤;该步骤包括步骤101)、主监控节点检查监控结果是否符合用户需求,当不符合时,执行下一

少;步骤102)、检查是否设定了自动调节,如果有,执行下一步,否则,发出警告信息后结束操作;步骤10 、主监控节点计算出云服务节点与当前任务相适应的配置,然后将这一计算结果通知云管理节点;步骤104)、云服务节点接收到新的配置信息后,按照该信息重新配置自身的资源。本发明的优点在于1、本发明中所采用的监测节点造价低廉,用户可以在相同的成本下布设更多的监测节点,有利于提高监控效率,节省监控成本。2、当监控系统中的部分监测节点发生故障时,系统能以一定的流程来进行容错处理,不影响监控的最终效果。3、当主监控节点发生故障时,利用从监测节点,整个监控系统能自动修复,具有极强的鲁棒性。4、系统能根据监控结果自动调整云服务的性能,提高了云计算环境的性能。5、监测节点可以动态加入整个系统,使得监控过程更为灵活、高效。


图1为在一个实施例中带有本发明的云计算服务监控系统的云计算环境的示意图;图2为监测节点动态加入本发明的云计算服务监控系统的流程图;图3为本发明的云计算服务监控系统中的监测节点进行监测的流程图;图4为利用云管理节点添加监控任务的流程图;图5为从监控节点替代主监控节点的流程图;图6为对云服务节点的配置做动态调整的流程图。
具体实施例方式下面结合附图和具体实施方式
对本发明进行说明。在图1中给出了一个已有的云计算服务系统的示意图,从图中可以看出,该系统包括有N个云服务节点,每个云服务节点都为一个特定的云计算服务,如服务器、网站或者网络应用;多个云服务节点可以在一个云中(即多个云服务节点从属于同一个云服务提供商),也可以在多个云中(即多个云服务节点从属于不同的云服务提供商)。针对上述云计算服务系统,在本实施例中采用了如图1中所示的监控系统,该监控系统包括有至少一个云管理节点,M个监测节点以及至少一个主监控节点。其中,所述的云管理节点用于提供管理功能,如创建或删除所述的云服务节点、所述的监测节点以及所述的主监控节点,动态调整云服务节点的配置等;所述的监测节点根据从主监控节点所接收到的监控命令对云计算服务系统中的云服务节点进行监测,并将监测结果返回给主监控节点;所述的主监控节点用于向所述的监测节点发送监控命令,收集各个监测节点所返回的监测结果,并展示给管理员。在本实施例中,所述的监测节点采用虚拟主机作为监测节点,由于所述监测节点所要完成的工作较为简单,对计算与存储性能并无太高要求,因此可以在诸如普通的支持 Php编程语言的网页空间上实现。监测节点只需要能够通过编程语言访问hternet网络即可。每个监测节点至少有三种状态,即“空闲”、“忙碌”与“故障”。监测节点属于“空闲”状态,则标志着该监测节点实际上并未工作,即事实上未对云服务节点进行监测,此时,该监测节点会将自己的状态信息传递给主监控节点,一旦从主监控节点接收到监控命令后,该监测节点的状态就由“空闲”转为“忙碌”,进行监测数据的采集与发送。上述过程也是监测节点动态加入监测网络的过程,在图2中对这一过程做了说明。当监测节点发生故障时,该节点会进入“故障”状态,一旦发生故障,该监测节点会被其它监测节点代替。监测节点的上述状态信息会被保存在监测节点状态表中,关于监测节点状态表的详细信息会在下文中有进一步的说明。主监控节点在对各个监测节点进行控制的过程中采用了监控任务表与监测节点状态表,在下面的表1中给出了监控任务表的示意图,在下面的表2中给出了监测节点状态表的示意图。
字段说明云服务节点ID记录云服务节点的索引监控类型各种监控类型(如HTTP服务,Email服务, SSH,云服务节点CPU使用率等)云服务访问信息对每种监控类型的访问方式,包括IP地址,网络端口等监控任务启动时间何时需要启动此监控任务(现在,或者将来某个时间)是否为重复监控任务“是”或“否”,如果为重复监控任务, 则根据下面的监控任务周期来定期开始监控任务。监控任务周期重复监控任务的时间间隔。如果不是重复监控任务,此字段为空。表1
权利要求
1.一种用于对云计算服务进行监控的系统,对包含有云服务节点的云计算服务系统进行监控;其特征在于,包括至少一个云管理节点,多个监测节点,至少一个主监控节点以及监测结果选择模块;其中,所述的监测节点根据从所述主监控节点所接收到的监控命令对所述云计算服务系统中的云服务节点进行监测,并将监测结果返回给所述主监控节点;所述的主监控节点用于向所述的监测节点发送监控命令,收集各个监测节点所返回的监测结果,并展示给管理员; 所述的云管理节点用于提供管理功能,所述管理功能包括创建或删除所述云服务节点、主监控节点、监测节点;动态调整所述云服务节点的配置;所述的监测结果选择模块用于对监测节点所返回的监测结果进行选择,在所述主监控节点的帮助下根据需要将管理员感兴趣的监测结果展示给管理员。
2.根据权利要求1所述的用于对云计算服务进行监控的系统,其特征在于,还包括有至少一个从监控节点,所述从监控节点为所述主监控节点的备份,当所述主监控节点发生故障时,所述从监控节点代替所述主监控节点进行工作。
3.根据权利要求1或2所述的用于对云计算服务进行监控的系统,其特征在于,所述的监测节点采用虚拟主机实现,所述云服务节点至少有一个对应的监测节点。
4.根据权利要求1或2所述的用于对云计算服务进行监控的系统,其特征在于,所述的主监控节点根据监控任务表向所述的监测节点发送监控命令,所述的主监控节点根据监测节点状态表从所述的多个监测节点中选择需要发送监控命令的监测节点;其中,所述的监控任务表包括所要监测的云服务节点的ID、监控类型、云服务访问信息、监控任务启动时间、是否为重复监控任务标识、监控任务周期;所述的监测节点状态表记录了监测节点处于空闲、忙碌、故障三种状态中的哪一种。
5.根据权利要求2所述的用于对云计算服务进行监控的系统,其特征在于,所述的从监测节点定期向主监控节点发送应答请求,当主监控节点超过一定时间持续无应答时,从监控节点通知所述云管理节点;由云管理节点删除主监控节点,并将从监控节点提升为主监控节点,最后创建一个新的从监控节点以作为备份。
6.一种应用于权利要求1-5之一的用于对云计算服务进行监控的系统的云计算服务监控方法,包括步骤1)、所述主监控节点查询监控任务表以获取监控任务;步骤幻、所述主监控节点检查监测节点状态表,根据所述监控任务的要求从所述监测节点状态表中选择能够满足监控任务的且状态为“空闲”的监测节点;步骤幻、所述主监控节点根据所述监控任务向步骤2~)得到的空闲的监测节点发送监控命令;步骤4)、所述的空闲的监测节点接收到监控命令后,向所述主监控节点返回状态“忙碌”,并开始监测过程;步骤幻、所述的监测节点在监测过程中返回监测数据,直到满足所述监控任务的终止条件;步骤6)、所述监测节点向所述主控制节点返回监控任务完成的信息,所述主控制节点在监测节点状态表中将这些节点的状态改为“空闲”。
7.根据权利要求6所述的用于对云计算服务进行监控的方法,其特征在于,在所述的步骤1)之前还包括在所述监控任务表中添加监控任务的步骤,该步骤包括当要为一新创建的或者已有的云服务节点设立新的监控任务时,根据所述云服务节点的类型以及管理员所设定的监控频率生成监控任务,并将该监控任务添加到所述监控任务表中。
8.根据权利要求6所述的用于对云计算服务进行监控的方法,其特征在于,该方法还包括当一监测节点发生故障时,对故障监测节点进行冗余替换的步骤;该步骤包括所述的主监控节点将发生故障的监测节点的状态设置为“故障”,然后查找监测节点状态表,从余下的状态为“空闲”的监测节点中选择一个替代的监测节点,并向该替代的监测节点发送监控命令,由该监测节点执行监测过程。
9.根据权利要求6所述的用于对云计算服务进行监控的方法,其特征在于,该方法还包括根据监测结果对云服务节点的性能进行调整的步骤;该步骤包括步骤101)、主监控节点检查监控结果是否符合用户需求,当不符合时,执行下一步;步骤102)、检查是否设定了自动调节,如果有,执行下一步,否则,发出警告信息后结束操作;步骤10 、主监控节点计算出云服务节点与当前任务相适应的配置,然后将这一计算结果通知云管理节点;步骤104)、云服务节点接收到新的配置信息后,按照该信息重新配置自身的资源。
全文摘要
本发明提供一种用于对云计算服务进行监控的系统,用于对包含有云服务节点的云计算服务系统进行监控;包括至少一个云管理节点,多个监测节点,至少一个主监控节点;其中监测节点根据从主监控节点所接收到的监控命令对云计算服务系统中的云服务节点进行监测,并将监测结果返回给主监控节点;主监控节点用于向监测节点发送监控命令,收集各个监测节点所返回的监测结果,并展示给管理员;云管理节点用于提供管理功能,所述管理功能包括创建或删除所述云服务节点、主监控节点、监测节点;动态调整所述云服务节点的配置。本发明中所采用的监测节点造价低廉,用户可以在相同的成本下布设更多的监测节点,有利于提高监控效率,节省监控成本。
文档编号H04L12/24GK102546256SQ20121000873
公开日2012年7月4日 申请日期2012年1月12日 优先权日2012年1月12日
发明者张继勇, 杜佳庆 申请人:易云捷讯科技(北京)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1