一种基于cAdvisor的集群性能监测方法与流程

文档序号:11253806阅读:680来源:国知局
一种基于cAdvisor的集群性能监测方法与流程

本发明属于云计算集群管理技术领域,具体地讲涉及一种基于cadvisor的集群性能监测方法。



背景技术:

docker是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的容器中,然后发布到任何流行的linux机器上,也可以实现虚拟化。容器是完全使用沙箱机制,相互之间不会有任何接口(类似iphone的app),几乎没有性能开销,可以很容易地在机器和数据中心中运行。最重要的是,docker不依赖于任何语言、框架包括系统。

fleet是一个开源的集群级别的集群服务管理工具。用户将要启动的服务提交给fleet,由fleet对服务进行分配和管理,其中,服务以docker容器的形式运行。

cadvisor是一个运行中的守护进程,用来收集、聚合、处理和导出运行容器相关的信息,每个容器保持独立的参数、历史资源使用情况和完整的资源使用数据。cadvisor是一个用来分析运行中docker容器资源占用以及性能特性的工具,而且是一个易于设置并且非常有用的工具。cadvisor是免费还开源的,它的资源消耗也比较低。

近年来,由于云计算和大数据的快速发展,分布式云计算集群管理显得越来越重要,如何实时监测集群中的机器资源性能,给管理者的相关决策提供依据成为一个亟待解决的问题。



技术实现要素:

根据现有技术中存在的问题,本发明提供了一种基于cadvisor的集群性能监测方法,能够实时监测分布式云计算集群中机器的资源性能并将状态数据按特定需求进行展示,给分布式云计算集群管理者的相关决策提供了直观有效的依据。

本发明采用以下技术方案:

一种基于cadvisor的集群性能监测方法,其特征在于,包括如下顺序步骤:

s1,用户在基于docker容器的分布式云计算的集群中的所有机器上均安装cadvisor服务,在处于服务节点的至少一台机器上安装fleet工具;

s2,分别验证cadvisor服务和fleet工具是否安装成功,直至安装成功为止;

s3,在由云计算管理平台分配的一台机器上安装定时任务服务,在由云计算管理平台分配的一台机器上安装数据同步服务;

s4,分别启动一个定时任务服务实例和一个数据同步服务实例,并判断上述两个实例是否正常工作;若不能正常工作,则停止相应地服务实例并查明原因,重新启动新的服务实例直到其正常工作;

s5,云计算管理平台通过cadivsor服务获取集群中每台机器的性能数据,解析这些性能数据并存储到云计算管理平台的数据库中;

s6,用户通过客户端提交查询信息至云计算管理平台,云计算管理平台对照查询信息提取数据库中的相关数据至客户端,从而用户可以通过客户端获取到所需的相关数据。

优选的,验证安装cadvisor服务是否安装成功的方法是通过在浏览器中访问api接口对应的url地址,若返回机器的相关性能数据则表示cadvisior服务安装成功,返回异常信息表示安装失败;验证安装fleet工具是否安装成功的方法是通过启动fleet命令并输入查看集群机器状态命令,若返回相关信息,则表示fleet工具安装成功,返回异常信息表示安装失败。

优选的,步骤s2中验证cadvisor服务是否安装成功的方法是通过在所在机器的浏览器中访问api接口对应的url地址,若返回机器的相关性能数据则表示cadvisior服务安装成功,返回异常信息表示安装失败;验证fleet工具是否安装成功的方法是通过启动fleet工具并输入查看集群机器状态命令,若返回相关信息,则表示fleet工具安装成功,返回异常信息表示安装失败。

优选的,步骤s3中的由云计算管理平台分配是指由云计算管理平台选择集群中空闲内存多、网络顺畅、配置高的机器用来安装数据同步服务和定时任务服务。

优选的,步骤s4中所述定时任务服务用于根据设定的周期时间,定期执行收集任务,访问集群中所有机器,获取性能数据;所述数据同步服务用于将获取到的集群中所有机器的性能数据同步整理好,并同步存储到云计算管理平台的数据库中;判断同步服务实例和定时任务服务实例是否正常工作的方法是通过云计算管理平台的服务实例管理页面查看这两个实例的运行状态,若运行状态是“运行”,表示正常工作;运行状态还包括“停止”和“正在启动”。

优选的,步骤s5中通过cadivsor服务获取的性能数据经过解析后,其最小粒度是按秒级储存,通过云计算管理平台可设定保存数据的期限,过期的数据通过定时任务服务定期删除。

进一步优选的,步骤s5中存储在云计算管理平台数据库中的性能数据包括集群整体状态的性能数据和单台机器的性能数据,所述集群整体状态的性能数据和单台机器的性能数据又分为即时数据和历史变化曲线,所述集群整体状态的性能数据和单台机器的性能数据按照需求规则不同,可按秒、分、时、天进行显示。

本发明的优点和有益效果在于:

1)本发明首先在已有的集群上安装cadvisor服务和fleet工具,并安装数据同步服务和定时任务服务;通过定时任务服务定期访问集群中所有机器,通过cadvisor服务获取集群中每台机器的性能数据,再通过数据同步服务将获取到的性能数据同步整理好,并同步存储到云计算管理平台的数据库中,通过云计算管理平台传送至客户端进行展示,给分布式云计算集群管理者在做出相关决策提供了直观有效的依据。

附图说明

图1为本发明的方法流程图。

图2为本发明的实施框图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

如图1、图2所示,一种基于cadvisor的集群性能监测方法,包括如下步骤:

s1,用户在基于docker容器的分布式云计算的集群中的所有机器上均安装cadvisor服务,在处于服务节点的至少一台机器上安装fleet工具;

需要说明的是,在处于服务节点的至少一台机器上安装fleet工具包括在处于服务节点的一台机器上安装fleet工具、在处于服务节点的多台机器上安装fleet工具和在处于服务节点的所有机器上安装fleet工具这些情况,都能满足本发明的条件。

在基于docker容器的分布式云计算的集群中所有机器上安装cadvisor服务的执行命令如下:

s2,分别验证cadvisor服务和fleet工具是否安装成功,直至安装成功为止;

验证cadvisor服务是否安装成功的方法是通过在所在机器的浏览器中访问api接口对应的url地址,若返回机器的相关性能数据则表示cadvisior服务安装成功,返回异常信息表示安装失败;验证fleet工具是否安装成功的方法是通过启动fleet工具并输入查看集群机器状态命令,若返回相关信息,则表示fleet工具安装成功,返回异常信息表示安装失败。

s3,在由云计算管理平台分配的一台机器上安装定时任务服务,在由云计算管理平台分配的一台机器上安装数据同步服务;

由云计算管理平台分配是指由云计算管理平台选择集群中空闲内存多、网络顺畅、配置高的机器用来安装数据同步服务和定时任务服务;数据同步服务和定时任务服务可能安装在同一台机器上,也可能安装在不同机器上。

数据同步服务和定时任务服务安装的方式通过配置unitfile文件,从集群的镜像库中下载最新的镜像文件,并按照配置文件的相关参数启动同步服务和平台应用。配置文件如下:

s4,分别启动一个定时任务服务实例和一个数据同步服务实例,并判断上述两个实例是否正常工作;若不能正常工作,则停止相应地服务实例并查明原因,重新启动新的服务实例直到其正常工作;

所述定时任务服务用于根据设定的周期时间,定期执行收集任务,访问集群中所有机器,获取性能数据;所述数据同步服务用于通过fleet服务同步获取集群中所有机器的性能数据,并同步存储到云计算管理平台的数据库中;判断同步服务实例和定时任务服务实例是否正常工作的方法是通过云计算管理平台的服务实例管理页面查看这两个实例的运行状态,若运行状态是“运行”,表示正常工作;运行状态还包括“停止”和“正在启动”。

s5,云计算管理平台通过cadivsor服务获取集群中每台机器的性能数据,解析这些性能数据并存储到云计算管理平台的数据库中;

通过cadivsor服务获取的性能数据经过解析后,其最小粒度是按秒级储存,通过云计算管理平台可设定保存数据的期限,过期的数据通过定时任务服务定期删除。

存储在云计算管理平台数据库中的性能数据包括集群整体状态的性能数据和单台机器的性能数据,所述集群整体状态的性能数据和单台机器的性能数据又分为即时数据和历史变化曲线,所述集群整体状态的性能数据和单台机器的性能数据按照需求规则不同,可按秒、分、时、天进行显示。

s6,用户根据业务所需,通过客户端提交查询信息至云计算管理平台,云计算管理平台对照查询信息提取数据库中的相关数据至客户端,从而用户可以通过客户端获取到所需的相关数据。

综上所述,本发明首先在已有的集群上安装cadvisor服务和fleet工具,并安装数据同步服务和定时任务服务;通过定时任务服务定期访问集群中所有机器,通过cadvisor服务获取集群中每台机器的性能数据,再通过数据同步服务将获取到的性能数据同步整理好,并同步存储到云计算管理平台的数据库中,通过云计算管理平台传送至客户端进行展示,给分布式云计算集群管理者在做出相关决策提供了直观有效的依据。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1