一种对云主机进行性能监控的监控方法_3

文档序号:8339497阅读:来源:国知局
区别在于,该告警模块401设置在计算节点201中。当然也可以将告警模块401设置在计算节点202中,只要保证计算节点201或者计算节点202能够ping通控制节点40即可。
[0072]实施例四:
[0073]请参图5所示的本发明一种对云主机进行性能监控的监控系统的第三种实施例。本实施例与实施例二或实施例三的区别在于,该监控系统包括两个告警模块401a、401b。其中,告警模块401a设置在控制节点40中,告警模块401b设置在计算节点201中。当然也可以将告警模块401b设置在计算节点202中,只要保证计算节点201或者计算节点202能够ping通控制节点40即可。
[0074]在本实施例中,该站点监控模块是两个(即站点监控模块402a、402b)。站点监控模块402a设置在控制节点40中,站点监控模块402b设置在计算节点201中。显而易见的,也可以仅在计算节点201中设置站点监控模块402b,而不在控制节点40中设置站点监控模块402a。通过该监控系统,用户可以通过WEB远程选择用哪个站点监控模块(即站点监控模块402a、402b)去采集云主机的虚拟资源利用状态进行监控以获得监控数据。因此,某一计算节点201或202发生网络拥堵或者宕机时,可以通过WEB操作,经由其他健康的计算节点去进行监控数据的采集操作,因此有效地提高了用户体验。
[0075]通过本发明所示出的监控系统及其监控方法,用户可以灵活的按需制定监控项与告警策略,实现对云主机的虚拟资源利用状态的全面了解,避免当需要监控的监控项目过多时,执行监控任务的云主机Agent过多地占用云主机自身的虚拟资源。
[0076]上文所列出的一系列的详细说明仅仅是针对本发明的可行性实施方式的具体说明,它们并非用以限制本发明的保护范围,凡未脱离本发明技艺精神所作的等效实施方式或变更均应包含在本发明的保护范围之内。
[0077]对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
[0078]此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。
【主权项】
1.一种对云主机进行性能监控的监控方法,其特征在于,同时通过云主机Agent模块、计算节点Agent模块以及站点监控模块采集云主机的虚拟资源利用状态进行监控以获得监控数据,具体包括以下步骤: 51、通过计算节点Agent模块的LibvirtAPI连接到KVM虚拟机管理程序,获取当前处于运行状态的云主机列表,并调用其对应的LibvirtAPI遍历获取所有云主机的监控数据; 52、通过至少一个站点监控模块对云主机的网络可用性进行监控,并至少采用间隔地方式采集并计算云平台监控数据后保存至数据库; 53、告警模块根据用户设置的告警设置规则对步骤SI至S2中所获得的所有监控数据进行告警监控。
2.根据权利要求1所述的监控方法,其特征在于,所述步骤S2中站点监控模块对云主机进行的网络可用性监控包括HTTP监控、PING监控、TCP监控。
3.根据权利要求1或2所述的监控方法,其特征在于,所述站点监控模块部署在云平台环境中的任意计算节点上和/或云平台环境中的控制节点上。
4.根据权利要求1所述的监控方法,其特征在于,所述步骤S2中所述“至少采用间隔地方式采集并计算云平台监控数据后保存至数据库”具体为: 提取执行步骤SI后所得到的监控数据,至少采集两次计算云主机内的内存使用率、CPU利用率、磁盘读写速率以及网卡速率,并将计算结果保存至数据库。
5.根据权利要求1所述的监控方法,其特征在于,所述步骤S3中的告警设置规则包括基础项告警设置规则、网络可用性告警设置规则、进程服务端口告警设置规则。
6.根据权利要求5所述的监控方法,其特征在于,所述基础项告警规则的设置项包括云主机名称、监控项设置、统计周期、统计方法、重试几次后告警、告警通知组、告警方式。
7.根据权利要求6所述的监控方法,其特征在于,所述监控项设置包括CPU使用率、内存使用率、磁盘读写率、网络出入流量、TCP连接数、系统进程数。
8.根据权利要求5所述的监控方法,其特征在于,所述网络可用性告警规则的设置项包括监控地址、监控频率、分布检测点、重试几次后告警、响应时间阈值、告警通知组。
9.根据权利要求5所述的监控方法,其特征在于,所述进程服务端口告警规则的设置项包括云主机IP地址、监控频率、监控项名称、告知通知组。
10.根据权利要求1至9中任一项所述的监控方法,其特征在于,所述云主机Agent模块为运行在用户所访问的云主机中的采集程序,所述计算节点Agent模块为运行在计算节点中的采集程序。
11.根据权利要求10所述的监控方法,其特征在于,所述云主机Agent模块在计算节点映射一个Linux类型的套接字文件,通过所述套接字文件与计算节点进行通信,计算节点上的采集程序周期性向套接字文件发送采集监控数据的执行指令,云主机Agent模块执行监控数据的采集操作,并将采集得到的监控数据通过所述套接字文件返回至计算节点并保存至数据库中。
12.根据权利要求1、2、4、5、6、7、8、9或11中任一项所述的监控方法,其特征在于,所述数据库包括MySQL数据库、Oracle数据库。
13.一种用于对云主机进行性能监控的监控系统,其特征在于,所述监控系统包括:云主机Agent模块、计算节点Agent模块、站点监控模块、告警模块以及数据库; 并同时通过云主机Agent模块、计算节点Agent模块以及站点监控模块采集云主机的虚拟资源利用状态进行监控以获得监控数据; 所述云主机Agent模块与所述计算节点Agent模块共同对云主机的虚拟资源利用状态进行监控,LibvirtAPI连接到KVM虚拟机管理程序,获取当前处于运行状态的云主机列表,调用对应的Libvirt API遍历获取所有云主机的监控数据,通过站点监控模块对云主机的网络可用性进行监控,并至少采用间隔地方式采集并计算云平台监控数据后保存至数据库,告警模块根据用户设置的告警设置规则对监控数据进行告警监控。
14.根据权利要求13所述的监控系统,其特征在于,所述站点监控模块部署在云平台环境中的任意一台云主机上和/或云平台环境中的控制节点上,所述云主机Agent模块部署在云主机上,所述计算节点Agent模块部署在至少一个计算节点上,所述数据库部署在控制节点上,所述告警模块部署在控制节点和/或计算节点上。
【专利摘要】本发明提供了一种对云主机进行性能监控的监控系统及监控方法,所述监控方法同时通过云主机Agent模块、计算节点Agent模块以及站点监控模块采集云主机的虚拟资源利用状态进行监控以获得监控数据,通过计算节点Agent模块的Libvirt API连接到KVM虚拟机管理程序,并调用其对应的Libvirt API遍历获取所有云主机的监控数据,通过至少一个站点监控模块对云主机的网络可用性进行监控,并至少采用间隔地方式采集并计算云平台监控数据后保存至数据库,告警模块根据用户设置的告警设置规则对所有监控数据进行告警监控。通过本发明,用户可根据监控项与告警策略,全面了解云主机的可用状态,避免监控项目过多时,云主机Agent过多地占用云主机自身的虚拟资源。
【IPC分类】G06F11-30, H04L12-26
【公开号】CN104657250
【申请号】CN201410787410
【发明人】许广彬, 郭晓, 张银滨, 李德才
【申请人】无锡华云数据技术服务有限公司
【公开日】2015年5月27日
【申请日】2014年12月16日
当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1