基于集群监控分析计算设备可用性的方法及装置的制造方法_4

文档序号:9202743阅读:来源:国知局
/或框图和/或流图中的每个框以及这些结构图和/或框图和/或流图中的框的组合。本技术领域技术人员可以理解,可以将这些计算机程序指令提供给通用计算机、专业计算机或其他可编程数据处理方法的处理器来实现,从而通过计算机或其他可编程数据处理方法的处理器来执行本发明公开的结构图和/或框图和/或流图的框或多个框中指定的方案。
[0090]本技术领域技术人员可以理解,本发明中已经讨论过的各种操作、方法、流程中的步骤、措施、方案可以被交替、更改、组合或删除。进一步地,具有本发明中已经讨论过的各种操作、方法、流程中的其他步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。进一步地,现有技术中的具有与本发明中公开的各种操作、方法、流程中的步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。
[0091]以上所述仅是本发明的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
【主权项】
1.一种基于集群监控分析计算设备可用性的方法,其特征在于,包括: 监控并采集多台计算设备在预定时长内多个预定监控项的监控数据; 对在所述预定时长内每台计算设备的每个预定监控项的监控数据进行分析处理,确定每台计算设备的监控分析结果;以及 根据所述监控分析结果,确定所述多台计算设备的可用性信息,以用于将数据业务分配至可用的计算设备。2.根据权利要求1所述的基于集群监控分析计算设备可用性的方法,其中,所述预定监控项包括以下一项或多项: CPU负载率;可用磁盘容量;每秒I/O数量;网络流量;内存占用率。3.根据权利要求1或2任一项所述的基于集群监控分析计算设备可用性的方法,其中,对在所述预定时长内每台计算设备的每个预定监控项的监控数据进行分析处理,确定每台计算设备的监控分析结果,进一步包括: 对在所述预定时长内每台计算设备的每个预定监控项的监控数据进行计算处理,确定与每个预定监控项相应的测评值;以及 将与每个预定监控项相应的测评值与该预定监控项的预设阈值进行比较,确定每台计算设备基于多个预定监控项的监控分析结果。4.根据权利要求3所述的基于集群监控分析计算设备可用性的方法,其中,对在所述预定时长内每台计算设备的每个预定监控项的监控数据进行计算处理,确定与每个预定监控项相应的测评值,具体包括以下至少一种情形: 对采集到的所述预定时长内CPU负载率进行平均值计算,确定相应的测评值为CPU负载率平均值; 对采集到的所述预定时长内可用磁盘容量进行最大值计算,确定相应测评值为可用磁盘容量最大值; 对采集到的所述预定时长内每秒I/o数量进行平均值计算,确定相应的测评值为每秒I/o平均值; 对采集到的所述预定时长内网络流量进行最大值计算,确定相应的测评值为网络流量最大值; 对采集到的所述预定时长内内存占用率进行最大值计算,确定相应的测评值为内存占用率最大值。5.根据权利要求4所述的基于集群监控分析计算设备可用性的方法,其中,将与每个预定监控项相应的测评值与该预定监控项的预设阈值进行比较,确定每台计算设备基于多个预定监控项的监控分析结果,具体包括以下至少一项: 当CPU负载率平均值大于CPU负载率阈值时,该计算设备的CPU负载率属于非正常状态; 当可用磁盘容量最大值小于磁盘容量阈值时,该计算设备的可用磁盘容量属于非正常状态; 当每秒I/O平均值大于I/O阈值时,该计算设备的每秒I/O数量属于非正常状态; 当网络流量最大值大于网络流量阈值时,该计算设备的网络流量属于非正常状态; 当内存占用率最大值大于内存占用率阈值时,该计算设备的内存属于非正常状态。6.一种基于集群监控分析计算设备可用性的装置,其特征在于,包括: 监控采集模块,用于监控并采集多台计算设备在预定时长内多个预定监控项的监控数据; 分析模块,用于对在所述预定时长内每台计算设备的每个预定监控项的监控数据进行分析处理,确定每台计算设备的监控分析结果; 可用性确定模块,用于根据所述监控分析结果,确定所述多台计算设备的可用性信息,以用于将数据业务分配至可用的计算设备。7.根据权利要求6所述的基于集群监控分析计算设备可用性的装置,其中,所述预定监控项以下至少任一项包括: CPU负载率;可用磁盘容量;每秒I/O数量;网络流量;内存占用率。8.根据权利要求6或7所述的基于集群监控分析计算设备可用性的装置,其中,所述分析模块进一步包括: 计算单元,用于对在所述预定时长内每台计算设备的每个预定监控项的监控数据进行计算处理,确定与每个预定监控项相应的测评值; 比较单元,用于将与每个预定监控项相应的测评值与该预定监控项的预设阈值进行比较,确定每台计算设备基于多个预定监控项的监控分析结果。9.根据权利要求8所述的基于集群监控分析计算设备可用性的装置,其中,所述计算单元具体用于以下至少一种情形: 对采集到的所述预定时长内CPU负载率进行平均值计算,确定相应的测评值为CPU负载率平均值; 对采集到的所述预定时长内可用磁盘容量进行最大值计算,确定相应测评值为可用磁盘容量最大值; 对采集到的所述预定时长内每秒I/o数量进行平均值计算,确定相应的测评值为每秒I/o平均值; 对采集到的所述预定时长内网络流量进行最大值计算,确定相应的测评值为网络流量最大值; 对采集到的所述预定时长内内存占用率进行最大值计算,确定相应的测评值为内存占用率最大值。10.根据权利要求9所述的基于集群监控分析计算设备可用性的装置,其中,所述比较单元具体用于以下至少一种情形: 当CPU负载率平均值大于CPU负载率阈值时,该计算设备的CPU负载率属于非正常状态; 当可用磁盘容量最大值小于磁盘容量阈值时,该计算设备的可用磁盘容量属于非正常状态; 当每秒I/O平均值大于I/O阈值时,该计算设备的每秒I/O数量属于非正常状态; 当网络流量最大值大于网络流量阈值时,该计算设备的网络流量属于非正常状态; 当内存占用率最大值大于内存占用率阈值时,该计算设备的内存属于非正常状态。
【专利摘要】本发明提供了一种基于集群监控分析计算设备可用性的方法,包括:监控并采集多台计算设备在预定时长内多个预定监控项的监控数据;对在预定时长内每台计算设备的每个预定监控项的监控数据进行分析处理,确定每台计算设备的监控分析结果;根据监控分析结果,确定多台计算设备的可用性信息,以用于将数据业务分配至可用的计算设备。本发明中,根据机器可用性信息可为后续对数据业务进行合理的分配提供可靠保证,确保数据业务快速且合理地分配,提升系统的自动化运维水平,节约人力成本。
【IPC分类】H04L29/08
【公开号】CN104917836
【申请号】CN201510316693
【发明人】杨挺
【申请人】北京奇虎科技有限公司, 奇智软件(北京)有限公司
【公开日】2015年9月16日
【申请日】2015年6月10日
当前第4页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1