基于集群监控分配数据业务方法及装置的制造方法

文档序号:9202550阅读:331来源:国知局
基于集群监控分配数据业务方法及装置的制造方法
【技术领域】
[0001]本发明涉及计算机技术领域,具体而言,本发明涉及一种基于集群监控分配数据业务方法及装置。
【背景技术】
[0002]集群是一组相互独立的、通过高速网络互联的计算机,它们构成了一个组,并以单一系统的模式加以管理。当集群为服务器集群时,指将网络中的若干服务器集中起来执行同一种服务、对外部相当于一个服务器的技术,具有高扩展、高可用、高性价比等特点。
[0003]集群中的每台服务器承载相应的数据业务,现有技术在集群内分配数据业务的过程中,为了节约成本,在机器压力允许的条件下,会采用在单机器上放置尽量多数据业务的策略,以确保资源利用最大化。但是,对机器分配数据业务并运行一段时间之后,承载在机器中的数据业务由于运行趋于稳定或版本升级等原因,可能会使得运行时间缩短,因此可产生硬件资源空闲的情况。因此,仅根据每台机器上承载的数据业务量多少判断该机器是否可用的方式不能准确且合理的对数据业务进行分配,由此可能产生硬件资源浪费、分配不合理等问题。

【发明内容】

[0004]为克服上述技术问题或者至少部分地解决上述技术问题,特提出以下技术方案:
[0005]本发明的实施例提出了一种基于集群监控分配数据业务的方法,包括:
[0006]以预定监控频率监控并采集在预定时长内多台计算设备多个预定监控项的监控数据,其中,每台计算设备各自承载相应的数据业务;
[0007]基于预定时间间隔对采集到的在预定时长内每台计算设备的每个预定监控项的监控数据进行分析处理,确定每台计算设备的监控分析结果;
[0008]根据监控分析结果,确定在预定时长内所述多台计算设备基于预定时间间隔的可用性信息;以及
[0009]根据基于预定时间间隔的可用性信息,重新分配每台计算设备各自承载的数据业务。
[0010]本发明的另一实施例提出了一种基于集群监控分配数据业务的装置,包括:
[0011 ] 监控模块,用于以预定监控频率监控并采集在预定时长内多台计算设备多个预定监控项的监控数据,其中,每台计算设备各自承载相应的数据业务;
[0012]分析模块,用于基于预定时间间隔对采集到的在预定时长内每台计算设备的每个预定监控项的监控数据进行分析处理,确定每台计算设备的监控分析结果;
[0013]可用性确定模块,用于根据监控分析结果,确定在预定时长内多台计算设备基于预定时间间隔的可用性信息;以及
[0014]业务分配模块,用于根据基于预定时间间隔的可用性信息,重新分配每台计算设备各自承载的数据业务。
[0015]本发明的实施例中,通过对集群式计算设备中的每台机器设备的多项预定监控项进行监控,并对不同类型的预定监控项的监控数据进行不同的分析来判断机器的可用性信息,根据基于时间特性的机器的可用性信息对集群中多台计算设备所承载的数据业务重新进行合理的分配,确保数据业在已有计算设备中的合理分配,对多台计算机器分配数据业务并运行一段时间之后,可重新调整分配计算设备各自承载的数据业务,提升系统的自动化运维水平,节约人力成本。
[0016]本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。
【附图说明】
[0017]本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
[0018]图1为本发明中基于集群监控分配数据业务的方法一个实施例的流程示意图;
[0019]图2为本发明中基于集群监控分配数据业务的方法一个优选实施例的流程示意图
[0020]图3为本发明中基于集群监控分配数据业务的装置一个实施例的结构示意图;
[0021]图4为本发明中基于集群监控分配数据业务的装置一个优选实施例的结构示意图。
【具体实施方式】
[0022]下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
[0023]本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
[0024]本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
[0025]在上下文中所称“计算设备”,也称为“电脑”,是指可以通过运行预定程序或指令来执行数值计算和/或逻辑计算等预定处理过程的智能电子设备,其可以包括处理器与存储器,由处理器执行在存储器中预存的存续指令来执行预定处理过程,或是由ASIC、FPGA、DSP等硬件执行预定处理过程,或是由上述二者组合来实现。计算设备包括但不限于服务器、个人电脑、笔记本电脑、平板电脑、智能手机等。
[0026]本发明的实施例中,所述计算设备可为网络服务器,所述多个计算设备可组成的服务器组或大规模服务器集群。
[0027]图1为本发明中基于集群监控分配数据业务的方法一个实施例的流程示意图。
[0028]步骤SllO:以预定监控频率监控并采集在预定时长内多台计算设备多个预定监控项的监控数据,其中,每台计算设备各自承载相应的数据业务;步骤S120:基于预定时间间隔对采集到的在预定时长内每台计算设备的每个预定监控项的监控数据进行分析处理,确定每台计算设备的监控分析结果;步骤S130:根据监控分析结果,确定在预定时长内多台计算设备基于预定时间间隔的可用性信息;步骤S140:根据基于预定时间间隔的可用性信息,重新分配每台计算设备各自承载的数据业务。
[0029]本发明的实施例中,通过对集群式计算设备中的每台机器设备的多项预定监控项进行监控,并对不同类型的预定监控项的监控数据进行不同的分析来判断机器的可用性信息,根据基于时间特性的机器的可用性信息对集群中多台计算设备所承载的数据业务重新进行合理的分配,确保数据业在已有计算设备中的合理分配,对多台计算机器分配数据业务并运行一段时间之后,可重新调整分配计算设备各自承载的数据业务,提升系统的自动化运维水平,节约人力成本。
[0030]步骤SllO:以预定监控频率监控并采集在预定时长内多台计算设备多个预定监控项的监控数据,其中,每台计算设备各自承载相应的数据业务。
[0031]每台计算设备可承载相应的一种或多种数据业务,为前端服务器提供数据服务支持。
[0032]其中,监控并采集监控数据的方式包括但不限于:
[0033]ganglia监控方式;zabbix监控方式;nag1s监控方式。
[0034]其中,预定监控项包括但不限于:
[0035]CPU负载率;可用磁盘容量;1/0数量,即每秒对磁盘读写总次数;网络流量;内存占用率。
[0036]在此,预定监控项可为管理员在监控之前根据监控需求预先设置的。
[0037]例如,通过ganglia监控方式,以每30分钟一次的预定监控频率监控并采集在3个月内多台计算设备的CPU负载率、可用磁盘容量、I/O数量、网络流量及内存占用率等多个预定监控项的监控数据。
[0038]可选地,步骤SllO之前,在多个计算设备上分别部署监控工具,在执行监控步骤时,启动监控工具,并通过监控工具执行多个预定监控项的监控数据监控及采集。
[0039]具体地,通过自动化配置和管理工具进行监控工具的部署,如SaltStack自动化工具在多个计算设备上批量部署监控工具ganglia。
[0040]步骤S120:基于预定时间间隔对采集到的在预定时长内每台计算设备的每个预定监控项的监控数据进行分析处理,确定每台计算设备的监控分析结果。
[0041]例如,基于每小时分析一次的预定时间间隔,对采集到的在3个月内每台计算设备的每个预定监控项的监控数据进行分析处理,确定在3个月内每台计算设备每小时的监控分析结果。
[0042]如图2所示,基于预定时间间隔对采集到的在预定时长内每台计算设备的每个预定监控项的监控数据进行分析处理,确定每台计算设备的监控分析结果的步骤具体包括步骤S221和步骤S222 ;步骤S221:基于预定时间间隔对采集到的在预定时长内每台计算设备的每个预定监控项的监控数据进行计算处理,确定与每个预定监控项相应的测评值;步骤S222:将与每个预定监控项相应的测评值与该预定监控项的预设阈值进行比较,确定在预定时长内每台计算设备相应的基于预定时间间隔的预定监控项的监控分析结果。
[0043]具体地,对每台计算设备的每个预定监控项,将采集到的在预定时长内的监控数据以预定时间间隔内进行贝叶斯分析,计算确定与每个预定监控项相应的测评值;例如,将采集到的在3个月内的任一预定监控项的监控
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1