数据采样系统中采样周期的控制方法和装置与流程

文档序号:15930104发布日期:2018-11-14 01:32阅读:1220来源:国知局

本发明涉及信息处理领域,尤指一种数据采样系统中采样周期的控制方法和装置。

背景技术

当前,市场上绝大数的网管软件、云管平台、服务器虚拟化软件都会涉及到管理资源,诸如服务器、存储、网络设备、虚拟机、数据库、web中间件等的监控。资源监控是监控被监控对象的监控项的数据,通过对数据的计算、分析得出被监控对象的当前状态及预测被监控对象未来的变化趋势。

监控监控数据通过两种方式:管理节点抓取、被管理节点主动上报。无论是管理节点抓取还是被管理节点主动上报,都是按照设定的固定时间间隔抓取和上报。时间间隔的设置需要考虑主机的响应能力和数据存储,以及数据的效用。为了更准确反应被监控对象的真实情况,需要尽可能获取多的数据,就需要抓取或上报的时间间隔尽量小;而考虑到被监控对象数据过多造成的管理节点的承受能力和数据存储能力,时间间隔又不能过小,这就造成了数据有效性和管理节点承受力二者间的矛盾。并且,当前监控平台针对每个节点的采集时间间隔是相同的,实际情况是不同节点的健康状况是各不相同的。

针对各个节点的特性,如何实现动态调整监控数据采样周期实现资源监控是亟待解决的问题。



技术实现要素:

为了解决上述技术问题,本发明提供了一种数据采样系统中采样周期的控制方法和装置。

为了达到本发明目的,本发明提供了一种数据采样系统中采样周期的控制方法,包括:

在当前的时间符合预先设置的采样周期调整策略后,获取距离当前采样周期调整时间预先设置的运行时间内的监控数据;

统计每个被监控设备在所述运行时间内的监控数据;

根据所述每个被监控设备的监控数据,计算所述每个被监控设备当前运行能力的健康状态;

根据所述每个被监控设备当前运行能力的健康状态,确定所述每个被监控设备新的采样周期;

按照新确定的采样周期,对每个被监控设备进行数据采样。

其中,所述方法还具有如下特点:所述获取距离当前采样周期调整时间预先设置的运行时间内的监控数据,包括:

获取所述采样周期调整策略中预先设置的至少两个采样时间段;

按照所述至少两个采样时间段,对所述每个被监控设备进行数据采样。

其中,所述方法还具有如下特点:所述根据所述每个被监控设备的监控数据,计算所述每个被监控设备当前运行能力的健康状态,包括:

计算每个被监控设备在每个采样时间段内监控数据条数的平均值;

根据所述至少两个采样时间段的权重值以及每个采样时间段的平均值,为每个被监控设备计算对应的监控数据条数的总平均值;

根据得到的所述被监控设备的总平均值,确定所述每个被监控设备当前运行能力的健康状态。

其中,所述方法还具有如下特点:所述根据所述每个被监控设备当前运行能力的健康状态,确定每个被监控设备新的采样周期,包括:

如果所述被监控设备的健康状态变差时,则缩短所述没监控设备的采样周期的时间;如果所述被监控设备的健康状态变好时,则增加所述没监控设备的采样周期的时间。

其中,所述方法还具有如下特点:所述根据所述每个被监控设备当前运行能力的健康状态,确定每个被监控设备新的采样周期,包括:

将每个被监控设备在本次计算得到监控数据条数与上一次采样周期调整操作中计算的到的监控数据条数进行比较,计算二者的差值;

如果差值大于预先设置的差值阈值,则调整所述被监控设备的采样周期。

一种数据采样系统中采样周期的控制装置,包括:

获取模块,用于在当前的时间符合预先设置的采样周期调整策略后,获取距离当前采样周期调整时间预先设置的运行时间内的监控数据;

统计模块,用于统计每个被监控设备在所述运行时间内的监控数据;

计算模块,用于根据所述每个被监控设备的监控数据,计算所述每个被监控设备当前运行能力的健康状态;

确定模块,用于根据所述每个被监控设备当前运行能力的健康状态,确定所述每个被监控设备新的采样周期;

监控模块,用于按照新确定的采样周期,对每个被监控设备进行数据采样。

其中,所述装置还具有如下特点:所述获取模块包括:

获取单元,用于获取所述采样周期调整策略中预先设置的至少两个采样时间段;

监控单元,用于按照所述至少两个采样时间段,对所述每个被监控设备进行数据采样。

其中,所述装置还具有如下特点:所述计算模块包括:

第一计算单元,用于计算每个被监控设备在每个采样时间段内监控数据条数的平均值;

第二计算单元,用于根据所述至少两个采样时间段的权重值以及每个采样时间段的平均值,为每个被监控设备计算对应的监控数据条数的总平均值;

确定单元,用于根据得到的所述被监控设备的总平均值,确定所述每个被监控设备当前运行能力的健康状态。

其中,所述装置还具有如下特点:

所述确定模块,具体用于如果所述被监控设备的健康状态变差时,则缩短所述没监控设备的采样周期的时间;如果所述被监控设备的健康状态变好时,则增加所述没监控设备的采样周期的时间。

其中,所述装置还具有如下特点:所述确定模块包括:

第三计算单元,用于将每个被监控设备在本次计算得到监控数据条数与上一次采样周期调整操作中计算的到的监控数据条数进行比较,计算二者的差值;

调整单元,用于如果差值大于预先设置的差值阈值,则调整所述被监控设备的采样周期。

本发明提供的实施例,在检测到符合调整采样周期的时间触发条件后,在用于调整采样周期的运行时间内,通过获取该运行时间内的监控数据的条目,来计算被监控设备当前运行能力的健康状态,根据该健康状态,对该被监控设备的采样周期进行调整,实现动态调整被监控设备的采样周期的目的,有效提升管理效率。

本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。

附图说明

附图用来提供对本发明技术方案的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本发明的技术方案,并不构成对本发明技术方案的限制。

图1为本发明提供的数据采样系统中采样周期的控制方法的流程图;

图2为本发明提供的数据采样系统的示意图;

图3为本发明提供的数据采样系统中采样周期的控制装置的结构图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白,下文中将结合附图对本发明的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。

在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行。并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。

图1为本发明提供的数据采样系统中采样周期的控制方法的流程图。图1所示方法包括:

步骤101、在当前的时间符合预先设置的采样周期调整策略后,获取距离当前采样周期调整时间预先设置的运行时间内的监控数据;

其中,每隔一段时间可以1周、2周或1月等,在符合该时间长度后,可以将最近几天的数据作为监控标本进行监控。

步骤102、统计每个被监控设备在所述运行时间内的监控数据;

具体的,由于每个被监控设备的工作特性不同,我们在进行采样周期调整时,是按照被监控设备的个体进行划分的,大的划分可以为同一型号的设备,更新的划分为同一型号的不同工作寿命的设备;

步骤103、根据所述每个被监控设备的监控数据,计算所述每个被监控设备当前运行能力的健康状态;

步骤104、根据所述每个被监控设备当前运行能力的健康状态,确定所述每个被监控设备新的采样周期;

步骤105、按照新确定的采样周期,对每个被监控设备进行数据采样。

本发明提供的方法实施例,在检测到符合调整采样周期的时间触发条件后,在用于调整采样周期的运行时间内,通过获取该运行时间内的监控数据的条目,来计算被监控设备当前运行能力的健康状态,根据该健康状态,对该被监控设备的采样周期进行调整,实现动态调整被监控设备的采样周期的目的,有效提升管理效率。

下面对本发明提供的方法实施例作进一步说明:

监控数据根据监控对象不同而不同,如监控服务器监控的数据可能包括cpu、内存、磁盘利用率数据以及网卡接收、发送的字节数;监控存储设备监控的数据可能包含总容量、可用容量以及连接的主机个数等;监控数据库可能包含连接数、存储空间等数据。

监控间隔的设置方法是每隔一段时间(如1周,2周,1月)系统根据已采取的最近一段时间(如1天、3天)的数据对被管理对象的健康状况做深度分析,其中,在对最近一段时间的数据进行分析时,本发明所述获取距离当前采样周期调整时间预先设置的运行时间内的监控数据,包括:

获取所述采样周期调整策略中预先设置的至少两个采样时间段;

按照所述至少两个采样时间段,对所述每个被监控设备进行数据采样。

举例来说:如按照如下时间段0:00-08:0008:01-12:00、12:01-18:00、18:01-23:59分为4段数据。

其中,时间段的划分主要是按照业务数量集中分布进行划分的,比如在企业办公网络中08:01-12:00和12:01-18:00是企业员工正常上班的时间,该时间段的数据比较多,剩下的两个时间段是企业员工正常下班的时间,该时间段的数据相对就会少一些。

按照上述不同时间段进行数据量的统计,可以体现被监控设备的数据特性,为后续进行数据采样周期的设置提供更加精准的参考数据。

其中,所述根据所述每个被监控设备的监控数据,计算所述每个被监控设备当前运行能力的健康状态,包括:

计算每个被监控设备在每个采样时间段内监控数据条数的平均值;

根据所述至少两个采样时间段的权重值以及每个采样时间段的平均值,为每个被监控设备计算对应的监控数据条数的总平均值;

根据得到的所述被监控设备的总平均值,确定所述每个被监控设备当前运行能力的健康状态。

具体的,在通过将数据按时间段细分取平均值,然后按照设置的不同时间段的权重,再通过加权平均的方式得到此段时间内的平均值,不同的平均值即可对应不同的健康状态。其中,平均值较小的说明被监控对象的健康状况相对良好,平均值较大的说明被监控对象的负载相对较高,健康状况相对较差。

其中,之所以为不同时间段的权重是不同的,该权重的大小的设置可以根据该时间段的数据量、该时间段上用户在线数量或者该时间段发生故障的次数信息中的至少一个来确定。

具体来说,该时间段的数据量越大,该时间段内有价值的数据存在的可能性就越高,则对应的权值越高,反之,该时间段对应的权值越低;

该时间段上用户在线数量越多,该时间段的负载往往会更高,更需要进行周期的监控和检测,因此,对应的权值越高;反之,该时间段对应的权值越低;

如果该时间段内发生故障的次数比较高,则该时间段更需要监控和检测来获知设备的运行状态,因此,对应的权值越高;反之,该时间段对应的权值越低。

在得到被监控设备的运行性能的健康状态后,按照健康状况从好至差,被监控对象的时间间隔设置从小至大。健康状况好的被监控对象的采集时间间隔可设置稍大,而健康状况差的监控对象的采集时间间隔设置较小。

具体的,根据所述每个被监控设备当前运行能力的健康状态,确定每个被监控设备新的采样周期,包括:

如果所述被监控设备的健康状态变差时,则缩短所述没监控设备的采样周期的时间;如果所述被监控设备的健康状态变好时,则增加所述没监控设备的采样周期的时间。

在管理节点抓取或者被监控对象主动上报数据前,先去读取被监控对象抓取或上报数据的时间间隔,然后根据时间间隔定时抓取或上报数据。

为了避免频繁对采样周期进行调整,在本发明提供的一个实施例中,所述根据所述每个被监控设备当前运行能力的健康状态,确定每个被监控设备新的采样周期,包括:

将每个被监控设备在本次计算得到监控数据条数与上一次采样周期调整操作中计算的到的监控数据条数进行比较,计算二者的差值;

如果差值大于预先设置的差值阈值,则调整所述被监控设备的采样周期。

本发明的有益效果是:通过动态设置被监控对象的数据采样周期,从而获取更有效的监控数据,提升了数据价值,降低了管理节点的负载,以便其可以管理更多的资源节点。

图2为本发明提供的数据采样系统的示意图。图2所示系统包括:(1)计算模块、(2)周期管理模块、(3)监控模块。其中,周期管理模块是计算模块的输出,是监控模块的输入。监控模块负责抓取或上报数据。

计算模块(1)提取监控模块(3)已经监控的部分数据,根据设置的数据时长(1周、2周、1月等)提取,将提取的数据按照时间段细分为若干段,如按照如下时间段0:00-08:0008:01-12:00、12:01-18:00、18:01-23:59分为4段数据,分别取各个时间段的数据的平均值,然后按照设置的不同时间段的权重(如,0:00-08:00、18:01-23:00权重为1,08:01-12:00、12:01-18:00权重为2),再通过加权平均的方式得到此段时间(1周、2周、1月等)内的平均值,不同的平均值即可对应不同的采集时间间隔。例如,平均值在第一取值区间时,采集时间间隔为1分钟;平均值在第二取值区间时,采集时间间隔为10分钟;平均值在第三取值区间时,采集时间间隔为1小时。平均值较小的说明被监控对象的健康状况相对良好,平均值较大的说明被监控对象的负载相对较高,健康状况相对较差。按照健康状况从好至差,被监控对象的时间间隔设置从小至大。健康状况好的被监控对象的采集时间间隔可设置稍大,而健康状况差的监控对象的采集时间间隔设置较小。在计算出新的采集时间间隔后,周期管理模块更新周期信息,监控模块根据新的周期信息进行采集。

由上可以看出,采样周期是按照设置的计算周期,周期性计算出被监控对象的数据采集周期的;在每个被监控对象的数据采集时间间隔是根据自身的已有数据计算出来,不尽相同,能够更贴合设备的个体的运行特性;通过动态调整采集周期可以更加动态调整监控数据采集周期的资源监控方法,有效提升数据价值和管理效率。

图3为本发明提供的数据采样系统中采样周期的控制装置的结构图。图3所示装置,包括:

获取模块301,用于在当前的时间符合预先设置的采样周期调整策略后,获取距离当前采样周期调整时间预先设置的运行时间内的监控数据;

统计模块302,用于统计每个被监控设备在所述运行时间内的监控数据;

计算模块303,用于根据所述每个被监控设备的监控数据,计算所述每个被监控设备当前运行能力的健康状态;

确定模块304,用于根据所述每个被监控设备当前运行能力的健康状态,确定所述每个被监控设备新的采样周期;

监控模块305,用于按照新确定的采样周期,对每个被监控设备进行数据采样。

在本发明提供的一个装置实施例中,所述获取模块包括:

获取单元,用于获取所述采样周期调整策略中预先设置的至少两个采样时间段;

监控单元,用于按照所述至少两个采样时间段,对所述每个被监控设备进行数据采样。

在本发明提供的一个装置实施例中,所述计算模块包括:

第一计算单元,用于计算每个被监控设备在每个采样时间段内监控数据条数的平均值;

第二计算单元,用于根据所述至少两个采样时间段的权重值以及每个采样时间段的平均值,为每个被监控设备计算对应的监控数据条数的总平均值;

确定单元,用于根据得到的所述被监控设备的总平均值,确定所述每个被监控设备当前运行能力的健康状态。

在本发明提供的一个装置实施例中,所述确定模块,具体用于如果所述被监控设备的健康状态变差时,则缩短所述没监控设备的采样周期的时间;如果所述被监控设备的健康状态变好时,则增加所述没监控设备的采样周期的时间。

在本发明提供的一个装置实施例中,所述确定模块包括:

第三计算单元,用于将每个被监控设备在本次计算得到监控数据条数与上一次采样周期调整操作中计算的到的监控数据条数进行比较,计算二者的差值;

调整单元,用于如果差值大于预先设置的差值阈值,则调整所述被监控设备的采样周期。

本发明提供的装置实施例,在检测到符合调整采样周期的时间触发条件后,在用于调整采样周期的运行时间内,通过获取该运行时间内的监控数据的条目,来计算被监控设备当前运行能力的健康状态,根据该健康状态,对该被监控设备的采样周期进行调整,实现动态调整被监控设备的采样周期的目的,有效提升管理效率。

本领域普通技术人员可以理解上述实施例的全部或部分步骤可以使用计算机程序流程来实现,所述计算机程序可以存储于一计算机可读存储介质中,所述计算机程序在相应的硬件平台上(如系统、设备、装置、器件等)执行,在执行时,包括方法实施例的步骤之一或其组合。

可选地,上述实施例的全部或部分步骤也可以使用集成电路来实现,这些步骤可以被分别制作成一个个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。

上述实施例中的各装置/功能模块/功能单元可以采用通用的计算装置来实现,它们可以集中在单个的计算装置上,也可以分布在多个计算装置所组成的网络上。

上述实施例中的各装置/功能模块/功能单元以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。上述提到的计算机可读取存储介质可以是只读存储器,磁盘或光盘等。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求所述的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1