一种基线管理中基线数据计算方法与流程

文档序号:16207869发布日期:2018-12-08 07:20阅读:739来源:国知局
一种基线管理中基线数据计算方法与流程

本发明涉及基线管理技术领域,特别是涉及一种基线管理中基线数据计算方法。

背景技术

在it监控领域,使用者经常根据过去一段时间内的数据进行采样分析,根据分析的结果按照一定的算法,计算出未来一段时间内的做为参考的数据,对这种参考数据,我们又称之为基线。

在现有技术中,对于基线数据的计算,一般都是针对采集的历史性能数据,然后除去历史性能数据中的最大数值,最小数值之后,取平均所得到的数据做为未来的基线数据。然而通过这样的方式得到的数据并不够准确,也没有很好的参考意义。



技术实现要素:

本发明提供了一种基线管理中基线数据计算方法和系统,本发明提供的技术方案能够实现准确的基线数据进行计算。

本发明公开了一种基线管理中基线数据计算方法,包括:

获取预设时间范围内的历史性能数据,所述预设时间范围是根据待计算的基线数据对应的日期时间确定的;

根据所述历史性能数据的大小,对所述历史性能数据进行分组,得到多个历史性能数据集合;

根据各个历史性能数据集合中所包含的历史性能数据的个数,选取目标历史性能数据集合;

根据所述目标历史性能数据集合,确定目标历史性能数据;

根据第一预设值以及所述目标性能数据的个数,确定所述目标历史性能数据的多个样本区间,并确定落入各个样本区间内的目标历史性能数据;

根据落入各个样本区间内的目标历史性能数据,确定各个样本区间对应的均方差;

根据所述均方差,选取目标样本区间;

根据落入所述目标样本区间内的目标历史性能数据,计算所述基线数据。

可选的,所述历史性能数据为多个,多个历史性能数据与所述预设时间范围内的多个日期时间相对应;

在所述获取预设时间范围内的历史性能数据之后,在所述根据所述历史性能数据的大小,对所述历史性能数据进行分组之前,还包括:

判断所述多个历史性能数据对应的日期时间是否连续;

如果不连续,则获取与缺失的日期时间相邻的日期时间所对应的历史性能数据;

根据所述相邻的日期时间所对应的历史性能数据,确定所述缺失的日期时间所对应的历史性能数据。

可选的,在所述根据历史性能数据的大小,对所述历史性能数据进行分组之前,还包括:

对所述多个历史性能数据进行排序;

筛除排序靠前的历史性能数据;和/或,

筛除排序靠后的历史性能数据;

所述根据历史性能数据的大小,对所述历史性能数据进行分组,得到多个历史性能数据集合,包括:

根据所述多个历史性能数据中最大的历史性能数据以及预设的集合个数,确定各个集合的集合范围;

根据所述多个历史性能数据的大小,将所述多个历史性能数据分配到对应的集合范围内;

每个集合范围内的历史性能数据构成对应的历史性能数据集合。

可选的,所述根据各个历史性能数据集合中所包含的历史性能数据的个数,选取目标历史性能数据集合包括:

选取历史性能数据个数最多的历史性能数据集合作为目标历史性能数据集合;

或者,

选取历史性能数据个数最多的历史性能数据集合,以及与所述个数最多的历史性能数据集合相邻的一个或两个历史性能数据集合,作为目标历史性能数据集合;

所述根据所述目标历史性能数据集合,确定目标历史性能数据包括:

将所述目标历史性能数据集合中的历史性能数据作为目标历史性能数据。

可选的,所述根据第一预设值以及所述目标性能数据的个数,确定所述目标历史性能数据的多个样本区间,并确定落入各个样本区间内的目标历史性能数据包括:

根据第一预设值以及所述目标性能数据的个数,确定每个样本区间中包含的目标历史性能数据的个数;

根据目标历史性能数据的总个数以及个每个样本区间中包含的目标历史性能数据的个数,确定所述目标历史性能数据的各个样本区间以及各个样本区间内的目标历史性能数据。

可选的,所述根据所述均方差,选取目标样本区间包括:

根据各个样本区间对应的均方差的大小,选取均方差最小的样本区间作为目标样本区间;

根据落入所述目标样本区间内的目标历史性能数据,确定基线数据包括:

将所述目标样本区间中的最小的历史性能数据作为所述基线数据的下基线的值;将所述目标样本区间中的最大的历史性能数据作为所述基线数据的上基线的值。

可选的,所述计算所述基线数据之后,还包括:

根据所述所述基线数据的上基线的值,与预设的容忍度值,计算所述基线数据的上容忍度;

根据所述所述基线数据的下基线的值,与预设的容忍度值,计算所述基线数据的下容忍度。

本发明还公开了一种基线管理中基线数据计算系统,包括:

采集模块,用于获取预设时间范围内的历史性能数据,所述预设时间范围是根据待计算的基线数据对应的日期时间确定的;

分组模块,用于根据所述历史性能数据的大小,对所述历史性能数据进行分组,得到多个历史性能数据集合;

筛选模块,根据各个历史性能数据集合中所包含的历史性能数据的个数,选取目标历史性能数据集合;根据所述目标历史性能数据集合,确定目标历史性能数据;

计算模块,用于根据第一预设值以及所述目标性能数据的个数,确定所述目标历史性能数据的多个样本区间,并确定落入各个样本区间内的目标历史性能数据;根据落入各个样本区间内的目标历史性能数据,确定各个样本区间对应的均方差;根据所述均方差,选取目标样本区间;根据落入所述目标样本区间内的目标历史性能数据,计算所述基线数据。

可选的,所述历史性能数据为多个,多个历史性能数据与所述预设时间范围内的多个日期时间相对应;系统还包括:

判断模块,用于判断所述多个历史性能数据对应的日期时间是否连续;

采集模块,用于在判断模块判断所述多个历史性能数据对应的日期时间不连续时,获取与缺失的日期时间相邻的日期时间所对应的历史性能数据;根据所述相邻的日期时间所对应的历史性能数据,确定所述缺失的日期时间所对应的历史性能数据。

可选的,所述分组模块,还用于对所述多个历史性能数据进行排序;

筛除排序靠前的历史性能数据;和/或,

筛除排序靠后的历史性能数据;

根据所述多个历史性能数据中最大的历史性能数据以及预设的集合个数,确定各个集合的集合范围;

根据所述多个历史性能数据的大小,将所述多个历史性能数据分配到对应的集合范围内;

每个集合范围内的历史性能数据构成对应的历史性能数据集合。

可选的,筛选模块,用于选取历史性能数据个数最多的历史性能数据集合作为目标历史性能数据集合;

或者,

选取历史性能数据个数最多的历史性能数据集合,以及与所述个数最多的历史性能数据集合相邻的一个或两个历史性能数据集合,作为目标历史性能数据集合;

所述根据所述目标历史性能数据集合,确定目标历史性能数据包括:

将所述目标历史性能数据集合中的历史性能数据作为目标历史性能数据。

可选的,计算模块,用于根据第一预设值以及所述目标性能数据的个数,确定每个样本区间中包含的目标历史性能数据的个数;

根据目标历史性能数据的总个数以及个每个样本区间中包含的目标历史性能数据的个数,确定所述目标历史性能数据的各个样本区间以及各个样本区间内的目标历史性能数据。

可选的,根据各个样本区间对应的均方差的大小,选取均方差最小的样本区间作为目标样本区间;

根据落入所述目标样本区间内的目标历史性能数据,确定基线数据包括:

将所述目标样本区间中的最小的历史性能数据作为所述基线数据的下基线的值;将所述目标样本区间中的最大的历史性能数据作为所述基线数据的上基线的值;

可选的,计算模块,还用于根据所述所述基线数据的上基线的值,与预设的容忍度值,计算所述基线数据的上容忍度;

根据所述所述基线数据的下基线的值,与预设的容忍度值,计算所述基线数据的下容忍度。

综上所述,在本发明中通过获取预设时间范围内的历史性能数据,对获取的历史性能数据进行平滑处理得到连续的历史性能数据。然后再进行分组筛选之后,得到目标历史性能数据集合。进而确定目标历史性能数据。再根据第一预设值以及所述目标性能数据的个数,确定所述目标历史性能数据的多个样本区间,并确定落入各个样本区间内的目标历史性能数据;进而分别确定各个样本区间对应的均方差;根据所述均方差,选取目标样本区间;根据落入所述目标样本区间内的目标历史性能数据,计算所述基线数据。可见,在根据样本区间以及对应的均方差算法确定最佳的目标的历史性能数据。进而得到最能待计算的基线数据,解决了现有技术中无法计算出所需的基线数据的问题,亦或者是计算得到的基线数据不够准确,没有参考意义的缺陷。

附图说明

图1是本发明中一种基线管理中基线数据计算方法的流程图;

图2是本发明中一种基线管理中基线数据计算方法的详细流程图;

图3是本发明中一种基线管理中基线数据计算系统的结构图;

图4是本发明中一种基线管理中基线数据计算系统的详细结构图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作还地详细描述。

图1是本发明中一种基线管理中基线数据计算方法的流程图。参加图1所示,该方法包括如下步骤:

步骤s110,获取预设时间范围内的历史性能数据,所述预设时间范围是根据待计算的基线数据对应的日期时间确定的。

步骤s120,根据所述历史性能数据的大小,对所述历史性能数据进行分组,得到多个历史性能数据集合。

步骤s130,根据各个历史性能数据集合中所包含的历史性能数据的个数,选取目标历史性能数据集合。

步骤s140,根据所述目标历史性能数据集合,确定目标历史性能数据。

步骤s150,根据第一预设值以及所述目标性能数据的个数,确定所述目标历史性能数据的多个样本区间,并确定落入各个样本区间内的目标历史性能数据。

步骤s160,根据落入各个样本区间内的目标历史性能数据,确定各个样本区间对应的均方差。

步骤s170,根据所述均方差,选取目标样本区间。

步骤s180,根据落入所述目标样本区间内的目标历史性能数据,计算所述基线数据。

可见,本申请中,对采集的数据进行分组筛选。筛除干扰历史性能数据。在根据筛选之后的历史性能数据中选取目标历史性能数据。在根据样本区间以及对应的均方差算法确定最佳的目标的历史性能数据。进而得到最能待计算的基线数据,解决了现有技术中无法计算出所需的基线数据的问题,亦或者是计算得到的基线数据不够准确,没有参考意义的缺陷。

图2是本发明中一种基线管理中基线数据计算方法的详细流程图。参见图2所述,该方法包括如下步骤。

步骤s210,获取预设时间范围内的历史性能数据,所述预设时间范围是根据待计算的基线数据对应的日期时间确定的。

在本实施例中,以计算2015年03月15日13:00:00的基线数据为例,对本发明的技术方案进行详细说明。

预设时间范围是指待计算的基线数据对应的日期时间之前的一段时间范围。可以是一周时间范围,可以是一个月时间范围,还可以是一年时间范围,甚至更长的时间范围,在此不在一一赘述。

在本发明的其他实施例中,可以计算某一周的基线数据,还可以是计算某一月的基线数据,还可以是计算某一年的基线数据。因而,对应的预设时间范围可以是更长,则可以采集前n周的历史性能数据;前n月的历史性能数据,还可以是采集前n年的历史性能数据。具体根据时间情况进行选择,在此不以本实施例中计算某一时间点的基线数据限制本发明。

在本实施例中,预设时间范围为一个月。因此,获取预设时间范围内的历史性能数据,是指从历史性能数据表获取取2015-3-1513:00:00至2015-4-1313:00:00的整13:00的历史性能数据。即获取待计算的基线数据对应的日期时间2015年-04月-13日13:00:00,之前一个月的历史性能数据。

在本申请的一种具体实施例中,获取的历史性能数据如下:

步骤s220,判断所述多个历史性能数据对应的日期时间是否连续。如果连续则进行步骤s230,如果不连续则进入步骤s221。

在本步骤中,为了使得计算出的基线数据更加准确,则要求获取的历史性能数据是连续的。如果采集的历史性能数据不是连续的,则计算出的基线数据会有误差,不具有参考价值。

步骤s221,获取与缺失的日期时间相邻的日期时间所对应的历史性能数据。

由于存在因采集故障导致某一日期时间所对应的历史性能数据缺失的情况。在本步骤中,由于在性能数据采集时,每隔一段时间采集一个性能数据,因而,能够获取到与缺失的日期时间相邻的日期时间所对应的历史性能数据。

如2015-4-613:00:00的数据不存在,因此需要取该日期时间的上下相邻日期时间所对应的历史性能数据。

步骤s222,根据所述相邻的日期时间所对应的历史性能数据,确定所述缺失的日期时间所对应的历史性能数据。

在本步骤中,根据相邻的日期时间所对应的历史性能数据,根据如下公式计算出所述缺失的日期时间所对应的历史性能数据。具体为:

value=va*(1-x)+vb*x;其中,value表示所缺少的日期时间所对应的历史性能数据;va表示上相邻的历史性能数据,vb表示下相邻的历史性能数据,x表示所缺少的日期时间与上相邻日期时间之差,与上下相邻日期时间之差之间的比值。

对应于上述实施例中,则value=85*(1-1/2)+94*1/2=89。

得到对应的历史性能数据如下:

[54,89,75,32,54,51,53,62,35,32,24,36,45,41,41,74,76,78,78,82,84,84,89,73,95,97,101,102,103,54]

在上述步骤s221和步骤s222中,通过对采样得到的历史性能数据,进行矩阵平滑处理。解决了因采集的历史性能数据不连续导致的基线数据计算不够准确的缺陷。并且,在上述步骤中,通过对应的公式计算出的采集缺失的历史性能数据更加准确,从而使得在计算基线数据时,能够减少误差,提高得到的基线数据的准确性。比直接求平均的平滑处理,具有更加准确的优点。

步骤s230,对所述多个历史性能数据进行排序,筛除干扰性的历史性能数据。

在本步骤中,对获取到的全部的连续的历史性能数据进行排序之后,筛除干扰性的历史性能数据,以便计算得到的基线数据更加准确。

在本发明的一种实施例中,可以通过筛除排序靠前的历史性能数据;和/或,筛除排序靠后的历史性能数据。

在本发明的一种实施例中,通过筛除干扰性的历史性能数据之后,得到筛除完成之后的历史性能数据如下:

[32,32,35,36,41,41,45,51,53,54,54,54,62,73,74,75,76,78,78,82,84,84,89,89,95,97,101,102]

步骤s240,根据所述多个历史性能数据中最大的历史性能数据以及预设的集合个数,确定各个集合的集合范围。

在本发明的一种具体实施例中,预设的集合个数可以为5个。则根据最大的历史性能数据102,区间个数5;得到每个集合的集合范围为102/5=21。则确定该5个集合的集合范围如下:

[0~21],[21~42],[42~63],[63~84],[84~105]。

步骤s250,根据所述多个历史性能数据的大小,将所述多个历史性能数据分配到对应的集合范围内;每个集合范围内的历史性能数据构成对应的历史性能数据集合。

在本步骤中,把步骤s230中的28个数分配到步骤s240所确定的这些集合中去(区间最小值<=n<区间最大值)后为:

集合1=[]

集合2=[32,32,35,36,41,41]

集合3=[45,51,53,54,54,54,62]

集合4=[73,74,75,76,78,78,82,84,84]

集合5=[89,89,95,97,101,102]

步骤s260,选取历史性能数据个数最多的历史性能数据集合,以及与所述个数最多的历史性能数据集合相邻的一个或两个历史性能数据集合,作为目标历史性能数据集合;将所述目标历史性能数据集合中的历史性能数据作为目标历史性能数据。

在步骤s260中,如果历史性能数据个数最多的历史性能数据集合相邻只有一个历史性能数据集合,则只取一个。

在上述具体实施例中,区间4中的历史性能数据个数最多,所以取区间4上邻区间3和它下邻区间5中的历史性能数据作为目标历史性能数据。取完得到的目标历史性能数据为如下:

[45,51,53,54,54,54,62,73,74,75,76,78,78,82,84,84,89,89,95,97,101,102]

在本发明的其他实施例中,还可以只选取历史性能数据个数最多的历史性能数据集合作为目标历史性能数据集合。

步骤s270,根据第一预设值以及所述目标性能数据的个数,确定每个样本区间中包含的目标历史性能数据的个数;根据目标历史性能数据的总个数以及个每个样本区间中包含的目标历史性能数据的个数,确定所述目标历史性能数据的各个样本区间以及各个样本区间内的目标历史性能数据。

在本发明的一种具体实施例中,第一预设值的值为0.8。因而根据第一预设值以及目标性能数据的个数22,计算出每个样本区间中包含的目标历史性能数据的个数为22*0.8=17.6,通过取整得到每个样本区间中包含的目标历史性能数据的个数17。

在本发明的其他实施例中,第一预设值的值可以根据实际情况进行设定,在此不再一一赘述。

进而确定所述目标历史性能数据的各个样本区间以及各个样本区间内的目标历史性能数据如下:

样本区间1~17:[45,51,53,54,54,54,62,73,74,75,76,78,78,82,84,84,89]

样本区间2~18:[51,53,54,54,54,62,73,74,75,76,78,78,82,84,84,89,89]

样本区间3~19:[53,54,54,54,62,73,74,75,76,78,78,82,84,84,89,89,95]

样本区间4~20:[54,54,54,62,73,74,75,76,78,78,82,84,84,89,89,95,97]

样本区间5~21:[54,54,62,73,74,75,76,78,78,82,84,84,89,89,95,97,101]

样本区间6~22:[54,62,73,74,75,76,78,78,82,84,84,89,89,95,97,101,102]

步骤s280,确定各个样本区间对应的均方差,根据各个样本区间对应的均方差的大小,选取均方差最小的样本区间作为目标样本区间;

在本发明的上述实施例中,通过分别计算各样本区间得到的对应的均方差如下:

在本步骤中,由于样本区间6~21对应的均方差的值最小,则样本区间6~21作为目标样本区间。

步骤s290,将所述目标样本区间中的最小的历史性能数据作为所述基线数据的下基线的值;将所述目标样本区间中的最大的历史性能数据作为所述基线数据的上基线的值。

在上述所述中,样本区间6~21:

[54,62,73,74,75,76,78,78,82,84,84,89,89,95,97,101,102]中的最小的历史性能数据为54,则将54作为基线数据的下基线的值。最大的历史性能数据为102,则将102作为所述基线数据的上基线的值。

在本发明的一种较佳实施例中,在步骤s290之后,还包括步骤s291。

步骤s291,根据所述所述基线数据的上基线的值,与预设的容忍度值,计算所述基线数据的上容忍度;根据所述所述基线数据的下基线的值,与预设的容忍度值,计算所述基线数据的下容忍度。

图3是本发明中一种基线管理中基线数据计算系统的结构图;参见图3所示,该系统包括如下模块:

采集模块301,用于获取预设时间范围内的历史性能数据,所述预设时间范围是根据待计算的基线数据对应的日期时间确定的;

分组模块302,用于根据所述历史性能数据的大小,对所述历史性能数据进行分组,得到多个历史性能数据集合;

筛选模块303,根据各个历史性能数据集合中所包含的历史性能数据的个数,选取目标历史性能数据集合;根据所述目标历史性能数据集合,确定目标历史性能数据;

计算模块304,用于根据第一预设值以及所述目标性能数据的个数,确定所述目标历史性能数据的多个样本区间,并确定落入各个样本区间内的目标历史性能数据;根据落入各个样本区间内的目标历史性能数据,确定各个样本区间对应的均方差;根据所述均方差,选取目标样本区间;根据落入所述目标样本区间内的目标历史性能数据,计算所述基线数据。

图4是本发明中一种基线管理中基线数据计算系统的详细结构图。参见图4所示:所述历史性能数据为多个,多个历史性能数据与所述预设时间范围内的多个日期时间相对应;图4在图3所示的基础上,还包括:

判断模块401,用于判断所述多个历史性能数据对应的日期时间是否连续;

采集模块301,用于在判断模块判断所述多个历史性能数据对应的日期时间不连续时,获取与缺失的日期时间相邻的日期时间所对应的历史性能数据;根据所述相邻的日期时间所对应的历史性能数据,确定所述缺失的日期时间所对应的历史性能数据。

在本发明的一种实施例中,分组模块302,还用于对所述多个历史性能数据进行排序;并且在排序之后,筛除排序靠前的历史性能数据;或,筛除排序靠后的历史性能数据。

在本发明的一种实施例中,分组模块302,还用于对所述多个历史性能数据进行排序;并且在排序之后,筛除排序靠前的历史性能数据;同时筛除排序靠后的历史性能数据。

在本发明的一种实施例中,分组模块302,根据所述多个历史性能数据中最大的历史性能数据以及预设的集合个数,确定各个集合的集合范围;根据所述多个历史性能数据的大小,将所述多个历史性能数据分配到对应的集合范围内;每个集合范围内的历史性能数据构成对应的历史性能数据集合;

在本发明的一种实施例中,筛选模块303,用于选取历史性能数据个数最多的历史性能数据集合作为目标历史性能数据集合;将所述目标历史性能数据集合中的历史性能数据作为目标历史性能数据。

在本发明的一种实施例中选取历史性能数据个数最多的历史性能数据集合,以及与所述个数最多的历史性能数据集合相邻的一个或两个历史性能数据集合,作为目标历史性能数据集合。将所述目标历史性能数据集合中的历史性能数据作为目标历史性能数据。

在本发明的一种实施例中,计算模块304,用于根据第一预设值以及所述目标性能数据的个数,确定每个样本区间中包含的目标历史性能数据的个数;根据目标历史性能数据的总个数以及个每个样本区间中包含的目标历史性能数据的个数,确定所述目标历史性能数据的各个样本区间以及各个样本区间内的目标历史性能数据。

在本发明的一种实施例中,计算模块304,根据各个样本区间对应的均方差的大小,选取均方差最小的样本区间作为目标样本区间;根据落入所述目标样本区间内的目标历史性能数据,确定基线数据包括:将所述目标样本区间中的最小的历史性能数据作为所述基线数据的下基线的值;将所述目标样本区间中的最大的历史性能数据作为所述基线数据的上基线的值;

在本发明的一种实施例中,计算模块304,还用于根据所述所述基线数据的上基线的值,与预设的容忍度值,计算所述基线数据的上容忍度;根据所述所述基线数据的下基线的值,与预设的容忍度值,计算所述基线数据的下容忍度。

综上所述,在本发明中通过获取预设时间范围内的历史性能数据,对获取的历史性能数据进行平滑处理得到连续的历史性能数据。然后再进行分组筛选之后,得到目标历史性能数据集合。进而确定目标历史性能数据。再根据第一预设值以及所述目标性能数据的个数,确定所述目标历史性能数据的多个样本区间,并确定落入各个样本区间内的目标历史性能数据;进而分别确定各个样本区间对应的均方差;根据所述均方差,选取目标样本区间;根据落入所述目标样本区间内的目标历史性能数据,计算所述基线数据。可见,在根据样本区间以及对应的均方差算法确定最佳的目标的历史性能数据。进而得到最能待计算的基线数据,解决了现有技术中无法计算出所需的基线数据的问题,亦或者是计算得到的基线数据不够准确,没有参考意义的缺陷。

以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1