一种基于时间序列数据的指标趋势预测方法及装置与流程

文档序号:20191083发布日期:2020-03-27 19:40阅读:351来源:国知局
一种基于时间序列数据的指标趋势预测方法及装置与流程

本发明涉及计算机技术领域,具体涉及一种基于时间序列数据的指标趋势预测方法及装置。



背景技术:

目前,传统的指标趋势预测是采集业务系统的相关指标,利用单一arima(autoregressiveintegratedmovingaveragemodel,自回归移动平均模型)算法或者其他单一算法等建立相应单一时间序列模型,并根据指标的历史时间序列数据进行数据分析和处理。

然而,在实际情况中,往往不同分布特征的指标数据适合使用不同的时间序列算法。对于不同分布特征的指标数据,利用传统的arima算法或者其他单一时间序列算法,如prophet、holt-winter、xgboost和移动平均等进行预测的时候,最终的预测误差率比较大。

因此,如何对不同分布特征的时间序列数据进行趋势预测成为亟待解决的问题。



技术实现要素:

由于现有方法存在上述问题,本发明实施例提出一种基于时间序列数据的指标趋势预测方法及装置。

第一方面,本发明实施例提出一种基于时间序列数据的指标趋势预测方法,包括:

获取目标指标的时间序列数据;

将获取的所述目标指标的时间序列数据分别输入预设个数训练好的模型中,确定所述目标指标的最终趋势。

可选地,所述将获取的所述目标指标的时间序列数据分别输入预设个数训练好的模型中,确定所述目标指标的最终趋势,包括:

将获取的所述目标指标的时间序列数据分别输入预设个数训练好的模型中,得到预设个数模型输出结果;

根据所述预设个数模型输出结果,确定所述目标指标的最终趋势。

可选地,所述预设个数模型输出结果包括:预设个数所述目标指标的趋势,以及预设个数分别与所述目标指标的趋势对应的相对平均误差率。

可选地,所述根据所述预设个数模型输出结果,确定所述目标指标的最终趋势,包括:

确定所述预设个数分别与所述目标指标的趋势对应的相对平均误差率中的最小相对平均误差率;

根据所述最小相对平均误差率,确定所述目标指标的最终趋势。

可选地,所述根据所述最小相对平均误差率,确定所述目标指标的最终趋势,包括:

根据所述最小相对平均误差率,确定与所述最小相对平均误差率对应的所述目标指标的趋势,以将所述与所述最小相对平均误差率对应的所述目标指标的趋势确定为所述目标指标的最终趋势。

第二方面,本发明实施例还提出一种基于时间序列数据的指标趋势预测装置,包括:数据获取模块和最终趋势确定模块;

所述数据获取模块,用于获取目标指标的时间序列数据;

所述最终趋势确定模块,用于将获取的所述目标指标的时间序列数据分别输入预设个数训练好的模型中,确定所述目标指标的最终趋势。

可选地,所述最终趋势确定模块,具体用于:

将获取的所述目标指标的时间序列数据分别输入预设个数训练好的模型中,得到预设个数模型输出结果;

根据所述预设个数模型输出结果,确定所述目标指标的最终趋势。

可选地,所述预设个数模型输出结果包括:预设个数所述目标指标的趋势,以及预设个数分别与所述目标指标的趋势对应的相对平均误差率。

可选地,所述根据所述预设个数模型输出结果,确定所述目标指标的最终趋势,包括:

确定所述预设个数分别与所述目标指标的趋势对应的相对平均误差率中的最小相对平均误差率;

根据所述最小相对平均误差率,确定所述目标指标的最终趋势。

可选地,所述根据所述最小相对平均误差率,确定所述目标指标的最终趋势,包括:

根据所述最小相对平均误差率,确定与所述最小相对平均误差率对应的所述目标指标的趋势,以将所述与所述最小相对平均误差率对应的所述目标指标的趋势确定为所述目标指标的最终趋势。

第三方面,本发明实施例还提出一种电子设备,包括:

至少一个处理器;以及

与所述处理器通信连接的至少一个存储器,其中:

所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行上述方法。

第四方面,本发明实施例还提出一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机程序,所述计算机程序使所述计算机执行上述方法。

由上述技术方案可知,本发明实施例将获取的所述目标指标的时间序列数据输入不同的训练好的模型中,实现了目标指标的趋势预测,并将与最小相对平均误差率对应的目标指标的趋势确定为目标指标的最终趋势,提升了指标趋势预测的精度。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些图获得其他的附图。

图1为本发明一实施例提供的一种基于时间序列数据的指标趋势预测方法的流程示意图;

图2为本发明一实施例提供的一种基于时间序列数据的指标趋势预测装置的结构示意图;

图3为本发明一实施例提供的电子设备的逻辑框图。

具体实施方式

下面结合附图,对本发明的具体实施方式作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。

图1示出了本实施例提供的一种基于时间序列数据的指标趋势预测方法的流程示意图,包括:

s11、获取目标指标的时间序列数据。

其中,所述目标指标是待预测指标。

所述时间序列数据是带有时间轴的待预测数据。

s12、将获取的所述目标指标的时间序列数据分别输入预设个数训练好的模型中,确定所述目标指标的最终趋势。

其中,所述训练好的模型包括但不限于训练好的xgboost模型、训练好的arima模型和训练好的holt-winter模型。在本发明实施例中,预设个数是人工确定的个数。将获取的所述目标指标的时间序列数据分别输入所述训练好的xgboost模型、训练好的arima模型和训练好的holt-winter模型中,以确定所述目标指标的最终趋势。

本发明实施例将获取的所述目标指标的时间序列数据输入不同的训练好的模型中,实现了目标指标的趋势预测,提升了指标趋势预测的精度。

进一步地,在上述方法实施例的基础上,所述将获取的所述目标指标的时间序列数据分别输入预设个数训练好的模型中,确定所述目标指标的最终趋势,包括:

将获取的所述目标指标的时间序列数据分别输入预设个数训练好的模型中,得到预设个数模型输出结果;

根据所述预设个数模型输出结果,确定所述目标指标的最终趋势。

其中,在本发明实施例中,预设个数取值为3。将获取的所述目标指标的时间序列数据分别输入训练好的xgboost模型、训练好的arima模型和训练好的holt-winter模型中,得到3个模型输出结果。所述模型输出结果包括但不限于所述目标指标的趋势以及与所述目标指标的趋势对应的相对平均误差率。然后根据3个所述目标指标的趋势以及3个与所述目标指标的趋势对应的相对平均误差率,确定所述目标指标的最终趋势。

本发明实施例基于目标指标的时间序列数据,利用训练好的模型,确定出目标指标的最终趋势。

进一步地,在上述方法实施例的基础上,所述预设个数模型输出结果包括:预设个数所述目标指标的趋势,以及预设个数分别与所述目标指标的趋势对应的相对平均误差率。

其中,在本发明实施例中,目标指标的趋势个数与训练好的模型的个数相同。与目标指标的趋势对应的相对平均误差率个数也与训练好的模型的个数相同。

本发明实施例中的预设个数所述目标指标的趋势,以及预设个数分别与目标指标的趋势对应的相对平均误差率是确定目标指标的最终趋势的依据。

进一步地,在上述方法实施例的基础上,所述根据所述预设个数模型输出结果,确定所述目标指标的最终趋势,包括:

确定所述预设个数分别与所述目标指标的趋势对应的相对平均误差率中的最小相对平均误差率;

根据所述最小相对平均误差率,确定所述目标指标的最终趋势。

其中,先确定出与所述目标指标的趋势对应的相对平均误差率中的最小相对平均误差率。然后根据所述最小相对平均误差率,确定所述目标指标的最终趋势。

本发明实施例通过确定最小相对平均误差率,进一步确定目标指标的最终趋势。

进一步地,在上述方法实施例的基础上,所述根据所述最小相对平均误差率,确定所述目标指标的最终趋势,包括:

根据所述最小相对平均误差率,确定与所述最小相对平均误差率对应的所述目标指标的趋势,以将所述与所述最小相对平均误差率对应的所述目标指标的趋势确定为所述目标指标的最终趋势。

其中,先确定出与所述最小相对平均误差率对应的所述目标指标的趋势。然后将最小相对平均误差率对应的所述目标指标的趋势作为所述目标指标的最终趋势。

本发明实施例将最小相对平均误差率对应的所述目标指标的趋势作为所述目标指标的最终趋势,提升了指标趋势预测的精度。

在此需要说明的是,在实际情况中,不同分布特征的时间序列数据适合使用不同的时间序列算法,例如,针对周期型时间序列数据,根据计算波峰波谷之间的索引差值是否等间距及提取间距当作该时间序列数据的一个周期长度,然后采用holt-winter模型预测指标未来的趋势,此时预测精度很高。而一般的带有趋势的时间序列数据,使用auto_arima算法,自动提取最优的参数p,q和d,建立的arima模型,预测的精度相比其他算法高。使用xgboost算法自定义时间序列的特征,如小时、日、周、每周第几天、每月第几天、月、季等维度,作为模型的训练特征对xgboost算法进行训练。所以最终采用综合多种主流算法的方式,针对每个时间序列数据选择一个输出的相对平均误差率最小的算法模型,预测指标的趋势。

在此还需要说明的是,训练好的arima、xgboost和holt-winter模型通过以下方法得到:

一、自回归移动平均模型arima

建立arima模型一般有三个阶段,最核心是模型识别和定阶:

1模型识别和定阶

模型的识别问题和定阶问题,主要是确定p,d,q三个参数,差分的阶数d一般通过观察自相关图示得到,默认为5。这里主要介绍p和q的确定。

通过类似于网格搜索的方式来寻找模型最佳的p,q组合,以生成最优arima模型。

在arima算法中,将自动会选择最优的p,q参数。

二、xgboost用于时间序列建模

主要过程是构造xgboost算法需要的特征。首先将样本集划分成训练集和测试集,然后构造训练集和测试集的特征,本方法中针对单一的时间序列指标变量抽取的特征有:

hour:小时

date:日期

quarter:季度

week:第几周

month:月份

day_of_week:一周的第几天

day_of_month:一月中的第几天

day_of_year:一年中第几天

将构造出的时间序列特征输入xgboost算法训练模型,可以得到比较高的预测精度。

三、holt-winter季节性预测模型

holt-winter季节性预测模型的预测函数和三次平滑函数相关。其中,三次平滑函数分别是水平函数lt,趋势函数bt和季节分量st。平滑参数为α,β和γ。

levellt=α(yt-st-s)+(1-α)(lt-1+bt-1)

trendbt=β(lt-lt-1)+(1-β)bt-1

seasonalst=γ(yt-lt)+(1-γ)st-s

forecastft+k=lt+kbt+st+k-s

其中s为季节循环的长度,0≤α≤1,0≤β≤1,0≤γ≤1,t表示时刻,k表示预测长度单位。

水平函数为季节性调整的观测值和时间点t处非季节预测之间的加权平均值。季节函数为当前季节指数和去年同一季节的季节指数之间的加权平均值。

图2示出了本实施例提供的一种基于时间序列数据的指标趋势预测装置的结构示意图,所述装置包括:数据获取模块21和最终趋势确定模块22;

所述数据获取模块21,用于获取目标指标的时间序列数据;

所述最终趋势确定模块22,用于将获取的所述目标指标的时间序列数据分别输入预设个数训练好的模型中,确定所述目标指标的最终趋势。

进一步地,在上述装置实施例的基础上,所述最终趋势确定模块22,具体用于:

将获取的所述目标指标的时间序列数据分别输入预设个数训练好的模型中,得到预设个数模型输出结果;

根据所述预设个数模型输出结果,确定所述目标指标的最终趋势。

进一步地,在上述装置实施例的基础上,所述预设个数模型输出结果包括:预设个数所述目标指标的趋势,以及预设个数分别与所述目标指标的趋势对应的相对平均误差率。

进一步地,在上述装置实施例的基础上,所述根据所述预设个数模型输出结果,确定所述目标指标的最终趋势,包括:

确定所述预设个数分别与所述目标指标的趋势对应的相对平均误差率中的最小相对平均误差率;

根据所述最小相对平均误差率,确定所述目标指标的最终趋势。

进一步地,在上述装置实施例的基础上,所述根据所述最小相对平均误差率,确定所述目标指标的最终趋势,包括:

根据所述最小相对平均误差率,确定与所述最小相对平均误差率对应的所述目标指标的趋势,以将所述与所述最小相对平均误差率对应的所述目标指标的趋势确定为所述目标指标的最终趋势。

图3为本发明一实施例提供的电子设备的逻辑框图;所述电子设备,包括:处理器(processor)31、存储器(memory)32和总线33;

其中,所述处理器31和存储器32通过所述总线33完成相互间的通信;所述处理器31用于调用所述存储器2中的程序指令,以执行上述方法实施例所提供的方法。

本发明实施例还提出一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机程序,所述计算机程序使所述计算机执行上述方法。

以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1