一种数据处理方法及装置与流程

文档序号:12158539阅读:190来源:国知局
一种数据处理方法及装置与流程

本申请涉及计算机和信息技术领域,尤其涉及一种数据处理方法及装置。



背景技术:

随着数据业务规模的增长,对业务数据进行提前预测对于数据业务的顺利进行起着越来越重要的作用,比如服务器只有提前预测好未来一段时间的业务数据,才能更好地预留资源,为用户提供服务。

在预测未来业务数据时,需要对已有的业务数据进行处理。比如,可以基于最近一段时间内的每个时间点(比如每一天)的业务数据的平均值来预测未来每个时间点的业务数据;这种方式通常只适用于短期预测,并且由于无法反映业务数据的变化规律,预测准确性较差。

另外一种预测方式是基于已有的业务数据,拟合出一个具体的预测模型,如自回归滑动平均模型(Auto-Regressive and Moving Average Model,ARMA),基于拟合出的预测模型来预测未来时间点的业务数据。这里所进行的预测模型拟合具体指的是,拟合出预测模型中的待估参数的取值,基于已知待估参数的取值的预测模型,即可进行后续业务数据的预测。这种预测方式只是单纯地基于每一个时间点的业务数据进行预测模型拟合匹配,由于在拟合之前没有掌控业务数据的趋势性或规律性信息,拟合难度较大,拟合出的模型通常也无法准确反映出业务数据的变化趋势或变化规律,预测结果准确性较差。

综上,现有技术进行业务数据预测的效率较低,准确性较差。



技术实现要素:

本申请实施例提供一种数据处理方法及装置,用以解决现有技术进行业务 数据预测的效率较低,准确性较差问题。

本申请实施例提供一种数据处理方法,包括:

服务器采集预设业务在多个预测周期内的不同时间点的业务数据;

基于所述预设业务在不同时间点的业务数据,确定所述预设业务在不同时间点的长期趋势数据和周期性趋势数据;其中,所述不同时间点的长期趋势数据反映业务数据在多个预测周期内的总的变化趋势,所述不同时间点的周期性趋势数据反映业务数据在每个预测周期内的变化趋势;

基于所述预设业务在不同时间点的长期趋势数据和周期性趋势数据,分别拟合出长期趋势预测模型和周期性趋势预测模型;

在需要预测出所述预设业务在未来预设时间点的业务数据时,分别基于拟合出的所述长期趋势预测模型和周期性趋势预测模型,确定出所述预设业务在未来预设时间点的长期趋势预测数据和周期性趋势预测数据;

将所述长期趋势预测数据和周期性趋势预测数据进行合并,确定出所述预设业务在未来预设时间点的业务数据。

可选地,所述服务器基于所述预设业务在不同时间点的业务数据,确定所述预设业务在不同时间点的长期趋势数据和周期性趋势数据,包括:

所述服务器基于所述预设业务在不同时间点的业务数据,确定所述预设业务在不同时间点的长期趋势数据;

基于所述预设业务在不同时间点的业务数据,以及确定的所述预设业务在不同时间点的长期趋势数据,确定所述预设业务在不同时间点的周期性趋势数据。

可选地,所述服务器基于所述预设业务在不同时间点的业务数据,确定所述预设业务在不同时间点的长期趋势数据,包括:

针对任一时间点,确定包括该任一时间点在内的一个预测周期内的业务数据的平均值,将确定的平均值作为所述预设业务在该任一时间点的长期趋势数据。

可选地,所述服务器根据以下公式确定所述预设业务在任一时间点的长期趋势数据:

其中,Tti表示所述预设业务在第i个时间点的长期趋势数据,L为预设周期,Yi-j为所述预设业务在第i-j个时间点的业务数据,L为奇数。

可选地,所述服务器基于所述预设业务在不同时间点的业务数据,确定所述预设业务在不同时间点的长期趋势数据,包括:

针对任一时间点,将包括该任一时间点在内的一个预测周期内的业务数据的平均值确定为所述预设业务在该任一时间点的长期趋势中间数据;

将在包括所述任一时间点在内的连续N个时间点的长期趋势中间数据的平均值,确定为所述预设业务在该任一时间点的长期趋势数据。

可选地,所述服务器根据以下公式确定所述预设业务在任一时间点的长期趋势数据:

或者,

或者,

其中,Tt2i表示所述预设业务在第i个时间点的长期趋势数据;Tt1i-n为所述预设业务在第i-n个时间点的长期趋势中间数据,Yi-n-j为所述预设业务在第i-n-j个时间点的业务数据;Tt1i+n为所述预设业务在第i+n个时间点的长期趋势中间数据,Yi+n-j为所述预设业务在第i+n-j个时间点的业务数据;L为预设周期,为奇数,k为正整数。

可选地,所述服务器根据以下公式确定所述预设业务在任一时间点的周期性趋势数据:

或者,

或者,

其中,St2i为所述预设业务在第i个时间点的周期性趋势数据;St1i-nL为所述预设业务在第i-nL个时间点的业务数据与在第i-nL个时间点的长期趋势数据之间的差值或商值;St1i+nL为所述预设业务在第i+nL个时间点的业务数据与在第i+nL个时间点的长期趋势数据之间的差值或商值;β为正整数;L为预设周期。

可选地,将所述长期趋势预测数据和周期性趋势预测数据进行合并,确定出预测的所述预设业务在未来预设时间点的业务数据,包括:

确定所述长期趋势预测数据和周期性趋势预测数据的和值,将确定的和值作为预测的所述预设业务在未来预设时间点的业务数据;或者,

确定所述长期趋势预测数据和周期性趋势预测数据的乘积,将确定的乘积作为预测的所述预设业务在未来预设时间点的业务数据。

本申请实施例提供一种数据处理装置,包括:

采集模块,用于采集预设业务在多个预测周期内的不同时间点的业务数据;

第一确定模块,用于基于所述预设业务在不同时间点的业务数据,确定所述预设业务在不同时间点的长期趋势数据和周期性趋势数据;其中,所述不同时间点的长期趋势数据反映业务数据在多个预测周期内的总的变化趋势,所述不同时间点的周期性趋势数据反映业务数据在每个预测周期内的变化趋势;

拟合模块,用于基于所述预设业务在不同时间点的长期趋势数据和周期性趋势数据,分别拟合出长期趋势预测模型和周期性趋势预测模型;

第二确定模块,用于在需要预测出所述预设业务在未来预设时间点的业务数据时,分别基于拟合出的所述长期趋势预测模型和周期性趋势预测模型,确定出所述预设业务在未来预设时间点的长期趋势预测数据和周期性趋势预测 数据;

第三确定模块,用于将所述长期趋势预测数据和周期性趋势预测数据进行合并,确定出所述预设业务在未来预设时间点的业务数据。

本申请实施例将采集的业务数据加工提炼成了长期趋势数据和周期性趋势数据,再分别基于这两种不同类型的趋势数据拟合出长期趋势预测模型和周期性趋势预测模型;由于提炼出的长期趋势数据用于反映业务数据在多个预测周期内的总的变化趋势,因此基于该长期趋势数据拟合长期趋势预测模型的效率及准确性较高;同理,由于周期性趋势数据用于反映业务数据在每个预测周期内的变化趋势,因此基于周期性趋势数据拟合周期性趋势预测模型的效率及准确性较高。并且,本申请实施例将基于长期趋势预测模型预测得到的长期趋势预测数据,和基于周期性趋势预测模型预测得到的周期性趋势预测数据进行合并,兼顾了业务数据的总的变化趋势和周期性变化趋势,因此得到的合并后的预测业务数据准确性较高。

附图说明

图1为本申请实施例一提供的数据处理方法流程图;

图2为本申请实施例二提供的数据处理方法流程图;

图3为本申请实施例三提供的数据处理方法流程图;

图4为本申请实施例四提供的数据处理方法流程图;

图5(a)为第一数据集合内不同时间点对应的业务数据示意图;

图5(b)为第一数据集合内不同时间点对应的长期趋势数据示意图;

图5(c)为第一数据集合内不同时间点对应的周期性趋势数据示意图;

图5(d)为第一数据集合内不同时间点对应的随机趋势数据示意图;

图6为本申请实施例五提供的数据处理装置结构示意图。

具体实施方式

本申请实施例中,服务器基于采集的预设业务在不同时间点的业务数据,确定在不同时间点的长期趋势数据和周期性趋势数据,其中长期趋势数据可以反映业务数据在多个预测周期内的总的变化趋势,周期性趋势数据可以反映业务数据在每个预测周期内的变化趋势;基于这两种不同类型的数据分别拟合出长期趋势预测模型和周期性趋势预测模型;基于拟合出的长期趋势预测模型和周期性趋势预测模型,得到预设业务在未来预设时间点的长期趋势预测数据和周期性趋势预测数据,再将得到的长期趋势预测数据和周期性趋势预测数据进行合并,确定出预测的业务数据。

可见,本申请实施例将采集的业务数据加工提炼成了长期趋势数据和周期性趋势数据,再分别基于这两种不同类型的趋势数据拟合出长期趋势预测模型和周期性趋势预测模型;由于提炼出的长期趋势数据用于反映业务数据在多个预测周期内的总的变化趋势,因此基于该长期趋势数据拟合长期趋势预测模型的效率及准确性较高;同理,由于周期性趋势数据用于反映业务数据在每个预测周期内的变化趋势,因此基于周期性趋势数据拟合周期性趋势预测模型的效率及准确性较高。并且,本申请实施例将基于长期趋势预测模型预测得到的长期趋势预测数据,和基于周期性趋势预测模型预测得到的周期性趋势预测数据进行合并,兼顾了业务数据的总的变化趋势和周期性变化趋势,因此得到的合并后的预测业务数据准确性较高。综上,本申请实施例可以实现未来业务数据的自动化预测,可以节省人工预测成本,提高预测效率及准确率,对于提前做好资源预留,预防业务风险起着重要作用。

下面结合说明书附图对本申请实施例作进一步详细描述。

实施例一

如图1所示,为本申请实施例一提供的数据处理方法流程图,包括以下步骤:

S101:服务器采集预设业务在多个预测周期内的不同时间点的业务数据。

在具体实施过程中,可以根据业务实际情况选择预测周期、统计时间单位 和统计时间长度。比如选择预测周期为一周,统计时间单位为一天,统计时间长度为12个预测周期,则这里的时间点也即为每一天。服务器采集多个预测周期内的不同时间点的业务数据,也即采集在12周内的每一天的业务数据,这里的业务数据可以指业务量(比如为交易金额或交易次数等)。

S102:基于所述预设业务在不同时间点的业务数据,确定所述预设业务在不同时间点的长期趋势数据和周期性趋势数据;其中,所述不同时间点的长期趋势数据反映业务数据在多个预测周期内的总的变化趋势,所述不同时间点的周期性趋势数据反映业务数据在每个预测周期内的变化趋势。

该步骤中,将预设业务在不同时间点的业务数据,分别加工提炼成长期趋势数据和周期性趋势数据。这里,长期趋势数据和周期性趋势数据分别是两种不同类型的数据,长期趋势数据反映业务数据在多个预测周期内的总的变化趋势,不体现周期性特点,因此,针对任一时间点,可以将包括该任一时间点在内的一个预测周期内的业务数据的平均值,作为所述预设业务在该任一时间点的长期趋势数据。而周期性趋势数据反映业务数据在每个预测周期内的变化趋势,体现周期性特点;针对任一时间点,可以基于预设业务在该时间点的业务数据和确定出的在该时间点的长期趋势数据,确定周期性趋势数据,比如,可以将预设业务在该时间点的业务数据与确定出的在该时间点的长期趋势数据的差值作为周期性趋势数据。

S103:基于所述预设业务在不同时间点的长期趋势数据和周期性趋势数据,分别拟合出长期趋势预测模型和周期性趋势预测模型。

这里,可以将回归滑动平均模型(Auto-Regressive and Moving Average Model,ARMA)或自回归积分滑动平均模型(Autoregressive Integrated Moving Average Model,ARIMA)作为长期趋势预测模型的样式,将HoltWinters模型作为周期性趋势预测模型的样式,基于得到的长期趋势数据和周期性趋势数据,分别拟合出这两种模型中的待估参数值。

S104:在需要预测出所述预设业务在未来预设时间点的业务数据时,分别 基于拟合出的所述长期趋势预测模型和周期性趋势预测模型,确定出所述预设业务在未来预设时间点的长期趋势预测数据和周期性趋势预测数据。

S105:将所述长期趋势预测数据和周期性趋势预测数据进行合并,确定出所述预设业务在未来预设时间点的业务数据。

这里,将所述长期趋势预测数据和周期性趋势预测数据合并后的数据作为预测的未来预设时间点的业务数据,该预测的业务数据同时兼顾了业务的长期趋势和周期性趋势特点。合并的方式有两种,具体可以是确定长期趋势预测数据和周期性趋势预测数据的和值,将确定的和值作为预测的所述预设业务在未来预设时间点的业务数据;或者,确定长期趋势预测数据和周期性趋势预测数据的乘积,将确定的乘积作为预测的所述预设业务在未来预设时间点的业务数据。

实施例二

如图2所示,为本申请实施例二提供的数据处理方法流程图,包括以下步骤:

S201:服务器采集预设业务在多个预测周期内的不同时间点的业务数据。

S202:针对任一时间点,确定包括该任一时间点在内的一个预测周期内的业务数据的平均值,将确定的平均值作为所述预设业务在该任一时间点的长期趋势数据。

这里,由于长期趋势数据需要反映业务数据在多个预测周期内的总的变化趋势,因此这里需要弱化周期性的变化趋势,可以将以该任一时间点作为中间时间点的一个预测周期内的业务数据的平均值作为所述预设业务在该任一时间点的长期趋势数据,此时需要该预测周期为奇数个时间点,当然,该任一时间点也可以不为中间时间点,只是这时候效果会差些。

具体地,服务器根据以下公式确定所述预设业务在任一时间点的长期趋势数据:

其中,Tti表示所述预设业务在第i个时间点的长期趋势数据,L为预设周期,Yi-j为所述预设业务在第i-j个时间点的业务数据,L为奇数。

经过上述处理,会造成一部分时间点上的长期趋势数据缺失(比如最近半个预测周期内的时间点上的长期趋势数据缺失),在具体实施中,可以预先补充一部分业务数据(具体可以采用已有的短期预测方式来预测这部分业务数据),以避免数据缺失。

S203:基于所述预设业务在不同时间点的业务数据,以及确定的所述预设业务在不同时间点的长期趋势数据,确定所述预设业务在不同时间点的周期性趋势数据。

这里,可以采用加法模型或乘法模型对业务数据进行拆分,若采用加法模型,针对任一时间点,可以直接将在该时间点的业务数据与确定出的长期趋势数据的差值作为在该时间点的周期性趋势数据;若采用乘法模型,则可以直接将业务数据与确定出的长期趋势数据的商值作为在该时间点的周期性趋势数据。

在具体实施中,业务数据的变化除具有长期性趋势和周期性趋势外,还有一定的随机性。因此,在确定周期性趋势数据时,除考虑长期趋势的影响外,还需要考虑随机性的影响,为此,本申请给出了取连续的几个预测周期内、同一相对位置上的时间点的所述差值的平均值作为所述周期性趋势数据。

具体地,服务器根据以下公式确定所述预设业务在任一时间点的周期性趋势数据St2i

或者,

或者,

其中,St2i为所述预设业务在第i个时间点的周期性趋势数据;St1i-nL为所 述预设业务在第i-nL个时间点的业务数据与在第i-nL个时间点的长期趋势数据之间的差值或商值;St1i+nL为所述预设业务在第i+nL个时间点的业务数据与在第i+nL个时间点的长期趋势数据之间的差值或商值;β为正整数;L为预设周期。

在具体实施中,可以根据业务数据实际情况选择β的取值,一般地,β可取1。

经过上述处理,会造成一部分时间点上的周期性趋势数据缺失(比如最近一个预测周期内的时间点上的周期性趋势数据缺失),在具体实施中,可以预先补充一部分业务数据(具体可以采用已有的短期预测方式来预测这部分业务数据),以避免数据缺失。

S204:基于所述预设业务在不同时间点的长期趋势数据和周期性趋势数据,分别拟合出长期趋势预测模型和周期性趋势预测模型。

在具体实施过程中,可以将ARMA(p,q)或ARIMA(p,d,q)作为长期趋势预测模型的样式,将HoltWinters模型作为周期性趋势预测模型的样式,基于得到的长期趋势数据和周期性趋势数据,分别拟合出这两种模型中的待估参数值。

具体地,ARMA(p,q)模型如下:

其中,Xt为第t个时间点的业务数据,Xt-i为第t-i个时间点的业务数据,at、at-i为随机扰动项,为待估参数;

或者,可以采用差分形式的ARIMA(p,d,q)模型:

其中ΔdXt是业务数据序列(第1~t个时间点对应的业务数据组成的序列)的d阶差分序列、ΔdXt-i是业务数据序列(第1~t-i个时间点对应的业务数据组成的序列)的d阶差分序列,其它参数的意义同ARMA(p,q)模型;这里, 可以采用极大似然法估计出参数的取值。

另外,HoltWinters模型的计算公式如下:

bt=γ(St-St-1)+(1-γ)bt-1

Ft+m=(St+btm)It-L+m

其中,α,β,γ为待估参数,Xt为第t个时间点的业务数据,bt、bt-1为趋势值,St、St-1为去除周期性因素的平滑值,L为预测周期,It、It-1为周期修正系数,Ft+m的计算公式用来预测第t+m(m为大于或等于1的正整数)个时间点的周期性趋势数据。

S205:在需要预测出所述预设业务在未来预设时间点的业务数据时,分别基于拟合出的所述长期趋势预测模型和周期性趋势预测模型,确定出所述预设业务在未来预设时间点的长期趋势预测数据和周期性趋势预测数据。

比如,采用确定出待估参数值的ARMA(p,q)模型来预测第t+1个时间点的长期趋势数据

这里,在ARMA(p,q)模型中,at的期望值为0。同理,若需要预测多个时间点(比如第t+2、t+3……)的长期趋势数据,则可以将已经预测出的时间点的长期趋势数据作为已知的该时间点的业务数据代入上式公式进行计算。

再比如,采用确定出待估参数值的HoltWinters模型来预测第t+m个时间点的周期性趋势数据:

S206:将所述长期趋势预测数据和周期性趋势预测数据进行合并,确定出所述预设业务在未来预设时间点的业务数据。

这里,可以将长期趋势预测数据和周期性趋势预测数据按照加法模型进行 合并,也即预测的业务数据=长期趋势预测数据+周期性趋势预测数据;或者,也可以将长期趋势预测数据和周期性趋势预测数据按照乘法模型进行合并,也即预测的业务数据=长期趋势预测数据×周期性趋势预测数据。

实施例三

如图3所示,为本申请实施例三提供的数据处理方法流程图,包括以下步骤:

S301:服务器采集预设业务在多个预测周期内的不同时间点的业务数据。

S302:针对任一时间点,将包括该任一时间点在内的一个预测周期内的业务数据的平均值确定为所述预设业务在该任一时间点的长期趋势中间数据;将在包括所述任一时间点在内的连续N个时间点的长期趋势中间数据的平均值,确定为所述预设业务在该任一时间点的长期趋势数据。

具体地,服务器根据以下公式确定所述预设业务在任一时间点的长期趋势数据:

或者,

或者,

其中,Tt2i表示所述预设业务在第i个时间点的长期趋势数据;Tt1i-n为所述预设业务在第i-n个时间点的长期趋势中间数据,Yi-n-j为所述预设业务在第i-n-j个时间点的业务数据;Tt1i+n为所述预设业务在第i+n个时间点的长期趋势中间数据,Yi+n-j为所述预设业务在第i+n-j个时间点的业务数据;L为预设周期,为奇数,k为正整数。

相比上述实施例二,本申请实施例针对任一时间点,在确定包括该时间点在内的一个预测周期内的业务数据的平均值后,并不是直接将该平均值作为该时间点对应的长期趋势数据,而是进一步对连续的几个时间点对应的长期趋势 数据取平均值,也即进一步对长期趋势数据进行平滑处理。

以下步骤的实施详见实施例二的描述,这里不再赘述。

S303:基于所述预设业务在不同时间点的业务数据,以及确定的所述预设业务在不同时间点的长期趋势数据,确定所述预设业务在不同时间点的周期性趋势数据。

具体地,服务器根据以下公式确定所述预设业务在任一时间点的周期性趋势数据St2i

或者,

或者,

其中,St2i为所述预设业务在第i个时间点的周期性趋势数据;St1i-nL为所述预设业务在第i-nL个时间点的业务数据与在第i-nL个时间点的长期趋势数据之间的差值或商值;St1i+nL为所述预设业务在第i+nL个时间点的业务数据与在第i+nL个时间点的长期趋势数据之间的差值或商值;β为正整数;L为预设周期。

S304:基于所述预设业务在不同时间点的长期趋势数据和周期性趋势数据,分别拟合出长期趋势预测模型和周期性趋势预测模型。

S305:在需要预测出所述预设业务在未来预设时间点的业务数据时,分别基于拟合出的所述长期趋势预测模型和周期性趋势预测模型,确定出所述预设业务在未来预设时间点的长期趋势预测数据和周期性趋势预测数据。

S306:将所述长期趋势预测数据和周期性趋势预测数据进行合并,确定出所述预设业务在未来预设时间点的业务数据。

在具体实施过程中,业务数据的变化除了具有上面描述的长期趋势和周期性趋势特性外,还具有一定的时间特性,比如节假日的业务数据与正常工作日及周末的业务数据明显不同,节假日的业务数据通常不再符合上述长期趋势和周期性趋势。为了体现业务数据的时间特性,在具体实施中,可以先将业务数 据按照时间属性进行拆分,针对符合长期趋势和周期性趋势的业务数据,比如正常工作日及周末的业务数据,执行上述模拟拟合处理,针对不符合长期趋势和周期性趋势的业务数据,比如节假日的业务数据,则可以根据节假日之前的工作日及周末的业务数据实际情况来预测。具体见下述实施例四的描述。

实施例四

如图4所示,为本申请实施例四提供的数据处理方法流程图,包括:

S401:服务器采集预设业务在多个预测周期内的不同时间点的业务数据。

S402:基于业务数据对应的时间点的属性(比如节假日或非节假日),将采集的不同时间点的业务数据,划分为第一数据集合和第二数据集合;其中,第一数据集合中的不同时间点具有第一属性(非节假日),该第一数据集合中不同时间点的业务数据具有长期趋势和周期性趋势,第二数据集合中的不同时间点具有第二属性(节假日),该第二数据集合中不同时间点的业务数据不具有长期趋势和周期性趋势。

在具体实施过程中,可以首先将采集的不同时间点的业务数据中的异常业务数据剔除,比如发生的异常大额数据、发生的异常小额数据等,再将剩余的业务数据拆分为第一数据集合和第二数据集合。这里的第一数据集合具体可以包括正常工作日及周末的时间点对应的业务数据,第二数据集合具体可以包括节假日对应的业务数据。

S403:针对第一数据集合对应的任一时间点,将包括该任一时间点在内的一个预测周期内的业务数据的平均值确定为所述预设业务在该任一时间点的长期趋势中间数据;将在包括所述任一时间点在内的连续N个时间点的长期趋势中间数据的平均值,确定为所述预设业务在该任一时间点的长期趋势数据。

具体地,可以根据以下公式确定任一时间点的长期趋势数据:

其中,Tt2i表示所述预设业务在第i个时间点的长期趋势数据;Tt1i为所述预设业务在第i个时间点的长期趋势中间数据,Yi-j为所述预设业务在第i-j个时间点的业务数据;Tt1i-1为所述预设业务在第i-1个时间点的长期趋势中间数据,Yi-1-j为所述预设业务在第i-1-j个时间点的业务数据;L为预设周期,为奇数。

S404:基于所述预设业务在第一数据集合内不同时间点的业务数据和长期趋势数据,确定所述预设业务在第一数据集合内不同时间点的周期性趋势数据。

具体地,可以根据以下公式确定预设业务在第一数据集合内的任一时间点的周期性趋势数据St2i

第一种,基于加法模型:

其中,St1i=Yti-Tt2i,这里,Yti为第i个时间点的业务数据。

第二种,基于乘法模型:

其中,

如图5(a)所示,为第一数据集合内不同时间点对应的业务数据示意图;图中,横坐标轴标识时间点,纵坐标值标识业务数据;图5(b)所示,为第一数据集合内不同时间点对应的长期趋势数据示意图;图5(c)所示,为第一数据集合内不同时间点对应的周期性趋势数据示意图;5(d)所示,为第一数据集合内不同时间点对应的随机趋势数据示意图(任一时间点的随机趋势数据是采用该时间点的业务数据减去长期趋势数据和周期性趋势数据后的数据,或者为采用时间点的业务数据除以长期趋势数据和周期性趋势数据后的数据)。

S405:基于所述预设业务在第一数据集合内不同时间点的长期趋势数据和周期性趋势数据,分别拟合出长期趋势预测模型和周期性趋势预测模型。

具体地,基于上述长期趋势数据,可以拟合得到长期趋势预测模型如下:

其中,Xt为第t个时间点的业务数据,Xt-i为第t-i个时间点的业务数据,at、at-i为随机扰动项,为待估参数;

或者,可以拟合得到差分形式的ARIMA(p,d,q)模型:

其中ΔdXt是业务数据序列(不同时间点对应的业务数据组成的序列)的d阶差分序列,其它参数的意义同ARMA(p,q)模型;这里,可以采用极大似然法估计出参数的取值。

另外,基于上述周期性趋势模型,可以拟合得到HoltWinters模型:

Ft+m=(St+btm)It-l+m

其中,

bt=γ(St-St-1)+(1-γ)bt-1

Ft+m=(St+btm)It-L+m

上述公式中,α,β,γ为待估参数,Xt为第t个时间点的业务数据,bt为趋势值,St为去除周期性因素的平滑值,L为预测周期,It为周期修正系数,Ft+m的计算公式用来预测第t+m个时间点的周期性趋势数据。

S406:在需要预测出所述预设业务在未来预设时间点的业务数据时,若该未来预设时间点具有第一属性,则分别基于拟合出的所述长期趋势预测模型和周期性趋势预测模型,确定出所述预设业务在未来预设时间点的长期趋势预测数据和周期性趋势预测数据。

比如,采用确定出待估参数值的ARMA(p,q)模型来预测第t+1个时间 点的长期趋势数据

采用确定出待估参数值的HoltWinters模型来预测第t+1个时间点的周期性趋势数据:

S407:将所述长期趋势预测数据和周期性趋势预测数据进行合并,确定出所述预设业务在未来预设时间点的业务数据。

比如,采用加法模型,确定出预测的业务数据

再比如,采用乘法模型,确定出预测的业务数据

S408:若该未来预设时间点具有第二属性,则根据距离该未来预设时间点最近的多个具有第一属性的时间点的业务数据,确定该未来预设时间点的业务数据。

在具体实施中,可以确定出在第一属性的时间点产生的业务数据平均值和在第二属性的时间点产生的业务数据平均值之间的比值,在预测未来第第二属性的时间点的业务数据时,根据距离该时间点最近的一些第一属性时间点的业务数据,以及确定出的所述比值,预测该时间点的业务数据。

比如,根据之前在小长假、长假产生的业务数据的经验值,总结计算出小长假、长假相对于正常工作日或周末的业务数据平均值的比值,从而根据时间上距离小长假、长假最近的一部分工作日或周末的业务数据(可以是真实产生的业务数据或预测的业务数据),计算出小长假、长假期间的预测业务数据。

在具体实施过程中,通常不只是预测一个时间点的业务数据,而是未来一段时间内的业务数据,这段时间内可能同时包括第一属性的时间点和第二属性的时间点,在具体实施中,分别得到各第一属性的时间点的预测业务数据,和各第二属性的时间点的预测业务数据后,将两者合并起来;在有需要的情况下,也可以增加月初效应和季度末效应等的特殊处理,得到最终完整的预测结果。

本申请实施例提供的上述业务数据预测方式可以适用于访问用户数、交易 笔数、金融产品使用次数、金额数量等多种业务数据的预测。可以协助规避资源流动性风险,避免出现资源临时性不足,保障业务的正常运行。

基于同一发明构思,本申请实施例中还提供了一种与数据处理方法对应的数据处理装置,由于该装置解决问题的原理与本申请实施例数据处理方法相似,因此该装置的实施可以参见方法的实施,重复之处不再赘述。

实施例五

如图6所示,为本申请实施例五提供的数据处理装置结构示意图,包括:

采集模块61,用于采集预设业务在多个预测周期内的不同时间点的业务数据;

第一确定模块62,用于基于所述预设业务在不同时间点的业务数据,确定所述预设业务在不同时间点的长期趋势数据和周期性趋势数据;其中,所述不同时间点的长期趋势数据反映业务数据在多个预测周期内的总的变化趋势,所述不同时间点的周期性趋势数据反映业务数据在每个预测周期内的变化趋势;

拟合模块63,用于基于所述预设业务在不同时间点的长期趋势数据和周期性趋势数据,分别拟合出长期趋势预测模型和周期性趋势预测模型;

第二确定模块64,用于在需要预测出所述预设业务在未来预设时间点的业务数据时,分别基于拟合出的所述长期趋势预测模型和周期性趋势预测模型,确定出所述预设业务在未来预设时间点的长期趋势预测数据和周期性趋势预测数据;

第三确定模块65,用于将所述长期趋势预测数据和周期性趋势预测数据进行合并,确定出预测的所述预设业务在未来预设时间点的业务数据。

可选地,所述第一确定模块62具体用于:

基于所述预设业务在不同时间点的业务数据,确定所述预设业务在不同时间点的长期趋势数据;基于所述预设业务在不同时间点的业务数据,以及确定的所述预设业务在不同时间点的长期趋势数据,确定所述预设业务在不同时间点的周期性趋势数据。

可选地,所述第一确定模块62具体用于:

针对任一时间点,确定包括该任一时间点在内的一个预测周期内的业务数据的平均值,将确定的平均值作为所述预设业务在该任一时间点的长期趋势数据。

可选地,所述第一确定模块62具体用于根据以下公式确定所述预设业务在任一时间点的长期趋势数据:

其中,Tti表示所述预设业务在第i个时间点的长期趋势数据,L为预设周期,Yi-j为所述预设业务在第i-j个时间点的业务数据,L为奇数。

可选地,所述第一确定模块62具体用于:

针对任一时间点,将包括该任一时间点在内的一个预测周期内的业务数据的平均值确定为所述预设业务在该任一时间点的长期趋势中间数据;将在包括所述任一时间点在内的连续N个时间点的长期趋势中间数据的平均值,确定为所述预设业务在该任一时间点的长期趋势数据。

可选地,所述第一确定模块62具体用于根据以下公式确定所述预设业务在任一时间点的长期趋势数据:

或者,

或者,

其中,Tt2i表示所述预设业务在第i个时间点的长期趋势数据;Tt1i-n为所述预设业务在第i-n个时间点的长期趋势中间数据,Yi-n-j为所述预设业务在第i-n-j个时间点的业务数据;Tt1i+n为所述预设业务在第i+n个时间点的长期趋势中间数据,Yi+n-j为所述预设业务在第i+n-j个时间点的业务数据;L为预设周期,为奇数,k为正整数。

可选地,所述第一确定模块62具体用于根据以下公式确定所述预设业务在任一时间点的周期性趋势数据:

或者,

或者,

其中,St2i为所述预设业务在第i个时间点的周期性趋势数据;St1i-nL为所述预设业务在第i-nL个时间点的业务数据与在第i-nL个时间点的长期趋势数据之间的差值或商值;St1i+nL为所述预设业务在第i+nL个时间点的业务数据与在第i+nL个时间点的长期趋势数据之间的差值或商值;β为正整数;L为预设周期。

可选地,所述第三确定模块65具体用于:

确定所述长期趋势预测数据和周期性趋势预测数据的和值,将确定的和值作为预测的所述预设业务在未来预设时间点的业务数据;或者,确定所述长期趋势预测数据和周期性趋势预测数据的乘积,将确定的乘积作为预测的所述预设业务在未来预设时间点的业务数据。

本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、装置(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一 个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。

显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1