模型生成方法、装置及设备与流程

文档序号:21322170发布日期:2020-06-30 20:54阅读:194来源:国知局
模型生成方法、装置及设备与流程

本发明涉及时间序列数据处理的技术领域,尤其涉及模型生成方法、装置及设备。



背景技术:

所谓时间序列,是按时间的顺序记录的一列有序数据,对时间序列进行观察、研究,可以发现有价值的规律性信息,并可利用发现的规律性信息对将来的时间序列进行预测。例如,时间序列可以为每个时间点的电力负荷值,或者每个时间点的交通流量值,或者每个时间点的产品销量值等。

自回归移动平均模型(autoregressivemovingaveragemodel,arma模型)对平稳时间序列具有很好的拟合效果,因此,目前可以采用arma模型进行建模,获得用于预测被观察对象未来时间序列的目标arma模型。然而,建模过程中需要人工通过观察自相关函数图和偏自相关函数图,并根据人工经验来确定arma模型的阶数,以获得适当的目标arma模型。采用人工定阶而得的目标arma模型对未来数据进行预测,模型生成过程低效且预测结果准确性低。



技术实现要素:

为克服相关技术中存在的问题,本发明提供了模型生成方法、装置及设备。

根据本发明实施例的第一方面,提供一种模型生成方法,所述方法包括:

获取平稳时间序列;

利用所述平稳时间序列在不同阶数下的自相关系数和偏自相关系数确定至少两个(p,q)对,p和q分别为arma模型的自相关阶数和移动平均阶数;

针对每个(p,q)对,确定该(p,q)对对应的参考arma模型,并确定所述参考arma模型的模型指标参数;

依据各个参考arma模型的模型指标参数确定目标arma模型。

在一个实施例中,所述获取平稳时间序列,包括:

获取时间序列;

检查所述时间序列是否满足平稳趋势条件,若满足,将所述时间序列确定为所述平稳时间序列;

若不满足,对所述时间序列进行平稳化处理,并在处理后的序列满足平稳趋势条件时,将处理后的序列作为所述平稳时间序列。

在一个实施例中,所述对所述时间序列进行平稳化处理,包括:

对所述时间序列进行第一处理得到第一序列,所述第一处理为一阶差分处理;

若所述第一序列不满足平稳趋势条件,则对第一序列进行第二处理得到第二序列;其中,当所述第一序列中的数据按周期发生变化时,所述第二处理包括:步长为所述周期的差分处理、二阶差分处理,否则,所述第二处理包括:二阶差分处理;

若所述第二序列仍不满足平稳趋势条件,则依据外部控制操作对所述第二序列进行平稳化处理。

在一个实施例中,所述利用所述平稳时间序列在不同阶数下的自相关系数和偏自相关系数确定至少两个(p,q)对,包括:

按阶数递增的顺序依次判断各阶数的自相关系数是否满足指定条件,将第一个满足指定条件的自相关系数的阶数作为p的上限值,将预设值作为p的下限值;

按阶数递增的顺序依次判断各阶数的偏自相关系数是否满足指定条件,将第一个满足指定条件的偏自相关系数的阶数作为q的上限值,将预设值作为q的下限值;

根据由p的上限值、下限值组成的p的取值范围、以及由q的上限值、下限值组成的q的取值范围构建至少两个(p,q)对,其中,p和q不同时为0。

在一个实施例中,所述模型指标参数为:贝叶斯信息度量bic值、以及所述参考arma模型与指定时间序列之间的平均绝对误差mae;

所述依据各个参考arma模型的模型指标参数确定目标arma模型,包括:

选择bic值最小的m个参考arma模型,从m个参考arma模型中选择mae最小的一个参考arma模型,将选择的一个参考arma模型作为目标arma模型,该选择的一个参考arma模型对应的(p,q)对为目标arma模型的最佳阶数。

根据本发明实施例的第二方面,提供一种模型生成装置,所述装置包括:

序列获取模块,用于获取平稳时间序列;

阶数对确定模块,用于利用所述平稳时间序列在不同阶数下的自相关系数和偏自相关系数确定至少两个(p,q)对,p和q分别为arma模型的自相关阶数和移动平均阶数;

模型确定模块,用于针对每个(p,q)对,确定该(p,q)对对应的参考arma模型,并确定所述参考arma模型的模型指标参数;

模型筛选模块,用于依据各个参考arma模型的模型指标参数确定目标arma模型。

在一个实施例中,所述序列获取模块具体用于:

获取时间序列;

检查所述时间序列是否满足平稳趋势条件,若满足,将所述时间序列确定为所述平稳时间序列;

若不满足,对所述时间序列进行平稳化处理,并在处理后的序列满足平稳趋势条件时,将处理后的序列作为所述平稳时间序列。

在一个实施例中,所述序列获取模块具体用于:

对所述时间序列进行第一处理得到第一序列,所述第一处理为一阶差分处理;

若所述第一序列不满足平稳趋势条件,则对第一序列进行第二处理得到第二序列;其中,当所述第一序列中的数据按周期发生变化时,所述第二处理包括:步长为所述周期的差分处理、二阶差分处理,否则,所述第二处理包括:二阶差分处理;

若所述第二序列仍不满足平稳趋势条件,则依据外部控制操作对所述第二序列进行平稳化处理。

在一个实施例中,所述阶数对确定模块,具体用于:

按阶数递增的顺序依次判断各阶数的自相关系数是否满足指定条件,将第一个满足指定条件的自相关系数的阶数作为p的上限值,将预设值作为p的下限值;

按阶数递增的顺序依次判断各阶数的偏自相关系数是否满足指定条件,将第一个满足指定条件的偏自相关系数的阶数作为q的上限值,将预设值作为q的下限值;

根据由p的上限值、下限值组成的p的取值范围、以及由q的上限值、下限值组成的q的取值范围构建至少两个(p,q)对,其中,p和q不同时为0。

在一个实施例中,所述模型指标参数为:贝叶斯信息度量bic值、以及所述参考arma模型与指定时间序列之间的平均绝对误差mae;

所述模型筛选模块,具体用于:选择bic值最小的m个参考arma模型,从m个参考arma模型中选择mae最小的一个参考arma模型,将选择的一个参考arma模型作为目标arma模型,该选择的一个参考arma模型对应的(p,q)对为目标arma模型的最佳阶数。

根据本发明实施例的第三方面,提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述程序时实现上述任一项方法。

本发明的实施例提供的技术方案可以包括以下有益效果:

本发明实施例利用平稳时间序列在不同阶数下的自相关系数和偏自相关系数确定至少两个(p,q)对,实现(p,q)对的构建,由于p和q分别为arma模型的自相关阶数和移动平均阶数,因此,针对每个(p,q)对,确定该(p,q)对对应的参考arma模型,并确定参考arma模型的模型指标参数,依据各个参考arma模型的模型指标参数确定目标arma模型,提高模型的生成效率,并避免引入人为因素导致模型预测准确率低的缺陷。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。

附图说明

此处的附图被并入发明中并构成本发明的一部分,示出了符合本发明的实施例,并与发明一起用于解释本发明的原理。

图1是本发明根据一示例性实施例示出的一种模型生成的流程图。

图2是本发明模型生成装置所在计算机设备的一种硬件结构图。

图3是本发明根据一示例性实施例示出的一种模型生成装置的框图。

具体实施方式

这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。

在本发明使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解,尽管在本发明可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本发明范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。

所谓时间序列,可以是按照时间的顺序记录的一列有序数据。对时间序列进行观察、研究,找寻它变化发展的规律,预测它将来的走势就是时间序列分析。时间序列分析可以广泛应用于日常生产、生活中,例如,可以进行产品销量、人流量、车流量等分析。相关技术采用arma模型进行建模时,先根据历史的时间序列的样本自相关系数和样本偏自相关系数,绘制自相关函数图和偏自相关函数图,人工观察自相关函数图和偏自相关函数图,根据人工经验确定什么情况下该看作相关系数截尾,什么情况下该看作相关系数在延迟若干阶之后正常衰减到零值附近做拖尾波动,从而确定arma模型的自相关阶数(p)和移动平均阶数(q)。依靠人为经验,具有很强的人为因素影响,不仅模型生成效率低,而且利用该模型进行预测的预测结果准确性低。

本发明实施例提供一种提高模型生成效率、且模型预测准确率的模型生成方案,以下结合附图对本发明实施例进行示例说明。

如图1所示,是本发明根据一示例性实施例示出的一种模型生成的流程图,所述方法包括:

在步骤102中,获取平稳时间序列;

在步骤104中,利用所述平稳时间序列在不同阶数下的自相关系数和偏自相关系数确定至少两个(p,q)对,p和q分别为arma模型的自相关阶数和移动平均阶数;

在步骤106中,针对每个(p,q)对,确定该(p,q)对对应的参考arma模型,并确定所述参考arma模型的模型指标参数;

在步骤108中,依据各个参考arma模型的模型指标参数确定目标arma模型。

所述方法可以应用于电子设备中,电子设备可以是智能手机、平板电脑等移动设备,也可以是pc、服务器等具有处理能力的计算机设备。

其中,平稳时间序列可以是被观察对象的平稳时间序列,也可以称为观察值序列、观察时间序列数据等。被观察对象可以是需对未来时间序列进行预测的业务对象,例如,被观察对象可以是某区域人流量、某区域车流量、某产品销量等,具体根据需求进行设置。

平稳时间序列可以有两种定义,根据限制条件的严格程度,可以分为严平稳时间序列和宽平稳时间序列。所谓严平稳时间序列,认为只有当序列所有的统计性质都不会随着时间的推移而发生变化时,该序列才能被认为平稳。所谓宽平稳时间序列,认为序列的统计性质主要由它的低阶矩决定,只要保证序列低阶矩平稳,就能保证序列的主要性质近似平稳。在一个实施例中,所述平稳时间序列可以是宽平稳时间序列。

本实施例利用平稳时间序列进行模型建立,而获得平稳时间序列的方式有很多种。在一个实施例中,可以获取时间序列,并对时间序列进行平稳性检验,通过检查时间序列是否满足平稳趋势条件,以判断时间序列是否稳定。对序列的平稳性检验有多种方法,例如,可以根据时序图和自相关图显示的特征做出判断的图检验方法,也可以是构造检验统计量进行加色检验的方法等。

在一个实施例中,可以采用adf(augmentdickey-fuller)检验法检查所述时间序列是否满足平稳趋势条件。adf检验是一种单位根检验,单位根检验是指检验序列中是否存在单位根,若存在单位根,则该序列为非平稳时间序列。具体如何利用adf检验法检查时间序列是否满足平稳趋势条件可以参考现有技术,在此不做限制。

若时间序列满足平稳趋势条件,将时间序列确定为平稳时间序列。若时间序列不满足平稳趋势条件,对时间序列进行平稳化处理,并在处理后的序列满足平稳趋势条件时,将处理后的序列作为所述平稳时间序列。平稳化处理是将非平稳序列转换为平稳序列的处理。

可见,该实施例可以实现自动化将非平稳时间序列转换为平稳时间序列,提高处理效率。

在一个实施例中,所述平稳化处理包括普通差分处理,普通差分处理的步长为1。而实际应用中,针对某些时间序列,特别是针对具有周期性的时间序列,采用普通差分处理可能很难将非平稳序列转换为平稳序列,鉴于此,在一个实施例中,平稳化处理包括步长为时间序列的周期的差分处理(简称周期差分处理)。

例如,对于时间序列:x1,x2,x3,…,xn,…

一阶差分:

二阶差分:

而某些被观察对象的序列具有周期性,例如季节周期、日周期、月周期等。针对具有周期性的序列,可以以步长为周期的差分运算进行平稳化处理。例如,周期为l的一阶l步长差分:

其中,针对序列具有周期性的被观察对象,时间序列的周期可以预先设定。例如,根据历史记录进行大数据分析,获得该序列的周期,并作为差分步长,可以存储周期与被观察对象的映射关系。

鉴于此,在一个实施例中,所述平稳化处理包括步长为1的差分处理(简称普通差分处理),和/或,步长为时间序列的周期长度的差分处理(简称周期差分处理)。针对数据不按周期发生变化的时间序列采用普通差分处理。针对数据按周期发生变化的时间序列,可以仅采用周期差分处理;也可以仅采用普通差分处理;还可以既采用周期差分处理,又采用普通差分处理,具体根据需求设置。

本实施例不仅可以采用普通差分处理,还可以采用周期差分处理,可以加快不平稳序列转换为平稳序列的效率,提高将不平稳序列转换为平稳序列的可能性。

实际应用中,某些非平稳序列可能很难转换为平稳序列,而重复进行差分处理可能导致资源浪费,鉴于此,在一个实施例中,还可以设置差分处理次数,以快速结束平稳化处理,避免一直差分处理导致资源浪费。对时间序列进行差分处理,在对时间序列进行差分处理的次数达到设定次数阈值时,若差分处理后的时间序列仍不满足平稳趋势条件,则依据外部控制操作对差分处理后的时间序列进行平稳化处理,或者输出时间序列不平稳的提醒信息等。例如,差分处理次数可以设置为3次,如果3次差分处理后序列仍未平稳,则依据外部控制操作对差分处理后的时间序列进行平稳化处理,或结束该时间序列的平稳化处理。例如,可以输出该历史时间序列数据不平稳的提醒信息,以提醒用户进行人工平稳化处理。

以下以其中一种组合进行示例说明。所述对所述时间序列进行平稳化处理,包括:

对所述时间序列进行第一处理得到第一序列,所述第一处理为一阶差分处理;

若所述第一序列不满足平稳趋势条件,则对第一序列进行第二处理得到第二序列;其中,当所述第一序列中的数据按周期发生变化时,所述第二处理包括:步长为所述周期的差分处理、二阶差分处理,否则,所述第二处理包括:二阶差分处理;

若所述第二序列仍不满足平稳趋势条件,则依据外部控制操作对所述第二序列进行平稳化处理。

其中,时间序列中的数据是否按周期发生变化,可以直接依据时间序列中时间点与观察值的关系而确定,也可以通过时间序列所属被观察对象是否在预设对象集合中来判定。预设对象集合可以是预先设置的时间序列具有周期性的观察对象的集合。而关于如何确定预设对象集合,可以是基于用户设置指令确定,也可以是记录该对象的历史时间序列而确定等。例如,每小时车流量的周期可以是24h,因此,可以判定车流量的序列具有周期性。又如,依据被观察对象的历史时间序列,绘制时间序列图,纵坐标为数据量,横坐标为时间,从而根据时间序列图来判断该对象是否是时间序列具有周期性的对象。

在每次差分处理(普通差分处理/周期差分处理)后,可以对差分处理后的序列进行平稳性检验,若差分处理后的序列不满足平稳趋势条件,即差分处理后的序列不平稳,则进行下一次差分处理或停止差分处理;若差分处理后的序列满足平稳趋势条件,即差分处理后的序列平稳,则将该序列作为平稳时间序列。以下以一个例子进行示例说明:

对时间序列进行一阶差分处理,获得第一序列。假设历史时间序列数据为:x1,x2,x3,…,xn,…,则一阶差分处理如下:

若通过平稳性检验判定第一序列不平稳、且第一序列中的数据按周期发生变化,则对第一序列进行周期差分处理。假设第一序列为:x′1,x′2,x′3,…,x′n,…,第一序列的周期为l,则周期差分处理如下:

若通过平稳性检验判定周期差分处理后的序列不平稳,则对周期差分处理后的序列进行二阶差分处理。假设周期差分处理后的序列为:x″1,x″2,x″3,…,x″n,…,则二阶差分处理如下:

由上述实施例可见,针对具有周期性的序列,依次采用一阶差分、周期差分以及二阶差分处理,可以加速将非平稳序列转换为平稳序列的效率。

在获得平稳时间序列后,可以计算平稳时间序列在不同阶数下的样本自相关系数和偏自相关系数。例如,采用样本自相关函数和偏自相关函数计算时间序列的样本自相关系数和偏自相关系数。如:假设时间序列为:x1,x2,x3,…,xn,…,样本自相关函数如下:

偏自相关函数如下:

其中

表示阶数为k的情况下的样本自相关系数;表示阶数为k的情况下的偏自相关系数。

当样本容量n充分大时,样本自相关系数近似服从正态分布,偏自相关系数也服从正态分布:

因此,可以依据样本自相关系数和偏自相关系数的样本分布函数,分别获得p和q的最大取值,以预设值作为p和q的下限值,并根据由p的上限值、下限值组成的p的取值范围、以及由q的上限值、下限值组成的q的取值范围构建至少两个(p,q)对。其中,根据阶数与样本自相关系数的映射关系,可以获得样本自相关系数的样本分布函数,进而获得样本自相关系数的分布规律,根据分布规律可以确定p的最大取值。根据阶数与偏自相关系数的映射关系,可以获得偏自相关系数的样本分布函数,进而获得偏自相关系数的分布规律,根据分布规律可以确定q的最大取值。

在一个实施例中,所述利用所述平稳时间序列在不同阶数下的自相关系数和偏自相关系数确定至少两个(p,q)对,包括:

按阶数递增的顺序依次判断各阶数的自相关系数是否满足指定条件,将第一个满足指定条件的自相关系数的阶数作为p的上限值,将预设值作为p的下限值;

按阶数递增的顺序依次判断各阶数的偏自相关系数是否满足指定条件,将第一个满足指定条件的偏自相关系数的阶数作为q的上限值,将预设值作为q的下限值;

根据由p的上限值、下限值组成的p的取值范围、以及由q的上限值、下限值组成的q的取值范围构建至少两个(p,q)对,其中,p和q不同时为0。

自相关函数和偏自相关函数往往会随着阶数的增加而迅速衰减至0。并且,可以利用标准差或指定置信区间来辅助判断相关函数是否显著为0,标准差为阶数的倒数。针对样本自相关系数,将第一个显著为0的样本自相关系数对应的阶数作为p的取值范围的上限值;针对偏自相关系数,将第一个显著为0的偏自相关系数对应的阶数作为q的取值范围的上限值。p的上限值可以使样本自相关函数的值落在指定置信区间,q的上限值可以使偏自相关函数的值落在指定置信区间。

在一个例子中,满足指定条件的自相关系数是指:大于其阶数相关联的关联值、且至少预设比例的其他自相关系数小于所述关联值,所述至少预设比例的其他自相关系数的阶数大于该满足指定条件的自相关系数的阶数,所述关联值为该满足指定条件的自相关系数的阶数的倒数的m1倍。如m1倍可以是2倍数,也可以是3倍数,关联值可以是2倍或3倍标准差,标准差为满足指定条件的自相关系数的阶数的倒数。预设比例可以是95%。在该实施例中,满足指定条件的自相关系数明显超过关联值、而后95%的自相关系数小于关联值,选取最大的p值使得之后的自相关函数值落在95%置信区间,此即p能取到的最大值。

相应的,满足指定条件的偏自相关系数是指:大于其阶数相关联的关联值、且至少预设比例的其他偏自相关系数小于所述关联值,所述至少预设比例的其他偏自相关系数的阶数大于该满足指定条件的偏自相关系数的阶数,所述关联值为该满足指定条件的偏自相关系数的阶数的倒数的m1倍。如m1倍可以是2倍数,也可以是3倍数,关联值可以是2倍或3倍标准差,标准差为满足指定条件的偏自相关系数的阶数的倒数。预设比例可以是95%。在该实施例中,满足指定条件的偏自相关系数明显超过关联值、而后95%的偏自相关系数小于关联值,选取最大的q值使得之后的偏自相关函数值落在95%置信区间,此即q能取到的最大值。

其中,q的取值范围的下限值可以是0,p的取值范围的下限值也可以是0,在构建样本(p,q)对,只要p和q不同时取值为0即可。每一阶数对应一个样本自相关系数,也对应一个标准差。

可见,该实施例通过某阶数下的标准差来判断该阶数下的样本自相关系数是否显著为0,从而选择出合适阶数作为p的最大取值,通过某阶数下的标准差来判断该阶数下的偏自相关系数是否显著为0,从而选出合适阶数作为q的最大取值,实现自动确定p和q的取值范围。

从p的取值范围中进行取值,从q的取值范围中进行取值,构成所有可能的(p,q)对。循环遍历所有(p,q)对,针对每个(p,q)对建立相应arma(p,q)模型,为了与后续目标arma模型区分,可以称为参考arma模型,并确定参考arma模型的模型指标参数。在该实施例中,针对每个(p,q)对,将(p,q)对分别作为arma模型中的p和q,针对已知阶数的arma模型进行参数估计、模型检验等处理,获得参考arma模型,并确定参考arma模型的模型指标参数。模型指标参数是用于评价模型好坏的参数。在一个实施例中,模型指标参数可以包括:bic值(bayesianinformationcriterion,贝叶斯信息度量)、以及所述参考arma模型与指定时间序列之间的平均绝对误差mae。在获得参考arma模型后可以输出bic值。利用指定时间序列计算参考arma模型的平均绝对误差(meanabsoluteerror,mae)。例如,将训练好的参考arma模型对指定时间序列中每个时间点对应的值进行预测,将预测值与指定时间序列中实际值进行比较,即可得到mae。

本实施例将平均绝对误差以及bic值作为筛选参考arma模型的指标,进而得到arma模型的最佳阶数,结合平均绝对误差以及bic值从所有参考arma模型中确定目标arma模型。在一个例子中,可以先考虑bic值,再考虑平均绝对误差;在另一个例子中,也可以先考虑平均绝对误差,再考虑bic值。例如,可以选择bic值最小的m个参考arma模型,从m个参考arma模型中选择mae最小的一个参考arma模型,将选择的一个参考arma模型作为目标arma模型,该选择的一个参考arma模型对应的(p,q)对为目标arma模型的最佳阶数。作为一种优选方案,m可以取值为3。

可见,通过选取三组使bic值最小的(p,q),再从这三组中选择使mae最小的(p,q)对,以此作为最佳阶数选择。

在获得目标arma模型后,目标arma模型可以用于预测被观察对象在未来时间段内的时间序列。在应用阶段,可以利用目标arma模型预测被观察对象在未来时间段内的时间序列。在预测未来时间序列时,若步骤102中的平稳时间序列直接是被观察对象的时间序列,则直接将目标arma模型输出的结果作为被观察对象在未来时间段内的时间序列。若步骤102中的平稳时间序列通过平稳化处理而得,则将目标arma模型输出的结果进行与平稳化处理相对应的处理,从而获得被观察对象在未来时间段内的时间序列。

由上述实施例可见,序列差分平稳过程实现集成自动化处理,无需人为干预即可实现将序列转化为平稳序列进行分析处理。同时,实现平稳序列自动定阶过程,无需人为参与,提高预测效率和准确性。

以上实施方式中的各种技术特征可以任意进行组合,只要特征之间的组合不存在冲突或矛盾,但是限于篇幅,未进行一一描述,因此上述实施方式中的各种技术特征的任意进行组合也属于本发明公开的范围。

与前述模型生成方法的实施例相对应,本发明还提供了模型生成装置及其所应用的电子设备的实施例。

本发明模型生成装置的实施例可以应用在计算机设备。装置实施例可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。以软件实现为例,作为一个逻辑意义上的装置,是通过其所在计算机设备的处理器将非易失性存储器中对应的计算机程序指令读取到内存中运行形成的。从硬件层面而言,如图2所示,是本发明模型生成装置所在计算机设备的一种硬件结构图,除了图2所示的处理器210、网络接口220、内存230、以及非易失性存储器240之外,实施例中模型生成装置231所在的计算机设备通常根据该设备的实际功能,还可以包括其他硬件,对此不再赘述。

如图3所示,是本发明根据一示例性实施例示出的一种模型生成装置的框图,所述装置包括:

序列获取模块32,用于获取平稳时间序列;

阶数对确定模块34,用于利用所述平稳时间序列在不同阶数下的自相关系数和偏自相关系数确定至少两个(p,q)对,p和q分别为arma模型的自相关阶数和移动平均阶数;

模型确定模块36,用于针对每个(p,q)对,确定该(p,q)对对应的参考arma模型,并确定所述参考arma模型的模型指标参数;

模型筛选模块38,用于依据各个参考arma模型的模型指标参数确定目标arma模型。

在一个实施例中,所述序列获取模块32具体用于:

获取时间序列;

检查所述时间序列是否满足平稳趋势条件,若满足,将所述时间序列确定为所述平稳时间序列;

若不满足,对所述时间序列进行平稳化处理,并在处理后的序列满足平稳趋势条件时,将处理后的序列作为所述平稳时间序列。

在一个实施例中,所述序列获取模块32具体用于:

对所述时间序列进行第一处理得到第一序列,所述第一处理为一阶差分处理;

若所述第一序列不满足平稳趋势条件,则对第一序列进行第二处理得到第二序列;其中,当所述第一序列中的数据按周期发生变化时,所述第二处理包括:步长为所述周期的差分处理、二阶差分处理,否则,所述第二处理包括:二阶差分处理;

若所述第二序列仍不满足平稳趋势条件,则依据外部控制操作对所述第二序列进行平稳化处理。

在一个实施例中,所述阶数对确定模块34,具体用于:

按阶数递增的顺序依次判断各阶数的自相关系数是否满足指定条件,将第一个满足指定条件的自相关系数的阶数作为p的上限值,将预设值作为p的下限值;

按阶数递增的顺序依次判断各阶数的偏自相关系数是否满足指定条件,将第一个满足指定条件的偏自相关系数的阶数作为q的上限值,将预设值作为q的下限值;

根据由p的上限值、下限值组成的p的取值范围、以及由q的上限值、下限值组成的q的取值范围构建至少两个(p,q)对,其中,p和q不同时为0。

在一个实施例中,所述模型指标参数为:贝叶斯信息度量bic值、以及所述参考arma模型与指定时间序列之间的平均绝对误差mae;

所述模型筛选模块38,具体用于:选择bic值最小的m个参考arma模型,从m个参考arma模型中选择mae最小的一个参考arma模型,将选择的一个参考arma模型作为目标arma模型,该选择的一个参考arma模型对应的(p,q)对为目标arma模型的最佳阶数。

对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本发明方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。

相应的,本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述程序时实现如下方法:

获取平稳时间序列;

利用所述平稳时间序列在不同阶数下的自相关系数和偏自相关系数确定至少两个(p,q)对,p和q分别为arma模型的自相关阶数和移动平均阶数;

针对每个(p,q)对,确定该(p,q)对对应的参考arma模型,并确定所述参考arma模型的模型指标参数;

依据各个参考arma模型的模型指标参数确定目标arma模型。

本发明中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于设备实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

相应的,本发明实施例还提供一种计算机存储介质,所述存储介质中存储有程序指令,所述程序指令包括:

获取平稳时间序列;

利用所述平稳时间序列在不同阶数下的自相关系数和偏自相关系数确定至少两个(p,q)对,p和q分别为arma模型的自相关阶数和移动平均阶数;

针对每个(p,q)对,确定该(p,q)对对应的参考arma模型,并确定所述参考arma模型的模型指标参数;

依据各个参考arma模型的模型指标参数确定目标arma模型。

本发明实施例可采用在一个或多个其中包含有程序代码的存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。计算机可用存储介质包括永久性和非永久性、可移动和非可移动媒体,可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括但不限于:相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。

本领域技术人员在考虑发明及实践这里申请的发明后,将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未申请的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。

应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1