一种数据预测系统及方法与流程

文档序号:14991615发布日期:2018-07-20 22:20阅读:266来源:国知局

本申请涉及数据预测技术领域,具体而言,涉及一种数据预测系统及方法。



背景技术:

对金融市场(比如股票市场)进行分析和预测,是金融投资中的核心问题,对经济市场进行分析和预测,是宏观调控中的核心问题。在金融领域以及经济领域进行数据预测时,均会涉及到各种频率的数据。其中,上述各种频率的数据不仅可以包括低频数据,如季度数据,还可以包括高频数据,如周数据、月度数据等,甚至还可以包括超高频数据,如实时数据等。可见,随着越来越精细的时间刻度来收集的数据的频率也越来越高。

为了便于利用上述各种频率的数据进行预测,相关技术中提供的数据预测方法首先将高频数据按照低频数据对应的频次取平均值,然后基于平均后的高频数据预测低频数据。

可见,相关技术中的数据预测方法采用直接平均的方式进行数据转换,在高频数据(如月度数据)中,各月的观测数据值有大也有小的情况下,对应的转换结果为定值,高频数据中的相关信息(如趋势信息)将会丢失,从而导致预测的准确率和可靠性均较差。



技术实现要素:

有鉴于此,本申请的目的在于提供一种数据预测系统及方法,以提高数据预测的准确度和可靠性。

第一方面,本申请提供了一种数据预测系统,所述系统包括:

高频数据获取模块,用于获取待预测时间段的低频数据对应的高频数据;

预测模型提取模块,用于从预先训练好的高频数据预测模型集以及数据预测模型集中,提取与所述待预测时间段相匹配的高频数据预测模型子集以及数据预测模型;

低频数据预测模块,用于利用所述低频数据对应的高频数据、提取的高频数据预测模型子集以及数据预测模型,得到所述低频数据的预测结果。

结合第一方面,本申请提供了第一方面的第一种可能的实施方式,其中,所述系统还包括高频数据预测模型集构建模块,所述高频数据预测模型集构建模块包括:

数据获取单元,用于获取目标时间段的低频数据,以及所述目标时间段的多类高频数据,每类高频数据对应有至少一个高频数据;

单类高频数据预测模型训练单元,用于针对任一类高频数据,将所述任一类高频数据对应的至少一个高频数据的取值作为自变量,将所述低频数据的取值作为因变量进行训练,得到所述目标时间段的单类高频数据预测模型;

高频数据预测模型集构建单元,用于依据多个单类高频数据预测模型构建所述高频数据预测模型子集,依据多个目标时间段的高频数据预测模型子集构建所述高频数据预测模型集。

结合第一方面的第一种可能的实施方式,本申请提供了第一方面的第二种可能的实施方式,其中,所述系统还包括数据预测模型集构建模块,所述数据预测模型集构建模块包括:

单类高频数据预测结果获取单元,用于将所述任一类高频数据对应的至少一个高频数据的取值,输入至所述高频数据预测模型子集对应的单类高频数据预测模型,获取单类高频数据预测结果;

数据预测模型集构建单元,用于将获取的多个所述单类高频数据预测结果作为自变量,将所述低频数据的取值作为因变量进行训练,得到所述目标时间段的数据预测模型,依据多个目标时间段的数据预测模型构建所述数据预测模型集。

结合第一方面、第一方面的第一种可能的实施方式和第二种可能的实施方式,本申请提供了第一方面的第三种可能的实施方式,其中,所述低频数据预测模块包括:

高频数据分类单元,用于对所述低频数据对应的高频数据进行高频数据分类,每类高频数据对应有至少一个高频数据;

预测模型匹配单元,用于针对任一类高频数据,查询提取的高频数据预测模型子集,得到与所述任一类高频数据相匹配的单类高频数据预测模型;

预测结果获取单元,用于将所述任一类高频数据对应的至少一个高频数据的取值输入得到的单类高频数据预测模型,获取单类高频数据预测结果;

低频数据预测单元,用于将获取的多个所述单类高频数据预测结果输入提取的数据预测模型中,得到所述低频数据的预测结果。

结合第一方面的第一种可能的实施方式,本申请提供了第一方面的第四种可能的实施方式,其中,所述高频数据预测模型集构建模块还包括:

预测精度判断模块,用于针对任一单类高频数据预测模型,判断所述单类高频数据预测模型的预测精度是否大于预设阈值;

所述高频数据预测模型集构建单元,具体用于在判断出所述单类高频数据预测模型的预测精度大于预设阈值时,依据多个单类高频数据预测模型构建所述高频数据预测模型子集。

结合第一方面的第一种可能的实施方式,本申请提供了第一方面的第五种可能的实施方式,其中,所述单类高频数据预测模型训练单元,具体用于构建初始单类高频数据预测模型;将初始权重系数和所述任一类高频数据对应的高频数据的取值输入至构建的所述初始单类高频数据预测模型;

判断所述初始单类高频数据预测模型的输出误差是否小于预设误差,若否,基于所述输出误差对所述初始权重系数进行调整,并基于进行初始权重系数调整后的初始单类高频数据预测模型,对所述任一类高频数据对应的高频数据的取值再次获取输出误差,直至输出误差小于预设误差时输入所述任一类高频数据对应的下一高频数据;其中,所述输出误差由所述初始单类高频数据预测模型的当前预测结果以及所述目标时间段的低频数据的取值确定;

依次将所述任一类高频数据对应的高频数据的取值输入至进行初始权重系数调整后的初始单类高频数据预测模型,直至在判断出最后一个高频数据对应的输出误差小于所述预设误差时,得到所述单类高频数据预测模型。

结合第一方面的第一种可能的实施方式,本申请提供了第一方面的第六种可能的实施方式,其中,根据以下公式构建所述单类高频数据预测模型:

其中,所述yt系指目标时间段的低频数据,系指目标时间段的任一类高频数据对应的高频数据,m表示高频数据与低频数据之间的倍率,β0、β1系指常数,εt系指随机误差项,l1/m系指高频滞后算子,且k系指高频数据滞后阶数,系指第t个低频数据对应滞后k阶数的高频数据,w(k;θ)系指权重系数。

结合第一方面的第六种可能的实施方式,本申请提供了第一方面的第七种可能的实施方式,其中,所述权重系数由以下估计法中的任意一种估计法得出:阿尔蒙估计法、指数阿尔蒙估计法、贝塔分布估计法以及步函数估计法。

第二方面,本申请还提供了一种数据预测方法,所述方法包括:

获取待预测时间段的低频数据对应的高频数据;

从预先训练好的高频数据预测模型集以及数据预测模型集中,提取与所述待预测时间段相匹配的高频数据预测模型子集以及数据预测模型;

利用所述低频数据对应的高频数据、提取的高频数据预测模型子集以及数据预测模型,得到所述低频数据的预测结果。

结合第二方面,本申请提供了第二方面的第一种可能的实施方式,其中,构建所述高频数据预测模型集,包括:

获取目标时间段的低频数据,以及所述目标时间段的多类高频数据,每类高频数据对应有至少一个高频数据;

针对任一类高频数据,将所述任一类高频数据对应的至少一个高频数据的取值作为自变量,将所述低频数据的取值作为因变量进行训练,得到所述目标时间段的单类高频数据预测模型;

依据多个单类高频数据预测模型构建所述高频数据预测模型子集,依据多个目标时间段的高频数据预测模型子集构建所述高频数据预测模型集。

本申请提供的数据预测系统及方法,其高频数据获取模块获取待预测时间段的低频数据对应的高频数据;预测模型提取模块从预先训练好的高频数据预测模型集以及数据预测模型集中,提取与所述待预测时间段相匹配的高频数据预测模型子集以及数据预测模型;低频数据预测模块利用所述低频数据对应的高频数据、提取的高频数据预测模型子集以及数据预测模型,得到所述低频数据的预测结果,也即,其通过预先训练的高频数据预测模型集以及数据预测模型集进行低频数据的预测,避免了采用直接平均的方式进行数据预测所带来的信息丢失而预测的准确率和可靠性均较差的问题,大大降低了信息丢失的可能性,预测的准确率和可靠性均较高。

为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。

附图说明

为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1示出了本申请实施例所提供的一种数据预测系统的结构示意图;

图2示出了本申请实施例所提供的一种数据预测系统中高频数据预测模型集构建模块的结构示意图;

图3示出了本申请实施例所提供的一种数据预测系统中数据预测模型集构建模块的结构示意图;

图4示出了本申请实施例所提供的一种数据预测系统中低频数据预测模块的结构示意图;

图5示出了本申请实施例所提供的一种数据预测方法的流程图;

图6示出了本申请实施例所提供的另一种数据预测方法的流程图;

图7示出了本申请实施例所提供的另一种数据预测方法的流程图;

图8示出了本申请实施例所提供的另一种数据预测方法的流程图;

图9示出了本申请实施例所提供的另一种数据预测方法的流程图;

图10示出了本申请实施例所提供的一种计算机设备的结构示意图。

主要元件符号说明:

11、高频数据获取模块;22、预测模型提取模块;33、低频数据预测模块;44、高频数据预测模型集构建模块;55、数据预测模型集构建模块;331、高频数据分类单元;332、预测模型匹配单元;333、预测结果获取单元;334、低频数据预测单元;441、数据获取单元;442、单类高频数据预测模型训练单元;443、高频数据预测模型集构建单元;444、预测精度判断模块;551、单类高频数据预测结果获取单元;552、数据预测模型集构建单元。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。

考虑到相关技术中的数据预测方法采用直接平均的方式进行数据转换,在高频数据(如月度数据)中,各月的观测数据值有大也有小的情况下,对应的转换结果为定值,高频数据中的相关信息(如趋势信息)将会丢失,从而导致预测的准确率和可靠性均较差。本申请一种实施例提供了一种数据预测系统,以提高数据预测的准确度和可靠性,详见下述实施例。

参见图1,为本申请实施例提供的数据预测系统的结构示意图,该数据预测系统具体包括:

高频数据获取模块11,用于获取待预测时间段的低频数据对应的高频数据;

预测模型提取模块22,用于从预先训练好的高频数据预测模型集以及数据预测模型集中,提取与待预测时间段相匹配的高频数据预测模型子集以及数据预测模型;

低频数据预测模块33,用于利用低频数据对应的高频数据、提取的高频数据预测模型子集以及数据预测模型,得到低频数据的预测结果。

这里,本申请实施例所提供的数据预测系统能够应用于各种应用场景,特别是金融领域、经济领域。对于不同的应用领域,可以获取到的低频数据不同,对应的高频数据也不同。比如,对于经济领域而言,本申请实施例中的高频数据对应于经济波动影响指标数据,低频数据则对应于经济波动指标数据。

其中,上述经济波动指标数据可以是国内生产总值(grossdomesticproduct,gdp)增速,对应的经济波动影响指标数据则可以是包括国房景气指数、m1与m2增速差、实际有效汇率指数等在内的经济稳健指标数据,还可以是包括新增信贷数据等在内的经济压力指标数据,还可以是包括发电量产量、水泥产量、固定资产投资完成额等在内的生产投资指标数据,还可以是包括出口额同比增速、进口额同比增速、出口订单指数、采购经理指数(purchasingmanagers'index,pmi)等在内的进出口指标数据,还可以是包括社会融资规模新增贷款、社会融资规律新增企业债券等在内的融资融券指标数据。

上述gdp增速作为季度数据,也即是每季均可以收集到一个gdp增速,上述新增信贷作为月度数据,也即是每月均可以收集到一个新增信贷,可见,对于同一个待预测时间段,每个季度数据与三个月度数据相对应。月度数据的时间刻度更精细,其对应的数据频率也越高,此时,上述月度数据(即新增信贷)则对应于本申请实施例中的高频数据,季度数据(即gdp增速)则对应于本申请实施例中的低频数据。

值得说明的是,本申请实施例中的低频数据和高频数据仅是为了便于区分两种不同频率的数据,在不同应用场景上述低频数据和高频数据对应的具体内容也不同。如,本申请实施例中的高频数据还可以是实时数据,低频数据则可以是日计数据,再如,本申请实施例中的高频数据还可以是日计数据,低频数据则可以是月度数据等等。为了便于对本申请实施例提供的数据预测系统的理解,接下来的内容将以上述新增信贷作为高频数据,gdp增速作为低频数据进行示例。

本申请实施例将获取的低频数据对应的高频数据依次输入至高频数据预测模型子集,以及数据预测模型中,便可得到低频数据的预测结果。其中,上述高频数据预测模型子集是从预先训练好的高频数据预测模型集中提取的与待预测时间段相匹配的模型子集,类似的,上述数据预测模型则是从预先训练好的数据预测模型集中提取的与待预测时间段相匹配的模型集。另外,对于高频数据预测模型集而言,本申请实施例是基于获取的目标时间段的低频数据以及每类高频数据对应的至少一个高频数据进行单类高频数据预测模型的训练后构建的,对于数据预测模型集而言,本申请实施例则是基于上述单类高频数据预测模型的预测结果以及低频数据进行数据预测模型的训练后构建的。

为了便于构建上述高频数据预测模型集,参见图2,本申请实施例提供的数据预测系统还包括高频数据预测模型集构建模块44,该高频数据预测模型集构建模块44具体包括:

数据获取单元441,用于获取目标时间段的低频数据,以及目标时间段的多类高频数据,每类高频数据对应有至少一个高频数据;

单类高频数据预测模型训练单元442,用于针对任一类高频数据,将任一类高频数据对应的至少一个高频数据的取值作为自变量,将低频数据的取值作为因变量进行训练,得到目标时间段的单类高频数据预测模型;

高频数据预测模型集构建单元443,用于依据多个单类高频数据预测模型构建高频数据预测模型子集,依据多个目标时间段的高频数据预测模型子集构建高频数据预测模型集。

这里,对于上述新增信贷作为高频数据,gdp增速作为低频数据而言,上述目标时间段可以指离散时间段,也即,上述目标时间段对应的低频数据可以是2010年至2017年中所有第一个季度对应的gdp增速,对应于上述每个年份中的第一个季度,均对应一类高频数据(即新增信贷)的三个高频数据。这里,对于新增信贷这一类高频数据而言,则可以将对应的三个高频数据的取值作为自变量,将gdp增速的取值作为因变量进行训练,以得到上述目标时间段对应于新增信贷这一类高频数据的单类高频数据预测模型,然后,本申请还基于高频数据预测模型集构建单元443,依据单类高频数据预测模型构建对应于所有类的高频数据对应的高频数据预测模型子集,最后,根据各个不同的目标时间段对应的高频数据预测模型子集的集合则可以构建得到上述高频数据预测模型集。

值得说明的是,本申请实施例不仅可以对于新增信贷这一类高频数据进行单类高频数据预测模型的训练,还可以对于出口额同比增速这一类高频数据进行单类高频数据预测模型的训练,还可以将经济波动指标数据中的其他类高频数据进行单类高频数据预测模型的训练。可见,本申请实施例可以单独考虑每类高频数据对应的自变量对低频数据对应的因变量的影响,从而最大可能的突出每类高频数据对低频数据的作用。

参见图2,本申请实施例中的高频数据预测模型集构建模块44还包括预测精度判断模块444,该预测精度判断模块444,用于针对任一单类高频数据预测模型,判断单类高频数据预测模型的预测精度是否大于预设阈值。在上述预测精度判断模块444判断出单类高频数据预测模型的预测精度大于预设阈值时,高频数据预测模型集构建单元443则依据多个单类高频数据预测模型构建高频数据预测模型子集。其中,上述预测精度指的是单类高频数据预测模型的预测结果与实际低频数据之间接近程度,若两者越接近,则对应的训练精度就越高。

为了便于构建上述数据预测模型集,参见图3,本申请实施例提供的数据预测系统还包括数据预测模型集构建模块55,该数据预测模型集构建模块55具体包括:

单类高频数据预测结果获取单元551,用于将任一类高频数据对应的至少一个高频数据的取值,输入至高频数据预测模型子集对应的单类高频数据预测模型,获取单类高频数据预测结果;

数据预测模型集构建单元552,用于将获取的多个单类高频数据预测结果作为自变量,将低频数据的取值作为因变量进行训练,得到目标时间段的数据预测模型,依据多个目标时间段的数据预测模型构建数据预测模型集。

这里,本申请实施例可以首先将新增信贷这一类高频数据对应的三个高频数据的取值输入至单类高频数据预测模型,以获取对应于新增信贷这一类高频数据的单类高频数据预测结果,和/或,将出口额同比增速这一类高频数据对应的三个高频数据的取值输入至单类高频数据预测模型,以获取对应于出口额同比增速这一类高频数据的单类高频数据预测结果,和/或,将经济波动指标数据中的其他类高频数据对应的高频数据的取值输入至单类高频数据预测模型,以获取对应于其他类高频数据的单类高频数据预测结果,然后,将上述获取的多个单类高频数据预测结果作为自变量,并将低频数据的取值作为因变量进行训练,得到目标时间段的数据预测模型,最后根据各个不同的目标时间段对应的数据预测模型则可以构建得到上述数据预测模型集。

考虑到本申请实施例提供的数据预测系统的应用场景,本申请实施例在上述数据预测模型训练的过程中,还可以将滞后当前目标时间段的低频数据参与到模型训练中,也即,本申请在对第二季度对应的目标时间段进行低频数据预测时,在第一季度的数据对第二季度的数据存在关联时,可以将第二季度对应的低频数据输入至数据预测模型中进行训练。

参见图4,本申请实施例提供的数据预测系统中的低频数据预测模块33具体包括:

高频数据分类单元331,用于对低频数据对应的高频数据进行高频数据分类,每类高频数据对应有至少一个高频数据;

预测模型匹配单元332,用于针对任一类高频数据,查询提取的高频数据预测模型子集,得到与任一类高频数据相匹配的单类高频数据预测模型;

预测结果获取单元333,用于将任一类高频数据对应的至少一个高频数据的取值输入得到的单类高频数据预测模型,获取单类高频数据预测结果;

低频数据预测单元334,用于将获取的多个单类高频数据预测结果输入提取的数据预测模型中,得到低频数据的预测结果。

可见,本申请实施例首先对低频数据对应的高频数据进行高频数据分类,然后针对任一类高频数据,查询提取的高频数据预测模型子集,得到与任一类高频数据相匹配的单类高频数据预测模型,并将任一类高频数据对应的至少一个高频数据的取值输入得到的单类高频数据预测模型,获取单类高频数据预测结果,最后将获取的多个单类高频数据预测结果输入提取的数据预测模型中,得到低频数据的预测结果。可见,利用模型进行数据预测的过程与模型的训练过程类似,具体内容在此不在赘述。

本申请实施例提供的数据预测系统可以基于以下公式构建上述单类高频数据预测模型:

其中,yt系指目标时间段的低频数据,系指目标时间段的任一类高频数据对应的高频数据,m表示高频数据与低频数据之间的倍率,β0、β1系指常数,εt系指随机误差项,l1/m系指高频滞后算子,且k系指高频数据滞后阶数,系指第t个低频数据对应滞后i阶数的高频数据,w(k;θ)系指权重系数。

其中,本申请实施中若将新增信贷作为高频数据,gdp增速作为低频数据,则yt为t时期的gdp增速,为t-i时期的新增信贷,则新增信贷的数据频率为gpd增速的3倍,对应的m则为3,依次类推,不再赘述。另外,上述权重系数可以由阿尔蒙估计法、指数阿尔蒙估计法、贝塔分布估计法以及步函数估计法等估计法中的任意一种确定。

考虑到指数阿尔蒙估计法具备的优良特性,本申请实施例优选的基于指数阿尔蒙估计法进行估计,根据指数阿尔蒙估计法进行估计得到的权重系数如下式所示:

其中,θ1≤300,θ2<0。

值得说明的是,本申请实施例提供的数据预测系统不仅可以利用上述单类高频数据预测模型构建公式对应的分布滞后模型,通过输入目标时间段的高频数据对应的当前值及其若干期的滞后值进行单类高频数据的预测,还可以只利用目标时间段的高频数据对应的若干期的滞后值构建向前预测模型进行预测,在此不再赘述。

另外,本申请实施例中除了可以直接基于上述估计法来单类高频数据预测模型的权重系数,还可以利用单类高频数据预测模型训练单元442进一步实现单类高频数据预测模型的训练。

上述单类高频数据预测模型训练单元442,具体用于构建初始单类高频数据预测模型;将初始权重系数和任一类高频数据对应的高频数据的取值输入至构建的初始单类高频数据预测模型;

判断初始单类高频数据预测模型的输出误差是否小于预设误差,若否,基于输出误差对初始权重系数进行调整,并基于进行初始权重系数调整后的初始单类高频数据预测模型,对任一类高频数据对应的高频数据的取值再次获取输出误差,直至输出误差小于预设误差时输入任一类高频数据对应的下一高频数据;其中,输出误差由初始单类高频数据预测模型的当前预测结果以及目标时间段的低频数据的取值确定;

依次将任一类高频数据对应的高频数据的取值输入至进行初始权重系数调整后的初始单类高频数据预测模型,直至在判断出最后一个高频数据对应的输出误差小于预设误差时,得到单类高频数据预测模型。

本申请实施例可以将初始权重系数和任一类高频数据对应的高频数据的取值输入至上述构建的初始单类高频数据预测模型中以对初始单类高频数据预测模型进行训练,并通过初始单类高频数据预测模型的输出误差与预设误差之间的比较结果对上述初始权重系数进行调整,直至针对上述高频数据调整后得到的输出误差小于预设误差时,添加新的高频数据重新进行权重调整,直至在判断出最后一个高频数据对应的输出误差小于预设误差时,得到单类高频数据预测模型。其中,上述初始权重系数可以由随机函数确定。

本申请实施例提供的数据预测系统在获取到低频数据和高频数据后,还可以进行相应的数据处理,如数据预处理,缺失值填充,数据转换,季节调整等。数据预处理可以是对获取的数据进行初步分析,并剔除重复数据等操作,缺失值填充则可以是基于大量数据对应的趋势图对不完整的数据进行数据点填充等操作,数据转换则可以是对数据进行归一化处理以把不同来源的数据统一到一个参考系下,季节调整则可以是对季节性数据进行分解,以将季节因素剔除,并将趋势因素或者随机因素筛选出来的操作以降低季节因素对后续模型训练的干扰。

另外,本申请实施例提供的数据预测系统还可以对数据进行筛选,也即从多类高频数据中筛选出最佳的高频数据类。本申请实施例可以基于回归树与主成分分析(principalcomponentanalysis,pca)相结合的方法进行筛选,以进一步提高后续模型训练的效率和准确率。

基于同一申请构思,本申请实施例中还提供了与数据预测系统对应的数据预测方法,由于本申请实施例中的方法解决问题的原理与本申请实施例上述数据预测系统相似,因此方法的实施可以参见系统的实施,重复之处不再赘述。如图5所示,为本申请实施例所提供的数据预测方法的流程图,该方法包括:

s101、获取待预测时间段的低频数据对应的高频数据;

s102、从预先训练好的高频数据预测模型集以及数据预测模型集中,提取与待预测时间段相匹配的高频数据预测模型子集以及数据预测模型;

s103、利用低频数据对应的高频数据、提取的高频数据预测模型子集以及数据预测模型,得到低频数据的预测结果。

本申请实施例中,参见图6,构建高频数据预测模型集具体包括如下步骤:

s201、获取目标时间段的低频数据,以及目标时间段的多类高频数据,每类高频数据对应有至少一个高频数据;

s202、针对任一类高频数据,将任一类高频数据对应的至少一个高频数据的取值作为自变量,将低频数据的取值作为因变量进行训练,得到目标时间段的单类高频数据预测模型;

s203、依据多个单类高频数据预测模型构建高频数据预测模型子集,依据多个目标时间段的高频数据预测模型子集构建高频数据预测模型集。

本申请实施例中,参见图7,构建数据预测模型集具体包括如下步骤:

s301、将任一类高频数据对应的至少一个高频数据的取值,输入至高频数据预测模型子集对应的单类高频数据预测模型,获取单类高频数据预测结果;

s302、将获取的多个单类高频数据预测结果作为自变量,将低频数据的取值作为因变量进行训练,得到目标时间段的数据预测模型,依据多个目标时间段的数据预测模型构建数据预测模型集。

参见图8,上述s103具体包括如下步骤:

s401、对低频数据对应的高频数据进行高频数据分类,每类高频数据对应有至少一个高频数据;

s402、针对任一类高频数据,查询提取的高频数据预测模型子集,得到与任一类高频数据相匹配的单类高频数据预测模型;

s403、将任一类高频数据对应的至少一个高频数据的取值输入得到的单类高频数据预测模型,获取单类高频数据预测结果;

s404、将获取的多个单类高频数据预测结果输入提取的数据预测模型中,得到低频数据的预测结果。

本申请实施例中,在得到目标时间段的单类高频数据预测模型之后,依据多个单类高频数据预测模型构建高频数据预测模型子集之前,上述方法还包括:

针对任一单类高频数据预测模型,判断单类高频数据预测模型的预测精度是否大于预设阈值,若是,则执行依据多个单类高频数据预测模型构建高频数据预测模型子集的步骤。

参见图9,上述s202具体包括如下步骤:

s501、构建初始单类高频数据预测模型;

s502、将初始权重系数和任一类高频数据对应的高频数据的取值输入至构建的初始单类高频数据预测模型;

s503、判断初始单类高频数据预测模型的输出误差是否小于预设误差,若否,基于输出误差对初始权重系数进行调整,并基于进行初始权重系数调整后的初始单类高频数据预测模型,对任一类高频数据对应的高频数据的取值再次获取输出误差,直至输出误差小于预设误差时输入任一类高频数据对应的下一高频数据;其中,输出误差由初始单类高频数据预测模型的当前预测结果以及目标时间段的低频数据的取值确定;

s504、依次将任一类高频数据对应的高频数据的取值输入至进行初始权重系数调整后的初始单类高频数据预测模型,直至在判断出最后一个高频数据对应的输出误差小于预设误差时,得到单类高频数据预测模型。

在具体实施中,根据以下公式构建单类高频数据预测模型:

其中,yt系指目标时间段的低频数据,系指目标时间段的任一类高频数据对应的高频数据,m表示高频数据与低频数据之间的倍率,β0、β1系指常数,εt系指随机误差项,l1/m系指高频滞后算子,且k系指高频数据滞后阶数,系指第t个低频数据对应滞后k阶数的高频数据,w(k;θ)系指权重系数。

其中,权重系数由以下估计法中的任意一种估计法得出:阿尔蒙估计法、指数阿尔蒙估计法、贝塔分布估计法以及步函数估计法。

对应于图5至图9中的数据预测方法,本申请实施例还提供了一种计算机设备,如图10所示,该设备包括存储器1000、处理器2000及存储在该存储器1000上并可在该处理器2000上运行的计算机程序,其中,上述处理器2000执行上述计算机程序时实现上述数据预测方法的步骤。

具体地,上述存储器1000和处理器2000能够为通用的存储器和处理器,这里不做具体限定,当处理器2000运行存储器1000存储的计算机程序时,能够执行上述数据预测方法,从而解决目前采用直接平均的方式所带来的预测的准确率和可靠性均较差的问题,进而达到高准确率和高可靠性的数据预测效果。

对应于图5至图9中的数据预测方法,本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述数据预测方法的步骤。

具体地,该存储介质能够为通用的存储介质,如移动磁盘、硬盘等,该存储介质上的计算机程序被运行时,能够执行上述数据预测方法,从而解决目前采用直接平均的方式所带来的预测的准确率和可靠性均较差的问题,进而达到高准确率和高可靠性的数据预测效果。

本申请实施例所提供的数据预测方法及系统的计算机程序产品,包括存储了程序代码的计算机可读存储介质,程序代码包括的指令可用于执行前面方法实施例中的方法,具体实现可参见方法实施例,在此不再赘述。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1