宏观经济数据预测方法及装置、设备及存储介质与流程

文档序号:31695158发布日期:2022-10-01 04:53阅读:50来源:国知局
宏观经济数据预测方法及装置、设备及存储介质与流程

1.本发明涉及大数据预测技术领域,尤其涉及一种宏观经济数据预测方法及装置、设备及存储介质。


背景技术:

2.目前,宏观经济指标对政策研判、投资决策具有重要意义,但宏观数据发布频率较低且存在明显的时滞,无法及时掌握经济运行状态,因此对宏观经济数据作出准确预测具有重要的价值。目前宏观经济数据的预测包括领先指数法和即时预测模型。
3.领先指数法可以将多类别不同的指标整合起来,形成一个综合并且全面反映基准指标的指数。目前已有的较多的指数编制方法有不使用模型的扩散指数与合成指数以及使用降维方法的pca(principal component analysis,主成分分析法),但领先指数法只能指示经济指标的变动方向,不能准确的预测经济指标的具体数值。
4.即时预测模型通过高频数据中的“新闻”从而动态地调整对经济指标的预期,主要包括纽约联储的nowcasting模型、wei模型、亚特兰大联储的gdpnow模型以及英格兰银行的midas模型。即时预测模型由于大量使用高频数据,因此天然的面临以下几类问题:
5.1、所使用的数据往往频率并不完全一致,例如如果我们关心经济增长状态,可以从gdp、工业增加值、高炉开工率等不同维度去刻画,但gdp为季频数据,工业增加值为月频数据,高炉开工率为周频数据,如何处理不同频率的数据是即时预测模型需要面对的首要问题;
6.2、所使用的数据发布时间不一致,例如上个月的经济数据,我们最早可以在月底获得pmi数据,然后在月度中旬获得物价数据和生产数据,最后在本月底获得工业企业利润数据,如何处理不同时间获得的经济数据是即时预测模型需要面对的第二个问题。
7.有鉴于此,有必要提出对目前的宏观经济数据预测方法进行进一步的改进。


技术实现要素:

8.为此,本发明目的在于至少一定程度上解决现有技术中的不足,从而提出一种宏观经济数据预测方法及装置、设备及存储介质。
9.第一方面,本发明提供了一种宏观经济数据预测方法,所述方法包括:
10.根据基准指标在全量宏观指标中通过筛选算法筛选出多个第一候选指标,根据多个所述第一候选指标建立基础因子池,所述筛选算法包括拐点匹配法、时序相关法、k-l信息量法和波动噪声比法;
11.将所述基础因子池中的所述第一候选指标与所述基准指标分别利用单元回归进行筛选,筛选后得到第二候选指标并将所述第二候选指标进行处理得到合成指数;
12.通过算法得到所述合成指数相对所述基准指标的领先期数,根据所述合成指数的领先期数对所述合成指数进行平移处理,并对平移处理后的所述合成指数进行正交化处理,得到因子数据;
13.通过多元加权回归模型对所述因子数据进行处理,得到所述基准指标的预测值。
14.第二方面,本发明提供了一种宏观经济预测装置,所述装置包括:
15.筛选模块:用于根据基准指标在全量宏观指标中通过筛选算法筛选出多个第一候选指标,根据多个所述第一候选指标建立基础因子池,所述筛选算法包括拐点匹配法、时序相关法、k-l信息量法和波动噪声比法;
16.处理模块:用于将所述基础因子池中的所述第一候选指标与所述基准指标分别利用单元回归进行筛选,筛选后得到第二候选指标并将所述第二候选指标进行处理得到合成指数;
17.正交模块:用于通过算法得到所述合成指数相对所述基准指标的领先期数,根据所述合成指数的领先期数对所述合成指数进行平移处理,并对平移处理后的所述合成指数进行正交化处理,得到因子数据;
18.预测模块:用于通过多元加权回归模型对所述因子数据进行处理,得到所述基准指标的预测值。
19.第三方面,本发明还提供了一种宏观经济数据预测设备,包括存储器、处理器、以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如第一方面所述的宏观经济数据预测方法中的各个步骤。
20.第四方面,本发明还提供了一种存储介质,其上存储有计算机程序,所述计算机程序被执行时,实现如第一方面所述的宏观经济数据预测方法中的各个步骤。
21.本发明提供了一种宏观经济数据预测方法及装置、设备及存储介质,该方法包括:根据基准指标在全量宏观指标中通过筛选算法筛选出多个第一候选指标,根据多个所述第一候选指标建立基础因子池,所述筛选算法包括拐点匹配法、时序相关法、k-l信息量法和波动噪声比法;将所述基础因子池中的所述第一候选指标与所述基准指标分别利用单元回归进行筛选,筛选后得到第二候选指标并将所述第二候选指标进行处理得到合成指数;通过算法得到所述合成指数相对所述基准指标的领先期数,根据所述合成指数的领先期数对所述合成指数进行平移处理,并对平移处理后的所述合成指数进行正交化处理,得到因子数据;通过多元加权回归模型对所述因子数据进行处理,得到所述基准指标的预测值。通过本发明提供的方法,通过算法筛选得到基础因子池,可以快速构建宏观分析框架,同时可以结合宏观经济研究者的研究经验对基础因子池进行调整,不影响后续的预测步骤,且该方法不仅可以指示未来经济数据的变动方向,而且可以给出未来经济数据的分布,还可避免宏观经济数据更新频率不同、更新时间不同带来的问题。
附图说明
22.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。
23.图1为本发明的宏观经济数据预测方法的流程示意图;
24.图2为本发明的宏观经济数据预测方法的子流程示意图;
25.图3为本发明的宏观经济数据预测方法的另一子流程示意图;
26.图4为本发明的宏观经济数据预测方法的拐点匹配法调整之前的拐点示意图;
27.图5为本发明的宏观经济数据预测方法的拐点匹配法调整之后的拐点示意图;
28.图6为本发明的宏观经济数据预测方法的又一子流程示意图;
29.图7为本发明的宏观经济数据预测方法的又一子流程示意图;
30.图8为本发明的宏观经济数据预测装置的程序模块示意图。
具体实施方式
31.为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而非全部实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
32.请参照图1,图1是本技术实施例的宏观经济数据预测方法的流程示意图,在本实施例中,上述宏观经济数据预测方法包括:
33.步骤101、根据基准指标在全量宏观指标中通过筛选算法筛选出多个第一候选指标,根据多个所述第一候选指标建立基础因子池,所述筛选算法包括拐点匹配法、时序相关法、k-l信息量法和波动噪声比法。
34.在本实施例中,基准指标即是需要被预测的指标,当确定了需要预测的指标后,即在全量宏观指标中通过筛选算法筛选出多个第一候选指标,其中全量宏观指标就相当于一个数据库,即当确定了需要预测的指标后,在数据库中通过筛选算法筛选出能够预测基准指标的第一候选指标。在全量宏观指标中通过筛选算法得到了多个第一候选指标之后,再将筛选得到的第一候选指标组成构成基础因子池。
35.在本实施例中,第一候选指标需要具有统计上的领先性,领先性的判断方法主要分成两个大类:(1)拐点的识别与匹配:通过对比基准指标与候选指标的峰与峰、谷与谷之间的领先滞后关系判断领先阶数;(2)时间序列上的相关性:通过考察基准指标与候选指标时间序列上的相关关系,判断领先阶数,主要方法为时差相关分析与k-l信息量。两类方法体现了不同的思想,拐点识别匹配法仅看重拐点,考察第一候选指标能否较为准确的预测基准指标的拐点。而时间序列相关关系认为时序上的每个点都等同重要,看重第一候选指标在形态上与基准指标是否领先与相似。第一候选指标通过拐点识别匹配法、时序相关性、k-l信息量方法可以检验候选指标的领先滞后情况,波动噪声比过滤了信噪比较低的宏观指标,四个方法同时做筛选取交集,相互结合验证可以加强领先指标筛选的稳定性与可信度。
36.步骤102、将所述基础因子池中的所述第一候选指标与所述基准指标分别利用单元回归进行筛选,筛选后得到第二候选指标并将所述第二候选指标进行处理得到合成指数。
37.在本实施例中,通过筛选算法筛选出用于预测基准指标的基础因子池之后,再将基础因子池中的第一候选指标与基准指标分别利用单元回归再次进行筛选,其中因为在不同时间、不同的第一候选指标的预测效果均不相同,所以在每一个预测时间,都会将基准指标与基础因子池中的每一个第一候选指标分别进行单元回归,将基础因子池中的第一候选指标与基准指标进行单元回归之后,再次对单元回归后的第一候选指标进行筛选,从而得
到第二候选指标,对得到的第二候选指标进行处理,进而得到合成指数。
38.步骤103、通过算法得到所述合成指数相对所述基准指标的领先期数,根据所述合成指数的领先期数对所述合成指数进行平移处理,并对平移处理后的所述合成指数进行正交化处理,得到因子数据。
39.在本实施例中,在步骤102中将第二候选指标处理之后得到合成指数之后,再通过调整合成指数与基准指标的领先滞后关系,即在每一个预测时间点,通过时序相关性算法得到合成指数相对基准指标的领先期数,再根据合成指数的领先阶数平移合成指数,再对平移处理之后的合成指数进行正交化处理,从而得到正交化处理的因子数据。
40.步骤104、通过多元加权回归模型对所述因子数据进行处理,得到所述基准指标的预测值。
41.在本实施例中,得到正交化处理后的因子数据之后,再通过多元加权回归的方式对正交化处理后的因子数据进行回归,从而得到基准指标的预测值。
42.本技术实施例提供了一种宏观经济数据预测方法,该方法包括:根据基准指标在全量宏观指标中通过筛选算法筛选出多个第一候选指标,根据多个所述第一候选指标建立基础因子池,所述筛选算法包括拐点匹配法、时序相关法、k-l信息量法和波动噪声比法;将所述基础因子池中的所述第一候选指标与所述基准指标分别利用单元回归进行筛选,筛选后得到第二候选指标并将所述第二候选指标进行处理得到合成指数;通过算法得到所述合成指数相对所述基准指标的领先期数,根据所述合成指数的领先期数对所述合成指数进行平移处理,并对平移处理后的所述合成指数进行正交化处理,得到因子数据;通过多元加权回归模型对所述因子数据进行处理,得到所述基准指标的预测值。通过本发明提供的方法,通过算法筛选得到基础因子池,可以快速构建宏观分析框架,同时可以结合宏观经济研究者的研究经验对基础因子池进行调整,不影响后续的预测步骤,且该方法不仅可以指示未来经济数据的变动方向,而且可以给出未来经济数据的分布,还可避免宏观经济数据更新频率不同、更新时间不同带来的问题。
43.进一步地,请参照图2,图2是本技术实施例中宏观经济数据预测方法的子流程示意图,在本实施例中,根据基准指标在全量宏观指标中通过筛选算法筛选出多个第一候选指标,根据多个所述第一候选指标建立基础因子池,所述筛选算法包括拐点匹配法、时序相关法、k-l信息量法和波动噪声比法,具体包括:
44.步骤201、将所述全量宏观指标中的指标分别通过所述拐点匹配法、时序相关法、k-l信息量法和波动噪声比法进行计算,得到所述全量宏观指标中的指标的参数,所述参数至少包括领先期数、相关系数;
45.步骤202、比较所述全量宏观指标中的指标的参数与预设的筛选条件,若满足,则得到所述第一候选指标。
46.在本实施例中,在全量宏观指标中筛选第一候选指标时,分别通过拐点匹配法、时序相关法、k-l信息量法和波动噪声比法进行筛选计算,其中将全量宏观指标中的指标分别通过以上四种方法进行计算,从而得到全量宏观指标的参数,其中全量宏观指标通过四种方法计算之后的参数数据至少包括领先期数、相关系数等等。通过四种方法进行计算之后,再将计算之后的参数与预设的筛选条件进行比较,若计算之后的全量宏观指标中的指标的参数符合预设的筛选条件,则满足条件的参数的全量宏观指标中的指标则作为第一候选指
标。
47.在本实施例中,通过拐点匹配法、时序相关法与k-l信息量法可以检查第一候选指标的领先与滞后情况,并从中筛选出具有领先作用的第一候选指标。理想的第一候选指标应在拐点匹配法、时序相关法以及k-l信息量法这三种方法测试下都具有领先性、且计算得出的领先期数应具有稳定性、拐点的匹配效率高、时序具有的相关性、且序列噪声少。因此可以分别构建如下评价标准:
48.1)领先性:拐点匹配法平均领先阶数、时序相关发与k-l信息量法的领先期数越大,领先性越强,然而过大的领先性有周期错配的可能性,结果可信度不足;
49.2)领先稳定性:拐点领先期数的标准差越小,拐点的领先期稳定性越强;
50.3)拐点匹配效率:若匹配率越高、多余率越低、可匹配拐点满足一定量,说明拐点匹配效率越高。其中,匹配率=基准指标匹配数/(基准指标总拐点数-无数据拐点),多余率=候选指标多余拐点/候选指标总拐点;
51.4)相关性:时序相关性分析的相关系数越高,相关性越强,使得构建指数时形态更加接近。
52.5)噪声少:噪声波动比率越低,则噪声越小,避免编制指数时引入过多噪声。
53.基于上述标准,我们在筛选候选指标的时候,设置下列具体筛选条件:
54.1、拐点匹配法下基准指标与第一候选指标匹配的拐点数量大于5个,匹配的拐点百分比大于等于50%,领先期数大于0;
55.2、时序相关性方法下相关系数大于0.2,领先期数大于0;
56.3、k-l信息量法下领先期数大于0;
57.4、噪声波动比方法下噪声波动比小于0.7。
58.进一步地,请参照图3,图3是本技术实施例中宏观经济数据预测方法的另一子流程示意图。在本实施例中,所述拐点匹配法包括:
59.步骤301、获取所述基准指标和所述第一候选指标的原始时间序列数据并对所述原始时间序列数据进行平滑处理;
60.步骤302、检测所述平滑后的时间序列数据中的所述基准指标和所述第一候选指标的明显峰值点对应的拐点,分别判断所述拐点是否为局部极值;
61.步骤303、筛选所述局部极值,再对筛选过后的所述局部极值进行调整得到所述候选指标和所述基准指标的拐点;
62.步骤304、匹配筛选过后得到的所述候选指标的拐点与所述基准指标的拐点,得到所述领先期数。
63.在本实施例中,请参阅图4和图5,图4和图5为本技术实施例采用拐点匹配法调整前后的拐点示意图。在判断拐点时,在获取基准指标与第一候选指标的原始时间序列数据后,需要采用llt滤波进行平滑,否则拐点识别会受到噪声的影响,识别到异常波动点,llt滤波模型如下所示:
[0064][0065]
其中a=2/(20+1),p为原始时间序列。
[0066]
得到第一候选指标与基准指标平滑后的时间序列后,我们可以开始进行拐点匹
配,拐点匹配主要有四个步骤:
[0067]
步骤一:初始拐点识别
[0068]
拐点属于局部极值点,首先可以通过判断每个拐点在前后n个月(本文n取6)范围内是否为最大(小)值,来判断该点是否属于局部极大(小)值点,作为拐点的候选。
[0069]
步骤二:拐点筛选
[0070]
在得到局部极值点后需要满足以下经验标准,从而保证周期不会过短而失去经济学意义:
[0071]
1)峰与谷(或谷与峰)之间,即每个上升或下降阶段,需要间隔至少6个月;
[0072]
2)峰与峰(或谷与谷)之间,即每个完整的周期,需要间隔至少16个月;
[0073]
3)去除数据开头与结尾6个月内的拐点;
[0074]
4)波峰与波谷必须交替出现。若相邻的两个拐点同为峰(谷),则将其中一个去除。在对不符合的拐点进行去除时,两个极大(小)值点间可优先去除较小(大)的,一个极大值与一个极小值间可优先去除时间较早的点,或将两个点同时去除。
[0075]
步骤三:拐点调整
[0076]
在实际应用中,可能会出现平滑后数据(llt滤波平滑)与原始数据的拐点不一致的情况,所以为了解决识别出的拐点相比于真实情况存在的失真,一般会在平滑数据的拐点识别后,再对拐点进行调整。常用的调整方法为,在平滑后序列拐点的[-n,n]个月(本文n取6)区间内,寻找原序列或次平滑序列的最大(小)值,将其作为调整后的极大(小)值。部分指标由于噪声或者春节效应的影响,易将拐点调整至1、2、3月份等异常值位置,因此统一将第一候选指标调整至一个次平滑的序列上。因基准指标往往噪声较小,仍然调整至原序列。在该步骤后也可再进行一次步骤二,将距离过近的拐点去除。
[0077]
步骤四:拐点匹配
[0078]
在筛选出拐点后,需要将第一候选指标的拐点与基准指标拐点进行一一匹配,查看领先期数。拐点匹配在实际操作中并没有固定的方式,在基准指标每个拐点前15个月与后8个月搜寻第一候选指标的拐点,根据不同搜寻结果可将指标拐点标注为以下标签:
[0079]
1)匹配:即基准指标的极大(小)值拐点与第一候选指标的极大(小)值拐点相匹配,将基准指标拐点记为匹配,并记录匹配的拐点数量、拐点领先滞后期数;
[0080]
2)缺失:即该基准指标拐点没有搜寻到任何可匹配的候选指标拐点,将基准指标拐点记为缺失;
[0081]
3)多余:匹配结束后,该第一候选指标拐点没有被基准指标匹配上,将候选指标的拐点记为多余;
[0082]
4)无数据:即由于第一候选指标数据开始时间较晚,导致该基准指标拐点没有对应第一候选指标的数据,将对应的基准指标拐点记为无数据。
[0083]
步骤五:领先期数确定
[0084]
领先性以数据单位频率的期数来衡量,用以反映跨指标对应的拐点间间隔的时间。领先期数在各个对应拐点上的表达会有不同,因此我们可以求均值来总体评价;同时,我们也可求中位数,因为均值本身可能会被异常值影响。此外,领先性的持续性也是考察的一方面,通常用领先期数的标准差来衡量。最后在计算了均值、中位数、标准差等统计指标后,还需对结果进行评价。
[0085]
进一步地,所述时序相关法包括:
[0086]
计算领先滞后l期的所述第一候选指标与所述基准指标之间的相关系数,选择所述相关系数最大的阶数为所述领先期数;
[0087]
所述k-l信息量法包括:
[0088]
计算所述领先滞后l期的所述第一候选指标与所述基准指标件的k-l信息量,选择所述k-l信息量最小的阶数为所述领先期数。
[0089]
在本实施例中,通过考察基准指标与第一候选指标时间序列上的相关关系,判断领先期数,主要方法为时序相关法与k-l信息量法。
[0090]
具体地,时序相关法是用来判断基准指标与第一候选指标领先、滞后关系的常用方法,该方法通过计算领先滞后l期的第一候选指标与基准指标间的相关系数,选择相关系数最大的阶数作为领先或滞后期数:
[0091][0092]
其中,x为第一候选指标序列,y为基准指标序列,t为基准指标或候选指标的日期,为候选指标平均值,为基准指标平均值,x
t
为t期的候选指标,yt为t期的基准指标,x
t+l
为t+l期的候选指标,y
t+l
为t+l期的基准指标,l为取值在-l和l之间的整数,l一般取值为12,l
*
为时序相关性分析方法下相关系数最大的阶数。
[0093]
具体地,k-l信息量法是用来衡量两列数据概率分布的相似程度,当k-l信息量越小时,说明概率分布越相似。k-l信息量法实际使用时与时序相关法类似,计算领先滞后l期的第一候选指标与基准指标间的k-l信息量,选择k-l信息量最小的的阶数作为领先或滞后期数,其中k-l信息量最小的阶数则为相关系数最大的领先期数:
[0094][0095][0096]
其中t为基准指标或候选指标的日期,y
t
为t期的基准指标,x
t
为t期候选指标,t为基准指标或候选指标的最后一个日期,l
*
为k-l信息量最小的阶数。
[0097]
具体地,筛选算法还包括波动噪声比法,波动噪声比法用于剔除一些噪声过大的全量宏观指标中的指标。其中,部分数据尽管在滤波后有着较好的周期性与领先性,但是由于数据本身噪声与波动过大,会在构造指数时引入一部分不必要的噪声。通过计算第一候选指标的噪声波动比率来对全量宏观指标中的指标的噪声大小进行判断,从而剔除噪声过大的宏观指标,该指标的构建方法如下:
[0098]
noise=std(i)/std(c)
[0099]
其中,c为宏观序列的周期波动项,即已经平滑处理过的序列。i为不规则项,可使
用原序列与周期波动项做差得到。若该比率越大,则说明序列的噪声干扰越大。例如家用洗衣机产量的当月同比数据,尽管其滤波数据有着较为明显的周期性,并且相对于名义gdp增速有一定领先性,但是由于其噪声波动比率较大,在全量宏观指标的指标筛选时予以剔除。
[0100]
在本实施例中,通过以上四种方法对全量宏观指标中的指标进行计算之后,得到的全量宏观指标中的指标的参数之后,再将得到的参数与步骤201和步骤201中所提到的预设的筛选条件进行比较,从而得到能够匹配筛选条件的第一候选指标。
[0101]
进一步地,请参照图6,图6是本技术实施例中宏观经济数据预测方法的又一子流程示意图,在本实施例中,将所述基础因子池中的所述第一候选指标与预设的基准指标分别利用单元回归进行筛选,筛选后得到第二候选指标并将所述第二候选指标进行处理得到合成指数,具体包括:
[0102]
步骤401、将所述基准指标与所述基础因子池中的每一个所述第一候选指标分别进行单元回归,筛选得到多个回归系数最小的所述第一候选指标,并作为所述第二筛选指标;
[0103]
步骤402、通过宏观指标树获取所述第二候选指标的父节点,将同一父节点的所述第二候选指标通过合成指数法分别合成,得到所述合成指数。
[0104]
在本实施例中,通过候选指标筛选算法筛选出用于预测的基础因子池,基础因子池中有多个筛选出来的第一候选指标,其中基础因子池中的第一候选指标的数量在30个左右。考虑到在不同时点、不同候选因子的预测效果不同,我们在每一个预测时点,将基准指标与因子池中的每个第一候选指标分别进行单元回归,选出回归系数p值最小的前15个第一候选指标,并将选出的回归系数p值最小的前15个第一候选指标作为第二候选指标,并通过宏观指标树获取不同的第二候选指标的父节点,将同一父节点的指标通过合成指数法分别合成得到多个合成指数。
[0105]
进一步地,请参照图7,图7是本技术实施例中宏观经济数据预测方法的又一子流程示意图,在本实施例中,所述筛选后得到第二候选指标并将所述第二候选指标进行处理得到合成指数,具体包括:
[0106]
步骤501、计算所述第二候选指标标准化后的差分并对所述第二候选指标标准化后的差分进行求和,得到总差分;
[0107]
步骤502、通过所述总差分计算所述合成指数。
[0108]
在本实施例中,合成指数的主体思想为,通过对每个候选指标的本月差分进行标准化,再按照某权重相加得到增长率,最后得到指数。
[0109]
指标差分公式为:
[0110]
diff(y
t
)=y
t-y
t-1
[0111]
其中y
t
为第t期的指标数据。
[0112]
在本实施例中,计算合成指数的主要步骤为:
[0113]
1、计算第二候选指标标准化后的差分,使用历史滚动72个月的指标差分绝对值的均值对当前差分进行标准化。其中,y
i,
代表领先指标值,a
i,
为差分绝对值的均值,s
i,
为标准化后的变化率。为了防止异常波动对均值的影响(如2020年初疫情),求a
i,
时可将历史差分绝对值在95%以上的异常数据去除。
[0114][0115]
2、对所有第二候选指标的标准化后的差分进行大类、小类内的等权重求和,得到总差分v
t

[0116]
3、将该总差分v
t
作为指数的环比变化率,计算合成指数i
t

[0117][0118]
进一步地,对所述平移处理后的合成指数进行正交化处理的公式如下:
[0119][0120][0121]fn*k
为原因子矩阵,为正交化后因子矩阵,s
k*k
为过渡矩阵,u
k*k
与分别为重叠矩阵的特征向量矩阵和特征根对角阵。
[0122]
进一步地,本技术实施例还提供了一种宏观经济数据预测装置600,图8为本技术实施例中宏观经济数据预测装置的程序模块示意图,本实施例中,上述宏观经济数据预测装置600包括:
[0123]
筛选模块601:用于根据基准指标在全量宏观指标中通过筛选算法筛选出多个第一候选指标,根据多个所述第一候选指标建立基础因子池,所述筛选算法包括拐点匹配法、时序相关法、k-l信息量法和波动噪声比法;
[0124]
处理模块602:用于将所述基础因子池中的所述第一候选指标与所述基准指标分别利用单元回归进行筛选,筛选后得到第二候选指标并将所述第二候选指标进行处理得到合成指数;
[0125]
正交模块603:用于通过算法得到所述合成指数相对所述基准指标的领先期数,根据所述合成指数的领先期数对所述合成指数进行平移处理,并对平移处理后的所述合成指数进行正交化处理,得到因子数据;
[0126]
预测模块604:用于通过多元加权回归模型对所述因子数据进行处理,得到所述基准指标的预测值。
[0127]
本技术实施例提供了一种宏观经济数据预测装置600,可以实现:根据基准指标在全量宏观指标中通过筛选算法筛选出多个第一候选指标,根据多个所述第一候选指标建立基础因子池,所述筛选算法包括拐点匹配法、时序相关法、k-l信息量法和波动噪声比法;将所述基础因子池中的所述第一候选指标与所述基准指标分别利用单元回归进行筛选,筛选后得到第二候选指标并将所述第二候选指标进行处理得到合成指数;通过算法得到所述合成指数相对所述基准指标的领先期数,根据所述合成指数的领先期数对所述合成指数进行平移处理,并对平移处理后的所述合成指数进行正交化处理,得到因子数据;通过多元加权回归模型对所述因子数据进行处理,得到所述基准指标的预测值。通过本发明提供的方法,通过算法筛选得到基础因子池,可以快速构建宏观分析框架,同时可以结合宏观经济研究者的研究经验对基础因子池进行调整,不影响后续的预测步骤,且该方法不仅可以指示未来经济数据的变动方向,而且可以给出未来经济数据的分布,还可避免宏观经济数据更新
频率不同、更新时间不同带来的问题。
[0128]
进一步地,本技术还提供了一种宏观经济数据预测设备,包括存储器、处理器、以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现上述的宏观经济数据预测方法中的各个步骤。
[0129]
进一步地,本技术还提供了一种存储介质,其上存储有计算机程序,所述计算机被处理器执行时,实现如上述的宏观经济数据预测方法中的各个步骤。
[0130]
在本发明各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。
[0131]
基于这样的理解,本发明的说明书技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0132]
需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本发明所必须的。在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
[0133]
对于本领域的技术人员,依据本技术实施例的思想,在具体实施方式及应用范围上均会有改变之处,综上,本说明书内容不应理解为对本发明的限制。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1