构建预测模型的方法及装置与流程

文档序号:16138111发布日期:2018-12-01 01:17阅读:465来源:国知局

本说明书一个或多个实施例涉及计算机技术领域,尤其涉及构建预测模型的方法和装置。

背景技术

互联网金融的出现,极大的刺激了银行等传统机构的业务发展,各种创新型金融业务不断涌现,给流动性管理带来了更大的挑战。在流动性管理中,流动性风险的管理至关重要。对于金融机构而言,自身流动性不足会引发流动性风险甚至危机,而过多的流动性则意味着资金使用效率低下导致盈利损失。对管理机构,例如央行而言,管理目标之一即管理市场预期,平抑市场流动性波动,避免出现系统性流动性风险。

在一些方案中,提出了一些方法来计算流动性指标,以流动性指标反映市场资金的流动性。例如,交通银行金融研究中心提出了交通银行银行间市场流动性指数ibli,又称为交银艾布力指数。这些流动性指数的计算方法都是基于过去时段的各种交易操作变量,来刻画那个时段的资金流动性,却不能对未来的流动性进行预测。通常,流动性指标的计算往往涉及许多变量,而这些变量与流动性指数之间又常常互相影响。例如资金利率会影响市场资金流动性,而市场资金流动性也会反过来影响资金利率。这样的关系使得流动性指标的预测愈发困难。

因此,希望能有改进的方案,更加有效地预测流动性指标,从而更好地管理流动性风险。



技术实现要素:

本说明书一个或多个实施例描述了一种构建预测模型的方法,该方法基于向量自回归模型var构建用于预测流动性指标的预测模型,从而有效地对未来的流动性指标进行前瞻性预测和分析。

根据第一方面,提供了一种构建预测模型的方法,所述预测模型用于预测可交换资源的流动性指标,所述方法包括:

获取第一变量序列、第二变量序列以及指标序列,所述第一变量序列和第二变量序列分别为,在按时间顺序排列的多个历史时段分别对第一变量和第二变量进行采样形成的变量序列,其中所述第一变量与所述可交换资源的操作规模相关联,所述第二变量与所述可交换资源的回报率相关联;所述指标序列包括,所述多个历史时段分别对应的流动性指标;

检测第一变量序列、第二变量序列和指标序列的平稳性,从而获取平稳的第一变量序列、第二变量序列和指标序列;

基于平稳的第一变量序列、第二变量序列和指标序列,确定各个历史时段对应的列向量,其中第i历史时段对应的列向量yi包括,该第i历史时段的第一变量、第二变量,以及该第i历史时段的流动性指标;

将所述各个历史时段对应的列向量输入向量自回归var模型,确定var模型的模型参数,从而将包含上述模型参数的var模型作为所述预测模型。

在一个实施例中,第一变量包括以下变量中的一个或多个:逆回购,中期借贷便利mlf,超短期逆回购slo,常备借贷便利slf,抵押补充贷款psl;

第二变量包括以下变量中的一组或多组:回购利率和交易量;同业拆借利率和交易量;利率互换利率和交易量;国债收益率和交易量。

根据一种可能的设计,采用单位根检验,来检测第一变量序列、第二变量序列和指标序列的平稳性,将存在单位根的序列作为不平稳序列。

在一种可能的实施方式中,在检测到第一变量序列、第二变量序列和指标序列中任一序列不平稳的情况下,对该不平稳的序列进行差分运算,并再次进行检验,直到获取到平稳的第一变量序列、第二变量序列和指标序列。

在一个实施例中,方法还包括:对第一变量序列/第二变量序列进行与指标序列的格兰杰因果关系检验,以检验第一变量/第二变量与流动性指标之间的因果影响关系。

具体地,在一个实施例中,经过格兰杰因果关系检验,确保第一变量和第二变量中的至少一个变量与所述流动性指标具有格兰杰双向因果关系。

在一种可能的设计中,通过以下方式进行格兰杰因果关系检验:确定滞后阶数m;基于滞后阶数,对流动性指标的滞后项进行第一回归处理,基于第一回归处理结果对第一变量/第二变量的滞后项进行第二回归处理,得到统计量;基于所述统计量利用f检验来检验第一变量/第二变量是否与流动性指标存在格兰杰因果关系。

根据一种实施方式,var模型用于,对于滞后阶数m,基于连续m个历史时段的列向量、对应的m个参数矩阵,以及扰动项,确定在所述连续m个历史时段之后的下一历史时段对应的列向量;相应地,确定var模型的模型参数包括:确定滞后阶数m;以及基于所述各个历史时段对应的列向量,确定所述m个参数矩阵和所述扰动项。

根据一种可能的设计,通过以下方式确定滞后阶数m:采用似然比lr检验确定滞后阶数m;或者根据赤池信息量准则aic,确定滞后阶数m;或者根据施瓦茨信息准则sc,确定滞后阶数m。

在一个实施例中,方法还包括,针对所述var模型进行脉冲响应分析,确定第一变量/第二变量对流动性指标的脉冲效应。

根据第二方面,提供一种构建预测模型的装置,所述预测模型用于预测可交换资源的流动性指标,所述装置包括:

序列获取单元,配置为获取第一变量序列、第二变量序列以及指标序列,所述第一变量序列和第二变量序列分别为,在按时间顺序排列的多个历史时段分别对第一变量和第二变量进行采样形成的变量序列,其中所述第一变量与所述可交换资源的操作规模相关联,所述第二变量与所述可交换资源的回报率相关联;所述指标序列包括,所述多个历史时段分别对应的流动性指标;

平稳性检测单元,配置为检测第一变量序列、第二变量序列和指标序列的平稳性,从而获取平稳的第一变量序列、第二变量序列和指标序列;

向量确定单元,配置为基于平稳的第一变量序列、第二变量序列和指标序列,确定各个历史时段对应的列向量,其中第i历史时段对应的列向量yi包括,该第i历史时段的第一变量、第二变量,以及该第i历史时段的流动性指标;

参数确定单元,配置为将所述各个历史时段对应的列向量输入向量自回归var模型,确定var模型的模型参数,从而将包含上述模型参数的var模型作为所述预测模型。

根据第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第一方面的方法。

根据第四方面,提供了一种计算设备,包括存储器和处理器,其特征在于,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一方面的方法。

通过本说明书实施例提供的方法和装置,选择更加贴近实际应用的向量自回归var模型来构建预测模型,从而实现对可交换资源的流动性指标的前瞻性预测。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。

图1示出本说明书披露的一个实施例的实施场景示意图;

图2示出根据一个实施例的构建预测模型的方法流程图;

图3示出根据一个实施例的模型构建装置的示意性框图。

具体实施方式

下面结合附图,对本说明书提供的方案进行描述。

图1为本说明书披露的一个实施例的实施场景示意图。在图1中,计算平台可以是任何具有计算、处理能力的设备或设备集群,用于构建预测可交换资源的流动性指标的预测模型。例如,计算平台可以是金融机构的服务器,或者提供金融产品的服务器,例如“蚂蚁财富”服务器。该服务器可以用于构建预测银行间市场流动性指标的预测模型。

为了构建预测模型,计算平台首先获取与要预测的流动性指标存在一定关联关系的变量构成的变量序列,这样的变量序列是对多个历史时段的变量进行采样而获得。一般地,要获取的变量序列可以包括与资源操作规模相关联的一类变量的变量序列(图1中示出为操作规模类变量序列),以及与资源回报率相关联的二类变量的变量序列(图2中示出为利率类变量序列)。然后确保各个变量序列为平稳序列,并且涉及的变量与流动性指标存在因果关联。在此基础上,将同一历史时段的一类变量、二类变量和流动性指标整理为该时段的列向量,将各个历史时段的列向量输入到向量自回归var模型中。通过用多个历史时段的列向量进行训练,确定向量自回归var模型中的参数矩阵和扰动项,并将确定出参数的var模型作为预测模型。进一步地,还可以对确定出的var模型进行脉冲响应分析,以确定一类变量和/或二类变量对流动性指标的影响。如此确定出的var模型可以用于对未来时段的流动性指标进行有效的预测。下面描述以上构思的具体实现过程。

图2示出根据一个实施例的构建预测模型的方法流程图;该方法可以由任何具有计算、处理能力的装置、设备、平台、设备集群来执行,例如图1所示的计算平台,该计算平台具体可以是例如蚂蚁财富的服务器。如图2所示,该方法至少包括以下步骤:步骤21,获取第一变量序列、第二变量序列以及指标序列,所述第一变量序列和第二变量序列分别为,在按时间顺序排列的多个历史时段分别对第一变量和第二变量进行采样形成的变量序列,所述指标序列包括,所述多个历史时段分别对应的流动性指标;步骤23,检测第一变量序列、第二变量序列和指标序列的平稳性,从而获取平稳的第一变量序列、第二变量序列和指标序列;步骤25,确定各个历史时段对应的列向量,其中第i历史时段的列向量yi包括,该第i历史时段的第一变量、第二变量,以及该第i历史时段的流动性指标;步骤27,将所述各个历史时段的列向量输入向量自回归var模型,确定var模型的模型参数,从而将包含上述模型参数的var模型作为所述预测模型。下面描述上述方法中各个步骤的具体执行方式。

可以理解,要构建的预测模型用于预测可交换资源的流动性指标。可交换资源可以是各种可以在市场以一定价格自由交换的资源,最典型的,可交换资源为货币。然而,随着各种金融产品的推出,可交换资源还可以包括,各种虚拟货币,基于真实货币衍生出的准货币衍生品,等等。下面以货币为例进行描述,但是实施例可以推广到适用的其他可能的可交换资源。

为了构建预测模型,首先在步骤21,获取第一变量序列、第二变量序列以及指标序列。

第一变量是与要预测的流动性指标存在关联关系的外生变量。在一个实施例中,第一变量是与可交换资源的操作规模相关联的变量,例如与央行货币操作规模相关联的变量。更具体地,在一个实施例中,第一变量包括以下变量中的一个或多个:逆回购,中期借贷便利mlf,超短期逆回购slo,常备借贷便利slf,抵押补充贷款psl,等等。相应地,第一变量序列为,在按时间顺序排列的多个历史时段分别对第一变量进行采样形成的变量序列。上述的历史时段可以是小时,半天,一天,一周,甚至一个月等等任何预定的时段。比较典型的,多数银行相关交易都以天为单位进行结算,因此,在一个实施例中,上述历史时段为天。在下面的例子中,以一天为一个历史时段进行说明和描述。但是应该理解,根据可交换资源的结算周期和变量的不同,历史时段有可能取不同的时长单位。在一天为一个历史时段的例子中,第一变量序列即为,在一段历史时期中,按照日期对第一变量进行采样,并按照采样日期排序而形成的变量序列。例如,第一变量序列可以表示为,a=(at,at+1,at+2,…,at+n),其中at表示过去某一天t对变量a采样的值,at+1表示t+1天对变量a采样的值,at+2表示t+2天对变量a采样的值,等等。可以理解,第一变量可以包括多个变量,例如前述的逆回购,中期借贷便利mlf,超短期逆回购slo等等。此时,第一变量序列可以包括对各个第一变量进行顺序采样形成的子序列。

另一方面,第二变量也是与要预测的流动性指标存在关联关系的变量。在一个实施例中,第二变量是与可交换资源的回报率相关联的变量,例如与银行间市场各期限资金利率指标相关联的变量。更具体地,在一个实施例中,所述第二变量包括以下变量中的一组或多组:回购利率和交易量;同业拆借利率和交易量;利率互换利率和交易量;国债收益率和交易量。相应地,第二变量序列为,在按时间顺序排列的多个历史时段分别对第二变量进行采样形成的变量序列。如前所述,历史时段可以是任何预定的时段,但是需要与采集第一变量序列的历史时段相一致。比较典型的,上述历史时段为天。于是,第二变量序列可以表示为,b=(bt,bt+1,bt+2,…,bt+n),其中bt表示过去某一天t对变量b采样的值,bt+1表示t+1天对变量b采样的值,bt+2表示t+2天对变量b采样的值,等等。更具体地,第二变量可以包含分组变量,例如回购利率和对应交易量构成一组变量。此时,第二变量序列中的bt+i可以包括,bt+i=(brt+i,bvt+i),其中brt+i为t+i天的回购率,bvt+i为t+i天回购率所对应的交易量。可以理解,第二变量可以包括多组变量,例如前述的回购利率和交易量;同业拆借利率和交易量等等。此时,第二变量序列可以包括对各组第二变量进行顺序采样形成的子序列。

此外,还获取指标序列,也就是多个历史时段分别对应的可交换资源的流动性指标构成的序列。流动性指标可以是已知的用于衡量可交换资源的流动性的数据指标。例如,为了反映市场资金的流动性,交通银行金融研究中心提出了交通银行银行间市场流动性指数ibli,又称为交银艾布力指数。ibli指数即可作为这里的流动性指标。下面就以ibli指数为例进行描述。但是需要理解,对于其他的可交换资源,可以采用其他的流动性指标来衡量;或者对于市场资金,也有可能采用其他数学方法确定的指数作为流动性指标,在此不作限定。

对于上述的流动性指标,需要获取与第一变量和第二变量采集的历史时段相同的历史时段分别对应的流动性指标,从而构成指标序列。

在分别获取第一变量序列、第二变量序列和指标序列的基础上,在步骤23,检测第一变量序列、第二变量序列和指标序列的平稳性,从而获取平稳的第一变量序列、第二变量序列和指标序列。

数据序列的平稳是后续构建和使用向量自回归var模型的基础,因此,在该步骤中,对各个序列进行平稳性检验。如果检测到某个变量序列不平稳,可以进行平稳性处理,例如差分,然后再次进行检验,直到获取平稳的变量序列。

可以采用多种方法来检验数据序列的平稳性。

在一个实施例中,采用单位根检验,来检测各个序列的平稳性。如果某变量序列中存在单位根,则认为该序列是不平稳的时间序列。

单位根检验的总体思路如下。定义随机时间序列{xt},t=1,2,…,其中xt=ρxt-1+εt,将定义式改写为下列形式:(1-ρl)=ε,其中l为滞后算子,1-ρl为滞后算子多项式,其特征方程为1-ρz=0,有根z=1/p。当ρ<1时,{xt}为平稳序列。当ρ=1时,时间序列存在一个单位根,此时{xt}是一个单位根过程,又称为单整过程,为不平稳序列,但是经过一次差分之后可以变为平稳序列。而当ρ〉1时,{xt}为一类具有所谓爆炸根的非平稳过程,经过一次差分后仍然为非平稳过程。

可以基于多种统计量进行单位根检验,例如基于df(dickeyfuller)统计量。在基于df统计量进行单位根检验的情况下,对于变量序列xt=ρxt-1+ε;

其零假设和备择假设分别为:

h0:ρ=1,xt非平稳;

h1:ρ<1,xt平稳。

在零假设成立条件下,计算df统计量:

若df大于临界值,则接受h0,认为xt非平稳;若df小于等于临界值,则拒绝h0,认为xt平稳。

除了以上基于df统计量进行单位根检验,还可以基于例如adf(增项df)统计量或其他统计量进行单位根检验。

在其他实施例中,还可以通过其他方式检验变量序列的平稳性,例如检验变量序列的均值、方差和协方差等。

如果检验确定某个变量序列不平稳,那么可以对其进行平稳化处理。在一个实施例中,对不平稳的变量序列进行差分处理操作。在其他实施例中,还可以采用一些其他算法,进行平稳化处理,例如区间均值处理、区间中位数处理、累计求和处理、区间平滑处理等。经过平稳化处理之后,再次进行平稳性检验,直到获取平稳的变量序列。

如此,通过步骤23,获得平稳的变量序列。

基于平稳的变量序列,在步骤25,确定各个历史时段对应的列向量,其中第i历史时段的列向量yi包括,该第i历史时段的第一变量、第二变量,以及该第i历史时段的流动性指标。可以理解,第一变量序列、第二变量序列和指标序列都是按照时间顺序排列的时间序列。将时间视为横向维度,那么每个变量序列可以对应于一个横向的行向量。在将第一变量序列、第二变量序列和指标序列时间对齐之后,可以获取同一历史时段下不同变量构成的列向量。

例如,如果各个变量序列采用以下表示:

第一变量序列a=(at,at+1,at+2,…,at+n);

第二变量序列b=(bt,bt+1,bt+2,…,bt+n);

指标序列c=(ct,ct+1,ct+2,…,ct+n),

那么,同一历史时段下的各个变量可以构成该历史时段的列向量,例如,yt=(at,bt,ct),yt+1=(at+1,bt+1,ct+1),…,yt+i=(at+i,bt+i,ct+i)。

如前所述,第一变量和第二变量都可以包含多个变量,相应地,第一变量序列和第二变量序列各自包含多个子序列。例如,第一变量a包括a1,a2和a3,第二变量包括b1和b2,相应地,同一历史时段对应的列向量可以表示为:yt+i=(a1t+i,a2t+i,a3t+i,b1t+i,b2t+i,ct+i)。如此,可以获取各个历史时段的列向量。

基于如此获取到的各个历史时段对应的列向量,可以进行预测模型的构建,特别是向量自回归var模型的构建。

在一个实施例中,在构建var模型之前,还对第一变量和第二变量进行格兰杰因果关系检验,以检验第一变量、第二变量与流动性指标之间的因果影响关系。

格兰杰因果关系检验由2003年诺贝尔经济学奖得主克莱夫.格兰杰(clivew.j.granger)首先提出,用于分析经济变量之间的因果关系。在时间序列情形下,两个经济变量x、y之间的格兰杰因果关系定义为:若在包含了变量x、y的过去信息的条件下,对变量y的预测效果要优于只单独由y的过去信息对y进行的预测效果,即变量x有助于解释变量y的将来变化,则认为变量x是引致变量y的格兰杰原因。

数学上,假定变量x,y之间的关系通过下式表达:

如果α整体不为零,而λ整体为零,那么认为x对y有单向影响;

如果λ整体不为零,而整体为零,那么认为y对x有单向影响;

如果α和λ整体不为零,那么认为y与x存在双向影响;

如果α和λ整体为零,那么认为y与x不存在影响。

在一个实施例中,为了进行格兰杰因果关系检验,可以首先将当前的y对所有的滞后项y做回归而排除x的滞后项,即y对y的滞后项yt-1,yt-2,…,yt-m及其他变量做回归,得到受约束的残差平方和rssr;然后做一个含有滞后项x的回归,即在前面的回归式中加进滞后项x,得到无约束的残差平方和rssur。在零假设h0下:α整体为零,α1=α2=…=αm=0,即滞后项x不属于此回归。然后用f检验来检验是否接受该零假设。如果计算的f值超过临界值fα,则拒绝零假设,那么滞后项x属于此回归,表明x是y的格兰杰原因。交换x,y位置,可以检验y是否为x的格兰杰原因。

通过以上方式,可以分别检验第一变量a与流动性指标c是否存在因果影响关系,以及第二变量c与流动性指标c是否存在因果影响关系。与前述过程类似的,首先对目标变量即流动性指标的滞后项进行第一回归处理,得到受约束的残差平方和rssr;然后基于第一回归处理结果对第一变量a/第二变量b的滞后项进行第二回归处理,得到统计量。接着,基于所述统计量利用f检验来检验第一变量a/第二变量b是否与流动性指标存在格兰杰因果关系。

如此,确保引入到后续的向量自回归var模型中的第一变量和第二变量,都是与流动性指标具有因果影响关系的变量。在一个实施例中,经过格兰杰因果关系检验,确保第一变量和第二变量中的至少一个变量与流动性指标具有双向因果影响关系。

在以上检验过程中,会使用到滞后阶数m,表示要考虑的滞后期的长短和滞后项的多少。滞后阶数越大,考虑的滞后期越长。在一个实施例中,根据实际需要来人为设定该滞后阶数。在另一实施例中,根据一些算法,确定较优的滞后阶数。在后续构建的var模型中,会同样地使用到该滞后阶数m。因此,在后续结合var模型的构建详细描述滞后阶数的确定。

在一个实施例中,在确保各个变量与流动性指标具有因果影响关系的基础上,基于步骤25中得到的各个历史时段下的列向量,在步骤27,构建向量自回归var模型,确定var模型的模型参数。

向量自回归模型简称var模型,1980年由克里斯托弗.西姆斯提出,它把每个内生变量作为系统中所有内生变量滞后值的函数来构建模型,从而规避了构建模型方法中需要对系统中每个内生变量关于所有内生变量滞后值的建模问题。var模型通常被用来预测互相影响的时间序列系统,以及随机扰动项对系统的动态影响。

var模型的数学表达式为:

yt=φ1yt-1+φ2yt-2+…+φmyt-m+εt(3)

其中,yt是k维内生变量,表示t时刻的列向量,yt-i表示t-i时刻的列向量,m为滞后阶数,φ1,φ2,…,φm是待估计的k*k维参数矩阵,εt为k维扰动列向量,或称为扰动项。

在构建向量自回归模型var的过程中,一般地,首先要确定上述滞后阶数m。通过以上模型的表达式可以看出,滞后阶数m反映了模型所考虑的滞后期的长短。因此,一方面,期望滞后阶数足够大,以使得所构造的模型可以更完整地反映对象随时间变化的动态特征;另一方面,滞后阶数越大,需要估计的参数就越多,模型的自由度就会减少。因此,对于特定的应用场景,可以确定较优的滞后阶数,从而较好地平衡这两方面的考虑。

在一个实施例中,采用似然比lr检验确定滞后阶数m。在lr检验中,从最大的滞后阶数开始检验。零假设h0:在滞后阶数为j时,参数矩阵φj的元素均为0;备择假设h1:参数矩阵φj中至少有一个元素显著不为0。然后计算lr统计量,如果该统计量大于临界值,则拒绝零假设;否则,接受零假设,再减少一个滞后阶数进行检验,直到拒绝零假设。

在一个实施例中,根据赤池信息准则,又名最小信息量aic信息准则,确定滞后阶数。根据aic信息准则,定义aic函数为:aic=-2ln(模型中极大似然函数值)+2(模型中未知参数个数)。使aic函数达到最小值的模型被认为是最优模型,相应地,使aic函数达到最小值的滞后阶数被认为是最优的滞后阶数。

类似的,还可以根据施瓦茨信息准则sc确定滞后阶数。在sc信息准则中,sc函数被定义为:sc=-2ln(模型中极大似然函数值)+ln(模型中未知参数个数)。将sc函数达到最小值的滞后阶数确定为最优滞后阶数。

本领域技术人员还可以采用其他方式来确定上述滞后阶数。

此外,如前所述,在构建var模型之前或同时进行格兰杰因果检验的情况下,格兰杰因果检验过程中也会用到滞后阶数。一般地,将格兰杰因果检验中的滞后阶数设置得与var模型中的相同。因此,在一个实施例中,可以确定一个较优的滞后阶数,同时用于格兰杰因果检验和var模型两者。如果在选择变量(第一变量/第二变量)时,已经通过其他方式确保选择的变量与流动性指标具有因果影响关系,那么也可以省去格兰杰因果检验的步骤,而在构建var模型时确定上述滞后阶数。

在确定了滞后阶数的基础上,就可以将步骤25中得到的各个历史时段下的列向量,输入到以上的公式(3)中,从而确定var模型的其他模型参数,包括参数矩阵φ1,φ2,…,φm和扰动项εt。

例如,以滞后阶数m为3为例,公式(3)可以写为:

yt=φ1yt-1+φ2yt-2+φ3yt-3+εt(4)

步骤25获得的各个历史时段下的列向量可以表示为yt=(at,bt,ct),其中a为第一变量,b为第二变量,c为流动性指标。通过改变历史时段的时间窗t,可以得到多组yt,yt-1,yt-2,yt-3,将这些数据分别代入var模型公式,就可以通过计算和训练,确定出模型参数φ1,φ2,φ3和εt。

如此,构建了var模型并确定出var模型的模型参数,于是可以将包含了这些模型参数的var模型作为用于预测流动性指标的预测模型。

在利用以上构建的var模型进行预测时,首先获取近期的连续多个时段的列向量,将其输入var模型公式(3),由于参数矩阵和扰动项均已确定,就可以通过公式(3)直接计算得出下一时段的列向量。每个列向量中均包含对应时段的第一变量、第二变量和流动性指标。因此,可以从输出的下一时段的列向量中提取出流动性指标值,即为预测的下一时段的流动性指标。

仍然以滞后阶数m=3为例,可以将公式(4)改写为:

yt+1=φ1yt+φ2yt-1+φ3yt-2+ε

当输入今天(t)各变量构成的列向量yt,昨天(t-1)各变量构成的列向量yt-1,以及前天(t-2)各变量构成的列向量yt-2,就可以根据上式来计算,或者说预测,明天(t+1)各向量构成的列向量yt+1,从该预测的列向量中提取出流动性指标c,即为预测的明天的流动性指标。当然,还可以基于已有的昨天、今天的列向量,以及预估的明天的列向量,进一步估计后天的列向量。可以理解,随着预测时间增加,预测准确度可能会降低。但是,对于短期的流动性指标的预测,如此构建的var模型是非常有效。

在构建了var预测模型的基础上,在一个实施例中,还对上述构建的var模型进行脉冲响应分析,确定第一变量/第二变量对流动性指标的脉冲效应,从而有利于构建更加准确的短期预测模型。

脉冲响应分析是分析var模型受到某种冲击时对系统的动态影响。更具体地说,它描述的是在某个内生变量的随机误差项上施加一个标准差大小的冲击后,对所有内生变量的当期值和未来值所产生的影响。如果说,格兰杰因果检验是定性地分析一个变量是否对另一个变量有影响,那么脉冲响应分析则可以定量地分析一个变量的冲击对另一个变量影响的程度。通常,脉冲响应分析考虑的是变量之间的短期影响。

仍然参看var模型的数学表达式公式(3),其中存在扰动项,该扰动项也是一个k维列向量,又称为冲击向量,它们相互之间可以是同期相关的,但与自己的滞后值无关且与等式右边的变量无关。

为了分析一个变量的脉冲冲击对其他变量的影响,定义脉冲响应函数:

cij表示,在其他误差项在任何时期都不变的条件下,当第j个变量对应的误差项在t期受到一个单位的冲击后,对第i个内生变量在t+q期造成的影响。通过以上的脉冲响应函数,分析变量j的冲击对变量i在t+q期的影响,从而更准确地评估变量之间的短期影响。

结合以上构建的预测流动性指标的var模型,可以针对某个第一变量或第二变量建立上述脉冲响应函数,分析该特定变量的冲击对流动性指标在预定时长(t+q期)的影响。在一个实施例中,基于如上建立的脉冲响应函数,建立该特定变量对流动性指标影响的短期预测子模型。

特别是,在本说明书一个实施例中,第一变量是与央行货币操作规模相关的变量。通过脉冲响应分析,例如将第一变量作为以上变量j,将流动性指标作为以上变量i,可以更准确地确定,央行货币政策冲击对流动性指标的脉冲影响效应。

如上,构建了var模型用于预测可交换资源的流动性指标。特别是,将该预测模型用于预测银行间市场流动性指标时,可以为流动性指标提供预测和预报,而不是像过去一样只能利用这些指标进行“总结”。流动性指标的前瞻性预测和预报,可以为央行货币市场操作以及金融机构的交易决策和资金安排提供前瞻性指导,填补空白领域。这也更符合流动性风险管理的核心和未来发展趋势,即前瞻性地识别潜在的流动性风险,从而实现早期预警和预判。

根据另一方面的实施例,还提供一种构建预测模型的装置,该预测模型用于预测可交换资源的流动性指标。图3示出根据一个实施例的模型构建装置的示意性框图。如图3所示,模型构建装置300包括:序列获取单元31,配置为获取第一变量序列、第二变量序列以及指标序列,所述第一变量序列和第二变量序列分别为,在按时间顺序排列的多个历史时段分别对第一变量和第二变量进行采样形成的变量序列,其中所述第一变量与所述可交换资源的操作规模相关联,所述第二变量与所述可交换资源的回报率相关联;所述指标序列包括,所述多个历史时段分别对应的流动性指标;平稳性检测单元33,配置为检测第一变量序列、第二变量序列和指标序列的平稳性,从而获取平稳的第一变量序列、第二变量序列和指标序列;向量确定单元35,配置为基于平稳的第一变量序列、第二变量序列和指标序列,确定各个历史时段对应的列向量,其中第i历史时段对应的列向量yi包括,该第i历史时段的第一变量、第二变量,以及该第i历史时段的流动性指标;以及参数确定单元37,配置为将所述各个历史时段对应的列向量输入向量自回归var模型,确定var模型的模型参数,从而将包含上述模型参数的var模型作为所述预测模型。

根据一种实施方式,第一变量包括以下变量中的一个或多个:逆回购,中期借贷便利mlf,超短期逆回购slo,常备借贷便利slf,抵押补充贷款psl;

第二变量包括以下变量中的一组或多组:回购利率和交易量;同业拆借利率和交易量;利率互换利率和交易量;国债收益率和交易量。

在一个实施例中,平稳性检测单元33配置为:采用单位根检验,来检测第一变量序列、第二变量序列和指标序列的平稳性,将存在单位根的序列作为不平稳序列。

根据一个实施例,平稳性检测单元33还配置为:在检测到第一变量序列、第二变量序列和指标序列中任一序列不平稳的情况下,对该不平稳的序列进行差分运算,并再次进行检验,直到获取到平稳的第一变量序列、第二变量序列和指标序列。

在一个实施例中,装置300还包括因果检测单元34,配置为:对第一变量序列/第二变量序列进行与指标序列的格兰杰因果关系检验,以检验第一变量/第二变量与流动性指标之间的因果影响关系。

具体地,在一个实施例中,经过因果检测单元34的检验,确保第一变量和第二变量中的至少一个变量与所述流动性指标具有格兰杰双向因果关系。

根据一种实施方式,因果检测单元34具体配置为:确定滞后阶数m;基于滞后阶数,对流动性指标的滞后项进行第一回归处理,基于第一回归处理结果对第一变量/第二变量的滞后项进行第二回归处理,得到统计量;基于所述统计量利用f检验来检验第一变量/第二变量是否与流动性指标存在格兰杰因果关系。

根据一种实施方式,构建的var模型用于,对于滞后阶数m,基于连续m个历史时段的列向量、对应的m个参数矩阵,以及扰动项,确定在所述连续m个历史时段之后的下一历史时段对应的列向量。相应地,参数确定单元37配置为:确定滞后阶数m;基于所述各个历史时段对应的列向量,确定所述m个参数矩阵和所述扰动项。

在一种实施方式中,因果检测单元34或参数确定单元37通过以下方式确定滞后阶数m:采用似然比lr检验确定滞后阶数m;或者,根据赤池信息量准则aic,确定滞后阶数m;或者,根据施瓦茨信息准则sc,确定滞后阶数m。

在一个实施例中,装置300还包括脉冲分析单元38,配置为针对所述var模型进行脉冲响应分析,确定第一变量/第二变量对流动性指标的脉冲效应。

以上的装置300可以由任何具有计算、处理能力的装置、设备、平台、设备集群来实现。在一种实施方式中,该装置300也可以体现为独立的金融产品,来提供流动性指标预测的服务,或者体现为产品模块,整合在金融分析评估平台中。

通过以上实施例的方法和装置,可以针对性的构建预测模型,从而为流动性指标提供前瞻性的预测分析,填补流动性风险管理中预警方面的空白。

根据另一方面的实施例,还提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行结合图2所描述的方法。

根据再一方面的实施例,还提供一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现结合图2所描述的方法。

本领域技术人员应该可以意识到,在上述一个或多个示例中,本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。

以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1