一种天气预测的方法及装置与流程

文档序号:11864639阅读:418来源:国知局
一种天气预测的方法及装置与流程
本发明涉及天气预测
技术领域
,尤其涉及一种天气预测的方法及装置。
背景技术
:目前,天气预测以大气动力学的数值方法为主,以大气动力学的数值方法预测天气只能提供点估计,无法对未来天气进行整体预测。天气在全世界80%的经济活动中扮演着决定性角色,对于很多企业或者经济实体来说,往往需要对天气风险进行评估,而基于点估计的天气预测方法远不足以提供对天气风险进行评估所需的数据。现有技术中提供一些采取了时间序列模型进行天气预测的方法,但这些预测方法在模型搭建的过程中使用的多是个人经验,使得天气预测并不准确。技术实现要素:本发明所要解决的技术问题是提供一种基于天气的收益预测方法及装置。本发明解决上述技术问题的技术方案如下:一种天气预测的方法,所述天气预测的方法包括:S1,获取所关注地区预设的过去时间段内的天气变量;S2,建立所述天气变量的条件均值模型;S3,建立所述天气变量的条件方差模型;S4,选择待预测的未来时间段,根据所述条件均值模型及所述条件方差模型获取所述未来时间段的所述天气变量的概率分布。本发明的有益效果是:提供一套完整的建模与预测方法,获取过去时间段内的天气变量,然后对过去时间段内的天气变量建立条件均值模型及条件方差模型,基于条件均值模型及条件方差模型得出天气变量的概率分布,以对未来天气进行预测,通过建模给出未来每个时期天气的完整概率分布,并不依据主观的经验,该天气的概率分布能够准确地预测未来的天气状况,且基于此概率分布,有利于企业对任意天气风险进行评估,以减少天气变化所带来的不确定性。在上述技术方案的基础上,本发明还可以做如下改进。进一步,所述步骤S2包括:S21,对所述天气变量进行差分;S22,获取差分后的天气变量的推广自相关函数,根据所述推广自相关函数选择自回归移动平均模型ARIMA的参数,根据所述参数确定所述自回归移动平均模型ARIMA;S23,对确定后的自回归移动平均模型ARIMA进行重复估计,获取系数显著的自回归移动平均模型ARIMA;S24,对所述系数显著的自回归移动平均模型ARIMA进行Ljung-Box检验,根据检验结果获取自回归项值大于预设阈值的自回归移动平均模型ARIMA;S25,计算所述自回归项值大于预设阈值的自回归移动平均模型ARIMA的赤池信息量准则AIC,选择所述赤池信息量准则AIC最小的自回归移动平均模型ARIMA作为所述条件均值模型。采用上述进一步方案的有益效果是:建立天气变量的条件均值模型,以便后续根据条件均值模型获取天气变量的概率分布的的均值。进一步,所述步骤S3包括:S31,利用极大似然法分别估计非对称广义自回归条件异方差模型NGARCH的系数与非对称幂自回归条件异方差模型APARCH的系数,根据各自的系数分别确定所述非对称广义自回归条件异方差模型NGARCH与非对称幂自回归条件异方差模型APARCH;S32,对确定的所述非对称广义自回归条件异方差模型NGARCH与非对称幂自回归条件异方差模型APARCH进行回测检验,根据检验结果选择确定的所述非对称广义自回归条件异方差模型NGARCH或非对称幂自回归条件异方差模型APARCH作为所述条件方差模型。采用上述进一步方案的有益效果是:建立天气变量的条件方差模型,以便后续根据条件均值模型获取天气变量的概率分布的的方差。进一步,所述步骤S4包括:S41,获取所述条件均值模型的残差,对所述残差的平方进行ARCH效应检验;S42,在ARCH效应检验通过时,对所述残差进行Jarque-Bera检验,根据检验结果选择新息的类型;S43,基于所述条件均值模型进行超前预测得到所述待预测的未来时间段的均值,基于所述条件方差模型进行超前预测得到所述待预测的未来时间段的方差;S44,基于所选择的新息的类型、所述均值及所述方差获取所述未来时间段的所述天气变量的概率分布。采用上述进一步方案的有益效果是:通过建模给出未来每个时期天气的完整概率分布,进一步提高未来的天气状况预测的准确性。进一步,所述新息的类型包括高斯新息及学生t新息,所述步骤S44包括:若所选择的新息的类型为高斯新息,则所述未来时间段的所述天气变量的概率分布为所述均值和方差的正态分布:其中,μt为均值,为方差;若所选择的新息的类型为学生t新息,则所述未来时间段的所述天气变量的概率分布为所述均值和方差的有偏学生t分布:其中,为方差,v是学生t分布的自由度,是自由度为v、均值为μt的有偏学生t分布。本发明解决上述技术问题的技术方案还如下:一种天气预测的装置,,所述天气预测的装置包括:获取模块,用于获取所关注地区预设的过去时间段内的天气变量;第一建立模块,用于建立所述天气变量的条件均值模型;第二建立模块,用于建立所述天气变量的条件方差模型;预测模块,用于选择待预测的未来时间段,根据所述条件均值模型及所述条件方差模型获取所述未来时间段的所述天气变量的概率分布。进一步,所述第一建立模块包括:差分单元,用于对所述天气变量进行差分;选择单元,用于获取差分后的天气变量的推广自相关函数,根据所述推广自相关函数选择自回归移动平均模型ARIMA的参数,根据所述参数确定所述自回归移动平均模型ARIMA;第一估计单元,用于对确定后的自回归移动平均模型ARIMA进行重复估计,获取系数显著的自回归移动平均模型ARIMA;第一检验单元,用于对所述系数显著的自回归移动平均模型ARIMA进行Ljung-Box检验,根据检验结果获取自回归项值大于预设阈值的自回归移动平均模型ARIMA;计算单元,用于计算所述自回归项值大于预设阈值的自回归移动平均模型ARIMA的赤池信息量准则AIC,选择所述赤池信息量准则AIC最小的自回归移动平均模型ARIMA作为所述条件均值模型。进一步,所述第二建立模块包括:第二估计单元,用于利用极大似然法分别估计非对称广义自回归条件异方差模型NGARCH的系数与非对称幂自回归条件异方差模型APARCH的系数,根据各自的系数分别确定所述非对称广义自回归条件异方差模型NGARCH与非对称幂自回归条件异方差模型APARCH;回测检验单元,用于对确定的所述非对称广义自回归条件异方差模型NGARCH与非对称幂自回归条件异方差模型APARCH进行回测检验,根据检验结果选择确定的所述非对称广义自回归条件异方差模型NGARCH或非对称幂自回归条件异方差模型APARCH作为所述条件方差模型。进一步,所述预测模块包括:第二检验单元,用于获取所述条件均值模型的残差,对所述残差的平方进行ARCH效应检验;第三检验单元,用于在ARCH效应检验通过时,对所述残差进行Jarque-Bera检验,根据检验结果选择新息的类型;预测单元,用于基于所述条件均值模型进行超前预测得到所述待预测的未来时间段的均值,基于所述条件方差模型进行超前预测得到所述待预测的未来时间段的方差;获取单元,用于基于所选择的新息的类型、所述均值及所述方差获取所述未来时间段的所述天气变量的概率分布。进一步,所述获取单元具体用于若所选择的新息的类型为高斯新息,则所述未来时间段的所述天气变量的概率分布为所述均值和方差的正态分布:其中,μt为均值,为方差;若所选择的新息的类型为学生t新息,则所述未来时间段的所述天气变量的概率分布为所述均值和方差的有偏学生t分布:其中,为方差,v是学生t分布的自由度,是自由度为v、均值为μt的有偏学生t分布。附图说明图1为本发明天气预测的方法一实施例的流程示意图;图2为图1所示步骤S2的流程示意图;图3为图1所示步骤S3的流程示意图;图4为图1所示步骤S4的流程示意图;图5为本发明天气预测的装置一实施例的结构示意图;图6为图5所示第一建立模块的结构示意图;图7为图5所示第二建立模块的结构示意图;图8为图5所示预测模块的结构示意图。具体实施方式以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。如图1所示,图1为本发明天气预测的方法一实施例的流程示意图,该天气预测的方法包括以下步骤:S1,获取所关注地区预设的过去时间段内的天气变量;本实施例中,天气变量可以是以日或者以月为时间单位的变量,预设的过去时间段可以是过去某几个月,过去一年或者几年等,天气变量可以是所关注地区的月均降水量、月均气温、日均降水量、日均气温等。S2,建立所述天气变量的条件均值模型;本实施例中,可以直接获取天气变量的推广的自相关函数EACF及其简化表,也可以对天气变量进行差分,以获取稳定的天气变量序列,然后获取该稳定的天气变量序列的推广的自相关函数EACF及其简化表。通过推广的自相关函数EACF及其简化表来确定自回归求和移动平均模型ARIMA的参数p,q,其中,参数p为自回归项,参数q为移动平均项数。然后,重复估计上述自回归求和移动平均模型ARIMA,直到所有系数都显著。本实施例可以使用极大似然法、条件似然法或广义矩估计等方法估计自回归求和移动平均模型ARIMA,优选地,利用条件似然法来重复估计上述自回归求和移动平均模型ARIMA。对以上估计得到的所有模型,进行Ljung-Box检验,保留自回归项p值大于0.05的模型。计算每个保留下来的模型的赤池信息量准则AIC,选择AIC最小的模型作为天气变量的条件均值模型。S3,建立所述天气变量的条件方差模型;本实施例中,考虑到天气数据的波动聚集性和非对称性,可以采用广义自回归条件异方差GARCH族模型中的非对称广义自回归条件异方差模型NGARCH与非对称幂自回归条件异方差模型APARCH,对非对称广义自回归条件异方差模型NGARCH与非对称幂自回归条件异方差模型APARCH进行估计。本实施例可以利用条件似然法分别估计非对称广义自回归条件异方差模型NGARCH与非对称幂自回归条件异方差模型APARCH的系数,选择较优的模型作为本实施例中的条件方差模型。S4,选择待预测的未来时间段,根据所述条件均值模型及所述条件方差模型获取所述未来时间段的所述天气变量的概率分布。本实施例中,选定待预测的未来时间段,例如选为未来半年或者一年作为该未来时间段,利用条件均值模型的n步超前预测得到该未来时间段的均值,利用条件方差模型的n步超前预测得到该未来时间段的方差,根据该均值及方差可以得到该未来时间段的天气变量的概率分布,通过该概率分布可以预测未来的天气状况。与现有技术相比,本实施例提供一套完整的建模与预测方法,获取过去时间段内的天气变量,然后对过去时间段内的天气变量建立条件均值模型及条件方差模型,基于条件均值模型及条件方差模型得出天气变量的概率分布,以对未来天气进行预测,本实施例通过建模给出未来每个时期天气的完整概率分布,并不依据主观的经验,该天气的概率分布能够准确地预测未来的天气状况,且基于此概率分布,有利于企业对任意天气风险进行评估,以减少天气变化所带来的不确定性。在一优选的实施例中,如图2所示,在上述图1的实施例的基础上,上述步骤S2包括:S21,对所述天气变量进行差分;S22,获取差分后的天气变量的推广自相关函数,根据所述推广自相关函数选择自回归移动平均模型ARIMA的参数,根据所述参数确定所述自回归移动平均模型ARIMA;S23,对确定后的自回归移动平均模型ARIMA进行重复估计,获取系数显著的自回归移动平均模型ARIMA;S24,对所述系数显著的自回归移动平均模型ARIMA进行Ljung-Box检验,根据检验结果获取自回归项值大于预设阈值的自回归移动平均模型ARIMA;S25,计算所述自回归项值大于预设阈值的自回归移动平均模型ARIMA的赤池信息量准则AIC,选择所述赤池信息量准则AIC最小的自回归移动平均模型ARIMA作为所述条件均值模型。本实施例中,对天气变量进行季节差分,把季节差分算子(1-B12)作用在该天气变量序列之上,得到新的序列{Xt},{Xt}是去除了季节性的时间序列。差分的意义在于,由于天气变量序列必然受到季节等时间因素的影响,差分后的序列能够更加稳定,对上述的序列{Xt}进行差分,对于序列{Xt}:ΔXt=Xt-Xt-1,此处Xt和Xt-1对应在时刻t和时刻t-1时的天气变量,则ΔXt为在t时刻的一阶差分(d=1)。当然,也可以进行n阶差分,有n阶差分为:ΔnXt=Δn-1Xt-Δn-1Xt-1,对n取不同的值,直到差分后的数据可以通过Ljung-Box检验,即自回归项p值小于预设阈值0.05,即可得到平稳的序列,以及差分次数d。自回归项p就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。如果自回归项p很小,说明原假设情况的发生的概率很小,而如果发生了,根据小概率原理,我们就有理由拒绝原假设,自回归项P值越小,我们拒绝原假设的理由越充分。总之,自回归项p越小,表明结果越显著。此处的预设阈值0.05是统计学界公认为可以作为判断是否显著的阈值。进行Ljung-Box检验的检验统计量为:其中,T是样本量,m是检验的滞后期数。例如,对于天气变量的月数据,取m为24来检验两年内的相关性;是样本的间隔为l的自相关函数,{xt}是差分后的天气变量序列。当时,拒绝不存在序列相关的原假设,这里的是自由度为m的卡方分布的95百分位分为点。通过数据的推广的自相关函数EACF的简化表来确定自回归移动平均模型ARIMA的参数p,q。推广的自相关函数EACF的简化表如下表1所示:0123450XXOOXO1XXOOXO2XXOOXO3XOXOOO4XOXOOO5XOOOOO表1表1中的行对应于上述的p,列对应于q,“X”表示对应的推广的自相关函数EACF的绝对值大于或等于推广的自相关函数EACF的渐进标准误的两倍;“o”表示对应的推广的自相关函数EACF的绝对值小于推广的自相关函数EACF的渐进标准误的两倍。推广的自相关函数EACF的标准误用直接得到,T是样本容量。具体而言,选择简化表中具有最小“p+q”值的“o”所具备的p与q作为自回归移动平均模型ARIMA的参数。例如,由上述的表可以得到p=0,q=2。对上述自回归移动平均模型ARIMA(p,d,q)进行估计,可以使用极大似然法、条件似然法、广义矩估计等方法。对自回归移动平均模型ARIMA(p,d,q)进行估计可以得到每个系数的估计值与标准误,据此计算出t统计量。删除p大于预设阈值0.05的系数,重新估计,重复估计直到所有系数都显著。对以上估计后得到的所有模型,进行Ljung-Box检验,保留p大于预设阈值0.05的模型。计算每个保留下来模型的赤池信息量准则AIC,选择赤池信息量准则AIC最小的模型作为天气变量的条件均值模型。其中,赤池信息量准则AIC定义为:其中,k是包括了截距项在内的回归元个数,n是观测样本数,RSS是回归残差平方和。采用AIC准则的优势在于,经过其筛选后的模型无论在样本内还是在样本外都能得到较好的预测表现,是一种建立在熵的概念基础上,可以权衡所估计模型的复杂度和此模型拟合数据的优良性的准则。实践中,赤池信息量准则AIC鼓励数据拟合的优良性但是尽量避免出现过度拟合的情况。所以在挑选模型的过程中,优先考虑的模型应是赤池信息量准则AIC最小的那一个,这样,能够保证找到最好地解释数据但包含最少自由参数的模型。在一优选的实施例中,如图3所示,在上述实施例的基础上,上述步骤S3包括:S31,利用极大似然法分别估计非对称广义自回归条件异方差模型NGARCH的系数与非对称幂自回归条件异方差模型APARCH的系数,根据各自的系数分别确定所述非对称广义自回归条件异方差模型NGARCH与非对称幂自回归条件异方差模型APARCH;S32,对确定的所述非对称广义自回归条件异方差模型NGARCH与非对称幂自回归条件异方差模型APARCH进行回测检验,根据检验结果选择确定的所述非对称广义自回归条件异方差模型NGARCH或非对称幂自回归条件异方差模型APARCH作为所述条件方差模型。本实施例中,可以利用条件似然法分别估计非对称广义自回归条件异方差模型NGARCH与非对称幂自回归条件异方差模型APARCH的系数。非对称广义自回归条件异方差模型NGARCH(1,1)形式如下:xt=μt+at,at=σtεt,εt~D(0,1),σt2=β0+β1σt-12+β2(at-1-θσt-1)2,]]>其中,μt是由自回归移动平均模型ARIMA得到的条件均值,D(0,1)表示均值为0、方差为1的正态分布或学生t分布,βi为正的系数,i≥0,θ是杠杆系数。APARCH(1,1)的模型形式为:xt=μt+at,at=σtεt,εt~D(0,1),σtδ=β0+α1(|at-1|+γ1at-1)δ+β1σt-1δ,]]>其中,μt是由自回归移动平均模型ARIMA得到的条件均值,D(0,1)表示均值为0、方差为1的正态分布或学生t分布,α1、β0、β1为正的系数,δ为正实数。这两个模型用极大似然法进行估计。如果新息是高斯新息,非对称广义自回归条件异方差模型NGARCH(1,1)的对数似然函数为:其中非对称幂自回归条件异方差模型APARCH(1,1)的对数似然函数为:其中如果新息是学生t新息,非对称广义自回归条件异方差模型NGARCH(1,1)的对数似然函数为:l(β0,β1,β2,θ)=-Σt=1T[12ln(σt2)+v+12ln(1+at2(v-2)σt2)],]]>其中,v是学生t分布的自由度,可以取3至6之间的一个整数值;非对称幂自回归条件异方差模型APARCH(1,1)的对数似然函数为:l(β0,α1,β1,γ1)=-Σt=1T[12ln(σt2)+v+12ln(1+at2(v-2)σt2)],]]>其中,v是学生t分布的自由度,可以取3至6之间的一个整数值。以上对数似然函数可以通过数值方法,如拟退火算法、遗传算法等求最大值点;也可以通过一阶条件,即偏导数等于0来求最大值点;此外,还可以使用广义矩估计、条件似然法等方法。本实施例中,利用比上述天气变量更高频的数据集进行回测检验,比较两个条件方差模型并选出更优的。具体地,如果上述天气变量为月均变量,那么可以利用日均或逐小时的天气变量进行回测。回测结果的好坏用预测的均方误差MSFE来衡量,选取预测的均方误差MSFE更小的模型作为更优模型。以下以月为时间单位的天气变量为原始数据进行回测检验:假设有0至T月的月天气变量数据,以及T+1至T+L月的日数据。再假设每月的日数据为n,则共有nL个日数据。根据这些日数据可以计算出T+1至T+L月每个月的样本方差,计算第j个月样本方差的公式为:T<j≤T+L。之后再由拟合好的非对称广义自回归条件异方差模型NGARCH(1,1)与非对称幂自回归条件异方差模型APARCH(1,1)进行n步超前预测。非对称广义自回归条件异方差模型NGARCH(1,1)的n步超前预测方法为:利用T月的残差aT与方差代入拟合好系数的公式得到T+1月的方差预测值而T+1月残差的预测值为从而T+2月方差的预测值为重复此步骤,则可以得到一直到T+L月的方差预测值:2≤j≤L;非对称幂自回归条件异方差模型APARCH(1,1)的n步超前预测方法为:利用T月的残差aT与方差代入拟合好系数的公式得到T+1月的方差预测值而T+1月残差的预测值为从而T+2月方差的预测值为从而T+3月方差的预测值为重复此步骤,则可以得到一直到T+L月的方差预测值。之后利用这些预测值与日数据计算的样本方差来计算预测的均方误差MSFE:比较由非对称广义自回归条件异方差模型NGARCH(1,1)与非对称幂自回归条件异方差模型APARCH(1,1)得到的预测的均方误差MSFE,选择预测的均方误差MSFE值小的作为最终用来预测的条件方差模型。在一优选的实施例中,如图4所示,在上述图1的实施例的基础上,上述步骤S4包括:S41,获取所述条件均值模型的残差,对所述残差的平方进行ARCH效应检验;S42,在ARCH效应检验通过时,对所述残差进行Jarque-Bera检验,根据检验结果选择新息的类型;S43,基于所述条件均值模型进行超前预测得到所述待预测的未来时间段的均值,基于所述条件方差模型进行超前预测得到所述待预测的未来时间段的方差;S44,基于所选择的新息的类型、所述均值及所述方差获取所述未来时间段的所述天气变量的概率分布。本实施例中,根据条件均值模型求出残差,残差是指实际观察值与条件均值模型的估计值(拟合值)之间的差,然后对残差的平方做Ljung-Box检验。若自回归项p>0.05,表明天气变量有很强的ARCH效应,检验通过,可以建立自回归条件异方差模型。对残差做Jarque-Bera检验,其检验统计量为JB统计量:JB=n6[s2+(k-3)24],]]>其中,是样本的偏度系数,是样本的峰度系数。在正态分布的假设下,JB统计量渐进地服从自由度为2的卡方分布。若p>0.05,则选择高斯新息,即认为模型中的随机扰动服从正态分布;若p≤0.05,则选择学生t分布的新息,即认为模型中的随机扰动项服从t分布。选择待预测的未来时间段,基于条件均值模型进行n步超前预测得到待预测的未来时间段的均值,基于上述条件方差模型进行n步超前预测得到所述待预测的未来时间段的方差。如果选择的是高斯新息,则得到的天气变量的概率分布为以预测得到的均值和方差分别为均值和方差的正态分布。即有其中,xt是要预测的天气变量在t月的预测值,μt与分别是预测得到的均值与方差;如果选择的是学生t新息,则得到的天气变量的概率分布为以预测得到的均值和方差分别为均值和方差的有偏学生t分布,即有其中,是预测得到的方差,v是学生t分布的自由度,是自由度为v、均值为μt的有偏学生t分布。如图5所示,图5为本发明一种天气预测的装置一实施例的结构示意图,所述天气预测的装置包括:获取模块101,用于获取所关注地区预设的过去时间段内的天气变量;本实施例中,天气变量可以是以日或者以月为时间单位的变量,预设的过去时间段可以是过去某几个月,过去一年或者几年等,天气变量可以是所关注地区的月均降水量、月均气温、日均降水量、日均气温等。第一建立模块102,用于建立所述天气变量的条件均值模型;本实施例中,可以直接获取天气变量的推广的自相关函数EACF及其简化表,也可以对天气变量进行差分,以获取稳定的天气变量序列,然后获取该稳定的天气变量序列的推广的自相关函数EACF及其简化表。通过推广的自相关函数EACF及其简化表来确定自回归求和移动平均模型ARIMA的参数p,q,其中,参数p为自回归项,参数q为移动平均项数。然后,重复估计上述自回归求和移动平均模型ARIMA,直到所有系数都显著。本实施例可以使用极大似然法、条件似然法或广义矩估计等方法估计自回归求和移动平均模型ARIMA,优选地,利用条件似然法来重复估计上述自回归求和移动平均模型ARIMA。对以上估计得到的所有模型,进行Ljung-Box检验,保留自回归项p值大于0.05的模型。计算每个保留下来的模型的赤池信息量准则AIC,选择AIC最小的模型作为天气变量的条件均值模型。第二建立模块103,用于建立所述天气变量的条件方差模型;本实施例中,考虑到天气数据的波动聚集性和非对称性,可以采用广义自回归条件异方差GARCH族模型中的非对称广义自回归条件异方差模型NGARCH与非对称幂自回归条件异方差模型APARCH,对非对称广义自回归条件异方差模型NGARCH与非对称幂自回归条件异方差模型APARCH进行估计。本实施例可以利用条件似然法分别估计非对称广义自回归条件异方差模型NGARCH与非对称幂自回归条件异方差模型APARCH的系数,选择较优的模型作为本实施例中的条件方差模型。预测模块104,用于选择待预测的未来时间段,根据所述条件均值模型及所述条件方差模型获取所述未来时间段的所述天气变量的概率分布。本实施例中,选定待预测的未来时间段,例如选为未来半年或者一年作为该未来时间段,利用条件均值模型的n步超前预测得到该未来时间段的均值,利用条件方差模型的n步超前预测得到该未来时间段的方差,根据该均值及方差可以得到该未来时间段的天气变量的概率分布,通过该概率分布可以预测未来的天气状况。在一优选的实施例中,如图6所示,在上述图5的实施例的基础上,第一建立模块102包括:差分单元,用于对所述天气变量进行差分;选择单元,用于获取差分后的天气变量的推广自相关函数,根据所述推广自相关函数选择自回归移动平均模型ARIMA的参数,根据所述参数确定所述自回归移动平均模型ARIMA;第一估计单元,用于对确定后的自回归移动平均模型ARIMA进行重复估计,获取系数显著的自回归移动平均模型ARIMA;第一检验单元,用于对所述系数显著的自回归移动平均模型ARIMA进行Ljung-Box检验,根据检验结果获取自回归项值大于预设阈值的自回归移动平均模型ARIMA;计算单元,用于计算所述自回归项值大于预设阈值的自回归移动平均模型ARIMA的赤池信息量准则AIC,选择所述赤池信息量准则AIC最小的自回归移动平均模型ARIMA作为所述条件均值模型。本实施例中,对天气变量进行季节差分,把季节差分算子(1-B12)作用在该天气变量序列之上,得到新的序列{Xt},{Xt}是去除了季节性的时间序列。差分的意义在于,由于天气变量序列必然受到季节等时间因素的影响,差分后的序列能够更加稳定,对上述的序列{Xt}进行差分,对于序列{Xt}:ΔXt=Xt-Xt-1,此处Xt和Xt-1对应在时刻t和时刻t-1时的天气变量,则ΔXt为在t时刻的一阶差分(d=1)。当然,也可以进行n阶差分,有n阶差分为:ΔnXt=Δn-1Xt-Δn-1Xt-1,对n取不同的值,直到差分后的数据可以通过Ljung-Box检验,即自回归项p值小于预设阈值0.05,即可得到平稳的序列,以及差分次数d。自回归项p就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。如果自回归项p很小,说明原假设情况的发生的概率很小,而如果发生了,根据小概率原理,我们就有理由拒绝原假设,自回归项P值越小,我们拒绝原假设的理由越充分。总之,自回归项p越小,表明结果越显著。此处的预设阈值0.05是统计学界公认为可以作为判断是否显著的阈值。进行Ljung-Box检验的检验统计量为:其中,T是样本量,m是检验的滞后期数。例如,对于天气变量的月数据,取m为24来检验两年内的相关性;是样本的间隔为l的自相关函数,{xt}是差分后的天气变量序列。当时,拒绝不存在序列相关的原假设,这里的是自由度为m的卡方分布的95百分位分为点。通过数据的推广的自相关函数EACF的简化表来确定自回归移动平均模型ARIMA的参数p,q。推广的自相关函数EACF的简化表如上述表1所示。表1中的行对应于上述的p,列对应于q,“X”表示对应的推广的自相关函数EACF的绝对值大于或等于推广的自相关函数EACF的渐进标准误的两倍;“o”表示对应的推广的自相关函数EACF的绝对值小于推广的自相关函数EACF的渐进标准误的两倍。推广的自相关函数EACF的标准误用直接得到,T是样本容量。具体而言,选择简化表中具有最小“p+q”值的“o”所具备的p与q作为自回归移动平均模型ARIMA的参数。例如,由上述的表可以得到p=0,q=2。对上述自回归移动平均模型ARIMA(p,d,q)进行估计,可以使用极大似然法、条件似然法、广义矩估计等方法。对自回归移动平均模型ARIMA(p,d,q)进行估计可以得到每个系数的估计值与标准误,据此计算出t统计量。删除p大于预设阈值0.05的系数,重新估计,重复估计直到所有系数都显著。对以上估计后得到的所有模型,进行Ljung-Box检验,保留p大于预设阈值0.05的模型。计算每个保留下来模型的赤池信息量准则AIC,选择赤池信息量准则AIC最小的模型作为天气变量的条件均值模型。其中,赤池信息量准则AIC定义为:其中,k是包括了截距项在内的回归元个数,n是观测样本数,RSS是回归残差平方和。采用AIC准则的优势在于,经过其筛选后的模型无论在样本内还是在样本外都能得到较好的预测表现,是一种建立在熵的概念基础上,可以权衡所估计模型的复杂度和此模型拟合数据的优良性的准则。实践中,赤池信息量准则AIC鼓励数据拟合的优良性但是尽量避免出现过度拟合的情况。所以在挑选模型的过程中,优先考虑的模型应是赤池信息量准则AIC最小的那一个,这样,能够保证找到最好地解释数据但包含最少自由参数的模型。在一优选的实施例中,如图7所示,在上述图5的实施例的基础上,所述第二建立模块103包括:第二估计单元,用于利用极大似然法分别估计非对称广义自回归条件异方差模型NGARCH的系数与非对称幂自回归条件异方差模型APARCH的系数,根据各自的系数分别确定所述非对称广义自回归条件异方差模型NGARCH与非对称幂自回归条件异方差模型APARCH;回测检验单元,用于对确定的所述非对称广义自回归条件异方差模型NGARCH与非对称幂自回归条件异方差模型APARCH进行回测检验,根据检验结果选择确定的所述非对称广义自回归条件异方差模型NGARCH或非对称幂自回归条件异方差模型APARCH作为所述条件方差模型。本实施例中,可以利用条件似然法分别估计非对称广义自回归条件异方差模型NGARCH与非对称幂自回归条件异方差模型APARCH的系数。非对称广义自回归条件异方差模型NGARCH(1,1)形式如下:xt=μt+at,at=σtεt,εt~D(0,1),σt2=β0+β1σt-12+β2(at-1-θσt-1)2,]]>其中,μt是由自回归移动平均模型ARIMA得到的条件均值,D(0,1)表示均值为0、方差为1的正态分布或学生t分布,βi为正的系数,i≥0,θ是杠杆系数。APARCH(1,1)的模型形式为:xt=μt+at,at=σtεt,εt~D(0,1),σtδ=β0+α1(|at-1|+γ1at-1)δ+β1σt-1δ,]]>其中,μt是由自回归移动平均模型ARIMA得到的条件均值,D(0,1)表示均值为0、方差为1的正态分布或学生t分布,α1、β0、β1为正的系数,δ为正实数。这两个模型用极大似然法进行估计。如果新息是高斯新息,非对称广义自回归条件异方差模型NGARCH(1,1)的对数似然函数为:其中非对称幂自回归条件异方差模型APARCH(1,1)的对数似然函数为:其中如果新息是学生t新息,非对称广义自回归条件异方差模型NGARCH(1,1)的对数似然函数为:l(β0,β1,β2,θ)=-Σt=1T[12ln(σt2)+v+12ln(1+at2(v-2)σt2)],]]>其中,v是学生t分布的自由度,可以取3至6之间的一个整数值;非对称幂自回归条件异方差模型APARCH(1,1)的对数似然函数为:l(β0,α1,β1,γ1)=-Σt=1T[12ln(σt2)+v+12ln(1+at2(v-2)σt2)],]]>其中,v是学生t分布的自由度,可以取3至6之间的一个整数值。以上对数似然函数可以通过数值方法,如拟退火算法、遗传算法等求最大值点;也可以通过一阶条件,即偏导数等于0来求最大值点;此外,还可以使用广义矩估计、条件似然法等方法。本实施例中,利用比上述天气变量更高频的数据集进行回测检验,比较两个条件方差模型并选出更优的。具体地,如果上述天气变量为月均变量,那么可以利用日均或逐小时的天气变量进行回测。回测结果的好坏用预测的均方误差MSFE来衡量,选取预测的均方误差MSFE更小的模型作为更优模型。以下以月为时间单位的天气变量为原始数据进行回测检验:假设有0至T月的月天气变量数据,以及T+1至T+L月的日数据。再假设每月的日数据为n,则共有nL个日数据。根据这些日数据可以计算出T+1至T+L月每个月的样本方差,计算第j个月样本方差的公式为:T<j≤T+L。之后再由拟合好的非对称广义自回归条件异方差模型NGARCH(1,1)与非对称幂自回归条件异方差模型APARCH(1,1)进行n步超前预测。非对称广义自回归条件异方差模型NGARCH(1,1)的n步超前预测方法为:利用T月的残差aT与方差代入拟合好系数的公式得到T+1月的方差预测值而T+1月残差的预测值为从而T+2月方差的预测值为重复此步骤,则可以得到一直到T+L月的方差预测值:2≤j≤L;非对称幂自回归条件异方差模型APARCH(1,1)的n步超前预测方法为:利用T月的残差aT与方差代入拟合好系数的公式得到T+1月的方差预测值而T+1月残差的预测值为从而T+2月方差的预测值为从而T+3月方差的预测值为重复此步骤,则可以得到一直到T+L月的方差预测值。之后利用这些预测值与日数据计算的样本方差来计算预测的均方误差MSFE:比较由非对称广义自回归条件异方差模型NGARCH(1,1)与非对称幂自回归条件异方差模型APARCH(1,1)得到的预测的均方误差MSFE,选择预测的均方误差MSFE值小的作为最终用来预测的条件方差模型。在一优选的实施例中,如图8所示,在上述图5的实施例的基础上,预测模块104包括:第二检验单元,用于获取所述条件均值模型的残差,对所述残差的平方进行ARCH效应检验;第三检验单元,用于在ARCH效应检验通过时,对所述残差进行Jarque-Bera检验,根据检验结果选择新息的类型;预测单元,用于基于所述条件均值模型进行超前预测得到所述待预测的未来时间段的均值,基于所述条件方差模型进行超前预测得到所述待预测的未来时间段的方差;获取单元,用于基于所选择的新息的类型、所述均值及所述方差获取所述未来时间段的所述天气变量的概率分布。本实施例中,根据条件均值模型求出残差,残差是指实际观察值与条件均值模型的估计值(拟合值)之间的差,然后对残差的平方做Ljung-Box检验。若自回归项p>0.05,表明天气变量有很强的ARCH效应,检验通过,可以建立自回归条件异方差模型。对残差做Jarque-Bera检验,其检验统计量为JB统计量:JB=n6[s2+(k-3)24],]]>其中,是样本的偏度系数,是样本的峰度系数。在正态分布的假设下,JB统计量渐进地服从自由度为2的卡方分布。若p>0.05,则选择高斯新息,即认为模型中的随机扰动服从正态分布;若p≤0.05,则选择学生t分布的新息,即认为模型中的随机扰动项服从t分布。选择待预测的未来时间段,基于条件均值模型进行n步超前预测得到待预测的未来时间段的均值,基于上述条件方差模型进行n步超前预测得到所述待预测的未来时间段的方差。其中,获取单元具体用于若所选择的新息的类型为高斯新息,则所述未来时间段的所述天气变量的概率分布为所述均值和方差的正态分布:其中,μt为均值,为方差;若所选择的新息的类型为学生t新息,则所述未来时间段的所述天气变量的概率分布为所述均值和方差的有偏学生t分布:其中,为方差,v是学生t分布的自由度,是自由度为v、均值为μt的有偏学生t分布。以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1