一种基于倒向回归方程的应用电力大数据预测GDP的方法与流程

文档序号:11831921阅读:630来源:国知局
一种基于倒向回归方程的应用电力大数据预测GDP的方法与流程
本发明涉及一种基于倒向回归方程的应用电力大数据预测GDP的方法。
背景技术
:传统的预测GDP的方法,实时性低,误差较大,无法提供时效性好、精度高的预测数据,导致无法向电力与经济主管部门提供有效的决策参考。技术实现要素:针对上述问题,本发明提供一种基于倒向回归方程的应用电力大数据预测GDP的方法,利用正向回归方程的参数估计值推导倒向回归方程,解构电力数据并以此预测地区经济发展情况,为电力与经济主管部门提供有效的建模方法及决策参考。下面以江苏省为例,对下述名称进行解释:正向回归方程:以江苏省用电量增长率为被解释变量,用电量增长率的一阶滞后变量、二阶滞后变量、江苏省GDP增长率、当季平均气温上升幅度、江苏省产业结构、江苏省城镇人口变化率、产成品价格指数增长率、当季的节假日天数、高温季度、低温季度、当季是否存在5-7天长假为解释变量,通过最小二乘法估计参数,测算解释变量对被解释变量的影响程度。倒向回归方程:从正向回归方程解构而来。以江苏省GDP增长率为被解释变量,江苏省用电量增长率、用电量增长率的一阶滞后变量、二阶滞后变量、当季平均气温上升幅度、江苏省产业结构、江苏省城镇人口变化率、产成品价格指数增长率、当季的节假日天数、高温季度、低温季度、当季是否存在5-7天长假为解释变量,用正向回归方程估计出的参数,测算各解释变量对GDP增长率的影响程度。为实现上述技术目的,达到上述技术效果,本发明通过以下技术方案实现:一种基于倒向回归方程的应用电力大数据预测GDP的方法,其特征在于,包括如下步骤:步骤1、采集历史数据:A)采集待预测地区工业企业历史用电量数据,数据的频率为季度;B)计算每个季度的平均气温的中位数;C)计算每个季度节假日的天数;D)计算每个季度待预测地区的工业品出厂价格指数;步骤2、进行变量设置:A)设置工业企业用电量增长率et=log(Et/Et-1),Et表示第t期的工业企业用电量;B)设置GDP的增长率gdpt=log(GDPt/GDPt-1),GDPt表示第t期的GDP;C)设置每个季度平均气温的上升幅度tet=log(Tet/Tet-1),Tet表示第t期的季度平均气温;D)对于每个季度,若属于高温季度,则设置高温虚拟变量MH=1,否则MH=0;E)对于每个季度,若属于低温季度,则设置低温虚拟变量ML=1,否则ML=0;F)设置工业品出厂价格指数的增长率ppit=log(PPIt/PPIt-1),PPIt表示第t期的工业品出厂价格指数;G)设置每个季度的节假日天数变量Dt;H)对于每个季度,若存在5-7天长假,则设置假期虚拟变量LH=1,否则为0;步骤3、对工业企业用电量、GDP进行对数差分处理;步骤4、设置正向回归方程并进行参数估计:et=β0+β1gdpt+β2tet+β3MHt+β4MLt+β5Dt+β6LH+β7ppit+ξt(1)式中,β0,β1,...,β7是回归系数的估计值,ξt是最小二乘法中的误差项;采用最小二乘法估计出β0,β1,...,β7;加入用电量增长率一阶滞后变量β8et-1和二阶滞后变量β9et-2,设置如下线性回归方程:et=β0+β1gdpt+β2tet+β3MHt+β4MLt+β5Dt+β6LH+β7ppit+β8et-1+β9et-2+ξt(4)步骤5、利用估计的参数推导倒向回归方程模型:由方程(1)可知GDP增长率的预测值gdpt:gdpt=1β1[et-β0-β2tet-β3MHt-β4MLt-β5Dt-β6LH-β7ppit-ξt]=etβ1-1β1[β0+β2tet+β3MHt+β4MLt+β5Dt+β6LH+β7ppit+ξt]---(5)]]>则下一期GDP的预测值GDPt+1的计算公式为:GDPt+1=GDPt·exp(gdpt+1)(7)。优选,当待预测地区为江苏省时,采用最小二乘法估计出β0,β1,...,β7,则方程(1)对应为:et=0.064329+0.006007gdpt+0.120598tet+0.035119MHt+0.036952MLt-0.004956Dt+0.041132LH+0.499193ppit+ξt---(2).]]>优选,设置以待预测季度为基准,向前取个季度的数据作为窗口,对每个季度的数据估计一次参数β0,β1,...,β7的估计值,用于预测待预测季度的GDP。比如,本发明的有益效果是:利用正向回归方程的参数估计值推导倒向回归方程,解构电力数据并以此预测地区经济发展情况,为电力与经济主管部门提供有效的建模方法及决策参考。附图说明图1是本发明GDP实际增速与预测增速对比示意图;图2是本发明实际公布GDP与测算的GDP对比示意图;图3是本发明2010-2014年GDP的测算增速与公布增速对比示意图。具体实施方式下面结合附图和具体的实施例对本发明技术方案作进一步的详细描述,以使本领域的技术人员可以更好的理解本发明并能予以实施,但所举实施例不作为对本发明的限定。一种基于倒向回归方程的应用电力大数据预测GDP的方法,包括如下步骤:步骤1、采集历史数据:A)采集待预测地区工业企业历史用电量数据,数据的频率为季度;B)计算每个季度的平均气温的中位数;C)计算每个季度节假日的天数;D)计算每个季度待预测地区的工业品出厂价格指数;步骤2、进行变量设置:A)设置工业企业用电量增长率et=log(Et/Et-1),Et表示第t期的工业企业用电量;B)设置GDP的增长率gdpt=log(GDPt/GDPt-1),GDPt表示第t期的GDP;C)设置每个季度平均气温的上升幅度tet=log(Tet/Tet-1),Tet表示第t期的季度平均气温;D)对于每个季度,若属于高温季度,则设置高温虚拟变量MH=1,否则MH=0;E)对于每个季度,若属于低温季度,则设置低温虚拟变量ML=1,否则ML=0;F)设置工业品出厂价格指数的增长率ppit=log(PPIt/PPIt-1),PPIt表示第t期的工业品出厂价格指数;G)设置每个季度的节假日天数变量Dt;H)对于每个季度,若存在5-7天长假,则设置假期虚拟变量LH=1,否则为0;步骤3、对工业企业用电量、GDP进行对数差分处理;步骤4、设置正向回归方程并进行参数估计:et=β0+β1gdpt+β2tet+β3MHt+β4MLt+β5Dt+β6LH+β7ppit+ξt(1)式中,β0,β1,...,β7是回归系数的估计值,ξt是最小二乘法中的误差项。最小二乘法的思路就是使得该误差项最小化;采用最小二乘法估计出β0,β1,...,β7;加入用电量增长率一阶滞后变量β8et-1和二阶滞后变量β9et-2,设置如下线性回归方程:et=β0+β1gdpt+β2tet+β3MHt+β4MLt+β5Dt+β6LH+β7ppit+β8et-1+β9et-2+ξt(4)步骤5、利用估计的参数推导倒向回归方程模型:由方程(1)可知GDP增长率的预测值gdpt:gdpt=1β1[et-β0-β2tet-β3MHt-β4MLt-β5Dt-β6LH-β7ppit-ξt]=etβ1-1β1[β0+β2tet+β3MHt+β4MLt+β5Dt+β6LH+β7ppit+ξt]---(5)]]>则下一期GDP的预测值GDPt+1的计算公式为:GDPt+1=GDPt·exp(gdpt+1)(7)。下面以江苏省为例进行详细介绍。收集2006年第3季度至今的江苏省工业企业用电量数据(E),考虑到目前的频率,我们只能收集到最高频率的GDP数据为季度,故用电的数据也是季度数据,工业企业用电量数据(E)的频率为季度;每个季度的平均气温或者温度(T)的中位数,每个季度节假日的天数(D);江苏省的PPI(工业品出厂价格指数)。分别对上述变量取对数,因变量是江苏省工业企业用电量增长率et=log(Et/Et-1),Et表示第t期的工业企业用电量;自变量是江苏省GDP的增长率gdpt=log(GDPt/GDPt-1),GDPt表示第t期的江苏省GDP;设置每个季度平均气温的上升幅度tet=log(Tet/Tet-1),Tet表示第t期的江苏省季度平均气温;对于每个季度,若属于高温季度,则设置高温虚拟变量MH=1,否则MH=0,对于每个季度,若属于低温季度,则设置低温虚拟变量ML=1,否则ML=0,以此设置虚拟变量,来区别高温季度和低温季度,一般的,认为高温季度为三季度,低温季度为一季度;设置工业品出厂价格指数的增长率ppit=log(PPIt/PPIt-1),PPIt表示第t期的工业品出厂价格指数。由于节假日严重影响用电量,除了设置每个季度的节假日天数变量Dt之外,有必要针对几个长假设置虚拟变量LH:对于每个季度,若存在5-7天长假,则设置假期虚拟变量LH=1,否则为0。由以上的说明可以构建一个数据表,其中包含定量变量和定性变量(虚拟变量),如表1所示。表1变量设置其中,观测值1假设来自第二季度,其既不是高温季度也不是低温季度,故两个温度季度的虚拟变量都为0,但由于当季存在7天长假,故该虚拟变量为1。可以通过查找Wind数据库,下载江苏省工业企业用电量等数据,为了保证数据的平稳性,对江苏省工业企业用电量、江苏省GDP进行了对数差分处理,使之成为增长率,即成为平稳的过程,以便进行回归,通过对数差分处理所形成的数据如表2所示。表2数据表(2006年三季度至2015年二季度)可以合理地认为,江苏省的用电量是结果(因变量),经济增长、产出、气温、节假日等因素都对电量产生影响,即这些变量都是自变量,由此可以设置如下线性回归方程:et=β0+β1gdpt+β2tet+β3MHt+β4MLt+β5Dt+β6LH+β7ppit+ξt(1)式中,β0,β1,...,β7是回归系数的估计值,ξt是最小二乘法中的误差项;上述的方程一共有7个变量,8个回归参数,可以采用线性回归的最小二乘法估计出来,从而得到回归系数的估计值β0,β1,...,β7,这样就得到正向回归方程,具体如表3和4所示:表3解释变量系数的参数估计和假设检验表4整体方程的假设检验由表3和4可知,R2=0.904760,这表示回归结果具有高度的解释力,其中的主要参数回归结果是显著的,由上述的回归结果可以得到的回归方程为:et=0.064329+0.006007gdpt+0.120598tet+0.035119MHt+0.036952MLt-0.004956Dt+0.041132LH+0.499193ppit+ξt---(2)]]>此外,考虑上一期用电量会对本期用电量产生影响,可尝试将用电量增长率滞后变量导入模型,进行线性回归的最小二乘法估计。当加入一阶滞后项后,设置如下线性回归方程et=β0+β1gdpt+β2tet+β3MHt+β4MLt+β5Dt+β6LH+β7ppit+β8et-1+ξt(3)当用电量增长率一阶滞后变量β8et-1和二阶滞后变量β9et-2均导入模型,进行线性回归的最小二乘法估计,可以设置如下线性回归方程:et=β0+β1gdpt+β2tet+β3MHt+β4MLt+β5Dt+β6LH+β7ppit+β8et-1+β9et-2+ξt(4)由于我们研究目的是由用电量来反映经济,即反映GDP,因此,由方程(1)可知,gdpt=1β1[et-β0-β2tet-β3MHt-β4MLt-β5Dt-β6LH-β7ppit-ξt]=etβ1-1β1[β0+β2tet+β3MHt+β4MLt+β5Dt+β6LH+β7ppit+ξt]---(5)]]>由公式(5)可知,GDP增长率的预测值gdpt,是由电量增长率的预测值除以β1,即基础上再剔除其他的因素1β1[β0+β2tet+β3MHt+β4MLt+β5Dt+β6LH+β7ppit+ξt]]]>而解构出来的,故名为解构方程。由(2)式可将(5)式可改写为:gdpt=et0.014555-10.014555[0.054961+0.090336tet+0.062741MHt+0.028967MLt-0.002761Dt+0.018168LH+0.524071ppit+ξt]=log(Et/Et-1)0.014555-10.014555[0.054961+0.090336log(Tet/Tet-1)+0.062741MHt+0.028967MLt-0.002761Dt+0.018168LH+0.524071log(PPIt/PPIt-1)+ξt]---(6)]]>由(6)可知,如果知道方程的系数估计值β0,β1,...,β7,又知道电量的增长率et,以及气温、节假日等变量的数据,由方程(2)即可得到gdp的增长率gdpt。若要进一步预测GDP的具体数值,则根据gdpt=log(GDPt/GDPt-1)可知:GDPt+1=GDPt·exp(gdpt+1)(7)显然,由(3)易知,下一期的GDP是本期GDPt乘以指数为底的对数增长率exp(gdpt+1),由此即可估计出下一个的GDP,即GDPt+1。为了对上述方法进一步说明,特举如下1个例子。回归样本共计36组,首先使用前20组进行线性回归建立前述(1)式正向方程et=0.104362-0.000551gdpt+0.117578tet+0.068029MHt+0.037878MLt-0.005001Dt+0.038813LH+0.706026ppit+ξt---(8)]]>记录方程的系数估计值,进而结合下一期样本数据,通过前述倒向方程求出第21期GDP,倒向方程即gdpt=log(Et/Et-1)-0.000551+10.000551[0.104362+0.117578log(Tet/Tet-1)+0.068029MHt+0.037878MLt-0.005001Dt+0.038813LH+0.706026log(PPIt/PPIt-1)+ξt]---(9)]]>此时,令t=21,将电量的增长率et,以及气温、节假日等变量的数据带入方程,有gdpt=0.04624933-0.000551+10.000551[0.104362+0.117578*0.088261+0.068029*1+0.037878*0-0.005001*27+0.038813*0-0.706026*0.00208]=0.043044---(10)]]>由(7)式可知,第21期GDP为13588.63亿元。以上就完成了从正向方程解构倒向方程,并利用倒向方程预测GDP的整个过程。以上的模型假设回归系数在一段时间保持不变,但事实上,回归系数随时可能发生变化,因此,比较合理的测试是设置一个参数以待预测季度为基准,向前取个季度的数据作为窗口,对每个季度的数据估计一次参数β0,β1,...,β7的估计值,用于预测待预测季度的GDP。比如,即数据样本为10个季度,每个季度估计一次参数,用于测算下个季度,到下个季度的时候,把最早的样本剔除,增加最新季度的样本,样本仍为10个季度,这样不断的滚动向前,测算每个季度的GDP,形成动态的预测,即为变参数模型的思想,充分利用数据自身来说话。根据(1)式建立正向方程,记录各参数估计值,通过倒向方程预测GDP增长率和GDP。总体样本为36个季度,因此共建立正向方程26次,各次参数估计值如表5所示,各期预测值与实际值如表6所示,GDP增速和GDP预测值与实际值对比分别如图1和图2所示。表5各正向方程参数估计值表6测算值与实际公布值对比从图1、图2可以看出,利用用电量测算的季度江苏省GDP在增速和数值方面的变化趋势与统计局公布的结果基本一致,GDP增速及数值均略低于统计局公布结果,预测精确度很高。为使测算结果与统计局公布结果之间的对比更显著化,下文利用用电量测算的江苏省季度GDP增速计算得出江苏省2011-2014四年(因为测算GDP增速从2010年三季度开始)的年度GDP增速,并且将其与统计局的公布结果相对比。江苏省年度GDP计算过程:根据各个季度的预测GDP相加得到对应各年份的江苏GDP,在此基础上进一步计算得出江苏GDP年度增速。2011-2014四年的测算GDP和公布的年度GDP见表7,测算GDP和公布GDP的年度增速对比见图3。表72011-14年江苏年度GDP测算值与实际公布值对比从图3可以清晰地看出,基于用电量测算的江苏省年度GDP增速在每个年份均接近基于统计局公布数据计算得到的增速,而同时,基于用电量测算反映出的2011-2014四年间年度GDP增速逐年放缓的情况与统计局公布数据反映的情况一致。利用正向回归方程的参数估计值推导倒向回归方程,解构电力数据并以此预测地区经济发展情况,为电力与经济主管部门提供有效的建模方法及决策参考。以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或者等效流程变换,或者直接或间接运用在其他相关的
技术领域
,均同理包括在本发明的专利保护范围内。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1