本发明属于对社会总抚养比进行模拟和预测分析的模型,具体的说是一种种基于二次项拟合gm(1,1)的社会总抚养比预测模型。
背景技术:
随着经济的发展、人口结构的转变,尤其是近两年二孩政策全面实施,有关人口结构与经济发展之间的关系成为热门研究课题。
社会总抚养比是指少儿人口和老年人口之和与劳动年龄人口的比值,由于计划生育政策等施行已近二十多年,我国正处于人口结构转变和人口红利后期,生育率低且人口老龄化严重,社会总抚养比正处于不断增加的阶段。关注社会总抚养比的现状以及未来的趋势是很有必要的,及早的了解到社会总抚养比的变化趋势,将有利于政府对经济发展做出宏观调控和制定合理的人口发展战略。
在人口红利、社会抚养比与经济增长关系研究方面:mason采用增长因素分析法对1982-2000年快速增长的中国经济进行了分析,并指出人口红利对中国人均gdp增长的贡献率为15%。mason等人以人口红利作为理论基础进行研究,指出人口红利通过劳动人口的绝对增长产生的“绝对效应”和通过社会抚养比的下降产生的“行为效应”两个方面来影响经济增长。bloom以1960-2000年中印两国的人口数据为研究基础,指出人口红利和社会开放程度是两国1980年以来经济高速增长的主要原因。misbah等人研究了1961年至2003年中国、印度和巴基斯坦人口红利对经济增长的影响,研究指出2005年后,中国人口红利效应开始弱化并走向负债,印度、巴基斯坦则继续享受人口红利所带来的经济增长。蔡昉等人采取静态的方法分析研究了中国社会总抚养比与经济增长之间的关系,研究结果表明社会总抚养比每下降1个百分点将带来0.115%的经济增长。张学辉等人指出劳动力的充分供给、高储蓄率、较低的社会总抚养比促进了我国经济的高速增长。刘家树基于协整的方法研究分析了中国人口结构和人均gdp关系,指出由于日益增加的老龄化人口,我国的人口红利将无法得以充分的利用。钟水映认为我国社会总抚养比随着我国老龄化人口的日趋增加而提升,并给经济增长带来显著的负面效应。王金营等人以中国1978-2007年的人口数据和经济数据作为研究对象,指出经济增长与社会抚养比之间是负相关的关系。刘书明等人通过对1995~2014年数据的实证分析,发现我国少儿人口数量减少且比重呈持续下降趋势,老年人口数量持续增长且比重呈上升趋势,老龄化进程加快。
技术实现要素:
本发明为了克服现有技术存在的不足之处,利用二次项拟合gm(1,1)应用于社会总抚养比变化规律研究,提出一种基于二次项拟合gm(1,1)的社会总抚养比预测模型,目的在于基于二次项拟合gm(1,1)建立微分方程描述社会总抚养比变化规律,分析社会总抚养比的现状以及预测未来的动态趋势,及早的了解到社会总抚养比的变化特性,为经济建设与人口政策的和谐发展提供科学指导建议。
为了实现上述发明目的,本发明采用如下技术方案:
基于二次项拟合gm(1,1)的社会总抚养比预测模型,包括如下步骤:
步骤1:对原始数据做一次累加处理;
步骤2:给出gm(1,1)基本模型及参数计算公式;
步骤3:对一次累加数列利用最小二乘法做二次多项式拟合;
步骤4:确定yn和矩阵b;
步骤5:得到二次项拟合gm(1,1)预测模型;
步骤6:进行模型的自身检验和多模型对比检验。
进一步,所述步骤1中,设x(0)(1),x(0)(2),…,x(0)(n)是预测指标所选取样本的原始数据序列,对该原始数据序列作作一次累加生成处理,处理方法如下式:
从而得到一个新的数据序列:
{x(1)(k)k=1,…,n}={x(1)(1),x(1)(2),…,x(1)(n)}。
进一步,所述步骤2中,基本的gm(1,1)模型将原始数据处理后得到的新的数据序列的变化趋势近似地用微分方程来描述:
其中,a和b是待识别参数,a称为发展参数,b称为内生控制灰数;参数a和b可以通过以下最小二乘法式计算得到;
进一步,所述步骤3中,二次项拟合gm(1,1)模型对一次累计数列式进行最小二乘法拟合;在matlab中利用ployfit函数对一次累加序列进行多项式拟合,得到多项式函数的导数值如下式:
s(x)=a0+a1x+a2x2+…+anxn
然后对上式进行求导并求出导数值式:
进一步,所述步骤4中:
进一步,所述步骤5中:二次项拟合gm(1,1)预测模型为:
进一步,所述步骤6中:对模型进行精度检验,首先进行残差和相对误差检验,残差检验计算公式为:
相对误差为:
另外还进行后验差检验,后验差检验主要包括两个指标,差检验的方差比c和小误差概率p,其中,原始数据方差为:
残差数据方差为:
差检验的方差比为:
c=s2/s1
小误差概率p为:
与已有技术相比,本发明的有益效果体现在:
1.gm(1,1)模型是灰色系统理论中应用最广泛的一种灰色动态预测模型,该模型由一个单变量的一阶微分方程构成。它主要用于复杂系统某一主导因素特征值的拟合和预测,以揭示主导因素变化规律和未来发展变化态势。由于实际问题样本数据少,且数据规律性较低,导致的原始gm(1,1)模型精度不够,当对原始数据进行一次累加处理后使得数据呈现出递增的趋势,因此选择二次项拟合的gm(1,1)模型以提升模型拟合精度。
2.通过残差、相对误差及后验差比值、小误差概率等预测模型评价手段,进行了多个模型的比较分析,确定所选择的二次项拟合gm(1,1)模型的预测有效性。
3.得到了社会总抚养比预测模型,如式(9)所示,给出了模型的求解途径和有效性检验方法,能够对社会总抚养比的变化规律进行预测分析。
4.本发明将二次项拟合gm(1,1)用于社会总抚养比的预测,并基于二次项最小二乘法拟合及微分方程建立预测模型并求解,同时基于相对误差、残差及后验差对模型进行了检验。
附图说明
图1是原始数据与一次累加后数据的对比图。
图2是二次多项式拟合曲线。
图3是二次项拟合模型的预测值与实际值的对比图。
图4是三个模型的估算值与实际值的比较图。
图5是三个模型各年份的相对误差图。
图6是2016-2025年江苏省社会总抚养比预测值的拟合散点图。
具体实施方式
下面结合附图对本发明作进一步详细说明。
本发明基于二次项拟合gm(1,1)的社会总抚养比预测模型,按如下步骤进行:
步骤1:对原始数据做一次累加处理。
设x(0)(1),x(0)(2),…,x(0)(n)是预测指标所选取样本的原始数据序列,通常情况下,样本的原始数据是具有随机性和不完整性的而非平稳的随机数列,不能够直接用它进行指标预测。为了弱化原始数据的随机性以增加数据的平稳性,需要对该原始数据序列作一些处理,通常是作一次累加生成处理,处理方法如式(1)所示:
从而得到一个新的数据序列:
{x(1)(k)|k=1,…,n}={x(1)(1),x(1)(2),…,x(1)(n)}(2)
步骤2:给出gm(1,1)基本模型及参数计算公式
基本的gm(1,1)模型将原始数据处理后得到的新的数据序列的变化趋势近似地用微分方程来描述。
其中,a和b是待识别参数,a称为发展参数,b称为内生控制灰数。参数a和b可以通过最小二乘法式(4)计算得到。
步骤3:对一次累加数列利用最小二乘法做二次多项式拟合。
二次项拟合gm(1,1)模型对一次累计数列式(2)进行最小二乘法拟合。在matlab中利用ployfit函数对一次累加序列进行多项式拟合,则可以得到序列(2)的多项式函数的导数值如式(5)所示:
s(x)=a0+a1x+a2x2+…+anxn(5)
然后对式(5)进行求导并求出导数值式(6):
步骤4:确定yn和矩阵b。
将x值带入式(6)求出相应的一次导数值s′(x),令
而矩阵b为:
步骤5:得到二次项拟合gm(1,1)预测模型
二次项拟合gm(1,1)预测模型为:
进而可以求得原始数据的预测值
步骤6:进行模型的自身检验和多模型对比检验。
对模型进行精度检验,首先进行残差和相对误差检验,残差检验计算公式为:
相对误差为:
另外还进行后验差检验,后验差检验主要包括两个指标,差检验的方差比c和小误差概率p,其中,原始数据方差为:
残差数据方差为:
差检验的方差比为:
c=s2/s1(14)
小误差概率p为
对于后验差检验中的指标,比值c越小越好,小误差概率p越大越好,按c和p两个指标综合来确定预测模型的精度。通常是将模型的精度分为四个等级,见表1。
表1模型预测精度等级
多模型对比检验是指多个预测模型进行对比检验。
具体实施例如下:
为了验证所提出的社会总抚养比预测模型的有效性,将其基于2010-2015年江苏省社会总抚养比数据进行模型的求解,然后进行各项模型的检验,最后将符合检验条件的预测模型用于预测江苏省2016-2025年的社会总抚养比情况。
一、首先以2010至2015年江苏省的社会总抚养比为原始数据进行模型的求解。
2010-2015年江苏省社会总抚养比的数据如表1所示。
表22010-2015年江苏省社会总抚养比
由式(2)得到一次累加序列为:
x(1)(k)={31.40,64.12,97.32,131.94,168.68,204.28}
原始数据与一次累加数据的对比情况如图1所示:
对一次累加的数据序列进行最小二乘法拟合,即利用matlab中的polyfit函数对一次累加的数据序列进行二次多项式拟合,如图2所示。
由matlab编程的结果可以得到二次多项式s(2)(x),
s(2)(x)=0.5100x2+31.0786x-0.2200
对二次多项式求导得
将相应的x值带入导数得s′(x),
s′(x)={32.10,33.12,34.14,35.16,36.18,37.20}
所以二次多项式的yn、b分别为
则可以求出改进后的a和b,
因此可以得到预测模型为:
则根据预测模型可以得到
则原始数据的还原值
二、其次对二次项拟合gm(1,1)模型进行精度检验。精度检验包括残差、相对误差、后验差比值、小误差概率检验,以及多个模型的对比检验。
1)首先根据式(10)~(11)进行残差和相对误差检验。
残差检验结果的检查值和相对误差如表3所示。
表3二次项拟合后的gm(1,1)对社会总抚养比的估算结果
2)另外还根据式(12)~(15)进行后验差检验
由表3的估算结果计算可知,后验差比值c=0.37,小误差概率p=1,根据表3模型预测精度等级表可知,二次项拟合的模型预测精度是较高的。同时图3可知实际的社会总抚养比与预测的社会总抚养比误差较小,说明模型的拟合效果较好。
3)多模型对比检验
为了验证二次项拟合gm(1,1)在社会总抚养比预测中的有效性,将其与基础gm(1,1)及三次项拟合gm(1,1)模型作对比分析。首先,从三个模型对2010-2015年的江苏省社会总抚养比的估算的角度出发,比较三个模型的预测精度。三个模型的比较结果如图4所示。
由图4可以看出,三次项拟合模型对2010-2015年江苏省的社会总抚养比的估算值与实际值是相差很多,误差相对较大。而原始的gm(1,1)模型和二次项拟合后的模型的估算值是比较贴近实际值的,说明这两个模型的拟合效果相对于三次项拟合模型是比较好的。
接下来,从模型预测的相对误差角度进行对比。将三个模型关于2010-2015年的预测相对误差进行比较分析。如表4所示。
表4三种模型2010-2015年社会总抚养比的相对误差
根据表格4的数据,做出各年份三个模型相对误差的折线图,如图5所示。
由图5可知,原始模型与二次项拟合模型的预测值的相对误差在总体上是逐年减少的,而三次项拟合模型的预测值相对误差则是呈现出逐年递增的趋势。因此,原始模型以及二次项拟合模型的预测效果也是相对较好。
在此基础上,再从三个模型的预测精度的角度出发进行比较分析。
表5三种模型的预测精度比较
从表5可以看出,基础gm(1,1)模型的小概率误差为0.83,从模型预测精度等级表表3可以看出是为等级2,即模型是合格的。而二次项拟合gm(1,1)模型的小概率误差为1,预测精度等级是1。三次项拟合gm(1,1)的后验差比值c=2.96,小误差概率p=0.17,由表2模型预测精度等级可知三次项拟合模型的预测精度是4级,即模型是不合格的。
三、根据二次项拟合后的gm(1,1)模型来预测江苏省2016-2025年的社会总抚养比。二次项拟合改进后的gm(1,1)模型的预测函数为:
则根据预测模型可以得到一次累加数据的预测值
则原始数据的还原值
上面的计算结果就是二次项拟合模型对于江苏省2016-2025年的社会总抚养比的预测值,预测结果如表6所示。
从表6的预测结果可以看出,2016-2025年江苏省的社会总抚养比在总体上是呈现增长趋势的,且这10年的平均社会总抚养比将达到44.59%。图6给出了预测值的散点拟合曲线,从图6可以看出,江苏省的社会总抚养比在2016-2025这一时间段内会逐年增长的,且每年将以1.3092%的增长率增长下去。
表6基于二次项拟合gm(1,1)的2016-2025年江苏省社会总抚养比的预测值
从可靠性角度来分析,二次项拟合后的gm(1,1)模型的预测值是可靠的。由图6可以看出2016至2025年的预测数据是贴近现实的。拟合的可决系数r2=0.9986,几乎接近于1,说明拟合优度好,即说明模型的预测精度较高。
根据互联网的资料显示,预计至2025年,江苏省的社会总抚养比将达到50%的临界点。因此,所提出预算结果是相对比较可靠的。由上面的表6和图6可知,2016年的江苏省社会总抚养比为38.92,到2025年江苏省的社会总抚养比为50.72,且呈现出逐年增长的趋势。由此可见江苏省需要抚养的人口是会越来越多,这也将会给江苏省的经济发展、老年社会体系保障、人口发展战略等许多方面带来一定程度的影响。
通过具体实施例及其结果可知,基于二次项拟合gm(1,1)的社会总抚养比预测模型能够准确有效的模拟和预测社会总抚养比的变化规律特性,为政府采取适当的人口政策以适应社会和经济发展的需要提供科学理论支撑。较早认识抚养比变化规律并及时准确采取措施应对抚养比增长和人口红利降低给社会经济发展带来的负担和阻力,对避免经济硬着陆和减少社会动荡不安因素具有重要的社会意义和经济价值。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。