工业增加值增速预测方法、系统、电子设备及存储介质与流程

文档序号:35579514发布日期:2023-09-27 00:21阅读:73来源:国知局
工业增加值增速预测方法、系统、电子设备及存储介质与流程

本发明涉及工业增加值增速预测,尤其涉及一种工业增加值增速预测方法、系统、电子设备和存储介质。


背景技术:

1、当前关于工业增加值预测的研究相对较少,且主要基于所选择的若干传统统计指标进行,如利用社会消费品零食总额、广义货币数据对工业增加值进行预测,基于构建的民营企业信用利差指数对工业增加值进行预测。在宏观经济传导机制愈发复杂、工业增加值影响因素更加多元的情形下,恰当的预测模型应当包含大量的解释变量以充分利用有价值的信息,仅利用少数几个变量较难获得精准的预测。此外,传统统计数据的滞后性致使预测时难以利用经济活动的当前信息,而电力大数据与经济活动密切相关且实时可得,可提供经济活动的当前信息弥补传统统计数据的不足。因此,综合利用电力数据和传统统计数据可能得到更加准确的工业增加值预测结果。电力行业是国民经济的基础性能源产业,对其他产业部门的发展起着至关重要的支撑作用。电力消耗是生产环节中重要投入之一,且本身不存在库存现象,由此也可以看出电力消耗和工业产值之间必然存在一定的相关性。

2、随着短期电力负荷预测技术的发展,对短期电力负荷影响因素考虑的愈发全面,并且影响因素与负荷之间的关系并非简单的线性关系,使得传统和经典的预测方法表现很大的劣势,并且大样本数据的处理对传统和经典的预测方法也是巨大的挑战,而一些机器学习算法凭借其强大的学习能力和自适应能力表现出卓越性能。应用机器学习算法进行负荷预测的实质先假设一个模型,然后通过学习求解使损失函数最小的模型参数,常用的机器学习算法有人工神经网络法、支持向量机法、随机森林、梯度提升决策树(gbdt)、岭回归等,这些方法在电力负荷预测的精度提升上有着显著的表现。但是,上述均为单一负荷预测方法,数据分布特点会对影响算法结果,这是单一算法本身缺陷造成的,因此对于同一组测试数据也会得到差异较大的计算结果,预测精度不高。


技术实现思路

1、本发明实施例解决其技术问题所采用的技术方案是:

2、一种工业增加值增速预测方法,包括:

3、步骤s1,获取样本数据,所述样本数据包括年度参数数据和年度工业增加值,所述年度参数数据包括年度经济数据和年度电力数据;

4、步骤s2,预处理各个所述样本数据,输入至样本集;

5、步骤s3,根据所述样本集,基于stacking算法,结合线性回归算法、决策树算法、支持向量机、k近邻算法、随机森林算法、adaboost算法、梯度回归算法和时间序列分析算法进行工业增加值增速预测建模,得出预测模型;

6、步骤s4,利用所述预测模型进行工业增加值增速预测;

7、步骤s5,使用波动性和准确度评估所述预测模型。

8、较优地,所述样本数据记为(xi,yi),其中,xi为所述年度参数数据,yi为所述年度工业增加值实际值,i为年份,特征向量xi=[xia,xib,...,xig],xia,xib,...,xig分别为年度电力数据a、年度居民收入及消费数据b、年度社会经济数据c、年度工业开发区基本信息d、年度工业产值e、年度工业产品价格指数f、年度工业原材料均价g。

9、较优地,所述预测模型包括初级学习模型和次级学习模型,所述步骤s3包括:

10、步骤s31,将所述样本集划分为训练集和测试集,其中,所述测试集为本年度的样本数据,所述训练集为其他年度的样本数据;

11、步骤s32,建立所述初级学习模型sx,并将各个所初级学习模型的输出作为所述次级学习模型的输入,所述初级学习模型包括线性回归算法模型s1、决策树算法模型s2、支持向量机模型s3、k近邻算法模型s4、随机森林算法模型s5、adaboost算法模型s6、梯度回归算法模型s7和时间序列分析算法模型s8,每个所述初级学习模型通过所述训练集进行训练、并且使用所述测试集进行测试;

12、步骤s33,建立所述次级学习模型,所述次级学习模型用于通过r2方法和遗传算法为所述初级学习模型的输出结果分配权重配置、以及设定所述次级学习模型的输出结果,所述次级学习模型的输出结果即为所述预测模型的输出结果。

13、较优地,所述步骤s33包括:

14、步骤s331,以rx最小为目标,用遗传算法求解出合适的个体,遗传算法的目标函数f(x)为:

15、f(x)=min(r1+r2…+r8)

16、

17、

18、其中,rx是所述初级学习模型sx输出结果的修正系数,x∈[1,8],n是所述训练集中元素xi数目,r2是线性回归决定系数,p为变量的数目,为通过所述初级学习模型sx计算所述训练集中所述特征向量xi所得的年度工业增加值预测值,为基于所述训练集、经所述初级学习模型sx计算所得所有所述的均值;

19、步骤s332,根据遗传算法得出的f(x)中的rx计算出各个所述初级学习模型sx的最大权重值qx:

20、

21、步骤s333,所述次级学习模型的输出结果f(y)定义为:

22、

23、步骤s331的计算过程包括:

24、步骤s331a,种群初始化,读入原始数据,将(xi,yi)和各所述初级学习模型sx输出的工业增加值预测值化为种群p,遗传种群p中设置多条未进化染色体ji,ji由所述初级学习模型sx输出的工业增加值预测值和一组实际值(xi,yi)组成,设置种群规模n、最大遗传代数nmax和变异率a;

25、步骤s331b,计算基因适应度,以所使用算法的rx之和最小为目标函数,适应度函数z(x)为目标函数的倒数:

26、

27、其中:

28、

29、步骤s331c,遗传选择,对各所述未进化染色体ji进行计算,将结果带入所述适应度函数z(x),得到对应的适应度值;循环n次,得到n个所述适应度值,将得到的n个所述适应度值从大到小排序,用最前面的1/3代替最后面的1/3,重新形成n个子代染色体;由此,遍历遗传种群p中的任意两条染色体中的任意两个基因进行基因交叉获得进化后的子代染色体,由子代染色体构成子代遗传种群p;重复遗传选择过程,直至子代遗传种群p'中的子代染色体数量与所述子代遗传种群p中的未进化染色体的数量相同;

30、步骤s331d,停止进化,当所述子代遗传种群p'中出现子代染色体适应度大于等于重组的子代染色体或高适应度染色体、或者当前进化次数达到所述最大迭代次数nmax时,停止优化,此时,f(x)达到最小,根据最小的f(x)计算出各个所述初级学习模型sx的所述最大权重值qx。

31、本发明还提供一种基于stacking集成算法的工业增加值增速预测系统,包括:

32、获取模块,用于获取样本数据,所述样本数据包括年度参数数据和年度工业增加值,所述年度参数数据包括年度经济数据和年度电力数据;

33、预处理模块,用于预处理各个所述样本数据,输入至样本集;

34、模型搭建模块,用于根据所述样本集,基于stacking算法,结合线性回归算法、决策树算法、支持向量机、k近邻算法、随机森林算法、adaboost算法、梯度回归算法和时间序列分析算法进行工业增加值增速预测建模,得出预测模型;

35、预测模块,用于利用所述预测模型进行工业增加值增速预测;

36、评估模块,用于使用波动性和准确度评估所述预测模型。

37、较优地,所述样本数据记为(xi,yi),其中,xi为所述年度参数数据,yi为所述年度工业增加值实际值,i为年份,特征向量xi=[xia,xib,...,xig],xia,xib,...,xig分别为年度电力数据a、年度居民收入及消费数据b、年度社会经济数据c、年度工业开发区基本信息d、年度工业产值e、年度工业产品价格指数f、年度工业原材料均价g。

38、较优地,所述预测模型包括初级学习模型和次级学习模型,所述模型搭建模块包括:

39、样本集处理单元,将所述样本集划分为训练集和测试集,其中,所述测试集为本年度的样本数据,所述训练集为其他年度的样本数据;

40、建立单元,建立所述初级学习模型sx,并将各个所初级学习模型的输出作为所述次级学习模型的输入,所述初级学习模型包括线性回归算法模型s1、决策树算法模型s2、支持向量机模型s3、k近邻算法模型s4、随机森林算法模型s5、adaboost算法模型s6、梯度回归算法模型s7和时间序列分析算法模型s8,每个所述初级学习模型通过所述训练集进行训练、并且使用所述测试集进行测试;

41、所述建立单元,建立所述次级学习模型,所述次级学习模型用于通过r2方法和遗传算法为所述初级学习模型的输出结果分配权重配置、以及设定所述次级学习模型的输出结果,所述次级学习模型的输出结果即为所述预测模型的输出结果。

42、由上述技术方案可知,本发明实施例提供的基于stacking集成算法的工业增加值增速预测方法,首先获取样本数据,其中,样本数据包括年度参数数据和年度工业增加值,年度参数数据包括年度经济数据和年度电力数据;预处理各个样本数据,输入至样本集;根据样本集,基于stacking算法,结合线性回归算法、决策树算法、支持向量机、k近邻算法、随机森林算法、adaboost算法、梯度回归算法和时间序列分析算法进行工业增加值增速预测建模,得出预测模型;利用预测模型进行工业增加值增速预测;使用波动性和准确度评估预测模型。通过组合预测方法,完成预测,降低单一算法的敏感度,提高负荷预测精度。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1