本发明涉及铜价的预测领域,尤其涉及一种基于lstm网络和情感倾向分析对铜价进行预测的方法。
背景技术:
1、我国是世界上最大的铜生产国和消费国。在生产方面,铜冶炼作为典型流程型生产过程,连续性生产方式下断料恢复成本巨大,并且铜矿品质直接影响生产稳定性和产品质量,对铜精矿供应稳定性及综合品质要求较高。在运营方面,铜精矿采购成本通常占生产总成本70%以上,运营成本高、资金占用大,从企业经济效益的角度出发亟需降低采购成本。据统计每降低1%的采购成本降为企业增加5%到10%的利润,1%的价值十分巨大。铜精矿采购作为铜冶炼企业的“第一利润源泉”,对于稳定高效生产及利润提升至关重要。
2、铜价是铜冶炼企业需要关注的主要问题。若企业能提前预知某一时刻的铜价,做好采购规划,在最优惠的时间进行库存补充,将大大降低预料采购成本。通过对铜价预测方法的研究,对企业生产调度有着很大的价值。尤其在当前高质量发展的要求下,需进一步增强供应链韧性、保障供应链安全、提升重要资源保障能力,铜采购的地位愈加突出。因此,需对铜价进行预测,制定高质量的铜采购决策,在保证生产稳定高效的前提下提升原料采购的经济性。
3、在铜价预测过程中存在很多不确定因素导致预测困难。铜金属价格非线性、非平稳特性显著,在经济全球化下受国际经济形势、货币政策等外部因素影响,其波动愈加剧烈,难以根据铜金属价格对市场变化做出准确分析。
4、目前在价格预测中应用较为广泛的方法包括:时间序列模型、人工神经网络预测法,但在铜价预测过程中存在很多不确定因素导致预测困难。铜金属价格非线性、非平稳特性显著,在经济全球化下受国际经济形势、货币政策等外部因素影响,其波动愈加剧烈,难以根据铜金属价格对市场变化做出准确分析。单方面从铜价的波动无法准确地预测出价格,需要尽可能考虑多个方面的影响因素,找到各因素对铜价潜在的影响程度。
5、因此,本领域的技术人员致力于开发一种新的铜价预测方法,解决现有技术中存在的因为很多不确定因素导致的预测困难。
技术实现思路
1、有鉴于现有技术的上述缺陷,本发明所要解决的技术问题是如何克服现有技术中存在的因为很多不确定因素导致的铜价预测困难,提高铜价预测的准确性。
2、为实现上述目的,本发明提供了一种基于lstm网络和情感倾向分析对铜价进行预测的方法,包括以下步骤:
3、步骤1、获取铜价的历史数据和与铜相关的文本数据;
4、步骤2、对所述历史数据进行异常值处理和数据归一化,并划分为第一训练集和第一测试集;
5、步骤3、搭建文本情感分析通道,根据所述文本数据确定情感倾向数值;
6、步骤4、根据所述第一训练集和所述情感倾向数值,构建lstm神经网络模型;
7、步骤5、根据所述lstm神经网络模型确定待预测时间段内铜的预测价格。
8、进一步地,在所述步骤2中进行所述异常值处理之前,确定所述历史数据中是否缺失数据,并通过线性插值向所述历史数据中插入缺失值;若所述历史数据中存在异常值,则去除所述异常值。
9、进一步地,所述数据归一化具体为:
10、
11、其中,d是归一化后的数据,di为归一化前的当前数据,dmin为所有数据中的最小值,dmax为所有数据中的最大值。
12、进一步地,所述步骤3包括以下子步骤:
13、步骤3.1、为bert模型建立数据集;
14、步骤3.2、对所述数据集进行数据处理,将所述数据集处理为方便模型训练所使用的数据结构;
15、步骤3.3、将所述数据集拆分为第二训练集和第二测试集;
16、步骤3.4、训练所述bert模型,加载大语料库上预训练的模型参数,并进行微调,构建所述文本情感分析通道;
17、步骤3.5、将所述文本数据输入所述bert模型进行情绪分类,得到所述情感倾向数值。
18、进一步地,所述步骤3.3中的所述第二测试集是所述数据集中除所述第二训练集之外的数据。
19、进一步地,所述步骤3.4中的所述大语料库上预训练的模型参数是指在语料库bookcorpus和英文维基百科上进行预训练得到的模型参数,包括但不限于向量参数、全连接层参数。
20、进一步地,所述步骤3.5中的所述情感倾向数值为对应0到1之间的情感倾向得分。
21、进一步地,所述步骤2的所述第一测试集是所述历史数据中除所述第一训练集之外的数据。
22、进一步地,所述步骤1中的所述文本数据是通过网络爬虫爬取的铜价相关的新闻文本。
23、进一步地,所述方法还包含一种价格预测计算机程序,包括:
24、获取模块,所述获取模块用于获取铜价的所述历史数据以及铜相关的所述文本数据;
25、处理模块,所述处理模块用于将所述获取模块获得的所述历史数据划分为所述第一训练集和所述第一测试集;
26、预测模块,所述预测模块创建所述lstm神经网络模型,并利用所述lstm神经网络模型确定待预测时间段内铜的预测价格。
27、本发明提供的一种基于lstm网络和情感倾向分析对铜价进行预测的方法至少具有以下技术效果:
28、本发明所提供的技术方案是在铜价预测过程中的一种情感倾向分析辅助预测的价格预测方法,解决了铜价预测过程中铜价非线性、非平稳特性显著的问题,可以提高价格预测的准确性。在实际生产应用时,只需读取近期价格历史数据以及铜价分析文本,即可在短时间内给出价格预测,方便快捷,自动化程度高,极大地提高了效率,预测准确度也得到提升。
29、以下将结合附图对本发明的构思、具体结构及产生的技术效果作进一步说明,以充分地了解本发明的目的、特征和效果。
1.一种基于lstm网络和情感倾向分析对铜价进行预测的方法,其特征在于,所述方法包括以下步骤:
2.如权利要求1所述的基于lstm网络和情感倾向分析对铜价进行预测的方法,其特征在于,在所述步骤2中进行所述异常值处理之前,确定所述历史数据中是否缺失数据,并通过线性插值向所述历史数据中插入缺失值;若所述历史数据中存在异常值,则去除所述异常值。
3.如权利要求2所述的基于lstm网络和情感倾向分析对铜价进行预测的方法,其特征在于,所述数据归一化具体为:
4.如权利要求3所述的基于lstm网络和情感倾向分析对铜价进行预测的方法,其特征在于,所述步骤3包括以下子步骤:
5.如权利要求4所述的基于lstm网络和情感倾向分析对铜价进行预测的方法,其特征在于,所述步骤3.3中的所述第二测试集是所述数据集中除所述第二训练集之外的数据。
6.如权利要求4所述的基于lstm网络和情感倾向分析对铜价进行预测的方法,其特征在于,所述步骤3.4中的所述大语料库上预训练的模型参数是指在语料库bookcorpus和英文维基百科上进行预训练得到的模型参数,包括但不限于向量参数、全连接层参数。
7.如权利要求4所述的基于lstm网络和情感倾向分析对铜价进行预测的方法,其特征在于,所述步骤3.5中的所述情感倾向数值为对应0到1之间的情感倾向得分。
8.如权利要求1所述的基于lstm网络和情感倾向分析对铜价进行预测的方法,其特征在于,所述步骤2的所述第一测试集是所述历史数据中除所述第一训练集之外的数据。
9.如权利要求1所述的基于lstm网络和情感倾向分析对铜价进行预测的方法,其特征在于,所述步骤1中的所述文本数据是通过网络爬虫爬取的铜价相关的新闻文本。
10.如权利要求1所述的基于lstm网络和情感倾向分析对铜价进行预测的方法,其特征在于,所述方法还包含一种价格预测计算机程序,包括: