本发明涉及时间序列数据预测,特别是指一种基于条件扩散模型的时间序列数据预测方法和系统。
背景技术:
1、时间序列数据(比如页岩油产量数据、每天的电网负荷数据、天气温度相关数据等)的预测,例如页岩油产量数据的预测,具有较长的时间依赖性,过去的产量数据对未来的产量变化有着重要影响,而传统的预测方法难以有效捕捉到这种长期依赖性,而且传统迭代预测序列模型存在误差积累问题。此外,很多时间序列数据,例如页岩油产量数据,存在非线性关系的复杂因素影响问题和样本数量少的问题,因此亟需一种有效的时间序列数据预测方法。
技术实现思路
1、本发明提供了一种基于条件扩散模型的时间序列数据预测方法和系统,用以解决现有技术存在的问题,所述技术方案如下:
2、一方面,提供了一种基于条件扩散模型的时间序列数据预测方法,包括:
3、s1、收集并预处理历史数据,所述历史数据包括随时间变化的动态时序数据和对应的不随时间变化的静态数据;
4、s2、将预处理后的历史数据划分为训练集与验证集,并将所述训练集的动态时序数据划分多组时间步;
5、s3、搭建特征处理模型,包括特征编码器与特征解码器,使用所述动态时序数据进行自编码、解码训练,将所述训练集内时间步的动态时序数据,经过训练完成的特征编码器进行特征升维,得到高维动态时序数据;
6、s4、搭建以条件输入transformer为主干网络的条件扩散模型,将训练集内天的高维动态时序数据作为条件扩散模型的加噪数据,以及天的高维动态时序数据与对应的静态数据融合后作为条件特征,输入条件扩散模型进行模型训练;
7、s5、将待预测的第一动态时序数据升维后的高维动态时序数据与对应的第一静态数据融合后作为条件特征,输入训练完成的条件扩散模型,执行去噪操作,得到预测的高维动态时序特征,将所述预测的高维动态时序特征输入s3中训练完成的特征解码器,获得最终预测的第二动态时序数据。
8、另一方面,提供了一种基于条件扩散模型的时间序列数据预测系统,所述系统包括:
9、收集预处理模块,用于收集并预处理历史数据,所述历史数据包括随时间变化的动态时序数据和对应的不随时间变化的静态数据;
10、划分模块,用于将预处理后的历史数据划分为训练集与验证集,并将所述训练集的动态时序数据划分多组时间步;
11、第一搭建模块,用于搭建特征处理模型,包括特征编码器与特征解码器,使用所述动态时序数据进行自编码、解码训练,将所述训练集内时间步的动态时序数据,经过训练完成的特征编码器进行特征升维,得到高维动态时序数据;
12、第二搭建模块,用于搭建以条件输入transformer为主干网络的条件扩散模型,将训练集内天的高维动态时序数据作为条件扩散模型的加噪数据,以及天的高维动态时序数据与对应的静态数据融合后作为条件特征,输入条件扩散模型进行模型训练;
13、预测模块,用于将待预测的第一动态时序数据升维后的高维动态时序数据与对应的第一静态数据融合后作为条件特征,输入训练完成的条件扩散模型,执行去噪操作,得到预测的高维动态时序特征,将所述预测的高维动态时序特征输入s3中训练完成的特征解码器,获得最终预测的第二动态时序数据。
14、另一方面,提供了一种电子设备,所述电子设备包括处理器和存储器,所述存储器中存储有指令,所述指令由所述处理器加载并执行以实现上述基于条件扩散模型的时间序列数据预测方法。
15、另一方面,提供了一种计算机可读存储介质,所述存储介质中存储有指令,所述指令由处理器加载并执行以实现上述基于条件扩散模型的时间序列数据预测方法。
16、本发明提供的技术方案带来的有益效果至少包括:
17、1)本发明提出了一种条件输入transformer为主干网络的条件扩散模型,能够支持长时间维度的建模,构建训练一个识别精度高、泛化性好的产量预测方法。
18、2)传统的扩散生成式模型只适用于图像任务的构建和处理,通过本发明的模型可以实现对时间序列数据的学习和预测,拥有更强的序列信息提取能力,提高了计算效率。
19、3)本发明的条件扩散模型生成过程中存在随机性和不确定性,从而在预测过程中能够生成多样性的特征,模拟真实数据中的不确定性和噪声,增加模型的鲁棒性。
20、4)本发明的模型相比传统时序预测模型,在模型内部对所有时间下的特征计算关联性,同时输出所有时间的预测值,不需要依靠预测值来进行下一时间的预测,避免了累计误差的问题。
1.一种基于条件扩散模型的时间序列数据预测方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述特征编码器通过全连接上采样层与非线性层relu进行上采样操作,实现数据重构和特征升维;所述特征解码器通过全连接下采样层与非线性层relu进行下采样操作,将升维的特征重新拟合为动态时序数据;
3.根据权利要求1所述的方法,其特征在于,所述条件输入transformer,通过多头自注意力层提取并融合条件特征与带有高斯噪声的数据的特征信息,并通过条件扩散模型的训练过程学习由特征信息到噪声分布的映射关系,输出预测的高斯噪声;
4.根据权利要求3所述的方法,其特征在于,所述s4的模型训练,分为前向加噪过程和噪声预测学习过程;
5.根据权利要求4所述的方法,其特征在于,所述s5,具体包括:
6.一种基于条件扩散模型的时间序列数据预测系统,其特征在于,所述系统包括:
7.根据权利要求6所述的系统,其特征在于,所述特征编码器通过全连接上采样层与非线性层relu进行上采样操作,实现数据重构和特征升维;所述特征解码器通过全连接下采样层与非线性层relu进行下采样操作,将升维的特征重新拟合为动态时序数据;
8.根据权利要求6所述的系统,其特征在于,所述条件输入transformer,通过多头自注意力层提取并融合条件特征与带有高斯噪声的数据的特征信息,并通过条件扩散模型的训练过程学习由特征信息到噪声分布的映射关系,输出预测的高斯噪声;
9.根据权利要求8所述的系统,其特征在于,所述第二搭建模块,具体用于:进行前向加噪过程和噪声预测学习过程;
10.根据权利要求9所述的系统,其特征在于,所述预测模块,具体用于: