基于局部分段的时间序列预测方法与流程

文档序号：37632657发布日期：2024-04-18 17:46阅读：7来源：国知局

本技术涉及人工智能，特别涉及一种基于局部分段的时间序列预测方法。

背景技术：

1、时间序列是按照时间顺序排列的数据，反映一段时间内单个或多个变量的变化情况，其具有时间依赖性和相关性。时间序列预测可以揭示观测变量的变化规律和趋势，为精细化管理和智能决策提供数据支持。时间序列预测作为人工智能技术的重要应用，可以助力生产制造、经济金融、资源监测等行业的发展。

2、目前，较多采用的基于循环神经网络（rnn）的长短时记忆网络（lstm）等模型，已经在诸多实际应用中展现出多步预测的良好性能。然而，受限于模型结构，循环神经网络通常不适于并行训练且存在梯度消失问题，导致捕获序列长度受限；基于卷积神经网络（cnn）的时间卷积网络（tcn）解决了并行训练的问题，但由于依靠堆叠隐藏层来获得更大的感受野，导致对内存的需求巨大。因此，亟需一种时间序列预测方法解决上述问题。

技术实现思路

1、鉴于此，本技术提供一种基于局部分段的时间序列预测方法，可以将注意力计算的单个时间点对应的时间序列数据之间的相关性转换为序列段间的相似性，在更精准地把握历史数据变化的同时，还能保留时间段内的局部语义信息，减少了注意力计算的空间复杂度，从而使获得的预测结果更为精准。

2、具体而言，包括以下的技术方案：

3、本技术实施例提供了一种基于局部分段的时间序列预测方法，所述方法包括：

4、对原始时间序列数据进行数据划分，得到第一训练集、第一验证集和第一测试集；

5、对所述第一训练集、所述第一验证集和所述第一测试集进行预处理，得到预处理后的第二训练集、第二验证集和第二测试集；

6、构建原始预测模型，所述原始预测模型包括依次连接的局部分段模块、transformer注意力模块、分段拍平模块和全连接层；

7、将所述第二训练集输入至所述原始预测模型中进行训练，得到目标预测模型；

8、将待预测的时间序列数据输入到目标预测模型中，得到目标预测结果。

9、在一些实施例中，对所述第一训练集、所述第一验证集和所述第一测试集进行预处理，得到预处理后的第二训练集、第二验证集和第二测试集，包括：

10、提取所述第一训练集、所述第一验证集和所述第一测试集的特征图；

11、计算所述第一训练集、所述第一验证集和所述第一测试集中每个通道的数据均值和方差；

12、基于所述数据均值和方差对所述特征图进行归一化处理，得到第二训练集、第二验证集和第二测试集。

13、在一些实施例中，所述将所述第二训练集输入至所述原始预测模型中进行训练，得到目标预测模型，包括：

14、在局部分段模块中对所述第二训练集进行可重叠时间序列段的分割处理，得到分割数据；

15、对所述分割数据进行位置编码，得到包括位置信息的位置编码数据；

16、在transformer注意力模块中对所述位置编码数据进行自注意力计算处理，得到解码输出数据；

17、在分段拍平模块中对所述解码输出数据进行拍平处理，得到一维拍平数据；

18、将所述一维拍平数据输入到所述全连接层中，得到中间训练结果和中间预测模型；

19、根据所述中间训练结果、平均绝对误差 mae和纳什相关系数 nse，计算损失函数值；

20、响应于所述损失函数值满足条件，停止训练，得到所述目标预测模型。

21、在一些实施例中，所述transformer注意力模块包括编码器和解码器，transformer注意力模块具有transformer架构，编码器用于计算自注意力并将结果输入至所述解码器，所述解码器用于计算交叉注意力；

22、所述编码器包括第一多头自注意力层、第一残差连接层和第一归一化层，所述解码器包括第二多头自注意力层、多头交叉注意力层、第二残差连接层和第二归一化层。

23、在一些实施例中，所述在局部分段模块中对第二训练集进行可重叠时间序列段的分割处理，得到分割数据，包括：

24、将所述第二训练集中的时间序列数据进行重叠或不重叠的局部分段，得到分割数据；

25、根据如下公式计算分段数量 n：

26、；

27、其中， i表示的是分段处理后单个时间序列数据的特殊标识， i的取值为( 0, n)， p表示的分段长度， n为分段数量， l表示的是所述第二训练集中的时间序列数据的总长度， s为两个连续分段之间步幅的不重叠区域。

28、在一些实施例中，根据如下公式，对所述分割数据进行位置编码，得到包括位置信息的位置编码数据：

29、；

30、；

31、其中，表示的是所述位置编码数据中的偶数项，表示的是所述位置编码数据中的奇数项， pos表示的是所述位置编码数据在所述时间序列数据中的位置，表示的是的维度。

32、在一些实施例中，对于固定长度的间距 k，根据如下公式，得到与的相对位置关系：

33、；

34、。

35、在一些实施例中，所述解码输出数据根据如下公式得到：

36、；

37、；

38、；

39、；

40、；

41、其中，表示的是所述解码输出数据，表示的是归一化指数函数，表示的是所述位置编码数据的初始分量， q、 k、 v分别为所述位置编码数据的查询分量、键值分量和数值分量，、、分别表示的是所述查询分量对应的权值矩阵、所述键值分量对应的权值矩阵和所述数值分量对应的权值矩阵，表示的是所述键值分量的转置分量，表示的是所述位置编码数据的维度， linear表示的是线性函数，表示的是经过正标准化处理后的所述位置编码数据。

42、在一些实施例中，分别根据如下公式，计算所述平均绝对误差 mae和所述纳什相关系数 nse：

43、；

44、；

45、其中， m表示的是所述中间训练结果中预测周期的长度，表示的是所述中间训练结果中对时间序列数据在第r时刻的预测值，表示的是所述中间训练结果中对时间序列数据的观测值，表示的是所述中间训练结果中对时间序列数据的观测值的平均值， r表示的是预测时间。

46、本技术实施例提供的技术方案的有益效果至少包括：

47、本技术实施例提供了一种基于局部分段的时间序列预测方法，将第二训练集输入至所构建的包括依次连接的局部分段模块、transformer注意力模块、分段拍平模块和全连接层的原始预测模型中进行训练，得到目标预测模型，所构建的原始预测模型考虑到时间序列数据周期长、变化趋势不规则导致的模型训练速度和预测速度慢、效率低的问题，通过局部分段模块将时间序列数据分为若干长度相等、可重叠的序列-时间段，使transformer注意力模块对时间段对应的序列段而非单个的时间点对应的时间序列数据进行运算，从而增强对相似时序变化过程的学习能力，降低注意力计算的空间复杂度；将待预测的时间序列数据输入到目标预测模型中，得到目标预测结果，使得到的目标预测结果更加准确。该方法可以将注意力计算的单个时间点对应的时间序列数据之间的相关性转换为序列段间的相似性，在更精准地把握历史数据变化的同时，还能保留时间段内的局部语义信息，减少了注意力计算的空间复杂度，从而使获得的预测结果更为精准。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王涛,杨斌,赵影,贺业凤
技术所有人：山东捷瑞数字科技股份有限公司
我是此专利的发明人

上一篇：一种具有出料防堵塞功能的米罐的制作方法
上一篇：一种粘接式LED光源固定结构的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。