一种基于GAF特征融合的用水量序列预测模型的方法与流程

文档序号:24422837发布日期:2021-03-26 22:25阅读:200来源:国知局
一种基于GAF特征融合的用水量序列预测模型的方法与流程
一种基于gaf特征融合的用水量序列预测模型的方法
技术领域
1.本发明属于信息处理技术领域,具体涉及一种基于gaf特征融合的用水量序列预测模型的方法。


背景技术:

2.传统的数据预测主要将统计学作为理论基础,对数据序列进行分析,其中有些方法较依赖数据特性,使用范围比较窄。回归分析法和滑动平均法在水量预测领域使用较为广泛。张雅君等利用多元线性回归分析进行了水量预测,预测了北京市2010年城市生活需水量,通过对其多种影响因素回归分析,建立了该预测模型。
3.yasar等选用了与城市需水量相关的10个因素,做多元非线性回归,经过多步预测,建立出适用于该城市的需水量预测模型。滑动平均法则是从box和jenkins于1976年提出自回归差分滑动平均模型(autoregressive integrated moving average,arima)后,在用水量预测领域得到了广泛运用。练庭宏等基于arima季节时间序列对城市需水状况建模,通过分析辨识模型阶次结构,对上海市中心城区需水量进行预报。mombeni等提出季节性sarima模型来预测城市月用水量,并较为准确的预测了一年的用水量,但是arima模型的预测精度需要建立在数据长度完善的基础上。
4.对比于传统预测方式,新技术一般有数据预处理、选取并建立模型、经多次训练和验证得到预测模型等几个步骤。比如人工神经网络(ann),灰色预测模型及一些机器预测模型如支撑向量机(svm)。近几年来,由于数据和计算能力的不断提升,深度学习也逐渐开始兴起,这也是目前研究的热点。深度学习可以学习一种深层的非线性网络结构,来实现复杂函数逼近,得到有效特征,可以用于分类、回归、预测和信息检索等各个领域。随着研究深入,基于深度学习的用水量预测也开始出现。


技术实现要素:

5.发明目的:在于克服上述背景技术的不足,提供一种基于gaf特征融合的用水量序列预测模型的方法。
6.技术方案:为实现本发明的目的,本发明所采用的技术方案是:
7.一种基于gaf特征融合的用水量序列预测模型的方法,包括下列步骤:
8.步骤s1:打开含有n个数据记录的大数据文件集文件,从中读取相应的数据记录;
9.步骤s2:将训练集a输入到lstm,输出结果;
10.步骤s3:将训练集a经过gaf生成的图输入到cnn中,输出结果;
11.步骤s4:将两者的输出结果进行concat特征融合;
12.步骤s5:最后经过多层mlp层输出,获得预测结果;
13.步骤s6:重复上述步骤进行多次训练,获得较为精确的预测模型;对测试集b进行预测。
14.进一步地,所述的步骤s1具体为:将n条数据划分为训练集a和测试集b,输入gaf所
需要的生成的图的大小size,如果size是小数,则范围为0<size<=1.0,如果是整数,则范围为1<size<=a,输入gaf所计算的方式method,取值为summation或者difference。
15.进一步地,所述的步骤s3具体为:
16.步骤s3

1:对gaf的输入训练集a先进行数据校验,满足输入标准;
17.步骤s3

2:对校验后的数据通过滑动窗口进行划分,对滑动窗口中的值求平均值,平移滑动窗口,步长为1,划分成相同大小的子序列;
18.步骤s3

3:对划分好的子序列进行归一化处理,获得新的子序列;
19.步骤s3

4:根据gaf的参数summation或者difference,来选择gaf对图的处理方式。
20.进一步地,所述步骤s3

2具体为:
21.步骤s3
‑2‑
1:判断所需要划分的窗口长度是否大于序列数组长度,如果大于,则报错;否则转步骤s3
‑2‑
2;
22.步骤s3
‑2‑
2:判断序列数组是否是一维,如果是,根据滑动窗口求取新的序列,新的序列中的每一个元素都是滑动窗口中的平均值;否则转步骤s3
‑2‑
3;
23.步骤s3
‑2‑
3:对于序列数组中的每一维的时间序列进行步骤s3
‑2‑
2的操作,获得新的序列。
24.进一步地,所述步骤s3

4具体为:以子序列的个数n为条件控制循环的循环变量,初始值为1,循环条件是循环变量值小于或等于n,从第一个子序列为1开始,重复下述步骤:
25.步骤s3
‑4‑
1:创建一个m*m大小的空二维矩阵g,m为子序列的长度;
26.步骤s3
‑4‑
2:对子序列中的每一个元素根据summation或difference进行余弦和或者余弦差计算,填入到矩阵g中对应位置,元素在矩阵中的位置根据元素在子序列中的位置决定。
27.进一步地,所述的步骤s3

4中,summation代表对序列中的每一个元素k和其他元素(包括元素k本身)进行余弦和操作,difference代表对序列中的每一个元素k和其他元素(包括元素k本身)进行余弦差操作。
28.有益效果:与现有技术相比,本发明的技术方案具有以下有益的技术效果:
29.(1)能够捕获时间序列的有效特征;
30.(2)通过不同的方式提取时间序列的不同特征并融合,丰富了时间序列的特征,能够更好地进行预测;
31.(3)所提供的方法简单易行;
32.(4)所提供的方法在深度学习等领域具有广阔的应用前景。
附图说明
33.图1是基于gaf特征融合的用水量预测模型方法的步骤流程图;
34.图2是基于gaf特征融合的用水量预测模型方法处理过程的示意图;
35.图3是基于gaf特征融合的用水量预测模型方法的预测结果展示,其中原始序列(图中实线线条)代表原始数据,预测序列(图中虚线线条)代表预测值。
具体实施方式
36.下面结合附图和实施例对本发明的技术方案作进一步的说明。
37.如图1

2所示,一种基于gaf特征融合的用水量序列预测模型的方法,包括下列步骤s1至s6:
38.步骤s1:打开含有n个数据记录的大数据文件集文件,以便从中读取相应的数据记录,将n条数据划分为训练集a和测试集b,输入gaf所需要的生成的图的大小size,如果size是小数,则范围为0<size<=1.0,如果是整数,则范围为1<size<=a,输入gaf所计算的方式method,取值为summation或者difference;
39.步骤s2:将训练集a输入到lstm,输出结果;
40.步骤s3:将训练集a经过gaf生成的图输入到cnn中,输出结果;
41.步骤s4:将两者的输出结果进行concat特征融合;
42.步骤s5:最后经过多层线性层输出,获得预测结果;
43.步骤s6:重复上述步骤进行多次训练,获得较为精确的预测模型;对测试集b进行预测。
44.步骤s3进一步包括:
45.步骤s3

1:对gaf的输入训练集a先进行数据校验,满足输入标准;
46.步骤s3

2:对校验后的数据通过滑动窗口进行划分,对滑动窗口中的值求平均值,平移滑动窗口,步长为1,划分成相同大小的子序列;
47.步骤s3

3:对划分好的子序列进行归一化处理,获得新的子序列;
48.步骤s3

4:根据gaf的参数summation或者difference,来选择gaf对图的处理方式,summation代表对序列中的每一个元素k和其他元素(包括元素k本身)进行余弦和操作,difference代表对序列中的每一个元素k和其他元素(包括元素k本身)进行余弦差操作。
49.步骤s3

2进一步包括:
50.步骤s3
‑2‑
1:判断所需要划分的窗口长度是否大于序列数组长度,如果大于,则报错;否则转步骤s3
‑2‑
2;
51.步骤s3
‑2‑
2:判断序列数组是否是一维,如果是,根据滑动窗口求取新的序列,新的序列中的每一个元素都是滑动窗口中的平均值;否则转步骤s3
‑2‑
3;
52.步骤s3
‑2‑
3:对于序列数组中的每一维的时间序列进行步骤s3
‑2‑
2的操作,获得新的序列。
53.步骤s3

4进一步包括:
54.以子序列的个数n为条件控制循环的循环变量,初始值为1,循环条件是循环变量值小于或等于n,从第一个子序列为1开始,重复下述步骤:
55.步骤s3
‑4‑
1:创建一个m*m大小的空二维矩阵g,m为子序列的长度。
56.步骤s3
‑4‑
2:对子序列中的每一个元素根据summation或difference进行余弦和或者余弦差计算,填入到矩阵g中对应位置,元素在矩阵中的位置根据元素在子序列中的位置决定。
57.如图3所示,gaf特征融合的用水量预测模型方法的预测结果展示,采用的数据是淮南某地区的用水量的时间序列,其中原始序列(图中实线线条)代表原始数据,预测序列(图中虚线线条)代表预测值。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1