基于时间序列预测模型适用性量化的预测模型选择方法_3

文档序号：8923022阅读：来源：国知局

[0118] 步骤一中，根据每个预测模型的预测步长P、真实值xk和预测模型输出结果毛，获得各预测模型的相对最大峰值误差PEP的过程为：
[0119] 根据公式：
[0121] 获得相对最大峰值误差PEP。
[0122] 本实施方式中，ME指标评估所有预测点预测偏差的平均水平，由于含有正负符号，因此得到的是经过正负抵消后的结果，能够描述预测模型输出结果相对于真实数值偏大或偏小的平均程度。恰恰由于计算过程中存在正负符号相互抵消的情况，因此，即使ME取值较小也并不一定意味着模型的预测性能良好，需要借助其他类别的指标综合判断模型性能。
[0123] 无符号绝对误差指标，主要刻画预测结果与真实数据之间的整体匹配水平即预测结果与真是数值之间总体偏差的平均水平，预测误差协方差较大的点在指标计算中占有更大的权重，这就导致其取值主要由预测偏差最大的点所决定，而对于取值较小的误差点不再敏感。
【具体实施方式】 [0124] 五：本实施方式是对一所述的基于时间序列预测模型适用性量化的预测模型选择方法作进一步说明，本实施方式中，无量纲准则误差包括最小信息准则AIC、贝叶斯信息准则BIC、确定系数、有效系数CE、匹配指数IoAd和持久系数PI，
[0125] 最小信息准则AIC和贝叶斯信息准则BIC，均用于在含有N个数据点的时间序列集中，获得含有最少自由参数且能够对数据进行解释的最小模型，即最低阶次模型，N为正整数，
[0126] 某个预测模型相对其他预测模型的最小信息准则AIC和贝叶斯信息准则BIC的取值越小，表示模型越优，
[0127] 步骤一中，根据每个预测模型的预测步长P、真实值xk和预测模型输出结果毛，获得各预测模型的最小信息准则AIC的过程为：
[0128] 根据公式：
[0129] AIC= 2 ?p+N?ln(RMSE)，（公式 15)
[0130] 获得最小信息准则AIC;
[0131] 步骤一中，根据每个预测模型的预测步长P、真实值xk和预测模型输出结果毛，获得各预测模型的贝叶斯信息准则BIC的过程为：
[0132] 根据公式：
[0133] BIC=p?ln(N)+N?ln(RMSE)，（公式l6)
[0134] 获得贝叶斯信息准则BIC;
[0135] 最小信息准则AIC和贝叶斯信息准则BIC的取值越小代表模型越优；
[0136] 确定系数RSqr，用于预测预测模型的数据统计特性的比例大小，取值区间为0到 1，取值越大于〇越优，最优模型取值为1，
[0137] 步骤一中，根据每个预测模型的预测步长P、真实值xk和预测模型输出结果毛，获得各预测模型的确定系数的过程为：
[0138] 根据公式：
[0140] 获得确定系数RSqr;
[0141] 有效系数CE，用于预测预测模型整体的预测效果，通常CE取值在0到1之间，偶尔会出现负值情况，有效系数CE的取值为1，表示预测模型最优，
[0142] 有效系数CE的取值为0,表明预测模型的性能不优于均值模型，均值模型为以数据均值作为后续每个点的预测结果，
[0143] 有效系数CE的取值为负值，表明预测模型的性能劣于均值模型；
[0144] 步骤一中，根据每个预测模型的预测步长P、真实值xk和预测模型输出结果毛，获得各预测模型的有效系数CE的过程为：
[0145] 根据公式：
[0147] 获得有效系数CE;
[0148] 匹配指数IoAd，用来量化预测模型输出结果与输入时间序列之间的匹配程度， IoAd取值范围在0到1之间，越接近1则表明模型性能越好，
[0149] 步骤一中，根据每个预测模型的预测步长P、真实值xk和预测模型输出结果毛，获得各预测模型的匹配指数IoAd的过程为：
[0150] 根据公式：
[0152] 获得匹配指数IoAd;
[0153] 持久系数PI，用于预测预测模型对于整体的预测效果，取值范围是0到1，或者出现负值的情况，
[0154] 持久系数PI的取值为1，表示预测模型最优，
[0155] 持久系数PI的取值为0,表明预测模型的性能不优于均值模型，均值模型为以数据均值作为后续每个点的预测结果，
[0156] 持久系数PI的取值为负值，表明预测模型的性能劣于均值模型；
[0157] 步骤一中，根据每个预测模型的预测步长P、真实值xk和预测模型输出结果毛，获得各预测模型的持久系数PI的过程为：
[0158] 根据公式：
[0160] 获得持久系数PI。
[0161] 本实施方式中，确定系数、CE、I〇Ad和PI主要刻画预测模型对于数据的解释能力。确定系数即为皮尔森积矩相关系数的平方值，为真实数据以及预测数据各自的离散程度的比值。确定系数刻画了预测模型所能够解释的数据统计特性的比例大小，取值区间为〇到 1，对于最优模型取值为1。确定系数建立在线性系统假设之上，并由数据集的均值和方差对指标进行归一化处理。确定系数对于预测值和真实值之间固定的加性误差及比例误差并不敏感，因此可能造成性能并不是最优的模型也获得较高的分数。此外，确定系数对于离群点会异常敏感，可能使得即便整体预测效果很好、部分离群点造成指标计算结果较小，模型评价为劣。
[0162] 与CE相同，IoAd对于预测值和真实值之间均值和方差的差异十分敏感，对于峰值误差更为敏感而往往会忽略较小的误差值。PI与CE十分相近，取值范围是0到1，同样可能出现负值的情况，PI不同取值的情况与CE对应相同，最优模型对应1，而PI为0时表明模型与均值模型性能相近，如果出现负值则表明模型极端不匹配。
【具体实施方式】 [0163] 六：本实施方式是对一所述的基于时间序列预测模型适用性量化的预测模型选择方法作进一步说明，本实施方式中，多次实验性能误差包括M次重复实验的平均误差水平特性Timeliness、离散特性Precision、参量重复特性 Repeatability和模型准确性Accuracy，
[0164] M次重复实验的平均误差水平特性Timeliness，用于预测M次重复预测实验预测模型的输出结果相对于输入时间序列偏大或偏小的平均程度，
[0165] 离散特性Precision，用于预测M次重复预测实验预测模型的输出结果离散度的平均水平，即对预测结果是否存在较大波动性的预测，
[0166] 重复特性Repeatability，用于预测预测模型输出结果是否可重复的，用于预测预测模型的鲁棒性，
[0167] M次重复实验的平均误差水平特性Timeliness为0,表示M次重复预测实验中平均误差水平为〇，
[0168] 离散特性Precision为0,表示预测误差离散程度小，
[0169] 重复特性Repeatability为0,表示重复性高，
[0170] 模型准确性Accuracy，用于综合预测M次重复实验中预测模型的预测性能，即包含了对预测模型多次重复实验下输出结果的平均偏大或偏小的程度的预测、每次实验预测误差序列离散度平均水平的预测和预测结果可重复性三个方面的综合预测，
[0171] 步骤一中，根据每个预测模型的预测步长P、真实值xk和预测模型输出结果毛，获得各预测模型的M次重复实验的平均误差的平均水平时间特性Timeliness的过程为：
[0172] 定义第i次实验的平均误差为：
[0174] 其中，尤是第i次实验第k个点的预测值，
[0175] 然后，定义第i次实验的标准差参量：
[0177] 结合（公式21)和（公式22)，根据公式：
[0179] 获得M次重复实验的平均误差水平特性Timeliness;
[0180] 步骤一中，根据每个预测模型的预测步长P、真实值xk和预测模型输出结果夫，获得各预测模型的精确特性Precision的过程为：
[0181] 根据公式：
[0183] 获得离散特性Precision;
[0184] 步骤一中，根据每个预测模型的预测步长P、真实值xk和预测模型输出结果毛，获得各预测模型的参量重复特性R印eatability的过程为：
[0185] 根据公式：
[0187] 获得参量重复特性Repeatability;
[0188] 其中，〇 (std)和〇 (E)分别为std和E的

完整全部详细技术资料下载

当前第3页1 2 3 4 5