基于时间序列预测模型适用性量化的预测模型选择方法_5

文档序号:8923022阅读:来源:国知局
身的平均增长速度,则预测结果的偏差过大; 归一化均方根误差NRMSE,是归一化后的RMSE指标,用来预测预测模型输出结果相对 于输入时间序列的平均偏差水平, 归一化均方根误差NRMSE的取值范围为O至正无穷, 归一化均方根误差NRMSE为0,表示预测模型性能好, 步骤一中,根据每个预测模型的预测步长P、真实值Xk和预测模型输出结果毛,获得各 预测模型的归一化均方根误差NRMSE的过程为: 根据公式:获得归一化均方根误差NRMSE。4.根据权利要求1所述的基于时间序列预测模型适用性量化的预测模型选择方法,其 特征在于,局部误差包括最大绝对误差AME、最大峰值误差H)IFF、相对最大峰值误差PEP和 误差符号变化次数NSC, 误差符号变化次数NSC主要记录误差序列符号发生变化的次数,用来预测预测结果中 是否存在系统误差,预测结果是否大于真实值或者小于真实值, 误差符号每变化一次则NSC计数增加1,NSC取值为O则说明符号没有发生变化,表示 预测模型大于真实值或者小于真实值, 预测误差符号是一致的,整体预测结果在实际数据结果的上方或下方,存在系统偏差, 误差符号变化次数NSC取值等于真实值,则表示误差符号在不断变化,预测结果中不 存在恒定的系统偏差, 最大绝对误差AME,用于计算最大预测偏差,最大绝对误差AME取值为0,模型最优, 步骤一中,根据每个预测模型的预测步长P、真实值Xk和预测模型输出结果毛,获得各 预测模型的最大绝对误差AME的过程为: 根据公式:获得最大绝对误差AME ; 最大峰值误差roiFF,用于判断在预测结果中是否存在系统偏差使得预测结果大于真 实值或小于真实值, 最大峰值误差roiFF取值为正,则表明预测模型的预测结果小于真实值, 最大峰值误差roiFF取值为负,则表明预测模型的预测结果大于真实值, 步骤一中,根据预测模型的预测步长、输入时间序列和预测模型输出结果,获得各预测 模型的最大峰值误差roiFF的过程为: 根据公式:获得最大峰值误差roiFF; 相对最大峰值误差PEP,用于预测当前的峰值状态的误差, 步骤一中,根据每个预测模型的预测步长P、真实值Xk和预测模型输出结果毛,获得各 预测模型的相对最大峰值误差PEP的过程为: 根据公式:获得相对最大峰值误差PEP。5.根据权利要求1所述的基于时间序列预测模型适用性量化的预测模型选择方法,其 特征在于,无量纲准则误差包括最小信息准则AIC、贝叶斯信息准则BIC、确定系数、有效系 数CE、匹配指数IoAd和持久系数PI, 最小信息准则AIC和贝叶斯信息准则BIC,均用于在含有N个数据点的时间序列集中, 获得含有最少自由参数且能够对数据进行解释的最小模型,即最低阶次模型,N为正整数, 某个预测模型相对其他预测模型的最小信息准则AIC和贝叶斯信息准则BIC的取值越 小,表示模型越优, 步骤一中,根据每个预测模型的预测步长P、真实值Xk和预测模型输出结果毛,获得各 预测模型的最小信息准则AIC的过程为: 根据公式: AIC = 2 · p+N · In (RMSE), (公式 15) 获得最小?目息准则AIC ; 步骤一中,根据每个预测模型的预测步长Ρ、真实值Xk和预测模型输出结果毛,获得各 预测模型的贝叶斯信息准则BIC的过程为: 根据公式: BIC = ρ · In (N)+N · In(RMSE), (公式 16) 获得贝叶斯信息准则BIC ; 最小信息准则AIC和贝叶斯信息准则BIC的取值越小代表模型越优; 确定系数RSqr,用于预测预测模型的数据统计特性的比例大小,取值区间为0到1,取 值越大于〇越优,最优模型取值为1, 步骤一中,根据每个预测模型的预测步长P、真实值Xk和预测模型输出结果毛,获得各 预测模型的确定系数的过程为: 根据公式:获得确定系数RSqr ; 有效系数CE,用于预测预测模型整体的预测效果,通常CE取值在0到1之间,偶尔会出 现负值情况,有效系数CE的取值为1,表示预测模型最优, 有效系数CE的取值为0,表明预测模型的性能不优于均值模型,均值模型为以数据均 值作为后续每个点的预测结果, 有效系数CE的取值为负值,表明预测模型的性能劣于均值模型; 步骤一中,根据每个预测模型的预测步长P、真实值Xk和预测模型输出结果4,获得各 预测模型的有效系数CE的过程为: 根据公式:获得有效系数CE ; 匹配指数IoAd,用来量化预测模型输出结果与输入时间序列之间的匹配程度,IoAd取 值范围在0到1之间,越接近1则表明模型性能越好, 步骤一中,根据每个预测模型的预测步长P、真实值Xk和预测模型输出结果%,获得各 预测模型的匹配指数IoAd的过程为: 根据公式:获得匹配指数IoAd ; 持久系数PI,用于预测预测模型对于整体的预测效果,取值范围是〇到1,或者出现负 值的情况, 持久系数PI的取值为1,表示预测模型最优, 持久系数PI的取值为〇,表明预测模型的性能不优于均值模型,均值模型为以数据均 值作为后续每个点的预测结果, 持久系数PI的取值为负值,表明预测模型的性能劣于均值模型; 步骤一中,根据每个预测模型的预测步长P、真实值Xk和预测模型输出结果毛,获得各 预测模型的持久系数PI的过程为: 根据公式:获得持久系数PI。6.根据权利要求1所述的基于时间序列预测模型适用性量化的预测模型选择方法,其 特征在于,多次实验性能误差包括M次重复实验的平均误差水平特性Timeliness、离散特 性Precision、参量重复特性Repeatability和模型准确性Accuracy, M次重复实验的平均误差水平特性Timeliness,用于预测M次重复预测实验预测模型 的输出结果相对于输入时间序列偏大或偏小的平均程度, 离散特性Precision,用于预测M次重复预测实验预测模型的输出结果离散度的平均 水平,即对预测结果是否存在较大波动性的预测, 重复特性R印eatability,用于预测预测模型输出结果是否可重复的,用于预测预测模 型的鲁棒性, M次重复实验的平均误差水平特性Timeliness为0,表示M次重复预测实验中平均误 差水平为〇, 离散特性Precision为0,表示预测误差离散程度小, 重复特性Repeatability为0,表示重复性高, 模型准确性Accuracy,用于综合预测M次重复实验中预测模型的预测性能,即包含了 对预测模型多次重复实验下输出结果的平均偏大或偏小的程度的预测、每次实验预测误差 序列离散度平均水平的预测和预测结果可重复性三个方面的综合预测, 步骤一中,根据每个预测模型的预测步长P、真实值Xk和预测模型输出结果%,获得各 预测模型的M次重复实验的平均误差的平均水平时间特性Timeliness的过程为: 定义第i次实验的平均误差E (i)为:其中,^是第i次实验第k个点的预测值, 然后,定义第i次实验的标准差参量std(i):结合(公式21)和(公式22),根据公式:获得M次重复实验的平均误差水平特性Timeliness,M为正整数; 步骤一中,根据每个预测模型的预测步长P、真实值Xk和预测模型输出结果:?,获得各 预测模型的精确特性Precision的过程为: 根据公式:获得离散特性Precision ; 步骤一中,根据每个预测模型的预测步长P、真实值xk和预测模型输出结果Λ,获得各 预测模型的参量重复特性R印eatability的过程为: 根据公式:获得参量重复特性Repeatability ; 其中,σ (std)和σ (E)分别为std和E的标准差, 结合公式23、公式24和公式25,根据公式:获得模型准确性Accuracy
【专利摘要】基于时间序列预测模型适用性量化的预测模型选择方法,涉及时间序列预测模型预测领域。本发明是为了解决现有的时间序列特性预测方法对预测模型输出的预测结果预测角度单一,无法实现对预测模型性能的全面、综合的预测,导致预测效果差的问题。本发明根据每个预测模型的预测步长P、真实值xk和预测模型输出结果获得各预测模型的误差和预测效率,根据预测需求在m个预测模型中,结合各预测模型的误差和预测效率,选取满足预测需求的最优预测模型,若满足预测需求的预测模型为一个,则该预测模型为最优预测模型,若满足预测需求的预测模型为多个,则将多个预测模型两两进行预测能力差异性检验,获得一个最优的预测模型。它可用于对预测模型进行预测。
【IPC分类】G06Q10/04
【公开号】CN104899658
【申请号】CN201510324353
【发明人】彭宇, 刘大同, 郭力萌, 彭喜元
【申请人】哈尔滨工业大学
【公开日】2015年9月9日
【申请日】2015年6月12日
当前第5页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1