更新预测模型的方法和装置的制造方法

文档序号:9375996阅读:391来源:国知局
更新预测模型的方法和装置的制造方法
【技术领域】
[0001] 本发明的各个实施方式涉及预测模型,更具体地,涉及更新用于时间序列数据 (Time Series Data)的预测模型的方法和装置。
【背景技术】
[0002] 随着计算机、数据通信以及实时监视等技术的发展,时间序列数据已经被广泛应 用于例如设备监视、生产线管理、金融分析等诸多方面。时间序列数据是指按照时间顺序排 列的测量值的集合,例如时间序列数据可以存储在数据库中,或者以其他方式来存储。
[0003] 测量值可以包括各种数据,例如,在监视用户对在线银行系统的访问的应用环境 中,被采集的测量值可以包括在各个时间点处、用户对在线银行系统的访问次数,此时的时 间序列数据例如可以存储为序列X 1, x2, ...,X1, ...,Xn,并且第i个时间点处测量的数据是 数值X1。在天气预报应用环境中,被采集的测量值可以是多元数据,例如可以包括温度、湿 度、压力、风力,等等。此时,将获得4组时间序列数据,并且在第i个时间点处测量的数据 可以是分别为temp Iiumi, Prei和Windi。
[0004] 时间序列数据的数值分布通常具有一定的规律性,因而可以基于在过去的某时间 段期间采集到的历史测量值来预测在未来的数据变化。例如,在上文所述的监视用户对在 线银行系统的访问次数的示例中,可以基于所预测的访问次数的变化,相应地调整在线银 行系统中的各种资源配置,以适合于不同时间段的用户访问需求,进而提高在线银行系统 中资源利用率。
[0005] 在现有技术中,已经开发出了可以基于特定时间段(例如,训练时间窗口)内的历 史测量值而建立预测模型,进而预测在未来的特定时间段(例如,预测时间窗口)内的数值 的技术方案。然而,预测模型通常会随着时间的推移而变化,按照现有的技术方案,无法知 晓现有的预测模型与真实测量值相匹配或者不相匹配,因而只能随着时间的推移而频繁地 更新预测模型,这产生了极大的计算量。一方面,现有技术并不提供应当在何时更新预测模 型进而生成新的预测模型的通知;另一方面,由于更新后的新的预测模型将依赖于历史数 据的选取,因而如何从大量历史数据中选择适当的范围用于生成新的预测模型,也成为一 个关注的焦点。

【发明内容】

[0006] 因而,期望开发一种能够有效地更新用于时间序列数据的预测模型的技术方案, 期望该技术方案可以检测现有的预测模型是否能够较为准确地反映时间序列数据在未来 的变化(例如,判断预测值和实际测量值之间的误差是否在特定阈值范围内),进而在误差 超过预定阈值时,能够提供更新预测模型的通知。
[0007] 根据本发明的一个方面,提供了一种用于更新预测模型的方法,该预测模型是用 于时间序列数据的预测模型,包括:从与预测模型相关联的多个预测时间窗口中按顺序选 择当前预测时间窗口 h ;基于预测模型,预测时间序列数据在当前预测时间窗口 h内的各个 时间点k的预测值基于时间序列数据在当前预测时间窗口 h内的各个时间点k的实际 测量值yk和预测值,计算与当前预测时间窗口 h相关联的预测误差MPE ;以及响应于预 测误差MPE大于或等于与当前预测时间窗口 h相关联的预定误差阈值,提供更新预测模型 的通知。
[0008] 根据本发明的一个方面,提供了一种更新预测模型的方法,该预测模型是用于时 间序列数据的预测模型,包括:响应于接收到更新预测模型的通知,获取与通知相关联的 当前预测时间窗口 h和与所述预测模型相关联的当前训练时间窗口,其中通知是根据上文 的方法来提供的;计算与当前训练时间窗口和当前预测时间窗口 h相关联的总累积误差 ACCh;提取时间点的范围,使得时间序列数据在范围内的实际测量值与预测值之间的累积 误差ACC w,和总累积误差ACCh之间的比例大于或等于预定比例;以及提供时间点的范围作 为更新预测模型的新的训练时间窗口。
[0009] 根据本发明的一个方面,提供了一种更新预测模型的装置,该预测模型是用于时 间序列数据的预测模型,包括:选择模块,配置用于从与预测模型相关联的多个预测时间窗 口中按顺序选择当前预测时间窗口 h ;预测模块,配置用于基于预测模型,预测时间序列数 据在当前预测时间窗口 h内的各个时间点k的预测值·^;计算模块,配置用于基于时间序 列数据在当前预测时间窗口 h内的各个时间点k的实际测量值yk和预测值.?,计算与当前 预测时间窗口 h相关联的预测误差MPE ;以及提供模块,配置用于响应于预测误差MPE大 于或等于与当前预测时间窗口 h相关联的预定误差阈值,提供更新预测模型的通知。
[0010] 根据本发明的一个方面,提供了一种更新预测模型的装置,该预测模型是用于时 间序列数据的预测模型,包括:获取模块,配置用于响应于接收到更新预测模型的通知,获 取与通知相关联的当前预测时间窗口 h和与所述预测模型相关联的当前训练时间窗口,其 中通知是根据上文的装置来提供的;计算模块,配置用于计算与当前训练时间窗口和当前 预测时间窗口 h相关联的总累积误差ACCh ;提取模块,配置用于提取时间点的范围,使得时 间序列数据在范围内的实际测量值与预测值之间的累积误差ACCw,和总累积误差ACC h之间 的比例大于或等于预定比例;以及提供模块,配置用于提供时间点的范围作为更新预测模 型的新的训练时间窗口。
[0011] 采用本发明所述的方法和装置,可以在尽可能少地改动现有预测方法的架构的情 况下,提醒在何时应当更新现有预测模型。
【附图说明】
[0012] 通过结合附图对本公开示例性实施方式进行更详细的描述,本公开的上述以及其 他目的、特征和优势将变得更加明显,其中,在本公开示例性实施方式中,相同的参考标号 通常代表相同部件。
[0013] 图1示出了适于用来实现本发明实施方式的示例性计算机系统/服务器12的框 图;
[0014] 图2示意性示出了根据一个技术方案的更新用于时间序列数据的预测模型的方 法的示意图;
[0015] 图3A和图3B分别示意性示出了根据本发明的实施方式的、训练时间窗口和预测 时间窗口的示意图;
[0016] 图4示意性示出了根据本发明的一个实施方式的、更新用于时间序列数据的预测 模型的方法的流程图;
[0017] 图5示意性示出了根据本发明的一个实施方式的、多级预测时间窗口的示意图;
[0018] 图6示意性示出了根据本发明的一个实施方式的、更新用于时间序列数据的预测 模型的方法的流程图;
[0019] 图7示意性示出了根据本发明的一个实施方式的、获取新的预测时间窗口 h'的 示意图;以及
[0020] 图8A和图8B分别示意性示出了根据本发明的实施方式的、更新用于时间序列数 据的预测模型的装置的框图。
【具体实施方式】
[0021] 下面将参照附图更详细地描述本公开的优选实施方式。虽然附图中显示了本公开 的优选实施方式,然而应该理解,可以以各种形式实现本公开而不应被这里阐述的实施方 式所限制。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的 范围完整地传达给本领域的技术人员。
[0022] 图1示出了适于用来实现本发明实施方式的示例性计算机系统/服务器12的框 图。图1显示的计算机系统/服务器12仅仅是一个示例,不应对本发明实施方式的功能和 使用范围带来任何限制。
[0023] 如图1所示,计算机系统/服务器12以通用计算设备的形式表现。计算机系统 /服务器12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器 28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
[0024] 总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器, 外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举 例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC) 总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
[0025] 计算机系统/服务器12典型地包括多种计算机系统可读介质。这些介质可以是 任何能够被计算机系统/服务器12访问的可用介质,包括易失性和非易失性介质,可移动 的和不可移动的介质。
[0026] 系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存 取存储器(RAM) 30和/或高速缓存存储器32。计算机系统/服务器12可以进一步包括其 他可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34 可以用于读写不可移动的、非易失性磁介质(图1未显示,通常称为"硬盘驱动器")。尽管 图1中未示出,可以提供用于对可移动非易失性磁盘(例如"软盘")读写的磁盘驱动器, 以及对可移动非易失性光盘(例如⑶-ROM,DVD-ROM或者其他光介质)读写的光盘驱动器。 在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28 可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模 块被配置以执行本发明各实施方式的功能。
[0027] 具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器 28中,这样的程序模块42包括--但不限于--操作系统、一个或者多个应用程序、
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1