一种时间序列预测方法及相关装置与流程

文档序号:31778437发布日期:2022-10-12 09:09阅读:102来源:国知局
一种时间序列预测方法及相关装置与流程

1.本技术涉及人工智能技术领域,尤其涉及一种时间序列预测方法及相关装置。


背景技术:

2.在实际工业生产环境中,时间序列预测在自动化和优化运营流程等方面发挥着重要作用;通过时间序列预测,可以使用业务场景中与过去行为相关的时间序列数据,来预测该业务场景中相关的数据变化趋势。
3.深度学习方法是目前常见的一类时间序列预测方法,通过深度学习方法实现时间序列预测时,需要预先利用特定场景中的时间序列数据及其对应的实际数据变化结果,训练适用于该特定场景的时间序列预测模型;进而将该时间序列预测模型应用至该特定场景,以实现该特定场景中的时间序列预测。
4.然而,上述时间序列预测方法存在以下问题:1)难以应对概念漂移问题;通常情况下,时间序列数据的数据模式会随着时间的变化而发生改变,一旦数据模式发生改变,此前训练的时间序列预测模型将会出现预测性能下降的问题。2)难以快速适应新的时间序列预测任务;对于新的业务场景或者业务需求下的时间序列预测任务,通常需要重新训练新的适用于该时间序列预测任务的时间序列预测模型,而训练时间序列预测模型往往需要经历较长时间。


技术实现要素:

5.本技术实施例提供了一种时间序列预测方法及相关装置,能够有效应对概念漂移问题,并且能够快速地适应新的时间序列预测任务。
6.有鉴于此,本技术第一方面提供了一种时间序列预测方法,所述方法包括:
7.获取目标时间序列预测模型处理过的参考时间序列数据;所述参考时间序列数据包括:对应的预测结果满足欠可靠条件的时间序列数据、以及新增的时间序列预测任务下的时间序列数据中的至少一种;
8.获取每个所述参考时间序列数据对应的标准数据变化结果;所述标准数据变化结果用于表征其对应的参考时间序列数据的后续实际变化趋势;
9.在所述目标时间序列预测模型的当前模型参数的基础上,基于各个所述参考时间序列数据及其各自对应的标准数据变化结果,对所述目标时间序列预测模型进行优化训练,并将优化训练后的所述目标时间序列预测模型投入时间序列预测任务。
10.本技术第二方面提供了一种时间序列预测装置,所述装置包括:
11.数据获取模块,用于获取目标时间序列预测模型处理过的参考时间序列数据;所述参考时间序列数据包括:对应的预测结果满足欠可靠条件的时间序列数据、以及新增的时间序列预测任务下的时间序列数据中的至少一种;
12.结果获取模块,用于获取每个所述参考时间序列数据对应的标准数据变化结果;所述标准数据变化结果用于表征其对应的参考时间序列数据的后续实际变化趋势;
13.优化训练模块,用于在所述目标时间序列预测模型的当前模型参数的基础上,基于各个所述参考时间序列数据及其各自对应的标准数据变化结果,对所述目标时间序列预测模型进行优化训练,并将优化训练后的所述目标时间序列预测模型投入时间序列预测任务。
14.本技术第三方面提供了一种计算机设备,所述设备包括处理器以及存储器:
15.所述存储器用于存储计算机程序;
16.所述处理器用于根据所述计算机程序,执行如上述第一方面所述的时间序列预测方法的步骤。
17.本技术第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,所述计算机程序用于执行上述第一方面所述的时间序列预测方法的步骤。
18.本技术第五方面提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述第一方面所述的时间序列预测方法的步骤。
19.从以上技术方案可以看出,本技术实施例具有以下优点:
20.本技术实施例提供了一种时间序列预测方法,该方法将迁移学习和增量学习联合起来,对支持跨任务的时间序列预测模型进行优化训练,从而使该时间序列预测模型能更好地应对概念漂移问题,且更快地适应新的时间序列预测任务。具体的,本技术实施例提供的方法会利用目标时间序列预测模型处理过的所对应的预测结果满足欠可靠条件的时间序列数据、以及其对应的标准数据变化结果,对目标时间序列预测模型进行优化训练,如此实现增量学习;通过增量学习,可以使目标时间序列预测模型更好地处理其原本难以准确处理的时间序列数据,当目标时间序列预测模型处理的时间序列数据的数据模式发生改变时,通过增量学习可以使目标时间序列预测模型及时具备准确处理数据模式改变后的时间序列数据的能力,从而有效地应对概念漂移问题。此外,本技术实施例提供的方法还会在目标时间序列预测模型的当前模型参数的基础上,利用新增的时间序列预测任务下的时间序列数据、及其对应的标准数据变化结果,对该目标时间序列预测模型进行优化训练,如此实现迁移学习;相比重新训练新的适应于新增的时间序列预测任务的模型的方案,本技术通过迁移学习,可以使目标时间序列预测模型快速地具备执行新增的时间序列预测任务的能力,即使得目标时间序列预测模型快速地适应新增的时间序列预测任务。
附图说明
21.图1为示例性的概念漂移示意图;
22.图2为本技术实施例提供的时间序列预测方法的应用场景示意图;
23.图3为本技术实施例提供的时间序列预测方法的流程示意图;
24.图4为本技术实施例提供的目标时间序列预测模型的应用方法的流程示意图;
25.图5为本技术实施例提供的一种时间序列预测任务的实现框架示意图;
26.图6为本技术实施例提供的另一种时间序列预测任务的实现框架示意图;
27.图7为本技术实施例提供的一种实验对比结果的示意图;
28.图8为本技术实施例提供的另一种实验对比结果的示意图;
29.图9为本技术实施例提供的时间序列预测装置的结构示意图;
30.图10为本技术实施例提供的终端设备的结构示意图;
31.图11为本技术实施例提供的服务器的结构示意图。
具体实施方式
32.为了使本技术领域的人员更好地理解本技术方案,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
33.本技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
34.人工智能(artificial intelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
35.人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习、自动驾驶、智慧交通等几大方向。
36.机器学习(machine learning,ml)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
37.本技术实施例提供的方案涉及人工智能技术中的机器学习技术,具体通过如下实施例进行说明:
38.相关技术中,基于深度学习的时间序列预测方法通常难以应对概念漂移问题,且难以快速地适应新增的时间序列预测任务。所谓概念漂移可以理解为时间序列数据的数据模式发生了明显的变化,图1所示的数据变化趋势图即反映了概念漂移情况,在图1所示的两个数据变化趋势图中,右侧的数据变化趋势与左侧的数据变化趋势存在明显的区别,现
有的时间序列预测模型基于右侧的时间序列数据执行时间序列预测任务,通常难以准确地预测后续的数据变化趋势,模型性能明显下降。新增的时间序列预测任务可以包括新的业务场景下的时间序列预测任务、以及满足新的业务需求的时间序列预测任务;新的业务场景可以理解为时间序列预测模型此前未涉及过的业务场景,即该时间序列预测模型此前未处理过该业务场景中的时间序列数据;满足新的业务需求可以理解为时间序列预测模型输出的预测结果需要匹配新的业务要求,例如,假设时间序列预测模型原本用于根据输入的时间序列数据预测未来一天的数据变化趋势,而使用对象需要时间序列预测模型能够预测未来七天的数据变化趋势,即相当于提出了一种新的业务需求;面对上述新增的时间序列预测任务,现有的时间序列预测模型通常难以处理,需要重新训练适用于该新增的时间序列预测任务的时间序列预测模型。
39.为了解决上述相关技术存在的问题,本技术实施例提供了一种时间序列预测方法,该方法既能够有效地应对概念漂移问题,又能够快速地适应新增的时间序列预测任务。
40.具体的,在本技术实施例提供的时间序列预测方法中,先获取目标时间序列预测模型处理过的参考时间序列数据,该参考时间序列数据包括:对应的预测结果满足欠可靠条件的时间序列数据、以及新增的时间序列预测任务下的时间序列数据中的至少一种;并获取每个参考时间序列数据对应的标准数据变化结果,该标准数据变化结果用于表征对应的参考时间序列数据的后续实际变化趋势。进而,在目标时间序列预测模型的当前模型参数的基础上,基于各个参考时间序列数据及其各自对应的标准数据变化结果,对该目标时间序列预测模型进行优化训练,并将优化训练后的目标时间序列预测模型投入时间序列预测任务。
41.上述方法将迁移学习和增量学习联合起来,对支持跨任务的目标时间序列预测模型进行优化训练,从而使目标时间序列预测模型能更好地应对概念漂移问题,且更快地适应新的时间序列预测任务。具体的,该方法可以利用所对应的预测结果满足欠可靠条件的时间序列数据、及其对应的标准数据变化结果,对目标时间序列预测模型进行优化训练,从而实现增量学习;通过增量学习,可以使目标时间序列预测模型更好地处理其原本难以准确处理的时间序列数据,当目标时间序列预测模型处理的时间序列数据的数据模式发生改变时,通过增量学习可以使目标时间序列预测模型及时具备准确处理数据模式改变后的时间序列数据的能力,从而有效地应对概念漂移问题。此外,该方法还可以在目标时间序列预测模型的当前模型参数的基础上,利用新增的时间序列预测任务下的时间序列数据、及其对应的标准数据变化结果,对该目标时间序列预测模型进行优化训练,如此实现迁移学习;相比重新训练新的适应于新增的时间序列预测任务的模型的方案,本技术通过迁移学习,可以使目标时间序列预测模型快速地具备执行新增的时间序列预测任务的能力,即使得目标时间序列预测模型快速地适应新增的时间序列预测任务。
42.应理解,本技术实施例提供的时间序列预测方法可以由计算机设备执行,该计算机设备可以是终端设备或服务器。其中,终端设备包括但不限于智能手机、平板电脑、笔记本电脑、台式计算机、智能语音交互设备、智能家电、车载终端、飞行器等。服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、cdn、以及大数据和人工智能平台等基础云计算服务的云服务器。
43.为了便于理解本技术实施例提供的时间序列预测方法,下面以该时间序列预测方法的执行主体为服务器为例,对该时间序列预测方法的应用场景进行示例性介绍。
44.参见图2,图2为本技术实施例提供的时间序列预测方法的应用场景示意图。如图2所示,该应用场景包括服务器210和数据库220,服务器210可以通过网络访问数据库220,或者数据库220也可以集成在服务器210中。其中,服务器210用于执行本技术实施例提供的时间序列预测方法,以对目标时间序列预测模型进行优化训练;数据库220用于存储时间序列数据。
45.在实际应用中,服务器210可以从数据库220中调取目标时间序列预测模型处理过的参考时间序列数据。此处的目标时间序列预测模型是用于根据输入的时间序列数据预测该时间序列数据对应的未来变化趋势的模型,例如,将今日产生的某类型的时间序列数据输入该目标时间序列预测模型,该目标序列预测模型可以相应地预测该类型的数据在明日的变化趋势;此外,目标时间序列预测模型可以支持处理多种不同的时间序列预测任务,不同的时间序列预测任务包括不同业务场景下的时间序列预测任务、不同数据源对应的时间序列预测任务、具备不同业务需求的时间序列预测任务等等。参考时间序列数据包括:对应的预测结果满足欠可靠条件的时间序列数据(可以理解为目标时间序列预测模型当前难以准确处理的时间序列数据)、以及新增的时间序列预测任务下的时间序列数据中的至少一种。
46.此外,服务器210还可以从数据库220中调取每个参考时间序列数据对应的标准数据变化结果,该标准数据变化结果用于表征对应的参考时间序列数据的后续实际变化趋势。具体的,数据库220可以存储特定指标下产生的全量时间序列数据,其中既包括目标时间序列预测模型处理过的时间序列数据,又包括在该时间序列数据后实际产生的时间序列数据,服务器210获取参考时间序列数据对应的标准数据变化结果,实际上就是获取在该参考时间序列数据之后实际产生的同类型的时间序列数据;例如,假设目标时间序列预测模型根据在2022年3月5日产生的a类型的参考时间序列数据,预测了2022年3月6日至8日a类型的数据变化趋势,则服务器210可以从数据库220中调取2022年3月6日至8日a类型实际的数据变化趋势,作为该参考时间序列数据对应的标准数据变化结果。应理解,在实际应用中,服务器210获取的标准数据变化结果对应的时间区间,与目标时间序列预测模型输出的预测结果对应的时间区间可以相同,也可以不同,本技术对此不做任何限定。
47.进而,服务器210可以在目标时间序列预测模型的当前模型参数的基础上,基于各参考时间序列数据及其各自对应的标准数据变化结果,对该目标时间序列预测模型进行优化训练,以提升该目标时间序列预测模型对其难以准确处理的时间序列数据的处理能力,从而应对概念漂移问题,并且使得该目标时间序列预测模型可以适应新增的时间序列预测任务。完成对于该目标时间序列预测模型的优化训练后,可以将优化训练后的目标时间序列预测模型重新投入时间序列预测任务中。
48.应理解,图2所示的应用场景仅为示例,在实际应用中,本技术实施例提供的时间序列预测方法也可以应用于其它场景,如游戏场景、云服务场景等,在此不对本技术实施例提供的时间序列预测方法的应用场景做任何限定。
49.下面通过方法实施例对本技术提供的时间序列预测方法进行详细介绍。
50.参见图3,图3为本技术实施例提供的时间序列预测方法的流程示意图。为了便于
描述,下述实施例仍以该时间序列预测方法的执行主体为服务器为例进行介绍。如图3所示,该时间序列预测方法包括以下步骤:
51.步骤301:获取目标时间序列预测模型处理过的参考时间序列数据;所述参考时间序列数据包括:对应的预测结果满足欠可靠条件的时间序列数据、以及新增的时间序列预测任务下的时间序列数据中的至少一种。
52.步骤302:获取每个所述参考时间序列数据对应的标准数据变化结果;所述标准数据变化结果用于表征对应的参考时间序列数据的后续实际变化趋势。
53.由于步骤301与步骤302的关联性较强,因此下文对步骤301和步骤302的实现过程进行整体介绍。
54.在本技术实施例中,服务器可以获取目标时间序列预测模型处理过的各参考时间序列数据,并获取每个参考时间序列数据对应的标准数据变化结果。示例性的,假设目标时间序列预测模型所处理的时间序列数据来自目标业务,并且在目标业务下产生的时间序列数据均存储于数据库,则服务器可以从该数据库中调取目标时间序列预测模型处理过的参考时间序列数据、以及参考时间序列数据对应的标准数据变化结果。
55.需要说明的是,本技术实施例中的目标时间序列预测模型,是用于根据时间序列数据预测其对应的未来数据变化趋势的模型。该目标时间序列预测模型的输入为历史时段内实际产生的时间序列数据,输出为根据输入的时间序列数据预测得到的另一时间序列数据,输出的时间序列数据能够反映未来一段时间内输入的时间序列数据对应的变化趋势;例如,假设将业务场景a中今日产生的指标a下的时间序列数据输入目标时间序列预测模型,则目标时间序列预测模型可以相应地输出业务场景a中明日可能产生的指标a下的时间序列数据。
56.应理解,在实际应用中,可以根据实际需求,控制向目标时间序列预测模型输入的时间序列数据对应的采样时段和采样频率;也可以根据实际需求,设置目标时间序列预测模型输出的时间序列数据对应的预测时段和预测采样频率,本技术对此不做任何限定。
57.此外,本技术实施例中的目标时间序列预测模型可以支持多种时间序列预测任务,不同的时间序列预测任务可能对应于不同的业务场景、处理来自不同数据源的时间序列数据、匹配不同的业务需求等等。也就是说,本技术实施例中的目标时间序列预测模型可以被应用于各种存在时间序列预测需求的场景中,该目标时间序列预测模型能够普适地处理各类时间序列预测数据,以相应地预测各类数据变化趋势。当然,为了实现目标时间序列预测模型的跨任务应用,需要对输入该目标时间序列预测模型的时间序列数据进行标准化处理,以保证输入该目标时间序列预测模型的时间序列数据符合该模型的处理数据标准,下文将通过另一方法实施例详细介绍目标时间序列预测模型的应用方式,并在其中介绍对时间序列数据进行标准化处理的方式。
58.需要说明的是,本技术实施例中的参考时间序列数据,是目标时间序列预测模型处理过的、且对优化该目标时间序列预测模型的性能能起到较大帮助作用的时间序列数据。更具体的,该参考时间序列数据包括:对应的预测结果满足欠可靠条件的时间序列数据(下文简称为第一时间序列数据)、以及新增的时间序列预测任务下的时间序列数据(下文简称为第二时间序列数据)中的至少一种。其中,第一时间序列数据可以理解为目标时间序列预测模型当前难以准确处理的时间序列数据;具体的,通过目标时间序列预测模型根据
某时间序列数据确定出其对应的预测结果后,可以利用欠可靠条件衡量该预测结果的准确性和可靠性,若确定该预测结果满足欠可靠条件,则说明该预测结果不够准确可靠,也即说明目标时间序列预测模型当前难以准确处理该时间序列数据,因此可以将该时间序列数据作为参考时间序列数据;此处的欠可靠条件是用于衡量目标时间序列预测模型确定的预测结果是否不准确可靠的条件;其例如可以是目标时间序列预测模型输出的边缘分布波动参数(下文将对该边缘分布波动参数进行详细介绍)高于预设的波动参数阈值,又例如可以是目标时间序列预测模型针对某时间序列数据确定的预测结果与该时间序列数据对应的标准数据变化结果之间的差异,超过预设的差异阈值,再例如可以是接收到使用对象针对该目标时间序列预测模型确定的预测结果反馈的不满意信息,本技术在此不对该欠可靠条件做任何限定。第二时间序列数据为新增的时间序列预测任务下的时间序列数据,该新增的时间序列预测任务例如可以是新的业务场景下的时间序列预测任务,又例如可以是与新的业务需求相匹配的时间序列预测任务,再例如可以是处理来自新的数据源的时间序列数据的时间序列预测任务,本技术对此不做任何限定。
59.需要说明的是,该参考时间序列数据对应的标准数据变化结果,是用于反映该参考时间序列数据的后续实际变化趋势的时间序列数据。正如上文所介绍的,参考时间序列数据是目标时间序列预测模型处理过的时间序列数据,也即该参考时间序列数据是历史时段内实际产生的时间序列数据,随着时间的推移,产生该参考时间序列数据的数据源还会持续地产生数据,相应地,由在该参考时间序列数据之后产生的数据组成的时间序列数据,即可作为该参考时间序列数据对应的标准数据变化结果。应理解,该标准数据变化结果对应的采样时段和采样频率可以根据实际需求设定,该标准数据变化结果对应的采样时段和采样频率,与目标时间序列预测模型输出的预测结果对应的预测时段和预测采样频率可以相同,也可以不同,本技术对此不做任何限定。
60.在一种可能的实现方式中,当目标时间序列预测模型为融合贝叶斯估计的时间序列预测模型时,服务器可以通过以下方式获取参考时间序列数据:获取各个候选时间序列数据各自对应的边缘分布波动参数,此处的候选时间序列数据为目标时间序列预测模型处理过的时间序列数据,此处的边缘分布波动参数为目标时间序列预测模型输出的参数,用于表征目标时间序列预测模型根据其对应的候选时间序列数据确定的预测结果的可靠度;进而,根据各个候选时间序列数据各自对应的边缘分布波动参数,选择所对应的边缘分布波动参数满足预设波动条件的候选时间序列数据,作为参考时间序列数据。
61.具体的,融合贝叶斯估计的时间序列预测模型可以根据输入的时间序列数据,相应地预测对应时间序列指标的边缘分布;边缘分布是指在概率论和统计学的多维随机变量中只包括其中部分变量的概率分布,例如,假设存在一个与变量x和变量y均相关的概率分布p(x,y),那么关于其中变量x的边缘分布可以为给定变量y的条件概率分布,即p(x)=∑yp(x,y)=∑yp(x|y)p(y),在该边缘分布中,得到只关于一个变量的概率分布,而不再考虑另一变量的影响,实际上是进行了降维操作。
62.对于融合贝叶斯估计的时间序列预测模型,其通常可以输出边缘分布预测值和边缘分布波动参数。其中,边缘分布预测值是所要得到的与输入的时间序列数据对应的预测结果。边缘分布波动参数能够反映预测结果的可靠度,该边缘分布波动参数例如可以是时间序列预测模型预测的边缘分布的标准差;应理解,该边缘分布波动参数反映的波动幅度
越大,则说明预测结果的可靠度越低,反之,该边缘分布波动参数反映的波动幅度越小,则说明预测结果的可靠度越高。
63.当目标时间序列预测模型为融合贝叶斯估计的时间序列预测模型时,服务器可以将目标时间序列预测模型在参考时段内处理过的各时间序列数据均视为候选时间序列数据;此处的参考时段例如可以是当前时间的前一天、前一周或前一个月,又例如可以是上次优化训练目标时间序列预测模型的时间与当前时间之间间隔的时间段,再例如可以是该目标时间序列预测模型投入使用的时间与当前时间之间间隔的时间段等等,本技术在此不对该参考时段做任何限定。同时,服务器还可以获取各候选时间序列数据各自对应的边缘分布波动参数;应理解,候选时间序列数据对应的边缘分布波动参数是目标时间序列预测模型处理该候选时间序列数据时输出的边缘分布波动参数,其用于表征目标时间序列预测模型根据该候选时间序列数据确定的预测结果的准确性和可靠性。
64.进而,服务器可以选择所对应的边缘分布波动参数满足预设波动条件的候选时间序列数据,作为上文中的参考时间序列数据。示例性的,服务器可以选择所对应的边缘分布波动参数超过预设的边缘分布波动参数阈值的候选时间序列数据,作为参考时间序列数据;或者,服务器也可以按照从大到小的顺序排列各候选时间序列数据各自对应的边缘分布波动参数,进而,确定其中排序靠前的n个(n为大于1的整数)边缘分布波动参数对应的候选时间序列数据,作为参考时间序列数据。应理解,在实际应用中,服务器也可以设定其它预设波动条件,并据此基于各候选时间序列数据各自对应的边缘分布波动参数,从各候选时间序列数据中选择参考时间序列数据,本技术在此不对预设波动条件做任何限定。
65.如此,根据融合贝叶斯估计的时间序列预测模型输出的边缘分布波动参数,衡量该时间序列预测模型针对各候选时间序列数据确定的预测结果的可靠性,并根据衡量结果从各候选时间序列数据中选出用于对该时间序列预测模型进行优化训练的参考时间序列数据;可以保证选出的参考时间序列数据对优化该时间序列预测模型的性能能够起到较大的帮助作用,即保证选出的参考时间序列数据具有较高的价值。
66.在另一种可能的实现方式中,服务器可以通过以下方式获取参考时间序列数据:获取各个候选时间序列数据各自对应的预测结果和标准数据变化结果,此处的候选时间序列数据为目标时间序列预测模型处理过的时间序列数据;然后,针对每个候选时间序列数据,确定其对应的预测结果与标准数据变化结果之间的差异,作为该候选时间序列数据对应的预测差异;进而,根据各个候选时间序列数据各自对应的预测差异,选择所对应的预测差异满足预设差异条件的候选时间序列数据,作为参考时间序列数据。
67.具体的,服务器可以将目标时间序列预测模型在参考时段内处理过的各时间序列数据均视为候选时间序列数据;此处的参考时段例如可以是当前时间的前一天、前一周或前一个月,又例如可以是上次优化训练目标时间序列预测模型的时间与当前时间之间间隔的时间段,再例如可以是该目标时间序列预测模型投入使用的时间与当前时间之间间隔的时间段等等,本技术在此不对该参考时段做任何限定。服务器可以获取各个候选时间序列数据各自对应的预测结果和标准数据变化结果;此处候选时间序列数据对应的预测结果,是通过目标时间序列预测模型处理该候选时间序列数据得到的预测结果;候选时间序列数据对应的标准数据变化结果,是在该候选时间序列数据之后实际产生的数据变化趋势。
68.针对每个候选时间序列数据,服务器可以计算其对应的预测结果与标准数据变化
结果之间的差异,作为该候选时间序列数据对应的预测差异,该预测差异能够反映目标时间序列预测模型基于该候选时间序列数据确定的预测结果的准确性和可靠性;应理解,预测差异越大,则说明目标时间序列预测模型基于该候选时间序列数据确定的预测结果越不准确、越不可靠,预测差异越小,则说明目标时间序列预测模型基于该候选时间序列数据确定的预测结果越准确、越可靠。
69.进而,服务器可以根据各个候选时间序列数据各自对应的预测差异,从各个候选时间序列数据中,选择所对应的预测差异满足预设差异条件的候选时间序列数据作为参考时间序列数据。示例性的,服务器可以选择所对应的预测差异大于预设的差异阈值的候选时间序列数据,作为参考时间序列数据。应理解,在实际应用中,服务器也可以设定其它预设差异条件,并据此基于各候选时间序列数据各自对应的预测差异,从各候选时间序列数据中选择参考时间序列数据,本技术在此不对预设差异条件做任何限定。
70.如此,根据候选时间序列数据对应的预测结果与标准数据变化结果之间的差异,确定候选时间序列数据对应的预测差异,进而,选择所对应的预测差异较大的候选时间序列数据作为参考时间序列数据,这样可以较准确地选出目标时间序列预测模型难以准确处理的参考时间序列数据。
71.在又一种可能的实现方式中,服务器可以支持使用对象通过事件驱动的方式,调用目标时间序列预测模型执行新增的时间序列预测任务,在该种情况下,服务器可以通过以下方式获取参考时间序列数据:获取目标时间序列预测模型处理过的、关联有目标驱动事件的时间序列数据,作为参考时间序列数据;此处的目标驱动事件是调用目标时间序列预测模型执行新增的时间序列预测任务时产生的。
72.示例性的,在实际生产环境中,使用对象可以通过在线的生产系统架构实现时间序列预测。具体的,该在线的生产系统架构可以包括计算平台以及监测平台。其中,计算平台用于为使用对象提供多种组件,以支持相关数据处理操作;在本技术实施例中,计算平台上部署有时间序列预测服务,其作为计算平台中的一个独立节点为使用对象提供时间序列预测服务。监测平台用于接收使用对象触发的驱动事件,以根据该驱动事件调用计算平台的相关组件为使用对象提供相应的服务;在本技术实施例中,当使用对象想要利用计算平台的时间序列预测服务执行新增的时间序列预测任务时,使用对象可以通过监测平台提供的、专用于控制时间序列预测服务执行新增的时间序列预测任务的控件,触发目标驱动事件,该目标驱动事件即是用于触发计算平台上的时间序列预测服务执行新增的时间序列预测任务的事件;进而,监测平台可以将其接收到的目标驱动事件传输给计算平台,以使计算平台上的时间序列预测服务执行新增的时间序列预测任务。
73.应理解,上述计算平台上的时间序列预测服务是基于上文中的目标时间序列预测模型实现的,即计算平台接收到监测平台传输过来的驱动事件后,可以相应地控制目标时间序列预测模型响应该驱动事件,以执行对应的时间序列预测任务。
74.在本技术实施例中,服务器可以将目标时间序列预测模型处理过的时间序列数据与其对应的驱动事件关联起来;基于此,服务器获取参考时间序列数据时,可以直接获取关联有目标驱动事件的时间序列数据,作为参考时间序列数据。
75.如此,通过上述方式可以实现基于事件驱动的时间序列预测任务,从而快速响应使用对象的需求,即使使用对象需要执行新增的时间序列预测任务,也可以通过事件驱动
的方式快速地响应该需求,执行该新增的时间序列预测任务。此外,通过上述方式,也可以快速准确地获取到新增的时间序列预测任务下的时间序列数据,作为参考时间序列数据。
76.在再一种可能的实现方式中,服务器可以根据目标时间序列预测模型的使用对象给出的反馈结果,选择参考时间序列数据。即,服务器可以获取候选时间序列数据对应的反馈结果,此处的候选时间序列数据为目标时间序列预测模型处理过的时间序列数据,此处的反馈结果是使用对象为候选时间序列数据对应的预测结果给出的评价信息,其用于表征该使用对象对于该预测结果的满意度;进而,根据候选时间序列数据对应的反馈结果,选择所对应的反馈结果不满足预设满意条件的候选时间序列数据,作为参考时间序列数据。
77.示例性的,服务器每次利用目标时间序列预测模型处理完时间序列数据,得到该时间序列数据对应的预测结果后,可以将该时间序列数据对应的预测结果反馈给请求基于该时间序列数据执行时间序列预测任务的使用对象,并请求该使用对象为该预测结果给出反馈结果,以通过该反馈结果表示该使用对象对于该预测结果的满意度;例如,服务器可以请求该使用对象为该预测结果给出对应的分数,作为该使用对象对于该预测结果的反馈结果。
78.在本技术实施例中,对于服务器在参考时段处理过的每个候选时间序列数据,服务器可以相应地获取每个候选时间序列数据对应的反馈结果,也即获取使用对象为该候选时间序列数据对应的预测结果给出的反馈结果。进而,服务器可以根据各个候选时间序列数据各自对应的反馈结果,从各个候选时间序列数据中,选出所对应的反馈结果不满足预设满意条件的候选时间序列数据,也即选出使用对象对于所对应的预测结果不满意的候选时间序列数据,作为参考时间序列数据。例如,假设使用对象给出的反馈结果为对预测结果给出的分数值,分数值越高则表示越满意,分数值越低则表示越不满意,,则服务器可以获取所对应的分数值低于预设分数阈值的候选时间序列数据,作为参考时间序列数据。
79.应理解,在实际应用中,使用对象给出的反馈结果还可以为其它形式,相应地,服务器可以通过其它方式根据反馈结果选择参考时间序列数据,本技术对此不做任何限定。
80.如此,通过上述方式,根据使用对象给出的反馈结果选择参考时间序列数据,可以选出使用对象不满意的预测结果对应的时间序列数据,使用对象若对预测结果不满意,则说明目标时间序列预测模型没有准确可靠地处理该时间序列数据,相应地选择该时间序列数据作为参考时间序列数据,有利于后续使目标时间序列预测模型更好地处理此类时间序列数据,从而提升使用对象的满意度。
81.应理解,在实际应用中,服务器可以选择上述任意一种或多种实现方式指示的参考时间序列数据获取方式,获取参考时间序列数据,也可以根据实际需求采用其它方式获取参考时间序列数据,本技术对此不做任何限定。
82.步骤303:在所述目标时间序列预测模型的当前模型参数的基础上,基于各个所述参考时间序列数据及其各自对应的标准数据变化结果,对所述目标时间序列预测模型进行优化训练,并将优化训练后的所述目标时间序列预测模型投入时间序列预测任务。
83.服务器获取到各参考时间序列数据及其各自对应的标准数据变化结果后,可以在目标时间序列预测模型的当前模型参数的基础上,利用各参考时间序列数据及其各自对应的标准数据变化结果,对该目标时间序列预测模型进行优化训练。需要说明的是,利用对应的预测结果满足欠可靠条件的时间序列数据及其对应的标准数据变化结果,对目标时间序
列预测模型进行优化训练,本质上就是增量学习;利用新增的时间序列预测任务下的时间序列数据及其对应的标准数据变化结果,对目标时间序列预测模型进行优化训练,本质上就是迁移学习。
84.具体实现时,服务器可以将每个参考时间序列数据输入该目标时间序列预测模型,目标时间序列预测模型通过对输入的参考时间序列数据进行分析处理,可以相应地输出该参考时间序列数据对应的预测结果;进而,服务器可以根据该参考时间序列数据对应的预测结果和标准数据变化结果之间的差异,构建损失函数,并基于该损失函数调整该目标时间序列预测模型的模型参数,实现对于该目标时间序列预测模型的优化训练。如此利用各参考时间序列数据及其各自对应的标准数据变化结果,重复执行上述优化训练操作,直至满足优化训练结束条件为止;此处的优化训练结束条件是用于衡量是否停止对于目标时间序列预测模型的优化训练的条件,其例如可以是对于目标时间序列预测模型的优化训练迭代轮次达到预设轮次,又例如可以是目标时间序列预测模型对于参考时间序列数据的处理性能达到预设性能要求,等等,本技术对此不做任何限定。
85.在一种可能的实现方式中,当目标时间序列预测模型为融合贝叶斯估计的时间序列预测模型时,服务器可以通过以下方式训练该目标时间序列预测模型。具体的,融合贝叶斯估计的时间序列预测模型中可以包括编码网络、解码网络和线性网络,其中线性网络可以包括用于确定预测结果的结果预测结构、以及用于确定边缘分布波动参数的波动参数预测结构;优化训练该融合贝叶斯估计的时间序列预测模型(也即目标时间序列预测模型)时,可以先获取训练时间序列数据及其对应的标准数据变化结果,此处的训练时间序列数据即是通过步骤301获取的参考时间序列数据,训练时间序列数据对应的标准数据变化结果即是通过步骤302获取的参考时间序列数据对应的标准数据变化结果;然后,通过目标时间序列预测模型,根据训练时间序列数据,确定该训练时间序列数据对应的预测结果和预测边缘分布波动参数;进而,根据该训练时间序列数据对应的预测结果和标准数据变化结果,训练该目标时间序列预测模型中的编码网络和解码网络;完成对编码网络和解码网络的训练后,可以根据该训练时间序列数据对应的预测结果、预测边缘分布波动参数以及标准数据变化结果,训练该目标时间序列预测模型中的线性网络。
86.以所训练的目标时间序列预测模型为融合贝叶斯估计的transformer模型为例,该transformer模型包括编码网络、解码网络和线性网络;其中,编码网络和解码网络主要由自注意力机制以及前馈网络(也称为dense层)组成,自注意力机制的核心是格式为(query、key、value)的三元组,自注意力机制通过公式来计算输出,其中,query的计算方法为q=xwq,wq∈r
l
×d,key的计算方法为k=xwk,wk∈r
l
×d,value的计算方法为v=xwv,wv∈r
l
×d;其中,x为自注意力层的输入特征,d为输入特征x的维度大小,wq、wk和wv均为自注意力层的模型参数。更具体的,对于x的第j行元素,其对应的输出结果可以如式(1)所示:
87.88.其中,即为输入特征x的第j行元素对应的输出结果,qj为query的第j行元素,k
l
为key的第l行元素,v
l
为value的第l行元素。
89.通过自注意力层完成对于输入特征x的处理后,可以进一步利用dense层处理该自注意力层的输出结果。除了上述编码网络和解码网络外,本技术实施例还在融合贝叶斯估计的transformer模型中引入了两个线性结构,分别是用于生成边缘分布预测值的结果预测结构、以及用于生成边缘分布的波动参数(如边缘分布的标准差)的波动参数预测结构,该结果预测结构输出的结果即为所预测的边缘分布(也即所要得到的用于反映数据变化趋势的预测结果),该波动参数预测结构输出的结果记为边缘分布波动参数,该边缘分布波动参数用于辅助筛选优化训练目标时间序列预测模型时使用的参考时间序列数据。
90.训练上述目标时间序列预测模型时,服务器可以将训练时间序列数据输入该目标时间序列预测模型,该目标时间序列预测模型通过对输入的训练时间序列数据进行分析处理,可以通过线性网络中的结果预测结构输出该训练时间序列数据对应的预测结果,通过线性网络中的波动参数预测结构输入该训练时间序列数据对应的预测边缘分布波动参数,具体表现如式(2)所示:
[0091][0092]
测模型输出的边缘分布波动参数,f()表示目标时间序列预测模型,xi为输入目标时间序列预测模型的训练时间序列数据,ω为目标时间序列预测模型的模型参数。
[0093]
进而,可以分两阶段对该目标时间序列预测模型进行训练。
[0094]
在第一阶段,旨在调整目标时间序列预测模型中编码网络和解码网络的模型参数,以确保该编码网络和解码网络可以正确地捕获时间序列数据在不同时间范围内的依赖关系;应理解,捕获的依赖关系越好,目标时间序列预测模型输出的预测结果就越准确。在该第一阶段中,服务器可以根据训练时间序列数据对应的预测结果和标准数据变化结果,调整编码网络和解码网络的模型参数,具体的,可以以最小化预测结果与标准数据变化结果之间的损失作为目标,调整编码网络和解码网络的模型参数,此处例如可以采用式(3)所示的均方误差来构建损失函数:
[0095][0096]
其中,l
mse
为第一阶段构建的损失函数,d表示由各个训练时间序列数据及其各自对应的标准数据变化结果组成的训练样本集合,xi为第i个训练时间序列数据,yi为第i个训练时间序列数据对应的标准数据变化结果,为第i个训练时间序列数据对应的预测结果。
[0097]
在第二阶段,服务器不再对编码网络和解码网络的模型参数进行调整,只优化线性网络的模型参数,专注于学习如何预测边缘分布。具体的,服务器可以固定目标时间序列预测模型中编码网络和解码网络的模型参数;进而,以最大化标准数据变化结果在预测分
布上的高斯似然概率为目标,根据训练时间序列数据对应的预测结果、预测边缘分布波动参数和标准数据变化结果,调整线性网络的模型参数;此处的预测分布是根据训练时间序列数据对应的预测结果和预测边缘分布波动参数确定的。
[0098]
示例性的,可以假设标准数据变化结果是从多元高斯边缘分布中随机生成的,通过训练过程旨在最大化标准数据变化结果在预测分布上的高斯似然概率,该第二阶段的损失函数的构建方式具体如下式(5)和式(6)所示:
[0099][0100][0101]
其中,为标准数据变化结果在预测分布上的高斯似然概率,为基于预测结果和预测边缘分布波动参数构建的预测分布,lg为第二阶段构建的损失函数。
[0102]
如此,通过上述方式分两阶段优化训练融合贝叶斯估计的时间序列预测模型,有助于使该时间序列预测模型具备更好的模型性能,更准确地根据输入的时间序列数据预测其对应的数据变化趋势,同时更准确地预测边缘分布波动参数,也即更准确地确定时间序列预测模型输出的预测结果的可靠度。
[0103]
需要说明的是,上文介绍的对于目标时间序列预测模型的优化训练方式,同样也是对于该目标时间序列预测模型的初始训练方式,即初始训练目标时间序列预测模型时也可以采用上文介绍的方式,两个训练阶段的区别仅在于所使用的训练样本不同。优化训练目标时间序列预测模型时,使用的训练样本是通过步骤301和步骤302获取的参考时间序列数据及其对应的标准数据变化结果。初始训练目标时间序列预测模型时,使用的训练样本是服务器所构建的冷启动样本;例如,服务器可以从数据库中获取若干历史时间序列数据,并将所获取的每个历史时间序列数据拆分为两段时间序列数据,进而,将所对应的采集时段较靠前的时间序列数据作为训练时间序列数据,将所对应的时段较靠后的时间序列数据作为该训练时间序列数据对应的标准数据变化结果,如此构建得到初始训练目标时间序列预测模型使用的冷启动样本。
[0104]
服务器完成对于目标时间序列预测模型的优化训练后,可以将优化训练后的目标时间序列预测模型重新投入时间序列预测任务,使得该目标时间序列预测模型可以更好地处理其原本难以准确处理的时间序列数据、以及新增的时间序列预测任务下的时间序列数据。
[0105]
上述时间序列预测方法将迁移学习和增量学习联合起来,对支持跨任务的目标时间序列预测模型进行优化训练,从而使目标时间序列预测模型能更好地应对概念漂移问题,且更快地适应新的时间序列预测任务。具体的,该方法可以利用所对应的预测结果满足欠可靠条件的时间序列数据、及其对应的标准数据变化结果,对目标时间序列预测模型进
行优化训练,从而实现增量学习;通过增量学习,可以使目标时间序列预测模型更好地处理其原本难以准确处理的时间序列数据,当目标时间序列预测模型处理的时间序列数据的数据模式发生改变时,通过增量学习可以使目标时间序列预测模型及时具备准确处理数据模式改变后的时间序列数据的能力,从而有效地应对概念漂移问题。此外,该方法还可以在目标时间序列预测模型的当前模型参数的基础上,利用新增的时间序列预测任务下的时间序列数据、及其对应的标准数据变化结果,对该目标时间序列预测模型进行优化训练,如此实现迁移学习;相比重新训练新的适应于新增的时间序列预测任务的模型的方案,本技术通过迁移学习,可以使目标时间序列预测模型快速地具备执行新增的时间序列预测任务的能力,即使得目标时间序列预测模型快速地适应新增的时间序列预测任务。
[0106]
下面通过方法实施例对上文中的目标时间序列预测模型的应用方法进行详细介绍。
[0107]
参见图4,图4为本技术实施例提供的目标时间序列预测模型的应用方法的流程示意图。为了便于描述,下述实施例仍以该模型应用方法的执行主体为服务器为例进行介绍。如图4所示,该模型应用方法包括以下步骤:
[0108]
步骤401:对待处理的目标时间序列数据进行频率归一化处理,得到所述目标时间序列数据对应的标准频率时间序列数据;所述频率归一化处理用于将所述目标时间序列数据对应的原始采样频率转换为预设的标准采样频率。
[0109]
在本技术实施例中,服务器可以获取需要目标时间序列预测模型处理的目标时间序列数据,并对所获取的目标时间序列数据进行频率归一化处理,以将该目标时间序列数据对应的原始采样频率转换为预设的标准采样频率,得到该目标时间序列数据对应的标准频率时间序列数据。
[0110]
需要说明的是,本技术实施例将需要目标时间序列预测模型处理的时间序列数据,统一视为目标时间序列数据。目标时间序列数据对应的标准频率时间序列数据,是对该目标时间序列数据进行频率归一化处理后得到的对应于标准采样频率的时间序列数据。
[0111]
设置上述标准采样频率时,可以综合考虑以下三个问题:1)将高采样频率的时间序列数据(如采样时间间隔为1min的时间序列数据)转换为低采样频率的时间序列数据(如采样时间间隔为30min的时间序列数据)所带来的风险,与将低采样频率的时间序列数据转换为高采样频率的时间序列数据所带来的风险是否相同;将高采样频率的时间序列数据转换为低采样频率的时间序列数据时,会不可避免地产生信息丢失,设置标准采样频率时需要考虑该信息丢失所带来的损失是否导致难以满足使用对象的需求;将低采样频率的时间序列数据转换为高采样频率的时间序列数据时,需要增加虚假数据来填充该低采样频率的时间序列数据,设置标准采样频率时需要考虑所增加的虚假数据是否会影响目标时间序列预测模型的预测性能。2)高采样频率的时间序列数据对于目标时间序列预测模型的处理资源消耗,是否等同于低采样频率的时间序列数据对于目标时间序列预测模型的处理资源消耗;在输入的时间序列数据对应的时间窗口长度、与输出的预测结果对应的时间窗口长度一定的情况下,高采样频率的时间序列数据相比低采样频率的时间序列数据,会消耗目标时间序列预测模型更多的处理资源。3)在实际应用中,是否需要高预测采样频率的预测结果,在很多情况下,使用对象只需要预测结果能够描述时间序列数据对应的未来趋势,而不要求预测结果对应的预测采样频率与输入的时间序列数据的采样频率一致。
[0112]
综合考虑上述三个问题,可以设置一个合理的标准采样频率,以将目标时间序列预测模型所需处理的各目标时间序列数据均转换为该标准采样频率,同时,目标时间序列预测模型输出的预测结果的预测采样频率也将是该标准采样频率。示例性的,该标准采样频率对应的标准采样时间间隔可以为60min,本技术在此不对该标准采样频率做任何限定。
[0113]
在一种可能的实现方式中,服务器可以通过以下方式,对目标时间序列数据进行频率归一化处理:基于目标时间序列数据对应的原始采样间隔和预设的标准采样间隔之间的关系,将目标时间序列数据划分为多个子时间序列数据;针对每个子时间序列数据,利用目标聚合方法,对该子时间序列数据进行聚合处理,得到该子时间序列数据对应的聚合数据;进而,根据多个子时间序列数据各自对应的聚合数据,确定该目标时间序列数据对应的标准频率时间序列数据。
[0114]
示例性的,某目标时间序列数据对应的原始采样间隔为10min,标准采样频率对应的标准采样间隔为60min,则服务器对该目标时间序列数据进行频率归一化处理时,可以将该目标时间序列数据等分为6个子时间序列数据。对于每个子时间序列数据,服务器可以采用使用对象选择的目标聚合方法,对该子时间序列数据进行聚合处理,得到该子时间序列数据对应的聚合数据;例如,使用对象可以在服务器为其提供的多种聚合方法中选择目标聚合方法,服务器提供的聚合方法可以包括平均值聚合法、中位数聚合法、5%分位数聚合法、95%分位数聚合法等等;以使用对象选择的目标聚合法为平均值聚合法为例,对于每个子时间序列数据,服务器可以计算该子时间序列数据包括的各数据的均值,作为该子时间序列数据对应的聚合数据。进而,服务器可以按照各子时间序列数据原本在目标时间序列数据中的排列顺序,相应地排列各子时间序列数据各自对应的聚合数据,从而得到该目标时间序列数据对应的标准频率时间序列数据,该标准频率时间序列数据即对应于标准采样频率。
[0115]
如此,通过上述方式对目标时间序列数据进行频率归一化处理,可以更好地保留目标时间序列数据原本的信息,尽可能地减少因频率归一化处理所带来的信息损失。
[0116]
在一种可能的实现方式中,本技术实施例中的目标时间序列预测模型可以用于执行基于实时数据流的时间序列预测任务,所谓实时数据流可以理解为原始采样频率高于一定频率的时间序列数据,在本技术实施例中,可以将原始采样频率高于上述标准采样频率的时间序列数据视为实时数据流。为了保证基于实时数据流的时间序列预测任务的实时性,可以利用在线线程支持目标时间序列预测模型的运行,在线线程相比离线线程具有更快的响应速度。
[0117]
在该种情况下,服务器可以先判断所需处理的目标时间序列数据对应的原始采样频率是否低于标准采样频率;若是,则调用由离线线程支持运行的参考时间序列预测模型,根据目标时间序列数据,确定该目标时间序列数据对应的预测结果;若否,则执行对待处理的目标时间序列数据进行频率归一化处理,得到该目标时间序列数据对应的标准频率时间序列数据。
[0118]
具体的,对于所对应的原始采样频率低于标准采样频率的目标时间序列数据,服务器可以将其视为非实时数据流,考虑到基于非实时数据流的时间序列预测任务对于实时性的要求通常较低,因此,可以调用由离线线程支持运行的参考时间序列预测模型对该目标时间序列数据进行处理,确定该目标时间序列数据对应的预测结果。需要说明的是,由离
线线程支持运行的参考时间序列预测模型的工作原理,与由在线线程支持运行的目标时间序列预测模型的工作原理相同,二者的区别仅在于所处理的时间序列数据对应的采样频率,本技术实施例中介绍的目标时间序列预测模型的应用过程同样适用于参考时间序列预测模型。
[0119]
对于所对应的原始采样频率高于或者等于标准采样频率的目标时间序列数据,服务器可以将其视为实时数据流,考虑到基于实时数据流的时间序列预测任务对于实时性的要求通常较高,因此,可以执行上述步骤401对该目标时间序列数据进行频率归一化处理,以便后续利用由在线线程支持运行的目标时间序列预测模型处理该目标时间序列数据。
[0120]
如此,区分基于实时数据流的时间序列预测任务和基于非实时数据流的时间序列预测任务,利用由在线线程支持运行的目标时间序列预测模型执行基于实时数据流的时间序列预测任务,利用由离线线程支持运行的参考时间序列预测模型执行基于非实时数据流的时间序列预测任务,可以更好地利用处理资源,利用在线资源处理对于实时性要求较高的时间序列预测任务,利用离线资源处理对于实时性要求较低的时间序列预测任务,避免在线资源被浪费。
[0121]
步骤402:对所述标准频率时间序列数据进行标准化处理,得到标准化输入数据。
[0122]
服务器通过对目标时间序列数据进行频率归一化处理,得到该目标时间序列数据对应的标准频率时间序列数据后,可以进一步对该标准频率时间序列数据进行标准化处理,从而得到目标时间序列预测模型支持处理的标准化输入数据。
[0123]
在一种可能的实现方式中,服务器可以通过以下方式对标准频率时间序列数据进行标准化处理:确定目标时间序列数据对应的均值和波动参数;然后,基于该目标时间序列数据对应的均值和波动参数,将标准频率时间序列数据映射至标准正态分布上,从而得到标准化输入数据。
[0124]
具体的,服务器可以根据目标时间序列数据中包括的各个数据,确定该目标时间序列数据对应的均值和波动参数;此处的均值例如可以是对目标时间序列数据中包括的各个数据进行求平均处理得到的,此处的波动参数例如可以是根据目标时间序列数据中包括的各个数据确定的方差或标准差。进而,服务器可以根据该目标时间序列数据对应的均值和波动参数,构建标准正态分布,并将对该目标时间序列数据进行频率归一化处理得到的标准频率时间序列数据映射到该标准正态分布上,如此即可得到目标时间序列预测模型支持处理的标准化输入数据。
[0125]
由于目标时间序列预测模型可以处理不同业务场景、来自不同数据源的时间序列数据,为了保证该目标时间序列预测模型可以可靠地处理各类时间序列数据,可以通过上述方式对各类时间序列数据依次做频率归一化处理和标准化处理,从而规范原始的时间序列数据,使目标时间序列预测模型实际处理的数据更标准,更有利于该目标时间序列预测模型准确预测对应的预测结果。
[0126]
步骤403:通过所述目标时间序列预测模型,根据所述标准化输入数据,确定标准化预测结果。
[0127]
服务器通过对目标时间序列数据进行上述频率归一化处理和标准化处理,得到该目标时间序列数据对应的标准化数据后,可以将该标准化数据输入目标时间序列预测模型,目标时间序列预测模型通过对该标准化数据进行分析处理,可以相应地输出标准化预
测结果,该标准化预测结果是目标时间序列预测模型输出的、符合特定规范的预测结果。
[0128]
应理解,当目标时间序列预测模型为融合贝叶斯估计的时间序列预测模型时,该目标时间序列预测模型除了会输出标准化预测结果外,还会输出边缘分布波动参数。
[0129]
步骤404:对所述标准化预测结果进行去标准化处理,得到所述目标时间序列数据对应的预测结果。
[0130]
进而,服务器可以对目标时间序列预测模型输出的标准化预测结果进行去标准化处理,以得到更具实际应用价值的预测结果。
[0131]
在一种可能的实现方式中,服务器可以通过以下方式对标准化预测结果进行去标准化处理:基于目标时间序列数据对应的均值和波动参数,将该标准化预测结果映射回标准化输入数据的分布,从而得到预测结果。
[0132]
具体的,对于标准化预测结果的去标准化处理,本质上是对于标准频率时间序列数据的标准化处理的逆过程;对该标准化预测结果进行去标准化处理时,可以基于目标时间序列数据对应的均值和波动参数,确定标准化输入数据的分布,也即对标准频率时间序列数据做标准化处理时使用的标准正态分布;进而,将目标时间序列预测模型输出的标准化预测结果映射回该标准化输入数据的分布,得到目标时间序列数据对应的预测结果。
[0133]
上述目标时间序列预测模型的应用方法,可以将对应于不同采样频率的目标时间序列数据统一转换为具有标准采样频率的标准频率时间序列数据,从而可以保证目标时间序列预测模型可以在多种对应不同采样频率的时间序列预测任务中共享。此外,对标准频率时间序列数据进行标准化处理,可以更好地保证目标时间序列预测模型的处理性能,使得目标时间序列预测模型可以准确更规范的时间序列数据;同时,对目标时间序列预测模型输出的标准化预测结果进行去标准化处理,可以保证最终得到的预测结果符合实际的应用需求。
[0134]
为了便于进一步理解本技术实施例提供的时间序列预测方法,下面结合图5和图6所示的时间序列预测方法的实现框架,对该时间序列预测方法进行整体示例性介绍。
[0135]
图5所示为融合贝叶斯估计的transformer模型(即上文中的目标时间序列预测模型)执行时间序列预测任务的实现框架。如图5所示,为了兼容处理多种采样频率下的时间序列数据,本技术实施例设计了频率归一化模块,该频率归一化模块用于将具有不同采样频率的时间序列数据转换为具有标准采样频率的时间序列数据。考虑到不同时间序列预测任务下的时间序列数据的尺度不同,在将时间序列数据输入transformer模型之前,可以先对时间序列数据进行标准化处理,以将不同取值区间的时间序列数据均映射到同一取值区间。进而,采用融合贝叶斯估计的transformer模型进行时间序列预测,得到标准化预测结果。最终,再通过对标准化预测结果进行去标准化处理,转换得到原始尺度的时间序列数据。
[0136]
图6中(a)所示为生产环境下的离线系统架构。目标时间序列预测模型的离线训练在机器学习平台上执行。在训练过程中,可以使用迁移学习以及增量学习来优化目标时间序列预测模型的模型参数。具体的,机器学习平台会存储该目标时间序列预测模型在先前训练阶段的模型参数,优化训练目标时间序列预测模型时,可以基于迁移学习将目标时间序列预测模型先前学习到的知识迁移到当前训练阶段;此外,优化训练目标时间序列预测模型时,机器学习平台还会加载此前所有阶段的反馈样本(即目标时间序列预测模型难以
准确处理的时间序列数据),进而基于增量学习利用这些反馈样本对目标时间序列预测模型进行优化训练,以保证该目标时间序列预测模型的长期性能。优化训练后的目标时间序列预测模型将作为计算平台中自动更新的预测服务节点进行发布。
[0137]
图6中(b)所示为生产环境下的基于事件驱动的在线系统架构。在该在线系统架构中,通过计算平台和监测平台的联动,实现了及时响应使用对象的需求的目标。具体的,计算平台可以为使用对象提供多种组件,以支持相关数据处理操作,时间序列预测服务即为该计算平台中的一个独立节点,其可以为使用对象提供时间序列预测能力;目标时间序列预测模型在离线环境中优化并更新后,在线系统架构中的时间序列预测服务也会自动更新。监测平台用于接收使用对象的事件驱动输入,当使用对象想要使用计算平台上的时间序列预测服务执行新的时间序列预测任务时,使用对象只需触控监测平台上的相关控件,计算平台即会自动创建对应的时间序列预测任务,最终,监测平台可以通过查询预测结果数据,为使用对象呈现时间序列的历史观测值和未来变化趋势。
[0138]
下面对上述频率归一化模块的工作原理进行详细介绍。
[0139]
频率归一化处理旨在将对应不同的原始采样频率时间序列数据均转换为对应标准采样频率的时间序列数据,设计该频率归一化模块对应的频率归一化策略时,可以综合考虑以下三个问题:1)将高采样频率的时间序列数据(如采样时间间隔为1min的时间序列数据)转换为低采样频率的时间序列数据(如采样时间间隔为30min的时间序列数据)所带来的风险,与将低采样频率的时间序列数据转换为高采样频率的时间序列数据所带来的风险是否相同;将高采样频率的时间序列数据转换为低采样频率的时间序列数据时,会不可避免地产生信息丢失,设置标准采样频率时需要考虑该信息丢失所带来的损失是否导致难以满足使用对象的需求;将低采样频率的时间序列数据转换为高采样频率的时间序列数据时,需要增加虚假数据来填充该低采样频率的时间序列数据,设置标准采样频率时需要考虑所增加的虚假数据是否会影响目标时间序列预测模型的预测性能。2)高采样频率的时间序列数据对于目标时间序列预测模型的处理资源消耗,是否等同于低采样频率的时间序列数据对于目标时间序列预测模型的处理资源消耗;在输入的时间序列数据对应的时间窗口长度、与输出的预测结果对应的时间窗口长度一定的情况下,高采样频率的时间序列数据相比低采样频率的时间序列数据,会消耗目标时间序列预测模型更多的处理资源。3)在实际应用中,是否需要高预测采样频率的预测结果,在很多情况下,使用对象只需要预测结果能够描述时间序列数据对应的未来趋势,而不要求预测结果对应的预测采样频率与输入的时间序列数据的采样频率一致。出于对上述问题的综合考虑,可以设置一个标准采样频率,将不同原始采样频率的时间序列数据归一化到该标准采样频率,仍可以满足使用对象的需求。
[0140]
示例性的,本技术实施例可以将各时间序列数据归一化为采样时间间隔为60min的时间序列数据。对时间序列数据进行频率归一化处理时,可以根据使用对象自身选择的聚合方法(包括平均值聚合法、中位数聚合法、5%分位数聚合法、95%分位数聚合法等等),对时间序列数据进行频率归一化处理。此外,考虑到工业环境中基于实时数据流的时间序列预测任务与基于非实时数据流的时间序列预测任务之间存在明显的差异,而本技术侧重于执行基于实时数据流的时间序列预测任务,因此,对于采样频率低于标准采样频率的时间序列数据,可以使用离线的时间序列预测模型执行对应的时间序列预测任务。
[0141]
下面对上述融合贝叶斯估计的transformer模型进行详细介绍。
[0142]
为了生成时间序列数据的预测边缘分布,本技术实施例基于贝叶斯估计优化了transformer模型的网络架构,优化后的transformer模型包括编码网络、解码网络和线性网络。编码网络和解码网络主要由自注意力机制以及前馈网络(也称为dense层)组成,自注意力机制的核心是格式为(query、key、value)的三元组,自注意力机制通过公式来计算输出,其中,query的计算方法为q=xwq,wq∈r
l
×d,key的计算方法为k=xwk,wk∈r
l
×d,value的计算方法为v=xwv,wv∈r
l
×d;其中,x为自注意力层的输入特征,d为输入特征x的维度大小,wq、wk和wv均为自注意力层的模型参数。更具体的,对于x的第j行元素,其对应的输出结果可以如下式所示:
[0143][0144]
其中,即为输入特征x的第j行元素对应的输出结果,qj为query的第j行元素,k
l
为key的第l行元素,v
l
为value的第l行元素。
[0145]
通过自注意力层完成对于输入特征x的处理后,可以进一步利用dense层处理该自注意力层的输出结果。除了上述编码网络和解码网络外,本技术实施例还在transformer模型中引入了两个线性结构,分别是用于生成边缘分布预测值的结果预测结构、以及用于生成边缘分布的标准差的波动参数预测结构,所预测的边缘分布预测值将呈现给使用对象以供决策,所预测的边缘分布标准差将用于选择增量学习的训练样本。
[0146]
为了训练上述transformer模型,本技术实施例引入了两阶段模型训练。在第一阶段,旨在调整编码网络和解码网络的模型参数,以确保该编码网络和解码网络可以正确地捕获时间序列数据在不同时间范围内的依赖关系,捕获的依赖关系越好,transformer模型输出的预测结果就越准确。因此,需要最小化预测结果与真实值(即标准数据变化结果)之间的损失,此处可以采用均方误差作为损失函数,如下式所示:
[0147][0148][0149]
其中,为transformer模型输出的预测结果,为transformer模型输出的边缘分布波动参数,xi为输入transformer模型的时间序列数据,ω为transformer模型的模型参数。l
mse
为第一阶段构建的损失函数,d表示由各个时间序列数据及其各自对应的真实值组成的训练样本集合。
[0150]
在第二阶段,不再对编码网络和解码网络的模型参数进行调整,只优化线性网络的模型参数,专注于学习如何预测边缘分布。具体的,可以假设真实值是从多元高斯边缘分
布中随机生成的,通过训练过程旨在最大化真实值在预测分布上的高斯似然概率,该第二阶段的损失函数的构建方式具体如下式所示:
[0151][0152][0153]
在上述训练过程中,如果transformer模型的预测结果相对准确,那么其输出的预测结果接近真实值,在这种情况下,预测的边缘分布标准差越低,高斯似然概率越高,反之,当transformer模型不能准确预测时,需要一个较高的边缘分布标准差来最大化高斯似然概率。总之,该边缘分布标准差可以表征transformer模型预测结果的不确定性。
[0154]
下面对基于迁移学习和增量学习的模型训练过程进行详细介绍。
[0155]
为了实现模型优化和模型可迁移性的目标,本技术实施例使用了迁移学习和增量学习进一步对transformer模型进行优化训练。发布在计算平台上的用于执行时间序列预测任务的初始transformer模型,可以是基于冷启动样本预训练得到的模型,该模型可能无法满足不同使用对象的真实需求,例如,该初始transformer模型可以是基于预测时间窗口长度为1天的样本训练得到的,而使用对象实际希望预测时间窗口为7天的数据变化趋势。将该transformer模型应用于新增的时间序列预测任务后,该新增的时间序列预测任务下的时间序列数据可以被存储到机器学习平台,用于后续优化训练该transformer模型,即采用迁移学习来微调该transformer模型。此外,为了避免概念漂移的风险,保证transformer模型的长期预测性能,本技术实施例还基于增量学习,利用该transformer此前难以准确处理的反馈样本,对该transformer进行优化训练,此处transformer此前难以准确处理的反馈样本可以是所对应的边缘分布标准差较高的时间序列数据。基于迁移学习的模型训练可以保证在不同业务场景下学习到的知识之间进行迁移,基于增量学习的模型优化可以应对工业生产环境下的概念漂移问题,保证模型的长期效果。
[0156]
本技术实施例通过比较基线模型(原始的transformer模型)和微调模型(基于迁移学习优化训练的transformer模型)的预测效果,来评估迁移学习带来的效果增益,本技术实施例具体使用平均绝对误差(mean absolute error,mae)和均方误差(mean squared error,mse)来评估模型的预测效果。更具体的,基线模型用于预测游戏业务a的预测窗口大小分别为1天、3天和7天的时间序列数据;评估模型的预测效果时,先直接使用该基线模型,预测来自游戏业务b的预测窗口分别为1天、3天和7天的样本,得到预测结果;再使用来自游戏业务b的少量样本对该基线模型进行微调,并利用该微调后的模型重新预测来自游戏业务b的样本,得到预测结果。上述实验产生的对比结果如图7所示,通过图7可以发现,基线模型在各种预测窗口的场景中的mae和mse都相对较差,可见,如果没有通过迁移学习进行模型的微调,时间序列预测模型难以在不同的游戏业务中共享。
[0157]
本技术实施例通过比较基线模型(原始的transformer模型)和优化模型(基于增量学习优化训练的transformer模型)的预测效果,来评估增量学习带来的效果增益。具体
的,基线模型用于预测游戏业务a的预测窗口大小分别为1天、3天和7天的时间序列数据,其使用游戏业务a前45天随机筛选的样本对其进行微调,以利用其来预测游戏业务a的后15天的全量样本;优化模型采用了本技术实施例提供的方式,从游戏业务a前45天产生的样本中选择具有代表性的历史样本进行模型微调。上述实验产生的对比结果如图8所示,通过图8可以发现,基线模型在各种预测窗口的场景中,随着时间的推移预测性能变得越来越差,而优化模型具备更好且更稳定的性能。
[0158]
需要说明的是,本技术实施例提供的时间序列预测方法可以应用于各种存在时间序列预测需求的场景,例如游戏场景、云服务场景、网络运维场景、交通场景、金融场景、气候预测场景等等。
[0159]
示例性的,当本技术实施例提供的时间序列预测方法应用于游戏场景中时,目标时间序列预测模型可以根据多种游戏业务下产生的时间序列数据,相应地预测该时间序列数据对应的未来变化趋势;利用该目标时间序列预测模型处理每种游戏业务下的时间序列数据前,可以先对所需处理的时间序列数据进行频率归一化处理,以将该时间序列数据对应的采样频率转换为预设的标准采样频率,然后再对该时间序列数据进行标准化处理;进而,再利用目标时间序列预测模型处理经上述处理后得到的数据,从而得到对应的预测结果。此外,还可以利用该目标时间序列预测模型难以准确处理的游戏业务下的时间序列数据,对该目标时间序列预测模型进行优化训练;以及,利用在新增的游戏业务下产生的时间序列数据,对该目标时间序列预测模型进行优化训练。应理解,上述游戏业务下产生的时间序列数据可以包括但不限于:游戏后台服务器的运行指标数据、游戏业务下的使用对象产生的游戏数据等。
[0160]
示例性的,当本技术实施例提供的时间序列预测方法应用于云服务场景中时,目标时间序列预测模型可以根据多种云服务下产生的时间序列数据,相应地预测该时间序列数据对应的未来变化趋势;利用该目标时间序列预测模型处理每种云服务下的时间序列数据前,可以先对所需处理的时间序列数据进行频率归一化处理,以将该时间序列数据对应的采样频率转换为预设的标准采样频率,然后再对该时间序列数据进行标准化处理;进而,再利用目标时间序列预测模型处理经上述处理后得到的数据,从而得到对应的预测结果。此外,还可以利用该目标时间序列预测模型难以准确处理的云服务下的时间序列数据,对该目标时间序列预测模型进行优化训练;以及,利用在新增的云服务下产生的时间序列数据,对该目标时间序列预测模型进行优化训练。应理解,上述云服务下产生的时间序列数据可以包括但不限于:云服务管理指标数据、云服务的后台服务器的运行指标数据、云服务下的使用对象产生的相关数据等。
[0161]
应理解,当本技术实施例提供的时间序列预测方法应用于其它场景中时,其实现原理与该时间序列预测方法在游戏场景和云服务中的实现原理相类似,区别仅在于所需处理的时间序列数据的类型可能不同,此处不再进行赘述。
[0162]
针对上文描述的时间序列预测方法,本技术还提供了对应的时间序列预测装置,以使上述时间序列预测方法在实际中得以应用及实现。
[0163]
参见图9,图9是与上文图3所示的时间序列预测方法对应的一种时间序列预测装置900的结构示意图。如图9所示,该时间序列预测装置900包括:
[0164]
数据获取模块901,用于获取目标时间序列预测模型处理过的参考时间序列数据;
所述参考时间序列数据包括:对应的预测结果满足欠可靠条件的时间序列数据、以及新增的时间序列预测任务下的时间序列数据中的至少一种;
[0165]
结果获取模块902,用于获取每个所述参考时间序列数据对应的标准数据变化结果;所述标准数据变化结果用于表征其对应的参考时间序列数据的后续实际变化趋势;
[0166]
优化训练模块903,用于在所述目标时间序列预测模型的当前模型参数的基础上,基于各个所述参考时间序列数据及其各自对应的标准数据变化结果,对所述目标时间序列预测模型进行优化训练,并将优化训练后的所述目标时间序列预测模型投入时间序列预测任务。
[0167]
可选的,当所述目标时间序列预测模型为融合贝叶斯估计的时间序列预测模型时,所述数据获取模块901具体用于:
[0168]
获取各个候选时间序列数据各自对应的边缘分布波动参数;所述候选时间序列数据为所述目标时间序列预测模型处理过的时间序列数据;所述边缘分布波动参数为所述目标时间序列预测模型输出的参数,用于表征所述目标时间序列预测模型根据其对应的候选时间序列数据确定的预测结果的可靠度;
[0169]
根据各个所述候选时间序列数据各自对应的边缘分布波动参数,选择所对应的边缘分布波动参数满足预设波动条件的候选时间序列数据,作为所述参考时间序列数据。
[0170]
可选的,所述目标时间序列预测模型包括编码网络、解码网络以及线性网络;所述线性网络包括用于确定预测结果的结果预测结构、以及用于确定边缘分布波动参数的波动参数预测结构;所述优化训练模块903具体用于:
[0171]
获取训练时间序列数据及其对应的标准数据变化结果;
[0172]
通过待训练的目标时间序列预测模型,根据所述训练时间序列数据,确定所述训练时间序列数据对应的预测结果和预测边缘分布波动参数;
[0173]
根据所述训练时间序列数据对应的预测结果和标准数据变化结果,训练所述目标时间序列预测模型中的所述编码网络和所述解码网络;
[0174]
完成对所述编码网络和所述解码网络的训练后,根据所述训练时间序列数据对应的预测结果、预测边缘分布波动参数以及标准数据变化结果,训练所述目标时间序列预测模型中的所述线性网络。
[0175]
可选的,所述优化训练模块903具体用于:
[0176]
固定所述目标时间序列预测模型中所述编码网络和所述解码网络的模型参数;
[0177]
以最大化所述标准数据变化结果在预测分布上的高斯似然概率为目标,根据所述训练时间序列数据对应的预测结果、预测边缘分布波动参数和标准数据变化结果,调整所述线性网络的模型参数;所述预测分布是根据所述训练时间序列数据对应的预测结果和预测边缘分布波动参数确定的。
[0178]
可选的,所述数据获取模块901具体用于:
[0179]
获取各个候选时间序列数据各自对应的预测结果和标准数据变化结果;所述候选时间序列数据为所述目标时间序列预测模型处理过的时间序列数据;
[0180]
针对每个所述候选时间序列数据,确定其对应的预测结果与标准数据变化结果之间的差异,作为所述候选时间序列数据对应的预测差异;
[0181]
根据各个所述候选时间序列数据各自对应的预测差异,选择所对应的预测差异满
足预设差异条件的候选时间序列数据,作为所述参考时间序列数据。
[0182]
可选的,所述数据获取模块901具体用于:
[0183]
获取所述目标时间序列预测模型处理过的、关联有目标驱动事件的时间序列数据,作为所述参考时间序列数据;所述目标驱动事件是调用所述目标时间序列预测模型执行新增的时间序列预测任务时产生的。
[0184]
可选的,所述数据获取模块901具体用于:
[0185]
获取候选时间序列数据对应的反馈结果;所述候选时间序列数据为所述目标时间序列预测模型处理过的时间序列数据;所述反馈结果是使用对象为所述候选时间序列数据对应的预测结果给出的评价信息,用于表征所述使用对象对于所述预测结果的满意度;
[0186]
根据所述候选时间序列数据对应的反馈结果,选择所对应的反馈结果不满足预设满意条件的候选时间序列数据,作为所述参考时间序列数据。
[0187]
可选的,所述装置还包括模型应用模块,所述模型应用模块用于:
[0188]
对待处理的目标时间序列数据进行频率归一化处理,得到所述目标时间序列数据对应的标准频率时间序列数据;所述频率归一化处理用于将所述目标时间序列数据对应的原始采样频率转换为预设的标准采样频率;
[0189]
对所述标准频率时间序列数据进行标准化处理,得到标准化输入数据;
[0190]
通过所述目标时间序列预测模型,根据所述标准化输入数据,确定标准化预测结果;
[0191]
对所述标准化预测结果进行去标准化处理,得到所述目标时间序列数据对应的预测结果。
[0192]
可选的,所述模型应用模块具体用于:
[0193]
基于所述目标时间序列数据对应的原始采样间隔和预设的标准采样间隔之间的关系,将所述目标时间序列数据划分为多个子时间序列数据;
[0194]
针对每个所述子时间序列数据,利用目标聚合方法,对所述子时间序列数据进行聚合处理,得到所述子时间序列数据对应的聚合数据;
[0195]
根据所述多个子时间序列数据各自对应的聚合数据,确定所述目标时间序列数据对应的标准频率时间序列数据。
[0196]
可选的,所述目标时间序列预测模型由在线线程支持运行;所述模型应用模块还用于:
[0197]
判断所述目标时间序列数据对应的原始采样频率是否低于所述标准采样频率;
[0198]
若是,则调用由离线线程支持运行的参考时间序列预测模型,根据所述目标时间序列数据,确定所述目标时间序列数据对应的预测结果;
[0199]
若否,则执行所述对待处理的目标时间序列数据进行频率归一化处理,得到所述目标时间序列数据对应的标准频率时间序列数据。
[0200]
可选的,所述模型应用模块具体用于:
[0201]
确定所述目标时间序列数据对应的均值和波动参数;基于所述目标时间序列数据对应的均值和波动参数,将所述标准频率时间序列数据映射至标准正态分布上,得到所述标准化输入数据;
[0202]
基于所述目标时间序列数据对应的均值和波动参数,将所述标准化预测结果映射
回所述标准化输入数据的分布,得到所述预测结果。
[0203]
上述时间序列预测装置将迁移学习和增量学习联合起来,对支持跨任务的目标时间序列预测模型进行优化训练,从而使目标时间序列预测模型能更好地应对概念漂移问题,且更快地适应新的时间序列预测任务。具体的,该装置可以利用所对应的预测结果满足欠可靠条件的时间序列数据、及其对应的标准数据变化结果,对目标时间序列预测模型进行优化训练,从而实现增量学习;通过增量学习,可以使目标时间序列预测模型更好地处理其原本难以准确处理的时间序列数据,当目标时间序列预测模型处理的时间序列数据的数据模式发生改变时,通过增量学习可以使目标时间序列预测模型及时具备准确处理数据模式改变后的时间序列数据的能力,从而有效地应对概念漂移问题。此外,该装置还可以在目标时间序列预测模型的当前模型参数的基础上,利用新增的时间序列预测任务下的时间序列数据、及其对应的标准数据变化结果,对该目标时间序列预测模型进行优化训练,如此实现迁移学习;相比重新训练新的适应于新增的时间序列预测任务的模型的方案,本技术通过迁移学习,可以使目标时间序列预测模型快速地具备执行新增的时间序列预测任务的能力,即使得目标时间序列预测模型快速地适应新增的时间序列预测任务。
[0204]
本技术实施例还提供了一种用于预测时间序列的计算机设备,该计算机设备具体可以是终端设备或者服务器,下面将从硬件实体化的角度对本技术实施例提供的终端设备和服务器进行介绍。
[0205]
参见图10,图10是本技术实施例提供的终端设备的结构示意图。如图10所示,为了便于说明,仅示出了与本技术实施例相关的部分,具体技术细节未揭示的,请参照本技术实施例方法部分。该终端可以为包括手机、平板电脑、个人数字助理(personal digital assistant,pda)、销售终端(point of sales,pos)、车载电脑等任意终端设备,以终端为计算机为例:
[0206]
图10示出的是与本技术实施例提供的终端相关的计算机的部分结构的框图。参考图10,计算机包括:射频(radio frequency,rf)电路1010、存储器1020、输入单元1030(其中包括触控面板1031和其他输入设备1032)、显示单元1040(其中包括显示面板1041)、传感器1050、音频电路1060(其可以连接扬声器1061和传声器1062)、无线保真(wireless fidelity,wifi)模块1070、处理器1080、以及电源1090等部件。本领域技术人员可以理解,图10中示出的计算机结构并不构成对计算机的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
[0207]
存储器1020可用于存储软件程序以及模块,处理器1080通过运行存储在存储器1020的软件程序以及模块,从而执行计算机的各种功能应用以及数据处理。存储器1020可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据计算机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器1020可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
[0208]
处理器1080是计算机的控制中心,利用各种接口和线路连接整个计算机的各个部分,通过运行或执行存储在存储器1020内的软件程序和/或模块,以及调用存储在存储器1020内的数据,执行计算机的各种功能和处理数据。可选的,处理器1080可包括一个或多个
处理单元;优选的,处理器1080可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器1080中。
[0209]
在本技术实施例中,该终端所包括的处理器1080还用于执行本技术实施例提供的时间序列预测方法的任意一种实现方式的步骤。
[0210]
参见图11,图11为本技术实施例提供的一种服务器1100的结构示意图。该服务器1100可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processing units,cpu)1122(例如,一个或一个以上处理器)和存储器1132,一个或一个以上存储应用程序1142或数据1144的存储介质1130(例如一个或一个以上海量存储设备)。其中,存储器1132和存储介质1130可以是短暂存储或持久存储。存储在存储介质1130的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1122可以设置为与存储介质1130通信,在服务器1100上执行存储介质1130中的一系列指令操作。
[0211]
服务器1100还可以包括一个或一个以上电源1126,一个或一个以上有线或无线网络接口1150,一个或一个以上输入输出接口1158,和/或,一个或一个以上操作系统,例如windows server
tm
,mac os x
tm
,unix
tm
,linux
tm
,freebsd
tm
等等。
[0212]
上述实施例中由服务器所执行的步骤可以基于该图11所示的服务器结构。
[0213]
其中,cpu 1122用于执行本技术实施例提供的时间序列预测方法的任意一种实现方式的步骤。
[0214]
本技术实施例还提供一种计算机可读存储介质,用于存储计算机程序,该计算机程序用于执行前述各个实施例所述的一种时间序列预测方法中的任意一种实施方式。
[0215]
本技术实施例还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行前述各个实施例所述的一种时间序列预测方法中的任意一种实施方式。
[0216]
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0217]
在本技术所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
[0218]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0219]
另外,在本技术各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单
元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0220]
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read-only memory,rom)、随机存取存储器(random access memory,ram)、磁碟或者光盘等各种可以存储计算机程序的介质。
[0221]
应当理解,在本技术中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“a和/或b”可以表示:只存在a,只存在b以及同时存在a和b三种情况,其中a,b可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。
[0222]
以上所述,以上实施例仅用以说明本技术的技术方案,而非对其限制;尽管参照前述实施例对本技术进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本技术各实施例技术方案的精神和范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1