一种资源量预估方法、装置、设备及存储介质与流程

文档序号:30937084发布日期:2022-07-30 01:20阅读:130来源:国知局
一种资源量预估方法、装置、设备及存储介质与流程

1.本发明实施例涉及人工智能技术领域,尤其涉及一种资源量预估方法、装置、设备及存储介质。


背景技术:

2.在供应链行业中,资源的采购量一直是一个重要话题。当采购的资源过多时,很容易产生资源损耗;当采购的资源过少时,很容易导致资源供应不足,以上情况均给门店造成一定损失。
3.门店通常基于各个资源的历史消耗数据,预估各个资源对应的资源量,作为各个资源对应的采购量。然而,如果仅仅根据历史消耗数据,预测各个资源对应的资源量,而不考虑影响其他因素,很容易导致预测的资源量不准确,进而无法准确地确定各个资源的采购量。


技术实现要素:

4.本技术实施例提供了一种资源量预估方法、装置、设备及存储介质,用于提高预测的资源量的准确性。
5.一方面,本技术实施例提供了一种资源量预估方法,该方法包括:
6.基于待预估资源的第一历史消耗数据和所述待预估资源的催化资源数据,确定所述待预估资源对应的目标特征数据;所述第一历史消耗数据是根据所述待预估资源在多个历史日期的消耗数据确定的,所述催化资源数据是根据所述待预估资源在未来预设时段内的催化资源确定的;
7.将所述目标特征数据输入集成学习模型,确定所述待预估资源在预测日期对应的候选数据量;
8.基于所述待预估资源的历史催化资源的催化结果,确定所述待预估资源的调整权重;
9.采用所述调整权重对所述候选数据量进行调整,确定所述待预估资源在所述预测日期对应的资源量。
10.可选地,所述基于待预估资源的第一历史消耗数据和所述待预估资源的催化资源数据,确定所述待预估资源对应的目标特征数据,包括:
11.确定所述待预估资源的第一历史消耗数据对应的第一特征数据、所述待预估资源的催化资源数据对应的第二特征数据、所述待预估资源的资源信息对应的第三特征数据、所述预测日期的预测数据对应的第四特征数据;
12.将所述第一特征数据、所述第二特征数据、所述第三特征数据以及所述第四特征数据合并,作为所述待预估资源对应的目标特征数据。
13.可选地,所述确定所述待预估资源的第一历史消耗数据对应的第一特征数据,包括:
14.基于多个目标滑动窗口内的子历史消耗数据,确定所述多个目标滑动窗口分别对应的第一维度的第一特征和第二维度的第一特征;所述多个目标滑动窗口内的子历史消耗数据是基于滑动窗口方式从所述第一历史消耗数据中确定的;
15.将所述多个目标滑动窗口分别对应的第一维度的第一特征和第二维度的第一特征,作为第一组特征数据;并将所述第一组特征数据作为所述待预估资源对应的第一特征数据。
16.可选地,所述将所述第一组特征数据作为所述待预估资源对应的第一特征数据之前,还包括:
17.基于所述第一历史消耗数据,确定当前日期对应的当日消耗数据以及多个比对日期各自对应的他日消耗数据;
18.基于所述当日消耗数据和多个他日消耗数据,确定每个比对日期对应的所述第一维度的第二特征和所述第二维度的第二特征;
19.将所述多个比对日期各自对应的第一维度的第二特征以及第二维度的第二特征,作为第二组特征数据;
20.所述将所述第一组特征数据作为所述待预估资源对应的第一特征数据,包括:
21.将所述第一组特征数据和所述第二组特征数据作为所述待预估资源对应的第一特征数据。
22.可选地,所述集成学习模型包括第一集成学习模型和第二集成学习模型;
23.所述将所述目标特征数据输入集成学习模型,确定所述待预估资源在预测日期对应的候选数据量之前,还包括:
24.确定所述待预估资源的历史平均消耗;
25.所述将所述目标特征数据输入集成学习模型,确定所述待预估资源在预测日期对应的候选数据量,包括:
26.若所述历史平均消耗小于消耗预设值,将所述目标特征数据输入所述第一集成学习模型,确定所述待预估资源在预测日期对应的候选数据量;
27.若所述历史平均消耗大于等于所述消耗预设值,将所述目标特征数据输入所述第二集成学习模型,确定所述待预估资源在预测日期对应的候选数据量。
28.可选地,所述第一集成学习模型和所述第二集成学习模型均为提升树模型;所述第一集成学习模型的损失函数为平均绝对百分比误差,所述第二集成学习模型的损失函数为平均绝对误差。
29.可选地,所述基于所述待预估资源的历史催化资源的催化结果,确定所述待预估资源的调整权重,包括:
30.根据所述历史催化资源对应的历史催化资源数据,从第二历史消耗数据中确定多个历史催化日期各自对应的资源消耗量,以及多个历史非催化日期各自对应的资源消耗量;
31.根据所述多个历史催化日期各自对应的资源消耗量,以及所述多个历史非催化日期各自对应的资源消耗量,确定所述待预估资源的调整权重。
32.一方面,本技术实施例提供了一种资源量预估装置,该装置包括:
33.特征数据确定模块,用于基于待预估资源的第一历史消耗数据和所述待预估资源
的催化资源数据,确定所述待预估资源对应的目标特征数据;所述第一历史消耗数据是根据所述待预估资源在多个历史日期的消耗数据确定的,所述催化资源数据是根据所述待预估资源在未来预设时段内的催化资源确定的;
34.预测模块,用于将所述目标特征数据输入集成学习模型,确定所述待预估资源在预测日期对应的候选数据量;
35.调整权重确定模块,用于基于所述待预估资源的历史催化资源的催化结果,确定所述待预估资源的调整权重;
36.调整模块,用于采用所述调整权重对所述候选数据量进行调整,确定所述待预估资源在所述预测日期对应的资源量。
37.可选地,所述特征数据确定模块具体用于:
38.确定所述待预估资源的第一历史消耗数据对应的第一特征数据、所述待预估资源的催化资源数据对应的第二特征数据、所述待预估资源的资源信息对应的第三特征数据、所述预测日期的预测数据对应的第四特征数据;
39.将所述第一特征数据、所述第二特征数据、所述第三特征数据以及所述第四特征数据合并,作为所述待预估资源对应的目标特征数据。
40.可选地,所述特征数据确定模块具体用于:
41.基于多个目标滑动窗口内的子历史消耗数据,确定所述多个目标滑动窗口分别对应的第一维度的第一特征和第二维度的第一特征;所述多个目标滑动窗口内的子历史消耗数据是基于滑动窗口方式从所述第一历史消耗数据中确定的;
42.将所述多个目标滑动窗口分别对应的第一维度的第一特征和第二维度的第一特征,作为第一组特征数据;并将所述第一组特征数据作为所述待预估资源对应的第一特征数据。
43.可选地,所述特征数据确定模块还用于:
44.所述将所述第一组特征数据作为所述待预估资源对应的第一特征数据之前,基于所述第一历史消耗数据,确定当前日期对应的当日消耗数据以及多个比对日期各自对应的他日消耗数据;
45.基于所述当日消耗数据和多个他日消耗数据,确定每个比对日期对应的所述第一维度的第二特征和所述第二维度的第二特征;
46.将所述多个比对日期各自对应的第一维度的第二特征以及第二维度的第二特征,作为第二组特征数据;
47.所述特征数据确定模块具体用于:
48.将所述第一组特征数据和所述第二组特征数据作为所述待预估资源对应的第一特征数据。
49.可选地,所述集成学习模型包括第一集成学习模型和第二集成学习模型;所述预测模块还用于:
50.所述将所述目标特征数据输入集成学习模型,确定所述待预估资源在预测日期对应的候选数据量之前,确定所述待预估资源的历史平均消耗;
51.所述预测模块具体用于:
52.若所述历史平均消耗小于消耗预设值,将所述目标特征数据输入所述第一集成学
习模型,确定所述待预估资源在预测日期对应的候选数据量;
53.若所述历史平均消耗大于等于所述消耗预设值,将所述目标特征数据输入所述第二集成学习模型,确定所述待预估资源在预测日期对应的候选数据量。
54.可选地,所述第一集成学习模型和所述第二集成学习模型均为提升树模型;所述第一集成学习模型的损失函数为平均绝对百分比误差,所述第二集成学习模型的损失函数为平均绝对误差。
55.可选地,所述调整权重确定模块具体用于:
56.根据所述历史催化资源对应的历史催化资源数据,从第二历史消耗数据中确定多个历史催化日期各自对应的资源消耗量,以及多个历史非催化日期各自对应的资源消耗量;
57.根据所述多个历史催化日期各自对应的资源消耗量,以及所述多个历史非催化日期各自对应的资源消耗量,确定所述待预估资源的调整权重。
58.一方面,本技术实施例提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述资源量预估方法的步骤。
59.一方面,本技术实施例提供了一种计算机可读存储介质,其存储有可由计算机设备执行的计算机程序,当所述程序在计算机设备上运行时,使得所述计算机设备执行上述资源量预估方法的步骤。
60.在本技术实施例中,资源量预估系统基于待预估资源的第一历史消耗数据和待预估资源的催化资源数据,确定待预估资源对应的目标特征数据,其中,第一历史消耗数据是根据待预估资源在多个历史日期的消耗数据确定的,催化资源数据是根据待预估资源在未来预设时段内的催化资源确定的。再将目标特征数据输入集成学习模型,确定待预估资源在预测日期对应的候选数据量。由于本技术中并不是仅仅根据待预估资源的第一历史消耗数据,确定待预估资源对应的目标特征数据,而是同时考虑了待预估资源的第一历史消耗数据和催化资源数据,因此,所确定的待预估资源对应的目标特征数据的内容更加丰富,集成学习模型所输出的候选数据量更加准确。
61.资源量预估系统再基于待预估资源的历史催化资源的催化结果,确定待预估资源的调整权重。然后,采用调整权重对候选数据量进行调整,确定待预估资源在预测日期对应的资源量。本技术中,通过调整权重,对候选数据量进行调整,使得所获得的待预估资源在预测日期对应的资源量更加准确。
附图说明
62.为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
63.图1为本技术实施例提供的一种系统架构示意图;
64.图2为本技术实施例提供的一种资源量预估方法的流程示意图;
65.图3为本技术实施例提供的一种确定调整权重方法的流程示意图;
66.图4为本技术实施例提供的一种确定第一特征数据方法的流程示意图;
67.图5为本技术实施例提供的一种资源量预估方法的流程示意图;
68.图6为本技术实施例提供的一种资源量预估装置的结构示意图;
69.图7为本技术实施例提供的一种计算机设备的结构示意图。
具体实施方式
70.为了使本发明的目的、技术方案及有益效果更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
71.参考图1,其为本技术实施例适用的一种资源量预估系统架构图,该资源量预估系统架构图至少包括终端设备101、资源量预估系统102。
72.终端设备101安装有用于资源量预估的目标应用,该应用可以是预先安装的客户端、网页版应用或嵌入在其他应用中的小程序等。终端设备101可以是智能手机、平板电脑、笔记本电脑、台式计算机等,但并不局限于此。
73.资源量预估系统102为目标应用的后台服务器,为目标应用提供服务。资源量预估系统102可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网路(content delivery network,cdn)、以及大数据和人工智能平台等基础云计算服务的云服务器。
74.终端设备101与资源量预估系统102可以通过有线或无线通信方式进行直接或间接地连接,本技术在此不做限制。
75.终端设备101响应用户的资源量预估操作,发送资源量预估指令至资源量预估系统102。资源量预估系统102接收资源量预估指令,基于待预估资源的第一历史消耗数据和待预估资源的催化资源数据,确定待预估资源对应的目标特征数据;其中,第一历史消耗数据是根据待预估资源在多个历史日期的消耗数据确定的,催化资源数据是根据待预估资源在未来预设时段内的催化资源确定的。再将目标特征数据输入集成学习模型,确定待预估资源在预测日期对应的候选数据量。然后,基于待预估资源的历史催化资源的催化结果,确定待预估资源的调整权重。最后,采用调整权重对候选数据量进行调整,确定待预估资源在预测日期对应的资源量。
76.基于图1所述的系统架构图,本技术实施例提供了一种资源量预估方法的流程,如图2所示,该方法的流程由图1所示的资源量预估系统102执行,包括以下步骤:
77.步骤s201,基于待预估资源的第一历史消耗数据和待预估资源的催化资源数据,确定待预估资源对应的目标特征数据。
78.具体地,待预估资源可以是不同门店出售的不同商品,如面包、鸡蛋等。
79.第一历史消耗数据是根据待预估资源在多个历史日期的消耗数据确定的。其中,消耗数据包括资源消耗量和资源价格。先确定待预估资源在每个历史日期各自对应的资源消耗量和资源价格,再将每个历史日期对应的资源消耗量和资源价格,组成第一历史消耗数据。
80.催化资源数据是根据待预估资源在未来预设时段内的催化资源确定的。其中,催
化资源数据至少包括以下一项:催化资源类型、催化持续时间、催化日期。
81.催化资源可以是促销活动、打折活动等。当催化资源为促销活动时,催化资源数据至少包括以下一项:促销活动类型、促销活动持续时间、促销活动日期、促销价格、赠品类型、赠品价格、赠品数量。
82.步骤s202,将目标特征数据输入集成学习模型,确定待预估资源在预测日期对应的候选数据量。
83.具体地,集成学习模型是根据训练集样本进行训练获得的。当训练集样本不同时,训练获得的集成学习模型可预估出不同的预测日期对应候选数据量。
84.预测日期可以是任意的未来日期,在此不做限定。
85.步骤s203,基于待预估资源的历史催化资源的催化结果,确定待预估资源的调整权重。
86.具体地,历史催化资源可以是历史促销活动、历史打折活动等。其中,历史催化资源和历史催化资源数据相对应,历史催化资源数据是根据待预估资源在历史预设时段内的历史催化资源确定的。历史催化资源数据至少包括以下一项:历史催化资源类型、历史催化持续时间、历史催化日期等。
87.当历史催化资源为历史促销活动时,历史催化资源数据至少包括以下一项:历史促销活动类型、历史促销活动持续时间、历史促销活动日期、历史促销价格、历史赠品类型、历史赠品价格、历史赠品数量。
88.可选地,确定待预估资源的调整权重,具体包括如图3所示的以下步骤:
89.步骤s301,根据历史催化资源对应的历史催化资源数据,从第二历史消耗数据中确定多个历史催化日期各自对应的资源消耗量,以及多个历史非催化日期各自对应的资源消耗量。
90.具体地,第二历史消耗数据是根据待预估资源在第一历史预设时段内的消耗数据确定的。其中,消耗数据包括资源消耗量和资源价格。
91.根据历史催化资源对应的历史催化资源数据,从第一历史预设时段内确定多个历史催化日期,并将第一历史预设时段内剩余的日期作为多个历史非催化日期。再从第二历史消耗数据中确定多个历史催化日期各自对应的资源消耗量,以及多个历史非催化日期各自对应的资源消耗量。
92.步骤s302,根据多个历史催化日期各自对应的资源消耗量,以及多个历史非催化日期各自对应的资源消耗量,确定待预估资源的调整权重。
93.具体地,根据多个历史催化日期各自对应的资源消耗量,确定多个历史催化日期对应的资源消耗量的均值,作为第一消耗量均值;根据多个历史非催化日期各自对应的资源消耗量,确定多个历史非催化日期对应的资源消耗量的均值,作为第二消耗量均值。最后,将第一消耗量均值与第二消耗量均值的比值,作为待预估资源的调整权重。
94.在本技术实施例中,根据历史催化资源对应的历史催化资源数据,确定待预估资源的调整权重,因此,确定调整权重时所依据的数据具有参考性,所确定的调整权重的准确性更高。
95.步骤s204,采用调整权重对候选数据量进行调整,确定待预估资源在预测日期对应的资源量。
96.具体地,本技术提供了以下两种可能的实施方式,确定待预估资源在预测日期对应的资源量:
97.第一种可能的实施方式,将调整权重乘以候选数据量,即可获得该待预估资源在预测日期对应的资源量。
98.第二种可能的实施方式,按照预设比例对调整权重进行修正,将修正后的调整权重乘以候选数据量,即可获得该待预估资源在预测日期对应的资源量。预设比例是根据待预估资源的催化资源和历史催化资源确定的。
99.在本技术实施例中,资源量预估系统基于待预估资源的第一历史消耗数据和待预估资源的催化资源数据,确定待预估资源对应的目标特征数据,其中,第一历史消耗数据是根据待预估资源在多个历史日期的消耗数据确定的,催化资源数据是根据待预估资源在未来预设时段内的催化资源确定的。再将目标特征数据输入集成学习模型,确定待预估资源在预测日期对应的候选数据量。由于本技术中并不是仅仅根据待预估资源的第一历史消耗数据,确定待预估资源对应的目标特征数据,而是同时考虑了待预估资源的第一历史消耗数据和催化资源数据,因此,所确定的待预估资源对应的目标特征数据的内容更加丰富,集成学习模型所输出的候选数据量更加准确。
100.资源量预估系统再基于待预估资源的历史催化资源的催化结果,确定待预估资源的调整权重。然后,采用调整权重对候选数据量进行调整,确定待预估资源在预测日期对应的资源量。本技术中,通过调整权重,对候选数据量进行调整,使得所获得的待预估资源在预测日期对应的资源量更加准确。
101.可选地,在上述步骤s201中,基于待预估资源的第一历史消耗数据和待预估资源的催化资源数据,确定待预估资源对应的目标特征数据,具体包括以下步骤:
102.先确定待预估资源的第一历史消耗数据对应的第一特征数据、待预估资源的催化资源数据对应的第二特征数据、待预估资源的资源信息对应的第三特征数据、预测日期的预测数据对应的第四特征数据。然后,将第一特征数据、第二特征数据、第三特征数据以及第四特征数据合并,作为待预估资源对应的目标特征数据。
103.具体地,待预估资源的催化资源数据至少包括以下一项:催化资源类型、催化持续时间、催化日期。将待预估资源的催化资源数据作为第二特征数据。
104.待预估资源的资源信息至少包括以下一项:资源分类、资源最大库存量、资源最小库存量、预设时间点对应的资源库存量、是否为畅销品类。将待预估资源的资源信息作为第三特征数据。
105.预测日期的预测数据为天气数据,天气数据可以通过天气预报获得。其中,天气数据至少包括以下一项:温度、湿度、风力、可见度。将预测日期的预测数据作为第四特征数据。
106.在本技术实施例中,通过待预估资源的第一历史消耗数据、待预估资源的催化资源数据、待预估资源的资源信息以及预测日期的预测数据,确定待预估资源对应的目标特征数据,提高了目标特征数据的多样性,有利于提高集成学习模型的输出的候选数据量的准确性。
107.可选地,针对确定待预估资源的第一历史消耗数据对应的第一特征数据,本技术实施例提供了以下两种可能的实施方式:
108.第一种可能的实施方式,包括以下步骤:
109.先基于多个目标滑动窗口内的子历史消耗数据,确定多个目标滑动窗口分别对应的第一维度的第一特征和第二维度的第一特征。其中,多个目标滑动窗口内的子历史消耗数据是基于滑动窗口方式从第一历史消耗数据中确定的。再将多个目标滑动窗口分别对应的第一维度的第一特征和第二维度的第一特征,作为第一组特征数据;并将第一组特征数据作为待预估资源对应的第一特征数据。
110.具体地,多个目标滑动窗口可以对应相同的窗口长度,也可以对应不同的窗口长度。针对多个目标滑动窗口,分别执行以下步骤:
111.先获取一个目标滑动窗口内的子历史消耗数据,其中,子历史消耗数据包括多个子历史日期各自对应的资源消耗量和资源价格,子历史日期为位于目标滑动窗口内的历史日期。将多个子历史日期各自对应的资源消耗量的均值、最大值、最小值、标准差、中位数作为第一维度的第一特征,将多个子历史日期各自对应的资源价格的均值、最大值、最小值、标准差、中位数作为第二维度的第一特征,即可确定该目标滑动窗口对应的第一维度的第一特征和第二维度的第一特征。
112.在本技术实施例中,通过确定多个目标滑动窗口对应的第一维度的第一特征和第二维度的第一特征,作为第一组特征数据,将第一组特征数据作为待预估资源对应的第一特征数据,可以有效地增加第一特征数据的多样性,有利于提高集成学习模型的输出的候选数据量的准确性。
113.第二种可能的实施方式,包括如图4所示的以下步骤:
114.步骤s401,基于多个目标滑动窗口内的子历史消耗数据,确定多个目标滑动窗口分别对应的第一维度的第一特征和第二维度的第一特征。
115.具体地,多个目标滑动窗口内的子历史消耗数据是基于滑动窗口方式从第一历史消耗数据中确定的。
116.步骤s402,将多个目标滑动窗口分别对应的第一维度的第一特征以及第二维度的第一特征,作为第一组特征数据。
117.步骤s403,基于第一历史消耗数据,确定当前日期对应的当日消耗数据以及多个比对日期各自对应的他日消耗数据。
118.具体地,当前日期为执行资源量预估方法的日期,比对日期为当前日期之前的日期。当日消耗数据包括当前日期对应的资源消耗量和资源价格。他日消耗数据包括比对日期对应的资源消耗量和资源价格。
119.步骤s404,基于当日消耗数据和多个他日消耗数据,确定每个比对日期对应的第一维度的第二特征和第二维度的第二特征。
120.具体地,针对多个比对日期,分别执行以下步骤:
121.将当前日期对应的资源消耗量和一个比对日期对应的资源消耗量的差值,作为该比对日期对应的第一维度的第二特征;将当前日期对应的资源价格和该比对日期对应的资源价格的差值,作为该比对日期对应的第二维度的第二特征。
122.步骤s405,将多个比对日期各自对应的第一维度的第二特征以及第二维度的第二特征,作为第二组特征数据。
123.具体地,另一种可能的实施方式,将多个比对日期各自对应的第一维度的第二特
征以及第二维度的第二特征,以及多个比对日期各自对应的资源消耗量、多个比对日期各自对应的资源价格,作为第二组特征数据。
124.步骤s406,将第一组特征数据和第二组特征数据作为待预估资源对应的第一特征数据。
125.在本技术实施例中,将多个目标滑动窗口分别对应的第一维度的第一特征和第二维度的第一特征,作为第一组特征数据。多个比对日期各自对应的第一维度的第二特征以及第二维度的第二特征,作为第二组特征数据。将第一组特征数据和第二组特征数据作为待预估资源对应的第一特征数据。可以进一步增加第一特征数据的多样性,有利于提高集成学习模型的输出的候选数据量的准确性。
126.可选地,在上述步骤s202之前,确定待预估资源的历史平均消耗,具体包括以下步骤:
127.获取待预估资源在第二历史预设时段内的消耗数据,其中,消耗数据包括资源消耗量和资源价格。对第二历史预设时段内的资源消耗量求均值,获得待预估资源的历史平均消耗。
128.可选地,在上述步骤s202中,集成学习模型包括第一集成学习模型和第二集成学习模型,第一集成学习模型和第二集成学习模型均为提升树模型。如,第一集成学习模型可以是以下任意一种:梯度提升决策树(gradient boosting decision tree,gbdt)、极端梯度增强算法(extreme gradient boosting,xgboost)、轻量级梯度提升机(light gradient boosting machine,lightgbm)。第二集成学习模型可以是以下任意一种:梯度提升决策树(gradient boosting decision tree,gbdt)、极端梯度增强算法(extreme gradient boosting,xgboost)、轻量级梯度提升机(light gradient boosting machine,lightgbm)。
129.第一集成学习模型的损失函数为平均绝对百分比误差,第一集成学习模型的损失函数如公式1所示:
[0130][0131]
其中,mape表示平均绝对百分比误差,n表示每次迭代时训练样本的个数,yi表示第i个训练样本的真实标签,表示第i个训练样本的预估标签。
[0132]
第二集成学习模型的损失函数为平均绝对误差,第二集成学习模型的损失函数如公式2所示:
[0133][0134]
其中,mae表示平均绝对误差,n表示每次迭代时训练样本的个数,yi表示第i个训练样本的真实标签,表示第i个训练样本的预估标签。
[0135]
将训练集样本中标签小于消耗预设值的训练集样本,作为第一训练集样本;将训练集样本中标签大于等于消耗预设值的训练集样本,作为第二训练集样本。采用第一训练集样本训练第一集成学习模型,采用第二训练集样本训练第二集成学习模型,获得已训练的第一集成学习模型和第二集成学习模型。
[0136]
可选地,将目标特征数据输入集成学习模型,确定待预估资源在预测日期对应的候选数据量,具体包括以下步骤:
[0137]
若历史平均消耗小于消耗预设值,将目标特征数据输入第一集成学习模型,确定待预估资源在预测日期对应的候选数据量;
[0138]
若历史平均消耗大于等于消耗预设值,将目标特征数据输入第二集成学习模型,确定待预估资源在预测日期对应的候选数据量。
[0139]
在本技术实施例中,如果只采用一种集成学习模型进行候选数据量预估,当不同的待预估资源对应的候选数据量分布比较大时,很容易导致该集成学习模型更偏向于候选数据量分布中的中位数或者均值,而很难准确预测出候选数据量分布中较大的值或者较小的值,这将会导致所预测的待预估资源的候选数据量不准确。而由于本技术中,集成学习模型包括第一集成学习模型和第二集成学习模型,其中,第一集成学习模型可以准确地预估出候选数据量分布中的较小的值以及中位数或者均值,第二集成学习模型可以准确地预估出候选数据量分布中的较大的值以及中位数或者均值。因此,根据待预估资源的历史平均消耗,从第一集成学习模型和第二集成学习模型中选择对应的集成学习模型,进行待预估资源的候选数据量预估,可以有效地提高候选数据量的准确性。
[0140]
为了更好的解释本技术实施例,下面结合具体实施场景,描述本技术实施例提供的一种资源量预估方法,如图5所示,包括以下步骤:
[0141]
步骤s501,确定待预估资源的第一历史消耗数据对应的第一特征数据。
[0142]
步骤s502,确定待预估资源的催化资源数据对应的第二特征数据。
[0143]
步骤s503,确定待预估资源的资源信息对应的第三特征数据。
[0144]
步骤s504,确定预测日期的预测数据对应的第四特征数据。
[0145]
步骤s505,将第一特征数据、第二特征数据、第三特征数据以及第四特征数据合并,作为待预估资源对应的目标特征数据。
[0146]
步骤s506,确定待预估资源的历史平均消耗。
[0147]
步骤s507,判断历史平均消耗是否小于消耗预设值,若是,则执行步骤s508;否则,执行步骤s509。
[0148]
步骤s508,将目标特征数据输入第一集成学习模型,确定待预估资源在预测日期对应的候选数据量。
[0149]
步骤s509,将目标特征数据输入第二集成学习模型,确定待预估资源在预测日期对应的候选数据量。
[0150]
步骤s510,基于待预估资源的历史催化资源的催化结果,确定待预估资源的调整权重。
[0151]
步骤s511,采用调整权重对候选数据量进行调整,确定待预估资源在预测日期对应的资源量。
[0152]
在本技术实施例中,通过待预估资源的第一历史消耗数据、待预估资源的催化资源数据、待预估资源的资源信息以及预测日期的预测数据,确定待预估资源对应的目标特征数据,提高了目标特征数据的多样性,有利于提高集成学习模型的输出的候选数据量的准确性。
[0153]
根据待预估资源的历史平均消耗,从第一集成学习模型和第二集成学习模型中选择对应的集成学习模型,进行待预估资源的候选数据量预估,可以有效地提高候选数据量的准确性。
[0154]
根据历史催化资源对应的历史催化资源数据,确定待预估资源的调整权重,因此,确定调整权重时所依据的数据具有参考性,所确定的调整权重的准确性更高。通过调整权重,对候选数据量进行调整,使得所获得的待预估资源在预测日期对应的资源量更加准确。
[0155]
基于相同的技术构思,本技术实施例提供了一种资源量预估装置,如图6所示,该资源量预估装置600包括:
[0156]
特征数据确定模块601,用于基于待预估资源的第一历史消耗数据和所述待预估资源的催化资源数据,确定所述待预估资源对应的目标特征数据;所述第一历史消耗数据是根据所述待预估资源在多个历史日期的消耗数据确定的,所述催化资源数据是根据所述待预估资源在未来预设时段内的催化资源确定的;
[0157]
预测模块602,用于将所述目标特征数据输入集成学习模型,确定所述待预估资源在预测日期对应的候选数据量;
[0158]
调整权重确定模块603,用于基于所述待预估资源的历史催化资源的催化结果,确定所述待预估资源的调整权重;
[0159]
调整模块604,用于采用所述调整权重对所述候选数据量进行调整,确定所述待预估资源在所述预测日期对应的资源量。
[0160]
可选地,所述特征数据确定模块601具体用于:
[0161]
确定所述待预估资源的第一历史消耗数据对应的第一特征数据、所述待预估资源的催化资源数据对应的第二特征数据、所述待预估资源的资源信息对应的第三特征数据、所述预测日期的预测数据对应的第四特征数据;
[0162]
将所述第一特征数据、所述第二特征数据、所述第三特征数据以及所述第四特征数据合并,作为所述待预估资源对应的目标特征数据。
[0163]
可选地,所述特征数据确定模块601具体用于:
[0164]
基于多个目标滑动窗口内的子历史消耗数据,确定所述多个目标滑动窗口分别对应的第一维度的第一特征和第二维度的第一特征;所述多个目标滑动窗口内的子历史消耗数据是基于滑动窗口方式从所述第一历史消耗数据中确定的;
[0165]
将所述多个目标滑动窗口分别对应的第一维度的第一特征和第二维度的第一特征,作为第一组特征数据;并将所述第一组特征数据作为所述待预估资源对应的第一特征数据。
[0166]
可选地,所述特征数据确定模块601还用于:
[0167]
所述将所述第一组特征数据作为所述待预估资源对应的第一特征数据之前,基于所述第一历史消耗数据,确定当前日期对应的当日消耗数据以及多个比对日期各自对应的他日消耗数据;
[0168]
基于所述当日消耗数据和多个他日消耗数据,确定每个比对日期对应的所述第一维度的第二特征和所述第二维度的第二特征;
[0169]
将所述多个比对日期各自对应的第一维度的第二特征以及第二维度的第二特征,作为第二组特征数据;
[0170]
所述特征数据确定模块601具体用于:
[0171]
将所述第一组特征数据和所述第二组特征数据作为所述待预估资源对应的第一特征数据。
[0172]
可选地,所述集成学习模型包括第一集成学习模型和第二集成学习模型;所述预测模块602还用于:
[0173]
所述将所述目标特征数据输入集成学习模型,确定所述待预估资源在预测日期对应的候选数据量之前,确定所述待预估资源的历史平均消耗;
[0174]
所述预测模块602具体用于:
[0175]
若所述历史平均消耗小于消耗预设值,将所述目标特征数据输入所述第一集成学习模型,确定所述待预估资源在预测日期对应的候选数据量;
[0176]
若所述历史平均消耗大于等于所述消耗预设值,将所述目标特征数据输入所述第二集成学习模型,确定所述待预估资源在预测日期对应的候选数据量。
[0177]
可选地,所述第一集成学习模型和所述第二集成学习模型均为提升树模型;所述第一集成学习模型的损失函数为平均绝对百分比误差,所述第二集成学习模型的损失函数为平均绝对误差。
[0178]
可选地,所述调整权重确定模块603具体用于:
[0179]
根据所述历史催化资源对应的历史催化资源数据,从第二历史消耗数据中确定多个历史催化日期各自对应的资源消耗量,以及多个历史非催化日期各自对应的资源消耗量;
[0180]
根据所述多个历史催化日期各自对应的资源消耗量,以及所述多个历史非催化日期各自对应的资源消耗量,确定所述待预估资源的调整权重。
[0181]
基于相同的技术构思,本技术实施例提供了一种计算机设备,计算机设备可以是终端或服务器,如图7所示,包括至少一个处理器701,以及与至少一个处理器连接的存储器702,本技术实施例中不限定处理器701与存储器702之间的具体连接介质,图7中处理器701和存储器702之间通过总线连接为例。总线可以分为地址总线、数据总线、控制总线等。
[0182]
在本技术实施例中,存储器702存储有可被至少一个处理器701执行的指令,至少一个处理器701通过执行存储器702存储的指令,可以执行上述资源量预估方法中所包括的步骤。
[0183]
其中,处理器701是计算机设备的控制中心,可以利用各种接口和线路连接计算机设备的各个部分,通过运行或执行存储在存储器702内的指令以及调用存储在存储器702内的数据,从而进行资源量预估。可选的,处理器701可包括一个或多个处理单元,处理器701可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器701中。在一些实施例中,处理器701和存储器702可以在同一芯片上实现,在一些实施例中,它们也可以在独立的芯片上分别实现。
[0184]
处理器701可以是通用处理器,例如中央处理器(cpu)、数字信号处理器、专用集成电路(application specific integrated circuit,asic)、现场可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件,可以实现或者执行本技术实施例中公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本技术实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
[0185]
存储器702作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程
序、非易失性计算机可执行程序以及模块。存储器702可以包括至少一种类型的存储介质,例如可以包括闪存、硬盘、多媒体卡、卡型存储器、随机访问存储器(random access memory,ram)、静态随机访问存储器(static random access memory,sram)、可编程只读存储器(programmable read only memory,prom)、只读存储器(read only memory,rom)、带电可擦除可编程只读存储器(electrically erasable programmable read-only memory,eeprom)、磁性存储器、磁盘、光盘等等。存储器702是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。本技术实施例中的存储器702还可以是电路或者其它任意能够实现存储功能的装置,用于存储程序指令和/或数据。
[0186]
基于同一发明构思,本技术实施例提供了一种计算机可读存储介质,其存储有可由计算机设备执行的计算机程序,当程序在计算机设备上运行时,使得计算机设备执行上述资源量预估方法的步骤。
[0187]
本领域内的技术人员应明白,本技术的实施例可提供为方法、系统、或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0188]
本技术是参照根据本技术的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0189]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0190]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0191]
显然,本领域的技术人员可以对本技术进行各种改动和变型而不脱离本技术的精神和范围。这样,倘若本技术的这些修改和变型属于本技术权利要求及其等同技术的范围之内,则本技术也意图包含这些改动和变型在内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1