项目预测方法以及装置与流程

文档序号:30179233发布日期:2022-05-26 12:46阅读:211来源:国知局
项目预测方法以及装置与流程

1.本说明书实施例涉及计算机技术领域,特别涉及一种项目预测方法。


背景技术:

2.为了项目运维的便捷性,可以进行项目的访问量、异常信息、高峰时间、低谷时间的等指标的预测。其中,预测一般是指基于项目的历史数据,对项目的上述指标进行预测,预测结果能够用于实现及时进行项目维护和运行规则调整等等效果。
3.相关技术中,历史数据是在历史时段内周期性采集的。然而,由于项目运行过程中用户行为、网络质量等因素,导致部分采集周期采集的数据为空,也就导致历史数据稀疏的问题进一步导致预测结果不准确。因此,需要提供更加准确的方案。


技术实现要素:

4.有鉴于此,本说明书实施例提供了一种项目预测方法。本说明书一个或者多个实施例同时涉及一种项目预测装置,一种计算设备,一种计算机可读存储介质以及一种计算机程序,以解决现有技术中存在的技术缺陷。
5.根据本说明书实施例的第一方面,提供了一种项目预测方法,包括:
6.获取目标项目的历史项目数据;
7.将所述历史项目数据输入预先训练得到的预测模型,获得所述目标项目的预测结果,其中,所述预测模型为利用样本序列训练得到,所述样本序列为基于累积周期,对按照预设采样周期采集的初始数据序列中的样本数据进行累积获得。
8.根据本说明书实施例的第二方面,提供了一种项目预测装置,包括:
9.历史数据获取模块,被配置为获取目标项目的历史项目数据;
10.项目预测模块,被配置为将所述历史项目数据输入预先训练得到的预测模型,获得所述目标项目的预测结果,其中,所述预测模型为利用样本序列训练得到,所述样本序列为基于累积周期,对按照预设采样周期采集的初始数据序列中的样本数据进行累积获得。
11.根据本说明书实施例的第三方面,提供了一种计算设备,包括:
12.存储器和处理器;
13.所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,该计算机可执行指令被处理器执行时实现上述项目预测方法的步骤。
14.根据本说明书实施例的第四方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现上述项目预测方法的步骤。
15.根据本说明书实施例的第五方面,提供了一种计算机程序,其中,当所述计算机程序在计算机中执行时,令计算机执行上述项目预测方法的步骤。
16.本说明书一个实施例实现了获取目标项目的历史项目数据;将历史项目数据输入预先训练得到的预测模型,获得目标项目的预测结果,其中,预测模型为利用样本序列训练得到,样本序列为基于累积周期,对按照预设采样周期采集的初始数据序列中的样本数据
1,1]。
28.在具体应用中,可以利用项目的历史数据,训练得到预测模型,例如时间序列预测分析方法,进而通过预测模型对项目的访问量、异常信息、高峰时间、低谷时间的等指标进行预测。其中,时间序列预测分析方法可以包括:arima模型、prophet模型、周期分解模型等等。arima模型即差分整合移动平均自回归模型(autoregressive integrated moving average model),又称整合移动平均自回归模型,移动也可称作滑动。prophet是一种适用于具有内在规律的行为数据的时间序列预测分析方法。周期分解模型是一种基于局部加权回归(lwr,locally weighted regression)将时间序列分解成趋势分量、季节分量和余项进行预测的模型。普通的线性回归,训练完成之后只保留训练得到的参数,而局部线性回归需要保留样本与训练得到的参数。为了减少历史数据稀疏导致训练得到的预测模型不准确的问题,可以采用如下两种解决方案:
29.第一种方案为对时序特征进行预处理:直接对历史数据进行提取数据特征的预处理,利用得到的处理结果训练得到预测模型。例如,统计历史数据的均值、方差、最大值、最小值、偏度、锐度等统计特征,并对多个统计特征进行拼接获得数据特征;利用该数据特征训练得到预测模型。第二种方案为通过卷积神经网络进行特征聚合:使用卷积神经网络方式对历史数据进行聚合特征的预处理,得到聚合特征,利用聚合特征训练得到预测模型。
30.但是,上述第一种方案中,统计特征的选取通常会导致历史数据反映的项目特质丢失,也就是信息丢失,造成对部分场景的预测仍然不够准确。例如,在连续跌0也就是在指定时长内未采集到历史数据的场景中,统计特征相近,导致预测模型的预测结果不够准确。上述第二种方案中,卷积神经网络实现特征聚合需要大量的训练数据,以及设置大量的参数,不够便捷。
31.为了兼顾准确度和便捷性,在本说明书中,提供了一种项目预测方法,本说明书同时涉及一种项目预测装置,一种计算设备,以及一种计算机可读存储介质,在下面的实施例中逐一进行详细说明。
32.参见图1,图1示出了本说明书一个实施例提供的一种项目预测方法的流程图,具体包括以下步骤:
33.s102,获取目标项目的历史项目数据。
34.在具体应用中,项目检测可以按照预设预测周期自动进行,或者通过终端接收的预测请求触发。因此,获取目标项目的历史项目数据的时机可以包括:在达到预设预测周期或者接收针对目标项目的预测请求的情况下。并且,获取目标项目的历史项目数据,可以包括:从数据库中读取目标项目的历史项目数据,或者,接收运行项目的计算设备发送的历史项目数据等等。
35.其中,目标项目可以包括需要对项目的访问量、异常信息、高峰时间、低谷时间的等指标进行预测的项目。示例性的,目标项目可以为视频应用程序、即时通讯应用程序、购物应用程序等等,本实施例对具体的目标项目不进行限制,可以根据具体需求设置。
36.并且,历史项目数据可以包括能够反映目标项目的运行特征的数据,例如,历史项目数据可以为视频播放量、项目的访问量、任务完成数量等等。另外,历史项目数据具体可以是一个或者多个,多个历史项目数据可以是按照预设周期采集的数据,可以按照采集时间或者数据的产生时间形成数据序列。本实施例对历史项目数据的形式不作限制,可以根
据具体需求进行设置。
37.s104,将历史项目数据输入预先训练得到的预测模型,获得目标项目的预测结果,其中,预测模型为利用样本序列训练得到,样本序列为基于累积周期,对按照预设采样周期采集的初始数据序列中的样本数据进行累积获得。
38.在具体应用中,可以针对预测场景预先训练得到预测模型,从而将历史项目输入预先训练得到的预测模型时,可以对目标项目进行预测场景的识别。为了便于理解和合理布局,后续以可选实施例的形式对针对预测场景预先训练得到预测模型的情况进行具体说明。获得预测模型的训练可以采用有监督、无监督、自监督的形式;并且,该训练针对的模型具体可以根据应用需求选择,例如,可以为arima模型、prophet模型、周期分解模型等等。这都是合理的,本实施例对预测模型的训练形式、以及训练针对模型不作限制。
39.其中,累积周期可以反映一次累积中样本数据的时间跨度,可以实现对所累积的样本数据的数量的控制。示例性的,累积周期可以与预设采样周期相同或者不同。为了便于理解和合理布局,后续以可选实施例的形式对累积周期的设置方式进行具体说明。并且,获得样本序列的具体方式,也就是基于累积周期,对按照预设采样周期采集的初始数据序列中的样本数据进行累积的方式,具体可以是多种的。下面以示例性描述的形式进行具体说明。
40.示例性的,可以直接按照滑窗也就是累积周期对初始数据序列中的样本数据进行累积。例如,对第一累积周期内的样本数据进行求和运算。这样,样本序列中的数据即累积周期内样本数据的汇总结果。或者,示例性的,可以通过多级聚合数据实现累积:与直接按照累积周期对初始数据序列中的样本数据进行类似,区别在于可以对不同累积周期的累积结果进行叠加。例如,可以对第一个累积周期的累积结果和第二个累积周期的累积结果进行叠加,从而形成更加密集的累积结果,进一步减少初始数据序列的稀疏,增加样本序列中的数据。或者,示例性的,可以对初始数据序列中的样本数据进行数量级的调整,以实现减少样本数据间数量级差异的压缩,对压缩后的数据按照累积周期进行累积。或者,示例性的,可以按照累积周期初始数据序列中的样本数据,对样本序列进行累积,对累积结果进行连续空值的合并,获得样本序列,从而完成累积。任何可以基于累积周期,对按照预设采样周期采集的初始数据序列中的样本数据进行累积的方式,均可用于本说明书,本实施例对此不作限制。为了便于理解和合理布局,后续以可选实施例的形式对第三和第四个示例进行具体说明。
41.在一种情况中,按照预设采样周期采集的初始数据序列中的样本数据进行累积,可以包括上述第二个示例、第三个示例以及第四个示例中的至少一个。或者,按照预设采样周期采集的初始数据序列中的样本数据进行累积,可以包括上述第一个示例和/或第四个示例。另外,在历史项目数据为数据序列的场景中,可以采用与获得样本序列的方式类似的方式,对该数据序列中的数据进行累积,将累积结果作为历史项目数据输入上述预测模型。本方式中区别在于进行累积的对象不同,对于相同部分可以参见上述对获得样本序列的方式的描述,在此不再赘述。这样,可以对历史项目数据进行减少稀疏的处理,可以适用于无需预测稀疏指标的预测场景中,拓宽本说明书实施例提供的项目预测方法的适用场景。
42.本说明书一个实施例中,样本序列中的数据是对初始数据序列中的样本数据累积得到的。因此,样本序列中的数据可以在相对于初始数据序列中的样本数据得到增强的同
时,保留初始数据序列中样本数据反映的项目特征。因此,在按照预设采样周期采集的初始数据序列存在稀疏问题时,通过上述样本序列可以减少稀疏问题,进而保证利用样本序列训练得到的预测模型更加准确。因此,将历史项目数据输入预先训练得到的预测模型,获得的预测结果可以更加准确。
43.参见图2,图2是本说明书一个实施例提供的一种项目预测平台的结构示意图,该项目预测平台200包括预测模块202和数据库204。其中,预测模块202可以从数据库204中获取目标项目的历史项目数据,进而将历史项目数据输入预先训练得到的预测模型,获得目标项目的预测结果。并且,项目预测平台200可以是在接收到终端206发送的预测请求时,通过预测模块202获得目标项目的预测结果,进而反馈该预测结果至终端206。其中,预测模型为利用样本序列训练得到,与上述图1实施例中的预测模型相同。本实施例中各步骤的具体实现方式与上述图1实施例中作用相同的步骤相同,在此不再赘述,详见上述图1实施例的描述。并且,在本实施例中,利用样本序列训练得到的预测模型的执行主体可以为项目预测平台或者服务器。
44.在一种情况中,进行项目预测也就是作为本说明书实施例的执行主体可以为终端206。为此,可以由获取目标项目的历史项目数据,进而将历史项目数据输入预先训练得到的预测模型,获得目标项目的预测结果。其中,预测模型可以由项目预测平台或者服务器训练得到并且发送至终端204。并且,上述终端204可以是任何一种可与用户进行人机交互的电子产品,例如个人计算机(pc,personal computer)、移动终端、掌上电脑ppc(pocket pc)、平板电脑等等。上述服务器可以是一台服务器,也可以是由多台服务器组成的服务器集群,或者是一个云计算服务中心,本说明书实施例对此不做限定。
45.本说明书一个实施例中,样本序列中的数据是对初始数据序列中的样本数据累积得到的。因此,样本序列中的数据可以在相对于初始数据序列中的样本数据得到增强的同时,保留初始数据序列中样本数据反映的项目特征。因此,在按照预设采样周期采集的初始数据序列存在稀疏问题时,通过上述样本序列可以减少稀疏问题,进而保证利用样本序列训练得到的预测模型更加准确。因此,将历史项目数据输入预先训练得到的预测模型,获得的预测结果可以更加准确。
46.在一种可选的实施方式中,在上述获取目标项目的历史项目数据之前,本说明书实施例提供的项目预测方法,还可以包括如下步骤:
47.获取目标项目的预测周期、以及预设采样周期;
48.利用预设采样周期对预测周期进行划分,获得累积周期。
49.在具体应用中,获取目标项目的预测周期、以及预设采样周期具体可以包括:直接读取预先设置的预测周期、以及预设采样周期,或者,接收预测请求中携带的预测周期、以及预设采样周期。并且,利用预设采样周期对预测周期进行划分,获得累积周期,具体可以为:累积周期=目标项目的预测周期
÷
预设采样周期。目标项目的预测周期具体可以是对项目进行异常检测的周期。示例性的,样本数据是按小时采集的数据,如果检测3天内目标项目是否存在异常,也就是目标项目的预测周期为3天,那么累积周期为3
×
24
÷
1=72小时。样本数据是按天采集的数据,如果检测一周内目标项目是否存在异常,那么累积周期为7
÷
1=7天。样本数据是按5分钟采集的数据,如果检测1小时内目标项目是否存在异常,那么累积周期为60
÷
5=12分钟;
50.本实施例通过利用预设采样周期对预测周期进行划分,获得累积周期,可以保证累积周期与预测周期适配,进一步减少预测周期内的数据稀疏问题。
51.在一种可选的实施方式中,在上述将历史项目数据输入预先训练得到的预测模型,获得目标项目的预测结果之前,本说明书实施例提供的项目预测方法,还可以包括如下步骤:
52.获取目标项目的预测场景类型;
53.查找与预测场景类型对应的预测模型,其中,预测模型为利用样本序列进行针对预测场景类型的训练得到。
54.其中,预测场景类型为按照预测指标的物理含义差异划分的类型。例如,预测场景类型可以包括:检测项目是否异常的异常检测类型、预计项目未来数据的未来值预估类型。并且,对利用样本序列进行针对预测场景类型的训练下面以示例性的形式进行说明。示例性的,针对异常检测类型的场景,对样本序列标记类别标签,利用标记有类别标签的样本序列训练得到分类模型;将历史项目数据,例如今天的项目访问量输入至上述训练得到的分类模型中,获得历史项目属于“异常、低频以及高频”的分类结果,也就是异常检测结果。和/或者,示例性的,对样本序列标记类别标签,利用标记的类别标签为高频类别和低频类别的样本序列训练得到预测模型;将历史项目数据,例如今天的项目访问量输入至上述训练得到的预测模型中,获得与历史项目数据的采集时间对应的预测时间内的预测数据,例如明天的项目访问量。具体的场景类型可以根据应用需求选择,例如,可以为异常检测类型和未来值预估类型中的至少一种。
55.本实施例通过针对预测场景类型进行预测模型的训练,可以保证预测模型与预测场景类型相适配,实现项目预测更加准确的效果。
56.在一种可选的实施方式中,在上述获取目标项目的历史项目数据之前,本说明书实施例提供的项目预测方法,还可以包括如下步骤:
57.按照预设采样周期对目标项目进行数据采集,获得初始数据序列;
58.对初始数据序列中的各数据进行数量级调整,获得各数据间差异值小于预设阈值的压缩后初始数据序列;
59.对压缩后初始数据序列进行数据累积,获得样本序列。
60.在具体应用中,对初始数据序列中的各数据进行数量级调整,具体可以包括:对初始数据序列中的各数据进行归一化处理,或者,通过0/1的赋值调整数量级,实现样本数据间差异的压缩。这样,可以在训练中保证所训练的模型学习到是否存在跌0。样本数据不为0,也就是当天有任务完成,则用1代替具体任务完成量;如果没有任务完成,则用0表示。例如,图3本说明书一个实施例提供的一种项目预测方法中,用于获得样本序列的过程涉及的数据示例图所示,压缩后初始数据序列可以为110110111010
……
000000。
61.本实施例可以减少数据离散也就是稀疏、数据倾斜,高低值差距过大等问题。
62.在一种可选的实施方式中,在上述获取目标项目的历史项目数据之前,本说明书实施例提供的项目预测方法,还可以包括如下步骤:
63.按照预设采样周期对目标项目进行样本数据采集,获得初始数据序列;
64.按照累积周期,对初始数据序列中的样本数据进行累积,得到包含多个累积值的累积序列;
65.若累积序列中目标累积值的连续出现次数大于或者等于次数阈值,则对目标累计值进行合并,获得样本序列,其中,目标累积值为表征的累积结果为空的值。
66.在具体应用中,滑窗即滑动窗口,也就是上述累积周期。按照累积周期,对初始数据序列中的样本数据进行累积针对的是初始数据序列。例如,3个月内的交易量,或者该交易量的0/1压缩结果。按累积周期计算压缩后初始数据序列各1的累积结果,比如压缩后初始数据序列是“100110”,累积结果为3。这样,经过按照累积周期累积之后,可以获得一个新序列,该新序列的稀疏问题减少。在累积结果为3时,新的滑窗序列为“3”;在累积结果为3、1、2时,新的滑窗序列为“312”。
67.在此基础上,当多个连续的滑窗值都是0的时候,也就是连续的目标累计值连续出现的次数大于或者等于次数阈值的时候,可以使用指定值例如00代替所有连续的0,实现对目标累计值的合并。该合并可以实现序列简化,保证项目预测更加高效。示例性的,新序列是“553210000”,可以简化成“5532100”。
68.在一种可选的实施方式中,上述对目标累计值进行合并,获得样本序列,具体可以包括如下步骤:
69.将连续的目标累计值替换为指定值,获得样本序列,其中,指定值用于表征样本序列中反映跌零特征的数据。
70.示例性的,可以利用指定值“00”对新序列进行打标,获得样本序列。这样,指定值“00”可以作为样本序列是否为异常数据也就是连续跌零的序列的标签。这样打标的原因是经过至少两个预测周期发生跌0,即确定为项目出现跌零异常,符合异常检测需求。并且,通过本方案得到的样本序列具有反映下降趋势的特点,从而保证预测模型具有识别连续下降的能力,该能力对项目运维至关重要。例如,图3所示虚线箭头代表了样本序列中的数据“3332100”反映出下降趋势。本文方法同时还给出了用于算法模型训练的打标数据,其中,聚合后的“00”标签表示异常,分类后的“0”分类代表异常分类,这样使用编码方式可以直接获得可训练的标签,大大减少了人工打标的成本。
71.在一种可选的实施方式中,在上述获得样本序列之后,本说明书实施例提供的项目预测方法,还可以包括如下步骤:
72.基于样本序列的各序列值以及累计周期总量,确定样本序列的稀疏指标;
73.基于稀疏指标,确定样本序列的类型标签;
74.利用样本序列以及样本序列的类型标签,训练得到预测模型。
75.在具体应用中,上述基于样本序列的各序列值以及累计周期总量,确定样本序列的稀疏指标,具体可以包括:对样本序列的各序列值以及累计周期总量分别进行归一化后相除,得到样本序列的稀疏指标。或者,对样本序列的各序列值以及累计周期总量直接相除。并且,基于稀疏指标,确定样本序列的类型标签,具体可以包括:按照稀疏指标分类,分类结果作为类型标签,建立类型标签和样本序列对应关系;或者,按照稀疏指标分类,分类结果作为类型标签,添加类型标签至样本序列中。
76.在一种可选的实施方式中,上述基于稀疏指标,确定样本序列的类型标签,具体可以包括如下步骤:从预先建立的指标区间与序列类型的对应关系中,查找稀疏指标对应的目标序列类型;将表征目标序列类型的标签确定为样本序列的类型标签。
77.示例性的,可以通过数据的赋值表明数据的稀疏指标:滑动窗口下的累积结果
÷
滑动窗口的大小,得到稀疏指标。在此基础上,按照稀疏指标所属的指标区间,对样本序列中的样本数据进行分类,例如,分成3类,高类型对应的指标区间为[5,1],中类型对应的指标区间为(0,0.5],低类型对应的指标区间为[0]。并且,高类型的类型标签为2,中类型的类型标签为1,0类型的类型标签为0,由此获得图3所示类型标签序列,例如“222211”。
[0078]
这样,可以实现对样本序列的自动分类以及打标签,可以保证项目预测的效率。
[0079]
下述结合附图3,以本说明书提供的项目预测方法中,样本序列的获取过程为例,对项目预测方法进行进一步说明。其中,图3示出了本说明书一个实施例提供的一种项目预测方法中,用于获得样本序列的过程涉及的数据示例图,该过程具体可以包括以下步骤:
[0080]
步骤s1,按照预设采样周期对目标项目进行样本数据采集,获得初始数据序列。例如,预设采样周期可以为一天,初始数据序列可以为5,3,0,5,3,0,2,2,1,0,3,0
……
,0,0,0,0,0,0。其中,每个样本数据例如可以为任务完成量,即“5”代表完成5个任务。
[0081]
步骤s2,调整初始数据序列中样本数据的数量级。例如,可以通过0/1的赋值调整数量级,实现样本数据间差异的压缩。这样,可以在训练中保证所训练的模型学习到是否存在跌0。样本数据不为0,也就是当天有任务完成,则用1代替具体任务完成量;如果没有任务完成,则用0表示。例如,图3所示压缩后初始数据序列可以为110110111010
……
000000。
[0082]
步骤s3,对压缩后初始数据序列中的样本数据进行滑动窗口下的累积。具体的,可以按照累积周期也就是滑动窗口,对压缩后初始数据序列中的样本数据进行累积。其中,累积周期的大小也就是窗口大小,具体可以为:累积周期=目标项目的预测周期
÷
预设采样周期。目标项目的预测周期具体可以是对项目进行异常检测的周期。示例性的,样本数据是按小时采集的数据,如果检测3天内目标项目是否存在异常,也就是目标项目的预测周期为3天,那么累积周期为3天
×
24小时
÷
1小时=72小时。样本数据是按天采集的数据,如果检测一周内目标项目是否存在异常,那么累积周期为7天
÷
1天=7天。样本数据是按5分钟采集的数据,如果检测1小时内目标项目是否存在异常,那么累积周期为60分钟
÷
5分钟=12分钟。
[0083]
在上述基础上,按累积周期计算压缩后初始数据序列各1的累积结果,比如压缩后初始数据序列是“100110”,累积结果为3。这样,经过按照累积周期累积之后,可以获得一个新序列,该新序列的稀疏问题减少,与初始数据序列有了明显的区别。例如,图3所示,新序列可以为553210000。
[0084]
步骤s4,对连续的“0”处理。具体的,当多个连续的滑窗值都是0的时候,也就是连续的目标累计值连续出现的次数大于或者等于次数阈值的时候,可以使用指定值例如00代替所有连续的0,实现对目标累计值的合并。该合并可以实现序列简化,保证项目预测更加高效。示例性的,新序列是“553210000”,可以简化成“5532100”。在一种情况中,可以利用指定值“00”对新序列进行打标,获得样本序列。这样,指定值“00”可以作为样本序列是否为异常数据也就是连续跌零的序列的标签。这样打标的原因是经过至少两个预测周期发生跌0,即确定为项目出现跌零异常,符合异常检测需求。并且,通过本方案得到的样本序列具有反映下降趋势的特点,从而保证预测模型具有识别连续下降的能力,该能力对项目运维至关重要。例如,图3所示虚线箭头代表了样本序列中的数据“3332100”反映出下降趋势。
[0085]
步骤s5,对样本序列进行分类统计,实现自动获得类型标签的效果。例如,通过数据的赋值表明数据的稀疏指标:滑动窗口下的累积结果
÷
滑动窗口的大小,得到稀疏指标。
在此基础上,按照稀疏指标所属的指标区间,对样本序列中的样本数据进行分类,例如,分成3类,高类型对应的指标区间为[5,1],中类型对应的指标区间为(0,0.5],低类型对应的指标区间为[0]。并且,高类型的类型标签为2,中类型的类型标签为1,0类型的类型标签为0,由此获得图3所示类型标签序列,例如“222211”。
[0086]
本实施例中各步骤的具体实现方式与上述图1实施例及图1可选实施例中步骤相同,具体可以参见上述图1实施例及图1可选实施例的描述,在此不再赘述。另外,图3所示的序列均仅为示例。并且,按照滑动窗口对压缩后初始数据序列的累积结果,与样本序列中的数据并非一一对应的关系,为了便于理解和图示简洁图中对数据进行了省略,旨在展现数据稀疏问题的减少、压缩后数据差异的降低、连续跌零的合并与标记、以及类型标签序列的实例。
[0087]
与上述方法实施例相对应,本说明书还提供了项目预测装置实施例,图4示出了本说明书一个实施例提供的一种项目预测装置的结构示意图。如图4所示,该装置包括:
[0088]
历史数据获取模块402,被配置为获取目标项目的历史项目数据;
[0089]
项目预测模块404,被配置为将所述历史项目数据输入预先训练得到的预测模型,获得所述目标项目的预测结果,其中,所述预测模型为利用样本序列训练得到,所述样本序列为基于累积周期,对按照预设采样周期采集的初始数据序列中的样本数据进行累积获得。
[0090]
本说明书一个实施例中,样本序列中的数据是对初始数据序列中的样本数据累积得到的。因此,样本序列中的数据可以在相对于初始数据序列中的样本数据得到增强的同时,保留初始数据序列中样本数据反映的项目特征。因此,在按照预设采样周期采集的初始数据序列存在稀疏问题时,通过上述样本序列可以减少稀疏问题,进而保证利用样本序列训练得到的预测模型更加准确。因此,将历史项目数据输入预先训练得到的预测模型,获得的预测结果可以更加准确。
[0091]
在一种可选的实施方式中,所述装置还包括:样本序列获取模块,被配置为:
[0092]
按照所述预设采样周期对所述目标项目进行样本数据采集,获得所述初始数据序列;
[0093]
对所述初始数据序列中的各数据进行数量级调整,获得各数据间差异值小于预设阈值的压缩后初始数据序列;
[0094]
对所述压缩后初始数据序列进行数据累积,获得所述样本序列。
[0095]
在一种可选的实施方式中,所述装置还包括:样本序列获取模块,被配置为:
[0096]
按照所述预设采样周期对所述目标项目进行样本数据采集,获得所述初始数据序列;
[0097]
按照所述累积周期,对所述初始数据序列中的样本数据进行累积,得到包含多个累积值的累积序列;
[0098]
若所述累积序列中目标累积值的连续出现次数大于或者等于次数阈值,则对所述目标累计值进行合并,获得所述样本序列,其中,所述目标累积值为表征的累积结果为空的值。
[0099]
在一种可选的实施方式中,所述样本序列获取模块,进一步被配置为:
[0100]
将连续的所述目标累计值替换为指定值,获得所述样本序列,其中,所述指定值用
于表征所述样本序列中反映跌零特征的数据。
[0101]
在一种可选的实施方式中,所述装置还包括:模型训练模块,被配置为:
[0102]
在获得所述样本序列之后,基于所述样本序列的各序列值以及累计周期总量,确定所述样本序列的稀疏指标;
[0103]
基于所述稀疏指标,确定所述样本序列的类型标签;
[0104]
利用所述样本序列以及所述样本序列的类型标签,训练得到所述预测模型。
[0105]
在一种可选的实施方式中,所述模型训练模块,进一步被配置为:
[0106]
从预先建立的指标区间与序列类型的对应关系中,查找所述稀疏指标对应的目标序列类型;
[0107]
将表征所述目标序列类型的标签确定为所述样本序列的类型标签。
[0108]
在一种可选的实施方式中,所述装置还包括:样本序列获取模块,被配置为:
[0109]
获取所述目标项目的预测周期、以及所述预设采样周期;
[0110]
利用所述预设采样周期对所述预测周期进行划分,获得所述累积周期。
[0111]
在一种可选的实施方式中,所述项目预测模块404,还被配置为:
[0112]
在所述将所述历史项目数据输入预先训练得到的预测模型,获得所述目标项目的预测结果之前,获取所述目标项目的预测场景类型;
[0113]
查找与所述预测场景类型对应的预测模型,其中,所述预测模型为利用所述样本序列进行针对所述预测场景类型的训练得到。
[0114]
上述为本实施例的一种项目预测装置的示意性方案。需要说明的是,该项目预测装置的技术方案与上述的项目预测方法的技术方案属于同一构思,项目预测装置的技术方案未详细描述的细节内容,均可以参见上述项目预测方法的技术方案的描述。
[0115]
图5示出了根据本说明书一个实施例提供的一种计算设备的结构框图。该计算设备500的部件包括但不限于存储器510和处理器520。处理器520与存储器510通过总线530相连接,数据库550用于保存数据。
[0116]
计算设备500还包括接入设备540,接入设备540使得计算设备500能够经由一个或多个网络560通信。这些网络的示例包括公用交换电话网(pstn,public switched telephone network)、局域网(lan,local area network)、广域网(wan,wide area network)、个域网(pan,personal area network)或诸如因特网的通信网络的组合。接入设备540可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(nic,network interface controller))中的一个或多个,诸如ieee802.11无线局域网(wlan,wireless local area networks)无线接口、全球微波互联接入(wi-max,worldwide interoperability for microwave access)接口、以太网接口、通用串行总线(usb,universal serial bus)接口、蜂窝网络接口、蓝牙接口、近场通信(nfc,near field communication)接口,等等。
[0117]
在本说明书的一个实施例中,计算设备500的上述部件以及图5中未示出的其他部件也可以彼此相连接,例如通过总线。应当理解,图5所示的计算设备结构框图仅仅是出于示例的目的,而不是对本说明书范围的限制。本领域技术人员可以根据需要,增添或替换其他部件。
[0118]
计算设备500可以是任何类型的静止或移动计算设备,包括移动计算机或移动计
算设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的计算设备(例如,智能手表、智能眼镜等)或其他类型的移动设备,或者诸如台式计算机或pc的静止计算设备。计算设备500还可以是移动式或静止式的服务器。
[0119]
其中,处理器520用于执行如下计算机可执行指令,该计算机可执行指令被处理器执行时实现上述项目预测方法的步骤。
[0120]
上述为本实施例的一种计算设备的示意性方案。需要说明的是,该计算设备的技术方案与上述的项目预测方法的技术方案属于同一构思,计算设备的技术方案未详细描述的细节内容,均可以参见上述项目预测方法的技术方案的描述。
[0121]
本说明书一实施例还提供一种计算机可读存储介质,其存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现上述项目预测方法的步骤。
[0122]
上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是,该存储介质的技术方案与上述的项目预测方法的技术方案属于同一构思,存储介质的技术方案未详细描述的细节内容,均可以参见上述项目预测方法的技术方案的描述。
[0123]
本说明书一实施例还提供一种计算机程序,其中,当所述计算机程序在计算机中执行时,令计算机执行上述项目预测方法的步骤。
[0124]
上述为本实施例的一种计算机程序的示意性方案。需要说明的是,该计算机程序的技术方案与上述的项目预测方法的技术方案属于同一构思,计算机程序的技术方案未详细描述的细节内容,均可以参见上述项目预测方法的技术方案的描述。
[0125]
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
[0126]
所述计算机指令包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、电载波信号、电信信号以及软件分发介质等。
[0127]
需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本说明书实施例并不受所描述的动作顺序的限制,因为依据本说明书实施例,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本说明书实施例所必须的。
[0128]
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
[0129]
以上公开的本说明书优选实施例只是用于帮助阐述本说明书。可选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书实施例的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解
释本说明书实施例的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本说明书。本说明书仅受权利要求书及其全部范围和等效物的限制。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1