营收数据预测方法、装置、计算机设备和存储介质与流程

文档序号:17550047发布日期:2019-04-30 18:12阅读:208来源:国知局
营收数据预测方法、装置、计算机设备和存储介质与流程

本申请涉及人工智能技术领域,特别是涉及一种营收数据预测方法、装置、计算机设备和存储介质。



背景技术:

在金融行业中,营业收入是指企业在生产经营活动中,因销售产品或提供劳务取得的各项收入,它关系到企业的生存和发展,对企业经营有重要的意义,因此,准确预测企业营收是投资分析的重要内容。

传统地,在对企业营收进行预测的时候,通常是由基金经理和研究员等对众多数据进行跟踪,然后根据所跟踪的数据得到预测值,但是这样的预测结果依赖于基金经理和研究员,导致最后的预测结果不准确。



技术实现要素:

基于此,有必要针对上述技术问题,提供一种能够提高预测准确性的营收数据预测方法、装置、计算机设备和存储介质。

一种营收数据预测方法,所述方法包括:

接收待预测时间以及待预测企业标识,并获取与所述待预测企业标识对应的第一历史营收数据;

将所述第一历史营收数据输入至预测单模型中得到第一单模型预测结果;

根据所述第一单模型预测结果以及第一历史营收数据构建目标模型选择特征;

将所述目标模型选择特征输入至已训练完成的模型分类器中得到各个所述预测单模型对应的权重;

根据所述第一单模型预测结果以及对应的所述权重计算得到预测营收数据。

在其中一个实施例中,所述模型选择器的生成方式包括:

获取第二历史营收数据;

获取训练预测时间,并将所述训练预测时间以及所述第二历史营收数据输入至预测单模型中得到第二单模型预测结果,所述预测单模型是预先训练得到的;

根据所述第二单模型预测结果以及所述第一历史营收数据构建训练模型选择特征;

根据所述第二历史营收数据和所述第二单模型预测结果确定各个所述预测单模型对应的权重;

基于所述预测单模型的权重、所述训练模型选择特征进行训练得到模型分类器。

在其中一个实施例中,所述根据所述第二历史营收数据和所述第二单模型预测结果确定所述预测单模型对应的权重,包括:

从所述第二历史营收数据中提取与所述训练预测时间对应的真实营收数据;

计算所述第二单模型预测结果与真实营收数据的比值;

对所述比值进行归一化处理得到所述预测单模型对应的权重。

在其中一个实施例中,所述根据所述第一单模型预测结果以及第一历史营收数据构建目标模型选择特征,包括:

根据所述第一单模型预测结果以及第一历史营收数据构建第一模型选择特征;

根据所述第一历史营收数据构建第二模型选择特征。

在其中一个实施例中,所述将所述第一历史营收数据输入至预测单模型中得到第一单模型预测结果,包括:

获取所述待预测时间对应的特征周期;

通过所述预测单模型计算得到与所述特征周期对应的预测值;

所述根据所述第一单模型预测结果以及第一历史营收数据构建第一模型选择特征,包括:

从所述第一历史营收数据提取与所述特征周期对应的真实值;

根据所述预测值和所述真实值计算得到第一模型选择特征。

在其中一个实施例中,所述根据所述第一历史营收数据构建第二模型选择特征,包括:

获取预设周期长度和区间,根据所述预设周期长度对所述第一历史营收数据进行分段;

获取每一区间中对应的分段的第一历史营收数据,并对所获取的第一历史营收数据进行排序,并标记排序后的第一历史营收数据的顺序值;

计算每一区间对应的分段的第一历史营收数据的顺序值的偏差值;

计算所述偏差值的平均值得到周期性强弱指标作为第二模型选择特征。

在其中一个实施例中,所述根据所述第一历史营收数据构建第二模型选择特征,包括:

获取预设周期长度,根据所述预设周期长度对所述第一历史营收数据进行分段;

根据每一分段的第一历史营收数据与上一分段的第一历史营收数据计算得到增减幅度;

根据所述增减幅度得到每一分段的第一历史营收数据的增减幅度标记值;

计算所述增减幅度标记值的平均值得到趋势性强弱指标作为第二模型选择特征。

一种营收数据预测装置,所述装置包括:

接收模块,用于接收待预测时间以及待预测企业标识,并获取与所述待预测企业标识对应的第一历史营收数据;

第一单模型预测结果获取模块,用于将所述第一历史营收数据输入至预测单模型中得到第一单模型预测结果;

第一特征构建模块,用于根据所述第一单模型预测结果以及第一历史营收数据构建目标模型选择特征;

预测模块,用于将所述目标模型选择特征输入至已训练完成的模型分类器中得到所述预测单模型对应的权重;

营收数据计算模块,用于根据所述第一单模型预测结果以及对应的所述权重计算得到预测营收数据。

一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。

一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。

上述营收数据预测方法、装置、计算机设备和存储介质,可以根据第一历史营收数据得到多个第一单模型预测结果,然后根据第一单模型预测结果以及第一历史营收数据本身的特征构建目标模型选择特征,从而根据目标模型选择特征计算得到每一预测单模型对应的权重,根据该权重和第一单模型预测结果可以得到预测营收数据,不需要人工参与,即可以获取到最准确的预测结果,提高了营收数据的预测准确性。

附图说明

图1为一个实施例中营收数据预测方法的应用场景图;

图2为一个实施例中营收数据预测方法的流程示意图;

图3为一个实施例中营收数据预测装置的结构框图;

图4为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

本申请提供的营收数据预测方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。终端102可以接收用户输入的待预测时间以及待预测企业标识,然后从服务器104中获取到待预测企业标识对应的第一历史营收数据,从而可以将该第一历史营收数据输入到训练得到的预测单模型中得到第一单模型预测结果。在得到第一单模型预测结果之后,终端102根据该第一单模型预测结果以及第一历史营收数据构建目标模型选择特征,从而终端将目标模型选择特征输入至已训练完成的模型分类器中即可以得到预测单模型对应的权重,然后终端102根据所得到的权重以及第一单模型预测结果即可以得到预测营收数据,整个过程不需要人工参与,即可以获取到最准确的预测结果,提高了营收数据的预测准确性。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一个实施例中,如图2所示,提供了一种营收数据预测方法,以该方法应用于图1中的终端为例进行说明,包括以下步骤:

s202:接收待预测时间以及待预测企业标识,并获取与待预测企业标识对应的第一历史营收数据。

具体地,待预测时间是指未来的某一时间,在本实施例中,提供了多种待预测时间,例如年或者季度,这样保证多样性的预测时间,可以根据用户需要进行不同的预测。待预测企业标识是可以唯一地确定待预测企业的标识,例如其可以是企业的纳税人识别号、企业的名称等。

当用户需要对某一个企业的营收数据进行预测时,则需要向终端输入该企业的企业标识,即上文中的待预测企业标识,且给出需要预测的时间。从而终端可以根据待预测企业标识查询得到对应的服务器,然后与对应的服务器进行连接,例如与该企业的财务服务器进行连接,从而终端可以从该企业的财务服务器读取到对应的第一历史营收数据。此外,各个企业的财务服务器还可以定期向终端提交各个企业最近一段时间的第一历史营收数据,以保证存储在终端一侧的第一历史营收数据的时效性,从而终端可以直接根据待预测企业标识获取到对应的第一历史营收数据即可,且如果第一历史营收数据的还缺失一部分,例如缺少最近一段时间的第一历史营收数据,则终端可以只从对应的服务器读取到缺失部分的第一历史营收数据即可,这样可以减少数据传输,提高效率。

可选地,终端在获取到第一历史营收数据之后,还可以对该第一历史营收数据进行预处理以提高模型训练的准确性。例如,终端可以删除异常数据或者是对第一历史营收数据进行处理得到模型需要输入的第一历史营收数据。其中删除异常数据可以包括终端判断第一历史营收数据中是否存在数据不全、为0或者是为空的数据,如果存在,则删除该些异常数据。终端对第一历史营收数据进行处理得到模型输入需要的第一历史营收数据可以是对第一历史营收数据进行差分,例如在删除异常数据后,终端可以判断所得到的第一历史营收数据是否需要进行差分,例如当所得到的第一历史营收数据是半年的第一历史营收数据时,则终端可以通过该半年的第一历史营收数据减去第一季度的第一历史营收数据,从而可以得到第二季度的第一历史营收数据。

s204:将第一历史营收数据输入至预测单模型中得到第一单模型预测结果。

预测单模型可以包括多个类别,例如时间序列类模型、趋势拟合类模型、时序拟合综合类模型和多因子类模型等。其中时间序列类模型可以为arima模型,其是利用时间序列数据本身建立的模型,历史生产数据其中主要包括两个字段,一个是时间字段,另外一个是营收数据字段,从而可以根据该两个字段来建立arima模型;趋势拟合类模型可以为polyfit模型,其是根据已知的营收数据构建离散点,即时间为x轴,第一历史营收数据为y轴,然后根据离散点来进行拟合构建函数作为趋势拟合模型,即所得到的拟合函数即为趋势拟合模型;时序拟合综合类模型可以是prophet模型,其是根据营收数据分段连续增长来生成分段模型的,其中可以将营收数据按照不同的增长幅度来进行分段,然后得到每一个分段对应的函数,将所有的函数组合得到预测单模型;多因子模型可以是xgboost模型,其是根据分类器的思想来构建的预测单模型,即根据时间和营收数据将第一历史营收数据进行分类,然后对分类后的第一历史营收数据进行学习得到预测单模型。

终端预先训练得到了上述多个预测单模型,当终端获取到第一历史营收数据后,将第一历史营收数据分别输入到上述多个预测单模型中从而可以得到多个预测单模型对应的第一单模型预测结果。

s206:根据第一单模型预测结果以及第一历史营收数据构建目标模型选择特征。

目标模型选择特征可以包括用于衡量各个单模型预测结果的准确性的特征以及历史生产数据自身属性的特征,例如,目标模型选择特征可以包括第一模型选择特征以及第二模型选择特征,其中第一模型选择特征是充分考虑到了单模型预测结果和历史生产数据中的真实结果之间的误差的,第二模型选择特征是用于标识历史生产数据本质的特征。

具体地,第一模型选择特征是充分考虑到了第一单模型预测结果和第一历史营收数据中的真实结果之间的误差的,从而可以考量每一个预测单模型的预测准确性。其中第一单模型预测结果即预测结果,而第一历史营收数据则是真实结果的表征,因此可以通过预测结果和真实结果来构建第一模型选择特征,例如可以选取第一单模型预测结果与第一历史营收数据中对应待预测时间的真实结果的比值作为第一模型选择特征。可选地,该第一模型选择特征可是每个预测单模型的环比上一周期的预测误差和/或每个预测单模型的历史同比周期的预测误差。

具体地,第二模型选择特征是用于标识第一历史营收数据本质的特征,第二模型选择特征可以是根据待预测时间之前的第一历史营收数据计算得到的,其可以包括周期性强弱指标和/或趋势性强弱指标。其中周期性强弱指标是用于表示第一历史营收数据中的周期性的,趋势性强弱指标是用于表示第一历史营收数据的趋势性的,例如增长或者是下降等。

s208:将第一模型选择特征和第二模型选择特征输入至已训练完成的模型分类器中得到预测单模型对应的权重。

具体地,终端在计算得到第一模型选择特征和第二模型选择特征之后,则将第一模型选择特征和第二模型选择特征输入至对应的模型分类器中,从而可以得到各个预测单模型对应的权重。权重是训练得到的模型分类器的结果,其表示了各个预测单模型对于预测营收数据的贡献,具体可以参见下文所示。

s210:根据第一单模型预测结果以及对应的权重计算得到预测营收数据。

具体地,终端在获取到模型分类器输出的各个权重后,根据第一单模型预测结果和各个权重计算即可以得到预测营收数据,例如z=h1*h+i1*i+j1*j+k1*k+l1*l+x1*x,其中h1、i1、j1、k1、l1、x1为各个预测单模型的权重,即模型选择器的输出,z为预测营收数据,h、i、j、k、l、x为各个预测单模型对应的第一单模型预测结果,通过上式进行计算即可以得到预测营收数据。

上述营收数据预测方法,可以根据第一历史营收数据得到多个第一单模型预测结果,然后根据第一单模型预测结果以及第一历史营收数据本身的特征构建目标模型选择特征,从而根据目标模型选择特征计算得到每一预测单模型对应的权重,根据该权重和第一单模型预测结果可以得到预测营收数据,不需要人工参与,即可以获取到最准确的预测结果,提高了营收数据的预测准确性。

在其中一个实施例中,模型选择器的生成方式可以包括:获取第二历史营收数据;获取训练预测时间,并将训练预测时间以及第二历史营收数据输入至预测单模型中得到第二单模型预测结果,预测单模型是预先训练得到的;根据第二单模型预测结果以及第一历史营收数据构建训练模型选择特征;根据第二历史营收数据和第二单模型预测结果确定预测单模型对应的权重;基于预测单模型对应的权重和训练模型选择特征进行训练得到模型分类器。

在其中一个实施例中,根据第二历史营收数据和第二单模型预测结果确定预测单模型对应的权重,可以包括:从第二历史营收数据中提取与训练预测时间对应的真实营收数据;计算第二单模型预测结果与真实营收数据的比值;对比值进行归一化处理得到预测单模型对应的权重。

具体地,第二历史营收数据是企业在以往的交易或者生产生活中所产生的营收数据等。终端可以首先向各个企业对应的财务服务器发送第二历史营收数据获取指令,从而各个企业的财务服务在接收到该第二历史营收数据获取指令后,将第二历史营收数据发送到对应的终端,终端在接收到第二历史营收数据后,将第二历史营收数据进行存储,例如存储在一个安全的数据库或服务器中。此外,各个企业的财务服务器还可以定期向终端提交各个企业最近一段时间的第二历史营收数据,以保证存储在终端一侧的第二历史营收数据的时效性。

且可选地,在终端获取到第二历史营收数据之后,还可以对该第二历史生产数据进行预处理以提高模型训练的准确性。例如,终端可以删除异常数据或者是对历史生产数据进行处理得到模型训练需要的历史生产数据。具体可以参见上文对于第一历史营收数据的处理。

终端在获取到第二历史营收数据后,对第二历史营收数据进行单模型训练得到多个预测单模型,如上文所述数的arima模型等,然后将训练预测时间以及第二历史营收数据输入至预测单模型中得到第二单模型预测结果。具体地,训练预测时间其也是历史时间,即已经过去的时间,在训练模型的时候,需要根据训练预测时间将第二历史营收数据划分为样本数据和校验数据,其中样本数据用于预测,校验数据用于调整预测模型或者是用于检验预测结果是否准确。

终端可以将训练预测时间对应的第二历史营收数据作为校验数据;而将训练预测时间之前的第二历史营收数据作为样本数据;终端将该样本数据和训练预测时间输入到预测单模型中可以得到每一个预测单模型所输出的单模型预测结果。例如训练预测时间为2018年第三季度,则可以获取到2018年之前的历史生产数据作为样本数据,将该样本数据输入到预测单模型中即可以得到与训练预测时间对应的第二单模型预测结果,例如可以得到arima模型的预测结果,polyfit模型的预测结果,prophet模型的预测结果以及xgboost模型的预测结果等。

终端还需要可以根据第二单模型预测结果以及第二历史营收数据构建训练模型选择特征,训练模型选择特征可以包括用于衡量各个单模型预测结果的准确性的特征以及历史生产数据自身属性的特征,例如,训练模型选择特征可以包括第三模型选择特征以及第四模型选择特征,其中第三模型选择特征是充分考虑到了单模型预测结果和历史生产数据中的真实结果之间的误差的,第四模型选择特征是用于标识历史生产数据本质的特征。具体地,第三模型选择特征是充分考虑到了第二单模型预测结果和第二历史营收数据中的真实结果之间的误差的,从而可以考量每一个预测单模型的预测准确性。其中第二单模型预测结果即预测结果,而第二历史营收数据则是真实结果的表征,因此可以通过预测结果和真实结果来构建第三模型选择特征,例如可以选取第二单模型预测结果与历史生产数据中对应训练预测时间的真实结果的比值作为第三模型选择特征。可选地,该第三模型选择特征可是每个预测单模型的环比上一周期的预测误差和/或每个预测单模型的历史同比周期的预测误差。第四模型选择特征是用于标识第二历史营收数据本质的特征,第四模型选择特征可以是根据训练预测时间之前的第二历史营收数据计算得到的,其可以包括周期性强弱指标和/或趋势性强弱指标。其中周期性强弱指标是用于表示第二历史营收数据中的周期性的,趋势性强弱指标是用于表示第二历史营收数据的趋势性的,例如增长或者是下降等。第三模型选择特征和第四模型选择特征的计算方式可以参见下文中的第一模型选择特征以及第二模型选择特征的计算方式。

模型分类器的训练过程可以是将预测单模型的权重作为y值,然后将所构建的第三模型选择特征和第四模型选择特征作为x值,对y值和x值之间的对应关系进行学习得到模型分类器。终端首先确定训练预测时间,然后根据单模型预测值和训练预测时间对应的第二历史营收数据确定训练预测时间对应的y值,从而可以建立y值和x值之间的对应关系,将所有的y值和x值标记于坐标系中得到多个离散的点,然后对多个离散的点进行拟合从而可以得到模型分类器。

在本实施例中,y值是每一个预测单模型的权重,终端可以从第二历史营收数据中提取到真实结果,即与训练预测时间对应的真实结果,然后将真实结果与第二单模型预测结果进行比较,通过每个第二单模型预测结果与真实结果的比值可以得到每一个预测单模型作为最优单模型的可能性,即比值。且可选地,终端可以将一个预测单模型作为最优单模型的可能性进行归一化即可以得到上述每个预测单模型对应的权重,从而终端对该些权重和对应的x值进行学习即可以得到模型分类器。其中归一化的过程可以包括:假设上述所计算的比值为a、b、c、d,则归一化的方式为a1=a/(a+b+c+d),b1=b/(a+b+c+d),c1=c/(a+b+c+d),d1=d/(a+b+c+d),所计算得到的a1、b1、c1、d1即为归一化后的权重。

这样当模型选择器中输入第一模型选择特征和第二模型选择特征时,模型分类器输出的是每个预测单模型的权重,例如第一预测单模型权重为0.25,第二预测单模型权重为0.15,第三预测单模型权重为0.2,第四预测单模型权重为0.4。从而终端可以根据该些预测单模型的单模型预测结果以及权重计算得到最后的预测结果,即预测时间对应的预测营收数据。

具体地,下文中将结合上述模型选择特征来对模型训练器的训练过程进行详细地说明:

以上述环比上一周期预测结果的预测误差、同比上一周期预测结果的预测误差、周期性强弱指标、趋势性强弱指标作为模型选择特征;以历史数据为2015年-2017年的营收数据为例,终端计算上述周期性强弱指标a和趋势性强弱指标b,然后根据训练预测时间计算每个预测单模型对应的环比上一周期预测结果的预测误差、同比上一周期预测结果的预测误差,假设存在4个预测单模型,则对应存在4个环比上一周期预测结果的预测误差c、d、e、f以及4个同比上一周期预测结果的预测误差m、n、p、q,因此建立模型分类器y=a2*a+b2*b+c2*c+d2*d+e1*e+f1*f+m1*m+n1*n+p1*p+q1*q,其中a2、b2、c2、d2、e1、f1、m1、n1、p1以及q1为各个模型选择特征的权重,通过拟合训练可以得到a2、b2、c2、d2、e1、f1、m1、n1、p1以及q1的值,在a2、b2、c2、d2、e1、f1、m1、n1、p1以及q1的值确定后,则可以得到模型分类器。

上述实施例中,在建立模型分类器的时候,充分考虑了个多个单模型的单模型预测结果以及第二历史营收数据,并根据单模型预测结果和第二历史营收数据据构建得到了第三模型选择特征,根据第二历史营收数据构建得到第四模型选择特征,从而根据第三模型选择特征和第四模型选择特征进行训练得到了模型分类器,这样模型分类器充分考虑了各个模型的特点以及第二历史营收数据的特征,从而可以提高模型预测的准确性。

在其中一个实施例中,根据第一单模型预测结果以及第一历史营收数据构建目标模型选择特征,可以包括:根据第一单模型预测结果以及第一历史营收数据构建第一模型选择特征;根据第一历史营收数据构建第二模型选择特征。

在其中一个实施例中,将第一历史营收数据输入至预测单模型中得到第一单模型预测结果,可以包括:获取待预测时间对应的特征周期;通过预测单模型计算得到与特征周期对应的预测值。根据第一单模型预测结果以及第一历史营收数据构建第一模型选择特征,可以包括:从第一历史营收数据提取与特征周期对应的真实值;根据预测值和真实值计算得到第一模型选择特征。其中特征周期可以是环比上一周期或同比上一周期,当是环比上一周期时,第一模型选择特征是环比预测误差,当是同比上一周期时,第一模型选择特征是同比上一周期。

在其中一个实施例中,根据第一历史营收数据构建第二模型选择特征,可以包括:获取预设周期长度和区间,根据预设周期长度对第一历史营收数据进行分段;获取每一区间中对应的分段的第一历史营收数据,并对所获取的第一历史营收数据进行排序,并标记排序后的第一历史营收数据的顺序值;计算每一区间对应的分段的第一历史营收数据的顺序值的偏差值;计算偏差值的平均值得到周期性强弱指标作为第二模型选择特征。

在其中一个实施例中,根据第一历史营收数据构建第二模型选择特征,可以包括:获取预设周期长度,根据预设周期长度对第一历史营收数据进行分段;根据每一分段的第一历史营收数据与上一分段的第一历史营收数据计算得到增减幅度;根据增减幅度得到每一分段的第一历史营收数据的增减幅度标记值;计算增减幅度标记值的平均值得到趋势性强弱指标作为第二模型选择特征。

具体地,上述模型分类器中涉及到第一模型选择特征和第二模型选择特征,且为了方便,在下文中将两个特征并称为模型选择特征进行说明。即模型选择特征可以包括环比上一周期预测结果的预测误差、同比上一周期预测结果的预测误差、周期性强弱指标、趋势性强弱指标。

其中环比上一周期预测结果的预测误差中周期可以是指一个季度或者是一个年份,环比上一周期预测结果的预测误差是针对每一个预测单模型以及训练预测时间来说的,每一个预测单模型均对应一个环比上一周期预测结果的预测误差。终端可以获取到待预测时间,然后获取到环比上一周期,并通过预测单模型计算得到环比上一周期对应的第一预测值,并从第一历史营收数据中提取与环比上一周期对应的第一真实值,终端然后根据第一预测值与第一真实值的比值得到环比上一周期预测结果的预测误差,即上述的第一模型选择特征。

具体地,以其中一个预测单模型的一个待预测时间来进行说明,假设待预测时间为2018年第四季度,则终端首先获取到2018年第三季度该预测单模型对应的第一预测值,然后终端从第一历史营收数据中提取到2018年第三季度该预测单模型的第一真实值,将第一预测值与第一真实值的比值作为环比上一周期预测结果的预测误差。

其中同比上一周期预测结果的预测误差中周期可以是指一个季度或者是一个年份,同比上一周期预测结果的预测误差是针对每一个预测单模型以及待预测时间来说的,每一个预测单模型均对应一个同比上一周期预测结果的预测误差。终端可以获取到待预测时间,然后获取到同比上一周期,并通过预测单模型计算得到同比上一周期对应的第二预测值,并从第一历史营收数据中提取与同比上一周期对应的第二真实值,终端然后根据第二预测值与第二真实值的比值得到同比上一周期预测结果的预测误差,即上述的第一模型选择特征。

具体地,以其中一个预测单模型的一个待预测时间来进行说明,假设待预测时间为2018年第四季度,则终端首先获取到2017年第四季度该预测单模型对应的第二预测值,然后终端从第一历史营收数据中提取到2017年第四季度该预测单模型的第二真实值,将第二预测值与第二真实值的比值作为同比上一周期预测结果的预测误差。

其中,周期性强弱指标是用于表征第一历史营收数据中的周期性特征的。终端在获取到第一历史营收数据后,获取到预设周期长度和区间,例如预设周期长度为季度,区间可以为年,即一个区间中可以包括多个周期。终端可以根据周期长度对第一历史营收数据进行分段,然后获取到每一个区间中对应的分段中的第一历史营收数据并进行排序,并对排序后的第一历史营收数据进行标记得到顺序值,然后计算每一区间中的对应分段的第一历史营收数据的顺序值的偏差值,计算偏差值的平均值得到周期性强弱指标,即上述的第二模型选择特征。

具体地,以周期长度为季度,区间长度为年份为例进行说明,假设第一历史营收数据包括2015年、2016年和2017年的营收数据,因此终端首先将该些第一历史营收数据按照周期长度进行分段,分为2015年第一季度、第二季度、第三季度和第四季度,2016年第一季度、第二季度、第三季度和第四季度以及2017年的第一季度、第二季度、第三季度和第四季度,然后对每一区间中对应的分段进行排序,并标记排序后的分段的顺序值,具体可以参见下表1所示:

表1排序结果

如上表所示,2015年为第一区间,2016年为第二区间,2017年为第三区间,其中每一区间中的对应分段即2015年的第一季度、2016年的第一季度以及2017年的第一季度,终端可以对该3个分段的第一历史营收数据进行排序,即对第一历史营收数据进行排序,并标记排序后每一个分段的顺序值,例如最大值为1,其次为2,依次标记下去。这样将每一区间的对应分段都排序完成。

在排序完成后,终端获取到每一个区间中的顺序值,根据该顺序值计算得到偏差值,例如上述2015年对应的第一区间的顺序值包括1、2、3、2,终端计算1、2、3、2的偏差值,例如可以计算1、2、3、2的标准差,同样地,终端还可以计算其他区间的标准差,最后将所有标准差的平均值作为周期性强弱指标。

其中,趋势性强弱指标是用于表征第一历史营收数据的趋势性特征的。终端在获取到第一历史营收数据后,获取到预设周期长度,例如预设周期长度为季度。终端可以根据周期长度对第一历史营收数据进行分段,然后根据当前分段的第一历史营收数据和上一分段的第一历史营收数据计算得到增减幅度,并可以根据该增减幅度对每一分段的第一历史营收数据进行标记得到增减幅度标记值,终端最后计算增减幅度标记值的平均值得到趋势性强弱指标,即上述的第二模型选择特征。

具体地,以周期长度为季度为例进行说明,假设第一历史营收数据包括2015年、2016年和2017年的营收数据,因此终端首先将该些第一历史营收数据按照周期长度进行分段,分为2015年第一季度、第二季度、第三季度和第四季度,2016年第一季度、第二季度、第三季度和第四季度以及2017年的第一季度、第二季度、第三季度和第四季度,然后针对每一分段计算得到增减幅度值,例如2015年第一季度的营收数据和2015年第二季度的营收数据的连线的斜率可以作为2015年第二季度的增减幅度值,同样地,还可以计算其他分段,即其他的周期的增减幅度值。在计算完增减幅度值后,终端根据增减幅度值计算得到增减幅度标记值,例如当增减幅度值大于0时,则其增减幅度标记值为+1,当增减幅度值小于0时,则增减幅度标记值为-1,当增减幅度等于0时,则增减幅度标记值为0。终端在获取到所有的增减幅度标记值后,可以计算标记幅度标记值的平均值,该些平均值即为趋势性强弱指标,即上述的第二模型选择特征。

上述实施例中,根据第一历史营收数据和各个预测单模型可以计算得到环比上一周期预测结果的预测误差、同比上一周期预测结果的预测误差、周期性强弱指标、趋势性强弱指标,从而再将指标输入至模型分类器中,保证了模型分类器输出的营收数据预测结果的准确性。

应该理解的是,虽然图2的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中,如图3所示,提供了一种营收数据预测装置,包括:接收模块100、第一单模型预测结果获取模块200、第一特征构建模块300、预测模块400和营收数据计算模块500,其中:

接收模块100,用于接收待预测时间以及待预测企业标识,并获取与待预测企业标识对应的第一历史营收数据。

第一单模型预测结果获取模块200,用于将第一历史营收数据输入至预测单模型中得到第一单模型预测结果。

第一特征构建模块300,用于根据第一单模型预测结果以及第一历史营收数据构建目标模型选择特征。

预测模块400,用于将第一模型选择特征和第二模型选择特征输入至模型分类器中得到预测单模型对应的权重。

营收数据计算模块500,用于根据第一单模型预测结果以及对应的权重计算得到预测营收数据。

在其中一个实施例中,营收数据预测装置还可以包括:

第一训练模块,用于获取第二历史营收数据。

第二单模型预测结果获取模块,用于获取训练预测时间,并将训练预测时间以及第二历史营收数据输入至预测单模型中得到第二单模型预测结果,预测单模型是预先训练得到的。

第三特征构建模块,用于根据第二单模型预测结果以及第一历史营收数据构建目标模型选择特征。

权重计算模块,用于根据第二历史营收数据和第二单模型预测结果确定预测单模型对应的权重。

第二训练模块,用于基于预测单模型对应的权重和训练模型选择特征进行训练得到模型分类器。

在其中一个实施例中,权重计算模块可以包括:

提取单元,用于从第二历史营收数据中提取与训练预测时间对应的真实营收数据。

比值计算单元,用于计算第二单模型预测结果与真实营收数据的比值。

归一化单元,用于对比值进行归一化处理得到预测单模型对应的权重。

在其中一个实施例中,第一特征构建模块300可以包括:

第一特征构建单元,用于根据所述第一单模型预测结果以及第一历史营收数据构建第一模型选择特征。

第二特征构建单元,用于根据所述第一历史营收数据构建第二模型选择特征。

在其中一个实施例中,第一单模型预测结果获取模块200可以包括:

周期获取单元,用于获取待预测时间对应的特征周期。

预测值计算单元,用于通过预测单模型计算得到与特征周期对应的预测值。

第一特征构建单元包括:

真实值计算单元,用于从第一历史营收数据提取与特征周期对应的真实值。

模型选择特征计算单元,用于根据预测值和真实值计算得到第一模型选择特征。

在其中一个实施例中,第二特征构建单元可以包括:

第一分段单元,用于获取预设周期长度和区间,根据预设周期长度对第一历史营收数据进行分段。

排序单元,用于获取每一区间中对应的分段的第一历史营收数据,并对所获取的第一历史营收数据进行排序,并标记排序后的第一历史营收数据的顺序值。

偏差值计算单元,用于计算每一区间对应的分段的第一历史营收数据的顺序值的偏差值。

第三模型选择特征计算单元,用于计算偏差值的平均值得到周期性强弱指标作为第二模型选择特征。

在其中一个实施例中,第二特征构建单元可以包括:

第二分段单元,用于获取预设周期长度,根据预设周期长度对第一历史营收数据进行分段。

增减幅度计算单元,用于根据每一分段的第一历史营收数据与上一分段的第一历史营收数据计算得到增减幅度。

标记单元,用于根据增减幅度得到每一分段的第一历史营收数据的增减幅度标记值。

第四模型选择特征计算单元,用于计算增减幅度标记值的平均值得到趋势性强弱指标作为第二模型选择特征。

关于营收数据预测装置的具体限定可以参见上文中对于营收数据预测方法的限定,在此不再赘述。上述营收数据预测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图4所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种营收数据预测方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解,图4中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

在一个实施例中,提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现以下步骤:接收待预测时间以及待预测企业标识,并获取与待预测企业标识对应的第一历史营收数据;将第一历史营收数据输入至预测单模型中得到第一单模型预测结果;根据第一单模型预测结果以及第一历史营收数据构建目标模型选择特征;将目标模型选择特征输入至已训练完成的模型分类器中得到各个预测单模型对应的权重;根据第一单模型预测结果以及对应的权重计算得到预测营收数据。

在一个实施例中,处理器执行计算机程序时所涉及的模型选择器的生成方式可以包括:获取第二历史营收数据;获取训练预测时间,并将训练预测时间以及第二历史营收数据输入至预测单模型中得到第二单模型预测结果,预测的那模型是预先训练得到的;根据第二单模型预测结果以及第一历史营收数据构建训练模型选择特征;根据第二历史营收数据和第二单模型预测结果确定预测单模型对应的权重;基于预测单模型的权重和训练进行训练得到模型分类器。

在一个实施例中,处理器执行计算机程序时所实现的根据第二历史营收数据和第二单模型预测结果确定预测单模型对应的权重,可以包括:从第二历史营收数据中提取与训练预测时间对应的真实营收数据;计算第二单模型预测结果与真实营收数据的比值;对比值进行归一化处理得到预测单模型对应的权重。

在一个实施例中,处理器执行计算机程序时所实现的根据第一单模型预测结果以及第一历史营收数据构建目标模型选择特征,可以包括:根据第一单模型预测结果以及第一历史营收数据构建第一模型选择特征;根据第一历史营收数据构建第二模型选择特征。

在一个实施例中,处理器执行计算机程序时所实现的将第一历史营收数据输入至预测单模型中得到第一单模型预测结果,可以包括:获取待预测时间对应的特征周期;通过预测单模型计算得到与特征周期对应的预测值;处理器执行计算机程序时所实现的根据第一单模型预测结果以及第一历史营收数据构建第一模型选择特征,可以包括:从第一历史营收数据提取与特征周期对应的真实值;根据预测值和真实值计算得到第一模型选择特征。

在一个实施例中,处理器执行计算机程序时所实现的根据第一历史营收数据构建第二模型选择特征,可以包括:获取预设周期长度和区间,根据预设周期长度对第一历史营收数据进行分段;获取每一区间中对应的分段的第一历史营收数据,并对所获取的第一历史营收数据进行排序,并标记排序后的第一历史营收数据的顺序值;计算每一区间对应的分段的第一历史营收数据的顺序值的偏差值;计算偏差值的平均值得到周期性强弱指标作为第二模型选择特征。

在一个实施例中,处理器执行计算机程序时所实现的根据第一历史营收数据构建第二模型选择特征,可以包括:获取预设周期长度,根据预设周期长度对第一历史营收数据进行分段;根据每一分段的第一历史营收数据与上一分段的第一历史营收数据计算得到增减幅度;根据增减幅度得到每一分段的第一历史营收数据的增减幅度标记值;计算增减幅度标记值的平均值得到趋势性强弱指标作为第二模型选择特征。

在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:接收待预测时间以及待预测企业标识,并获取与待预测企业标识对应的第一历史营收数据;将第一历史营收数据输入至预测单模型中得到第一单模型预测结果;根据第一单模型预测结果以及第一历史营收数据构建目标模型选择特征;将目标模型选择特征输入至已训练完成的模型分类器中得到各个预测单模型对应的权重;根据第一单模型预测结果以及对应的权重计算得到预测营收数据。

在一个实施例中,计算机程序被处理器执行时所涉及的模型选择器的生成方式可以包括:获取第二历史营收数据;获取训练预测时间,并将训练预测时间以及第二历史营收数据输入至预测单模型中得到第二单模型预测结果,预测的那模型是预先训练得到的;根据第二单模型预测结果以及第一历史营收数据构建训练模型选择特征;根据第二历史营收数据和第二单模型预测结果确定预测单模型对应的权重;基于预测单模型的权重和训练进行训练得到模型分类器。

在一个实施例中,计算机程序被处理器执行时所实现的根据第二历史营收数据和第二单模型预测结果确定预测单模型对应的权重,可以包括:从第二历史营收数据中提取与训练预测时间对应的真实营收数据;计算第二单模型预测结果与真实营收数据的比值;对比值进行归一化处理得到预测单模型对应的权重。

在一个实施例中,计算机程序被处理器执行时所实现的根据第一单模型预测结果以及第一历史营收数据构建目标模型选择特征,可以包括:根据第一单模型预测结果以及第一历史营收数据构建第一模型选择特征;根据第一历史营收数据构建第二模型选择特征。

在一个实施例中,计算机程序被处理器执行时所实现的将第一历史营收数据输入至预测单模型中得到第一单模型预测结果,可以包括:获取待预测时间对应的特征周期;通过预测单模型计算得到与特征周期对应的预测值;处理器执行计算机程序时所实现的根据第一单模型预测结果以及第一历史营收数据构建第一模型选择特征,可以包括:从第一历史营收数据提取与特征周期对应的真实值;根据预测值和真实值计算得到第一模型选择特征。

在一个实施例中,计算机程序被处理器执行时所实现的根据第一历史营收数据构建第二模型选择特征,可以包括:获取预设周期长度和区间,根据预设周期长度对第一历史营收数据进行分段;获取每一区间中对应的分段的第一历史营收数据,并对所获取的第一历史营收数据进行排序,并标记排序后的第一历史营收数据的顺序值;计算每一区间对应的分段的第一历史营收数据的顺序值的偏差值;计算偏差值的平均值得到周期性强弱指标作为第二模型选择特征。

在一个实施例中,计算机程序被处理器执行时所实现的根据第一历史营收数据构建第二模型选择特征,可以包括:获取预设周期长度,根据预设周期长度对第一历史营收数据进行分段;根据每一分段的第一历史营收数据与上一分段的第一历史营收数据计算得到增减幅度;根据增减幅度得到每一分段的第一历史营收数据的增减幅度标记值;计算增减幅度标记值的平均值得到趋势性强弱指标作为第二模型选择特征。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。

以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1