一种数据处理方法、装置及计算设备与流程

文档序号:18888740发布日期:2019-10-15 21:22阅读:121来源:国知局
一种数据处理方法、装置及计算设备与流程

本申请属于数据分析与处理技术领域,尤其涉及一种数据处理方法、装置及计算设备。



背景技术:

对于产品(如计算机数控cnc产品)的生产及销售企业来说,需求量(销量)的预判非常重要,能够为产品的仓储、备件资源的调配提供便利。

目前,通常采用自回归方式,通过利用企业多年的历史销量数据进行自回归建模,并利用模型对产品销量进行自回归预判来确定产品的需求量。

然而该确定企业产品需求量的方式仅以企业历史销量数据这一种影响因素作为数据依据,未能发现与产品需求量密切相关的其他隐含影响因素,这会导致最终产品需求量确定结果的准确率较低。由此,提供一种能够高准确率地确定产品需求量等目标参数的取值的实现方案,于本领域而言十分必要。



技术实现要素:

有鉴于此,本申请的目的在于提供一种数据处理方法、装置及计算设备,以用于高准确率地确定产品需求量等目标参数的取值。

为此,本申请公开如下技术方案:

一种数据处理方法,包括:

获取n个第一类参数的第一参数值,所述n为大于1的整数;

按自回归方式,基于所述第一类参数的第一参数值确定所述第一类参数在预定时间的第二参数值;

基于所述第一类参数的第二参数值确定所述第一类参数的特征值;

基于各个第一类参数的特征值,确定目标参数在所述预定时间的取值,得到目标参数值。

上述方法,优选的,还包括:预先确定所述n个第一类参数;所述预先确定所述n个第一类参数包括:

对m个第一类参数中的每个第一类参数进行与所述目标参数间的相关性分析,得到每个第一类参数对所述目标参数产生影响的影响值;

构建每个第一类参数对应的第一处理模型,并确定每个第一类参数对应的第一处理模型的处理准确度;其中,所述第一处理模型为自回归模型;

基于m个第一类参数中每个第一类参数对应的影响值及第一处理模型的处理准确度,确定用于对所述目标参数的参数值进行确定的n个第一类参数;

其中,所述m为大于1的整数,所述m不小于所述n。

上述方法,优选的,所述按自回归方式,基于所述第一类参数的第一参数值确定所述第一类参数在预定时间的第二参数值,包括:

将所述第一类参数的第一参数值输入所述第一类参数对应的第一处理模型,得到该第一处理模型输出的该第一类参数在所述预定时间的第二参数值;

所述基于所述第一类参数的第二参数值确定所述第一类参数的特征值,包括:

基于所述第一类参数的第二参数值及所述第一类参数对应的影响值,确定所述第一类参数的特征值。

上述方法,优选的,所述第一类参数的第一参数值为对应于相应不同历史时间的时序数据;在对所述第一类参数进行与所述目标参数间的相关性分析时,还得到该第一类参数对所述目标参数产生影响时所对应的滞后信息,所述第一类参数的时序数据对应的所述不同历史时间为根据该第一类参数对应的滞后信息确定的时间;

所述第一处理模型输出第一类参数的第二参数值,包括:

所述第一处理模型基于第一类参数的时序数据的时序特征,输出该第一类参数在预定时间的第二参数值。

上述方法,优选的,所述基于各个第一类参数的特征值,确定目标参数在所述预定时间的取值,得到目标参数值,包括:

将各个第一类参数的特征值输入预先构建的第二处理模型,得到所述第二处理模型输出的所述目标参数在所述预定时间的取值。

上述方法,优选的,其中,在确定目标参数的取值之前,所述方法还包括:

获取至少一个第二类参数的参数值;

对所述至少一个第二类参数的参数值进行量化处理,得到所述至少一个第二类参数的量化值,以使得结合各个第一类参数的特征值以及所述至少一个第二类参数的量化值确定所述目标指标的取值;

其中,第二类参数的量化值,用于表征该第二类参数对所述目标参数所产生影响的影响程度。

一种数据处理装置,包括:

第一获取单元,用于获取n个第一类参数的第一参数值,所述n为大于1的整数;

第一确定单元,用于按自回归方式,基于所述第一类参数的第一参数值确定所述第一类参数在预定时间的第二参数值;

第二确定单元,用于基于所述第一类参数的第二参数值确定所述第一类参数的特征值;

第三确定单元,用于基于各个第一类参数的特征值,确定目标参数在所述预定时间的取值,得到目标参数值。

上述装置,优选的,该装置还包括:

第四确定单元,用于预先确定所述n个第一类参数;

所述第四确定单元预先确定所述n个第一类参数,具体包括:

对m个第一类参数中的每个第一类参数进行与所述目标参数间的相关性分析,得到每个第一类参数对所述目标参数产生影响的影响值;

构建每个第一类参数对应的第一处理模型,并确定每个第一类参数对应的第一处理模型的处理准确度;其中,所述第一处理模型为自回归模型;

基于m个第一类参数中每个第一类参数对应的影响值及第一处理模型的处理准确度,确定用于对所述目标参数的参数值进行确定的n个第一类参数;

其中,所述m为大于1的整数,所述m不小于所述n。

上述装置,优选的,该装置还包括:

第二获取单元,用于在确定目标参数的取值之前,获取至少一个第二类参数的参数值;

量化单元,用于对所述至少一个第二类参数的参数值进行量化处理,得到所述至少一个第二类参数的量化值,以使得结合各个第一类参数的特征值以及所述至少一个第二类参数的量化值确定所述目标指标的取值;

其中,第二类参数的量化值,用于表征该第二类参数对所述目标参数所产生影响的影响程度。

一种计算设备,包括:

存储器,用于至少存储一组指令集;

处理器,用于调用并执行所述存储器中的所述指令集,通过执行所述指令集执行权利要求1-6任一项所述的方法。

由以上方案可知,本申请提供的数据处理方法、装置及计算设备,基于多个第一类参数的特征值确定目标参数在预定时间的取值,从而在确定目标参数值时综合考虑了多个第一类参数所表征的多个影响因素,相应可较为准确地确定目标参数的取值,另外,由于本申请基于自回归方式确定各个第一类参数在预定时间的第二参数值,进而基于各个第一类参数在预定时间的第二参数值确定其特征值,而非直接基于各个第一类参数的第一参数值确定其特征值,从而,可使得第一类参数的特征值的确定更为准确,进一步提升了最终基于各第一类参数的特征值所确定出的所述目标参数值的准确率。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1是本申请一可选实施方式提供的数据处理方法的流程示意图;

图2是本申请另一可选实施方式提供的数据处理方法的流程示意图;

图3是本申请一可选实施方式提供的预先确定n个第一类参数的流程示意图;

图4是本申请又一可选实施方式提供的数据处理方法的流程示意图;

图5是本申请一可选实施方式提供的对第一类参数进行滚动自回归处理的示意图;

图6是本申请一可选实施方式提供的预判多期目标参数值的示意图;

图7是本申请再一可选实施方式提供的数据处理方法的流程示意图;

图8-图10分别是本申请不同可选实施方式提供的数据处理装置的结构示意图;

图11是本申请一可选实施方式提供的计算设备的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

本申请提供了一种数据处理方法、装置及计算设备,用于高准确率地确定产品需求量/销量等目标参数在预定时间的取值。以下将通过具体实施例对本申请的数据处理方法、装置及计算设备进行说明。

参考图1,为本申请提供的一种数据处理方法一个可选实施方式的流程示意图,该数据处理方法可以应用于计算设备中,该计算设备可以是但不限于:智能手机、平板电脑、膝上型便携计算机、笔记本电脑、一体机或台式机等终端设备,或云端/局域网等环境中的服务器。

如图1所示,本实施例中,所述数据处理方法可以包括以下处理步骤:

步骤101、获取n个第一类参数的第一参数值,所述n为大于1的整数。

本申请提供的数据处理方法,主要用于根据目标参数的多个影响因素所对应的多个参数的已有参数值,来确定目标参数在预定时间的取值,比如,根据cnc(computerizednumericalcontrol,计算机数控)产品销量的各影响因素所对应的历史参数数据,来确定未来某个月cnc产品的需求量/销量等。

接下来,本实施例将主要以确定产品需求量/销量等目标参数在预定时间的取值为例,对本申请方案进行详细阐述。

所述n个第一类参数,为能够对目标参数的取值产生影响的多个影响因素所对应的多个参数,以所述目标参数为产品需求量/销量为例,所述n个第一类参数为对该产品需求量/销量这一目标参数产生影响的n个影响因素所对应的参数。所述n个第一类参数的第一参数值则为所述n个第一类参数的历史数值。

更进一步地,本申请中,所述第一类参数为对产品需求量/销量产生影响的客观类因素所对应的参数,示例性地,在所述目标参数具体为cnc产品需求量/销量的情况下,该第一类参数具体地可以包括:

1)企业内部参数:

包括但不限于cnc产品历史销量(如前一年或前6个月中每个月的销量等)、历史销售线索/渠道和商机数据等中的任一种或多种;

2)企业外部参数:

包括但不限于宏观经济历史数据(如cnc产品所加工的原材料的期货数据(期货价格等))、供应商所在地gdp历史数据、行业gdp历史数据、制造业pmi(purchasingmanagers'index,采购经理指数)、cpi(consumerpriceindex,居民消费价格指数)历史数据、下游行业历史数据(如利用cnc生产的电器或者汽车/挖掘机等重型机械的历史销量)、竞对对手的历史数据(如竞争对手cnc产品历史销量、销售渠道/商机等等)、垂直行业历史数据(如针对利用cnc生产的汽车,可统计驾驶员人数、最近一年新增的驾照数量)等中的任一种或多种。

上述的各类企业内部数据以及企业外部数据所对应的参数均为客观类参数,具体实施中,可基于企业内部数据库或借助第三方渠道来分别获取这些客观类参数的历史数据,其中,对于非数值型取值的参数(如商机等),可通过量化手段基于其对目标参数所产生的客观影响将其取值量化为数值型取值。

与目前仅基于cnc产品的历史销量,通过自回归方式确定cnc产品在预定时间的需求量/销量(如确定其未来12期(1个月作为1期)的需求量/销量)相区别的是,本申请在确定cnc产品的需求量/销量等目标参数在预定时间的取值时,除了将其历史销量作为一个影响因素,还引入了能够对cnc产品的需求量/销量等目标参数值产生影响的、与其密切相关的其他潜在/隐含因素,即上述的各类企业内部参数及各类企业外部参数所对应的因素。

步骤102、按自回归方式,基于所述第一类参数的第一参数值确定所述第一类参数在预定时间的第二参数值。

在获得所述n个第一类参数的第一参数值,也即所述n个第一类参数的历史数据后,本申请并不直接采用所述n个第一类参数的历史数据对所述目标参数在预定时间的取值进行确定,具体地,以所述目标参数为上述的cnc产品需求量/销量为例,本申请并不直接利用所述cnc产品历史销量、历史销售线索/渠道和商机等各类企业内部历史数据,以及宏观经济历史数据、供应商所在地gdp历史数据、行业gdp历史数据等各类企业外部历史数据,对所述cnc产品在预定时间(如未来某期)的需求量/销量进行预判,而是先针对上述的多个第一类参数中的每个第一类参数,按自回归方式,基于该每个第一类参数的历史数据,预判该第一类参数在所述预定时间(也即预判目标参数的取值时对应要求的时间)的取值。

具体实施中,可预先基于梯度下降树(gdbt,gradientboostingdecisiontree,)、随机森林(rf,randomforest)或支持向量回归机(svr,supportvectorregression)等算法,利用每个第一类参数的批量样本数据来构建每个第一类参数的自回归模型。

进而在此基础上,当存在针对每个第一类参数的自回归处理需求时,可利用每个第一类参数的自回归模型、基于该第一类参数的历史数据即其第一参数值来对该第一类参数进行自回归预判,以得到该第一类参数在所述预定时间的预判值,也即该第一类参数的所述第二参数值。

步骤103、基于所述第一类参数的第二参数值确定所述第一类参数的特征值。

在对多个第一类参数进行自回归处理,得到多个第一类参数在所述预定时间的预判值,即所述第二参数值后,可进一步基于每个第一类参数的第二参数值确定其特征值,本申请中,第一类参数的特征值通常为对第一类参数的第二参数值进行相应处理后所得的取值,该部分将在下文进行详细阐述,所得的各个第一类参数的特征值,最终可用于对所述目标参数在所述预定时间的取值进行预判。

步骤104、基于各个第一类参数的特征值,确定目标参数在所述预定时间的取值,得到目标参数值。

在得到各个第一类参数的特征值之后,最终可基于各个第一类参数的特征值来确定所述目标参数在所述预定时间的取值。

由以上方案可知,本申请实施例提供的数据处理方法,基于多个第一类参数的特征值确定目标参数在预定时间的取值,从而在确定目标参数值时综合考虑了多个第一类参数所表征的多个影响因素,相应可较为准确地确定目标参数的取值,另外,由于本申请基于自回归方式确定各个第一类参数在预定时间的第二参数值,进而基于各个第一类参数在预定时间的第二参数值确定其特征值,而非直接基于各个第一类参数的第一参数值确定其特征值,从而,可使得第一类参数的特征值的确定更为准确,进一步提升了最终基于各第一类参数的特征值所确定出的所述目标参数值的准确率。

在本申请实施例的一可选实施方式中,参考图2示出的数据处理方法的流程示意图,该数据处理方法在所述步骤101获取n个第一类参数的第一参数值之前,还可以包括以下的预处理:

步骤101’、预先确定所述n个第一类参数。

如图3所示,具体可通过以下的处理过程,确定出所述用于对目标参数值进行预判的n个第一类参数:

步骤301、对m个第一类参数中的每个第一类参数进行与所述目标参数间的相关性分析,得到每个第一类参数对所述目标参数产生影响的影响值。

其中,所述m为大于1的整数,所述m不小于所述n。

本申请的发明人通过分析、研究不同因素对目标参数的取值产生影响的影响情况,预先初步确定出了对应于多个影响因素的m个第一类参数,该m个第一类参数,可以为数量不少于所述n的上述企业内部参数和/或上述企业外部参数。

在此基础上,为了进一步确保最终所得的目标参数在预定时间的取值的准确性,本申请提出了进一步对所述m个第一类参数进行筛选,以从中筛选出对目标参数值的预判更为有利、可使得最终所得的目标参数值更为准确的多个高价值参数,即所述n个第一类参数。

通常某个第一类参数在某一时间的取值,并不会在同一时间对目标参数的取值产生影响,而是在某一段时间(可以为一个时间范围,比如在之后的4-6个月内对目标参数的取值产生影响等)之后该影响才体现出来,也即,该第一类参数的取值对目标参数的取值的影响存在滞后。具体地,比如,cnc产品下游行业的某个第一类参数如汽车销量值等取值发生变化,则往往会在几个月(如4~6个月)之后才会影响cnc产品的销量,这就使得汽车销量的取值对cnc产品销量的影响存在滞后。

基于该特点,实际实施中,可以根据每个第一类参数对所述目标参数所产生影响的滞后关系,对各个第一类参数与所述目标参数进行相关性分析,其中,可以但不限于采用滞后pearson相关系数,标准互信息数,fdl(有限置换模型)等相关性分析手段,来分析每个第一类参数与所述目标参数之间的相关性,相应可得到每个第一类参数对所述目标参数所产生的影响的影响值,该影响值具体可以是一个基于相关性分析所输出的影响评分或者相关性系数,通常第一类参数所对应的影响评分/相关性系数的值越大,则该第一类参数对所述目标参数所产生影响的影响程度越高。

在利用上述的相关性分析手段,分析每个第一类参数与所述目标参数的相关性时,除了可得到每个第一类参数对所述目标参数所产生影响的影响值,如影响评分/相关性系数等,还可以得到该第一类参数对所述目标参数产生影响时所对应的滞后信息,其中,该滞后信息具体可以是滞后阶数,该滞后信息用于反映第一类参数的取值具体会在多长的时间之后对所述目标参数产生影响。

步骤302、构建每个第一类参数对应的第一处理模型,并确定每个第一类参数对应的第一处理模型的处理准确度;其中,所述第一处理模型为自回归模型。

如上文所述,可基于梯度下降树、随机森林或支持向量回归机等算法,利用每个第一类参数的批量样本数据来构建每个第一类参数的自回归模型,即所述第一处理模型。在针对每个第一类参数构建完成其自回归模型后,本实施例针对每个第一类参数的自回归模型,在相应的验证集上测试模型的自回归处理的准确度。

其中,模型对应的准确度数值越大,表示模型的自回归处理的准确度越高。

步骤303、基于m个第一类参数中每个第一类参数对应的影响值及第一处理模型的处理准确度,确定用于对所述目标参数的参数值进行确定的n个第一类参数。

在确定出m个第一类参数中每个第一类参数的所述影响值(如影响评分或相关性系数等),以及该第一类参数所对应的自回归模型的准确度之后,本实施例综合每个第一类参数对应的所述影响值及自回归模型的准确度,来确定每个第一类参数在预判所述目标参数值时的价值。

通常期望从所述m个第一类参数中确定出影响值高、且所对应的自回归模型的准确度高的第一类参数作为预判所述目标参数值时的高价值参数。具体实施中,可通过对所述影响值及所述准确度数值进行归一化处理(两者数值可能不在一个量级,归一化后才能便于计算),并通过进一步基于加权计算等方式对归一化后的影响值及准确度数值进行计算,来计算出一个能够表征第一类参数在预判目标参数值时的预判价值的数值,该数值越大,表示相对应的第一类参数在预判目标参数值时的预判价值越高。

最终,可按所计算出的价值数值对m个第一类参数进行降序排序,并选取排序后的前n个第一类参数对所述目标参数在预定时间的取值进行预判,而所述m个第一类参数中除所述n个第一类参数之外的其他部分,则被滤除掉不再参与目标参数值的预判。

本实施例通过基于第一类参数对目标参数所产生影响的影响值及第一类参数的自回归模型的准确度,从m个第一类参数中筛选出n个第一类参数,实现了“对目标参数值的确定更为有利、可使得最终所得的目标参数值更为准确的多个高价值参数”的确定,可进一步提升后续所得的目标参数在预定时间的取值的准确度。

在本申请实施例的一可选实施方式中,参考图4示出的数据处理方法的流程示意图,所述数据处理方法具体可通过如下的处理过程实现:

步骤401、获取n个第一类参数的第一参数值,所述n为大于1的整数。

所述n个第一类参数,即为从所述m个第一类参数中确定出的一系高价值参数。对于目标参数为cnc产品销量的情况,所述n个第一类参数具体可以是上述的企业内部参数和/或企业外部参数中的相应参数,所述n个第一类参数的第一参数值则为这些参数的原始历史数据。

如上文所述,通常某个第一类参数在某一时间的取值,并不会在同一时间对目标参数的取值产生影响,而是在某一段时间(可以为一个时间范围,比如在之后的4-6个月内对目标参数的取值产生影响等)之后该影响才体现出来,也即,该第一类参数的取值对目标参数的取值的影响存在滞后。

鉴于此,在获取用于对目标参数值进行预判的所述n个第一类参数的第一参数值时,为了保证最终所得的目标参数值的准确性,具体需根据每个第一类参数对目标参数产生影响的滞后信息,来确定需获取哪个历史时间/历史时间段的第一类参数的第一参数值。

比如,假设第一类参数a的当前取值在之后的4~6个月内对目标参数的取值产生影响,第一类参数b的当前取值在之后的2~5个月内对目标参数的取值产生影响,第一类参数c的当前取值在之后的5~7个月内对目标参数的取值产生影响等等,由此,当需要确定预定时间内(比如未来一个月)所述目标参数的取值时,可根据每个第一类参数对应的所述滞后信息,相应获取该预定时间之前的某一时间段内该第一参数值的历史数据,以所述第一类参数a为例,则可获取所述未来一个月之前的4~6个月内该参数a的历史数据,以用于参与后续的该目标参数值的判定,其他参数值的获取情况类似。

其中,第一类参数所对应的滞后信息,具体可在对每个第一类参数进行与所述目标参数间的相关性分析时得到。

在获取每个第一类参数的第一参数值时,具体可根据该第一类参数对应的滞后信息确定该第一类参数在相应的历史时段内不同历史时间的时序数据,如对于上述的参数a,假设该参数为cnc历史销量,则可获取其在所述未来一个月之前的4~6个月内每个月的历史销量,由此得到该参数a的3个历史销量值,而该3个历史销量值则构成时序数据。

步骤402、将所述第一类参数的第一参数值输入所述第一类参数对应的第一处理模型,得到该第一处理模型输出的该第一类参数在所述预定时间的第二参数值。

在基于每个第一类参数对应的滞后信息,获取其所对应的第一参数值之后,可将该第一类参数的第一参数值输入该第一类参数对应的自回归模型中,利用自回归模型对该第一类参数在所述预定时间(如未来的一个月)的取值进行预判,由此,得到该第一类参数在所述预定时间的第二参数值。

具体地,可将第一类参数在对应于所述滞后信息的历史时段内不同历史时间的时序数据,输入该第一类参数对应的自回归模型,在此基础上,自回归模型会根据所输入的时序数据的时序特征,来对该第一类参数在所述预定时间的取值进行预判。

在实际应用中,往往需要预判目标参数在未来不同时间的取值,例如预判cnc销量在未来一年所对应的12期(一个月为一期)中各期的需求量/销量等,由此,参考图5,针对每个第一类参数可采用滚动方式对其进行自回归处理,具体地,仍以上述的参数a为例,假设在获取其在所述未来一个月之前的4~6个月内每个月的销量x1、x2、x3后,可首先利用该时序数据x1、x2、x3、基于该参数a的自回归模型预判未来第一个月的销量值y1,之后可进行滚动,利用时序数据x2、x3、x4(x4为x3所在月份之后的一个月参数a的取值)预判参数a在未来第二个月的取值y2,相类似地,再之后,利用时序数据x3、x4、x5(x5为x4所在月份之后的一个月参数a的取值)预判其在未来第三个月的取值y3,直至得到所需的12期预判值为止。

其中,需要说明的是,在滚动过程中,当按照对应的滞后信息滚动至需要基于未来时间的数据作为预判基础时,则直接利用已预判出的该未来时间的数据作为预判基础,为便于理解,以下举例说明,由于所述第一类参数a对应的滞后信息为4~6个月,从而,未来第十二个月该参数a的预判值y12需基于其之前的4~6个月内的该参数a的取值确定,此种情况下,则可直接利用已预判出的该参数a的取值y6、y7、y8通过自回归来确定y12。

步骤403、基于所述第一类参数的第二参数值及所述第一类参数对应的影响值,确定所述第一类参数的特征值。

在得到各个第一类参数在所述预定时间的预判值,也即所述第二参数值后,本实施例继续根据每个第一类参数的第二参数值,并结合第一类参数对所述目标参数所产生影响的影响值(如影响评分或相关性系数等)来确定所述第一类参数的特征值。

示例性地,比如,具体可根据第一类参数所对应的影响评分或相关性系数,为该第一类参数确定一个对应于所述影响评分或相关性系数的权值,进而基于加权的方式利用该权值对所述第一类参数的第二参数值进行调整,由此,得到该第一类参数的特征值。

步骤404、将各个第一类参数的特征值输入预先构建的第二处理模型,得到所述第二处理模型输出的所述目标参数在所述预定时间的取值。

在得到各个第一类参数的特征值后,最终可基于各个第一类参数的特征值,确定所述目标参数在所述预定时间的取值。

具体地,可预先基于梯度下降树、随机森林或支持向量回归机等算法,利用所述n个第一类参数的特征值与所述目标参数值的批量样本数据来训练该目标参数的预测模型,即所述第二处理模型。

由此,当需要基于各个第一类参数的特征值确定所述目标参数在所述预定时间的取值时,可将各个第一类参数的特征值输入所述第二处理模型,由该模型基于各个第一类参数的特征值预判并输出所述目标参数在所述预定时间的取值。

实际应用中,针对目标参数在未来不同时间的取值的预判需求,如图6所示,比如需要预判cnc产品在未来一年12期中各期的销量值等,则可将基于滚动自回归方式得到的各个第一类指标在每一期的第二参数值所对应的特征值输入所述第二处理模型,相应得到模型输出的目标参数在每一期的预判值,以所述目标参数为cnc产品销量为例,则可得到cnc产品在未来多期如未来一年中12期的销量值。

由于本实施例基于多个第一类参数的特征值确定目标参数在预定时间的取值,从而在确定目标参数值时综合考虑了多个第一类参数所表征的多个影响因素,相应可较为准确地确定目标参数的取值,另外,由于本申请基于自回归方式确定各个第一类参数在预定时间的第二参数值,进而基于各个第一类参数在预定时间的第二参数值确定其特征值,而非直接基于各个第一类参数的第一参数值确定其特征值,从而,可使得第一类参数的特征值的确定更为准确,进一步提升了最终基于各第一类参数的特征值所确定出的所述目标参数值的准确率。

在本申请实施例的一可选实施方式中,参考图7示出的数据处理方法的流程示意图,该方法在确定目标参数的取值之前,还可以包括:

步骤701、获取至少一个第二类参数的参数值。

为了进一步提升所确定出的目标参数在所述预定时间的取值的准确性,本实施例在上述第一类参数的基础上,进一步引入了至少一个第二类参数。

该第二类参数为能够对所述目标参数的取值产生影响的各个主观类因素所对应的参数。仍以所述目标参数为cnc产品销量为例,所述至少一个第二类参数,示例性地,可以包括但不限于针对最近预定时间段内的技术革新情况、物流周期运转情况、工作人员休假情况、行业重要活动情况等各种主观类影响因素相应为其设置的参数。

所述至少一个第二类参数的参数值,即可以为上述的各种主观类因素的具体数据,如最近预定时间段内实际发生的技术革新、实际的物流周期运转数据、工作人员实际休假数据、行业重要活动记录数据等等。

步骤702、对所述至少一个第二类参数的参数值进行量化处理,得到所述至少一个第二类参数的量化值,以使得结合各个第一类参数的特征值以及所述至少一个第二类参数的量化值确定目标指标的取值;

其中,第二类参数的量化值,用于表征该第二类参数对所述目标参数所产生影响/关联的影响/关联程度。

对于上述的对应于各主观类影响因素的各个第二类参数,由于其取值通常为非数值类型,从而可基于一定的量化手段对其进行量化。

示例性地,比如,可利用专业人员打分或其他量化手段等,客观评估上述各个主观类因素对所述目标参数的影响,并对其进行打分,给出一个与其对目标参数的影响相匹配的分值,具体地,比如,对于所述技术革新情况,如果最近预定时间段内发生了较大的技术革新,且通过对其进行评估,发现该技术革新会为cnc销量带来一个较大的积极影响(会促使cnc销量有一个较大的增长),则可为该因素打出一个较高的分值,以此实现对该因素所对应参数值的量化。

本步骤中,所获得的每个第二类参数的量化值,具体可以是第二类参数所对应的影响因素的打分分值,或者还可以是对该打分分值进行相应处理(如对各第二类参数的打分分值进行加权处理,或将各第二类参数的打分分值归一化到某一个数值范围等)后所得的数值,本实施例对此不作限定,只要该第二类参数的量化值,能够客观表征该第二类参数对所述目标参数所产生影响的影响程度即可。

在此基础上,最终可将所述第一类参数的特征值以及所述第二类参数的量化值共同输入所述第二处理模型,由该第二处理模型基于所述第一类参数的特征值以及所述第二类参数的量化值对所述目标参数在所述预定时间的取值进行预判,当然,与之相匹配的是,在模型的训练阶段也需要将所述第二类参数引入所述第二处理模型的训练中。

本实施例在采用对应于多个客观类因素的多个第一类参数参与目标参数值的预判基础上,继续在目标参数值的预判中引入了对应于多个主观类因素的多个第二类参数,可进一步提升最终所得的目标参数在预定时间的取值的准确度。

对应于上述的数据处理方法,在本申请的一可选实施方式中,可提供了一种数据处理装置,该数据处理装置可以应用于计算设备中,该计算设备可以是但不限于:智能手机、平板电脑、膝上型便携计算机、笔记本电脑、一体机或台式机等终端设备,或云端/局域网等环境中的服务器。

参考图8示出的数据处理装置的结构示意图,该装置可以包括:

第一获取单元801,用于获取n个第一类参数的第一参数值,所述n为大于1的整数。

所述n个第一类参数,为能够对目标参数的取值产生影响的多个影响因素所对应的多个参数,以所述目标参数为产品需求量/销量为例,所述n个第一类参数为对该产品需求量/销量这一目标参数产生影响的n个影响因素所对应的参数。所述n个第一类参数的第一参数值则为所述n个第一类参数的历史数值。

更进一步地,本申请中,所述第一类参数为对产品需求量/销量产生影响的客观类因素所对应的参数。

示例性地,在所述目标参数具体为cnc产品需求量/销量的情况下,该第一类参数具体地可以包括如上文所述的企业内部参数和/或企业外部参数。

第一确定单元802,用于按自回归方式,基于所述第一类参数的第一参数值确定所述第一类参数在预定时间的第二参数值。

在获得所述n个第一类参数的第一参数值,也即所述n个第一类参数的历史数据后,本申请并不直接采用所述n个第一类参数的历史数据对所述目标参数在预定时间的取值进行确定,而是先针对上述的多个第一类参数中的每个第一类参数,按自回归方式,基于该每个第一类参数的历史数据,预判该第一类参数在所述预定时间(也即预判目标参数的取值时对应要求的时间)的取值。

具体实施中,可预先基于梯度下降树、随机森林或支持向量回归机等算法,利用每个第一类参数的批量样本数据来构建每个第一类参数的自回归模型。

进而在此基础上,当存在针对每个第一类参数的自回归处理需求时,可利用每个第一类参数的自回归模型、基于该第一类参数的历史数据即其第一参数值来对该第一类参数进行自回归预判,以得到该第一类参数在所述预定时间的预判值,也即该第一类参数的所述第二参数值。

第二确定单元803,用于基于所述第一类参数的第二参数值确定所述第一类参数的特征值。

在对多个第一类参数进行自回归处理,得到多个第一类参数在所述预定时间的预判值,即所述第二参数值后,可进一步基于每个第一类参数的第二参数值确定其特征值,本申请中,第一类参数的特征值通常为对第一类参数的第二参数值进行相应处理后所得的取值,该部分将在下文进行详细阐述,所得的各个第一类参数的特征值,最终可用于对所述目标参数在所述预定时间的取值进行预判。

第三确定单元804,用于基于各个第一类参数的特征值,确定目标参数在所述预定时间的取值,得到目标参数值。

在得到各个第一类参数的特征值之后,最终可基于各个第一类参数的特征值来确定所述目标参数在所述预定时间的取值。

由以上方案可知,本申请实施例提供的数据处理装置,基于多个第一类参数的特征值确定目标参数在预定时间的取值,从而在确定目标参数值时综合考虑了多个第一类参数所表征的多个影响因素,相应可较为准确地确定目标参数的取值,另外,由于本申请基于自回归方式确定各个第一类参数在预定时间的第二参数值,进而基于各个第一类参数在预定时间的第二参数值确定其特征值,而非直接基于各个第一类参数的第一参数值确定其特征值,从而,可使得第一类参数的特征值的确定更为准确,进一步提升了最终基于各第一类参数的特征值所确定出的所述目标参数值的准确率。

在本申请的一可选实施方式中,参考图9,所述数据处理装置还可以包括:第四确定单元805,用于预先确定所述n个第一类参数。

所述第四确定单元805预先确定所述n个第一类参数,具体包括:

对m个第一类参数中的每个第一类参数进行与所述目标参数间的相关性分析,得到每个第一类参数对所述目标参数产生影响的影响值;

构建每个第一类参数对应的第一处理模型,并确定每个第一类参数对应的第一处理模型的处理准确度;其中,所述第一处理模型为自回归模型;

基于m个第一类参数中每个第一类参数对应的影响值及第一处理模型的处理准确度,确定用于对所述目标参数的参数值进行确定的n个第一类参数;

其中,所述m为大于1的整数,所述m不小于所述n。

本申请的发明人通过分析、研究不同因素对目标参数的取值产生影响的影响情况,预先初步确定出了对应于多个影响因素的m个第一类参数,该m个第一类参数,可以为数量不少于所述n的上述企业内部参数和/或上述企业外部参数。

在此基础上,为了进一步确保最终所得的目标参数在预定时间的取值的准确性,本申请提出了进一步对所述m个第一类参数进行筛选,以从中筛选出对目标参数值的预判更为有利、可使得最终所得的目标参数值更为准确的多个高价值参数,即所述n个第一类参数。

本实施例综合每个第一类参数对应的所述影响值及自回归模型的准确度,来确定每个第一类参数在预判所述目标参数值时的价值。

通常期望从所述m个第一类参数中确定出影响值高、且所对应的自回归模型的准确度高的第一类参数作为预判所述目标参数值时的高价值参数。具体实施中,可通过对所述影响值及所述准确度数值进行归一化处理(两者数值可能不在一个量级,归一化后才能便于计算),并通过进一步基于加权计算等方式对归一化后的影响值及准确度数值进行计算,来计算出一个能够表征第一类参数在预判目标参数值时的预判价值的数值,该数值越大,表示相对应的第一类参数在预判目标参数值时的预判价值越高。

最终,可按所计算出的价值数值对m个第一类参数进行降序排序,并选取排序后的前n个第一类参数对所述目标参数在预定时间的取值进行预判,而所述m个第一类参数中除所述n个第一类参数之外的其他部分,则被滤除掉不再参与目标参数值的预判。

本实施例通过基于第一类参数对目标参数所产生影响的影响值及第一类参数的自回归模型的准确度,从m个第一类参数中筛选出n个第一类参数,实现了“对目标参数值的确定更为有利、可使得最终所得的目标参数值更为准确的多个高价值参数”的确定,可进一步提升后续所得的目标参数在预定时间的取值的准确度。

在本申请的一可选实施方式中,所述数据处理装置中的第一确定单元802具体用于:将所述第一类参数的第一参数值输入所述第一类参数对应的第一处理模型,得到该第一处理模型输出的该第一类参数在所述预定时间的第二参数值。

其中,所述第一类参数的第一参数值为对应于相应不同历史时间的时序数据;在对所述第一类参数进行与所述目标参数间的相关性分析时,还得到该第一类参数对所述目标参数产生影响时所对应的滞后信息,所述第一类参数的时序数据对应的所述不同历史时间为根据该第一类参数对应的滞后信息确定的时间;

所述第一处理模型输出第一类参数的第二参数值,包括:

所述第一处理模型基于第一类参数的时序数据的时序特征,输出该第一类参数在预定时间的第二参数值。

所述第二确定单元803,具体用于:基于所述第一类参数的第二参数值及所述第一类参数对应的影响值,确定所述第一类参数的特征值。

在得到各个第一类参数在所述预定时间的第二参数值后,本实施例继续根据每个第一类参数的第二参数值,并结合第一类参数对所述目标参数所产生影响的影响值(如影响评分或相关性系数等)来确定所述第一类参数的特征值。所述第三确定单元,具体用于:将各个第一类参数的特征值输入预先构建的第二处理模型,得到所述第二处理模型输出的所述目标参数在所述预定时间的取值。

在得到各个第一类参数的特征值后,最终可基于各个第一类参数的特征值,确定所述目标参数在所述预定时间的取值。

具体地,可预先基于梯度下降树、随机森林或支持向量回归机等算法,利用所述n个第一类参数的特征值与所述目标参数值的批量样本数据来训练该目标参数的预测模型,即所述第二处理模型。

由此,当需要基于各个第一类参数的特征值确定所述目标参数在所述预定时间的取值时,可将各个第一类参数的特征值输入所述第二处理模型,由该模型基于各个第一类参数的特征值预判并输出所述目标参数在所述预定时间的取值。

在本申请的一可选实施方式中,参考图10,所述数据处理装置还可以包括:

第二获取单元806,用于在确定目标参数的取值之前,获取至少一个第二类参数的参数值。

为了进一步提升所确定出的目标参数在所述预定时间的取值的准确性,本实施例在上述第一类参数的基础上,进一步引入了至少一个第二类参数。

该第二类参数为能够对所述目标参数的取值产生影响的各个主观类因素所对应的参数。

量化单元807,用于对所述至少一个第二类参数的参数值进行量化处理,得到所述至少一个第二类参数的量化值,以使得结合各个第一类参数的特征值以及所述至少一个第二类参数的量化值确定所述目标指标的取值;

其中,第二类参数的量化值,用于表征该第二类参数对所述目标参数所产生影响的影响程度。

对于上述的对应于各主观类影响因素的各个第二类参数,由于其取值通常为非数值类型,从而可基于一定的量化手段对其进行量化。

在此基础上,最终可将所述第一类参数的特征值以及所述第二类参数的量化值共同输入所述第二处理模型,由该第二处理模型基于所述第一类参数的特征值以及所述第二类参数的量化值对所述目标参数在所述预定时间的取值进行预判,当然,与之相匹配的是,在模型的训练阶段也需要将所述第二类参数引入所述第二处理模型的训练中。

本实施例在采用对应于多个客观类因素的多个第一类参数参与目标参数值的预判基础上,继续在目标参数值的预判中引入了对应于多个主观类因素的多个第二类参数,可进一步提升最终所得的目标参数在预定时间的取值的准确度。

这里,需要说明的是,本说明书中控制方法所对应的各个实施例以及电子设备所对应的各个实施例分别采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。另外,本申请说明书中,实施例所公开的电子设备是与实施例所公开的控制方法相对应的,对于实施例公开的电子设备而言,由于其与实施例公开的控制方法相对应,所以描述的比较简单,相关相似之处参见方法部分的说明即可。

在本申请的一可选实施方式中,还提供了一种计算设备,该计算设备可以是但不限于:智能手机、平板电脑、膝上型便携计算机、笔记本电脑、一体机或台式机等终端设备,或云端/局域网等环境中的服务器。

参考图11示出的该计算设备的结构示意图,该计算设备包括:

存储器1101,用于至少存储一组指令集;

处理器1102,用于调用并执行所述存储器中的所述指令集,通过执行所述指令集实现以上各方法实施例中任一实施例所提供的数据处理方法,或实现以上各装置实施例中任一实施例所提供的数据处理装置。该处理器1102通过调用所述指令集所实现的具体功能,具体请参阅以上各实施例对所述数据处理方法或装置的相关说明,这里不再赘述。

为了描述的方便,描述以上系统或装置时以功能分为各种模块或单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。

最后,还需要说明的是,在本文中,诸如第一、第二、第三和第四等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1