数据预测方法及装置与流程

文档序号:11775637阅读:245来源:国知局
数据预测方法及装置与流程

本发明涉及数据挖掘技术领域,特别涉及一种数据预测方法及装置。



背景技术:

通常来讲,商家的备货方式是将商品从厂家或供应商统一采购至全国各rdc(regionaldistributioncenter,区域分发中心),每个区域分发中心会覆盖多个fdc(frontdistributioncenter,前端物流中心),购物用户下订单后,就近的fdc有货时商家将从就近fdc发货,就近的fdc无货时将通过rdc内配调拨至fdc或直接从rdc发货。

对于fdc的备货数量而言,传统方法主要是通过历史销量数据对全国各fdc进行未来一段时间的销量数据进行预测。例如,通过商家大数据平台获取全国各fdc的历史最近两周销量,通过加权平均方法,通过近一周周总销量以及次近一周周总销量的加权和预测未来一周周总销量。对于fdc调拨量的计算,传统方法是利用调拨系统根据全国fdc设置安全库存天数、目标库存天数以及未来日均fdc预测销量计算得出每日调拨量,以此实现支持全国fdc每日的自动调拨生产业务。

然而,传统方法预测得到的商品销量往往不够准确。预测得到的商品销量不够准确导致fdc的库存量不足,进而导致fdc所覆盖的城市销售额偏低、配送时效相对较差。



技术实现要素:

本发明解决的一个技术问题是,如何实现对商品销量更准确的预测。

根据本发明实施例的一个方面,提供了一种数据预测方法,包括:利用商品的历史销量数据,生成商品的销量特征;利用促销计划数据,生成销量预测白名单;利用销量预测白名单中的商品的销量特征进行boosting预测处理,以对销量预测白名单中的商品的促销销量进行预测。

在一些实施例中,该数据预测方法还包括:利用商品的历史调拨数据,计算商品的本地满足率;将本地满足率低于预设值的商品加入销量预测白名单,以便对销量预测白名单更新。

在一些实施例中,将本地满足率低于预设值的商品加入销量预测白名单包括:若在预设持续时间内,商品的本地满足率低于预设值,则将商品加入销量预测白名单。

在一些实施例中,商品的历史调拨数据包括商品的本地销量以及商品的调拨量;计算商品的本地满足率包括:将商品的本地销量与商品的调拨量的差值,与商品的本地销量作比,得到商品的本地满足率。

在一些实施例中,该数据预测方法还包括:利用商品的历史调拨数据,计算商品的调拨偏低量;利用商品的调拨偏低量进行boosting预测处理。

在一些实施例中,计算商品的调拨偏低量包括:将商品的历史调拨数据中的不同时段的调拨量取平均,得到商品的调拨偏低量。

在一些实施例中,商品的历史销量数据包括商品的促销价格、商品在历史促销期间的日均销量、商品在非促销期间的日均销量、商品在预设日期至今的日均销量。

在一些实施例中,利用促销计划数据,生成销量预测白名单包括:从促销计划数据中,筛选促销计划中的商品;若促销计划正在进行,则将促销期间日均销量相比非促销期间日均销量的增幅大于第一阈值的商品加入销量预测白名单;若促销计划尚未进行,则将商品在预设日期至今的日均销量大于第二阈值的商品加入销量预测白名单。

在一些实施例中,若在促销期间的预设持续时间内,商品的日均销量相比非促销期间日均销量的增幅大于第一阈值,则将商品加入销量预测白名单;若在非促销期间的预设持续时间内,商品在预设日期至今的日均销量大于第二阈值,则将商品加入销量预测白名单。

在一些实施例中,boosting预测处理采用的机器学习模型为xgboost模型或者gbdt模型。

在一些实施例中,该数据预测方法还包括:利用销量预测白名单中的部分商品的销量特征以及部分商品的实际促销销量,以对boosting预测处理采用的机器学习模型进行训练。

根据本发明实施例的另一个方面,提供了一种数据预测装置,包括:销量特征生成单元,被配置为利用商品的历史销量数据,生成商品的销量特征;销量预测白名单生成单元,被配置为利用促销计划数据,生成销量预测白名单;销量预测单元,被配置为利用销量预测白名单中的商品的销量特征进行boosting预测处理,以对销量预测白名单中的商品的促销销量进行预测。

在一些实施例中,该数据预测装置还包括:本地满足率计算单元,被配置为利用商品的历史调拨数据,计算商品的本地满足率;销量预测白名单更新单元,被配置为将本地满足率低于预设值的商品加入销量预测白名单,以便对销量预测白名单更新。

在一些实施例中,本地满足率计算单元被配置为:若在预设持续时间内,商品的本地满足率低于预设值,则将商品加入销量预测白名单。

在一些实施例中,商品的历史调拨数据包括商品的本地销量以及商品的调拨量;本地满足率计算单元被配置为:将商品的本地销量与商品的调拨量的差值,与商品的本地销量作比,得到商品的本地满足率。

在一些实施例中,该数据预测装置还包括:调拨偏低量计算单元,被配置为利用商品的历史调拨数据,计算商品的调拨偏低量;销量预测单元还被配置为利用商品的调拨偏低量进行boosting预测处理。

在一些实施例中,调拨偏低量计算单元被配置为将商品的历史调拨数据中的不同时段的调拨量取平均,得到商品的调拨偏低量。

在一些实施例中,商品的历史销量数据包括商品的促销价格、商品在历史促销期间的日均销量、商品在非促销期间的日均销量、商品在预设日期至今的日均销量。

在一些实施例中,销量预测白名单生成单元被配置为:从促销计划数据中,筛选促销计划中的商品;若促销计划正在进行,则将促销期间日均销量相比非促销期间日均销量的增幅大于第一阈值的商品加入销量预测白名单;若促销计划尚未进行,则将商品在预设日期至今的日均销量大于第二阈值的商品加入销量预测白名单。

在一些实施例中,销量预测白名单生成单元被配置为:若在促销期间的预设持续时间内,商品的日均销量相比非促销期间日均销量的增幅大于第一阈值,则将商品加入销量预测白名单;若在非促销期间的预设持续时间内,商品在预设日期至今的日均销量大于第二阈值,则将商品加入销量预测白名单。

在一些实施例中,销量预测单元进行boosting预测处理采用的机器学习模型为xgboost模型或者gbdt模型。

在一些实施例中,数据预测装置还包括:模型训练单元,被配置为利用销量预测白名单中的部分商品的销量特征以及部分商品的实际促销销量,以对boosting预测处理采用的机器学习模型进行训练。

根据本发明实施例的又一个方面,提供了一种数据处理装置,包括:存储器;以及耦接至存储器的处理器,处理器被配置为基于存储在存储器中的指令,执行前述的数据预测方法。

根据本发明实施例的再一个方面,提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机指令,指令被处理器执行时实现前述的数据预测方法。

本发明提供的数据预测方法,能够利用商品的历史销量数据生成商品的销量特征,并利用促销计划数据生成销量预测白名单,然后将销量预测白名单中的商品的销量特征输入boosting增强模型,以对销量预测白名单中的商品的促销销量进行预测。从而实现了对商品销量更准确的预测。

通过以下参照附图对本发明的示例性实施例的详细描述,本发明的其它特征及其优点将会变得清楚。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1示出本发明数据预测方法的一个实施例的流程示意图。

图2示出本发明数据预测方法的另一个实施例的流程示意图。

图3示出本发明数据预测装置的一个实施例的结构示意图。

图4示出本发明数据预测装置的另一个实施例的结构示意图。

图5示出本发明数据预测装置的另一个实施例的结构示意图。

图6示出本发明数据预测装置的又一个实施例的结构示意图。

图7示出本发明数据预测装置的又一个实施例的结构示意图。

图8示出本发明数据预测装置的再一个实施例的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。

发明人研究发现,导致销量预测不够准确现象的一个重要原因是,传统的预测方法是参考fdc历史一段时间的销量数据,然后简单的加权预测方法预测计算得出未来一周日均销量。商家实际的业务中经常涉及在未来有计划地发起品牌促销、品类促销等活动,但传统的销量预测方法以及fdc调拨计算并没有相应的策略,对于未来的因素考虑较少,并没有针对性根据促销、节假日等情况进行动态、及时的调整,最终导致fdc本地满足率变差、相关区域销售额受影响等现象出现。

下面结合图1描述本发明提供的数据预测方法的一个实施例。

图1示出本发明数据预测方法的一个实施例的流程示意图。如图1所示,该实施例的数据预测方法包括:

步骤s102,利用商品的历史销量数据,生成商品的销量特征。

例如,商品的历史销量数据包括商品的促销价格、商品在历史促销期间的日均销量、商品在非促销期间的日均销量、商品在预设日期至今的日均销量以及商品在周末的日均销量。将历史销量数据进行级联,可以得到商品的销量特征。

可选的,如果历史销量数据中含有异常值,可以对历史销量做极值平滑,即将历史销量最大的2%数量的数据用当周的日平均销量替换。

步骤s103,利用促销计划数据,生成销量预测白名单。

例如,可以从促销计划数据中,筛选促销计划中的商品。若促销计划正在进行,则将促销期间日均销量相比非促销期间日均销量的增幅大于2.5倍的商品加入销量预测白名单。若促销计划尚未进行,则将商品在预设日期至今的日均销量大于10件的商品加入销量预测白名单。

可选的,若在促销期间的连续2日内,商品的日均销量相比非促销期间日均销量的增幅大于2.5倍,则将商品加入销量预测白名单。若在非促销期间的连续2日内,商品在预设日期至今的日均销量大于10件,则将商品加入销量预测白名单。

此外,还可以针对参与满减的单品、直降单品和降价闪购单品等商品,通过满减力度、直降情况折算出单品的打折力度,然后通过量价关系经验模型进行销量增幅情况的预测。

步骤s106,利用销量预测白名单中的商品的销量特征进行boosting预测处理,以对销量预测白名单中的商品的促销销量进行预测。

本领域技术人员应理解,boosting预测处理使用的boosting增强模型是一类机器学习模型的统称。具体来说,应用至本实施例中的boosting增强模型可以为使用xgboost(extremegradientboost极限梯度增强)算法的xgboost模型,或者使用gbdt(gradientboostingdecisiontree,渐变增强决策树)算法的gbdt模型。将销量预测白名单中的商品的销量特征输入boosting增强模型后,boosting增强模型可以输出商品的预测促销销量。

上述实施例中,通过引入商家的未来促销计划数据,动态生成销量预测白名单,可以针对未来促销计划,利用boosting增强模型进行商品销量的预测。由于销量预测白名单涵盖了商家的促销信息,基于销量预测白名单,boosting增强模型能够根据输入的销量特征进行更为准确促销销量的预测,进而提升fdc所覆盖的城市销售额,优化配送时效,实现促销期间的fdc本地满足率业务指标提升。

发明人还发现,基于现有技术中的销量估计方法,根据预测出的销量数据进行fdc调拨,fdc本地满足率指标较差。其原因是在销量预测过程当中没有特殊考虑fdc本地满足率相对较差的商品。基于上述考虑,发明人通过下面实施例中的数据预测方法,重新设计了fdc调拨计算方法。

下面结合图2描述本发明提供的数据预测方法的另一个实施例。

图2示出本发明数据预测方法的另一个实施例的流程示意图。在图1所示实施例的基础上,该实施例的数据预测方法还包括:

步骤s204,利用商品的历史调拨数据,计算商品的本地满足率以及商品的调拨偏低量。

在选取商品的历史调拨数据时,应注意避免特殊的促销时间段。商品的历史调拨数据可以例如表1所示,其中主要包括商品的本地销量以及商品的调拨量。

表1

其中,一种计算商品的本地满足率的方法是:将商品的本地销量s与商品的调拨量t的差值,与商品的本地销量s作比,得到商品的本地满足率r。如公式(1)所示:

r=(s-t)/s(1)

其中,一种计算商品的调拨偏低量的方法是:将商品的调拨量t取平均,计算得到商品的调拨偏低量。例如,根据表1计算得到的商品的调拨偏低量为85。

步骤s205,将本地满足率低于预设值的商品加入销量预测白名单。

可选的,若在预设持续时间内,商品的本地满足率低于预设值,则将商品加入销量预测白名单。

例如,可以将连续两日本地满足率最差的商品加入销量预测白名单。

步骤s207,将商品的调拨偏低量输入boosting增强模型,以对销量预测白名单中的商品的促销销量进行预测。

本领域技术人员应理解,在使用boosting增强模型进行促销销量预测之前,需要对boosting增强模型进行训练。例如,可以利用销量预测白名单中的一部分(例如70%)商品的销量特征的数据以及部分商品的实际促销销量,以对boosting增强模型进行训练。

当然,如果采用商品的实际促销销量对boosting增强模型进行训练,利用训练后的boosting增强模型可以输出预测的商品促销销量。如果采用商品的增量对boosting增强模型进行训练,利用训练后的boosting增强模型可以输出预测的商品促销增量。

假设训练后的boosting增强模型输出预测的商品促销增量为x,商品的调拨偏低量为y,此商品当前业务规则的默认调拨量为q0,此商品所属三级分类默认的安全调拨量为s(通常取值0-10之间),那么商品未来几天的总调拨量q可以如公式(2)所示:

q=q0+s+x+y(2)

其中,q0的计算方式如公式(3)所示:

q0=w1*0.6+w2*0.4(3)

其中,w1代表离当前最近的7日的fdc日均销量,w2代表离当前最近的次近周fdc日均销量。

上述实施例实现了促销活动期间全国fdc相应地增量调拨技术设计。结合未来促销计划、本地满足率指标而生成的促销预测白名单,结合预测基线以及调拨量偏低差异而设计的动态调拨补货模型,可以更加科学的进行调拨补货。在探测到商家的促销计划时有针对性的提高相应时间的调拨量,在到探测实际业务中调拨指标的变化时定位到最有可能影响调拨指标的具体商品,从而调整相关商品的调拨量,改善fdc的本地满足率。

下面结合图3描述本发明一个实施例的数据预测装置。

图3示出本发明数据预测装置的一个实施例的结构示意图。如图3所示,该实施例的数据预测装置30包括:

销量特征生成单元302,被配置为利用商品的历史销量数据,生成商品的销量特征;

销量预测白名单生成单元303,被配置为利用促销计划数据,生成销量预测白名单;

销量预测单元307,被配置为利用销量预测白名单中的商品的销量特征进行boosting预测处理,以对销量预测白名单中的商品的促销销量进行预测。

下面结合图4描述本发明另一个实施例的数据预测装置。

图4示出本发明数据预测装置的另一个实施例的结构示意图。如图4所示,在图3所示实施例的基础上,该实施例的数据预测装置40还包括:

本地满足率计算单元404,被配置为利用商品的历史调拨数据,计算商品的本地满足率;

销量预测白名单更新单元405,被配置为将本地满足率低于预设值的商品加入销量预测白名单,以便对销量预测白名单更新。

在一个实施例中,本地满足率计算单元404被配置为:

若在预设持续时间内,商品的本地满足率低于预设值,则将商品加入销量预测白名单。

在一个实施例中,商品的历史调拨数据包括商品的本地销量以及商品的调拨量;

本地满足率计算单元404被配置为:将商品的本地销量与商品的调拨量的差值,与商品的本地销量作比,得到商品的本地满足率。

下面结合图5描述本发明另一个实施例的数据预测装置。

图5示出本发明数据预测装置的另一个实施例的结构示意图。如图5所示,在图4所示实施例的基础上,该实施例的数据预测装置50还包括:

调拨偏低量计算单元506,被配置为利用商品的历史调拨数据,计算商品的调拨偏低量;

销量预测单元307还被配置为利用商品的调拨偏低量进行boosting预测处理。

在一个实施例中,调拨偏低量计算单元506被配置为将商品的历史调拨数据中的不同时段的调拨量取平均,得到商品的调拨偏低量。

在一个实施例中,商品的历史销量数据包括商品的促销价格、商品在历史促销期间的日均销量、商品在非促销期间的日均销量、商品在预设日期至今的日均销量。

在一个实施例中,销量预测白名单生成单元303被配置为:

从促销计划数据中,筛选促销计划中的商品;

若促销计划正在进行,则将促销期间日均销量相比非促销期间日均销量的增幅大于第一阈值的商品加入销量预测白名单;

若促销计划尚未进行,则将商品在预设日期至今的日均销量大于第二阈值的商品加入销量预测白名单。

在一个实施例中,销量预测白名单生成单元303被配置为:

若在促销期间的预设持续时间内,商品的日均销量相比非促销期间日均销量的增幅大于第一阈值,则将商品加入销量预测白名单;

若在非促销期间的预设持续时间内,商品在预设日期至今的日均销量大于第二阈值,则将商品加入销量预测白名单。

在一个实施例中,销量预测单元406进行boosting预测处理采用的机器学习模型为xgboost模型或者gbdt模型。

下面结合图6描述本发明另一个实施例的数据预测装置。

图6示出本发明数据预测装置的另一个实施例的结构示意图。如图6所示,在图5所示实施例的基础上,该实施例的数据预测装置60还包括:

模型训练单元601,被配置为利用销量预测白名单中的部分商品的销量特征以及部分商品的实际促销销量,以对boosting预测处理采用的机器学习模型进行训练。

图7示出了本发明数据预测装置的另一个实施例的结构图。如图7所示,该实施例的数据预测装置70包括:存储器710以及耦接至该存储器710的处理器720,处理器720被配置为基于存储在存储器710中的指令,执行前述任意一个实施例中的数据预测方法。

其中,存储器710例如可以包括系统存储器、固定非易失性存储介质等。系统存储器例如存储有操作系统、应用程序、引导装载程序(bootloader)以及其他程序等。

图8示出了本发明数据预测装置的又一个实施例的结构图。如图8所示,该实施例的装置80包括:存储器810以及处理器820,还可以包括输入输出接口830、网络接口840、存储接口850等。这些接口830,840,850以及存储器810和处理器820之间例如可以通过总线850连接。其中,输入输出接口830为显示器、鼠标、键盘、触摸屏等输入输出设备提供连接接口。网络接口840为各种联网设备提供连接接口。存储接口850为sd卡、u盘等外置存储设备提供连接接口。

本发明还包括一种计算机可读存储介质,其上存储有计算机指令,该指令被处理器执行时实现前述任意一个实施例中的数据预测方法。

本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用非瞬时性存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1