一种线下门店商品销量预测方法、装置和设备与流程

文档序号：22390655发布日期：2020-09-29 17:55阅读：197来源：国知局

本申请涉及数据处理技术领域，尤其涉及一种线下门店商品销量预测方法、装置和设备。

背景技术：

现有的商品销量预测方法均是采用单一的模型进行预测，主要可以分为两类，一类是基于时间序列的预测模型，通过对预测目标自身时间序列进行处理来进行预测，该模型对非序列、非线性关系数据的学习能力较弱，使得预测准确度不高；另一类是基于机器学习的预测模型，通过支持向量机、随机森林、卷积神经网络等模型对历史数据进行训练，当待预测的数据与历史数据相差较大时，会使得预测准确率下降。而线下门店的商品销售数据具有不同的地域、品类等属性，因此，得到的商品数据是多种类的，而采用单一的预测模型对多种类商品数据进行预测，存在预测准确率低的技术问题。

技术实现要素：

本申请提供了一种线下门店商品销量预测方法、装置和设备，用于解决现有的销量预测方法采用单一预测模型存在的预测准确率低的技术问题。

有鉴于此，本申请第一方面提供了一种线下门店商品销量预测方法，包括：

获取若干个线下门店的商品的第一历史销售数据；

对所述第一历史销售数据进行目标特征提取和分层分类，得到若干个训练集；

将每个所述训练集分别输入到若干个待训练模型进行训练，得到若干个预测模型，所述预测模型的数量为所述训练集的数量与所述待训练模型的数量之积，所述待训练模型至少包括机器学习模型和时间序列模型；

对获取的目标商品的第二历史销售数据进行目标特征提取得到第一特征，将所述第一特征分别输入到各个所述预测模型，得到若干个预测销量，所述第二历史销售数据距离当前时间的时间段小于所述第一历史销售数据距离当前时间的时间段；

计算所述目标商品的实际销量与每个所述预测销量的误差值，将最小的所述误差值对应的所述预测模型作为最佳预测模型；

获取所述目标商品的第三历史销售数据，对所述第三历史销售数据进行目标特征提取得到第二特征，将所述第二特征输入到所述最佳预测模型，输出所述目标商品在预置时间段的销量，所述第三历史销售数据距离当前时间的时间段小于所述第二历史销售数据距离当前时间的时间段。

可选的，所述对所述第一历史销售数据进行目标特征提取，之前还包括：

对所述第一历史销售数据进行预处理，所述预处理包括数据筛选、数据缺失值填充或异常值修改。

可选的，所述目标特征至少包括季节性特征、节假日特征、天气特征或门店特征。

可选的，对所述第一历史销售数据进行分层分类，包括：

基于商品属性对所述第一历史销售数据进行分层分类，所述商品属性至少包括地域、商品品类、销量、波动性和销售频率。

可选的，所述误差值包括加权平均绝对百分比误差值、平均绝对百分比误差值、均方误差值或平均绝对误差值。

本申请第二方面提供了一种线下门店商品销量预测装置，包括：

第一获取单元，用于获取若干个线下门店的商品的第一历史销售数据；

分类单元，用于对所述第一历史销售数据进行目标特征提取和分层分类，得到若干个训练集；

训练单元，用于将每个所述训练集分别输入到若干个待训练模型进行训练，得到若干个预测模型，所述预测模型的数量为所述训练集的数量与所述待训练模型的数量之积，所述待训练模型至少包括机器学习模型和时间序列模型；

提取单元，用于对获取的目标商品的第二历史销售数据进行目标特征提取得到第一特征，将所述第一特征分别输入到各个所述预测模型，得到若干个预测销量，所述第二历史销售数据距离当前时间的时间段小于所述第一历史销售数据距离当前时间的时间段；

计算单元，用于计算所述目标商品的实际销量与每个所述预测销量的误差值，将最小的所述误差值对应的所述预测模型作为最佳预测模型；

预测单元，用于获取所述目标商品的第三历史销售数据，对所述第三历史销售数据进行目标特征提取得到第二特征，将所述第二特征输入到所述最佳预测模型，输出所述目标商品在预置时间段的销量，所述第三历史销售数据距离当前时间的时间段小于所述第二历史销售数据距离当前时间的时间段。

可选的，还包括：

预处理单元，用于对所述第一历史销售数据进行预处理，所述预处理包括数据筛选、数据缺失值填充或异常值修改。

可选的，所述目标特征至少包括季节性特征、节假日特征、天气特征或门店特征。

可选的，所述误差值包括加权平均绝对百分比误差值、平均绝对百分比误差值、均方误差值或平均绝对误差值。

本申请第三方面提供了一种线下门店商品销量预测设备，所述设备包括处理器以及存储器；

所述存储器用于存储程序代码，并将所述程序代码传输给所述处理器；

所述处理器用于根据所述程序代码中的指令执行单一方面任一种所述的线下门店商品销量预测方法。

从以上技术方案可以看出，本申请具有以下优点：

本申请提供了一种线下门店商品销量预测方法，包括：获取若干个线下门店的商品的第一历史销售数据；对第一历史销售数据进行目标特征提取和分层分类，得到若干个训练集；将每个训练集分别输入到若干个待训练模型进行训练，得到若干个预测模型，预测模型的数量为训练集的数量与待训练模型的数量之积，待训练模型至少包括机器学习模型和时间序列模型；对获取的目标商品的第二历史销售数据进行目标特征提取得到第一特征，将第一特征分别输入到各个预测模型，得到若干个预测销量，第二历史销售数据距离当前时间的时间段小于第三历史销售数据距离当前时间的时间段；计算目标商品的实际销量与每个预测销量的误差值，将最小的误差值对应的预测模型作为最佳预测模型；获取目标商品的第三历史销售数据，对第三历史销售数据进行目标特征提取得到第二特征，将第二特征输入到最佳预测模型，输出目标商品在预置时间段的销量，第三历史销售数据距离当前时间的时间段小于第二历史销售数据距离当前时间的时间段。

本申请中的线下门店商品销量预测方法，获取若干个线下门店的商品的第一历史销售数据，并对第一历史销售数据进行目标特征提取和分层分类，得到若干个训练集，通过分层分类，使得每个训练集的特征比较突出，每个训练集拥有更一致的特征，可以更好的训练待训练模型；将每个数据集分别输入到若干个待训练模型进行训练，使用机器学习模型和时间序列模型等多个待训练模型进行训练，避免单一模型预测准确度不高的问题；通过对获取的目标商品的第二历史销售数据进行目标特征提取并输入到各个预测模型，得到多个预测销量，通过计算预测销量和真实销量的误差值来回测，选择适合目标商品的最优预测模型，将最优预测模型来预测目标商品预置时间段的销量，通过目标商品的第二历史销售数据来进行回测，从而选择最适合目标商品的预测模型，提高了预测准确率，解决了现有的销量预测方法采用单一预测模型存在的预测准确率低的技术问题。

附图说明

图1为本申请实施例提供的一种线下门店商品销量预测方法的一个流程示意图；

图2为本申请实施例提供的一种线下门店商品销量预测方法的另一个流程示意图；

图3为本申请实施例提供的一种线下门店商品销量预测装置的一个结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

为了便于理解，请参阅图1，本申请提供的一种线下门店商品销量预测方法的一个实施例，包括：

步骤101、获取若干个线下门店的商品的第一历史销售数据。

商品的第一历史销售数据至少包括历史销量、节假日、天气和线下门店信息等数据，其中，商品的数量为多个，包括目标商品。

步骤102、对第一历史销售数据进行目标特征提取和分层分类，得到若干个训练集。

对第一历史销售数据进行目标特征提取，目标特征至少包括季节性特征、节假日特征、天气特征和门店特征(商圈、周期性)，还可以包括促销计划特征等，可以采用宽表存储该目标特征。对第一历史销售数据进行类型打标，用于区分不同类型数据，可以从地域、商品品类、销量、波动性和销售频率等商品属性来对第一历史销售数据进行分层分类，打标方式为分层打标，同一个第一历史销售数据的每个维度可由范围的大到小打上标签，如地域标签可以为省、城市和门店，商品品类标签可以为大类、中类和小类，根据该标签对第一历史销售数据进行分层分类，得到若干个训练集，每个训练集为一个层级类别，训练集中包括多个训练样本，每个训练样本由目标特征和销量构成，通过对数据进行分层分类，使得各个训练集的特征更加突出，其内在拥有更一致的特性，如训练集的随机性、季节性、趋势性，使得选择模型的时候更有针对性，可以提高预测模型的预测准确率。

步骤103、将每个训练集分别输入到若干个待训练模型进行训练，得到若干个预测模型。

考虑到不同类型的数据适合不同的模型，使用单一模型不能为每类数据匹配最佳的模型，因此，本申请实施例中将每个训练集分别输入到若干个待训练模型进行训练，当待训练模型达到收敛条件时，得到若干个预测模型，预测模型的数量为训练集的数量与待训练模型的数量之积，其中，待训练模型至少包括机器学习模型和时间序列模型，机器学习模型包括支持向量机、随机森林、卷积神经网络等模型。

步骤104、对获取的目标商品的第二历史销售数据进行目标特征提取得到第一特征，将第一特征分别输入到各个预测模型，得到若干个预测销量。

第二历史销售数据距离当前时间的时间段小于第一历史销售数据距离当前时间的时间段，第二历史销售数据至少包括历史销量、节假日、天气和线下门店信息等数据。对第二历史销售数据进行目标特征提取，得到第一特征，将第一特征分别输入到各个预测模型，得到若干个预测销量。

步骤105、计算目标商品的实际销量与每个预测销量的误差值，将最小的误差值对应的预测模型作为最佳预测模型。

计算目标商品的实际销售与每个预测销量的误差值，以对每个预测模型进行评估，具体的，误差值可以是加权平均绝对百分比误差值、平均绝对百分比误差值、均方误差值或平均绝对误差值，选择误差值最小的预测模型作为目标商品的最佳预测模型。通过目标商品对预测模型进行回测来选择最佳预测模型，能客观科学地以数据回测的方法选择最佳预测模型，降低人工经验判断的风险，例如，季节性产品数据集以往具有高随机性特性适合移动平均模型，但过了一段时间后它呈现低随机性，此时就不适合继续采用移动平均模型，而人工经验未能随之改变，使用回测近期数据择优的方法，可以及时捕捉数据信息并修改模型选择，从而提高商品销量预测准确率。

步骤106、获取目标商品的第三历史销售数据，对第三历史销售数据进行目标特征提取得到第二特征，将第二特征输入到最佳预测模型，输出目标商品在预置时间段的销量。

第三历史销售数据距离当前时间的时间段小于第二历史销售数据距离当前时间的时间段，当第三历史销售数据为近1个月的销售数据时，相应的，第三历史销售数据具体可以为近1个月的销量、近一个月的节假日、近一个月的天气和线下门店信息等数据。在获取了目标商品的第三历史销售数据后，对第三历史销售数据进行目标特征提取得到第二特征，将第二特征输入前述回测得到的最佳预测模型，输出目标商品在预置时间段的销量。

本申请实施例中的线下门店商品销量预测方法，获取若干个线下门店的商品的第一历史销售数据，并对第一历史销售数据进行目标特征提取和分层分类，得到若干个训练集，通过分层分类，使得每个训练集的特征比较突出，每个训练集拥有更一致的特征，可以更好的训练待训练模型；将每个数据集分别输入到若干个待训练模型进行训练，使用机器学习模型和时间序列模型等多个待训练模型进行训练，避免单一模型预测准确度不高的问题；通过对获取的目标商品的第二历史销售数据进行目标特征提取并输入到各个预测模型，得到多个预测销量，通过计算预测销量和真实销量的误差值来回测，选择适合目标商品的最优预测模型，将最优预测模型来预测目标商品预置时间段的销量，通过目标商品的第二历史销售数据来进行回测，从而选择最适合目标商品的预测模型，提高了预测准确率，解决了现有的销量预测方法采用单一预测模型存在的预测准确率低的技术问题。

为了便于理解，请参考图2，本申请还提供一种线下门店商品销量预测方法的另一个实施例，包括：

步骤201、获取若干个线下门店的商品的第一历史销售数据，并对第一历史销售数据进行预处理。

商品的第一历史销售数据至少包括历史销量、节假日、天气和线下门店信息等数据。预处理包括数据筛选、数据缺失值填充或异常值修改，通过对数据进行预处理，可以提高第一历史销售数据的质量，进而提高预测模型的预测性能。

步骤202、对预处理后的第一历史销售数据进行目标特征提取和分层分类，得到若干个训练集。

对第一历史销售数据进行目标特征提取，目标特征至少包括季节性特征、节假日特征、天气特征和门店特征(商圈、周期性)，还可以包括促销计划特征等，可以采用宽表存储该目标特征。对第一历史销售数据进行类型打标，用于区分不同类型数据，可以从地域、商品品类、销量、波动性和销售频率来对第一历史销售数据进行分类，打标方式为分层打标，同一个第一历史销售数据的每个维度可由范围的大到小打上标签，如地域标签可以为省、城市和门店，商品品类可以为大类、中类和小类，根据该标签对第一历史销售数据进行分层分类，得到若干个训练集，每个训练集为一个层级类别，训练集中包括多个训练样本，每个训练样本由目标特征和销量构成，通过对数据进行分层分类，使得各个训练集的特征更加突出，其内在拥有更一致的特性，如训练集的随机性、季节性、趋势性，使得选择模型的时候更有针对性，可以提高预测模型的预测准确率。

步骤203、将每个训练集分别输入到若干个待训练模型进行训练，得到若干个预测模型。

步骤204、获取目标商品的第二历史销售数据，并对第二历史销售数据进行预处理。

第二历史销售数据距离当前时间的时间段小于第一历史销售数据距离当前时间的时间段，第二历史销售数据至少包括历史销量、节假日、天气和线下门店信息等数据。预处理包括数据筛选、数据缺失值填充或异常值修改。

步骤205、对预处理后的第二历史销售数据进行目标特征提取得到第一特征，将第一特征分别输入到各个预测模型，得到若干个预测销量。

对预处理后的第二历史销售数据进行目标特征提取，得到第一特征，将第一特征分别输入到各个预测模型，得到若干个预测销量。

步骤206、计算目标商品的实际销量与每个预测销量的误差值，将最小的误差值对应的预测模型作为最佳预测模型。

步骤207、获取目标商品的第三历史销售数据，并对第三历史销售数据进行预处理。

第三历史销售数据距离当前时间的时间段小于第二历史销售数据距离当前时间的时间段，当第三历史销售数据为近1个月的销售数据时，相应的，第三历史销售数据具体可以为近1个月的销量、近一个月的节假日、近一个月的天气和线下门店信息等数据。在获取了目标商品的第三历史销售数据后，对第三历史销售数据进行预处理，预处理包括数据筛选、数据缺失值填充或异常值修改。

步骤208、对预处理后的第三历史销售数据进行目标特征提取得到第二特征，将第二特征输入到最佳预测模型，输出目标商品在预置时间段的销量。

对预处理后的第三历史销售数据进行目标特征提取得到第二特征，将第二特征输入前述回测得到的最佳预测模型，输出目标商品在预置时间段的销量。

为了便于理解，请参考图3，本申请提供了一种线下门店商品销量预测装置，包括：

第一获取单元301，用于获取若干个线下门店的商品的第一历史销售数据。

分类单元302，用于对第一历史销售数据进行目标特征提取和分层分类，得到若干个训练集。

训练单元303，用于将每个训练集分别输入到若干个待训练模型进行训练，得到若干个预测模型，预测模型的数量为训练集的数量与待训练模型的数量之积，待训练模型至少包括机器学习模型和时间序列模型。

提取单元304，用于对获取的目标商品的第二历史销售数据进行目标特征提取得到第一特征，将第一特征分别输入到各个预测模型，得到若干个预测销量，第二历史销售数据距离当前时间的时间段小于第一历史销售数据距离当前时间的时间段。

计算单元305，用于计算目标商品的实际销量与每个预测销量的误差值，将最小的误差值对应的预测模型作为最佳预测模型。

预测单元306，用于获取目标商品的第三历史销售数据，对第三历史销售数据进行目标特征提取得到第二特征，将第二特征输入到最佳预测模型，输出目标商品在预置时间段的销量，第三历史销售数据距离当前时间的时间段小于第二历史销售数据距离当前时间的时间段。

作为进一步的改进，还包括：

预处理单元307，用于对第一历史销售数据进行预处理，预处理包括数据筛选、数据缺失值填充或异常值修改。

作为进一步的改进，目标特征至少包括季节性特征、节假日特征、天气特征或门店特征。

作为进一步的改进，误差值包括加权平均绝对百分比误差值、平均绝对百分比误差值、均方误差值或平均绝对误差值。

本申请还提供了一种线下门店商品销量预测设备，设备包括处理器以及存储器；

存储器用于存储程序代码，并将程序代码传输给处理器；

处理器用于根据程序代码中的指令执行前述的线下门店商品销量预测方法实施例中的线下门店商品销量预测方法。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

以上所述，以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：雷小平
技术所有人：名创优品(横琴)企业管理有限公司
我是此专利的发明人

上一篇：显示提高的粘膜转移的药物纳米粒子的制作方法
上一篇：一种用于钢结构的栈桥支柱机构的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。