一种不依赖自身历史销量数据的商品销量预测方法及系统与流程

文档序号:31415631发布日期:2022-09-03 13:54阅读:157来源:国知局
一种不依赖自身历史销量数据的商品销量预测方法及系统与流程

1.本发明涉及商品销量预测技术领域,具体而言,涉及一种不依赖自身历史销量数据的商品销量预测方法及系统。


背景技术:

2.传统的销量预测方法或模型往往针对是已经上市且有大量历史销售数据的产品,结合其历史数据进行建模,预测其在未来一段时间内的可能销量。然而,这类模型无法应用于尚未投产、无相关历史数据的新品或刚刚上市尚未产生大量销售数据的商品的销量预测,由此需要一种能够对新产品、旧商品都能进行销量预测的方法及系统。


技术实现要素:

3.本发明的目的在于提供一种不依赖自身历史销量数据的商品销量预测方法及系统,其能够对无历史销量数据的未上市待预测商品或刚刚上市尚无大量销售数据的商品以及已上市一段时间的旧商品进行销量预测,辅助分析不同商品参数组合对待预测商品的销量影响。
4.本发明的实施例是这样实现的:
5.第一方面,本技术实施例提供一种不依赖自身历史销量数据的商品销量预测方法,其包括:
6.获取待预测商品对应的同品类商品的商品参数信息和销量信息,并进行特征提取和向量化转换,得到商品参数特征数据和对应的销量特征数据;
7.将商品参数特征数据和对应的销量特征数据输入预设的销量预测模型中进行训练,得到不同商品参数组合与销量之间的回归模型;
8.将商品参数特征数据和对应的销量特征数据输入预设的因果推断模型中进行训练,得到各项商品参数与销量之间的因果模型;
9.获取待预测商品对应的商品参数特征数据分别输入到上述回归模型和因果模型中,得到预测结果并输出,上述预测结果包括销量预测值和各参数对应的因果效应权重值。
10.基于第一方面,在本发明的一些实施例中,上述方法还包括:
11.获取待预测商品上市后的实际销量数据,计算并得到实际销量数据与上述销量预测值之间的残差值;
12.判断残差值是否大于预设的标准残差值,若是,则将实际销量数据输入销量预测模型中重新进行训练,得到新的回归模型;若否,则直接输出。
13.基于第一方面,在本发明的一些实施例中,上述方法还包括:
14.根据预设的模型训练条件对商品参数特征数据和对应的销量特征数据进行筛选,当两者都满足训练条件,则输入预设的销量预测模型和因果推断模型中进行训练;当不满足训练条件时,则重新选择商品参数数据并判断。
15.基于第一方面,在本发明的一些实施例中,上述进行特征提取和向量化转换,得到
商品参数特征数据和对应的销量特征数据的步骤具体包括:
16.从数据库中抽取待预测商品对应的同品类商品的商品参数数据和销量数据;
17.利用特征选择算法对商品参数数据进行特征提取,得到商品参数特征数据;
18.识别销量数据中的失真销量数据,并执行数据清洗和数据修复;
19.对清洗后的数据进行格式、粒度、向量化转换,得到销量特征数据。
20.基于第一方面,在本发明的一些实施例中,上述特征选择算法为皮尔逊系数/relief算法/最大相关最小冗余算法。
21.基于第一方面,在本发明的一些实施例中,上述将商品参数特征数据和对应的销量特征数据输入预设的因果推断模型中进行训练,得到各项商品参数与销量之间的因果模型的步骤具体包括:
22.从商品参数特征数据中提取并得到核心商品参数特征数据;
23.将核心商品参数特征数据输入预设的因果推断模型中利用混淆变量控制方法进行训练,得到各项核心商品参数与销量之间的因果模型。
24.基于第一方面,在本发明的一些实施例中,上述得到商品参数特征数据和对应的销量特征数据的步骤包括:
25.通过大数据etl技术获取待预测商品对应的同品类商品的商品参数特征数据和对应的销量特征数据。
26.第二方面,本技术实施例提供一种不依赖自身历史销量数据的商品销量预测系统,其包括:
27.信息收集处理模块,用于获取待预测商品对应的同品类商品的商品参数信息和销量信息,并进行特征提取和向量化转换,得到商品参数特征数据和对应的销量特征数据;
28.销量预测模块,用于将商品参数特征数据和对应的销量特征数据输入预设的销量预测模型中进行训练,得到不同商品参数组合与销量之间的回归模型;
29.因果分析模块,用于将商品参数特征数据和对应的销量特征数据输入预设的因果推断模型中进行训练,得到各项商品参数与销量之间的因果模型;
30.结果输出模块,用于获取待预测商品对应的商品参数特征数据分别输入到上述回归模型和因果模型中,得到预测结果并输出,上述预测结果包括销量预测值和各参数对应的因果效应权重值;
31.模型优化模块,用于获取并计算待预测商品上市后的实际销量数据与销量预测值之间的残差值,并判断残差值是否大于预设的标准残差值,若是,则将实际销量数据输入销量预测模型中重新进行训练,得到新的回归模型,若否,则直接输出。
32.第三方面,本技术实施例提供一种电子设备,其包括存储器,用于存储一个或多个程序;处理器。当上述一个或多个程序被上述处理器执行时,实现如上述第一方面中任一项上述的方法。
33.第四方面,本技术实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述第一方面中任一项上述的方法。
34.相对于现有技术,本发明的实施例至少具有如下优点或有益效果:
35.本技术实施例提供一种不依赖自身历史销量数据的商品销量预测方法及系统,首先获取与待预测商品对应的同品类商品的商品参数特征数据和销量特征数据,经过筛选
后,分别将特征数据输入预设的销量预测模型和因果推断模型中进行训练,得到不同商品参数组合与销量之间的回归模型,用以对待预测商品的销量进行预测,并得到各项商品参数与销量之间的因果模型,用以体现不同商品参数组合对销量的影响程度,即实现因果效应定量分析,最后,将待预测商品对应的参数数据分别输入到回归模型和因果模型中进行预测,输出稳定的预测销量数据以及特定参数组合对销量的因果效应。整体而言,本技术可以摆脱现有销量预测模型对商品本身历史销量数据的依赖,完成对待预测商品的销量预测。同时,本技术更精准量化不同商品参数组合对于待预测商品销量的因果影响,通过分析影响销量的核心参数,更精准的定位影响待预测商品未来销量的核心参数组合,优化设计流程。
附图说明
36.为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
37.图1为本发明提供的一种不依赖自身历史销量数据的商品销量预测方法一实施例的流程图;
38.图2为本发明提供的一种不依赖自身历史销量数据的商品销量预测方法另一实施例的流程图;
39.图3为本发明提供的一种不依赖自身历史销量数据的商品销量预测系统一实施例的程序框图;
40.图4为本发明提供的一种不依赖自身历史销量数据的商品销量预测系统一实施例的结构示意图;
41.图5为本发明实施例提供的一种电子设备的结构框图。
42.图标:1、信息收集处理模块;2、销量预测模块;3、因果分析模块;4、结果输出模块;5、模型优化模块;6、存储器;7、处理器;8、通信接口。
具体实施方式
43.为使本技术实施例的目的、技术方案和优点更加清楚,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本技术一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本技术实施例的组件可以以各种不同的配置来布置和设计。
44.因此,以下对在附图中提供的本技术的实施例的详细描述并非旨在限制要求保护的本技术的范围,而是仅仅表示本技术的选定实施例。基于本技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
45.实施例
46.下面结合附图,对本技术的一些实施方式作详细说明。在不冲突的情况下,下述的各个实施例及实施例中的各个特征可以相互组合。
47.请参照图1,图1所示为本技术实施例提供的一种不依赖自身历史销量数据的商品销量预测方法的流程图,该方法包括以下步骤:
48.步骤s1:获取待预测商品对应的同品类商品的商品参数信息和销量信息,并进行特征提取和向量化转换,得到商品参数特征数据和对应的销量特征数据。
49.上述步骤中,可以利用消费者大数据获得待预测商品对应的同品类商品的相关商品参数信息和销量信息,然后对其进行处理和筛选,以得到商品参数特征数据和对应的销量特征数据,作为后续训练销量预测模型和因果推断模型的训练样本。其中,待预测商品可以为无历史销量数据的未上市的新商品或者刚刚上市尚无大量销售数据的商品或者已上市一段时间但销量数据难以获取的商品。示例性的,若待预测商品为一款待上市的手机,则可以先获取与其相关的同类手机产品的参数信息和销量信息,然后通过大数据etl技术进行提取,以得到商品参数特征数据和对应的销量特征数据。其中,商品参数信息包括但不限于:cpu、屏幕尺寸、屏幕分辨率、ram(动态存储)、手机内存(rom)、相机像素、电池等等。
50.上述步骤中具体的处理过程包括:首先从数据库中抽取待预测商品对应的同品类商品的商品参数数据和销量数据,接着,利用特征选择算法对商品参数数据进行特征提取,得到商品参数特征数据,其中,特征选择算法可以为皮尔逊系数或relief算法或最大相关最小冗余算法等。然后,识别销量数据中的失真销量数据,并执行数据清洗和数据修复,其中,数据清洗的目的是过滤那些不符合要求的数据,例如不完整的数据、错误的数据和重复的数据等,以剔除一些不必要的数据,减少内存。最后,对清洗后的数据进行格式、粒度、向量化转换,得到销量特征数据,并将商品参数特征数据和销量特征数据作为训练样本,后续输入到销量预测模型和因果推断模型中进行训练。
51.另外,由于商品的销售场所和一些环境因素也会对商品的销量产生影响,所以为了更加全面地对模型进行训练,可以在商品参数特征数据的基础上,同时考虑商品销售场所、销售地面积、销售地库存量、节假日、天气、环境经济信息等,以获得更好的训练模型,更准确地对销量进行预测。
52.步骤s2:将商品参数特征数据和对应的销量特征数据输入预设的销量预测模型中进行训练,得到不同商品参数组合与销量之间的回归模型。
53.上述步骤中,在训练时,可以将上述商品参数特征数据和销量特征数据构成的训练样本按照一定比例分为训练集和验证集,例如8:2,用80%的数据作为训练集进行模型训练,用剩余的20%的数据作为验证集对训练后的模型进行验证。验证时,计算销量预测值与实际销量值的残差,并预先设置需达到的残差标准,如果计算出来的残差过大,未达到预设的残差标准,说明预测结果准确度不够,则对模型进行迭代优化,以使最终得到的回归模型的准确率达到一定的高度。训练、验证完成后,得到的回归模型反映了不同商品参数组合与销量之间的映射关系,例如将该待预测商品对应的同品类商品的销量特征数据设为y,将相关的商品参数特征数据设为x,商品不同的参数特征组合与销量之间的映射关系设为f(x),则向量x与向量y之间的映射关系可以表示为:y=f(x)。
54.此外,在将商品参数特征数据和对应的销量特征数据输入预设的销量预测模型之前,还可以先根据预设的模型训练条件对商品参数特征数据和对应的销量特征数据进行筛选,当两者都满足训练条件,则输入预设的销量预测模型和因果推断模型中进行训练;当不满足训练条件时,则重新选择商品参数数据并判断。将数据进行筛选的目的主要是为了剔
除一些超限、跳变、异常或重复的数据等,以避免对一些不必要的数据进行训练,提高整体训练速度。
55.步骤s3:将商品参数特征数据和对应的销量特征数据输入预设的因果推断模型中进行训练,得到各项商品参数与销量之间的因果模型。
56.上述步骤中,由于训练得到的回归模型是基于关联(correlation)分析构建的,而关联分析本身缺乏可解释性和稳定性,因为在关联分析中,相关联的两个变量不一定存在因果关系。例如在手机屏幕尺寸大小不同的情况下,发现手机的最终销量不同,这只能说明手机屏幕尺寸与销量之间有关联,但是并不能说明手机屏幕尺寸大小改变就一定会导致销量改变,即手机屏幕尺寸与销量之间并不一定存在定量的因果关系。为了了解各项商品参数对销量的影响程度,即各项商品参数对销量的因果效应,可以将商品参数特征数据和对应的销量特征数据输入预设的因果推断模型中进行训练,以得到各项商品参数与销量之间的因果模型,输出特定参数组合对销量的因果效应。具体的,首先,从商品参数特征数据中提取并得到核心商品参数特征数据,这是由于不是所有获取到的商品参数特征数据都与销量之间具有因果关系,所以需要先从商品参数特征数据提取出重要的、设计者感兴趣的核心商品参数特征数据来进行训练;然后,将核心商品参数特征数据输入预设的因果推断模型中利用混淆变量控制方法进行训练,得到各项核心商品参数与销量之间的因果模型。
57.步骤s4:获取待预测商品对应的商品参数特征数据分别输入到上述回归模型和因果模型中,得到预测结果并输出,上述预测结果包括销量预测值和各参数对应的因果效应权重值。
58.上述步骤中,首先按照步骤s1对待预测商品的相关商品参数特征数据进行提取,然后分别将其输入上述回归模型和因果模型中,即可得到销量预测结果和相关商品参数对销量的因果效应权重结果,从而对待预测商品的销量进行预测。同时,更精准量化不同商品参数组合对于待预测商品销量的因果影响,通过分析影响销量的核心商品参数,更精准的定位影响待预测商品未来销量的核心参数组合,优化设计流程。
59.请参照图2和图3,上述方法还包括:
60.步骤s5:获取待预测商品上市后的实际销量数据,计算并得到实际销量数据与上述销量预测值之间的残差值;
61.步骤s6:判断残差值是否大于预设的标准残差值,若是,则将实际销量数据输入销量预测模型中重新进行训练,得到新的回归模型;若否,则直接输出。
62.上述步骤中,通过持续收集待预测商品上市后的实际销量数据,并将计算得到的实际销量数据与销量预测值之间的残差值与预设的标准残差值进行比较,如果实际销量与预测销量之间的差距过大,则将实际销量数据输入销量预测模型中进行再次训练,以对回归模型进行迭代和优化,同时,可以将实际销量数据输入因果推断模型中进行再次训练,以对因果模型进行迭代和优化(如图3所示),使得回归模型和因果模型的预测效果更加准确。
63.基于同样的发明构思,本发明还提出一种不依赖自身历史销量数据的商品销量预测系统,请参照图4,图4为本技术实施例提供的一种不依赖自身历史销量数据的商品销量预测系统的结构框图。该系统包括:
64.信息收集处理模块1,用于获取待预测商品对应的同品类商品的商品参数信息和销量信息,并进行特征提取和向量化转换,得到商品参数特征数据和对应的销量特征数据;
65.销量预测模块2,用于将商品参数特征数据和对应的销量特征数据输入预设的销量预测模型中进行训练,得到不同商品参数组合与销量之间的回归模型;
66.因果分析模块3,用于将商品参数特征数据和对应的销量特征数据输入预设的因果推断模型中进行训练,得到各项商品参数与销量之间的因果模型;
67.结果输出模块4,用于获取待预测商品对应的商品参数特征数据分别输入到上述回归模型和因果模型中,得到预测结果并输出,上述预测结果包括销量预测值和各参数对应的因果效应权重值;
68.模型优化模块5,用于获取并计算待预测商品上市后的实际销量数据与销量预测值之间的残差值,并判断残差值是否大于预设的标准残差值,若是,则将实际销量数据输入销量预测模型中重新进行训练,得到新的回归模型,若否,则直接输出。
69.请参照图5,图5为本技术实施例提供的一种电子设备的结构框图。该电子设备包括存储器6、处理器7和通信接口8,该存储器6、处理器7和通信接口8相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。存储器6可用于存储软件程序及模块,如本技术实施例所提供的一种不依赖自身历史销量数据的商品销量预测系统对应的程序指令/模块,处理器7通过执行存储在存储器6内的软件程序及模块,从而执行各种功能应用以及数据处理。该通信接口8可用于与其他节点设备进行信令或数据的通信。
70.其中,存储器6可以是但不限于,随机存取存储器(random access memory,ram),只读存储器(read only memory,rom),可编程只读存储器(programmable read-only memory,prom),可擦除只读存储器(erasable programmable read-only memory,eprom),电可擦除只读存储器(electric erasable programmable read-only memory,eeprom)等。
71.处理器7可以是一种集成电路芯片,具有信号处理能力。该处理器7可以是通用处理器,包括中央处理器(central processing unit,cpu)、网络处理器(network processor,np)等;还可以是数字信号处理器(digital signal processing,dsp)、专用集成电路(application specific integrated circuit,asic)、现场可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
72.可以理解,图5所示的结构仅为示意,电子设备还可包括比图5中所示更多或者更少的组件,或者具有与图1所示不同的配置。图5中所示的各组件可以采用硬件、软件或其组合实现。
73.在本技术所提供的实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本技术的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于
硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
74.另外,在本技术各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
75.所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
76.综上所述,本技术实施例提供一种不依赖自身历史销量数据的商品销量预测方法及系统,首先获取与待预测商品对应的同品类商品的商品参数数据和销量数据,经过筛选后,分别将数据输入预设的销量预测模型/因果推断模型中进行训练,得到不同商品参数组合与销量之间的回归模型,用以对待预测商品的销量进行预测,并得到各项商品参数与销量之间的因果模型,用以体现不同商品参数组合对销量的影响程度,即实现因果效应定量分析,最后,将待预测商品对应的参数数据分别输入到回归模型和因果模型中进行预测,输出稳定的预测销量数据以及特定参数组合对销量的因果效应。整体而言,本技术可以摆脱销量预测模型对历史销量数据的依赖,完成对待预测商品的销量预测。同时,本技术更精准量化不同商品参数组合对于待预测商品销量的因果影响,通过分析影响销量的核心参数,更精准的定位影响待预测商品未来销量的核心参数组合,优化设计流程。
77.以上所述仅为本技术的优选实施例而已,并不用于限制本技术,对于本领域的技术人员来说,本技术可以有各种更改和变化。凡在本技术的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本技术的保护范围之内。
78.对于本领域技术人员而言,显然本技术不限于上述示范性实施例的细节,而且在不背离本技术的精神或基本特征的情况下,能够以其它的具体形式实现本技术。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本技术的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本技术内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1