基于电商销售数据的商品分类提取及在该分类提取下的销量预测方法

文档序号:10594705阅读:200来源:国知局
基于电商销售数据的商品分类提取及在该分类提取下的销量预测方法
【专利摘要】本发明是一种基于电商销售数据及外部相关数据的销量预测方法,其特征在于:首先通过电商企业产品销售的地域地域特征对所售区域进行重新划分,提高销售数据密度。其次利用地域内汇总的销售数据建立时间序列拟合模型,通过历史数据预测未来的销售量。最后利用相关性分析,选取对于销售影响较大的外部因素,通过隐马尔科夫预测模型,将外部因素的变化对销售量的概率影响加入到预测模型中,提高预测结果的可靠性。
【专利说明】
基于电商销售数据的商品分类提取及在该分类提取下的销量预测方法
技术领域
[0001]本发明涉及互联网电商信息处理领域,具体地说,是涉及一种基于电商企业的销售数据及综合利用外部数据的商品销量预测方法。
【背景技术】
[0002]随着我国电商基础设施的日渐完善,越来越多的电商企业逐渐发展状态,形成了规模级的电商企业,年销售额上千万甚至上亿元,随着销售量的增加,随之带来的就是库存管理,个性化营销方面的问题,由于电商企业的线上销售特性,其产品是随机的销往全国各地,如何高效,准确的给出未来某一地域的销售预测,能够帮助企业合理规划库存,有针对性的进行活动策划,降低企业运营成本,提高在同类电商企业中的竞争力。
[0003]传统的销量预测技术主要采用的是对历史销售数据进行回归分析,建立回归模型,这种预测方式在传统的供大于求的销售状况中有着较好的应用,但是电商企业的销售存在着一下几个传统销售不具有的特征:产品种类的多样性;产品库存的灵活性;销售范围的不确定性;例如:某电商企业在销售某种商品后,货源停止供应该种商品而采用另一型号的商品重新供货,在这种情况下,传统的回归分析就无法识别两种产品之间的关系。此外,线上销售更容易受到外部因素的影响,而传统的回归分析无法考量外部因素,当外部因素发生较大改变时,其对销售预测存在着较大偏差。

【发明内容】

[0004]鉴于以上所述现有技术存在的问题和不足,本发明要解决的技术问题是提供一种能够综合历史销售数据及外部影响因素的基于电商销售数据的商品分类提取及在该分类提取下的销量预测方法,该方法既能考量销售历史趋势,同时又能对当前外部因素的变化产生响应,修正基于历史数据的预测值。
[0005]为了解决上述问题,本发明采用下述技术方案:
一种基于电商销售数据及外部相关数据的销量预测方法,其特征在于:首先利用外部信息对电商销售地域SalesArea进行重新划分,在新的电商销售地域SalesArea下对销售数据进行汇总,然后利用聚类技术将零散的商品类型重新聚合到一起,最后利用复合销售预测技术,预测聚合商品分类下的销售量。
[0006]具体步骤如下:
(I)利用相关数据对电商销售地域SalesArea进行重新划分。
[0007]a、地域相关要素提取。
[0008]不同地域间对于相同产品的销售模式是不同的,因此在对电商企业销售商品的销量预测研究中,首先要区别对待不同地区的销售模式。因此首先要通过相关性分析,选择与销售相关的外部因素。
[0009]b、地域重新划分。
[0010]通过相关性分析得出的因素,例如经济,人口等,利用这些外部因素序列通过聚类的方法,获取新的地域分类集合Area= {a1、a2、a3、......an},其中an第n个新地域内包含有的原始地域信息。
[0011](2)利用电商企业的销售数据Sal esData按照商品销售时间Time对所有商品进行共性提取,获取所有商品所属Categoriesfg息。
[0012]a、商品销量信息汇总。
[0013]在新的销售地域划分集合Area内,对所售产品按一定的时间间隔T进行统计汇总,最终获取所有商品在给定地域内的销售时间序列SalesTSi={ su、si2、si3、......Sin }。
[0014]b、利用聚类技术进行商品聚类。
[0015]利用聚类技术将求出的商品销售时间序列SalesTS1进行聚类分析操作,获取商品的新分类信息Categories。
[0016](3)在新的Categories下,利用复合预测模型对商品销量进行预测。
[0017]a、构造基于历史销售数据的预测模型;
根据不同商品的销售特征,具有季节特性的商品销售序列选择SARMA时间序列模型,不具有季节特性的商品销售序列选择ARMA时间序列模型,利用建立的时间序列模型拟合历史数据并给出销量预测值。
[0018]b、利用相关性分析获取对于销售数据有主要影响的外部因素;
由于在可获得的众多外部销量相关的数据中存在大量的数据,数据之间又会有各种各样的先关性关系,因此,在进行外部因素对于销量数据的影响分析前,首先要通过二者的相关性分析确定二者的相关程度,筛选掉相关性较小的外部因素。这里采用皮尔森相关系数(Pearson correlat1n coefficient)作为相关性检验的标准。
[0019]C、利用外部因素建立隐马尔科夫预测模型;
利用外部因素的历史变化数据生成,外部因素变化的预测矩阵即隐马尔科夫模型中的转移概率矩阵,再利用外部因素与销售变化的历史数据生成混淆矩阵。最后给定初始外部条件观察值,通过转移矩阵给出未来时段的外部因素概率分布,再通过混淆矩阵将外部因素的概率分布转化为对销量影响的概率分布。
[0020]基于电商销售数据的商品分类提取及在该分类提取下的销量预测方法到此结束。
[0021]本发明的基于电商销售数据及外部相关数据的销量预测方法,通过对电商销售地域特征提取,商品特征提取等手段对电商销售数据进行重新整合,再利用复合销售预测方法,结合历史数据以及外部因素对在新分类下的商品销量进行准确预测,解决了电商销售数据的零散问题及预测结果对外部因素无反应的缺点,提高了预测结果的可靠性和实用性。
【附图说明】
[0022]图1是本发明的基于电商销售数据的商品分类提取及在该分类提取下的销量预测方法的流程图;
图2是图1所述的地域重划分的流程图;
图3是图1中产品分类提取的流程图;
图4是图1中复合预测模型的流程图。
【具体实施方式】
[0023]下面结合附图和【具体实施方式】对本发明作进一步详细的描述。
[0024]参照图1,本发明的基于电商销售数据的商品分类提取及在该分类提取下的销量预测方法包括如下步骤:
步骤01、利用相关数据对电商销售地域SalesArea进行重新划分,参照图2,其具体如下:
步骤101:地域相关要素提取;
不同地域间对于相同产品的销售模式是不同的,因此在对电商企业销售商品的销量预测研究中,首先要区别对待不同地区的销售模式。因此首先要通过相关性分析,选择与销售相关的外部因素。
[0025]步骤102:地域重新划分;
通过相关性分析得出的因素,例如经济,人口等,利用这些外部因素序列通过聚类的方法,获取新的地域分类集合4^&={&1、32、33、......an},其中an第η个新地域内包含有的原始地域信息。
[0026]步骤02、判利用电商企业的销售数据SalesData按照商品销售时间Time对所有商品进行共性提取,获取所有商品所属Categories彳目息。参照图3,包括如下步骤:
步骤201:商品销量信息汇总;
在新的销售地域划分集合Area内,对所售产品按一定的时间间隔T进行统计汇总,最终获取所有商品在给定地域内的销售时间序列SalesTSi={ su、si2、si3、......Sin }。
[0027]步骤202:利用聚类技术进行商品聚类;
利用聚类技术将求出的商品销售时间序列SalesTS1进行聚类分析操作,获取商品的新分类信息Categories。
[0028]步骤03、在新的Categories下,利用复合预测模型对商品销量进行预测。参照图4,包括如下步骤:
步骤301:构造基于历史销售数据的预测模型;
根据不同商品的销售特征,具有季节特性的商品销售序列选择SARMA时间序列模型,不具有季节特性的商品销售序列选择ARMA时间序列模型,利用建立的时间序列模型拟合历史数据并给出销量预测值。
[0029]步骤302:利用相关性分析获取对于销售数据有主要影响的外部因素;
由于在可获得的众多外部销量相关的数据中存在大量的数据,数据之间又会有各种各样的先关性关系,因此,在进行外部因素对于销量数据的影响分析前,首先要通过二者的相关性分析确定二者的相关程度,筛选掉相关性较小的外部因素。这里采用皮尔森相关系数(Pearson correlat1n coefficient)作为相关性检验的标准。
[0030]步骤303:利用外部因素建立隐马尔科夫预测模型;
利用外部因素的历史变化数据生成,外部因素变化的预测矩阵即隐马尔科夫模型中的转移概率矩阵,再利用外部因素与销售变化的历史数据生成混淆矩阵。最后给定初始外部条件观察值,通过转移矩阵给出未来时段的外部因素概率分布,再通过混淆矩阵将外部因素的概率分布转化为对销量影响的概率分布。
[0031]综上所述,本发明提出了一种基于电商销售数据及外部相关数据的销量预测方法,提高了电商领域内的商品销量预测的可靠性。
【主权项】
1.一种基于电商销售数据的商品分类提取及在该分类提取下的销量预测方法,其特征在于:首先利用电商企业销售数据SalesData按照商品销售的时间Time对所有销售商品进行共性提取,获取所有商品所属Categoriesfg息; 再利用上述方法中提取的Categories信息汇总商品销售数据,对此类商品建立复合预测模型,获取SalesForecast值; 具体步骤如下: (1)利用相关数据对电商销售地域SalesArea进行重新划分; (2)利用电商企业的销售数据SalesData按照商品销售时间Time对所有商品进行共性提取,获取所有商品所属Categories彳目息; (3)在新的Categories下,利用复合预测模型对商品销量进行预测。2.根据权利要求1所述的基于电商销售数据的商品分类提取及在该分类提取下的销量预测方法,其特征在于,其中步骤(I)中所述的利用相关数据对电商销售地域SalesArea进行重新划分,其操作步骤如下: a、地域相关要素提取:不同地域间对于相同产品的销售模式是不同的,因此在对电商企业销售商品的销量预测研究中,首先要区别对待不同地区的销售模式;因此首先要通过相关性分析,选择与销售相关的外部因素; b、地域重新划分:通过相关性分析得出的因素,例如经济,人口,利用这些外部因素序列通过聚类的方法,获取新的地域分类集合4^8={&1、&2、83、......an},其中an第η个新地域内包含有的原始地域信息。3.根据权利要求1所述的基于电商销售数据的商品分类提取及在该分类提取下的销量预测方法,其特征在于,其中步骤(2)中所述的利用电商企业的销售数据SalesData按照商品销售时间Time对所有商品进行共性提取,获取所有商品所属Categories信息,其操作步骤如下: a、商品销量信息汇总:在新的销售地域划分集合Area内,对所售产品按一定的时间间隔T进行统计汇总,最终获取所有商品在给定地域内的销售时间序列SalesTS1H su、Sl2、Si3、......Sin }; b、利用聚类技术进行商品聚类:利用聚类技术将求出的商品销售时间序列行聚类分析操作,获取商品的新分类信息Categories。4.根据权利要求1所述的基于电商销售数据的商品分类提取及在该分类提取下的销量预测方法,其特征在于,上述步骤(3)中所述的在新的Categories下,利用符合预测模型对商品销量进行预测,其操作步骤如下: a、构造基于历史销售数据的预测模型; 根据不同商品的销售特征,具有季节特性的商品销售序列选择SARMA时间序列模型,不具有季节特性的商品销售序列选择ARMA时间序列模型,利用建立的时间序列模型拟合历史数据并给出销量预测值; b、利用相关性分析获取对于销售数据有主要影响的外部因素; 由于在可获得的众多外部销量相关的数据中存在大量的数据,数据之间又会有各种各样的先关性关系,因此,在进行外部因素对于销量数据的影响分析前,首先要通过二者的相关性分析确定二者的相关程度,筛选掉相关性较小的外部因素;这里采用皮尔森相关系数(Pearson correlat1n coefficient)作为相关性检验的标准; c、利用外部因素建立隐马尔科夫预测模型; 利用外部因素的历史变化数据生成,外部因素变化的预测矩阵即隐马尔科夫模型中的转移概率矩阵,再利用外部因素与销售变化的历史数据生成混淆矩阵;最后给定初始外部条件观察值,通过转移矩阵给出未来时段的外部因素概率分布,再通过混淆矩阵将外部因素的概率分布转化为对销量影响的概率分布。
【文档编号】G06K9/62GK105956699SQ201610276199
【公开日】2016年9月21日
【申请日】2016年4月29日
【发明人】孙颖
【申请人】连云港天马网络发展有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1