基于协同过滤算法和聚类算法的卷烟消费研判方法与流程

文档序号：11433146阅读：472来源：国知局

本发明涉及烟草销售领域，尤其是一种基于协同过滤算法和k-means++聚类算法相结合的的卷烟消费研判方法，以对个体消费者的消费需求进行研判。

背景技术：

卷烟具有价值性和危害性并存的“双重属性”，这决定了烟草行业必须施行国家烟草专卖制度。但是经济与社会的发展，烟草行业的市场化要求不断提高，计划与市场的天平不断向市场倾斜。为了更加真实把握市场需求，生产更加适销对路的产品，进行更加科学的货源投放，国家局战略性地提出了开展市场需求预测工作。从2003年以来，需求预测探索的步伐从未间断，企业对需求预测重要性的认识不断加深，需求预测准确率不断提高。需求预测已成为真实把握市场，灵敏反应市场的重要工具，在工业企业生产、商业企业满足市场的过程中发挥着越来越重要作用。通过对创新卷烟市场需求预测的研究，进一步提高卷烟市场需求预测水平，从而推动“按需组织货源”的市场化进程。

卷烟商品市场需求预测是烟草企业营销活动的重要一环。之前的需求预测大多集中在区域消费总量的研判，缺乏对个体消费者的需求研判；之前的需求预测是全品规总量的预测，缺少对分品牌分品规需求的预测；之前的需求研判是基于历史销售数据的研判，缺少对未来多变消费环境的适变能力。目前，国内在卷烟产品个体消费者需求预测方法方面的研究甚少。所以，研究一种简便、快捷、真实、公平、低成本的能够从消费者层面，获取消费者对卷烟产品接受程度的反馈信息的方法，已成为同领域技术人员关注的问题。

技术实现要素：

本发明要解决的技术问题是：提出一种基于协同过滤算法和聚类算法的卷烟消费研判方法，通过对消费者信息和商品信息的挖掘，利用邻居集合的卷烟偏好，对个体消费者进行需求研判。

本发明所采用的技术方案为：一种基于协同过滤算法和聚类算法的卷烟消费研判方法，包括以下步骤：

1)样本采集；通过样本消费者的浏览记录、点赞情况、查询频繁度、购买记录以及注册时填报的卷烟偏好，获得样本消费者对卷烟各品规的偏好度；

2)特征采集：选取多个用户特征信息的特征值构建消费者特征向量，得到消费者特征矩阵；选取多个商品特征信息的特征值构建卷烟特征向量，得到卷烟特征矩阵；

3)聚类：运用k-means++算法分别对样本消费者和卷烟进行聚类，并计算各类类中心的偏好度；

4)相似度计算：根据所聚消费者类别，计算目标消费者和所属类中心的相似度；根据所聚卷烟类别，计算目标卷烟品规和所属类中心的相似度；

5)偏好度计算：基于协同过滤思想，计算user-based的偏好度和item-based的偏好度，整合两种路径所得的偏好度，得到需求研判值。

进一步的说，本发明所述的步骤3)中，通过k-means++聚类算法对消费者和卷烟进行聚类的步骤包括：

a、先从输入的数据点集合中随机选择一个点作为第一聚类中心；

b、对于数据集中的每一个点，计算它与最近聚类中心的距离d(x)；

c、选择另一个新的数据点作为新的聚类中心；

d、重复步骤b和步骤c，直到k个中心被选择出来；

e、利用这k个初始的聚类中心来运行标准的k-means算法。

再进一步的说，本发明所述的步骤4)中，计算研判目标与所属类中心的相似度，运用余弦距离计算公式，计算研判目标与所属类中心的距离，以距离大小推测相似度大小。

再进一步的说，本发明所述的步骤5)中，根据协同过滤中user-based思想，结合计算所得相似度，计算目标消费者对目标品规user-based偏好度；根据协同过滤中item-based思想，结合计算所得相似度，计算目标消费者对目标品规item-based偏好度。

本发明的有益效果是：通过将协同过滤算法和k-means++聚类算法相结合，运用k-means++的方法将消费者和卷烟聚类，再运用协同过滤算法的思想对某消费者对某卷烟的偏好度进行两种算法的测算，整合两种算法所得的偏好度，进而通过目标消费者的偏好度预测目标消费者的消费需求。

附图说明

下面结合附图和实施例对本发明进一步说明。

图1是本发明的原理流程框图。

具体实施方式

现在结合附图和优选实施例对本发明作进一步详细的说明。这些附图均为简化的示意图，仅以示意方式说明本发明的基本结构，因此其仅显示与本发明有关的构成。

如图1所示的一种基于协同过滤算法和聚类算法的卷烟消费研判方法，具体包括以下步骤：

第一步，使用卷烟消费者app，通过消费者浏览记录、点赞情况、查询频繁度、购买记录以及注册时填报的卷烟偏好，计算样本卷烟消费者(用i表示)对各品规(用j表示)的偏好度，即rij＝(ri1,ri2,…,rij,…)；

第二步，采集用户特征信息，选取p个特征值构建消费者特征向量，本实施例中即为消费者特征矩阵useri＝(ui1,ui2,…uip)；

第三步，汇总商品特征信息，选取q个特征值构建卷烟特征向量，本实施例中即为卷烟特征矩阵itemj＝(ij1,ij2,…ijq)；

第四步，运用k-means++算法对消费者和卷烟进行聚类，消费者聚集成x个类，卷烟聚集成y个类，对每个类中的每位消费者的特征值取平均，可得第x类消费者类中心偏好度为：

rcx＝average(rij)＝(rcx_1,rcx_2,…,rcx_j,…)

对每个类中的每个品规的特征值取平均，可得第y类卷烟类中心偏好度为：

rcy＝average(rij)＝(rcy_1,rcy_2,…,rcy_i,…)

第五步，计算类中每位个体消费者i和消费者类中心ci的距离ki，其中ci＝(ci1,ci2,…,cip)。根据余弦距离计算公式，可得ki：

第六步，计算类中每种个体卷烟j和卷烟类中心cj的距离kj，其中cj＝(cj1,cj2,…,cjq)。

根据余弦距离计算公式，可得kj：

第七步，根据协同过滤中user-based的思想，某未知偏好消费者的商品偏好情况，可由其所属类中心的品规偏好情况，结合该目标消费者与类中心的相似度计算得到。由第四步和第五步所得数据，计算第i个消费者对所有卷烟的user-basedrating值为：

rijub＝rcx_j×ki

即rijub＝(ri1ub,ri2ub,…,rijub,…)

＝(rcx_1×ki,rcx_2×ki,…,rcx_j×ki,…)

第八步，根据协同过滤中item-based的思想，由第四步和第六步所得数据，计算所有消费者对第j个卷烟的item-basedrating值为：

rijib＝rcy_i×kj

即rijib＝(ri1ib,ri2ib,…,rijib,…)

＝(rcy_1×kj,rcy_2×kj,…,rcy_j×kj,…)

第九步，将根据user-based和item-based计算的rating值求平均，得到某消费者i对某品规卷烟j的偏好程度为：

据此，可将rij看作是消费者i对品规卷烟j需求的研判值。最后，结合投放总量，可求出需求绝对量的研判值。

以上说明书中描述的只是本发明的具体实施方式，各种举例说明不对本发明的实质内容构成限制，所属技术领域的普通技术人员在阅读了说明书后可以对以前所述的具体实施方式做修改或变形，而不背离本发明的实质和范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：茅斯佳;苏建康;李剑;强韶军;李霓彬
技术所有人：江苏省烟草公司常州市公司
我是此专利的发明人

上一篇：具有抗头发衰老活性的生物活性组合物的制造方法与工艺
上一篇：多功能飞行害虫捕杀器的制造方法与工艺

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。