一种基于长尾效应的卷烟惊喜度推荐方法及系统与流程

文档序号:18888735发布日期:2019-10-15 21:22阅读:328来源:国知局
一种基于长尾效应的卷烟惊喜度推荐方法及系统与流程

本发明涉及计算机技术领域,具体提供一种基于长尾效应的卷烟惊喜度推荐方法及系统。



背景技术:

目前卷烟行业的市场行情普遍存在畅销烟、紧俏烟占据了整个卷烟市场80%的销量,特别是一些畅销、紧俏卷烟的限量供应在一定程度上影响到零售客户的运营。如何针对“需求不旺、销量不佳”的品牌,进行营销已迫在眉睫。

“长尾理论”阐述了:只要存储和流通的渠道足够大,需求不旺或销量不佳的产品所共同占据的市场份额可以和那些少数热销产品所占据的市场份额相匹敌甚至更大。也就是说,众多小市场汇聚成的市场能量可与主流大市场相抗衡。本文从“长尾理论”角度出发,将客户信息、卷烟销售数据和指标进行建模,挖掘卷烟长尾中的销售机会,增加卷烟销量。可以采用lda主题文档模型进行长尾推荐。lda主题文档模型是一种文档主题生成模型,也称为三层贝叶斯概率模型,传统的lda主题文档模型为文档-主题-词。所谓生成模型为文档-主题-词三层结构,就是说,我们认为一篇文章的每个词都是通过“以一定概率选择了某个主题,并从这个主题中以一定概率选择某个词语”这样一个过程得到。文档到主题服从多项式分布,主题到词服从多项式分布。但是传统的lda主题文档模型并不能满足分析卷烟行业行情的需求。



技术实现要素:

本发明的技术任务是针对上述存在的问题,提供一种能够将客户信息、卷烟销售数据和指标进行建模,挖掘卷烟长尾中的销售机会,增加卷烟销量的基于长尾效应的卷烟惊喜度推荐方法。

本发明进一步的技术任务是提供一种基于长尾效应的卷烟惊喜度推荐系统。

为实现上述目的,本发明提供了如下技术方案:

一种基于长尾效应的卷烟惊喜度推荐方法,具体包括以下步骤:

s1、数据集选取:根据销售指标对用户进行分档,从分档用户中选取训练集;

s2、建立模型:根据商品和用户的订购行为建立用户概率模型,根据用户概率模型对训练集验证;

s3、计算各用户主题分布的余弦相似度,使用用户主题分布间的余弦相似度来刻画用户相似度;

s4、寻找紧邻用户生成推荐卷烟集合。

作为优选,步骤s1中,选取训练集后,统计用户的卷烟品规订购数量,卷烟品规和订购的数量生成商品层wi,用户对卷烟品规订购总量为用户订购行为层uj。

根据各类销售指标对用户进行分档,一般分为30档用户,从30档用户中采用随机抽样的方法,每档用户取200个用户共6000户作为训练集,统计抽样用户各种品规卷烟的订购数量,将各品规卷烟和订购的数量生成商品层wi。每个用户的对于各品规卷烟订购总量看成客户订购行为层uj。相同主题下的用户是爱好相近的用户,可以作为长尾推荐的用户。

作为优选,步骤s2中,将uij作为用户订购卷烟出现的概率,如公式(1)所示

p(θ)=uj/wi(1)

通过用户概率模型分解得到卷烟-主题阵w和主题-用户阵k。

在20个主题下,进行500次的分解迭代,卷烟-主题阵w和主题-用户阵k趋于收敛。主题用来刻画用户的订购行为的偏好。

作为优选,步骤s3中,各用户主题分布的余弦相似度计算如公式(2)所示

其中sij表示用户ui和uj的相似度;ui和uj表示两用户的概率主题分布。其中相似度sij值越大,用户爱好越相近,寻找相似度最大的前n个用户作为推荐用户。

作为优选,步骤s4中,通过用户标签取出推荐用户的地理位置,使用k紧邻算法计算地理位置与目标用户最接近的推荐用户,将最接近的推荐用户订购卷烟集合推送给目标用户,k紧邻计算公式如公式(3)所示

其中,目标用户地理位置坐标为p(x1,y1),推荐用户地理位置坐标为q(x2,y2)。

一种基于长尾效应的卷烟惊喜度推荐系统,包括以下模块:

数据集选取模块:用于根据销售指标对用户进行分档,从分档用户中选取训练集;

模型模块:用于根据商品和用户的订购行为建立用户概率模型,根据用户概率模型对训练集验证;

各用户主题分布的余弦相似度计算模块:使用用户主题分布间的余弦相似度来刻画用户相似度;

卷烟集合生成模块:用于寻找紧邻用户生成推荐卷烟集合。

作为优选,所述数据集选取模块选取训练集后,统计用户的卷烟品规订购数量,卷烟品规和订购的数量生成商品层wi,用户对卷烟品规订购总量为用户订购行为层uj。

作为优选,卷烟集合生成模通过用户标签取出推荐用户的地理位置,使用k紧邻算法计算地理位置与目标用户最接近的推荐用户,将最接近的推荐用户订购卷烟集合推送给目标用户。

与现有技术相比,本发明的基于长尾效应的卷烟惊喜度推荐方法具有以下突出的有益效果:所述基于长尾效应的卷烟惊喜度推荐方法基于目前卷烟行业的市场情普遍存在畅销烟、紧俏烟占据了整个卷烟市场60%的销量,特别是一些畅销、紧俏卷烟的限量供应在一定程度上影响到零售客户的运营的问题,针对“需求不旺、销量不佳”的品牌,进行营销,将客户信息、卷烟销售数据和指标进行建模,挖掘卷烟长尾中的销售机会,增加卷烟销量,具有良好的推广应用价值。

附图说明

图1是本发明基于长尾效应的卷烟惊喜度推荐方法中客户订购行为层-商品-主题层示意图。

具体实施方式

下面将结合实施例,对本发明的基于长尾效应的卷烟惊喜度推荐方法及系统作进一步详细说明。

实施例

本发明的基于长尾效应的卷烟惊喜度推荐方法,具体包括以下步骤:

s1、数据集选取:根据销售指标对用户进行分档,从分档用户中选取训练集。

选取训练集后,统计用户的卷烟品规订购数量,卷烟品规和订购的数量生成商品层wi,用户对卷烟品规订购总量为用户订购行为层uj。

根据各类销售指标对用户进行分档,一般分为30档用户,从30档用户中采用随机抽样的方法,每档用户取200个用户共6000户作为训练集,统计抽样用户各种品规卷烟的订购数量,将各品规卷烟和订购的数量生成商品层wi。每个用户的对于各品规卷烟订购总量看成客户订购行为层uj。相同主题下的用户是爱好相近的用户,可以作为长尾推荐的用户。

s2、建立模型:根据商品和用户的订购行为建立用户概率模型,根据用户概率模型对训练集验证。

将uij作为用户订购卷烟出现的概率,如公式(1)所示

p(θ)=uj/wi(1)

通过用户概率模型分解得到卷烟-主题阵w和主题-用户阵k。

在20个主题下,进行500次的分解迭代,卷烟-主题阵w和主题-用户阵k趋于收敛。主题用来刻画用户的订购行为的偏好。

s3、计算各用户主题分布的余弦相似度,使用用户主题分布间的余弦相似度来刻画用户相似度。

各用户主题分布的余弦相似度计算如公式(2)所示

其中sij表示用户ui和uj的相似度;ui和uj表示两用户的概率主题分布。其中相似度sij值越大,用户爱好越相近,寻找相似度最大的前n个用户作为推荐用户。

s4、寻找紧邻用户生成推荐卷烟集合。

通过用户标签取出推荐用户的地理位置,使用k紧邻算法计算地理位置与目标用户最接近的推荐用户,将最接近的推荐用户订购卷烟集合推送给目标用户,k紧邻计算公式如公式(3)所示

其中,目标用户地理位置坐标为p(x1,y1),推荐用户地理位置坐标为q(x2,y2)。

该基于长尾效应的卷烟惊喜度推荐方法利用lda文档主题模型对用户的兴趣建模,lda文档主题模型为客户订购行为-主题-商品这三层。将主题模型下生成的多项式的概率分布表示为用户对商品的兴趣。并将一个用户对所有商品的所有行为并成一个文档进行主题生成,得到概率分布情况。有了概率分布情况就可以建立相应的主题兴趣模型。

其中客户订购行为层-商品-主题三层释义如下,如附图1所示:

商品层:商品集w={w1,w2...wv}是从卷烟库中抽取出来的去除停用卷烟后的所有卷烟的集合。

主题层:主题集中的每一个主题zk都是基于卷烟集w的概率多项式分布,可以表示为向量其中pk,j表示卷烟wj在主题zk中的生成概率。

客户订购行为层:即每一个用的订购行为表示成一个卷烟频向量di={tfi,1,tfi,2...tfi,v},其中tfi,j表示卷烟j在客户i订购行为中出现的次数;对于主题层来说,客户集可以表示为u={u1,u2...um},其中每个向量ud={qd,1,qd,2...qd,m}表示一个客户订购的主题分布,qd,m是该主题z在客户订购行为中的生成概率。

本发明的基于长尾效应的卷烟惊喜度推荐系统,包括以下模块:

数据集选取模块:用于根据销售指标对用户进行分档,从分档用户中选取训练集;

模型模块:用于根据商品和用户的订购行为建立用户概率模型,根据用户概率模型对训练集验证;

各用户主题分布的余弦相似度计算模块:使用用户主题分布间的余弦相似度来刻画用户相似度;

卷烟集合生成模块:用于寻找紧邻用户生成推荐卷烟集合。

数据集选取模块选取训练集后,统计用户的卷烟品规订购数量,卷烟品规和订购的数量生成商品层wi,用户对卷烟品规订购总量为用户订购行为层uj。

卷烟集合生成模通过用户标签取出推荐用户的地理位置,使用k紧邻算法计算地理位置与目标用户最接近的推荐用户,将最接近的推荐用户订购卷烟集合推送给目标用户。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1