一种基于数据分析处理技术的营销活动奖品供应商推荐方法与流程

文档序号:11921450阅读:176来源:国知局

本发明涉及数据分析技术领域,具体来说是一种基于数据分析处理技术的营销活动奖品供应商推荐方法。



背景技术:

在互联网+的背景下,越来越多的用户开始尝试通过营销活动来实现用户的营销需求,无论是品牌发布会、新品推广还是结合特殊事件、时间的短期营销活动,都深受用户追捧。同时,随着营销活动越来越频繁,如何选择好的奖品供应商来辅助用户完成营销活动的奖品发放越来越困扰着用户。

目前,用户在选择奖品供应商时往往通过个人经验从互联网内搜索奖品供应商,或者通过熟人介绍供应商。但是,通过个人经验和熟人介绍的奖品供应商,往往因为信息局限性,如选择范围小、奖品价格波动等原因不能选择到最优的奖品供应商。

通常研究学者使用协同过滤(Collaborative Filtering,CF)推荐算法来进行供应商选择,但是随着系统中用户和奖品数量的不断增加,协同过滤面临着评分数据稀疏性、推荐实时性、可拓展性挑战。为此很多研究学者针对相似度计算提出了一系列的改进措施。如黄创光等人提出了一种不确定近邻的协同过滤算法,通过不确定近邻因子及调和参数预测评分。Miz等人将聚类和SlopeOne相结合应用在推荐算法中。Melville P等人使用基于内容的方法来完善评分中的空值,缓解评分数据的稀疏性。

以上方法均存在以下缺陷:未考虑用户之间共同评分数对评估结果的影响;忽略了评分差异度,未考虑评分的高与低与评估结果的影响;忽略了用户对单一奖品类别的偏好程度对评估结果的影响。

因此,如何能够结合用户偏好,更准确的向用户进行推荐需已经成为急需解决的技术问题。



技术实现要素:

本发明的目的是为了解决现有技术中推荐方法正确性不足的缺陷,提供一种基于数据分析处理技术的营销活动奖品供应商推荐方法来解决上述问题。

为了实现上述目的,本发明的技术方案如下:

一种基于数据分析处理技术的营销活动奖品供应商推荐方法,包括以下步骤:

预定义处理,对用户采购信息进行奖品类别的评分;

计算任意用户间的评分相似度,根据用户奖品类别的评分信息评估任意用户间的相似度;

计算任意用户间的偏好相似度,根据用户奖品类别的评分信息评估任意用户间的偏好相似度;

计算最终用户相似度,结合评分相似度和偏好相似度两个维度,评估出最终用户相似度;

评估待处理数据,采集用户营销奖品数据,预测目标用户对各供应商的评分;

推荐优质供应商,对检索出的奖品供应商按评分结果升序或降序进行排列展示。

所述的预定义处理包括以下步骤:

使用一维数组A定义用户集,A={a1,a2,…,an},其中:ap表示单个用户;

使用一维数组B定义奖品集,B={b1,b2…,bn},其中:bq表示单个奖品;

定义用户集A对奖品集B的评分数据,使用二维矩阵Mx表示每个用户对各个奖品的评分,其矩阵分布如下:

式中,p∈[1,n],q∈[1,m],rp,q表示用户ap对奖品bq的实际评分,rn,m的取值范围为[1,5],若用户ap对奖品bq未评分,则记为0;

定义奖品类别集tk′的定义,使用一维数组tk′={t',t'2…t'k}表示奖品类别集。

所述的计算任意用户间的评分相似度包括以下步骤:

使用Person相似度公式计算任意用户a、an之间的相似度SimP(a,an),其计算公式如下

其中,表示用户a和an的共同评分奖品集,和表示用户a和an在集合中对奖品的平均评分,Ra,i表示用户a对所属用户a、an的共同评分奖品集的评分,Rb,i表示用户anb对所属用户a、an的共同评分奖品集的评分;

计算用户对奖品的共同评分数在所有评分数中的共同评分权重Weight(a,an),其计算公式如下:

其中,表示用户a和an的共同评分的奖品数,表示用户a和an所有已评分奖品数;

计算用户a和b的共同评分差异度权重Weight_SD(a,an),其计算公式如下:

式中Nm表示在用户a和an共同评分集合中奖品评分同时大于或者小于的奖品总数,为用户a和an评分的平均值;

基于共同评分权重Weight(a,an)以及共同评分差异度权重Weight_SD(a,an),计算任意用户间的评分相似度Simscore(a,an),其计算公式如下:

Simscore(a,an)=Weight(a,an)×Weight_SD(a,an)×SimP(a,an)

其中,Simscore(a,an)为用户a和an之间的相似度,Weight(a,an)为用户a和an的共同评分权重,Weight_SD(a,an)为用户a和an之间的共同评分差异度权重,SimP(a,an)为传统的用户a和an之间的相似度。

所述的计算任意用户间的偏好相似度包括以下步骤:

计算用户a对奖品类别tk′的兴趣度Weight_tag(a,tk′),其计算公式如下:

式中Ta,t′表示用户a对奖品类别t′的评分次数,k表示用户a评价的所有奖品类别中的某个类别;

计算融合用户评分和奖品类别兴趣度的用户a对奖品i的偏好程度Weight_pre(a,i),计算公式如下

式中Ra,i为用户a对奖品i的评分,Weight_tag(a,tk′)为用户a对奖品类别tk′的兴趣度;

计算用户之间的偏好相似度Simpre(a,an),计算公式如下:

,其中:表示用户a和an共同感兴趣的奖品集,表示用户a在内的奖品平均偏好程度,示用户an在内的奖品平均偏好程度,Weight_pre(a,b)为融合用户评分和奖品类别兴趣度的用户a对奖品b的偏好程度。

所述的计算最终用户相似度的公式如下:

Sim(a,an)=α×Simscore(a,an)+β×Simpre(a,an)+(1-α-β)×Simscore(a,an)×Simpre(a,an)

其中:α和β为权重值、α和β取值范围[0,1]。

所述的评估待处理数据包括以下步骤:

采集用户对营销奖品的需求,采集数据包括用户名称、奖品名称,存储接收到的数据内容;

以用户名称为索引读取数据仓库中用户历史评分数据、用户属性数据、用户偏好数据;以奖品名称为索引读取数据仓库中奖品特征数据;

根据Sim(a,an),对目标用户a的相似用户依据相似度由大到小排序,选出与目标用户a相似度最接近且已对用户a未评分奖品评分的k个用户构成最近邻居集Na

预测目标用户a对未评分奖品b的最终评分其计算公式如下

式中Na表示目标用户a的最近邻居集,和表示用户a和an的评分绝对值。

有益效果

本发明的一种基于数据分析处理技术的营销活动奖品供应商推荐方法,与现有技术相比降低了传统推荐方法在计算相似度时用户对奖品评分数据的差异度以及奖品类别的偏好程度对预测结果的影响,提高了推荐结果的科学性与准确性。

附图说明

图1为本发明的方法顺序图。

具体实施方式

为使对本发明的结构特征及所达成的功效有更进一步的了解与认识,用以较佳的实施例及附图配合详细的说明,说明如下:

如图1所示,本发明所述的一种基于数据分析处理技术的营销活动奖品供应商推荐方法,包括以下步骤:

第一步,预定义处理。对用户采购信息进行奖品类别的评分,其具体步骤如下:

(1)使用一维数组A定义用户集,A={a1,a2,…,an},其中:ap表示单个用户,即单个奖品供应商。

(2)使用一维数组B定义奖品集,B={b1,b2…,bn},其中:bq表示单个奖品。

(3)定义用户集A对奖品集B的评分数据,使用二维矩阵Mx表示每个用户对各个奖品的评分,其矩阵分布如下:

式中,p∈[1,n],q∈[1,m],rp,q表示用户ap对奖品bq的实际评分,rn,m的取值范围为[1,5],若用户ap对奖品bq未评分,则记为0。

(4)定义奖品类别集tk′的定义,使用一维数组tk′={t',t'2…t'k}表示奖品类别集,bq为单个奖品,多个奖品根据常用分类又组成奖品类别集tk′,在此奖品类别集tk′用于后期计算过程中记录奖品评分记录的出现次数,因此其直接通过二维矩阵Mx获得相关数据即可。

第二步,计算任意用户间的评分相似度。根据用户奖品类别的评分信息评估任意用户间的相似度,其具体步骤如下:

(1)使用Person相似度公式计算任意用户a、an之间的相似度SimP(a,an),其计算公式如下:

其中,表示用户a和an的共同评分奖品集,和表示用户a和an在集合中对奖品的平均评分,Ra,i表示用户a对所属用户a、an的共同评分奖品集的评分,Rb,i表示用户anb对所属用户a、an的共同评分奖品集的评分。

(2)计算用户对奖品的共同评分数在所有评分数中的共同评分权重Weight(a,an),考虑到直接使用Person相似度公式在两个用户的共同评分奖品数非常稀少时会造成相似度非常高,因此本发明引入Weight(a,an)权重来降低误差。其公式如下:

其中,表示用户a和an的共同评分的奖品数,表示用户a和an所有已评分奖品数。

(3)计算用户a和b的共同评分差异度权重Weight_SD(a,an),传统的推荐算法中默认所有评分的权重值相同,未考虑到评分的高与低。本发明引用Weight_SD(a,an)来表示用户a和an的共同评分差异度权重。其计算公式如下:

式中Nm表示在用户a和an共同评分集合中奖品评分同时大于或者小于的奖品总数,为用户a和an评分的平均值。

(4)基于共同评分权重Weight(a,an)以及共同评分差异度权重Weight_SD(a,an),计算任意用户间的评分相似度Simscore(a,an),其计算公式如下:

Simscore(a,an)=Weight(a,an)×Weight_SD(a,an)×SimP(a,an)

其中,Simscore(a,an)为用户a和an之间的相似度,Weight(a,an)为用户a和an的共同评分权重,Weight_SD(a,an)为用户a和an之间的共同评分差异度权重,SimP(a,an)为传统的用户a和an之间的相似度,通过现有的方法获得或直接设定调整。

第三步,计算任意用户间的偏好相似度。根据用户奖品类别的评分信息评估任意用户间的偏好相似度,其具体步骤如下:

(1)计算用户a对奖品类别tk′的兴趣度Weight_tag(a,tk′),其计算公式如下:

式中Ta,t′表示用户a对奖品类别t′的评分次数,k表示用户a评价的所有奖品类别中的某个类别。

(2)计算融合用户评分和奖品类别兴趣度的用户a对奖品i的偏好程度Weight_pre(a,i),计算公式如下

式中Ra,i为用户a对奖品i的评分,Weight_tag(a,tk′)为用户a对奖品类别tk′的兴趣度。

(3)计算用户之间的偏好相似度Simpre(a,an),计算公式如下:

,其中:表示用户a和an共同感兴趣的奖品集,表示用户a在内的奖品平均偏好程度,示用户an在内的奖品平均偏好程度,Weight_pre(a,b)为融合用户评分和奖品类别兴趣度的用户a对奖品b的偏好程度。

第四步,计算最终用户相似度。结合评分相似度和偏好相似度两个维度,评估出最终用户相似度,计算最终用户相似度的公式如下:

Sim(a,an)=α×Simscore(a,an)+β×Simpre(a,an)+(1-α-β)×Simscore(a,an)×Simpre(a,an)

其中:α和β为权重值、α和β取值范围[0,1]。在此通过调整α和β的值,使得结果达到最优。

第五步,评估待处理数据。采集用户营销奖品数据,预测目标用户对各供应商的评分,其具体步骤如下:

(1)采集用户对营销奖品的需求。采集数据包括用户名称、奖品名称,存储接收到的数据内容。在针对数据库的实际应用中,可以以用户名称为索引读取数据仓库中用户历史评分数据、用户属性数据、用户偏好数据,再以奖品名称为索引读取数据仓库中奖品特征数据。

(2)根据Sim(a,an),对目标用户a的相似用户依据相似度由大到小排序,选出与目标用户a相似度最接近且已对用户a未评分奖品评分的k个用户构成最近邻居集Na

(3)预测目标用户a对未评分奖品b的最终评分其计算公式如下

式中Na表示目标用户a的最近邻居集,和表示用户a和an的评分绝对值。

第六步,推荐优质供应商,对检索出的奖品供应商按评分结果升序或降序进行排列展示,从而得出推荐结果。

以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是本发明的原理,在不脱离本发明精神和范围的前提下本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明的范围内。本发明要求的保护范围由所附的权利要求书及其等同物界定。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1