一种基于数据分析处理技术的营销活动奖品供应商推荐方法与流程

文档序号:11921450阅读:来源:国知局

技术特征:

1.一种基于数据分析处理技术的营销活动奖品供应商推荐方法,其特征在于,包括以下步骤:

11)预定义处理,对用户采购信息进行奖品类别的评分;

12)计算任意用户间的评分相似度,根据用户奖品类别的评分信息评估任意用户间的相似度;

13)计算任意用户间的偏好相似度,根据用户奖品类别的评分信息评估任意用户间的偏好相似度;

14)计算最终用户相似度,结合评分相似度和偏好相似度两个维度,评估出最终用户相似度;

15)评估待处理数据,采集用户营销奖品数据,预测目标用户对各供应商的评分;

16)推荐优质供应商,对检索出的奖品供应商按评分结果升序或降序进行排列展示。

2.根据权利要求1所述的一种基于数据分析处理技术的营销活动奖品供应商推荐方法,其特征在于,所述的预定义处理包括以下步骤:

21)使用一维数组A定义用户集,A={a1,a2,…,an},其中:ap表示单个用户;

22)使用一维数组B定义奖品集,B={b1,b2…,bn},其中:bq表示单个奖品;

23)定义用户集A对奖品集B的评分数据,使用二维矩阵Mx表示每个用户对各个奖品的评分,其矩阵分布如下:

<mrow> <mi>M</mi> <mi>x</mi> <mo>=</mo> <mfenced open = "[" close = "]"> <mtable> <mtr> <mtd> <msub> <mi>r</mi> <mrow> <mn>1</mn> <mo>,</mo> <mn>1</mn> </mrow> </msub> </mtd> <mtd> <msub> <mi>r</mi> <mrow> <mn>1</mn> <mo>,</mo> <mn>2</mn> </mrow> </msub> </mtd> <mtd> <mo>...</mo> </mtd> <mtd> <msub> <mi>r</mi> <mrow> <mn>1</mn> <mo>,</mo> <mi>q</mi> </mrow> </msub> </mtd> <mtd> <mo>...</mo> </mtd> <mtd> <msub> <mi>r</mi> <mrow> <mn>1</mn> <mo>,</mo> <mi>m</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> </mtd> <mtd> <msub> <mi>r</mi> <mrow> <mn>1</mn> <mo>,</mo> <mi>m</mi> </mrow> </msub> </mtd> </mtr> <mtr> <mtd> <msub> <mi>r</mi> <mrow> <mn>2</mn> <mo>,</mo> <mn>1</mn> </mrow> </msub> </mtd> <mtd> <msub> <mi>r</mi> <mrow> <mn>2</mn> <mo>,</mo> <mn>2</mn> </mrow> </msub> </mtd> <mtd> <mo>...</mo> </mtd> <mtd> <msub> <mi>r</mi> <mrow> <mn>2</mn> <mo>,</mo> <mi>q</mi> </mrow> </msub> </mtd> <mtd> <mo>...</mo> </mtd> <mtd> <msub> <mi>r</mi> <mrow> <mn>2</mn> <mo>,</mo> <mi>m</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> </mtd> <mtd> <msub> <mi>r</mi> <mrow> <mn>2</mn> <mo>,</mo> <mi>m</mi> </mrow> </msub> </mtd> </mtr> <mtr> <mtd> <mo>.</mo> </mtd> <mtd> <mo>.</mo> </mtd> <mtd> <mrow></mrow> </mtd> <mtd> <mo>.</mo> </mtd> <mtd> <mrow></mrow> </mtd> <mtd> <mo>.</mo> </mtd> <mtd> <mo>.</mo> </mtd> </mtr> <mtr> <mtd> <mo>.</mo> </mtd> <mtd> <mo>.</mo> </mtd> <mtd> <mrow></mrow> </mtd> <mtd> <mo>.</mo> </mtd> <mtd> <mrow></mrow> </mtd> <mtd> <mo>.</mo> </mtd> <mtd> <mo>.</mo> </mtd> </mtr> <mtr> <mtd> <mo>.</mo> </mtd> <mtd> <mo>.</mo> </mtd> <mtd> <mrow></mrow> </mtd> <mtd> <mo>.</mo> </mtd> <mtd> <mrow></mrow> </mtd> <mtd> <mo>.</mo> </mtd> <mtd> <mo>.</mo> </mtd> </mtr> <mtr> <mtd> <msub> <mi>r</mi> <mrow> <mi>p</mi> <mo>,</mo> <mn>1</mn> </mrow> </msub> </mtd> <mtd> <msub> <mi>r</mi> <mrow> <mi>p</mi> <mo>,</mo> <mn>2</mn> </mrow> </msub> </mtd> <mtd> <mo>...</mo> </mtd> <mtd> <msub> <mi>r</mi> <mrow> <mi>p</mi> <mo>,</mo> <mi>q</mi> </mrow> </msub> </mtd> <mtd> <mo>...</mo> </mtd> <mtd> <msub> <mi>r</mi> <mrow> <mi>p</mi> <mo>,</mo> <mi>m</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> </mtd> <mtd> <msub> <mi>r</mi> <mrow> <mi>p</mi> <mo>,</mo> <mi>m</mi> </mrow> </msub> </mtd> </mtr> <mtr> <mtd> <mo>.</mo> </mtd> <mtd> <mo>.</mo> </mtd> <mtd> <mrow></mrow> </mtd> <mtd> <mo>.</mo> </mtd> <mtd> <mrow></mrow> </mtd> <mtd> <mo>.</mo> </mtd> <mtd> <mo>.</mo> </mtd> </mtr> <mtr> <mtd> <mo>.</mo> </mtd> <mtd> <mo>.</mo> </mtd> <mtd> <mrow></mrow> </mtd> <mtd> <mo>.</mo> </mtd> <mtd> <mrow></mrow> </mtd> <mtd> <mo>.</mo> </mtd> <mtd> <mo>.</mo> </mtd> </mtr> <mtr> <mtd> <mo>.</mo> </mtd> <mtd> <mo>.</mo> </mtd> <mtd> <mrow></mrow> </mtd> <mtd> <mo>.</mo> </mtd> <mtd> <mrow></mrow> </mtd> <mtd> <mo>.</mo> </mtd> <mtd> <mo>.</mo> </mtd> </mtr> <mtr> <mtd> <msub> <mi>r</mi> <mrow> <mi>n</mi> <mo>,</mo> <mn>1</mn> </mrow> </msub> </mtd> <mtd> <msub> <mi>r</mi> <mrow> <mi>n</mi> <mo>,</mo> <mn>2</mn> </mrow> </msub> </mtd> <mtd> <mo>...</mo> </mtd> <mtd> <msub> <mi>r</mi> <mrow> <mi>n</mi> <mo>,</mo> <mi>q</mi> </mrow> </msub> </mtd> <mtd> <mo>...</mo> </mtd> <mtd> <msub> <mi>r</mi> <mrow> <mi>n</mi> <mo>,</mo> <mi>m</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> </mtd> <mtd> <msub> <mi>r</mi> <mrow> <mi>n</mi> <mo>,</mo> <mi>m</mi> </mrow> </msub> </mtd> </mtr> </mtable> </mfenced> <mo>,</mo> </mrow>

式中,p∈[1,n],q∈[1,m],rp,q表示用户ap对奖品bq的实际评分,rn,m的取值范围为[1,5],若用户ap对奖品bq未评分,则记为0;

24)定义奖品类别集t′k的定义,使用一维数组t′k={t',t'2…t'k}表示奖品类别集。

3.根据权利要求1所述的一种基于数据分析处理技术的营销活动奖品供应商推荐方法,其特征在于,所述的计算任意用户间的评分相似度包括以下步骤:

31)使用Person相似度公式计算任意用户a、an之间的相似度SimP(a,an),其计算公式如下

<mrow> <mi>S</mi> <mi>i</mi> <mi>m</mi> <mi>P</mi> <mrow> <mo>(</mo> <mi>a</mi> <mo>,</mo> <msub> <mi>a</mi> <mi>n</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <munder> <mi>&Sigma;</mi> <mrow> <mi>i</mi> <mo>&Element;</mo> <msub> <mi>I</mi> <mrow> <mi>a</mi> <mo>,</mo> <msub> <mi>a</mi> <mi>n</mi> </msub> </mrow> </msub> </mrow> </munder> <mrow> <mo>(</mo> <msub> <mi>R</mi> <mrow> <mi>a</mi> <mo>,</mo> <mi>i</mi> </mrow> </msub> <mo>-</mo> <msub> <mover> <mi>R</mi> <mo>&OverBar;</mo> </mover> <mi>a</mi> </msub> <mo>)</mo> </mrow> <mrow> <mo>(</mo> <msub> <mi>R</mi> <mrow> <mi>b</mi> <mo>,</mo> <mi>i</mi> </mrow> </msub> <mo>-</mo> <msub> <mover> <mi>R</mi> <mo>&OverBar;</mo> </mover> <msub> <mi>a</mi> <mi>n</mi> </msub> </msub> <mo>)</mo> </mrow> </mrow> <mrow> <msqrt> <mrow> <munder> <mi>&Sigma;</mi> <mrow> <mi>i</mi> <mo>&Element;</mo> <msub> <mi>I</mi> <mi>a</mi> </msub> </mrow> </munder> <msup> <mrow> <mo>(</mo> <msub> <mi>R</mi> <mrow> <mi>a</mi> <mo>,</mo> <mi>i</mi> </mrow> </msub> <mo>-</mo> <msub> <mover> <mi>R</mi> <mo>&OverBar;</mo> </mover> <mi>a</mi> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> </mrow> </msqrt> <msqrt> <mrow> <munder> <mi>&Sigma;</mi> <mrow> <mi>i</mi> <mo>&Element;</mo> <msub> <mi>I</mi> <msub> <mi>a</mi> <mi>n</mi> </msub> </msub> </mrow> </munder> <msup> <mrow> <mo>(</mo> <msub> <mi>R</mi> <mrow> <msub> <mi>a</mi> <mi>n</mi> </msub> <mo>,</mo> <mi>i</mi> </mrow> </msub> <mo>-</mo> <msub> <mover> <mi>R</mi> <mo>&OverBar;</mo> </mover> <msub> <mi>a</mi> <mi>n</mi> </msub> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> </mrow> </msqrt> </mrow> </mfrac> <mo>,</mo> </mrow>

其中,表示用户a和an的共同评分奖品集,表示用户a和an在集合中对奖品的平均评分,Ra,i表示用户a对所属用户a、an的共同评分奖品集的评分,Rb,i表示用户anb对所属用户a、an的共同评分奖品集的评分;

32)计算用户对奖品的共同评分数在所有评分数中的共同评分权重Weight(a,an),其计算公式如下:

<mrow> <mi>W</mi> <mi>e</mi> <mi>i</mi> <mi>g</mi> <mi>h</mi> <mi>t</mi> <mrow> <mo>(</mo> <mi>a</mi> <mo>,</mo> <msub> <mi>a</mi> <mi>n</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <msub> <mi>Con</mi> <mrow> <mi>a</mi> <mo>,</mo> <msub> <mi>a</mi> <mi>n</mi> </msub> </mrow> </msub> <mo>/</mo> <msub> <mi>All</mi> <mrow> <mi>a</mi> <mo>,</mo> <msub> <mi>a</mi> <mi>n</mi> </msub> </mrow> </msub> </mrow>

其中,表示用户a和an的共同评分的奖品数,表示用户a和an所有已评分奖品数;

33)计算用户a和b的共同评分差异度权重Weight_SD(a,an),其计算公式如下:

<mrow> <mi>W</mi> <mi>e</mi> <mi>i</mi> <mi>g</mi> <mi>h</mi> <mi>t</mi> <mo>_</mo> <mi>S</mi> <mi>D</mi> <mrow> <mo>(</mo> <mi>a</mi> <mo>,</mo> <msub> <mi>a</mi> <mi>n</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mn>1</mn> <mrow> <msub> <mi>Con</mi> <mrow> <mi>a</mi> <mo>,</mo> <msub> <mi>a</mi> <mi>n</mi> </msub> </mrow> </msub> </mrow> </mfrac> <munder> <mi>&Sigma;</mi> <mrow> <mi>k</mi> <mo>&Element;</mo> <msub> <mi>S</mi> <mrow> <mi>a</mi> <mo>,</mo> <msub> <mi>a</mi> <mi>n</mi> </msub> </mrow> </msub> </mrow> </munder> <msub> <mi>N</mi> <mi>m</mi> </msub> </mrow>

式中Nm表示在用户a和an共同评分集合中奖品评分同时大于或者小于的奖品总数,为用户a和an评分的平均值;

34)基于共同评分权重Weight(a,an)以及共同评分差异度权重Weight_SD(a,an),计算任意用户间的评分相似度Simscore(a,an),其计算公式如下:

Simscore(a,an)=Weight(a,an)×Weight_SD(a,an)×SimP(a,an)

其中,Simscore(a,an)为用户a和an之间的相似度,Weight(a,an)为用户a和an的共同评分权重,Weight_SD(a,an)为用户a和an之间的共同评分差异度权重,SimP(a,an)为传统的用户a和an之间的相似度。

4.根据权利要求1所述的一种基于数据分析处理技术的营销活动奖品供应商推荐方法,其特征在于,所述的计算任意用户间的偏好相似度包括以下步骤:

41)计算用户a对奖品类别t′k的兴趣度Weight_tag(a,t′k),其计算公式如下:

<mrow> <mi>W</mi> <mi>e</mi> <mi>i</mi> <mi>g</mi> <mi>h</mi> <mi>t</mi> <mo>_</mo> <mi>t</mi> <mi>a</mi> <mi>g</mi> <mrow> <mo>(</mo> <mi>a</mi> <mo>,</mo> <msup> <mi>t</mi> <mo>&prime;</mo> </msup> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <msub> <mi>T</mi> <mrow> <mi>a</mi> <mo>,</mo> <msup> <mi>t</mi> <mo>&prime;</mo> </msup> </mrow> </msub> <mrow> <munder> <mi>&Sigma;</mi> <mrow> <mi>k</mi> <mo>&Element;</mo> <msub> <mi>T</mi> <mi>a</mi> </msub> </mrow> </munder> <msub> <mi>T</mi> <mrow> <mi>a</mi> <mo>,</mo> <msubsup> <mi>t</mi> <mi>k</mi> <mo>&prime;</mo> </msubsup> </mrow> </msub> </mrow> </mfrac> </mrow>

式中Ta,t′表示用户a对奖品类别t′的评分次数,k表示用户a评价的所有奖品类别中的某个类别;

42)计算融合用户评分和奖品类别兴趣度的用户a对奖品i的偏好程度Weight_pre(a,i),计算公式如下

<mrow> <mi>W</mi> <mi>e</mi> <mi>i</mi> <mi>g</mi> <mi>h</mi> <mi>t</mi> <mo>_</mo> <mi>p</mi> <mi>r</mi> <mi>e</mi> <mrow> <mo>(</mo> <mi>a</mi> <mo>,</mo> <mi>i</mi> <mo>)</mo> </mrow> <mo>=</mo> <msub> <mi>R</mi> <mrow> <mi>a</mi> <mo>,</mo> <mi>i</mi> </mrow> </msub> <mo>&times;</mo> <munder> <mi>&Sigma;</mi> <mrow> <mi>k</mi> <mo>&Element;</mo> <mi>T</mi> </mrow> </munder> <mi>W</mi> <mi>e</mi> <mi>i</mi> <mi>g</mi> <mi>h</mi> <mi>t</mi> <mo>_</mo> <mi>t</mi> <mi>a</mi> <mi>g</mi> <mrow> <mo>(</mo> <mi>a</mi> <mo>,</mo> <msubsup> <mi>t</mi> <mi>k</mi> <mo>&prime;</mo> </msubsup> <mo>)</mo> </mrow> </mrow>

式中Ra,i为用户a对奖品i的评分,Weight_tag(a,t′k)为用户a对奖品类别t′k的兴趣度;

43)计算用户之间的偏好相似度Simpre(a,an),计算公式如下:

<mrow> <msub> <mi>Sim</mi> <mrow> <mi>p</mi> <mi>r</mi> <mi>e</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>a</mi> <mo>,</mo> <msub> <mi>a</mi> <mi>n</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <munder> <mi>&Sigma;</mi> <mrow> <mi>i</mi> <mo>&Element;</mo> <msub> <mi>p</mi> <mrow> <mi>a</mi> <mo>,</mo> <msub> <mi>a</mi> <mi>n</mi> </msub> </mrow> </msub> </mrow> </munder> <mrow> <mo>(</mo> <mi>W</mi> <mi>e</mi> <mi>i</mi> <mi>g</mi> <mi>h</mi> <mi>t</mi> <mo>_</mo> <mi>p</mi> <mi>r</mi> <mi>e</mi> <mo>(</mo> <mrow> <mi>a</mi> <mo>,</mo> <mi>b</mi> </mrow> <mo>)</mo> <mo>-</mo> <mover> <mrow> <mi>W</mi> <mi>e</mi> <mi>i</mi> <mi>g</mi> <mi>h</mi> <mi>t</mi> <mo>_</mo> <msub> <mi>pre</mi> <mi>a</mi> </msub> </mrow> <mo>&OverBar;</mo> </mover> <mo>)</mo> </mrow> <mo>&times;</mo> <mrow> <mo>(</mo> <mi>W</mi> <mi>e</mi> <mi>i</mi> <mi>g</mi> <mi>h</mi> <mi>t</mi> <mo>_</mo> <mi>p</mi> <mi>r</mi> <mi>e</mi> <mo>(</mo> <mrow> <msub> <mi>a</mi> <mi>n</mi> </msub> <mo>,</mo> <mi>b</mi> </mrow> <mo>)</mo> <mo>-</mo> <mover> <mrow> <mi>W</mi> <mi>e</mi> <mi>i</mi> <mi>g</mi> <mi>h</mi> <mi>t</mi> <mo>_</mo> <msub> <mi>pre</mi> <msub> <mi>a</mi> <mi>n</mi> </msub> </msub> </mrow> <mo>&OverBar;</mo> </mover> <mo>)</mo> </mrow> </mrow> <mrow> <msqrt> <mrow> <munder> <mi>&Sigma;</mi> <mrow> <mi>i</mi> <mo>&Element;</mo> <msub> <mi>P</mi> <mi>a</mi> </msub> </mrow> </munder> <msup> <mrow> <mo>(</mo> <mi>W</mi> <mi>e</mi> <mi>i</mi> <mi>g</mi> <mi>h</mi> <mi>t</mi> <mo>_</mo> <mi>p</mi> <mi>r</mi> <mi>e</mi> <mo>(</mo> <mrow> <mi>a</mi> <mo>,</mo> <mi>b</mi> </mrow> <mo>)</mo> <mo>-</mo> <mover> <mrow> <mi>W</mi> <mi>e</mi> <mi>i</mi> <mi>g</mi> <mi>h</mi> <mi>t</mi> <mo>_</mo> <msub> <mi>pre</mi> <mi>a</mi> </msub> </mrow> <mo>&OverBar;</mo> </mover> <mo>)</mo> </mrow> <mn>2</mn> </msup> </mrow> </msqrt> <msqrt> <mrow> <munder> <mi>&Sigma;</mi> <mrow> <mi>i</mi> <mo>&Element;</mo> <msub> <mi>P</mi> <msub> <mi>a</mi> <mi>n</mi> </msub> </msub> </mrow> </munder> <msup> <mrow> <mo>(</mo> <mi>W</mi> <mi>e</mi> <mi>i</mi> <mi>g</mi> <mi>h</mi> <mi>t</mi> <mo>_</mo> <mi>p</mi> <mi>r</mi> <mi>e</mi> <mo>(</mo> <mrow> <msub> <mi>a</mi> <mi>n</mi> </msub> <mo>,</mo> <mi>b</mi> </mrow> <mo>)</mo> <mo>-</mo> <mover> <mrow> <mi>W</mi> <mi>e</mi> <mi>i</mi> <mi>g</mi> <mi>h</mi> <mi>t</mi> <mo>_</mo> <msub> <mi>pre</mi> <msub> <mi>a</mi> <mi>n</mi> </msub> </msub> </mrow> <mo>&OverBar;</mo> </mover> <mo>)</mo> </mrow> <mn>2</mn> </msup> </mrow> </msqrt> </mrow> </mfrac> </mrow>

,其中:表示用户a和an共同感兴趣的奖品集,表示用户a在内的奖品平均偏好程度,示用户an内的奖品平均偏好程度,Weight_pre(a,b)为融合用户评分和奖品类别兴趣度的用户a对奖品b的偏好程度。

5.根据权利要求1所述的一种基于数据分析处理技术的营销活动奖品供应商推荐方法,其特征在于,所述的计算最终用户相似度的公式如下:

Sim(a,an)=α×Simscore(a,an)+β×Simpre(a,an)+(1-α-β)×Simscore(a,an)×Simpre(a,an)

其中:α和β为权重值、α和β取值范围[0,1]。

6.根据权利要求1所述的一种基于数据分析处理技术的营销活动奖品供应商推荐方法,其特征在于,所述的评估待处理数据包括以下步骤:

61)采集用户对营销奖品的需求,采集数据包括用户名称、奖品名称,存储接收到的数据内容;

以用户名称为索引读取数据仓库中用户历史评分数据、用户属性数据、用户偏好数据;以奖品名称为索引读取数据仓库中奖品特征数据;

62)根据Sim(a,an),对目标用户a的相似用户依据相似度由大到小排序,选出与目标用户a相似度最接近且已对用户a未评分奖品评分的k个用户构成最近邻居集Na

63)预测目标用户a对未评分奖品b的最终评分其计算公式如下

<mrow> <msub> <mi>M</mi> <mrow> <mi>a</mi> <mo>,</mo> <msub> <mi>a</mi> <mi>n</mi> </msub> </mrow> </msub> <mo>=</mo> <msub> <mover> <mi>R</mi> <mo>&OverBar;</mo> </mover> <mi>a</mi> </msub> <mo>+</mo> <mfrac> <mrow> <munder> <mi>&Sigma;</mi> <mrow> <msub> <mi>a</mi> <mi>n</mi> </msub> <mo>&Element;</mo> <msub> <mi>N</mi> <mi>a</mi> </msub> </mrow> </munder> <mi>S</mi> <mi>i</mi> <mi>m</mi> <mrow> <mo>(</mo> <mi>a</mi> <mo>,</mo> <msub> <mi>a</mi> <mi>n</mi> </msub> <mo>)</mo> </mrow> <mo>&times;</mo> <mrow> <mo>(</mo> <msub> <mi>R</mi> <mrow> <msub> <mi>a</mi> <mi>n</mi> </msub> <mo>,</mo> <mi>b</mi> </mrow> </msub> <mo>-</mo> <msub> <mover> <mi>R</mi> <mo>&OverBar;</mo> </mover> <msub> <mi>a</mi> <mi>n</mi> </msub> </msub> <mo>)</mo> </mrow> </mrow> <mrow> <munder> <mi>&Sigma;</mi> <mrow> <msub> <mi>a</mi> <mi>n</mi> </msub> <mo>&Element;</mo> <msub> <mi>N</mi> <mi>a</mi> </msub> </mrow> </munder> <mo>|</mo> <mi>S</mi> <mi>i</mi> <mi>m</mi> <mrow> <mo>(</mo> <mi>a</mi> <mo>,</mo> <msub> <mi>a</mi> <mi>n</mi> </msub> <mo>)</mo> </mrow> <mo>|</mo> </mrow> </mfrac> </mrow>

式中Na表示目标用户a的最近邻居集,表示用户a和an的评分绝对值。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1