一种基于数据分析处理技术的营销活动奖品供应商推荐方法与流程

文档序号：11921450阅读：来源：国知局

技术特征：

1.一种基于数据分析处理技术的营销活动奖品供应商推荐方法，其特征在于，包括以下步骤：

11)预定义处理，对用户采购信息进行奖品类别的评分；

12)计算任意用户间的评分相似度，根据用户奖品类别的评分信息评估任意用户间的相似度；

13)计算任意用户间的偏好相似度，根据用户奖品类别的评分信息评估任意用户间的偏好相似度；

14)计算最终用户相似度，结合评分相似度和偏好相似度两个维度，评估出最终用户相似度；

15)评估待处理数据，采集用户营销奖品数据，预测目标用户对各供应商的评分；

16)推荐优质供应商，对检索出的奖品供应商按评分结果升序或降序进行排列展示。

2.根据权利要求1所述的一种基于数据分析处理技术的营销活动奖品供应商推荐方法，其特征在于，所述的预定义处理包括以下步骤：

21)使用一维数组A定义用户集，A＝{a₁,a₂,…,a_n}，其中：a_p表示单个用户；

22)使用一维数组B定义奖品集，B＝{b₁,b₂…,b_n}，其中：b_q表示单个奖品；

23)定义用户集A对奖品集B的评分数据，使用二维矩阵Mx表示每个用户对各个奖品的评分，其矩阵分布如下：

$<mrow> <mi>M</mi> <mi>x</mi> <mo>=</mo> <mfenced open = "[" close = "]"> <mtable> <mtr> <mtd> <msub> <mi>r</mi> <mrow> <mn>1</mn> <mo>,</mo> <mn>1</mn> </mrow> </msub> </mtd> <mtd> <msub> <mi>r</mi> <mrow> <mn>1</mn> <mo>,</mo> <mn>2</mn> </mrow> </msub> </mtd> <mtd> <mo>...</mo> </mtd> <mtd> <msub> <mi>r</mi> <mrow> <mn>1</mn> <mo>,</mo> <mi>q</mi> </mrow> </msub> </mtd> <mtd> <mo>...</mo> </mtd> <mtd> <msub> <mi>r</mi> <mrow> <mn>1</mn> <mo>,</mo> <mi>m</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> </mtd> <mtd> <msub> <mi>r</mi> <mrow> <mn>1</mn> <mo>,</mo> <mi>m</mi> </mrow> </msub> </mtd> </mtr> <mtr> <mtd> <msub> <mi>r</mi> <mrow> <mn>2</mn> <mo>,</mo> <mn>1</mn> </mrow> </msub> </mtd> <mtd> <msub> <mi>r</mi> <mrow> <mn>2</mn> <mo>,</mo> <mn>2</mn> </mrow> </msub> </mtd> <mtd> <mo>...</mo> </mtd> <mtd> <msub> <mi>r</mi> <mrow> <mn>2</mn> <mo>,</mo> <mi>q</mi> </mrow> </msub> </mtd> <mtd> <mo>...</mo> </mtd> <mtd> <msub> <mi>r</mi> <mrow> <mn>2</mn> <mo>,</mo> <mi>m</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> </mtd> <mtd> <msub> <mi>r</mi> <mrow> <mn>2</mn> <mo>,</mo> <mi>m</mi> </mrow> </msub> </mtd> </mtr> <mtr> <mtd> <mo>.</mo> </mtd> <mtd> <mo>.</mo> </mtd> <mtd> <mrow></mrow> </mtd> <mtd> <mo>.</mo> </mtd> <mtd> <mrow></mrow> </mtd> <mtd> <mo>.</mo> </mtd> <mtd> <mo>.</mo> </mtd> </mtr> <mtr> <mtd> <mo>.</mo> </mtd> <mtd> <mo>.</mo> </mtd> <mtd> <mrow></mrow> </mtd> <mtd> <mo>.</mo> </mtd> <mtd> <mrow></mrow> </mtd> <mtd> <mo>.</mo> </mtd> <mtd> <mo>.</mo> </mtd> </mtr> <mtr> <mtd> <mo>.</mo> </mtd> <mtd> <mo>.</mo> </mtd> <mtd> <mrow></mrow> </mtd> <mtd> <mo>.</mo> </mtd> <mtd> <mrow></mrow> </mtd> <mtd> <mo>.</mo> </mtd> <mtd> <mo>.</mo> </mtd> </mtr> <mtr> <mtd> <msub> <mi>r</mi> <mrow> <mi>p</mi> <mo>,</mo> <mn>1</mn> </mrow> </msub> </mtd> <mtd> <msub> <mi>r</mi> <mrow> <mi>p</mi> <mo>,</mo> <mn>2</mn> </mrow> </msub> </mtd> <mtd> <mo>...</mo> </mtd> <mtd> <msub> <mi>r</mi> <mrow> <mi>p</mi> <mo>,</mo> <mi>q</mi> </mrow> </msub> </mtd> <mtd> <mo>...</mo> </mtd> <mtd> <msub> <mi>r</mi> <mrow> <mi>p</mi> <mo>,</mo> <mi>m</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> </mtd> <mtd> <msub> <mi>r</mi> <mrow> <mi>p</mi> <mo>,</mo> <mi>m</mi> </mrow> </msub> </mtd> </mtr> <mtr> <mtd> <mo>.</mo> </mtd> <mtd> <mo>.</mo> </mtd> <mtd> <mrow></mrow> </mtd> <mtd> <mo>.</mo> </mtd> <mtd> <mrow></mrow> </mtd> <mtd> <mo>.</mo> </mtd> <mtd> <mo>.</mo> </mtd> </mtr> <mtr> <mtd> <mo>.</mo> </mtd> <mtd> <mo>.</mo> </mtd> <mtd> <mrow></mrow> </mtd> <mtd> <mo>.</mo> </mtd> <mtd> <mrow></mrow> </mtd> <mtd> <mo>.</mo> </mtd> <mtd> <mo>.</mo> </mtd> </mtr> <mtr> <mtd> <mo>.</mo> </mtd> <mtd> <mo>.</mo> </mtd> <mtd> <mrow></mrow> </mtd> <mtd> <mo>.</mo> </mtd> <mtd> <mrow></mrow> </mtd> <mtd> <mo>.</mo> </mtd> <mtd> <mo>.</mo> </mtd> </mtr> <mtr> <mtd> <msub> <mi>r</mi> <mrow> <mi>n</mi> <mo>,</mo> <mn>1</mn> </mrow> </msub> </mtd> <mtd> <msub> <mi>r</mi> <mrow> <mi>n</mi> <mo>,</mo> <mn>2</mn> </mrow> </msub> </mtd> <mtd> <mo>...</mo> </mtd> <mtd> <msub> <mi>r</mi> <mrow> <mi>n</mi> <mo>,</mo> <mi>q</mi> </mrow> </msub> </mtd> <mtd> <mo>...</mo> </mtd> <mtd> <msub> <mi>r</mi> <mrow> <mi>n</mi> <mo>,</mo> <mi>m</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> </mtd> <mtd> <msub> <mi>r</mi> <mrow> <mi>n</mi> <mo>,</mo> <mi>m</mi> </mrow> </msub> </mtd> </mtr> </mtable> </mfenced> <mo>,</mo> </mrow>$

式中，p∈[1,n]，q∈[1,m]，r_p,q表示用户a_p对奖品b_q的实际评分，r_n,m的取值范围为[1,5]，若用户a_p对奖品b_q未评分，则记为0；

24)定义奖品类别集t′_k的定义，使用一维数组t′_k＝{t',t'₂…t'_k}表示奖品类别集。

3.根据权利要求1所述的一种基于数据分析处理技术的营销活动奖品供应商推荐方法，其特征在于，所述的计算任意用户间的评分相似度包括以下步骤：

31)使用Person相似度公式计算任意用户a、a_n之间的相似度SimP(a,a_n)，其计算公式如下

$<mrow> <mi>S</mi> <mi>i</mi> <mi>m</mi> <mi>P</mi> <mrow> <mo>(</mo> <mi>a</mi> <mo>,</mo> <msub> <mi>a</mi> <mi>n</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <munder> <mi>Σ</mi> <mrow> <mi>i</mi> <mo>&Element;</mo> <msub> <mi>I</mi> <mrow> <mi>a</mi> <mo>,</mo> <msub> <mi>a</mi> <mi>n</mi> </msub> </mrow> </msub> </mrow> </munder> <mrow> <mo>(</mo> <msub> <mi>R</mi> <mrow> <mi>a</mi> <mo>,</mo> <mi>i</mi> </mrow> </msub> <mo>-</mo> <msub> <mover> <mi>R</mi> <mo>&OverBar;</mo> </mover> <mi>a</mi> </msub> <mo>)</mo> </mrow> <mrow> <mo>(</mo> <msub> <mi>R</mi> <mrow> <mi>b</mi> <mo>,</mo> <mi>i</mi> </mrow> </msub> <mo>-</mo> <msub> <mover> <mi>R</mi> <mo>&OverBar;</mo> </mover> <msub> <mi>a</mi> <mi>n</mi> </msub> </msub> <mo>)</mo> </mrow> </mrow> <mrow> <msqrt> <mrow> <munder> <mi>Σ</mi> <mrow> <mi>i</mi> <mo>&Element;</mo> <msub> <mi>I</mi> <mi>a</mi> </msub> </mrow> </munder> <msup> <mrow> <mo>(</mo> <msub> <mi>R</mi> <mrow> <mi>a</mi> <mo>,</mo> <mi>i</mi> </mrow> </msub> <mo>-</mo> <msub> <mover> <mi>R</mi> <mo>&OverBar;</mo> </mover> <mi>a</mi> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> </mrow> </msqrt> <msqrt> <mrow> <munder> <mi>Σ</mi> <mrow> <mi>i</mi> <mo>&Element;</mo> <msub> <mi>I</mi> <msub> <mi>a</mi> <mi>n</mi> </msub> </msub> </mrow> </munder> <msup> <mrow> <mo>(</mo> <msub> <mi>R</mi> <mrow> <msub> <mi>a</mi> <mi>n</mi> </msub> <mo>,</mo> <mi>i</mi> </mrow> </msub> <mo>-</mo> <msub> <mover> <mi>R</mi> <mo>&OverBar;</mo> </mover> <msub> <mi>a</mi> <mi>n</mi> </msub> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> </mrow> </msqrt> </mrow> </mfrac> <mo>,</mo> </mrow>$

其中，表示用户a和a_n的共同评分奖品集，和表示用户a和a_n在集合中对奖品的平均评分，R_a,i表示用户a对所属用户a、a_n的共同评分奖品集的评分，R_b,i表示用户a_nb对所属用户a、a_n的共同评分奖品集的评分；

32)计算用户对奖品的共同评分数在所有评分数中的共同评分权重Weight(a,a_n)，其计算公式如下：

$<mrow> <mi>W</mi> <mi>e</mi> <mi>i</mi> <mi>g</mi> <mi>h</mi> <mi>t</mi> <mrow> <mo>(</mo> <mi>a</mi> <mo>,</mo> <msub> <mi>a</mi> <mi>n</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <msub> <mi>Con</mi> <mrow> <mi>a</mi> <mo>,</mo> <msub> <mi>a</mi> <mi>n</mi> </msub> </mrow> </msub> <mo>/</mo> <msub> <mi>All</mi> <mrow> <mi>a</mi> <mo>,</mo> <msub> <mi>a</mi> <mi>n</mi> </msub> </mrow> </msub> </mrow>$

其中，表示用户a和a_n的共同评分的奖品数，表示用户a和a_n所有已评分奖品数；

33)计算用户a和b的共同评分差异度权重Weight_SD(a,a_n)，其计算公式如下：

$<mrow> <mi>W</mi> <mi>e</mi> <mi>i</mi> <mi>g</mi> <mi>h</mi> <mi>t</mi> <mo>_</mo> <mi>S</mi> <mi>D</mi> <mrow> <mo>(</mo> <mi>a</mi> <mo>,</mo> <msub> <mi>a</mi> <mi>n</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mn>1</mn> <mrow> <msub> <mi>Con</mi> <mrow> <mi>a</mi> <mo>,</mo> <msub> <mi>a</mi> <mi>n</mi> </msub> </mrow> </msub> </mrow> </mfrac> <munder> <mi>Σ</mi> <mrow> <mi>k</mi> <mo>&Element;</mo> <msub> <mi>S</mi> <mrow> <mi>a</mi> <mo>,</mo> <msub> <mi>a</mi> <mi>n</mi> </msub> </mrow> </msub> </mrow> </munder> <msub> <mi>N</mi> <mi>m</mi> </msub> </mrow>$

式中N_m表示在用户a和a_n共同评分集合中奖品评分同时大于或者小于的奖品总数，为用户a和a_n评分的平均值；

34)基于共同评分权重Weight(a,a_n)以及共同评分差异度权重Weight_SD(a,a_n)，计算任意用户间的评分相似度Sim_score(a,a_n)，其计算公式如下：

Sim_score(a,a_n)＝Weight(a,a_n)×Weight_SD(a,a_n)×SimP(a,a_n)

其中，Sim_score(a,a_n)为用户a和a_n之间的相似度，Weight(a,a_n)为用户a和a_n的共同评分权重，Weight_SD(a,a_n)为用户a和a_n之间的共同评分差异度权重，SimP(a,a_n)为传统的用户a和a_n之间的相似度。

4.根据权利要求1所述的一种基于数据分析处理技术的营销活动奖品供应商推荐方法，其特征在于，所述的计算任意用户间的偏好相似度包括以下步骤：

41)计算用户a对奖品类别t′_k的兴趣度Weight_tag(a,t′_k)，其计算公式如下：

$<mrow> <mi>W</mi> <mi>e</mi> <mi>i</mi> <mi>g</mi> <mi>h</mi> <mi>t</mi> <mo>_</mo> <mi>t</mi> <mi>a</mi> <mi>g</mi> <mrow> <mo>(</mo> <mi>a</mi> <mo>,</mo> <msup> <mi>t</mi> <mo>′</mo> </msup> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <msub> <mi>T</mi> <mrow> <mi>a</mi> <mo>,</mo> <msup> <mi>t</mi> <mo>′</mo> </msup> </mrow> </msub> <mrow> <munder> <mi>Σ</mi> <mrow> <mi>k</mi> <mo>&Element;</mo> <msub> <mi>T</mi> <mi>a</mi> </msub> </mrow> </munder> <msub> <mi>T</mi> <mrow> <mi>a</mi> <mo>,</mo> <msubsup> <mi>t</mi> <mi>k</mi> <mo>′</mo> </msubsup> </mrow> </msub> </mrow> </mfrac> </mrow>$

式中T_a,t′表示用户a对奖品类别t′的评分次数，k表示用户a评价的所有奖品类别中的某个类别；

42)计算融合用户评分和奖品类别兴趣度的用户a对奖品i的偏好程度Weight_pre(a,i)，计算公式如下

$<mrow> <mi>W</mi> <mi>e</mi> <mi>i</mi> <mi>g</mi> <mi>h</mi> <mi>t</mi> <mo>_</mo> <mi>p</mi> <mi>r</mi> <mi>e</mi> <mrow> <mo>(</mo> <mi>a</mi> <mo>,</mo> <mi>i</mi> <mo>)</mo> </mrow> <mo>=</mo> <msub> <mi>R</mi> <mrow> <mi>a</mi> <mo>,</mo> <mi>i</mi> </mrow> </msub> <mo>×</mo> <munder> <mi>Σ</mi> <mrow> <mi>k</mi> <mo>&Element;</mo> <mi>T</mi> </mrow> </munder> <mi>W</mi> <mi>e</mi> <mi>i</mi> <mi>g</mi> <mi>h</mi> <mi>t</mi> <mo>_</mo> <mi>t</mi> <mi>a</mi> <mi>g</mi> <mrow> <mo>(</mo> <mi>a</mi> <mo>,</mo> <msubsup> <mi>t</mi> <mi>k</mi> <mo>′</mo> </msubsup> <mo>)</mo> </mrow> </mrow>$

式中R_a,i为用户a对奖品i的评分，Weight_tag(a,t′_k)为用户a对奖品类别t′_k的兴趣度；

43)计算用户之间的偏好相似度Sim_pre(a,a_n)，计算公式如下：

$<mrow> <msub> <mi>Sim</mi> <mrow> <mi>p</mi> <mi>r</mi> <mi>e</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>a</mi> <mo>,</mo> <msub> <mi>a</mi> <mi>n</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <munder> <mi>Σ</mi> <mrow> <mi>i</mi> <mo>&Element;</mo> <msub> <mi>p</mi> <mrow> <mi>a</mi> <mo>,</mo> <msub> <mi>a</mi> <mi>n</mi> </msub> </mrow> </msub> </mrow> </munder> <mrow> <mo>(</mo> <mi>W</mi> <mi>e</mi> <mi>i</mi> <mi>g</mi> <mi>h</mi> <mi>t</mi> <mo>_</mo> <mi>p</mi> <mi>r</mi> <mi>e</mi> <mo>(</mo> <mrow> <mi>a</mi> <mo>,</mo> <mi>b</mi> </mrow> <mo>)</mo> <mo>-</mo> <mover> <mrow> <mi>W</mi> <mi>e</mi> <mi>i</mi> <mi>g</mi> <mi>h</mi> <mi>t</mi> <mo>_</mo> <msub> <mi>pre</mi> <mi>a</mi> </msub> </mrow> <mo>&OverBar;</mo> </mover> <mo>)</mo> </mrow> <mo>×</mo> <mrow> <mo>(</mo> <mi>W</mi> <mi>e</mi> <mi>i</mi> <mi>g</mi> <mi>h</mi> <mi>t</mi> <mo>_</mo> <mi>p</mi> <mi>r</mi> <mi>e</mi> <mo>(</mo> <mrow> <msub> <mi>a</mi> <mi>n</mi> </msub> <mo>,</mo> <mi>b</mi> </mrow> <mo>)</mo> <mo>-</mo> <mover> <mrow> <mi>W</mi> <mi>e</mi> <mi>i</mi> <mi>g</mi> <mi>h</mi> <mi>t</mi> <mo>_</mo> <msub> <mi>pre</mi> <msub> <mi>a</mi> <mi>n</mi> </msub> </msub> </mrow> <mo>&OverBar;</mo> </mover> <mo>)</mo> </mrow> </mrow> <mrow> <msqrt> <mrow> <munder> <mi>Σ</mi> <mrow> <mi>i</mi> <mo>&Element;</mo> <msub> <mi>P</mi> <mi>a</mi> </msub> </mrow> </munder> <msup> <mrow> <mo>(</mo> <mi>W</mi> <mi>e</mi> <mi>i</mi> <mi>g</mi> <mi>h</mi> <mi>t</mi> <mo>_</mo> <mi>p</mi> <mi>r</mi> <mi>e</mi> <mo>(</mo> <mrow> <mi>a</mi> <mo>,</mo> <mi>b</mi> </mrow> <mo>)</mo> <mo>-</mo> <mover> <mrow> <mi>W</mi> <mi>e</mi> <mi>i</mi> <mi>g</mi> <mi>h</mi> <mi>t</mi> <mo>_</mo> <msub> <mi>pre</mi> <mi>a</mi> </msub> </mrow> <mo>&OverBar;</mo> </mover> <mo>)</mo> </mrow> <mn>2</mn> </msup> </mrow> </msqrt> <msqrt> <mrow> <munder> <mi>Σ</mi> <mrow> <mi>i</mi> <mo>&Element;</mo> <msub> <mi>P</mi> <msub> <mi>a</mi> <mi>n</mi> </msub> </msub> </mrow> </munder> <msup> <mrow> <mo>(</mo> <mi>W</mi> <mi>e</mi> <mi>i</mi> <mi>g</mi> <mi>h</mi> <mi>t</mi> <mo>_</mo> <mi>p</mi> <mi>r</mi> <mi>e</mi> <mo>(</mo> <mrow> <msub> <mi>a</mi> <mi>n</mi> </msub> <mo>,</mo> <mi>b</mi> </mrow> <mo>)</mo> <mo>-</mo> <mover> <mrow> <mi>W</mi> <mi>e</mi> <mi>i</mi> <mi>g</mi> <mi>h</mi> <mi>t</mi> <mo>_</mo> <msub> <mi>pre</mi> <msub> <mi>a</mi> <mi>n</mi> </msub> </msub> </mrow> <mo>&OverBar;</mo> </mover> <mo>)</mo> </mrow> <mn>2</mn> </msup> </mrow> </msqrt> </mrow> </mfrac> </mrow>$

，其中：表示用户a和a_n共同感兴趣的奖品集，表示用户a在内的奖品平均偏好程度，示用户a_n在内的奖品平均偏好程度，Weight_pre(a,b)为融合用户评分和奖品类别兴趣度的用户a对奖品b的偏好程度。

5.根据权利要求1所述的一种基于数据分析处理技术的营销活动奖品供应商推荐方法，其特征在于，所述的计算最终用户相似度的公式如下：

Sim(a,a_n)＝α×Sim_score(a,a_n)+β×Sim_pre(a,a_n)+(1-α-β)×Sim_score(a,a_n)×Sim_pre(a,a_n)

其中：α和β为权重值、α和β取值范围[0,1]。

6.根据权利要求1所述的一种基于数据分析处理技术的营销活动奖品供应商推荐方法，其特征在于，所述的评估待处理数据包括以下步骤：

61)采集用户对营销奖品的需求，采集数据包括用户名称、奖品名称，存储接收到的数据内容；

以用户名称为索引读取数据仓库中用户历史评分数据、用户属性数据、用户偏好数据；以奖品名称为索引读取数据仓库中奖品特征数据；

62)根据Sim(a,a_n)，对目标用户a的相似用户依据相似度由大到小排序，选出与目标用户a相似度最接近且已对用户a未评分奖品评分的k个用户构成最近邻居集N_a；

63)预测目标用户a对未评分奖品b的最终评分其计算公式如下

$<mrow> <msub> <mi>M</mi> <mrow> <mi>a</mi> <mo>,</mo> <msub> <mi>a</mi> <mi>n</mi> </msub> </mrow> </msub> <mo>=</mo> <msub> <mover> <mi>R</mi> <mo>&OverBar;</mo> </mover> <mi>a</mi> </msub> <mo>+</mo> <mfrac> <mrow> <munder> <mi>Σ</mi> <mrow> <msub> <mi>a</mi> <mi>n</mi> </msub> <mo>&Element;</mo> <msub> <mi>N</mi> <mi>a</mi> </msub> </mrow> </munder> <mi>S</mi> <mi>i</mi> <mi>m</mi> <mrow> <mo>(</mo> <mi>a</mi> <mo>,</mo> <msub> <mi>a</mi> <mi>n</mi> </msub> <mo>)</mo> </mrow> <mo>×</mo> <mrow> <mo>(</mo> <msub> <mi>R</mi> <mrow> <msub> <mi>a</mi> <mi>n</mi> </msub> <mo>,</mo> <mi>b</mi> </mrow> </msub> <mo>-</mo> <msub> <mover> <mi>R</mi> <mo>&OverBar;</mo> </mover> <msub> <mi>a</mi> <mi>n</mi> </msub> </msub> <mo>)</mo> </mrow> </mrow> <mrow> <munder> <mi>Σ</mi> <mrow> <msub> <mi>a</mi> <mi>n</mi> </msub> <mo>&Element;</mo> <msub> <mi>N</mi> <mi>a</mi> </msub> </mrow> </munder> <mo>|</mo> <mi>S</mi> <mi>i</mi> <mi>m</mi> <mrow> <mo>(</mo> <mi>a</mi> <mo>,</mo> <msub> <mi>a</mi> <mi>n</mi> </msub> <mo>)</mo> </mrow> <mo>|</mo> </mrow> </mfrac> </mrow>$

式中N_a表示目标用户a的最近邻居集，和表示用户a和a_n的评分绝对值。

完整全部详细技术资料下载

当前第2页1 2 3