向终端用户推荐对象的方法及系统的制作方法

文档序号:9839627阅读:236来源:国知局
向终端用户推荐对象的方法及系统的制作方法
【技术领域】
[0001] 本发明涉及网络数据处理,更为具体地涉及向终端用户推荐对象的技术。
【背景技术】
[0002] 推荐系统是互联网业、电子商务以及零售业等行业在数据挖掘领域最典型并且最 重要的应用。
[0003] 目前,大部分公司的推荐系统都基于协同过滤算法实现,虽然协同过滤算法在应 用与商品推荐时显示出了较好的表现,但还有可改进的地方。协同过滤算法基于用户之间 的消费相似度来构建对用户的评价,从而做出推荐,而用户之间的相似度是通过高维稀疏 向量之间的相似度来标识的,这样的评价方法所得到的用户之间的相似度可能是不准确 的,从而导致了推荐结果的不准确性,并且随着商户数量的增多,推荐系统所计算的向量稀 疏程度会增加,这不但降低了推荐的准确度,同时增大了计算的复杂度,降低了推荐系统的 性能。

【发明内容】

[0004] 本文提供一种向终端用户推荐对象的方法,其包括: a.基于N个对象,建立对象关联数据集,该对象关联数据集包括第一时间段内被任意 终端用户浏览过的所述N个对象中所有对象,以及第一时间段内被任意终端用户先后浏览 过的N个对象中的两个对象按浏览顺序组成的关联组; b. 确定所述对象关联数据集中各对象在该对象关联数据集中出现的个体频率; c. 确定所述对象关联组在该对象关联数据集中出现的关联组频率; d. 基于所述对象关联组中每个对象的个体频率以及该关联组频率计算该所述对象关 联组中两个对象的关联度; e. 确定所述N个对象中被有推荐需求的终端用户浏览过的对象,将其作为种子对象; f. 标定所述种子对象的推荐度; g. 在所述对象关联数据集中查找包括所述种子对象的第一类关联组,并为所述第一 类关联组中的尚未被标定的对象标定推荐度;以及 h. 在所述对象关联数据集中查找包括所述第一类关联组中的非种子对象的第二类关 联组,并为该第二类关联组中的未标定推荐度的对象标定推荐度。
[0005] 根据本发明的一个方面,该向终端用户推荐对象的方法中,所述步骤d按照如下公 式确定所述关联度:
其中#为对象X的个体频率,Λ为对象y的个体频率,为对象X与y组成的关联组xy 的组频率,Wxy为关联组xy中对象X与y的关联度。
[0006] 根据本发明的一个方面,该向终端用户推荐对象的方法中,所述种子对象的推荐 度为1,所述推荐度按照如下公式确定:
其中,X为关联组xy中的已标定了推荐度的对象,其推荐度为Rx,y为关联组xy中未标定 推荐度的对象,Ry表示y的推荐度,P是预定的推荐度传播概率。
[0007] 根据本发明的示例,还提供向终端用户推荐对象的系统,其包括: 第一单元,其用于基于N个对象,建立对象关联数据集,该对象关联数据集包括第一时 间段内被任意终端用户浏览过的所述N个对象中的所有对象,以及第一时间端内被任意终 端用户先后浏览过的N个对象中的两个对象按浏览顺序组成的关联组; 第二单元,其用于确定所述对象关联数据集中各对象在该对象关联数据集中出现的个 体频率; 第三单元,其用于确定所述对象关联组在该对象关联数据集中出现的关联组频率; 第四单元,其用于基于所述对象关联组中每个对象的个体频率以及该关联组频率计算 该所述对象关联组中对象间的关联度; 第五单元,其用于确定所述N个对象中被有推荐需求的终端用户浏览过的对象,将其作 为种子对象; 第六单元,其用于标定所述种子对象的推荐度; 第七单元,其用于在所述对象关联数据集中查找包括所述种子对象的第一类关联组, 并为所述第一类关联组中的非种子对象标定推荐度;以及 第八单元,其用于在所述对象关联数据集中查找包括所述第一类关联组中的非种子对 象的第二类关联组,并为该第二类关联组中的未标定推荐度的对象标定推荐度。
[0008] 根据本发明的一个方面,所提供的向终端用户推荐对象的系统中,所述步骤第四 单元按照如下公式确定所述关联度:
其中/?为对象X的个体频率,Λ为对象y的个体频率,Λν为对象X与y组成的关联组xy 的组频率,Wxy为关联组xy中对象X与y的关联度。
[0009] 根据本发明的一个方面,所提供的向终端用户推荐对象的系统中,所述种子对象 的推荐度为1,所述推荐度按照如下公式确定:
其中,X为关联组xy中的已标定了推荐度的对象,其推荐度为Rx,y为关联组xy中未标定 推荐度的对象,Ry表示y的推荐度,P是预定的推荐度传播概率。
【附图说明】
[0010]图1是根据本发明一个示例的向终端用户推荐对象的方法的流程图。
[0011]图2是根据本发明一个示例的向终端用户推荐对象的系统的结构示意图。
【具体实施方式】
[0012] 现在参照附图描述本发明的示意性示例。相同的附图标号表示相同的元件。下文 描述的各实施例有助于本领域技术人员透彻理解本发明,且意在示例而非限制。除非另有 限定,文中使用的术语(包括科学、技术和行业术语)具有与本发明所属领域的技术人员普 遍理解的含义相同的含义。此外,流程图中各步骤的先后顺序也不以图示的顺序为限。
[0013] 图1是根据本发明一个示例的向终端用户推荐对象的方法的流程图。如图所示,在 步骤10,基于N个对象,建立对象关联数据集,该对象关联数据集包括第一时间段内被任意 终端用户浏览过的所述N个对象中所有对象,以及第一时间段内被任意终端用户先后浏览 过的N个对象中的两个对象按浏览顺序组成的关联组。
[0014]通常而言,N是一个较大数据,而第一时间段也是诸如一个月等的时间段,由此,所 获得的对象关联数据集是一个数据含量大的数据集。在此,为便于阐述,假设N为4,即,假设 有A、B、C、D四个对象,第一时间段为1天。在这一天的时间里,甲用户先浏览了A,再浏览了 C,然后再浏览了D,又回头再浏览了A;用户乙先浏览了A,再浏览了D,然后再次回去浏览了 A,再去浏览了B;丙用户浏览了B,之后浏览了 C; 丁用户的浏览顺序为D、B、C、A。由此,该例子 中,该第一时间段内被甲、乙、丙、丁浏览过的该N个对象中的所有对象为A、C、D、A、A、D、A、B、 B、 C、D、B、C、A;第一时间段内被甲用户先后浏览过的N个对象中的两个对象按浏览顺序组成 的关联组包括六(:、00、04,用户乙先后浏览过的~个对象中的两个对象按浏览顺序组成的关 联组包括40、04^8,用户丙先后浏览过的~个对象中的两个对象按浏览顺序组成的关联组 包括BC,用户丁先后浏览过的N个对象中的两个对象按浏览顺序组成的关联组包括DB、BC、 CA。进而,该例子中,基于这4个对象建立对象关联数据集包括A、C、D、A、A、D、A、B、B、C、D、B、 C、 A、AC、CD、DA、AD、DA、AB、BC、DB、BC、CA。
[0015] 可见,构建该关联数据集的过程中,如果某个对象被同一终端用户在不同的时间 浏览过多次,则该对象应在该关联数据集中出现多次,而该关联组中,关联组中每个组都是 按照用户浏览组中两个对象的顺序排列的,而且,如果同一终端用户在不同的时间先后浏 览两个对象的情况出现了多次,则该关联组应在该关联数据集中出现多次。比如,上面这个 具体的例子,在该一天的上午,用户丙先后浏览过B与C,从而构成这两个对象按浏览顺序组 成关联组BC,而用户丙下午再次浏览过B与C,则再次构成关联组BC,相应地,上文给出的对 象关联数据集将修改为包括A、C、D、A、A、D、A、B、B、C、D、B、C、A、AC、CD、DA、AD、DA、AB、BC、BC、 DB、BC、CA〇
[0016] 在步骤12,确定所述对象关联数据集中各对象在该对象关联数据集中出现的个体 频率。对象A在步骤10所建立的对象关联数据集中出现的次数便是A的个体频率,对象B 出现的次数变为B的个体频率Λ,依次类推。
[0017] 在步骤14,确定所述对象关联组在该对象关联数据集中出现的关联组频率。对象 关联组的频率指的是以相同顺序包含两个对象的关联组在整个对象关联数据集中出现的 次数。例如,关联组ΑΒ的关联组频率表不为. :/灿。
[0018] 在步骤16,基于所述对象关联组中每个对象的个体频率以及该关联组频率计算该 所述对象关联组中对象间的关联度。如果要计算关联组ΑΒ中对象Α与对象Β的关联度,则根 据对象A的个体频率/^、对象B的个体频率Λ、以及关联组AB的关联组频率/μ来根据如下 的等式(1)来计算:
(1) 其中,4为对象χ的个体频率,Λ为对象y的个体频率,:4为对象χ与y组成的关联组xy 的组频率,Wxy为关联组xy中对象X与y的关联度。
[0019] 如果对象X为对象A,而对象y为对象B,则按照等式(1) : A与B的关联度计算如下:
在步骤18,确定所述N个对象中被有推荐需求的终端用户浏览过的对象,将其作为种子 对象。结合上文给出的例子,假设有推荐需求的的终端用户为丙,则首先从N个对象中确定 出丙曾经浏览过的对象,如在步骤10所描述过的,丙曾经浏览过B与C,因此,对于有推荐需 求的的终端用户丙对象B与C都被确定为种子对象。
[0020] 在步骤20,
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1