一种物品推荐方法、装置制造方法

文档序号:6535217阅读:123来源:国知局
一种物品推荐方法、装置制造方法
【专利摘要】本发明适用于网络信息检索【技术领域】,提供了一种物品推荐方法、装置,所述方法包括:采集物品属性数据和用户日志数据,所述用户日志数据中包括用户历史行为数据;根据所述物品属性数据和所述用户历史行为数据计算物品之间的二维相似度;根据所述二维相似度计算用户对每个物品的喜好程度;根据所述喜好程度为所述用户推荐相应的物品。本发明,计算物品之间的相似度时,综合考虑了物品属性数据和用户历史行为数据,得出的二维相似度数据相比现有技术的只考虑物品属性数据和用户历史行为数据中的其中一种而得出的属性相似度或者行为相似度,精确度更高,使得能推荐给用户最为喜爱的物品。
【专利说明】一种物品推荐方法、装置
【技术领域】
[0001]本发明属于网络信息检索【技术领域】,尤其涉及一种物品推荐方法、装置。
【背景技术】
[0002]随着互联网的发展,网络资源呈爆炸式增长,互联网用户获取信息需要的代价越来越高。虽然用户可以借助搜索引擎去获取信息,但是还是会存在不足之处。
[0003]一方面,用户搜索时很难找到合适的关键词来描述搜索内容;另一方面,搜索引擎返回给用户的结果很难满足用户的个性化需求。
[0004]因此,个性化推荐系统应运而生,它根据用户行为或物品属性分析用户的喜好,从而给用户提供个性化的推荐结果。个性化推荐系统在给用户进行推荐时,首先基于物品属性或用户行为计算物品之间的相似性,然后根据用户行为预测用户对未知物品的喜好程度,并据此筛选出用户最感兴趣的若干物品并推荐给该用户。
[0005]然而,当前的个性化推荐系统往往基于物品属性和用户行为中的一种数据计算物品之间的相似度,因此相似度计算不够准确。部分个性化推荐系统虽然结合上述两种数据计算物品之间的相似度,但是由于计算方法复杂,很难在分布式环境下实现,因此无法满足实际中处理大数据的需求。
[0006]另外,现有技术也提供了一种集成属性和结构相似性的个性化商品推荐方法,该方法集成属性和结构相似性信息,将用户和商品作为带有特征信息的节点映射到网络,依据顾客和商品间的购买关系建立信息网络图,在信息网络图中利用集成属性和结构相似性度量用户节点对间的兴趣偏好,并以此选择最近邻,以提高推荐准确性。虽然该方法相比于当前的个性化推荐系统推荐准确性更高,但在计算相似度时,需要多次迭代计算,而且在每次迭代计算的过程中需要保证能够访问到全部数据,因此很难通过拆分数据的方式将该计算过程分解到Hadoop分布式环境集群上的各个计算节点,所以很难在Hadoop分布式环境下实现,并且单机环境下夹角余弦计算方法也只能处理小规模数据,因此该方法对于小规模数据是可行的,如用户和物品数量在“千”数量级,但当用户数量、物品数量以及用户行为数据增加到中等规模或者大规模时,该方法并不现实。

【发明内容】

[0007]本发明实施例提供了一种物品推荐方法、装置,旨在解决现有技术提供的物品推荐方法,计算复杂,效率低下,且很难在分布式环境下实现,因此无法满足实际中处理大数据的需求的问题。
[0008]一方面,提供一种物品推荐方法,所述方法包括:
[0009]采集物品属性数据和用户日志数据,所述用户日志数据中包括用户历史行为数据;
[0010]根据所述物品属性数据和所述用户历史行为数据计算物品之间的二维相似度;
[0011]根据所述二维相似度计算用户对每个物品的喜好程度;[0012]根据所述喜好程度为所述用户推荐相应的物品。
[0013]进一步地,所述根据所述物品属性数据和所述用户历史行为数据计算物品之间的二维相似度包括:
[0014]根据所述物品属性数据计算物品i与物品j之间的属性相似度SimA(i,j);
[0015]根据所述用户历史行为数据计算物品i与物品j之间的行为相似度SimB(i,j);
[0016]根据所述属性相似度SimA(i, j)和所述行为相似度SimB(i, j)计算物品i与物品j之间的二维相似度Sim(i, j)。
[0017]进一步地,根据如下所示的公式计算物品i与物品j之间的二维相似度Sim(i, j):
[0018]Sim(i,j) = a.SimA(i, j) + (l-a ).SimB(i, j);
[0019]其中,a为调节参数,a大于等于0小于等于1,用于权衡物品属性数据与用户历史行为数据对物品i与物品j之间的二维相似度Sim(i,j)的贡献。
[0020]进一步地,所述根据所述物品属性数据和所述用户历史行为数据计算物品之间的二维相似度包括:
[0021]根据物品 属性数据建立物品属性向量;
[0022]根据用户的历史行为数据建立物品行为向量;
[0023]根据物品属性向量和物品行为向量建立物品二维向量;
[0024]根据所述物品二维向量计算物品i与物品j之间的二维相似度Sim(i, j)。
[0025]进一步地,所述根据物品属性向量和物品行为向量建立物品二维向量包括:
[0026]根据物品i的属性向量F(i)和物品i的行为向量H(i)建立物品i的二维向量W(j),所述胃W(j)满足:
【权利要求】
1.一种物品推荐方法,其特征在于,所述方法包括: 采集物品属性数据和用户日志数据,所述用户日志数据中包括用户历史行为数据; 根据所述物品属性数据和所述用户历史行为数据计算物品之间的二维相似度; 根据所述二维相似度计算用户对每个物品的喜好程度; 根据所述喜好程度为所述用户推荐相应的物品。
2.如权利要求1所述的方法,其特征在于,所述根据所述物品属性数据和所述用户历史行为数据计算物品之间的二维相似度包括: 根据所述物品属性数据计算物品i与物品j之间的属性相似度SimA(i,j); 根据所述用户历史行为数据计算物品i与物品j之间的行为相似度SimB(i,j);根据所述属性相似度SimA(i,j)和所述行为相似度SimB(i,j)计算物品i与物品j之间的二维相似度Sim (i, j)。
3.如权利要求2所述的方法,其特征在于,根据如下所示的公式计算物品i与物品j之间的二维相似度Sim (i,j):
Sim(i,j) = a.SimA(i, j) + (l-a ).SimB(i, j); 其中,a为调节参数,a大于等于O小于等于1,用于权衡物品属性数据与用户历史行为数据对物品i与物品j之间的二维相似度Sim(i,j)的贡献。
4.如权利要求1所述的方法,其特征在于,所述根据所述物品属性数据和所述用户历史行为数据计算物品之间的二维相似度包括: 根据物品属性数据建立物品属性向量; 根据用户的历史行为数据建立物品行为向量; 根据物品属性向量和物品行为向量建立物品二维向量; 根据所述物品二维向量计算物品i与物品j之间的二维相似度Sim(i,j)。
5.如权利要求4所述的方法,其特征在于,所述根据物品属性向量和物品行为向量建立物品二维向量包括: 根据物品i的属性向量F(i)和物品i的行为向量H(i)建立物品i的二维向量W(i),所述W(i)满足:
6.如权利要求5所述的方法,其特征在于,所述根据二维向量W(i)和二维向量W(j)计算物品i与物品j之间的二维相似度Sim(i,j)具体为: 计算二维向量W(i)和二维向量W(j)之间的点积。
7.如权利要求6所述的方法,其特征在于,所述计算二维向量W(i)和二维向量W(j)之间的点积包括: 将向量W(i)表示成物品列表L(d),所述L(d)中包括物品集合包含的每一个特征d对应的物品i和特征d在物品i中的特征值,其中,i为包含特征d的任意一物品标识,d是物品属性向量对应的任意一属性标识或者用户行为向量对应的任意一用户标识; 根据特征d对应的物品列表L(d)得到特征d对应的向量D(d),所述向量D(d)的每一个元素对应物品i和特征d在物品i中的特征值; 计算D(d)对应的物品列表L(d)中任意两个物品在特征d上的乘积,得到包含特征d的物品i与其他所有包含特征d的物品在特征d上的乘积,得到一组向量Dotd(i),向量Dotd(i)的元素为其他所有包含特征d的物品与物品i在特征d上的乘积; 汇总物品i与其他物品在所有特征上的乘积所得的向量Dotd(i),得到向量W(i)与其他向量W(j)之间的点积。
8.一种物品推荐装置,其特征在于,所述装置包括: 数据采集单元,用于采集物品属性数据和用户日志数据,所述用户日志数据中包括用户历史行为数据; 二维相似度计算单元,用于根据所述物品属性数据和所述用户历史行为数据计算物品之间的二维相似度; 喜好程度计算单元,用于根据所述二维相似度计算用户对每个物品的喜好程度; 物品推荐单元,用于根据所述喜好程度为所述用户推荐相应的物品。
9.如权利要求8所述的装置,其特征在于,所述二维相似度计算单元包括: 属性相似度计算模块,用于根据所述物品属性数据计算物品i与物品j之间的属性相似度 SimA(i, j); 行为形似度计算模块,用于根据所述用户历史行为数据计算物品i与物品j之间的行为相似度SimB(i,j); 第一二维相似度计算模块,用于根据所述属性相似度SimA(i,j)和所述行为相似度SimB(i, j)计算物品i与物品j之间的二维相似度Sim(i, j)。
10.如权利要求9所述的装置,其特征在于,所述第一二维相似度计算模块根据如下所示的公式计算物品i与物品j之间的二维相似度Sim(i, j):
Sim(i,j) = a.SimA(i, j) + (l-a ).SimB(i, j); 其中,a为调节参数,a大于等于0小于等于1,用于权衡物品属性数据与用户历史行为数据对物品i与物品j之间的二维相似度Sim(i,j)的贡献。
11.如权利要求8所述的装置,其特征在于,所述二维相似度计算单元包括: 属性向量建立模块,用于根据物品属性数据建立物品属性向量;行为向量建立模块,用于根据用户的历史行为数据建立物品行为向量; 二维向量建立模块,用于根据物品属性向量和物品行为向量建立物品二维向量; 第二二维相似度计算模块,用于根据所述物品二维向量计算物品i与物品j之间的二维相似度Sim (i, j)。
12.如权利要求11所述的装置,其特征在于,所述二维向量建立模块包括: 第一二维向量建立子模块,用于根据物品i的属性向量F(i)和物品i的行为向量H(i)建立物品i的二维向量W(i),所述W(i)满足:
13.如权利要求12所述的装置,其特征在于,所述第二二维相似度计算模块计算二维向量W(i)和二维向量W(j)之间的点积。
14.如权利要求13所述的装置,其特征在于,所述第二二维相似度计算模块包括: 物品列表建立子模块,用于将向量W(i)表示成物品列表L(d),所述L(d)中包括物品集合包含的每一个特征d对应的物品i和特征d在物品i中的特征值,其中,i为包含特征d的任意一物品标识,d是物品属性向量对应的任意一属性标识或者用户行为向量对应的任意一用户标识; 特征向量计算子模块,用于根据特征d对应的物品列表L(d)得到特征d对应的向量D(d),所述向量D(d)的每一个元素对应物品i和特征d在物品i中的特征值; 特征值乘积计算子模块,用于计算D(d)对应的物品列表L(d)中任意两个物品在特征d上的乘积,得到包含特征d的物品i与其他所有包含特征d的物品在特征d上的乘积,得到一组向量Dotd(i),向量Dotd(i)的元素为其他所有包含特征d的物品与物品i在特征d上的乘积; 向量点积获取子模块,用于汇总物品i与其他物品在所有特征上的乘积所得的向量Dotd(i),得到向量W(i)与其他向量W(j)之间的点积。
【文档编号】G06Q30/02GK103744966SQ201410007692
【公开日】2014年4月23日 申请日期:2014年1月7日 优先权日:2014年1月7日
【发明者】鲁梦平, 李朝, 董延平, 刘杰 申请人:Tcl集团股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1