基于协同过滤的通用物品推荐方法与流程

文档序号:11730045阅读:430来源:国知局

本发明涉及信息推荐技术领域,具体涉及一种基于协同过滤的通用物品推荐方法。



背景技术:

如今已经进入了一个数据爆炸的时代,随着web2.0的发展,web已经变成数据分享的平台,那么,如何让人们在海量的数据中想要找到他们需要的信息将变得越来越难。

在这样的情形下,搜索引擎(google,bing,百度等等)成为大家快速找到目标信息的最好途径。在用户对自己需求相对明确的时候,用搜索引擎很方便的通过关键字搜索很快的找到自己需要的信息。但搜索引擎并不能完全满足用户对信息发现的需求,那是因为在很多情况下,用户其实并不明确自己的需要,或者他们的需求很难用简单的关键字来表述。又或者他们需要更加符合他们个人口味和喜好的结果,因此出现了推荐系统,与搜索引擎对应,大家也习惯称它为推荐引擎。

随着推荐引擎的出现,用户获取信息的方式从简单的目标明确的数据的搜索转换到更高级更符合人们使用习惯的信息发现。

如今,随着推荐技术的不断发展,推荐引擎已经在电子商务(e-commerce,例如amazon,当当网)和一些基于social的社会化站点(包括音乐,电影和图书分享,例如豆瓣,mtime等)都取得很大的成功。这也进一步的说明了,web2.0环境下,在面对海量的数据,用户需要这种更加智能的,更加了解他们需求,口味和喜好的信息发现机制。协同过滤推荐算法是诞生最早,并且较为著名的推荐算法。主要的功能是预测和推荐。算法通过对用户历史行为数据的挖掘发现用户的偏好,基于不同的偏好对用户进行群组划分并推荐品味相似的商品。协同过滤推荐算法分为两类,分别是基于用户的协同过滤算法(user-basedcollaborativefiltering),和基于物品的协同过滤算法(item-basedcollaborativefiltering)。简单的说就是:人以类聚,物以群分。



技术实现要素:

本发明的目的是为了解决现有技术中的上述缺陷,提供一种基于协同过滤的通用物品推荐方法。

本发明的目的可以通过采取如下技术方案达到:

一种基于协同过滤的通用物品推荐方法,所述通用物品推荐方法包括下列步骤:

s1、业务方对推荐物品及用户的属性及特征值进行初始化定义,将用户的行为分类并设置初始搜索引擎的条件,完成初始化设定和推荐引擎apk接入后,向推荐引擎apk发起推荐请求,并将初始化的数据集发送给推荐引擎apk;

s2、推荐引擎apk首先根据业务方的初始搜索引擎,将满足搜索条件的数据,汇总形成可推荐候选集a,对可推荐候选集a通过相似度判定得到相似用户集,并根据基于用户的协同过滤思想,进行数据筛选得到可推荐结果集b;

s3、将可推荐结果集b根据物品的属性,对属性的特征值进行划分,根据用户的感兴趣集中各个特征值所占的比例,得到可推荐结果集b的用户中每个属性特征值所占的权重,并根据各个最显著的特征集去得到用户感知最敏感的属性,根据感知最敏感的属性的不同参考权重,将用户的感兴趣集进行排序,得到初步推荐列表c;

s4、将初步推荐结果列表c发送给业务方,业务方根据需求进行重排,最后得到推荐结果列表d。

进一步地,所述步骤s2的具体过程如下:

s201、将用户的行为分为t1~tk共k类,并对这k类行为分别进行权重赋值w1~wk,根据不同的用户行为区分为正面、负面以及高、中、低六个维度,赋值向量w的取值为w=【-2,-1,0,1,2,3】;

s202、获取用户对物品的行为操作累加值得到用户对物品的喜好度h=∑w;当h>3时,则认为用户对该物品感兴趣;

s203、通过不同用户对各个物品的喜好度h,利用欧几里得距离计算得到用户之间的相似度:

当两个用户之间的相似度sim(x,y)>k时,其中k由业务方决定,即认为两者相似从而得到相似用户集,并根据基于用户的协同过滤思想,得到各个用户的可推荐结果集b。

进一步地,所述步骤s3的具体过程如下:

s301、根据可推荐结果集b,对物品的属性和特征值进行划分,设物品的属性向量为:

属性si的特征值向量为:

s302、通过各个属性的区分度向量和候选推荐集构造属性特征矩阵;

对用户a而言,感兴趣物品集qa中某一物品属性si的特征值vk在所占的比例为则在候选推荐集qt中,设该物品属性的特征值vk所占的权重:

另,当(i,k取任意可取值),则认为属性sx的区分度最强;各个属性的区分度取:

所以,当给出qa后,可得索性区分度向量:

得到qt后,可得物品的属性特征矩阵:

s303、根据属性特征矩阵和属性区分度向量,可以得到候选推荐集qt的各物品推荐分数向量:

s304、根据得到的推荐分数向量对可推荐结果集b的排序,确定初步推荐结果列表c。

进一步地,所述步骤s2中可推荐候选集a的人数如果不满足最低推荐人数要求,则向业务方请求扩大搜索条件。

进一步地,所述用户的属性及特征值的定义的方式为【属性-值】键值对。

进一步地,用户的初始属性由用户在注册时填写,推荐引擎可以根据用户填写的属性值,为初始用户进行特征划分。

本发明相对于现有技术具有如下的优点及效果:

相比于传统的基于人口统计学和基于内容的推荐方法相比,本发明借鉴协同过滤思想和基于内容的推荐思想,更为注重了用户之间的个体差异性,通过分析用户的历史行为数据,挖掘用户的兴趣进行推荐;因此,推荐结果因人而异,更多的考虑了用户的个人喜好,也可以针对不同的推荐场景定制不同的方法参数。

附图说明

图1是本发明中公开的基于协同过滤的通用物品推荐方法的流程图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

实施例

如附图1所示,本实施例公开了一种基于协调过滤的通用物品推荐方法,该通用物品推荐方法借鉴协同过滤思想和基于内容的推荐思想,设计一套通用物品的推荐引擎。其中,通用物品包括但不限于:书籍、音乐、电影,不同的通用物品的区别在于,喜好度的衡量标准以及物品的属性特征差异可根据不同的推荐场景由业务方调整参数。

该通过物品推荐方法具体包括下列步骤:

s1、业务方对推荐物品及用户的属性及特征值进行初始化定义,定义的方式为【属性-值】键值对,例如【身高-170cm】;将用户的行为分类并设置初始搜索引擎的条件,完成初始化设定和推荐引擎apk接入后,向推荐引擎apk发起推荐请求,并将初始化的数据集发送给推荐引擎apk。

具体应用中,用户的初始属性由用户在注册时填写,推荐引擎可以根据用户填写的属性值,为初始用户进行特征划分。

s2、推荐引擎apk首先根据业务方的初始搜索引擎,将满足搜索条件的数据,汇总形成可推荐候选集a,对可推荐候选集a通过相似度判定得到相似用户集,并根据基于用户的协同过滤思想,进行数据筛选得到可推荐结果集b;如果可推荐候选集a的人数不满足最低推荐人数要求,则向业务方请求扩大搜索条件。

其中,所述进行数据筛选得到可推荐结果集b的具体过程如下:

s201、将用户的行为分为t1~tk共k类,并对这k类行为分别进行权重赋值w1~wk,根据不同的用户行为区分为正面、负面以及高、中、低六个维度,赋值向量w的取值为w=【-2,-1,0,1,2,3】;

具体应用中,根据用户在线上的行为数据,定义不同行为的特征。

s202、获取用户对物品的行为操作累加值得到用户对物品的喜好度h=∑w,当h>3时,则认为用户对该物品感兴趣;

s203、通过不同用户对各个物品的喜好度h,利用欧几里得距离

计算得到用户之间的相似度:

当两个用户之间的相似度sim(x,y)>k时,其中k由业务方决定,即认为两者相似从而得到相似用户集,并根据基于用户的协同过滤思想,得到各个用户的可推荐结果集b。

s3、将可推荐结果集b根据物品的属性,对属性的特征值进行划分,根据用户的感兴趣集中各个特征值所占的比例,得到可推荐结果集b的用户中每个属性特征值所占的权重,并根据各个最显著的特征集去得到用户感知最敏感的属性,根据感知最敏感的属性的不同参考权重,将用户的感兴趣集进行排序,得到初步推荐列表c。

该步骤具体过程如下:

s301、根据可推荐结果集b,对物品的属性和特征值进行划分,设物品的属性向量为:

属性si的特征值向量为:

s302、通过各个属性的区分度向量和候选推荐集构造属性特征矩阵;

对用户a而言,候选推荐集qt中某一物品属性si的特征值vk在所占的比例为则在候选推荐集qt中,设该物品属性的特征值vk所占的权重:

另,当(i,k取任意可取值)

则认为属性sx的区分度最强;各个属性的区分度取:

所以,当给出qa后,可得索性区分度向量:

得到qt后,可得物品的属性特征矩阵:

s303、根据属性特征矩阵和属性区分度向量,可以得到候选推荐集qt的各物品推荐分数向量:

s304、根据得到的推荐分数向量对可推荐结果集b的排序,确定初步推荐结果列表c。

s4、将初步推荐结果列表c发送给业务方,业务方根据需求进行适当重排,最后得到推荐结果列表d,即为最终结果。

综上所述,本发明借鉴协同过滤思想和基于内容的推荐思想,注重用户之间的个体差异性,通过分析用户的历史行为数据,挖掘用户的兴趣进行推荐;因此,推荐结果因人而异,更多的考虑了用户的个人喜好,也可以针对不同的推荐场景定制不同的方法参数。

上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1