基于用户偏好的内容推荐方法和服务器的制造方法

文档序号:6541323阅读:119来源:国知局
基于用户偏好的内容推荐方法和服务器的制造方法
【专利摘要】本发明提供了一种基于用户偏好的内容推荐方法和服务器。该方法包括:(a)基于所述用户的历史偏好信息,计算所述用户的偏好指数向量;(b)基于所述偏好指数向量,从待选推荐列表中选出要推荐的内容项,以构成最终推荐列表;以及(c)向所述用户提供所述最终推荐列表。
【专利说明】基于用户偏好的内容推荐方法和服务器
【技术领域】
[0001]本发明涉及内容推荐领域,更具体地涉及基于用户偏好的内容推荐方法和服务器。
【背景技术】
[0002]近年来,随着智能手机、平板电脑等移动终端的普及,移动互联网已经成为我们在生产、生活中不可或缺的一部分。移动终端已经不再只是一个基本通讯和信息传递的终端,而是成为了人们随身携带的娱乐应用终端。这一变化,催生了巨大的移动应用市场产业,人们在日常的学习、工作、休息时大量的使用移动终端上的各种应用(例如,app)。例如,在学习时可以通过教育类app来获得各种知识;在工作时可以通过例如金融类app获得各种重要的金融信息、新闻等或通过地图类应用获得定位/导航功能等;在休息时可以通过媒体类app欣赏电影、电视剧、音乐、图书等。
[0003]与此同时,移动终端也改变了用户的消费方式、消费习惯和消费行为。PC用户和移动终端用户在采购他们服务的时候在时间上是有显著区别的:移动终端上的消费者普遍比较没有耐心,总是希望立刻就可以找到他们想要的东西,而PC用户则相对更有耐心,愿意花时间去搜索或等待更价廉物美的商品和/或服务。
[0004]这方面的典型例子是82%的利用移动终端预定酒店房间的用户是在24小时以内决定并完成的。这几乎就相当于用户到了目的地就用手机来订酒店。与在电脑上预定酒店房间的用户相比,这些用户花的时间要短的多。移动终端用户的这种“冲动性购买”、“即时性购买”行为,其实是对传统互联网相对慢条斯理的商务模式的一种颠覆。针对这种新的变化,企业需要在极短的时间内帮助用户找到他们可能感兴趣的商品并进行推荐,以占领移动营销的先机。因此就需要一种根据已有的数据(例如,销售数据)来预测用户可能关注的商品/服务的内容推荐系统。
[0005]在现有的内容推荐方案中,协同过滤算法是重要的内容推荐算法之一。GroupLens在1994年提出了基于用户的协同过滤(简称为CF-U,即Collaborative FilteringUser-based)算法。该算法是最早得到应用的协同过滤算法,其主要分为三个步骤:
[0006]I)数据表述。通常首先获得一个mXn的用户-项目评分矩阵R,m行代表用户数,η列代表项目数,矩阵元素I'm表示用户i对项目j的评分值;
[0007]2)根据用户-项目评分矩阵来计算用户的相似度,按照相似度从大到小为当前用户求得一个最近邻集合N ;以及
[0008]3)产生推荐数据集。针对当前用户获得了 k最近邻后,可以基于这k个邻居对任意项目的评分,来预测当前用户对该项目的评分。然后根据预测评分的高低,从所有预测了评分的项目中选择一个或多个项目作为最后的推荐结果。
[0009]在该过程中,为了要得到与当前用户评分最相似的k近邻,必须计算用户之间的相似度。传统的相似性度量方法一般为余弦相似性。用户评分被当成η维空间向量。如果用户对项目没有进行评分,则用户对该项目的评分设为O。用户a和b之间的相似度通过它们评分向量间的余弦夹角度量来如下给出:
【权利要求】
1.一种基于用户偏好的内容推荐方法,包括: (a)基于所述用户的历史偏好信息,计算所述用户的偏好指数向量; (b)基于所述偏好指数向量,从待选推荐列表中选出要推荐的内容项,以构成最终推荐列表;以及 (C)向所述用户提供所述最终推荐列表。
2.根据权利要求1所述的方法,其中,所述历史偏好信息是通过统计预定时间段内所述用户下载的内容项来得到的。
3.根据权利要求2所述的方法,其中,所述预定时间段是I个月。
4.根据权利要求3所述的方法,其中,步骤(a)还包括: (al)将统计出的用户下载的内容项分成一个或多个类别; (a2)针对所述一个或多个类别中的每个类别,计算用户下载的内容项中属于该类别的内容项的数目与用户下载的内容项的总数的比值;以及 (a3)根据所述一个或多个类别中的所有类别的相应比值,构成所述用户在所述预定时间段内的偏好指数向量。
5.根据权利要求4所述的方法,其中,所述一个或多个类别包括以下至少一项:音频、视频、图书、主题、游戏、以及工具软件。`
6.根据权利要求1所述的方法,其中,所述待选推荐列表是通过推荐算法针对所述用户生成的,以及所述推荐算法是以下至少一项: 基于内容的推荐; 基于协同过滤的推荐; 基于关联规则的推荐; 基于效用的推荐; 基于知识的推荐;以及 上述各项的任意组合。
7.根据权利要求6所述的方法,其中,所述基于协同过滤的推荐包括以下至少一项: 基于用户的协同过滤推荐(CF-U); 基于项目的协同过滤推荐(CF-1); 基于模型的协同过滤推荐(CF-M);以及 以上各项的任意组合。
8.根据权利要求1所述的方法,其中,步骤(b)包括: (bl)根据所述待选推荐列表中各个内容项的类别,将所述待选推荐列表分为一个或多个分类子列表; (b2)基于所述偏好指数向量,从相应分类子列表中选出排名靠前的内容项,以填入所述最终推荐列表;以及 (b3)基于所述待选推荐列表中未被选择的内容项,调整所述最终推荐列表。
9.根据权利要求8所述的方法,其中,步骤(b2)包括: (b21)基于所述偏好指数向量中与各个类别相对应的偏好指数以及所述最终推荐列表的长度,计算在所述最终推荐列表中每个类别所占的预期数目;以及 (b22)针对每个类别,从相应分类子列表中选出相应预期数目的排名靠前的内容项,以填入所述最终推荐列表。
10.根据权利要求9所述的方法,其中,步骤(b22)中的选择是以下两种方式之一: 每次在一个分类子列表中选出一个当前排名第一的内容项,并针对所有分类子列表循环进行,其中,跳过已被选空的分类子列表和被选择内容项的数目达到相应预期数目的分类子列表;或者 在每个分类子列表中一次性选出相应预期数目的内容项,其中,如果分类子列表中的内容项的数目小于相应预期数目,则将该分类子列表中的所有内容项全部选出。
11.根据权利要求9所述的方法,其中,步骤(b3)包括: (b31)如果所述分类子列表中内容项的数目小于相应的预期数目,从所述待选推荐列表中未被选择的剩余内容项中选择排名靠前的内容项,以将所述最终推荐列表补全; (b32)判断所述待选推荐列表中未被选择的剩余内容项中排名第一的内容项的评分与所述最终推荐列表中排名最后的内容项的评分之间的差值是否大于预定阈值,如果大于所述预定阈值,则交换这二者并重复步骤(b32)直到所述待选推荐列表中未被选择的剩余内容项中排名第一的内容项的评分与所述最终推荐列表中排名最后的内容项的评分之间的差值小于等于所述预定阈值,以得到所述最终推荐列表。
12.根据权利要求1所述的方法,其中,所述最终推荐列表中的内容项是按内容项的打分顺序由高至低排列的。
13.根据权利要 求1所述的方法,其中,所述内容项至少包括以下各项信息:内容名称、内容类型、以及内容打分。
14.一种基于用户偏好的内容推荐服务器,包括: 偏好指数计算单元,用于基于所述用户的历史偏好信息,计算所述用户的偏好指数向量; 推荐内容选择单元,用于基于所述偏好指数向量,从待选推荐列表中选出要推荐的内容项,以构成最终推荐列表;以及 推荐列表提供单元,用于向所述用户提供所述最终推荐列表。
15.根据权利要求14所述的服务器,其中,所述历史偏好信息是通过统计预定时间段内所述用户下载的内容项来得到的。
16.根据权利要求15所述的服务器,其中,所述预定时间段是I个月。
17.根据权利要求16所述的服务器,其中,所述偏好指数计算单元还用于: (al)将统计出的用户下载的内容项分成一个或多个类别; (a2)针对所述一个或多个类别中的每个类别,计算用户下载的内容项中属于该类别的内容项的数目与用户下载的内容项的总数的比值;以及 (a3)根据所述一个或多个类别中的所有类别的相应比值,构成所述用户在所述预定时间段内的偏好指数向量。
18.根据权利要求17所述的服务器,其中,所述一个或多个类别包括以下至少一项:音频、视频、图书、主题、游戏、以及工具软件。
19.根据权利要求14所述的服务器,其中,所述待选推荐列表是通过推荐算法针对所述用户生成的,以及所述推荐算法是以下至少一项: 基于内容的推荐;基于协同过滤的推荐; 基于关联规则的推荐; 基于效用的推荐; 基于知识的推荐;以及 上述各项的任意组合。
20.根据权利要求19所述的服务器,其中,所述基于协同过滤的推荐包括以下至少一项: 基于用户的协同过滤推荐(CF-U); 基于项目的协同过滤推荐(CF-1); 基于模型的协同过滤推荐(CF-M);以及 以上各项的任意组合。
21.根据权利要求14所述的服务器,其中,所述推荐内容选择单元还用于: (bl)根据所述待 选推荐列表中各个内容项的类别,将所述待选推荐列表分为一个或多个分类子列表; (b2)基于所述偏好指数向量,从相应分类子列表中选出排名靠前的内容项,以填入所述最终推荐列表;以及 (b3)基于所述待选推荐列表中未被选择的内容项,调整所述最终推荐列表。
22.根据权利要求21所述的服务器,其中,所述推荐内容选择单元还用于: (b21)基于所述偏好指数向量中与各个类别相对应的偏好指数以及所述最终推荐列表的长度,计算在所述最终推荐列表中每个类别所占的预期数目;以及 (b22)针对每个类别,从相应分类子列表中选出相应预期数目的排名靠前的内容项,以填入所述最终推荐列表。
23.根据权利要求22所述的方法,其中,所述推荐内容选择单元从分类子列表中进行选择是以下两种方式之一: 每次在一个分类子列表中选出一个当前排名第一的内容项,并针对所有分类子列表循环进行,其中,跳过已被选空的分类子列表和被选择内容项的数目达到相应预期数目的分类子列表;或者 在每个分类子列表中一次性选出相应预期数目的内容项,其中,如果分类子列表中的内容项的数目小于相应预期数目,则将该分类子列表中的所有内容项全部选出。
24.根据权利要求22所述的服务器,其中,所述推荐内容选择单元还用于: (b31)如果所述分类子列表中内容项的数目小于相应的预期数目,从所述待选推荐列表中未被选择的剩余内容项中选择排名靠前的内容项,以将所述最终推荐列表补全; (b32)判断所述待选推荐列表中未被选择的剩余内容项中排名第一的内容项的评分与所述最终推荐列表中排名最后的内容项的评分之间的差值是否大于预定阈值,如果大于所述预定阈值,则交换这二者并重复步骤(b32)直到所述待选推荐列表中未被选择的剩余内容项中排名第一的内容项的评分与所述最终推荐列表中排名最后的内容项的评分之间的差值小于等于所述预定阈值,以得到所述最终推荐列表。
25.根据权利要求14所述的服务器,其中,所述最终推荐列表中的内容项是按内容项的打分顺序由高至低排列的。
26.根据权利要求14所述的服务器,其中,所述内容项至少包括以下各项信息:内容名称、内容类型、以及内容打分。`
【文档编号】G06F17/30GK103823908SQ201410108119
【公开日】2014年5月28日 申请日期:2014年3月21日 优先权日:2014年3月21日
【发明者】王如章 申请人:北京飞流九天科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1