一种基于协同过滤的rss信息推荐方法

文档序号:7722548阅读:200来源:国知局
专利名称:一种基于协同过滤的rss信息推荐方法
技术领域
本发明涉及一种信息推荐方法,具体涉及一种基于协同过滤的RSS信息推荐方 法。 目前互联网中的RSS信息推荐方法,只能推荐整条信息源,不能针对单篇文章进 行个性化推荐。例如谷歌阅读器,抓虾网、鲜果网等的在线RSS阅读器均不能完成同好用 户的单篇文章个性化推荐。如专利号为200510022721. 3、发明名称为《一种基于XML文件 的RSS信息交互处理方法》的专利即属于此列。 这样会导致使用者得到的推荐文章泛滥,不能得到精准的使用者喜好的单篇文
化早。 本发明解决的技术问题是提供一种既能荐整条信息源,又能针对同好用户的单 篇文章进行个性化推荐。 本发明基于以下假设有相同或类似订阅习惯的用户,其相互推荐的信息更具价 值;最相似的同好用户推荐的信息比次相似同好用户的推荐更具价值。通过分析用户的习 惯,找到每个用户的同好用户群,以及该用户群的订阅集。通过加权每个同好用户的收藏文 章,以推荐该用户最有可能喜欢的文章,从而达到个性化的推荐效果。
为达到上述目标,本发明采用如下的技术方案
—种基于协同过滤的RSS信息推荐方法,步骤如下 1)用户从大量RSS源集中订阅某些RSS源时,服务器行为记录模块获取登录的用 户信息,查询会话表获得用户唯一身份标识u,连同该RSS信息源在系统中的唯一标识r,形 成用户对RSS源的订阅情况Wu,r,更新至行为处理模块的用户-RSS源订阅矩阵W(m,n)之 中,m为系统中的用户数目,n为RSS源的数目,订阅情况Wu, r的值当订阅时为1 ,未订阅时
为O; 2)行为处理模块从用户-RSS源订阅矩阵W(m,n)中获取订阅情况Wu,r,利用余弦 相关性算法计算两用户之间的相似度sim(ip,i,),其中ip,i,分别为p、q两名用户;并将相 似度更新至用户相似度方阵sim(m,m)中,余弦相关算法的公式为 3)行为处理模块根据用户相似度方阵sim(m,m)推算出与每个用户有相似订阅习 惯的"同好"用户,并将该用户所有"同好"用户订阅的所有RSS源形成同好用户订阅集,再 按相似度由高到低排列,形成对该用户的推荐加权系数f ;
背景技术

发明内容
3
4)用户从一个RSS源的文章列表中收藏某篇文章时,服务器行为记录模块获取登 录的用户信息,查询会话表获得用户唯一身份标识u,连同该篇文章在系统中的唯一标识 rt,形成用户对文章的收藏情况Cu,rt,更新至行为处理模块的同好收藏矩阵C(a,b)之中, a为某用户的同好用户数目,b为同好用户订阅集中所有文章的数目; 5)行为处理模块针对同好收藏矩阵C(a, b)中单篇文章的所有同好用户行为,做
推荐加权处理,按推荐优先级形成推荐文章集,并将推荐文章集更新至推荐模块; 6)在用户获取文章推荐时,推荐模块实时地从推荐文章集筛选出目标用户可能会
感兴趣的TopN条内容推荐给用户。 上述RSS是在线共享内容的一种简易方式(也称聚合内容,Really SimpleSyndication)。通常在时效性比较强的内容上使用RSS订阅能更快速获取信息,网 站提供RSS输出,有利于让用户获取网站内容的最新更新。 上述RSS源是一种描述和同步网站内容的格式,是目前使用最广泛的XML应用。发 布一个RSS文件后,这个RSS Feed中包含的信息就能直接被其他站点调用,而且由于这些 数据都是标准的XML格式,所以也能在其他的终端和服务中使用。
上述余弦相关性算法为信息推荐领域内公知的通用算法。 —种用于上述方法的RSS阅读系统,由阅读模块、订阅模块、订阅管理模块、行为 记录模块、行为处理模块和推荐模块组成,其特征在于阅读模块分别和订阅模块、订阅管理 模块、行为记录模块及推荐模块相连接;行为处理模块分别和行为记录模块及推荐模块相 连接;订阅模块和订阅管理模块相互连接,模块之间通过由编程实现的控制语句,共享一个 或多个服务器数据库的数据。
本发明有以下有益效果 1.相比起传统的RSS推荐方法,本发明使其推荐效果不仅仅局限于整个RSS信息 源的推荐,更加突出了信息源中单篇文章的推荐,有效避免了信息冗余和过载;
2.相比起传统的基于用户的信息推荐技术,本发明结合了基于项的推荐方式,使 其推荐效果有一定的差异覆盖面,便于用户发现可能感兴趣的新内容; 3.相比传统的基于项的信息推荐技术,本发明引入了同好用户群,并利用同好用 户加权因子,使推荐内容更加精准可信。


图1是本发明阅读系统的结构示意图。 其中1、阅读模块,2、订阅模块,3、订阅管理模块,4、行为记录模块,5、推荐模块, 6、行为处理模块。 图2是本发明方法的流程图,其中7-12为其中的各个步骤。
具体实施例方式
下面结合附图和实施例对本发明做进一步说明,但不限于此。
实施例1 : —种基于协同过滤的RSS信息推荐方法,如图2所示,步骤如下 7、用户从大量RSS源集中订阅某些RSS源时,服务器行为记录模块获取登录的用户信息,查询会话表获得用户唯一身份标识u,连同该RSS信息源在系统中的唯一标识r,形 成用户对RSS源的订阅情况Wu,r,更新至行为处理模块的用户-RSS源订阅矩阵W(m,n)之 中,m为系统中的用户数目,n为RSS源的数目,订阅情况Wu, r的值当订阅时为1 ,未订阅时
为O; 8、行为处理模块从用户-RSS源订阅矩阵W(m,n)中获取订阅情况Wu, r,利用余弦 相关性算法计算两用户之间的相似度sim(ip,i,),其中ip,i,分别为p、q两名用户;并将相 似度更新至用户相似度方阵sim(m,m)中,余弦相关算法的公式为 9、行为处理模块根据用户相似度方阵sim(m, m)推算出与每个用户有相似订阅习 惯的"同好"用户,并将该用户所有"同好"用户订阅的所有RSS源形成同好用户订阅集,再 按相似度由高到低排列,形成对该用户的推荐加权系数f ; 10、用户从一个RSS源的文章列表中收藏某篇文章时,服务器行为记录模块获取 登录的用户信息,查询会话表获得用户唯一身份标识u,连同该篇文章在系统中的唯一标识 rt,形成用户对文章的收藏情况Cu,rt,更新至行为处理模块的同好收藏矩阵C(a,b)之中, a为某用户的同好用户数目,b为同好用户订阅集中所有文章的数目; 11、行为处理模块针对同好收藏矩阵C(a, b)中单篇文章的所有同好用户行为,做
推荐加权处理,按推荐优先级形成推荐文章集,并将推荐文章集更新至推荐模块; 12、在用户获取文章推荐时,推荐模块实时地从推荐文章集筛选出目标用户可能
会感兴趣的TopN条内容推荐给用户。 实施例2 : —种用于上述方法的RSS阅读系统,如图1所示,由阅读模块1、订阅模块2、订阅 管理模块3、行为记录模块4、行为处理模块6和推荐模块5组成,其特征在于阅读模块1分 别和订阅模块2、订阅管理模块3、行为记录模块4及推荐模块5相连接;行为处理模块6分 别和行为记录模块4及推荐模块5相连接;订阅模块2和订阅管理模块3相互连接,模块之 间通过由编程实现的控制语句,共享一个或多个服务器数据库的数据。
权利要求
一种基于协同过滤的RSS信息推荐方法,步骤如下1)用户从大量RSS源集中订阅某些RSS源时,服务器行为记录模块获取登录的用户信息,查询会话表获得用户唯一身份标识u,连同该RSS信息源在系统中的唯一标识r,形成用户对RSS源的订阅情况Wu,r,更新至行为处理模块的用户-RSS源订阅矩阵W(m,n)之中,m为系统中的用户数目,n为RSS源的数目,订阅情况Wu,r的值当订阅时为1,未订阅时为0;2)行为处理模块从用户-RSS源订阅矩阵W(m,n)中获取订阅情况Wu,r,利用余弦相关性算法计算两用户之间的相似度sim(ip,iq),其中ip,iq分别为p、q两名用户;并将相似度更新至用户相似度方阵sim(m,m)中,余弦相关算法的公式为 <mrow><mi>sim</mi><mrow> <mo>(</mo> <msub><mi>i</mi><mi>p</mi> </msub> <mo>,</mo> <msub><mi>i</mi><mi>q</mi> </msub> <mo>)</mo></mrow><mo>=</mo><mi>cos</mi><mrow> <mo>(</mo> <msub><mi>i</mi><mi>p</mi> </msub> <mo>,</mo> <msub><mi>i</mi><mi>q</mi> </msub> <mo>)</mo></mrow><mo>=</mo><mfrac> <mrow><munderover> <mi>&Sigma;</mi> <mrow><mi>k</mi><mo>=</mo><mn>1</mn> </mrow> <mi>n</mi></munderover><msub> <mi>W</mi> <mrow><mi>p</mi><mo>,</mo><mi>k</mi> </mrow></msub><mo>&times;</mo><msub> <mi>W</mi> <mrow><mi>q</mi><mo>,</mo><mi>k</mi> </mrow></msub> </mrow> <msqrt><munderover> <mi>&Sigma;</mi> <mrow><mi>k</mi><mo>=</mo><mn>1</mn> </mrow> <mi>n</mi></munderover><msup> <mrow><mo>(</mo><msub> <mi>W</mi> <mrow><mi>p</mi><mo>,</mo><mi>k</mi> </mrow></msub><mo>)</mo> </mrow> <mn>2</mn></msup><mo>&times;</mo><munderover> <mi>&Sigma;</mi> <mrow><mi>k</mi><mo>=</mo><mn>1</mn> </mrow> <mi>n</mi></munderover><msup> <mrow><mo>(</mo><msub> <mi>W</mi> <mrow><mi>q</mi><mo>,</mo><mi>k</mi> </mrow></msub><mo>)</mo> </mrow> <mn>2</mn></msup> </msqrt></mfrac> </mrow>3)行为处理模块根据用户相似度方阵sim(m,m)推算出与每个用户有相似订阅习惯的“同好”用户,并将该用户所有“同好”用户订阅的所有RSS源形成同好用户订阅集,再按相似度由高到低排列,形成对该用户的推荐加权系数f;4)用户从一个RSS源的文章列表中收藏某篇文章时,服务器行为记录模块获取登录的用户信息,查询会话表获得用户唯一身份标识u,连同该篇文章在系统中的唯一标识rt,形成用户对文章的收藏情况Cu,rt,更新至行为处理模块的同好收藏矩阵C(a,b)之中,a为某用户的同好用户数目,b为同好用户订阅集中所有文章的数目;5)行为处理模块针对同好收藏矩阵C(a,b)中单篇文章的所有同好用户行为,做推荐加权处理,按推荐优先级形成推荐文章集,并将推荐文章集更新至推荐模块;6)在用户获取文章推荐时,推荐模块实时地从推荐文章集筛选出目标用户可能会感兴趣的TopN条内容推荐给用户。
2. —种用于权利要求1所述方法的RSS阅读系统,由阅读模块、订阅模块、订阅管理模 块、行为记录模块、行为处理模块和推荐模块组成,其特征在于阅读模块分别和订阅模块、 订阅管理模块、行为记录模块及推荐模块相连接;行为处理模块分别和行为记录模块及推 荐模块相连接;订阅模块和订阅管理模块相互连接,模块之间通过由编程实现的控制语句, 共享一个或多个服务器数据库的数据。
全文摘要
一种基于协同过滤的RSS信息推荐方法,属信息推荐技术领域,系统由阅读模块、订阅模块、订阅管理模块、行为记录模块、行为处理模块和推荐模块组成,其中阅读模块分别和订阅模块、订阅管理模块、行为记录模块及推荐模块相连接;行为处理模块分别和行为记录模块及推荐模块相连接;订阅模块和订阅管理模块相互连接,模块之间通过由编程实现的控制语句,共享一个或多个服务器数据库的数据。本发明使其推荐效果不仅限于整个RSS信息源的推荐,更加突出了单篇文章的推荐,有效避免了信息冗余和过载;推荐效果有一定的差异覆盖面,便于用户发现可能感兴趣的新内容;引入了同好用户群,并利用同好用户加权因子,使推荐内容更加精准可信。
文档编号H04L29/06GK101753573SQ20091025645
公开日2010年6月23日 申请日期2009年12月25日 优先权日2009年12月25日
发明者徐超, 林贺, 王恒, 石祚夫, 袁东风, 陈飞, 颜廷芝, 魏斌 申请人:山东大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1