群组推荐方法和系统的制作方法

文档序号:6582800阅读:142来源:国知局
专利名称:群组推荐方法和系统的制作方法
技术领域
本发明涉及一种信息处理技术领域,尤其涉及一种群组推荐方法和系统。
背景技术
随着恥132. 0技术的发展,SNS (Social Networking krvices社会性网络服务)在 网络用户的生活中扮演的角色越来越重要。在这些SNS网络上,用户常常有寻找共性群体 的内在需求。例如,论文网络上的用户常常迫切地需要与他人探讨某篇文章或某个领域中 的问题,电影网络上的用户在看过某部电影后可能有需求与他人交流对该部电影的看法, 读书网络上的用户也常常需要类似的交流。通常,用户通过建立主题群组来寻找共性群体。建立主题群组的过程如下首先某 个用户(群主)发起建立群组的请求并将群组主题概括为群组名称,然后他在他所知的用 户里面选择符合群组要求的用户并向他们发出入群邀请,每个加入了该群的用户自动具备 邀请他人加入的权限。不过,这种办法具有一定的局限性。首先,只有少部分人具有这种建群的能动性, 有些人即使意识到有需要建立某群组,也可能缺少驱动力使之付诸行动。其次,这样的群组 往往主题比较单一,比如学友群一般只谈论与张学友有关的内容,王菲群一般只谈论涉及 王菲的事件。而一个用户通常喜欢多个歌手,且用户的兴趣不只是音乐,还包括运动等等, 如果用户要为自己的每一个兴趣爱好加一个群或组建一个群,那么每个用户对应的群组将 会有许多个,这不利于用户在SNS网络上形成稳固的关系。而且,主题群组的主题单一性割 裂了用户各种兴趣爱好之间可能存在的潜在联系,不利于用户的使用体验。最后,推荐的 群组一般都是用户目前感兴趣的,难以根据用户的潜在兴趣以及兴趣变化推荐更合适的群 组。用户需要具有以下功能的群组能够稳定地在其中讨论任何他感兴趣的内容—— 这意味着该群组中的其他用户与他有着相似的兴趣爱好,在很多兴趣爱好上他们都保持一 致——只有这样,用户提出的带有主题交叉性质的议题才不至于被该群组其他用户反感或 非议,而更可能受到大家欢迎。这样的群组不像一般的主题群组,它没有明确的主题,但是 该群组中的用户在兴趣爱好上具有很强的共性,称这样的群组为共性群组。当前已有的群组推荐方案都是基于主题群组的。这种方案必须由用户创建群组, 然后系统平台提取该群组的特征,通过访问用户数据库与用户特征匹配,最后将该群组推 荐给最匹配的用户。具体过程为群主用户创建某个主题群组,并将其发布在系统平台上; 系统平台将该群组的相关属性特征传送到用户数据库,并与其中的用户进行特征匹配;用 户数据库将与该群组属性特征最匹配的一组用户发送到系统平台;系统平台将该群组整合 到这组用户的个人主页空间中作为推荐项。发明人在实现本发明的过程中发现上述方案需要用户自己创建群组,受用户能 动性影响;用户创建的群组主题往往由创建者决定,往往比较单一;系统推荐的群组过多 会增加用户的困扰,降低用户体验值;推荐的群组一般都是用户目前感兴趣的,难以根据用户未来的潜在兴趣以及兴趣变化推荐更合适的群组。

发明内容
本发明实施例提供一种群组推荐方法和系统,以在用户数据库中发现用户的共性 群组,和根据用户个人属性信息和个人行为历史向用户推荐最适合的共性群组。本发明实施例提供一种群组推荐方法,该方法包括根据用户特征发现并创建共 性群组;根据在所加入的共性群组中的活跃程度和用户与其他共性群组的匹配程度向用户 推荐共性群组。本发明实施例还提供一种群组推荐系统,该系统包括共性群组发现子系统,用于 根据用户特征发现并创建共性群组;共性群组推荐子系统,用于根据在所加入的共性群组 中的活跃程度和用户与其他共性群组的匹配程度向用户推荐共性群组。本发明实施例通过创建包容性更强的用户的共性群组,克服了一般群组主题比较 单一的缺陷;因为共性群组中的用户的偏好特征相似而具有更大的相容性,群组中的用户 将获得更好的情感体验;以及共性群组中的用户偏好特征相似而具有很强的趋同性,使得 在这样的群组中进行推荐将更具效率。


此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,并不 构成对本发明的限定。在附图中图1为本发明实施例一中群组推荐方法的流程图;图2为本发明实施例六中推荐算法的流程图;图3为本发明实施例七中群组更新算法的流程图;图4为本发明实施例八中群组推荐系统的结构示意图;图5为本发明实施例八中共性群组发现子系统的结构示意图;图6为本发明实施例八中共性群组推荐系统的结构示意图;图7为本发明实施例九中用户特征提取单元的结构示意图;图8为本发明实施例十中用户关系网络构建单元的结构示意图;图9为本发明实施例十一中用户共性群组发现单元的结构示意图;图10为本发明实施例十二中共性群组创建单元的结构示意图;图11为本发明实施例十三中共性群组管理子系统的结构示意图。
具体实施例方式为使本发明实施例的目的、技术方案和优点更加清楚明白,下面结合实施例和附 图,对本发明实施例做进一步详细说明。在此,本发明的示意性实施例及其说明用于解释本 发明,但并不作为对本发明的限定。在后面的描述中,本说明书中的“群组”特指“共性群 组”,“一般群组”等同于“主题群组”。实施例一本实施例提供一种群组推荐方法。如图1所示,该方法包括步骤SllO 根据用户特征发现并创建共性群组;
在该步骤中,要提取用户特征(包括用户基本特征,偏好特征)并计算用户偏好 特征的权重和建立用户特征描述文件以规范用户特征;根据提取的用户特征计算用户之间 的特征相似度,当超过相似度阈值时在用户对应的顶点之间连线从而构建用户关系网络; 在用户关系网络中进行社团挖掘,即计算社团相似度并依此找到最佳社团邻居对,根据合 并的Q值增益来确定是否合并该最佳社团邻居对,所述社团是用户关系网络中彼此交集为 空的顶点子集;根据社团挖掘的结果创建共性群组,记录群组用户信息,群组用户的活动信 息,群组用户共享的资源信息,群组中推荐内容的相关信息,以及群组宏观信息;该步骤还包括当所述群组活跃程度低于群组活跃程度阈值时,重新构建共性群 组。所述群组活跃程度为所有用户在群时间的总和与所有用户在线时间的总和之比,或者 所有用户在群活动的总和与所有用户在线活动的总和之比。步骤S120根据在所加入的共性群组中的活跃程度和用户与其他共性群组的匹配 程度向用户推荐共性群组。在该步骤中,需要衡量用户在所加入的共性群组中的用户活跃程度,具体为计算 用户在群时间与用户在线时间的比例或者用户在群活动与用户在线活动的比例;当所述用 户活跃程度低于用户活跃程度阈值时,在用户和其他共性群组之间进行特征匹配确定匹配 程度;将与用户匹配的且未超出推荐次数阈值的共性群组推荐给所述用户。本实施例通过用户的共性群组并根据用户与共性群组的匹配程度和在共性群组 中活跃程度对用户进行推荐,从而能实现更为有效的推荐。实施例二本实施例进一步详细描述了实施例一中提取并规范用户特征的技术手段。提取并规范用户特征具体包括首先,收集用户的特征信息;用户特征信息包括用户的个人属性信息(例如年龄、 学历、职业等等)、用户对自身兴趣爱好的描述(最爱看的书和电影、最爱听的音乐等等)和 用户个人的行为历史(例如用户曾浏览了哪些页面、对什么书或电影做了评论、网购了什 么商品等等)。然后,根据收集得到的用户信息计算用户偏好特征的权重。例如在一个电影社区 群组推荐中,用户X的偏好包含其对某种类型的电影、某个导演、某个演员以及某部的电影 的喜好程度,依次记录这四种偏好为W]、[3]、[2]、[1]。从用户χ注册时填写的兴趣爱好 信息中可以直接得到该用户的一些偏好,为Slx = {喜剧片[4],科幻片[4],战争片[4],史蒂夫·斯皮尔伯格[3],吴宇森[3],张艺谋[3],周星驰[2],周润发[2],Marlon· Brando [2]大话西游[1], SavingPrivateRyan [1],The GodFather [1]}其对应的权值为Rlx= {10,8,9,9,8,7,10,10,9,10,9,10}用户χ的行为信息不仅包含其对某些影片的偏好程度的明信息,还包含其对某些 导演、某些类型电影、某些演员的偏好程度的暗信息。以对导演的偏好程度为例子,介绍如 何提取这些暗信息对用户χ评分过的所有电影中出现的每个导演,做如下处理
若该导演在用户填写的兴趣爱好表中已被评分,说明用户χ对该导演的偏好程度 已经记录到Sx和Rx中,故不必再为此导演评分;否则在用户χ看过该导演的电影数超过num部(num为给定阈值)时,则计算用户 χ对该导演的所有电影的评分值的平均,作为用户Χ对该导演的偏好程度,填入Sx和民中;如果用户χ看过该导演的电影数没有超过num部,则不将用户χ对该导演的评分 作为一种偏好,因为个别电影不能反映其对该部电影的导演的偏好程度。最后,建立用户特征描述文件;用户描述文件格式可以采取表格的形式,以反映用户的基本信息、偏好信息和行 为信息,下面以电影推荐系统的用户描述文件为例说明。
权利要求
1.一种群组推荐方法,其特征在于,该方法包括 根据用户特征发现并创建共性群组;根据用户在所加入的共性群组中的活跃程度和用户与其他共性群组的匹配程度向用 户推荐共性群组。
2.根据权利要求1所述的方法,其特征在于,根据用户特征发现并创建共性群组的步 骤具体包括提取并规范用户特征,所述用户特征包括用户基本特征和偏好特征; 根据提取的用户特征构建用户关系网络;在用户关系网络中进行社团挖掘,所述社团是用户关系网络中彼此交集为空的顶点子集;根据社团挖掘的结果创建共性群组。
3.根据权利要求2所述的方法,其特征在于,提取并规范用户特征的步骤具体包括 收集用户的特征信息;计算用户偏好特征的权重; 建立用户特征描述文件。
4.根据权利要求2所述的方法,其特征在于,计算用户之间的特征相似度包括 计算用户基本特征的相似度;计算用户偏好特征的相似度;根据用户基本特征的相似度和用户偏好特征的相似度计算用户的特征相似度。
5.根据权利要求4所述的方法,其特征在于用户基本特征的相似度根据公式(1)计算得到,
6.根据权利要求2所述的方法,其特征在于,在用户关系网络中进行社团挖掘的步骤 具体包括计算所有有连线的社团之间的相似度,初始时以单个用户对应的顶点为社团; 根据所述社团相似度找到最佳社团邻居对;根据最佳社团邻居对合并的Q值增益来确定是否合并最佳社团邻居对。
7.根据权利要求6所述的方法,其特征在于,所述Q值增益根据公式(5)计算
8.根据权利要求2所述的方法,其特征在于,根据社团挖掘的结果创建共性群组的步 骤包括创建群组数据表;存储群组数据表中的相关信息,其中,所述群组数据表中的相关信息包括群组用户信 息,群组成员信息,群组特征信息,群组用户的活动信息,群组资源信息,群组推荐信息,以 及群组宏观信息。
9.根据权利要求8所述的方法,其特征在于所述群组宏观信息包括群组的用户数目、 主要特征和资源空间路径,其中群组主要特征根据群组成员的偏好特征在群组中的重要程 度确定,所述重要程度与所述偏好特征在所述群组中的相对频度和相对权重成正比;其中,偏好特征在群组中的频度根据公式(6)计算得到,
10.根据权利要求1所述的方法,其特征在于,根据用户在所加入的共性群组中的活跃 程度和用户与其他共性群组的匹配程度向用户推荐共性群组的步骤包括衡量用户在所加入的共性群组中的用户活跃程度;当所述用户活跃程度低于用户活跃程度阈值时,计算用户和其他共性群组之间的特征 匹配值并确定用户与所述其他共性群组之间的匹配程度;将与用户匹配且未超出推荐次数阈值的共性群组推荐给所述用户。
11.根据权利要求10所述的方法,其特征在于所述用户和其他共性群组之间的特征 匹配值计算采用公式(10)或公式(11),Μ = |FI η F2( Ο)M = |F1 η F2|/|F1 U F2(11)其中,用户的特征集合为Fl,共性群组的主要特征集合为F2,M为用户与共性群组的特 征匹配值。
12.—种群组推荐系统,其特征在于,该系统包括共性群组发现子系统,用于根据用户特征发现并创建共性群组;共性群组推荐子系统,用于根据在所加入的共性群组中的活跃程度和用户与其他共性 群组的匹配程度向用户推荐共性群组。
13.根据权利要求12所述的系统,其特征在于,所述共性群组发现子系统包括用户特征提取单元,用于提取并规范用户特征,所述用户特征包括用户基本特征,偏好 特征;用户关系网络构建单元,用于根据提取的用户特征构建用户关系网络;用户共性群组发现单元,用于在用户关系网络中进行社团挖掘,所述社团是用户关系 网络中彼此交集为空的顶点子集;共性群组创建单元,用于根据社团挖掘的结果创建共性群组。
14.根据权利要求13所述的系统,其特征在于,所述用户特征提取单元包括收集模块,用于收集用户的特征信息;计算模块,用于计算用户偏好特征的权重;建立模块,用于建立用户特征描述文件。
15.根据权利要求13所述的系统,其特征在于,所述用户关系网络构建单元包括 计算模块,用于计算用户之间的特征相似度;连线模块,用于当用户之间的特征相似度超过相似度阈值时,在用户对应的顶点之间 连线;其中特征相似度根据下式计算,sim(x,y) = a · siml(x,y)+b · sim2(x,y),其中 a+b = 1,siml (χ, y)为用户基本特征的相似度,sim2(x, y)为用户偏好特征的相似度,siml (x, y)根据下式计算,
16.根据权利要求13所述的系统,其特征在于,所述用户共性群组发现单元包括计算模块,用于计算所有有连线的社团之间的相似度,初始时以单个用户对应的顶点 为社团;确定模块,根据所述社团相似度找到最佳社团邻居对,并最佳社团邻居对合并的Q值 增益来确定是否合并最佳社团邻居对; 其中,所述Q值增益下式计算
17.根据权利要求13所述的系统,其特征在于,所述共性群组创建单元包括 数据表构建模块,用于构建群组数据表,所述群组数据表包括群组用户表,群组成员 表,群组用户活动日志表,群组资源表,群组推荐内容表和群组信息文件; 存储模块,用于存储上述群组数据表及相关信息;确定模块,用于根据群组成员的偏好特征在群组中的重要程度确定群组的主要特征, 所述重要程度与所述偏好特征在所述群组中的相对频度和相对权重成正比;计算单元,用于计算所述偏好特征在所述群组中的相对频度和相对权重;其中 偏好特征在群组中的相对频度根据下式计算,
18.根据权利要求12所述的系统,其特征在于,所述共性群组推荐子系统包括 活跃程度衡量单元,用于衡量用户在所加入的共性群组中的用户活跃程度; 特征匹配单元,用于当所述用户活跃程度低于用户活跃程度阈值时,计算用户和其他 共性群组之间的特征匹配值并确定用户与所述其他共性群组的匹配程度;推荐单元,用于将与用户匹配且未超出推荐次数阈值的共性群组推荐给所述用户。
全文摘要
本发明提供一种群组推荐方法和系统。该方法包括根据用户特征发现并创建共性群组;根据用户在所加入的共性群组中的活跃程度和用户与其他共性群组的匹配程度向用户推荐共性群组。该系统包括共性群组发现子系统,用于根据用户特征发现并创建共性群组;共性群组推荐子系统,用于根据用户在所加入的共性群组中的活跃程度和用户与其他共性群组的匹配程度向用户推荐共性群组。本发明实施例通过用户的共性群组并根据用户与共性群组的匹配程度和在共性群组中活跃程度对用户进行推荐,从而能实现更为有效的推荐。
文档编号G06F17/30GK102044009SQ200910207130
公开日2011年5月4日 申请日期2009年10月23日 优先权日2009年10月23日
发明者刘淇, 向彪, 杜家春, 陈恩红, 高建煌 申请人:中国科学技术大学, 华为技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1