一种基于近邻关系的微博系统朋友推荐方法

文档序号:9420234阅读:408来源:国知局
一种基于近邻关系的微博系统朋友推荐方法
【专利说明】-种基于近邻关系的微博系统朋友推荐方法
[0001] 本发明得到国家自然科学基金化1103227, 61272526)的资助。
技术领域
[0002] 本发明设及利用微博兴趣挖掘增进Internet用户之间的在线社交互动,特别是 设及一种基于近邻关系的全新微博系统朋友推荐方法。
【背景技术】
[0003]微博系统(micro-bloggingsystems),尤其是Twitter和Weibo,在当今得到了巨 大的发展。截至到2013年Twitter拥有超过1. 4亿的活跃用户每天发布超过3. 4亿条消 息。Weibo也积聚了超过4亿的用户,每秒钟发布的微博消息高达1000条。用户发布的海 量微博内容展示了社交媒体平台下的大数据环境。不仅如此,微博系统(例如Twitter和 Weibo)还呈现出强大的媒体特性,为微博用户提供了推荐和添加新朋友、传播突发新闻、信 息共享等强大而便捷的功能。
[0004] 微博系统最基本的功能之一是增进Internet用户之间的在线社交互动。作为增 进用户在线交流的主要途径之一,朋友推荐(化iendrecommendation)成为近年来的研究 热点。例如,Moricz等提出具有共同朋友的用户可能彼此相识并据此设计推荐算法,只把具 有高度相关性的用户相互推荐。有文献利用链接预测如基于"朋友的朋友"运一策略向某一 用户推荐另一个用户。Deng等把基于用户熟人(如亲人、朋友等)的网络系统进行推荐与 基于用户之间的相似程度进行推荐运两种推荐策略进行了对比。有些文献则推荐Twitter 用户利用协同过滤算法进行相互关注。然而,上述研究工作在进行朋友推荐时没有考虑用 户所发微博内容之间的潜在联系,使用户难W在海量信息中精确获得自己真正感兴趣的资 源。
[0005] 事实上,成千上万微博用户所发布的海量微博内容为获取用户的信息提供了机遇 和挑战。如果把微博用户当成"社会传感器",我们就能够尽可能的收集他们的微博页面信 息巧日所发微博,关注,粉丝等),并把收集的信息形成数据集,通过对数据集进行分析和挖 掘来理解微博用户的行为。其中一部分研究工作提出根据分析获取的用户兴趣特征来提高 朋友推荐的准确性。如Zuo等发现具有类似兴趣的人更容易彼此联系交流。有文献表明兴 趣相似的用户之间的接触频率远远高于兴趣不同的用户。化en等研究网络用户之间的推荐 关系,W帮助用户发现已知的接触和社会网站上的新朋友。服U等则提出基于协作推荐的方 法。该方法使用社会网络的链接结构并利用相互表明兴趣的内容推荐来解决微博客和类似 社会网络中众多链接之间的相互推荐问题。上述基于兴趣的推荐策略看似促进了用户的在 线交流,然而事实上兴趣匹配用户之间的联系频率仍然较低。
[0006] 此外,尽管近年来很多研究工作致力于基于社交媒体用户潜在兴趣的应用,然而 大多数运些研究忽略了用户位置和兴趣之间潜在的紧密关系。事实上,用户近期发布的微 博(Tweet)往往能够反映出所发布者近期的兴趣或行为。假设两个兴趣相似的微博用户当 前正好位于同一活动场所并且彼此可见,那么相比于彼此不可见的虚拟用户,他们更愿意 建立相互之间的联系与交流。例如用户"Bob"喜欢旅游,而且"Bob"发现用户"AliCe"目 前就在自己附近且也非常爱好旅游。由于两人就在各自周围,他们在彼此视线范围内发现 对方的可能性就非常大。如果"Bob"进一步发现"Alice"就坐在自己不远处且正是自己喜 欢的类型,他就很可能会与"Alice"交流并乐意在今后继续和她保持联系。然而现有相关 工作均不能直接应用于上述任务,因为它们均没有考虑把微博用户的位置和兴趣相关联。
[0007] 为此,本发明提出了基于近邻的朋友推荐(nei曲borbasedfriend recommendation,NBFR)运一全新思想,使位于同一场所的兴趣相似用户之间相互发现。由 于现实世界中位于同一场所的用户在彼此视线范围内发现对方的可能性很大,通过把同一 场所内兴趣爱好相似的微博用户相互推荐,为社交媒体用户提供了与周围可能感兴趣的人 进行联系的有效途径。随着在线社交网络的迅速发展,如今越来越多的人既是虚拟在线社 交媒体的用户又是现实社会的成员,而NBFR不仅考虑了微博用户的兴趣,同时还考虑微博 用户当前所在的物理位置。通过把在线用户的兴趣与位置相结合,NBFR也架起了虚拟世界 和现实世界联系的桥梁。将来NBFR不仅能够作为APP运行在智能手机上,还能开发成微博 系统的一项基本功能W增强微博的可用性。NBFR的基本思想主要包括两大部分:首先根据 用户所发海量微博来挖掘用户的兴趣,生成用户主题兴趣矩阵。其次,根据各个用户的主题 兴趣向量来衡量用户的兴趣相似度。
[0008] 为了对用户的主题兴趣向量进行精确匹配,本发明提出利用超立方体的方法来描 述不同用户的不同兴趣主题:即把描述用户兴趣分布的不同主题映射到超立方体空间中, 每一主题对应于超立方体每一顶点的一个坐标分量。考虑到通常用户仅对一小部分主题感 兴趣,我们愿意建立二进制超立方体而不是普通的超立方体来描述各个用户的兴趣主题, 因为前者更能准确的描述用户兴趣的相似程度。此外,提出主题匹配的捷径算法(topic matchingshort州talgorithm)W进一步提高推荐的准确性。

【发明内容】

[0009] 为实现上述目的,本发明公开了如下的技术内容: 一种基于近邻关系的微博系统朋友推荐方法,其特征在于: (1) 通过把在线用户的位置与兴趣相结合,建立用户线上和线下相联系的桥; (2) 利用词袋和矩阵分解方法从微博内容中挖掘用户的兴趣; (3) 通过超立方体来衡量各个微博用户的兴趣相似性; (4) 利用超立方体结构,提出主题匹配的捷径算法W进一步提高兴趣推荐的准确性; 其中: 步骤(1)中建立用户线上和线下相联系的桥,指的是使位于同一地理场所相互视线范 围内兴趣匹配的微博用户之间相互推荐,为社交媒体用户提供与自身周围可能感兴趣的人 建立联系和沟通的独特途径,即通过把兴趣和位置相结合,使在线用户能够增进线下的联 系和交流。为此,首先要通过用户移动设备上的短距离无线通信装置,来完成微博用户的线 下邻居发现和探测,然后使位于同一场所相互视线范围内的兴趣相似用户之间相互发现和 彼此推荐; 步骤(2)利用词袋和矩阵分解方法从海量微博中挖掘用户的兴趣,指的是采用词袋和 矩阵分解方法得到反映用户潜在主题兴趣分布的用户兴趣矩阵,该矩阵的每一行表示邻居 组内一个用户的主题兴趣向量;最后对主题兴趣向量进行变化,用概率的形式表示用户对 潜在主题的喜好程度。
[0010] 步骤(3)通过超立方体来衡量微博用户的兴趣相似性,指的是把描述用户兴趣分 布的不同主题映射到超立方体空间,每一主题对应于超立方体每一顶点的一个坐标分量, 分别建立主题超立方体和二进制超立方体结构,并根据两种超立方体的特性提出不同的匹 配算法进行邻居组中微博用户的兴趣匹配过程; 步骤(4)提出主题匹配的捷径算法,指的是利用邻居组中存在的线下朋友关系来进一 步改善兴趣推荐的性能,首先分析微博用户的两种在线关注关系的特点,接着利用"双向关 注"来生成"捷径",并根据捷径进行进一步的兴趣推荐。
[0011] 本发明步骤(1)所述的邻居探测包括:蓝牙或WifiDirect。步骤(2)所述的词 袋和矩阵分解分别指:挖掘的用户近期所发微博内容通过分词和去停留词操作形成词袋模 型;根据矩阵分解对项目进行评分预测的原理进行用户潜在兴趣挖掘。用户兴趣分析指的 是挖掘微博用户的潜在兴趣,形成用户主题兴趣向量。匹配和推荐指的是主题超立方体及 二进制超立方体中的兴趣匹配算法,W及基于捷径的兴趣推荐算法。
[0012] 本发明公开的基于近邻的朋友推荐(nei曲borbasedfriendrecommendation, NBFR)与现有技术相比所具有的积极效果在于: (1)本发明公开了一种基于近邻关系的全新微博系统朋友推荐方法。主要是把在线用 户的当前位置与兴趣相结合,通过把用户视线范围内兴趣爱好相似的微博用户推荐给源用 户,为社交媒体用户提供与自身视线范围内可能感兴趣的人进行联系的独特渠道。为此,首 先为源用户建立邻居组,然后利用词袋和矩阵分解方法从微博内容中挖掘用户的兴趣;再 根据超立方体特征提出匹配算法来衡量各个微博用户的兴趣相似性;最后提出主题匹配的 捷径算法W进一步提高兴趣推荐的准确性。可W对用户所在场所自身一定范围内的兴趣匹 配用户进行精确推荐,提高在线用户之间联系频率的目的。
[0013] (2)提高用户在Internet海量信息中获取自己真正感兴趣信息资源的概率。
[0014] (3)作为微博系统的一项功能改善微博的可用性。
[0015] 本发明重点解决了现在的在线用户难W在
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1