在社交网络服务网站中计算用户距离的方法和设备的制作方法

文档序号:7888728阅读:134来源:国知局

专利名称::在社交网络服务网站中计算用户距离的方法和设备的制作方法
技术领域
:本发明的实施方式总体上涉及网络信息
技术领域
,更具体地,涉及在社交网络服务网站中计算用户距离的方法和设备。
背景技术
:社交网络服务(SNS)网站已经发展为一种重要的网络服务平台。通过SNS网站,用户可以与其他人进行多种形式的交流和互动,完成各种各样的操作。SNS网站是向对特定对象感兴趣或只是一起“闲逛”的人们提供虚拟社区的web站点。在注册和登录之后,社交网络的成员可以通过语音、聊天、即时消息、视频会议和博客等进行通信。社交网络通常向成员提供了联系其他成员的方法。社交网络还可以用作亲自会面的媒介。当一个人向SNS网站进行了注册并且可能还通过了相关认认证之后,他/她称为该SNS网站的“用户”或“成员”。在SNS网站中,不同的用户之间可以建立连接或关联关系,这种关联关系在SNS网站中通常被称为“好友关系”或简称“好友”。由于SNS网站中的连接通常是双向的(但这不是必须的),因此术语“好友”可能依赖于参照系。而且,用户之间的连接可以是直接连接;但是用户之间的一级或者多级间接连接也是允许的。可以理解,SNS网站中的“好友”并非必须要求用户在现实生活中实际上是朋友,它仅仅表示SNS网站中的关系。根据用户之间的好友关系,可以计算不同用户在SNS网站中的“距离”。对于SNS网站中的用户A和用户B,二者之间的距离是指从用户A出发,沿具有好友连接的其他用户达到用户B所需的最小连接数目或者跳数。作为示例,参考图1A,图100A表示SNS网站中的用户连接关系,顶点A和B分别对应于SNS网站中的用户A和用户B。假设用户A和B在SNS网站中具有好友关系,则顶点A与B之间的跳数为1,即两个用户之间的距离为I。又如,参见图1B,图100B同样表示SNS网站中的用户关系。从图1B中可见,用户A与B之间没有直接的好友连接关系。此时,从用户A出发沿好友连接到达B的路径包括{A,C,B},{A,C,D,E,B},{A,D,E,B},{A,D,C,B},其中最短路径为{A,C,B}。因此,用户A与B之间的好友跳数为2(即,从A到C,再从C到B),二者之间的距离为2。在SNS网站中,任意给出两个用户,快速、准确地确定他们之间的距离是有益的。这例如可以用于好友推荐、用户群组划分、提供个性化服务等等多个方面。现有技术中,通常根据图(graph)来计算用户之间的距离。具体而言,可以将SNS网站中的每个用户作为顶点,如果两个用户之间具有直接好友关系(即,距离为I),则对应的两个顶点之间存在边。以此方式,可以利用一个无向图来代表SNS网站中的用户关系。此后,为了计算任何给定用户之间的距离,只需计算图中对应顶点的距离即可。这通常是通过对图执行广度优先搜索(BFS)实现的。这种方法对于数据规模较小的情况比较方便有效,但是难以处理用户数量众多的大规模SNS网站。例如,中大规模的SNS网站通常拥有数百万、数千万乃至数以亿计的用户,并且用户之间具有复杂的相互关系。在这种情况下,利用图的BFS确定用户距离在计算复杂性、响应时间、资源成本等方面都是很高的,甚至是不可行的。可以理解,一方面,如果计算并且存储所有用户之间的距离,在计算复杂性以及存储资源上都会给系统造成巨大压力。另一方面,如果实时地根据图的BFS来计算用户之间的距离,则很难满足实时响应的要求。因此,本领域需要一种在SNS网站中更为有效、快速地计算用户距离的技术方案。
发明内容鉴于以上问题,本发明提出一种在社交网络服务网站中计算用户距离的方法和设备。在本发明的一个方面,提供一种在社交网络服务SNS网站中计算用户距离的方法,所述SNS网站包括多个用户。所述方法包括:将所述多个用户中的每个用户映射到坐标空间中的点,使得所述多个用户中任意两个用户在所述SNS网站中的距离与对应点在所述坐标空间中的距离成比例;以及响应于计算所述多个用户中的两个用户之间距离的请求,通过计算所述两个用户在所述坐标空间中的对应点之间的距离,来计算所述两个用户之间的距离。在本发明的另一方面,提供一种在社交网络服务SNS网站中计算用户距离的设备,所述SNS网站包括多个用户,所述设备包括:映射装置,配置用于将所述多个用户中的每个用户映射到坐标空间中的点,使得所述多个用户中任意两个用户在所述SNS网站中的距离与对应点在所述坐标空间中的距离成比例;以及计算装置,配置用于响应于计算所述多个用户中的两个用户之间距离的请求,通过计算所述两个用户在所述坐标空间中的对应点之间的距离,来计算所述两个用户之间的距离。根据本发明的实施方式,SNS网站中的用户距离不再单纯地依赖对图的BSF完成。与现有技术不同,每个用户被映射至一个特定坐标空间中的点,该映射确保任意两个用户在SNS网站中的距离与其对应点在该坐标空间中的距离成比例(例如,相等)。这样,无需存储每个用户之间的距离,而是仅存储用户以及与之对应的点的坐标。随后,可以通过计算坐标空间中的点的距离而快速地计算任何SNS网站用户之间的距离。本领域技术人员可以理解,计算坐标空间中的两个点之间的距离在算法复杂性、响应时间以及资源成本等方面均明显优于图的BSF操作。而且,根据本发明的某些实施方式,上述映射可以采用基于标志用户的策略来实现,从而进一步提高效率、降低算法复杂性。通过参考附图阅读下文的详细描述,本发明实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本发明的若干实施方式,其中:图1A和图1B示出了利用图来表示SNS网站中的用户关系的示例;图2示出了根据本发明一个示例性实施方式的在SNS网站中计算用户距离的方法200的流程图;图3示出了根据本发明另一示例性实施方式的在SNS网站中计算用户距离的方法300的流程图4示出了根据本发明一个示例性实施方式的在SNS网站中计算用户距离的设备400的框图;以及图5示出了适合用来实践本发明实施方式的计算机系统500的框图。在各个附图中,相同或对应的标号表示相同或对应的部分。具体实施例方式下面将参考附图中示出的若干示例性实施方式来描述本发明的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本发明,而并非以任何方式限制本发明的范围。本发明的总体思路是,将SNS网站中的用户映射到一个给定的坐标空间中,使得点之间的距离反映或者至少近似反映用户之间的距离(好友跳数)。这样,即使是将所有用户映射到空间中,也只需计算一次用户之间的距离。这些距离被用于完成映射而无需存储。此后,便可以通过简单地计算点之间的距离来获得任意用户之间的距离,而无需进行复杂的BFS等操作。而且,根据本发明的优选实施方式,无需将所有用户都直接映射到坐标空间中,而只需要映射某些用户即可,其他用户的映射可以通过更为简单的方式完成。以此方式,计算复杂性可以进一步降低。图1A和图1B示出了以图来表示SNS网站中的用户关系的示意图,已在上文描述。现在参考图2,其示出了根据本发明一个示例性实施方式的在SNS网站中计算用户距离的方法200的流程图。应当理解,图2中所示的方法200的步骤仅仅是出于说明之目的。方法200可以包括附加的和/或备选的步骤。方法200开始之后,在步骤S202,将SNS网站中所考虑的多个用户中的每个用户映射到坐标空间中的点,使得多个用户中任意两个用户在SNS网站中的距离与对应点在所述坐标空间中的距离成比例。根据本发明的实施方式,在步骤S202所考虑的多个用户可以是SNS网站的全部用户,也可以是其一部分。另外,根据本发明的实施方式,在步骤S202,可以将用户映射到任何适当的坐标空间中。例如,坐标空间可以是黎曼空间或称常曲率空间。特别地,在某些实施方式中,黎曼空间可以是二维或三维欧式空间。备选地,根据另一些实施方式,目标坐标空间可以是非欧空间,例如球面空间或者双曲空间,等等。其他任何适当的目标坐标空间也是可能的。除其他特性之外,步骤S202处所执行的映射所具有的重要特性在于,其确保任意两个用户在SNS网站中的距离(B卩,好友跳数)与对应的点在坐标空间中的距离成比例,并且比例的数值是已知的或者可获得的。特别地,步骤S202处执行的映射可以是保距映射,即,使得用户在SNS网站中的距离与对应点在坐标空间中的距离相等。例如,如果两个用户在SNS网站中的距离为3,则使得对应的两个点在坐标空间中的距离(例如,欧几里得距离)也是3或者近似为3。在此方面,任何目前已知或者将来开发的保距映射均可与本发明的实施方式结合使用。根据本发明的实施方式,映射过程可以视为在目标坐标空间中构建一个适当的曲面,使得与用户对应的点处于该曲面上(在误差范围内),并且任意两个点之间的距离与对应用户在SNS网站中的好友跳数成比例。这是一个曲面拟合问题,因此任何目前已知或将来开发的适当多维曲面拟合算法均可与本发明的实施方式结合使用。例如,可以将用户在SNS网站中的距离(例如,通过图的BSF操作获得)作为已知量,将点在坐标空间中的坐标作为未知量,通过求解多维参数优化问题来实现上述拟合曲面的构建,从而完成映射。作为示例,可以采用DownhillSimplex算法求解这样的多维参数优化问题。关于DownhillSimplex算法的详细内容,可参见如下文献:Nelder,J.A.,andMead,R.Asimplexmethodforfunctionminimization.TheComputerJournal,7,4(Jan.1965),308-313。其他方法也是可行的,诸如Quas1-Newton方法、共轭梯度算法、BoxConstraints优化方法、模拟退火算法等,本发明的范围在此方面不受限制。此外,如本领域已知的,上述这些多维优化算法可能存在一定的误差。映射的容差可由用户设置,并且是可以优化和更新的。特别地,在步骤S202处,可以通过例如求解多维参数优化问题将所考虑的所有用户映射到坐标空间中。备选地,也可以仅从这些用户中选择某些具有代表性的用户执行映射。而后,其他用户向坐标空间中点的映射可以根据他们与代表性用户之间的关系,而直接在坐标空间中简单地确定。这还将在下文参考图3详述。注意,在步骤S202的映射完成之后,只需要记录与每个用户对应的点的坐标,而无需记录每两个用户之间的距离。这种存储例如可以通过数据库、结构化文件、文本文件等各种适当的结构来实现。作为示例,可以通过表(table)结构来存储用户与其对应点的信息,如下所示。这节省了存储空间。权利要求1.一种在社交网络服务SNS网站中计算用户距离的方法,所述SNS网站包括多个用户,所述方法包括:将所述多个用户中的每个用户映射到坐标空间中的点,使得所述多个用户中任意两个用户在所述SNS网站中的距离与对应点在所述坐标空间中的距离成比例;以及响应于计算所述多个用户中的两个用户之间距离的请求,通过计算所述两个用户在所述坐标空间中的对应点之间的距离来计算所述两个用户之间的距离。2.根据权利要求1所述的方法,其中将所述多个用户中的每个用户映射到坐标空间中的点包括:选择所述多个好友中的多个标志用户,每个标志用户在所述SNS网站中的好友数目超过预定阈值;将每个标志用户映射至所述坐标空间的点,使得任意两个标志用户在所述SNS网站中的距离等于对应点之间的距离;以及根据除所述多个标志用户之外的每个用户与所述多个标志用户在所述SNS网站中的距离,在所述坐标空间中确定与所述每个用户对应的点。3.根据权利要求2所述的方法,其中选择所述多个好友中的多个标志用户包括:选择所述多个标志用户使得任意两个标志用户在所述SNS网站中的距离至少为2。4.根据权利要求2所述的方法,其中选择所述多个好友中的多个标志用户包括:从所述多个用户中随机选择所述标志用户。5.根据权利要求1所述的方法,其中将所述多个用户中的每个用户映射到坐标空间中的点包括:通过求解多维参数优化问题实现所述映射。6.根据权利要求5所述的方法,其中通过求解多维参数优化问题实现所述映射包括:利用DownhillSimplex算法求解所述多维参数优化问题。7.根据权利要求1所述的方法,其中所述坐标空间是非欧几里得空间。8.一种在社交网络服务SNS网站中计算用户距离的设备,所述SNS网站包括多个用户,所述设备包括:映射装置,配置用于将所述多个用户中的每个用户映射到坐标空间中的点,使得所述多个用户中任意两个用户在所述SNS网站中的距离与对应点在所述坐标空间中的距离成比例;以及计算装置,配置用于响应于计算所述多个用户中的两个用户之间距离的请求,通过计算所述两个用户在所述坐标空间中的对应点之间的距离,来计算所述两个用户之间的距离。9.根据权利要求8所述的设备,其中所述映射装置包括:选择装置,配置用于选择所述多个好友中的多个标志用户,每个标志用户在所述SNS网站中的好友数目超过预定阈值;第一映射装置,配置用于将每个标志用户映射至所述坐标空间的点,使得任意两个标志用户在所述SNS网站中的距离等于对应点之间的距离;以及第二映射装置,配置用于根据除所述多个标志用户之外的每个用户与所述多个标志用户在所述SNS网站中的距离,在所述坐标空间中确定与所述每个用户对应的点。10.根据权利要求9所述的设备,其中所述选择装置包括:第一选择装置,配置用于选择所述多个标志用户使得任意两个标志用户在所述SNS网站中的距离至少为2。11.根据权利要求9所述的设备,其中所述选择装置包括:第二选择装置,配置用于从所述多个用户中随机选择所述标志用户。12.根据权利要求8所述的设备,其中所述映射装置包括:求解装置,配置用于通过求解多维参数优化问题实现所述映射。13.根据权利要求12所述的设备,其中所述求解装置包括:第一求解装置,配置用于利用DownhillSimplex算法求解所述多维参数优化问题。14.根据权利要求8所述的设备,其中所述坐标空间是非欧几里得空间。全文摘要本发明的实施方式涉及在社交网络服务网站中计算用户距离的方法和设备。公开了一种在社交网络服务SNS网站中计算用户距离的方法,该SNS网站包括多个用户,该方法包括将该多个用户中的每个用户映射到坐标空间中的点,使得该多个用户中任意两个用户在该SNS网站中的距离与对应点在该坐标空间中的距离成比例;以及响应于计算该多个用户中的两个用户之间距离的请求,通过计算该两个用户在该坐标空间中的对应点之间的距离,来计算该两个用户之间的距离。还公开了相应的设备。根据本发明的实施方式,可以更为快速、高效地计算SNS网站中的用户距离。文档编号H04L29/08GK103220315SQ20121002515公开日2013年7月24日申请日期2012年1月19日优先权日2012年1月19日发明者赵小菡,王潇,高婷婷申请人:北京千橡网景科技发展有限公司,加州大学圣塔芭芭拉分校
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1