确定用户的影响力排序的方法与装置制造方法

文档序号:7807309阅读:169来源:国知局
确定用户的影响力排序的方法与装置制造方法
【专利摘要】本发明的实施例提供了一种确定用户的影响力的方法和装置。该方法包括:获取第一信息和第二信息,第一信息用于指示社交网络中的N个用户的相互关注关系,第二信息用于指示N个用户中各用户发布的消息数,以及各用户发布的消息的主题;根据第一信息和第二信息,确定目标主题对应的N维权重向量;获取第三信息,第三信息用于指示N个用户中具有消息转发关系的用户之间转发消息的数量和转发消息的主题;根据第三信息,确定目标主题对应的转移概率矩阵;根据转移概率矩阵和权值向量,利用佩奇排序算法确定在社交网络中,N个用户在目标主题领域的影响力的排序。由于反映了社交网络中用户之间实际的相关度,因此有效地提高了影响力排序结果的准确性。
【专利说明】确定用户的影响力排序的方法与装置

【技术领域】
[0001] 本发明涉及计算机网络领域,并尤其涉及一种确定用户的影响力排序的方法和装 置。

【背景技术】
[0002] 随着高速无线网络的普及,网络媒体在社会信息传播和商业领域扮演着越来越重 要的角色。比如综合信息门户网站和社交网络已逐步取代传统媒体成为信息传播的最重要 平台,这些网络信息和社交平台上影响力较大的网站和用户在事件的传播中更是起到推动 的作用。
[0003] 从错综复杂以及用户庞大的关系网络中找到起重要影响的网络节点(例如可以 是网站,手机用户,微博或微信用户,运营商网关等)是产品推广或信息传播监控的关键。 因此找出有影响力的网络节点并进行影响力排名是企业进行产品推广或信息传播监控的 一种有效的方法。
[0004] PageRank(佩奇排序)算法是网络节点影响力排名的通用算法,它最先由Google 提出。佩奇排序算法定义了随机冲浪者模型,即想象网络中存在着许多随机冲浪者,它们从 某个网络节点(例如,网页)出发,按照转移概率矩阵在网络节点间游走,那么随机冲浪者 的位置概率分布即代表了网页的重要性。
[0005] 佩奇排序算法有原始版本和面向主题的佩奇排序(Topic Sensitive PageRank) 版本。其中,面向主题的佩奇排序算法可应用于社交网络中,用于确定社交网络中各用户在 某一目标主题的影响力。该算法采用如下公式迭代得到各用户的影响力排序:
[0006] Pi+i = βΜΡ?+(1-β )es/ | S |
[0007] 其中,pi+1和Pi分别表示在第i+1次和第i次迭代计算时,各用户的佩奇排序值 组成的向量,该向量的维度η表示待排序的用户的个数;β为介于0至1之间的转移常 数,通常取值〇. 15 ;Μ为转移概率矩阵,是基于用户之间的相互关注关系建立的;公式中 es/丨S丨为权重向量,其中,S为目标主题相关的节点的集合,es向量中各元素的值取决于 该元素对应的用户是否属于集合S,如果是,取1,否则,取0。
[0008] 但是,在社交网络中,上述面向主题的佩奇排序算法存在以下缺点:权重向量的选 择简单的用〇或1,即相关或不相关表示,而实际中,与目标主题相关的用户之间也存在相 关程度的不同,上述权值向量的表达不够准确。此外,转移概率矩阵中各元素仅通过用户之 间的关注关系确定。不能反映出实际的社交关系中,从而使影响力排序结果的准确性较低。


【发明内容】

[0009] 本发明的实施例提供了一种确定用户的影响力的方法和装置,能够有效地提高影 响力排序结果的准确性。
[0010] 第一方面,提供了一种方法,该方法包括:获取第一信息和第二信息,第一信息用 于指示社交网络中的N个用户的相互关注关系,第二信息用于指示N个用户中各用户发布 的消息数,以及各用户发布的消息的主题;根据第一信息和第二信息,确定目标主题对应的 N维权重向量,权重向量中的第i元素是基于第一比重和第二比重确定的,其中,第一比重 为:第i用户发布的消息中,关于目标主题的消息所占的比重,第二比重为:第i用户关注 的用户中,发布的消息包含关于目标主题的消息的用户所占的比重,i为1至N中的任意整 数;获取第三信息,第三信息用于指示N个用户中具有消息转发关系的用户之间转发消息 的数量和转发消息的主题;根据第三信息,确定目标主题对应的转移概率矩阵,转移概率矩 阵的第(j,k)元素是基于:第k用户被第j用户转发的,关于目标主题的消息的数量,第j 用户对应的转发关联用户的数量,以及转发关联用户发布的关于目标主题的消息的数量之 间的大小关系确定的,其中,转发关联用户为N个用户中,发布的消息被第j用户转发过的 用户,j、k均为1至N中的任意整数;根据转移概率矩阵和权值向量,利用佩奇排序算法确 定在社交网络中,N个用户在目标主题领域的影响力的排序。
[0011] 结合第一方面,在第一方面的第一种可能的实现方式中,权重向量中的第i元素 是通过以下公式确定的A = x(a/b) + (l-x) (c/d),其中,&是权重向量中的第i元素;X为 预先设定的实数,且〇 < X < 1 ;a为第i用户发布的关于目标主题的消息的数量;b为第i 用户发布的消息总数;c为第i用户关注的用户中,发布的消息包含关于目标主题的消息的 用户的数量;d为第i用户关注的用户总数。
[0012] 结合第一方面或第一方面的第一种可能的实现方式,在第一方面的第二种可能 的实现方式中,转移概率矩阵的第(j,k)元素是通过以下公式确定的:B jk = max(e,l)/ max(f,g),其中,Bjk为转移概率矩阵的第(j,k)元素;e为第k用户被第j用户转发的,关 于目标主题的消息的数量;f为转发关联用户发布的关于目标主题的消息的数量;g为第j 用户对应的转发关联用户的数量。
[0013] 结合第一方面、第一方面的第一种或第二种可能的实现方式,在第一方面的第三 种可能的实现方式中,根据转移概率矩阵和权值向量,利用佩奇排序算法确定N个用户的 影响力的排序,包括:根据转移概率矩阵和权值向量,对N个用户各自对应的佩奇排序值进 行第一次迭代,第一次迭代为迭代次数预先设定的有限次迭代;
[0014] 根据第一次迭代后,N个用户各自对应的佩奇排序值,将N个用户分为第一集合和 第二集合,其中,第二集合中的用户对应的佩奇排序值小于第一集合中的用户对应的佩奇 排序值;根据转移概率矩阵和权值向量,对N个用户各自对应的佩奇排序值进行第二次迭 代,在第二次迭代中,第一集合中的用户对应的佩奇排序值的迭代停止阈值小于第二集合 中的用户对应的佩奇排序值的迭代停止阈值;将第二次迭代后,N个用户各自对应的佩奇 排序值的大小排序确定为N个用户在目标主题领域的影响力的排序。
[0015] 第二方面,提供了一种方法,该方法包括:对N个网络节点各自对应的佩奇排序值 进行第一次迭代,第一次迭代为迭代次数预先设定的有限次迭代;根据第一次迭代后,N个 网络节点各自对应的佩奇排序值,将N个网络节点分为第一集合和第二集合,其中,第二集 合中的网络节点对应的佩奇排序值小于第一集合中的网络节点对应的佩奇排序值;对N个 网络节点各自对应的佩奇排序值进行第二次迭代,在第二次迭代中,第一集合中的网络节 点对应的佩奇排序值的迭代停止阈值小于第二集合中的网络节点对应的佩奇排序值的迭 代停止阈值;将第二次迭代后,N个网络节点各自对应的佩奇排序值的大小排序确定为N个 网络节点的影响力的排序。
[0016] 第三方面,提供了一种装置,该装置包括:第一获取模块,用于获取第一信息和第 二信息,第一信息用于指示社交网络中的N个用户的相互关注关系,第二信息用于指示N个 用户中各用户发布的消息数,以及各用户发布的消息的主题;第一确定模块,用于根据第一 获取模块获取的第一信息和第二信息,确定目标主题对应的N维权重向量,权重向量中的 第i元素是基于第一比重和第二比重确定的,其中,第一比重为:第i用户发布的消息中,关 于目标主题的消息所占的比重,第二比重为:第i用户关注的用户中,发布的消息包含关于 目标主题的消息的用户所占的比重,i为1至N中的任意整数;第二获取模块,用于获取第 三信息,第三信息用于指示N个用户中具有消息转发关系的用户之间转发消息的数量和转 发消息的主题;第二确定模块,用于根据第二获取模块获取的第三信息,确定目标主题对应 的转移概率矩阵,转移概率矩阵的第(j,k)元素是基于:第k用户被第j用户转发的,关于 目标主题的消息的数量,第j用户对应的转发关联用户的数量,以及转发关联用户发布的 关于目标主题的消息的数量之间的大小关系确定的,其中,转发关联用户为N个用户中,发 布的消息被第j用户转发过的用户,j、k均为1至N中的任意整数;第三确定模块,用于根 据转移概率矩阵和权值向量,利用佩奇排序算法确定在社交网络中,N个用户在目标主题领 域的影响力的排序。
[0017] 结合第三方面,在第三方面的第一种可能的实现方式中,权重向量中的第i元素 是通过以下公式确定的A = x(a/b) + (l-x) (c/d),其中,&是权重向量中的第i元素;X为 预先设定的实数,且〇 < X < 1 ;a为第i用户发布的关于目标主题的消息的数量;b为第i 用户发布的消息总数;c为第i用户关注的用户中,发布的消息包含关于目标主题的消息的 用户的数量;d为第i用户关注的用户总数。
[0018] 结合第三方面或第三方面的第一种可能的实现方式,在第三方面的第二种可能 的实现方式中,转移概率矩阵的第(j,k)元素是通过以下公式确定的:B jk = maX(e,l)/ max(f,g),其中,Bjk为转移概率矩阵的第(j,k)元素;e为第k用户被第j用户转发的,关 于目标主题的消息的数量;f为转发关联用户发布的关于目标主题的消息的数量;g为第j 用户对应的转发关联用户的数量。
[0019] 结合第三方面、第三方面的第一种或第二种可能的实现方式,在第三方面的第三 种可能的实现方式中,第三确定单元具体用于根据转移概率矩阵和权值向量,对N个用户 各自对应的佩奇排序值进行第一次迭代,第一次迭代为迭代次数预先设定的有限次迭代; 根据第一次迭代后,N个用户各自对应的佩奇排序值,将N个用户分为第一集合和第二集 合,其中,第二集合中的用户对应的佩奇排序值小于第一集合中的用户对应的佩奇排序值 的迭代停止阈值;根据转移概率矩阵和权值向量,对N个用户各自对应的佩奇排序值进行 第二次迭代,在第二次迭代中,第一集合中的用户对应的佩奇排序值的迭代停止阈值小于 第二集合中的用户对应的佩奇排序值的迭代停止阈值;将第二次迭代后,N个用户各自对 应的佩奇排序值的大小排序确定为N个用户在目标主题领域的影响力的排序。
[0020] 第四方面,提供了一种装置,该装置包括:第一迭代模块,对N个网络节点各自对 应的佩奇排序值进行第一次迭代,第一次迭代为迭代次数预先设定的有限次迭代;确定模 块,用于根据第一迭代模块得到的N个网络节点各自对应的佩奇排序值,将N个网络节点分 为第一集合和第二集合,其中,第二集合中的网络节点对应的佩奇排序值小于第一集合中 的网络节点对应的佩奇排序值;第二迭代模块,用于对第一迭代模块得到的N个网络节点 各自对应的佩奇排序值进行第二次迭代,在第二次迭代中,确定模块确定的第一集合中的 网络节点对应的佩奇排序值的迭代停止阈值小于第二集合中的网络节点对应的佩奇排序 值的迭代停止阈值;确定模块还用于将第二次迭代后,N个网络节点各自对应的佩奇排序 值的大小排序确定为N个网络节点的影响力的排序。
[0021] 本发明的实施例采用了基于用户之间实际的社交关系(例如转发关系、关注关系 以及目标主题)确定的转移概率矩阵和权重向量来进行影响力排序。由于用户之间的实际 的社交关系反映了社交网络中用户之间实际的相关度,因此有效地提高了影响力排序结果 的准确性。

【专利附图】

【附图说明】
[0022] 为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使 用的附图作简单地介绍,显而易见地,下面所描述的附图仅仅是本发明的一些实施例,对于 本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他 的附图。
[0023] 图1是根据本发明实施例的确定用户的影响力的方法的示意性流程图。
[0024] 图2是根据本发明另一实施例的确定用户的影响力的装置的示意性结构图。
[0025] 图3是根据本发明另一实施例的确定用户的影响力的方法的示意性流程图。
[0026] 图4是根据本发明又一实施例的确定用户的影响力的装置的示意性结构图。
[0027] 图5是根据本发明另一实施例的确定网络节点的影响力的方法的示意性流程图。
[0028] 图6是根据本发明另一实施例的确定网络节点的影响力的装置的示意性结构图。
[0029] 图7是根据本发明另一实施例的确定网络节点的影响力的方法的示意性流程图。
[0030] 图8是根据本发明另一实施例的确定网络节点的影响力的装置的示意性结构图。

【具体实施方式】
[0031] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完 整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发 明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实 施例,都应属于本发明保护的范围。
[0032] 图1是根据本发明实施例的确定用户的影响力的方法的示意性流程图。图1的方 法由确定用户的影响力的装置执行。图1的方法包括:
[0033] 110、获取第一信息和第二信息,第一信息用于指示社交网络中的N个用户的相互 关注关系,第二信息用于指示N个用户中各用户发布的消息数,以及各用户发布的消息的 主题;
[0034] 120、根据第一信息和第二信息,确定目标主题对应的N维权重向量,权重向量中 的第i元素是基于第一比重和第二比重确定的,其中,第一比重为:第i用户发布的消息中, 关于目标主题的消息所占的比重,第二比重为:第i用户关注的用户中,发布的消息包含关 于目标主题的消息的用户所占的比重,i为1至N中的任意整数;
[0035] 130、获取第三信息,第三信息用于指示N个用户中具有消息转发关系的用户之间 转发消息的数量和转发消息的主题;
[0036] 140、根据第三信息,确定目标主题对应的转移概率矩阵,转移概率矩阵的第(j,k) 元素是基于:第k用户被第j用户转发的,关于目标主题的消息的数量,第j用户对应的转 发关联用户的数量,以及转发关联用户发布的关于目标主题的消息的数量之间的大小关系 确定的,其中,转发关联用户为N个用户中,发布的消息被第j用户转发过的用户,j、k均为 1至N中的任意整数;
[0037] 150、根据转移概率矩阵和权值向量,利用佩奇排序算法确定在社交网络中,N个用 户在目标主题领域的影响力的排序。
[0038] 应理解,第二信息还可以指示各个用户发布的消息总数。各用户发布的消息的主 题可以是例如社会、教育、经济、军事、娱乐等中的一种或多种。
[0039] 本发明的实施例采用了基于用户之间实际的社交关系(例如转发关系、关注关系 以及目标主题)确定的转移概率矩阵和权重向量来进行影响力排序。由于用户之间的实际 的社交关系反映了社交网络中用户之间实际的相关度,因此有效地提高了影响力排序结果 的准确性。
[0040] 根据本发明的实施例,权重向量中的第i元素是通过以下公式确定的:Ai = x(a/ b) + (l_x) (c/d),其中,&是权重向量中的第i元素;x为预先设定的实数,且0彡x彡1 ;a 为第i用户发布的关于目标主题的消息的数量;b为第i用户发布的消息总数;c为第i用 户关注的用户中,发布的消息包含关于目标主题的消息的用户的数量;d为第i用户关注的 用户总数。
[0041] 应理解,确定权重向量中的元素也可以采用基于a/b和c/d确定的其他的公式。例 如进行简单的变形。
[0042] 根据本发明的实施例,转移概率矩阵的第(j,k)元素是通过以下公式确定的:Bjk =max(e, l)/max(f, g),其中,Bjk为转移概率矩阵的第(j,k)元素;e为第k用户被第j用 户转发的,关于目标主题的消息的数量;f为转发关联用户发布的关于目标主题的消息的 数量;g为第j用户对应的转发关联用户的数量。
[0043] 应理解,确定转移概率矩阵中的元素也可以采用基于e、f和g确定的其他的公式。
[0044] 根据本发明的实施例,根据转移概率矩阵和权值向量,利用佩奇排序算法确定N 个用户的影响力的排序,包括:根据转移概率矩阵和权值向量,对N个用户各自对应的佩奇 排序值进行第一次迭代,第一次迭代为迭代次数预先设定的有限次迭代;根据第一次迭代 后,N个用户各自对应的佩奇排序值,将N个用户分为第一集合和第二集合,其中,第二集合 中的用户对应的佩奇排序值小于第一集合中的用户对应的佩奇排序值;根据转移概率矩阵 和权值向量,对N个用户各自对应的佩奇排序值进行第二次迭代,在第二次迭代中,第一集 合中的用户对应的佩奇排序值的迭代停止阈值小于第二集合中的用户对应的佩奇排序值 的迭代停止阈值;将第二次迭代后,N个用户各自对应的佩奇排序值的大小排序确定为N个 用户在目标主题领域的影响力的排序。
[0045] 应理解,迭代次数预先设定的有限次迭代,可以是根据六度空间理论设定的迭代 次数,例如5次。也可以是其他的迭代次数,例如少于10次。换句话说,第一次迭代为迭代 次数预先设定的有限次迭代,以便于根据第一次的迭代结果的排序值进行影响力的初步排 序,并根据需要将第一集合的用户进行更加精确的排序。图1的方法还可以包括:在第一次 迭代中,对N个用户的佩奇排序值设定收敛停止阈值。根据第一次迭代后,N个用户各自对 应的佩奇排序值,将N个用户分为第一集合和第二集合,可以是,根据幂律分布规律确定两 个集合,例如第一次迭代后的佩奇排序值中,按照大小顺序,前20%的用户为第一集合,后 80%的用户为第二集合。也可以根据需要划分不同的集合。
[0046] 由于对第一集合设定的收敛停止阈值小于第二集合设定的收敛停止阈值,因此在 对影响力排序时,对第二集合进行了更少次的运算,从而减少了计算的开销。
[0047] 换句话说,社交网络数据具有小世界和大数据属性,用户节点的影响力排序值呈 幂律分布,即绝大部分节点的影响力值都很低,只有少部分节点的影响力很高。在实际的 节点影响力排名应用中,并不需要对所有节点进行排名,只需对少量影响力大的节点进行 排名。大部分影响力小的节点在递归计算5次后,就可以忽略这些节点的变化,不再需要计 算,从而大量节省计算时间。
[0048] 上面描述了根据本发明实施例的确定用户的影响力的方法,下面结合附图描述根 据本发明实施例的确定用户的影响力的装置。
[0049] 图2是根据本发明另一实施例的确定用户的影响力的装置的示意性结构图。图2 的装置200包括:第一获取模块210,用于获取第一信息和第二信息,第一信息用于指不社 交网络中的N个用户的相互关注关系,第二信息用于指示N个用户中各用户发布的消息数, 以及各用户发布的消息的主题;第一确定模块220,用于根据第一获取模块210获取的第一 信息和第二信息,确定目标主题对应的N维权重向量,权重向量中的第i元素是基于第一比 重和第二比重确定的,其中,第一比重为:第i用户发布的消息中,关于目标主题的消息所 占的比重,第二比重为:第i用户关注的用户中,发布的消息包含关于目标主题的消息的用 户所占的比重,i为1至N中的任意整数;第二获取模块230,用于获取第三信息,第三信息 用于指示N个用户中具有消息转发关系的用户之间转发消息的数量和转发消息的主题;第 二确定模块240,用于根据第二获取模块230获取的第三信息,确定目标主题对应的转移概 率矩阵,转移概率矩阵的第(j,k)元素是基于:第k用户被第j用户转发的,关于目标主题 的消息的数量,第j用户对应的转发关联用户的数量,以及转发关联用户发布的关于目标 主题的消息的数量之间的大小关系确定的,其中,转发关联用户为N个用户中,发布的消息 被第j用户转发过的用户,j、k均为1至N中的任意整数;第三确定模块250,用于根据转 移概率矩阵和权值向量,利用佩奇排序算法确定在社交网络中,N个用户在目标主题领域的 影响力的排序。
[0050] 本发明的实施例采用了基于用户之间实际的社交关系(例如转发关系、关注关系 以及目标主题)确定的转移概率矩阵和权重向量来进行影响力排序。由于用户之间的实际 的社交关系反映了社交网络中用户之间实际的相关度,因此有效地提高了影响力排序结果 的准确性。
[0051] 根据本发明的实施例,权重向量中的第i元素是通过以下公式确定的:Ai = x(a/ b) + (l_x) (c/d),其中,&是权重向量中的第i元素;x为预先设定的实数,且0彡x彡1 ;a 为第i用户发布的关于目标主题的消息的数量;b为第i用户发布的消息总数;c为第i用 户关注的用户中,发布的消息包含关于目标主题的消息的用户的数量;d为第i用户关注的 用户总数。
[0052] 根据本发明的实施例,转移概率矩阵的第(j,k)元素是通过以下公式确定的:Bjk =max(e, l)/max(f, g),其中,Bjk为转移概率矩阵的第(j,k)元素;e为第k用户被第j用 户转发的,关于目标主题的消息的数量;f为转发关联用户发布的关于目标主题的消息的 数量;g为第j用户对应的转发关联用户的数量。
[0053] 根据本发明的实施例,第三确定单元具体用于根据转移概率矩阵和权值向量,对N 个用户各自对应的佩奇排序值进行第一次迭代,第一次迭代为迭代次数预先设定的有限次 迭代;根据第一次迭代后,N个用户各自对应的佩奇排序值,将N个用户分为第一集合和第 二集合,其中,第二集合中的用户对应的佩奇排序值小于第一集合中的用户对应的佩奇排 序值的迭代停止阈值;根据转移概率矩阵和权值向量,对N个用户各自对应的佩奇排序值 进行第二次迭代,在第二次迭代中,第一集合中的用户对应的佩奇排序值的迭代停止阈值 小于第二集合中的用户对应的佩奇排序值的迭代停止阈值;将第二次迭代后,N个用户各 自对应的佩奇排序值的大小排序确定为N个用户在目标主题领域的影响力的排序。
[0054] 确定用户的影响力的装置200的各个模块的操作和功能可以参考上述图1的方 法,为了避免重复,在此不再赘述。下面结合具体例子,更加详细地描述本发明的实施例。
[0055] 图3是根据本发明另一实施例的确定用户的影响力的方法的示意性流程图。图3 的方法是图1的方法的例子。本实施例中的集合Z中的用户对应图1的实施例中的第二集 合中的用户,集合Y中不属于集合Z中的用户对应图1的实施例中的第一集合中的用户;第 一阈值对应第一集合中的用户对应的佩奇排序值的迭代停止阈值,第二阈值对应第一集合 中的用户对应的佩奇排序值的迭代停止阈值。第一排序值用于排序值向量的初始化,其中 每个用户的第一排序值为排序值向量的元素;第二排序值向量对应第一次迭代后N个用户 各自对应的佩奇排序值构成的向量。具体的实现方式如下。
[0056] 310、设定迭代次数。
[0057] 例如基于六度空间理论,将迭代次数设定为5,换句话说,节点说影响力的传递最 多不超过5次就可以到达所有的节点。
[0058] 320、对所有用户的佩奇排序值赋值。
[0059] 具体地,对所有的用户设定相同的第一排序值,例如将多有用户赋值为1。
[0060] 330、设定第一阈值。
[0061] 该第一阈值用于与用户的影响力排序值的波动比较,影响力排序值的波动定义为 R = | pk-pk+1 | /pk。
[0062] 340、根据设定的迭代次数进行计算,并根据第一阈值确定部分用户的影响力排序 值。
[0063] 例如,可以采用公式 3. l:pk+1 = βΒΡ--+(1-β)Α (3. 1)
[0064] 其中,Β为社会类主题的转移概率矩阵,该矩阵为ΝΧΝ矩阵;Α为社会类主题的权 重向量,该向量为对应N个用户的N维向量;β为常数,例如可以为0. 15 ;pk和pk+1分别为 用户的排序值经过第k次和第k+Ι次迭代后的排序值向量,该向量为对应N个用户的N维 向量。权重向量A中的第i元素是通过以下公式确定的A = x(a/b) + (l-x) (c/d),其中, A是权重向量中的第i元素;x为预先设定的实数,且0 < x < 1 ;a为第i用户发布的关于 目标主题的消息的数量;b为第i用户发布的消息总数;c为第i用户关注的用户中,发布的 消息包含关于目标主题的消息的用户的数量;d为第i用户关注的用户总数。转移概率矩 阵B的第(j,k)元素是通过以下公式确定的:B jk = max(e, l)/max(f, g),其中,Bjk为转移 概率矩阵的第(j,k)元素;e为第k用户被第j用户转发的,关于目标主题的消息的数量; f为转发关联用户发布的关于目标主题的消息的数量;g为第j用户对应的转发关联用户的 数量。
[0065] 具体而言,利用转移概率矩阵B和主题的权重向量A对用户的第一排序值向量进 行迭代计算,并在每次迭代计算后计算每个用户的排序值的波动值R。将该波动值R与第一 阈值比较:如果在5次迭代计算内的波动值不大于第一阈值,则停止对该用户的计算。同时 将该用户的排序值确定为影响力排序值,并将该用户确定为集合X中的元素。如果在5次 迭代计算后,用户的排序值的波动值大于第一阈值,则将该用户确定为集合Y中元素,并执 行 350。
[0066] 350、确定用户的第二排序值向量。
[0067] 具体地,通过对转移概率矩阵和用户的多个第一排序值向量进行5次迭代计算, 确定用户的第二排序值向量,其中第二排序值向量中的元素为每个用户的第二排序值。
[0068] 360、确定集合Y中低影响力用户的集合Z。
[0069] 具体地,根据集合Y中每个用户的第二排序值的大小进行初步排序,并根据排序 结果确定低影响力用户的集合Z。例如,根据幂律分布将排序在后80%的用户确定为低影 响力用户。
[0070] 对于集合Y中不属于集合Z中的用户,与340相似,根据第一阈值和公式3. 1确定 该用户的影响力排序值。对集合Z中的用户执行370。
[0071] 370、针对集合Z中的用户设定第二阈值。
[0072] 具体地,设定大于第一阈值的第二阈值。由于排序在后80%的用户为低影响力用 户,因此使第二阈值大于第一阈值基本不会减少最终影响力排序的精确度。
[0073] 380、根据第二阈值确定集合Z中用户的影响力排序值。
[0074] 例如,根据公式3. 1,利用转移概率矩阵B和主题的权重向量A对用户的第二排序 值向量进行迭代计算,并在每次迭代计算后计算集合Z中每个用户的排序值的波动值。将 该波动值与第二阈值比较:如果该波动值不大于第二阈值,则停止对该用户的计算。同时将 该用户的排序值确定为集合Z中用户的影响力排序值。
[0075] 390、根据所有用户的影响力排序值确定所有用户的影响力。
[0076] 具体地,由于影响力排序值大的用户的影响力高,可以将用户按照影响力排序值 从大到小排序来确定所有用户的影响力。
[0077] 图4是根据本发明另一实施例的确定用户的影响力的装置的示意性流程图。图4 的装置400包括:处理器410、存储器420、通信总线430。处理器410通过通信总线430调 用存储器420中的代码,并用于:获取第一信息和第二信息,第一信息用于指示社交网络中 的N个用户的相互关注关系,第二信息用于指示N个用户中各用户发布的消息数,以及各 用户发布的消息的主题;根据第一信息和第二信息,确定目标主题对应的N维权重向量,权 重向量中的第i元素是基于第一比重和第二比重确定的,其中,第一比重为:第i用户发布 的消息中,关于目标主题的消息所占的比重,第二比重为:第i用户关注的用户中,发布的 消息包含关于目标主题的消息的用户所占的比重,i为1至N中的任意整数;获取第三信 息,第三信息用于指示N个用户中具有消息转发关系的用户之间转发消息的数量和转发消 息的主题;根据第三信息,确定目标主题对应的转移概率矩阵,转移概率矩阵的第(j,k)元 素是基于:第k用户被第j用户转发的,关于目标主题的消息的数量,第j用户对应的转发 关联用户的数量,以及转发关联用户发布的关于目标主题的消息的数量之间的大小关系确 定的,其中,转发关联用户为N个用户中,发布的消息被第j用户转发过的用户,j、k均为1 至N中的任意整数;根据转移概率矩阵和权值向量,利用佩奇排序算法确定在社交网络中, N个用户在目标主题领域的影响力的排序。
[0078] 本发明的实施例采用了基于用户之间实际的社交关系(例如转发关系、关注关系 以及目标主题)确定的转移概率矩阵和权重向量来进行影响力排序。由于用户之间的实际 的社交关系反映了社交网络中用户之间实际的相关度,因此有效地提高了影响力排序结果 的准确性。
[0079] 根据本发明的实施例,权重向量中的第i元素是通过以下公式确定的A = x(a/ b) + (l_x) (c/d),其中,&是权重向量中的第i元素;x为预先设定的实数,且0彡x彡1 ;a 为第i用户发布的关于目标主题的消息的数量;b为第i用户发布的消息总数;c为第i用 户关注的用户中,发布的消息包含关于目标主题的消息的用户的数量;d为第i用户关注的 用户总数。
[0080] 根据本发明的实施例,转移概率矩阵的第(j,k)元素是通过以下公式确定的:Bjk =max(e, l)/max(f, g),其中,Bjk为转移概率矩阵的第(j,k)元素;e为第k用户被第j用 户转发的,关于目标主题的消息的数量;f为转发关联用户发布的关于目标主题的消息的 数量;g为第j用户对应的转发关联用户的数量。
[0081] 根据本发明的实施例,处理器410具体用于:根据转移概率矩阵和权值向量,对N 个用户各自对应的佩奇排序值进行第一次迭代,第一次迭代为迭代次数预先设定的有限次 迭代;根据第一次迭代后,N个用户各自对应的佩奇排序值,将N个用户分为第一集合和第 二集合,其中,第二集合中的用户对应的佩奇排序值小于第一集合中的用户对应的佩奇排 序值;根据转移概率矩阵和权值向量,对N个用户各自对应的佩奇排序值进行第二次迭代, 在第二次迭代中,第一集合中的用户对应的佩奇排序值的迭代停止阈值小于第二集合中的 用户对应的佩奇排序值的迭代停止阈值;将第二次迭代后,N个用户各自对应的佩奇排序 值的大小排序确定为N个用户在目标主题领域的影响力的排序。
[0082] 确定用户的影响力的装置400的各个模块的操作和功能可以参考上述图1的方 法,为了避免重复,在此不再赘述。
[0083] 此外,现有技术采用的佩奇排序方法或面向主题的佩奇排序方法来进行网络节点 的影响力排序,利用随机冲浪者模型,并通过迭代计算使排序值收敛至设定的阈值来进行 的影响力排序。然而,由于采用迭代计算使排序值收敛至设定的阈值需要多次计算,当网络 节点数目过多时,计算开销大。本发明另一实施例的确定网络节点的影响力的方法,可以在 网络节点数目过多时,减少计算的开销。
[0084] 图5是根据本发明另一实施例的确定网络节点的影响力的方法的示意性流程图。 图5的方法由确定网络节点的影响力的装置执行。包括:
[0085] 510、对N个网络节点各自对应的佩奇排序值进行第一次迭代,第一次迭代为迭代 次数预先设定的有限次迭代;
[0086] 520、根据第一次迭代后,N个网络节点各自对应的佩奇排序值,将N个网络节点分 为第一集合和第二集合,其中,第二集合中的网络节点对应的佩奇排序值小于第一集合中 的网络节点对应的佩奇排序值;
[0087] 530、对N个网络节点各自对应的佩奇排序值进行第二次迭代,在第二次迭代中, 第一集合中的网络节点对应的佩奇排序值的迭代停止阈值小于第二集合中的网络节点对 应的佩奇排序值的迭代停止阈值;
[0088] 540、将第二次迭代后,N个网络节点各自对应的佩奇排序值的大小排序确定为N 个网络节点的影响力的排序。
[0089] 应理解,网络节点可以是网站,手机用户,微博或微信用户,运营商网关等。迭代次 数预先设定的有限次迭代,可以是根据六度空间理论设定的迭代次数,例如5次。也可以是 其他的迭代次数,例如少于10次。换句话说,第一次迭代为迭代次数预先设定的有限次迭 代,以便于根据第一次的迭代结果的排序值进行影响力的初步排序,并根据需要将第一集 合的网络节点进行更加精确的排序。图1的方法还可以包括:在第一次迭代中,对N个网络 节点的佩奇排序值设定收敛停止阈值。根据第一次迭代后,N个网络节点各自对应的佩奇 排序值,将N个网络节点分为第一集合和第二集合,可以是,根据幂律分布规律确定两个集 合,例如第一次迭代后的佩奇排序值中,按照大小顺序,前20 %的网络节点为第一集合,后 80%的网络节点为第二集合。也可以根据需要划分不同的集合。
[0090] 本发明的实施例可以根据需要针对不同的网络节点设定不同的收敛停止阈值,由 于对于收敛停止阈值小的网络节点可以进行更少次数的迭代计算,因此减少了计算的开 销。
[0091] 上面描述了根据本发明实施例的确定网络节点的影响力的方法,下面结合附图描 述根据本发明实施例的确定网络节点的影响力的装置。
[0092] 图6是根据本发明另一实施例的确定网络节点的影响力的装置的示意性结构图。 图6的装置600包括:第一迭代模块610,用于对N个网络节点各自对应的佩奇排序值进行 第一次迭代,第一次迭代为迭代次数预先设定的有限次迭代;确定模块620,用于根据第一 迭代模块得到的N个网络节点各自对应的佩奇排序值,将N个网络节点分为第一集合和第 二集合,其中,第二集合中的网络节点对应的佩奇排序值小于第一集合中的网络节点对应 的佩奇排序值;第二迭代模块630,用于对第一迭代模块得到的N个网络节点各自对应的佩 奇排序值进行第二次迭代,在第二次迭代中,确定模块确定的第一集合中的网络节点对应 的佩奇排序值的迭代停止阈值小于第二集合中的网络节点对应的佩奇排序值的迭代停止 阈值;确定模块620还用于将第二次迭代后,N个网络节点各自对应的佩奇排序值的大小排 序确定为N个网络节点的影响力的排序。
[0093] 本发明的实施例可以根据需要针对不同的网络节点设定不同的收敛停止阈值,由 于对于收敛停止阈值小的网络节点可以进行更少次数的迭代计算,因此减少了计算的开 销。
[0094] 确定网络节点的影响力的装置600的各个模块的操作和功能可以参考上述图5的 方法,为了避免重复,在此不再赘述。下面结合具体例子,更加详细地描述本发明的实施例。 [0095] 图7是根据本发明另一实施例的确定网络节点的影响力的方法的示意性流程图。 图7的方法是图5的方法的例子。本实施例中的集合Z中的网络节点对应图5的实施例中 的第二集合中的网络节点,集合Y中不属于集合Z中的网络节点对应图5的实施例中的第 一集合中的网络节点;第一阈值对应第一集合中的网络节点对应的佩奇排序值的迭代停止 阈值,第二阈值对应第一集合中的网络节点对应的佩奇排序值的迭代停止阈值。第一排序 值用于排序值向量的初始化,其中每个网络节点的第一排序值为排序值向量的元素;第二 排序值向量对应第一次迭代后N个网络节点各自对应的佩奇排序值构成的向量。具体的实 现方式如下。
[0096] 710、设定迭代次数。
[0097] 例如,以社交网络为例,根据六度空间理论将迭代次数设定为5,换句话说,节点说 影响力的传递最多不超过5次就可以到达所有的节点。
[0098] 720、对所有网络节点的佩奇排序值赋值。
[0099] 具体地,对所有的网络节点设定相同的第一排序值,例如将多有网络节点赋值为 1〇
[0100] 730、设定第一阈值。
[0101] 该第一阈值用于与网络节点的影响力排序值的波动比较,影响力排序值的波动定 义为 R = I pk-pk+1 I /pk。
[0102] 740、根据第一阈值确定部分网络节点的影响力排序值。
[0103] 例如,采用"抽税模型"公式 7. l:pk+1 = i3Mpk+(l-i3)e/S (7. 1)
[0104] 其中,Μ为转移概率矩阵,该矩阵为NXN矩阵;e为权重向量,该向量为对应N个网 络节点的N维向量;β为常数,例如可以为0. 15 ;pk和pk+1分别为网络节点的排序值经过第 k次和第k+Ι次迭代后的排序值向量,该向量为对应N个网络节点的N维向量。S为N个网 络节点中与目标主题相关的网络节点的数目。权重向量e中的元素取决于该节点是否与该 目标主题相关,若相关则为1,否则为0。具体而言,利用转移概率矩阵Μ和权重向量e对网 络节点的第一排序值向量进行迭代计算,并在每次迭代计算后计算每个网络节点的排序值 的波动值R。将该波动值R与第一阈值比较:如果在5次迭代计算内的波动值不大于第一 阈值,则停止对该网络节点的计算。同时将该网络节点的排序值确定为影响力排序值,并将 该网络节点确定为集合X中的元素。如果在5次迭代计算后,网络节点的排序值的波动值 大于第一阈值,则将该网络节点确定为集合Y中元素,并执行750。
[0105] 750、确定网络节点的第二排序值向量。
[0106] 具体地,通过对转移概率矩阵和网络节点的多个第一排序值向量进行5次迭代计 算,确定网络节点的第二排序值向量,其中第二排序值向量中的元素为每个网络节点的第 二排序值。
[0107] 760、确定集合Y中低影响力网络节点的集合Z。
[0108] 具体地,根据集合Y中每个网络节点的第二排序值的大小进行初步排序,并根据 排序结果确定低影响力网络节点的集合Z。例如,根据幂律分布将排序在后80%的网络节 点确定为低影响力网络节点。
[0109] 对于集合Y中不属于集合Z中的网络节点,与740相似,根据第一阈值和公式7. 1 确定该网络节点的影响力排序值。对集合Z中的网络节点执行770。
[0110] 770、针对集合Z中的网络节点设定第二阈值。
[0111] 具体地,设定大于第一阈值的第二阈值。由于排序在后80%的网络节点为低影响 力网络节点,因此使第二阈值大于第一阈值基本不会减少最终影响力排序的精确度。
[0112] 780、根据第二阈值确定集合Z中网络节点的影响力排序值。
[0113] 例如,根据公式7. 1,利用转移概率矩阵Μ和权重向量e对网络节点的第二排序值 向量进行迭代计算,并在每次迭代计算后计算集合Z中每个网络节点的排序值的波动值。 将该波动值与第二阈值比较:如果该波动值不大于第二阈值,则停止对该网络节点的计算。 同时将该网络节点的排序值确定为集合Z中网络节点的影响力排序值。
[0114] 790、根据所有网络节点的影响力排序值确定所有网络节点的影响力。
[0115] 具体地,由于影响力排序值大的网络节点的影响力高,可以将网络节点按照影响 力排序值从大到小排序来确定所有网络节点的影响力。
[0116] 图8是根据本发明另一实施例的确定网络节点的影响力的装置的示意性结构图。
[0117] 图8的装置800包括:处理器810、存储器820、通信总线830。处理器810通过通 信总线830调用存储器820中的代码,并用于:对N个网络节点各自对应的佩奇排序值进行 第一次迭代,第一次迭代为迭代次数预先设定的有限次迭代;根据第一次迭代后,N个网络 节点各自对应的佩奇排序值,将N个网络节点分为第一集合和第二集合,其中,第二集合中 的网络节点对应的佩奇排序值小于第一集合中的网络节点对应的佩奇排序值;对N个网络 节点各自对应的佩奇排序值进行第二次迭代,在第二次迭代中,第一集合中的网络节点对 应的佩奇排序值的迭代停止阈值小于第二集合中的网络节点对应的佩奇排序值的迭代停 止阈值;将第二次迭代后,N个网络节点各自对应的佩奇排序值的大小排序确定为N个网络 节点的影响力的排序。
[0118] 确定网络节点的影响力的装置800的各个模块的操作和功能可以参考上述图5的 方法,为了避免重复,在此不再赘述。
[0119] 另外,本文中术语"系统"和"网络"在本文中常被可互换使用。本文中术语"和/ 或",仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以 表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符"/",一般表 示前后关联对象是一种"或"的关系。
[0120] 应理解,在本发明实施例中,"与A相应的B"表示B与A相关联,根据A可以确定 B。但还应理解,根据A确定B并不意味着仅仅根据A确定B,还可以根据A和/或其它信息 确定B。
[0121] 本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单 元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件 和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这 些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专 业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不 应认为超出本发明的范围。
[0122] 所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系 统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0123] 在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以 通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的 划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件 可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨 论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合 或通信连接,也可以是电的,机械的或其它的形式连接。
[0124] 所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显 示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个 网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案 的目的。
[0125] 另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以 是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的 单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0126] 通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到本发明可以 用硬件实现,或固件实现,或它们的组合方式来实现。当使用软件实现时,可以将上述功能 存储在计算机可读介质中或作为计算机可读介质上的一个或多个指令或代码进行传输。计 算机可读介质包括计算机存储介质和通信介质,其中通信介质包括便于从一个地方向另一 个地方传送计算机程序的任何介质。存储介质可以是计算机能够存取的任何可用介质。以 此为例但不限于:计算机可读介质可以包括RAM、ROM、EEPROM、CD-ROM或其他光盘存储、磁 盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期 望的程序代码并能够由计算机存取的任何其他介质。此外。任何连接可以适当的成为计算 机可读介质。例如,如果软件是使用同轴电缆、光纤光缆、双绞线、数字用户线(DSL)或者诸 如红外线、无线电和微波之类的无线技术从网站、服务器或者其他远程源传输的,那么同轴 电缆、光纤光缆、双绞线、DSL或者诸如红外线、无线和微波之类的无线技术包括在所属介质 的定影中。如本发明所使用的,盘(Disk)和碟(disc)包括压缩光碟(CD)、激光碟、光碟、数 字通用光碟(DVD)、软盘和蓝光光碟,其中盘通常磁性的复制数据,而碟则用激光来光学的 复制数据。上面的组合也应当包括在计算机可读介质的保护范围之内。
[0127] 总之,以上所述仅为本发明技术方案的较佳实施例而已,并非用于限定本发明的 保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在 本发明的保护范围之内。
【权利要求】
1. 一种确定用户的影响力排序的方法,其特征在于,包括: 获取第一信息和第二信息,所述第一信息用于指示社交网络中的N个用户的相互关注 关系,所述第二信息用于指示所述N个用户中各用户发布的消息数,以及所述各用户发布 的消息的主题; 根据所述第一信息和所述第二信息,确定所述目标主题对应的N维权重向量,所述权 重向量中的第i元素是基于第一比重和第二比重确定的,其中,所述第一比重为:第i用户 发布的消息中,关于所述目标主题的消息所占的比重,所述第二比重为:所述第i用户关注 的用户中,发布的消息包含关于所述目标主题的消息的用户所占的比重,i为1至N中的任 意整数; 获取第三信息,所述第三信息用于指示所述N个用户中具有消息转发关系的用户之间 转发消息的数量和所述转发消息的主题; 根据所述第三信息,确定所述目标主题对应的转移概率矩阵,所述转移概率矩阵的第 (j,k)元素是基于:第k用户被第j用户转发的,关于所述目标主题的消息的数量,所述第j 用户对应的转发关联用户的数量,以及所述转发关联用户发布的关于所述目标主题的消息 的数量之间的大小关系确定的,其中,所述转发关联用户为所述N个用户中,发布的消息被 所述第j用户转发过的用户,j、k均为1至N中的任意整数; 根据所述转移概率矩阵和所述权值向量,利用佩奇排序算法确定在所述社交网络中, 所述N个用户在所述目标主题领域的影响力的排序。
2. 根据权利要求1所述的方法,其特征在于,所述权重向量中的第i元素是通过以下公 式确定的: Aj = x(a/b) + (l-x) (c/d) 其中,A是所述权重向量中的第i元素;x为预先设定的实数,且Ο < x < 1 ;a为第i 用户发布的关于所述目标主题的消息的数量;b为所述第i用户发布的消息总数;c为所述 第i用户关注的用户中,发布的消息包含关于所述目标主题的消息的用户的数量;d为所述 第i用户关注的用户总数。
3. 根据权利要求1或2所述的方法,其特征在于,所述转移概率矩阵的第(j,k)元素 是通过以下公式确定的: BJk = max (e, 1) /max (f, g) 其中,ΒΛ为所述转移概率矩阵的第(j,k)元素;e为第k用户被第j用户转发的,关于 所述目标主题的消息的数量;f为所述转发关联用户发布的关于所述目标主题的消息的数 量;g为所述第j用户对应的转发关联用户的数量。
4. 根据权利要求1-3中的任一项所述的方法,其特征在于,所述根据所述转移概率矩 阵和所述权值向量,利用佩奇排序算法确定所述N个用户的影响力的排序,包括: 根据所述转移概率矩阵和所述权值向量,对所述N个用户各自对应的佩奇排序值进行 第一次迭代,所述第一次迭代为迭代次数预先设定的有限次迭代; 根据所述第一次迭代后,所述N个用户各自对应的佩奇排序值,将所述N个用户分为第 一集合和第二集合,其中,所述第二集合中的用户对应的佩奇排序值小于所述第一集合中 的用户对应的佩奇排序值; 根据所述转移概率矩阵和所述权值向量,对所述N个用户各自对应的佩奇排序值进行 第二次迭代,在所述第二次迭代中,所述第一集合中的用户对应的佩奇排序值的迭代停止 阈值小于所述第二集合中的用户对应的佩奇排序值的迭代停止阈值; 将所述第二次迭代后,所述N个用户各自对应的佩奇排序值的大小排序确定为所述N 个用户在所述目标主题领域的影响力的排序。
5. -种确定网络节点的影响力排序的方法,其特征在于,包括: 对N个网络节点各自对应的佩奇排序值进行第一次迭代,所述第一次迭代为迭代次数 预先设定的有限次迭代; 根据所述第一次迭代后,所述N个网络节点各自对应的佩奇排序值,将所述N个网络节 点分为第一集合和第二集合,其中,所述第二集合中的网络节点对应的佩奇排序值小于所 述第一集合中的网络节点对应的佩奇排序值; 对所述N个网络节点各自对应的佩奇排序值进行第二次迭代,在所述第二次迭代中, 所述第一集合中的网络节点对应的佩奇排序值的迭代停止阈值小于所述第二集合中的网 络节点对应的佩奇排序值的迭代停止阈值; 将所述第二次迭代后,所述N个网络节点各自对应的佩奇排序值的大小排序确定为所 述N个网络节点的影响力的排序。
6. -种确定用户的影响力排序的装置,其特征在于,包括: 第一获取模块,用于获取第一信息和第二信息,所述第一信息用于指示社交网络中的 N个用户的相互关注关系,所述第二信息用于指示所述N个用户中各用户发布的消息数,以 及所述各用户发布的消息的主题; 第一确定模块,用于根据所述第一获取模块获取的所述第一信息和所述第二信息,确 定所述目标主题对应的N维权重向量,所述权重向量中的第i元素是基于第一比重和第二 比重确定的,其中,所述第一比重为:第i用户发布的消息中,关于所述目标主题的消息所 占的比重,所述第二比重为:所述第i用户关注的用户中,发布的消息包含关于所述目标主 题的消息的用户所占的比重,i为1至N中的任意整数; 第二获取模块,用于获取第三信息,所述第三信息用于指示所述N个用户中具有消息 转发关系的用户之间转发消息的数量和所述转发消息的主题; 第二确定模块,用于根据所述第二获取模块获取的所述第三信息,确定所述目标主题 对应的转移概率矩阵,所述转移概率矩阵的第(j,k)元素是基于:第k用户被第j用户转发 的,关于所述目标主题的消息的数量,所述第j用户对应的转发关联用户的数量,以及所述 转发关联用户发布的关于所述目标主题的消息的数量之间的大小关系确定的,其中,所述 转发关联用户为所述N个用户中,发布的消息被所述第j用户转发过的用户,j、k均为1至 N中的任意整数; 第三确定模块,用于根据所述转移概率矩阵和所述权值向量,利用佩奇排序算法确定 在所述社交网络中,所述N个用户在所述目标主题领域的影响力的排序。
7. 根据权利要求6所述的装置,其特征在于,所述权重向量中的第i元素是通过以下公 式确定的: Aj = x(a/b) + (l-x) (c/d) 其中,A是所述权重向量中的第i元素;x为预先设定的实数,且Ο < x < 1 ;a为第i 用户发布的关于所述目标主题的消息的数量;b为所述第i用户发布的消息总数;c为所述 第i用户关注的用户中,发布的消息包含关于所述目标主题的消息的用户的数量;d为所述 第i用户关注的用户总数。
8. 根据权利要求6或7所述的装置,其特征在于,所述转移概率矩阵的第(j,k)元素 是通过以下公式确定的: BJk = max (e, 1) /max (f, g) 其中,ΒΛ为所述转移概率矩阵的第(j,k)元素;e为第k用户被第j用户转发的,关于 所述目标主题的消息的数量;f为所述转发关联用户发布的关于所述目标主题的消息的数 量;g为所述第j用户对应的转发关联用户的数量。
9. 根据权利要求6-8中的任一项所述的装置,其特征在于,所述第三确定单元具体用 于根据所述转移概率矩阵和所述权值向量,对所述N个用户各自对应的佩奇排序值进行第 一次迭代,所述第一次迭代为迭代次数预先设定的有限次迭代;根据所述第一次迭代后,所 述N个用户各自对应的佩奇排序值,将所述N个用户分为第一集合和第二集合,其中,所述 第二集合中的用户对应的佩奇排序值小于所述第一集合中的用户对应的佩奇排序值的迭 代停止阈值;根据所述转移概率矩阵和所述权值向量,对所述N个用户各自对应的佩奇排 序值进行第二次迭代,在所述第二次迭代中,所述第一集合中的用户对应的佩奇排序值的 迭代停止阈值小于所述第二集合中的用户对应的佩奇排序值的迭代停止阈值;将所述第二 次迭代后,所述N个用户各自对应的佩奇排序值的大小排序确定为所述N个用户在所述目 标主题领域的影响力的排序。
10. -种确定网络节点的影响力排序的装置,其特征在于,包括: 第一迭代模块,对N个网络节点各自对应的佩奇排序值进行第一次迭代,所述第一次 迭代为迭代次数预先设定的有限次迭代; 确定模块,用于根据所述第一迭代模块得到的所述N个网络节点各自对应的佩奇排序 值,将所述N个网络节点分为第一集合和第二集合,其中,所述第二集合中的网络节点对应 的佩奇排序值小于所述第一集合中的网络节点对应的佩奇排序值; 第二迭代模块,用于对第一迭代模块得到的所述N个网络节点各自对应的佩奇排序值 进行第二次迭代,在所述第二次迭代中,所述确定模块确定的所述第一集合中的网络节点 对应的佩奇排序值的迭代停止阈值小于所述第二集合中的网络节点对应的佩奇排序值的 迭代停止阈值; 所述确定模块还用于将所述第二次迭代后,所述N个网络节点各自对应的佩奇排序值 的大小排序确定为所述N个网络节点的影响力的排序。
【文档编号】H04L12/24GK104092567SQ201410294986
【公开日】2014年10月8日 申请日期:2014年6月26日 优先权日:2014年6月26日
【发明者】陈凯, 周异, 周曲 申请人:华为技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1