一种节点重要性排序的方法和系统的制作方法

文档序号:9865525阅读:813来源:国知局
一种节点重要性排序的方法和系统的制作方法
【技术领域】
[0001] 本发明涉及计算机技术领域,尤其涉及一种节点重要性排序的方法和系统。
【背景技术】
[0002] 社交网络中重要用户挖掘是通过在网络中对节点的重要性进行排序来实现的,不 同的社交网站会依据不同的应用场景对重要性进行定义和计算。网络中节点重要性的排序 是一个非常重要的问题,例如对网页的排序是搜索算法的核必。
[0003] 现有技术中存在一种链接数据库中节点排序方法,可用于对节点的重要性排序, 该方法是Lawrence化ge发明的美国US 6285999B1号专利,即"链接数据库中节点排序方 法"(英文全称为 MET册D FOR N孤E RANKING IN A LINKED DATABA沈),简称化geRank 算 法,该算法用来标识网页的等级/重要性,使郝些更具"等级/重要性"的网页在搜索结果 中网站排名获得提升,从而提高搜索结果的相关性和质量。
[0004] 化geRank算法存在的缺陷是无法处理悬摆链,也就是对于出度为零的网页(没有 链出边的网页)无法处理,为了解决悬摆链的问题,目前采用的方法是引入一个随机跳转 概率,即走到悬摆链的时候会W-定概率随机选择网页链入,送样会使得网页排序结果严 重依赖随机跳转概率参数的选择,也就是说不同的随机跳转概率参数会得到不同的排序结 果,送会极大影响排序结果的准确性。
[0005] 现有技术中还存在一种节点重要性排序方法是HITS(英文全称;Hyperlink- induced Topic Search) 算法, HITS 算法同时考虑了节点权威性 (英文名称为 authority) 和中枢性(英文名称为hub)。一个节点的权威值等于链入它的节点的hub值的和,一个节 点的hub值等于它指向的节点的权威值之和。由此可见HITS算法中权威值和中枢值的计 算都是依赖于节点之间的相互链接关系,所WHITS算法存在的问题是无法适用于包含多 个集团的网络中节点重要性的排序,因为各个集团之间没有链接,很难说明一个集团比另 外一个集团更重要,因此也就不能确定跨集团的多节点中哪个节点更加权威或者中枢性更 强。
[0006] 综上,现有技术中存在的节点重要性排序方法都无法完全适用于社交网络中重要 用户挖掘,目前业界仍急需研究出能够完全适用于社交网络中重要用户挖掘的节点重要性 排序方法。

【发明内容】

[0007] 本发明实施例提供了一种节点重要性排序的方法和系统,用于实现社交网络中重 要用户挖掘。
[0008] 为解决上述技术问题,本发明实施例提供W下技术方案:
[0009] 第一方面,本发明实施例提供一种节点重要性排序的方法,包括:
[0010] 从节点应用服务器获取拓扑网络中各个节点之间交互的节点日志信息;
[0011] 根据所述节点日志信息在所述拓扑网络中加入含权性和有向性,得到有向含权网 络;
[0012] 在所述有向含权网络中加入背景节点,得到加入有所述背景节点的有向含权网 络,所述背景节点与所述有向含权网络中原有的所有节点建立有双向链接关系;
[0013] 根据加入有所述背景节点的有向含权网络对所述各个节点的重要性进行排序,得 到所述各个节点的重要性排名。
[0014] 第二方面,本发明实施例还提供一种节点重要性排序的系统,包括:
[0015] 信息获取模块,用于从节点应用服务器获取拓扑网络中各个节点之间交互的节点 日志信息;
[0016] 网络转化模块,用于根据所述节点日志信息在所述拓扑网络中加入含权性和有向 性,得到有向含权网络;
[0017] 节点添加模块,用于在所述有向含权网络中加入背景节点,得到加入有所述背景 节点的有向含权网络,所述背景节点与所述有向含权网络中原有的所有节点建立有双向链 接关系;
[001引重要性排序模块,用于根据加入有所述背景节点的有向含权网络对所述各个节点 的重要性进行排序,得到所述各个节点的重要性排名。
[0019] 从W上技术方案可W看出,本发明实施例具有W下优点:
[0020] 在本发明实施例中,首先从节点应用服务器获取拓扑网络中各个节点之间交互的 节点日志信息,然后根据获取到的节点日志信息在拓扑网络中加入含权性和有向性,得到 有向含权网络,接下来在有向含权网络中加入背景节点,得到加入有背景节点的有向含权 网络,其中,背景节点与有向含权网络中原有的所有节点建立有双向链接关系,最后根据加 入有背景节点的有向含权网络对各个节点的重要性进行排序,从而可W得到各个节点的重 要性排名。本发明实施例中各个节点可W对应于社交网络中的各个用户,通过对节点重要 性的排序可W从社交网络中挖掘出重要用户,故可W实现社交网络中重要用户挖掘,本发 明实施例中对节点重要性的排序是通过各个节点之间的交互行为进行挖掘W及有向含权 网络来实现的,重要性排序的结果精度高,由于有向含权网络中已经添加了与原有的所有 节点都建立有双向链接关系的背景节点,使得出度为零的节点也可W实现跳转,故不需要 引入随机跳转概率,所W不受随机跳转概率参数的影响,并且对于节点之间没有相互链接 的跨集团的拓扑网路也同样适用。
【附图说明】
[0021] 为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使 用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于 本领域的技术人员来讲,还可W根据送些附图获得其他的附图。
[0022] 图1为本发明实施例提供的一种节点重要性排序的方法的流程方框示意图;
[0023] 图2-a为本发明实施例提供的一种节点重要性排序的系统的组成结构示意图;
[0024] 图2-b为本发明实施例提供的另一种节点重要性排序的系统的组成结构示意图; [00巧]图2-C为本发明实施例提供的一种重要性排序模块的组成结构示意图;
[0026] 图2-d为本发明实施例提供的一种计算子模块的组成结构示意图;
[0027] 图2-e为本发明实施例提供的一种排序子模块的组成结构示意图;
[0028] 图3为本发明实施例提供的节点重要性排序的方法应用于服务器的组成结构示 意图;
[0029] 图4为本发明实施例提供的节点重要性排序的系统的实现架构示意图;
[0030] 图5为计算子模块执行的方法流程示意图。
【具体实施方式】
[0031] 本发明实施例提供了一种节点重要性排序的方法和系统,用于实现社交网络中重 要用户挖掘。
[0032] 为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明 实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,下面所描述 的实施例仅仅是本发明一部分实施例,而非全部实施例。基于本发明中的实施例,本领域的 技术人员所获得的所有其他实施例,都属于本发明保护的范围。
[0033] 本发明的说明书和权利要求书及上述附图中的术语"包括"和"具有及他们的 任何变形,意图在于覆盖不排他的包含,W便包含一系列单元的过程、方法、系统、产品或设 备不必限于郝些单元,而是可包括没有清楚地列出的或对于送些过程、方法、产品或设备固 有的其它单元。
[0034] W下分别进行详细说明。本发明节点重要性排序的一个实施例,具体可W应用于 社交网络中重要用户挖掘的场景中,请参阅图1所示,本发明一个实施例提供的节点重要 性排序的方法,可W包括如下步骤:
[0035] 101、获取拓扑网络中各个节点之间交互的节点日志信息。
[0036] 在本发明实施例中,节点对应于社交网络中的各个用户,每个用户对应于拓扑网 络中的一个节点,通过对节点重要性的排序,可W实现对社交网络中重要用户的挖掘,在社 交网络中,用户有着自己单独的行为,用户与用户之间也可能存在交互行为,送些都会影响 一个用户在社交网络中的活跃程度和影响力,用户之间的交互行为通过用户日志可W由社 交网络应用服务器来保存,将社交网络中的用户表示为拓扑网络中的节点,则对于节点而 言,在拓扑网络的节点之间也可能存在交互行为,对节点之间交互行为的记录可W通过节 点应用服务器来保存,当需要对拓扑网络中各个节点进行重要性排名时,首先提取各个节 点之间交互的节点日志信息,例如可W从节点应用服务器来提取上述节点日志信息。其中, 节点日志信息用于记录交互双方的节点名称、交互行为W及交互发生的时间等交互行为的 记录,提取各个节点的节点日志信息可W发现各个节点在拓扑网络中的活跃程度W及节点 对其它节点的影响力,送些都会影响拓扑网络中节点的排序结果。
[0037] 在本发明的一些实施例中,拓扑网络中各个节点之间交互的节点日志信息,具体 可W包括如下内容:交互的两个节点中交互发起方的标识号(ID,Identity)和交互接收方 的ID,交互行为类型,交互发起方的属性、交互时间。举例说明,在拓扑网络中,若节点A和 节点B之间产生过交互行为,例如,在社交软件微信中,节点A对应于微信中注册的用户A, 节点B对应于微信中注册的用户B,用户A对用户B在微信中发布的照片点过赞,则可W认 为节点A和节点B之间产生过交互行为,郝么在节点A和节点B的节点日志信息中都会记录 下交互发起方(即节点A)的ID号、交互接收方(即节点B)的ID号、交互行为类型为"点 赞"、交互发起方的属性(例如节点A在社交网络中公开的用户标签等属性信息)W及交互 行为产生的时间点。可w理解的是,节点日志信息除了记录下如上举例的内容之外,还可w 根据设计网络应用的具体平台、用户之间交互的具体方式W及对其它用户产生的影响等来 设计节点日志信息的具体内容,此处不做限定。
[0038] 在如上的实现场景中,若通过步骤101从节点应用服务器获取拓扑网络中各个节 点之间交互的节点日志信息包括了交互发起方的ID和交互接收方的ID、交互行为类型和 交互发起方的属性等涉及到用户的身份W及敏感数据时,为了保证用户的隐私不被泄露, 本发明实施例还可W执行如下步骤:
[0039] A1、对交互发起方的ID和交互接收方的ID进行匿名化处理;
[0040] A2、对交互行为类型和交互发起方的属性进行泛化处理。
[0041] 其中,步骤A1和步骤A2之间没有时序先后顺序之分,可W先执行其中任意一个, 还可W同时执行两个步骤,即通过匿名化处理和泛化处理,可W对涉及到用户的身份W及 敏感数据等方面进行隐私保护,其中,泛化处理可W使得当一个变量(如参数或过程变量) 被声明承载某个给定类的值时,可使用类(或其他元素)的实例作为值,例如对交互行为类 型和交互发起方的属性的泛化处理,使得交互行为类型和交互发起方的属性被使用的其它 元素值或者实例作为其值,而真正的交互行为类型和交互发起方的属性不会被直接泄露。
[0042] 102、根据节点日志信息在拓扑网络中加入含权性和有向性,得到有向含权网络。
[0043] 在本发明实施例中,从节点应用服务器获取到拓扑网络中各个节点之
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1