用于发现作为网络中社区的星形结构的系统及方法

文档序号:7847859阅读:177来源:国知局
专利名称:用于发现作为网络中社区的星形结构的系统及方法
用于发现作为网络中社区的星形结构的系统及方法
背景技术
本文中所描述的主题一般地涉及定义及检测网络环境中节点之间的关系。如本文中所描述,网络、网络环境(及其类似者)可包括(但未必限于)计算机网络、社交网络、化学网络、生物学网络,等等。可认为网络是以某种方式经由边缘所连接的节点的集合。作为一个非限制性实例,可将基于因特网的网络定义为包括经由边缘(例如,连接网页的超链接)所连接的节点(诸如网页)。作为另一非限制性实例,可将生物化学网络定义为包括经由边缘(例如,网络节点之间的已知关系(诸如化学结合或化学反应性))所连接的节点(诸如分子)。作为又一非限制性实例,可将呼叫网络定义为包括经由边缘(例如,呼叫网络中节点之间的联系(诸如已拨电话或已发文字消息)的存在)所连接的节点(诸如电话号码和/或个人)。存在大量关于网络的可用信息。例如,存在关于哪些用户/号码已呼叫给定电信网络内的其它用户/号码的大量呼叫信息。尽管存在描述网络的信息,但利用该信息以实现最大价值通常较为困难(有时是直接由大量的信息所造成)。因此,尽管描述网络内节点的关系的信息具有明显的价值,但发现现有网络数据内的这些关系通常较为困难。

发明内容
本发明的各实施例提供了系统、方法、装置及程序产品,所述系统、方法、装置及程序产品提供了用于定义及发现网络环境中的关系的方法。本发明的各实施例利用关系定义将网络环境关系定义为所关注网络内的星形结构,且自动地发现网络(诸如社交网络、技术网络、生物学网络、化学网络等)中的这些星形结构。这些星形结构很重要(在各原因当中),这是因为所述星形结构的语义及所述星形结构的“轮毂(hub)”及“轮辐(spokes)”在各种网络上下文中所扮演的角色。因此,本发明的各实施例(例如)使得用户能够识别电信网络中的有影响力的个人/号码作为联系该网络内的其它节点(轮辐)的轮毂。一旦已识别这些星形结构,则用户可(例如)通过将所述轮毂用作影响遍及该网络的其它节点的联系点或入口点而利用网络信息。概括地,本发明的一个方面提供一种方法,所述方法包括存取存储设备中所存储的网络数据;提取所述网络数据内与节点及边缘对应的信息;选择一个或多个候选节点组;计算所述一个或多个候选节点组的星形测量;判定所述一个或多个候选节点组的所述星形测量是否未超过预定阈值;以及响应于所述一个或多个候选节点组的所述星形测量未超过所述预定阈值而定义一个或多个星形结构。本发明的另一方面提供一种装置,所述装置包括一个或多个处理器;以及计算机可读存储介质,所述计算机可读存储介质具有以其体现且可由所述一个或多个处理器执行的指令程序,所述指令程序包括配置为存取存储设备中所存储的网络数据的计算机可读程序代码;配置为提取所述网络数据内与节点及边缘对应的信息的计算机可读程序代码;配置为选择一个或多个候选节点组的计算机可读程序代码;配置为计算所述一个或多个候选节点组的星形测量的计算机可读程序代码;配置为判定所述一个或多个候选节点组、的所述星形测量是否未超过预定阈值的计算机可读程序代码;以及配置为响应于所述一个或多个候选节点组的所述星形测量未超过所述预定阈值而定义一个或多个星形结构的计算机可读程序代码。本发明的另一方面提供一种计算机程序产品,所述计算机程序产品包括计算机可读存储介质,所述计算机可读存储介质具有以其体现的计算机可读程序代码,所述计算机可读程序代码包括配置为存取存储设备中所存储的网络数据的计算机可读程序代码;配置为提取所述网络数据内与节点及边缘对应的信息的计算机可读程序代码;配置为选择一个或多个候选节点组的计算机可读程序代码;配置为计算所述一个或多个候选节点组的星形测量的计算机可读程序代码;配置为判定所述一个或多个候选节点组的所述星形测量是否未超过预定阈值的计算机可读程序代码;以及配置为响应于所述一个或多个候选节点组的所述星形测量未超过所述预定阈值而定义一个或多个星形结构的计算机可读程序代码。

为了更好地理解本发明的示例性实施例以及本发明的其它及另外的特征及优点,参考结合附图的以下描述,且将在所附权利要求书中指出本发明所要求保护的实施例的范围。


图I例示根据一个实施例的其中具有星形结构的示例性网络;图2例示根据一个实施例的示例性星形结构类型; 图3例示根据一个实施例的示例性星形测量;图4例示根据一个实施例的示例性星形类型;图5例示根据一个实施例的示例性剪除的星形;图6例示根据一个实施例的用于识别星形结构的示例性方法;及图7例示根据一个实施例的示例性计算机系统。
具体实施例方式将易于理解,除了所描述的示例性实施例以外,本发明的各实施例的组件(如本文中的附图所总体上描述及说明)可以以广泛种类的不同配置来布置和设计。因此,本发明的各实施例的以下更详细描述(如附图所表示)并非旨在限制所要求保护的本发明的各实施例的范围,而是仅表示本发明的示例性实施例。在本说明书中对“一个实施例”(或其类似者)的参考意谓结合该实施例所描述的特定特征、结构或特性包括在本发明的至少一个实施例中。因此,在本说明书中各处的短语“在一个实施例中”或其类似者的出现未必均指代同一实施例。此外,可在一个或多个实施例中以任何适当方式组合所描述的特征、结构或特性。在以下描述中,提供众多特定细节以给予对本发明的各实施例的透彻理解。然而,本领域技术人员将认识到,可在没有所述特定细节中的一个或多个的情况下或通过其它方法、组件、材料等来实现本发明的各种实施例。在其它情况下,未详细地展示或描述公知的结构、材料或操作以避免混淆本发明的各方面。应注意的是,附图中的流程图和框图,图示了按照本发明各种实施例的系统、装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,所述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。关于节点的网络数据(不管所述节点表示通信网路中的呼叫者、生理学或生物化学系统中的分子、工业反应工艺中的化学品、导致彼此不利的相互作用的医药品或其类似者)可包含有价值的信息。考虑到已存在关于网络中的节点如何相关的大量可用数据,因此识别节点网络内的感兴趣及潜在重要的关系具有实际价值。例如,网络数据可含有关于与网络中的其它人相关/通信的要人的信息,此信息又可用于指向(targeting)遍及网络分布的信息。发明者已认识到,在给定现有网络数据的情况下,可能难以识别网络内可能以感·兴趣且重要方式彼此相关的(多个)重要节点。作为一个非限制性实例,可能难以识别正在联系许多其它呼叫者的中心呼叫者(例如,电话推销员(tele-marketer)),即使能够存取所有呼叫信息也是如此。就此而言,可认为电话推销员或中心节点是网络内经由边缘(或在此实例中为所进行的呼叫)连接至许多其它节点(“轮辐”)的星形结构的“轮毂”。相应地,本发明的各实施例提供用于网络内的星形结构的定义,且允许自动分析网络数据以识别网络内的这些星形结构。在给定适当识别的星形结构的情况下,能够执行星形结构内的关系的进一步分析而不受大量额外网络数据阻碍。现在转到附图。通过参考附图将最好地理解本发明的例示实施例。以下描述仅旨在作为实例,且仅例示如本文中所要求保护的本发明的某些选定示例性实施例。参考图1,例示一个示例性网络。所述网络包括(通过边缘)连接的许多节点。如本文中所描述,所述节点可为广泛种类的节点中的任一者,例如,彼此呼叫或向彼此发送文字消息的用户,或社交网络站点的用户,其中边缘表示节点(例如,呼叫、文字、友情链接等等)之间的某种关系。令人感兴趣的是,可见网络含有一个或多个星形结构,其中轮毂节点连接星形结构内的轮辐。例如,图I中所例示的网络可为互连的社交网络网站的社交网络。在社交网络上下文中,星形结构的轮毂可表示用户网页,且轮辐(并非所有轮辐均是环绕的)可表示轮毂用户的朋友的网页。因此,所指示的轮毂节点可以是特别所关注的,例如,识别与网络内的许多其它用户联络的用户,或与网络内的特定节点子集联络的用户。图2中例示了利用本发明的各实施例所定义的各种示例性星形结构。可将“完美”星形定义为具有是星形结构的轮辐之间的唯一公共连接的轮毂节点。轮辐可具有额外连接(但并非与星形结构的其它轮辐的连接)。因此,完美星形中的轮毂是将轮辐结合在一起的唯一连接。可将“不完美”星形定义为具有连接若干轮辐的轮毂,其中所述轮辐中的一个或多个彼此连接。因此,不完美星形轮毂并非将轮辐彼此结合的唯一连接,但其确实表示公共连接或边缘。
为了在网络内适当地定义星形结构且又为了能够识别网络内的星形结构,引入星形测量。本质上,本发明的各实施例利用星形测量来识别星形,其中如果星形测量未超过阈值(其中可针对上下文适当地调谐阈值),则识别到星形结构。图3中例示根据本发明的一个实施例的示例性星形测量。根据本发明的一个实施例的星形测量(SM)可定义为
权利要求
1.一种方法,包括 存取存储设备中所存储的网络数据; 提取所述网络数据内与节点及边缘对应的信息; 选择一个或多个候选节点组; 计算所述一个或多个候选节点组的星形测量; 判定所述一个或多个候选节点组的所述星形测量是否未超过预定阈值;以及响应于所述一个或多个候选节点组的所述星形测量未超过所述预定阈值而定义一个或多个星形结构。
2.如权利要求I的方法,其中计算所述一个或多个候选节点组的星形测量进一步包 括 识别轮毂节点; 识别一个或多个邻近节点; 确定所述一个或多个邻近节点的边缘的平均数目; 确定所述轮毂节点的边缘的平均数目;以及 将所述星形测量计算为所述一个或多个邻近节点的边缘的所述平均数目除以所述轮毂节点的边缘的所述数目。
3.如权利要求I的方法,其中所述一个或多个星形结构包括局部星形结构及全局星形结构中的一个或多个。
4.如权利要求3的方法,其中响应于定义一个或多个全局星形结构而识别一个或多个局部星形结构。
5.如权利要求I的方法,还包括 响应于判定所述一个或多个候选节点组的所述星形测量超过所述预定阈值,剪除所述一个或多个候选节点组并且重新判定一个或多个修改后的候选节点组的星形测量是否未超过所述预定阈值。
6.如权利要求5的方法,其中剪除所述一个或多个候选节点组包括自候选星形结构移除轮毂节点的与其它节点具有最高连接度的邻居。
7.如权利要求6的方法,其中响应于判定一个或多个修改后的候选节点组的星形测量未超过所述预定阈值而定义星形结构。
8.如权利要求I的方法,其中所述网络数据包括呼叫网络数据、医药品网络数据以及社交因特网Web站点网络数据中的一个或多个。
9.如权利要求I的方法,还包括将所述一个或多个星形结构输出至一个或多个显示设备。
10.一种装置,包括 一个或多个处理器;以及 计算机可读存储介质,所述计算机可读存储介质具有以其体现且可由所述一个或多个处理器执行的指令程序,所述指令程序包括 配置为存取存储设备中所存储的网络数据的计算机可读程序代码; 配置为提取所述网络数据内与节点及边缘对应的信息的计算机可读程序代码; 配置为选择一个或多个候选节点组的计算机可读程序代码;配置为计算所述一个或多个候选节点组的星形测量的计算机可读程序代码; 配置为判定所述一个或多个候选节点组的所述星形测量是否未超过预定阈值的计算机可读程序代码;以及 配置为响应于所述一个或多个候选节点组的所述星形测量未超过所述预定阈值而定义一个或多个星形结构的计算机可读程序代码。
11.如权利要求10的装置,其中配置为计算所述一个或多个候选节点组的星形测量的计算机可读程序代码进一步被配置为 识别轮毂节点; 识别一个或多个邻近节点; 确定所述一个或多个邻近节点的边缘的平均数目; 确定所述轮毂节点的边缘的平均数目;以及 将所述星形测量计算为所述一个或多个邻近节点的边缘的所述平均数目除以所述轮毂节点的边缘的所述数目。
12.如权利要求10的装置,其中所述一个或多个星形结构包括局部星形结构及全局星形结构中的一个或多个。
13.如权利要求12的装置,其中响应于定义一个或多个全局星形结构而识别一个或多个局部星形结构。
14.如权利要求10的装置,其中所述计算机可读程序代码进一步包括 配置为响应于判定所述一个或多个候选节点组的所述星形测量超过所述预定阈值而剪除所述一个或多个候选节点组并且重新判定一个或多个修改后的候选节点组的星形测量是否未超过所述预定阈值的计算机可读程序代码。
15.如权利要求14的装置,其中剪除所述一个或多个候选节点组包括自候选星形结构移除轮毂节点的与其它节点具有最高连接度的邻居。
16.如权利要求15的装置,其中响应于判定一个或多个修改后的候选节点组的星形测量未超过所述预定阈值而定义星形结构。
17.如权利要求10的装置,其中所述网络数据包括呼叫网络数据、医药品网络数据以及社交因特网Web站点网络数据中的一个或多个。
18.如权利要求10的装置,还包括 一个或多个显示设备; 其中所述计算机可读程序代码还包括配置为将所述一个或多个星形结构输出至所述一个或多个显示设备的计算机可读程序代码。
19.一种计算机程序产品,包括 计算机可读存储介质,所述计算机可读存储介质具有以其体现的计算机可读程序代码,所述计算机可读程序代码包括 配置为存取存储设备中所存储的网络数据的计算机可读程序代码; 配置为提取所述网络数据内与节点及边缘对应的信息的计算机可读程序代码; 配置为选择一个或多个候选节点组的计算机可读程序代码; 配置为计算所述一个或多个候选节点组的星形测量的计算机可读程序代码; 配置为判定所述一个或多个候选节点组的所述星形测量是否未超过预定阈值的计算机可读程序代码;以及 配置为响应于所述一个或多个候选节点组的所述星形测量未超过所述预定阈值而定义一个或多个星形结构的计算机可读程序代码。
20.如权利要求19的计算机程序产品,其中配置为计算所述一个或多个候选节点组的星形测量的计算机可读程序代码进一步被配置为 识别轮毂节点; 识别一个或多个邻近节点; 确定所述一个或多个邻近节点的边缘的平均数目; 确定所述轮毂节点的边缘的平均数目;以及 将所述星形测量计算为所述一个或多个邻近节点的边缘的所述平均数目除以所述轮毂节点的边缘的所述数目。
全文摘要
本发明的各实施例提供了系统、方法、装置及程序产品,所述系统、方法、装置及程序产品提供了用于定义和发现网络环境中的关系的方法。本发明的各实施例利用关系定义将网络环境关系定义为所关注网络内的星形结构,且自动地发现网络中的这些星形结构。
文档编号H04L29/08GK102726010SQ201180007188
公开日2012年10月10日 申请日期2011年1月26日 优先权日2010年1月30日
发明者A·A·纳纳瓦蒂, S·慕克吉, U·N·拉加万 申请人:国际商业机器公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1