基于图结构匹配的社交网络分析方法

文档序号:9417432阅读:1957来源:国知局
基于图结构匹配的社交网络分析方法
【技术领域】
[0001]本发明涉及图结构匹配技术、社交网络分析技术、分布式计算技术、增量计算技术等领域;具体涉及基于图结构匹配的社交网络分析方法。
【背景技术】
[0002]近年来,互联网的持续快速发展,社交网络等新兴信息模式的迅猛发展,对个人和社会群体的行为产生了深远影响。以Facebook为例,我们发现其:(I)用户规模大,全球注册用户超8.5亿,用户间联系逾千亿;(2)使用频繁,超过一半的用户每天登陆Facebook,所有用户每月在线时间达7000亿分钟;(3)商业价值高,是排名第一的广告发布接受网站,每天有超过10亿条包括视频、照片、新闻等信息在用户间分享。
[0003]庞大的社交网络为人们提供了丰富的信息,然而如何快速有效地发现社交网络海量信息背后所蕴含的知识,是亟待人们解决的问题。
[0004]由于社交网络可以抽象为图结构一一用户可被视为图的顶点,用户之间的关系可被看作图的边,因此,基于图结构匹配的分析技术已成为社交网络分析的主要技术之一,并且已经和正在帮助人们进行专家推荐、社交圈子识别,社会位置分析等。简言之,图结构匹配是在一个大图G中查询与给定模式图Q匹配的子图(可形式化描述为Q(G))。然而,由于社交网络图数据“海量”及“非结构化”的特点,通过传统技术对社交网络“大数据”进行分析已难以满足人们的迫切需要。具体原因表现在:(I)图结构匹配兼顾数据和拓扑结构,从而导致对该问题的运算往往较为复杂,例如:基于子图同构的图结构匹配属于一类极难解决的问题一一NP完全问题;(2)社交网络的数据往往是分布式存储的。例如=Twitter社交图的FlockDB,Yahoo !互联网应用的PNUTS,开源社区的Neo4j和HypergraphDB等。另一方面,图结构匹配经常需要访问多个数据节点,例如:访问多个数据站点以取得匹配计算所需要的全部信息。因此,在分布式环境下,图结构匹配的求值更加困难;(3)现实世界的社交网络是不断变化的。在一周内有10%的节点及节点关系更新是常见的情况。当更新出现的时候,昂贵的查询需要被重新计算。这样的计算在面对频繁的请求时往往是无法进行的。
[4]可视化管理工具的缺失。与关键词搜索和结构化查询不同,图结构匹配查询条件(如模式图Q)的描述更加复杂,且对结果的理解也需要更加直观的方式。

【发明内容】

[0005]本发明的目的是为了有效的克服以上困难,更加高效、便捷地对社交网络“大数据”进行分析,我们对传统技术进行了如下三方面的扩展:(I)采用分布式技术管理、查询数据,实现图结构匹配计算的并行化;(II)实现匹配结果(视图)的增量维护;(III)实现模式图构造和匹配结果的可视化。
[0006]为了达到上述的技术效果,本发明采取以下技术方案:基于图结构匹配的社交网络分析方法,包括下述步骤(以下步骤不分先后顺序):
[0007]a、图形化界面帮助用户管理图数据,构建模式图及可视化查询结果。
[0008]b、查询引擎调用分布式算法执行结构匹配计算,同时对匹配结果进行评估,选取top-K个结果,并将它们可视化在图形界面上。
[0009]C、运用增量算法,对已有的匹配结果进行增量计算,以保证结果的正确性和完整性。
[0010]进一步的技术方案是:步骤b通过以下步骤实现:
[0011 ] bl、查询引擎接收查询请求后,将请求分发到各个数据站点。
[0012]b2、各站点收到查询请求后,并行地调用优化了的VF2算法执行本地计算。
[0013]b3、查询引擎收集到所有返回的计算结果后,查询引擎利用排序功能识别top-K个匹配项,排序功能利用匹配结果的度数对结果进行整合。
[0014]进一步的技术方案是:步骤c通过以下步骤实现:
[0015]Cl、将模式图Q视为无向图Q’,并计算出无向图Q’的直径d。
[0016]c2、对于给定的图G中每一条边的更新Ae= (V, V’),分别计算V和V’在d步内可达的节点,并从图G中导出该子图,称为图G( △ e,Q);对图G( △ e, Q)和模式图Q进行同构计算。
[0017]本发明与现有技术相比,具有以下的有益效果:
[0018]针对社交网络“大数据”,通过分布式,可视化及增量计算技术,实现高效、便捷的数据分析与维护,进而为专家推荐、社交圈子识别,社会位置分析等热点应用提供关键技术支撑。
[0019]本发明所提供的技术包括:(I)分布式图结构匹配技术,(II)图数据管理技术,
(III)匹配结果(视图)增量维护技术,(IV)查询可视化技术。
[0020](I)分布式图结构匹配技术:通过全双工方式,对经典的VF2算法进行拓展,实现分布式图结构匹配计算。
[0021](II)图数据管理技术:基础数据采用十字链表结构,便于双向(延父节点,或子节点)遍历;同时由于采用了更加“简洁”的数据结构,使得数据的空间开销更小。
[0022](III)匹配结果增量维护技术:从输入输出变化的角度,设计增量维护算法,使得对查询结果的动态维护更加高效。
[0023](IV)查询可视化技术:通过“所见即所得”的可视化方式帮助用户构建查询,管理图数据,并可视化查询结果。
【附图说明】
[0024]图1是本发明系统架构示意图
【具体实施方式】
[0025]下面结合本发明的实施例对本发明作进一步的阐述和说明。
[0026]实施例:
[0027]基于图结构匹配的社交网络分析方法,通过以下三大模块实现:
[0028]一、图形化界面:
[0029]图形化界面帮助用户管理图数据,构建模式图,及可视化查询结果。用户一方面可以通过在面板上“画出” 一系列的节点和边,便利地构建模式图
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1