基于图结构匹配的社交网络分析方法_2

文档序号:9417432阅读:来源:国知局
,另一方面可以选择所要查询的图数据,最终明确匹配算法的输入;用户可以指定图数据并对其进行一系列数据管理操作,如节点查询,节点和边的增删改等操作;匹配结果将以图形化的方式呈现,用户可以更加直观地理解匹配结果。
[0030]二、查询引擎
[0031]查询引擎调用分布式算法执行结构匹配计算,同时对匹配结果进行评估,选取top-K个结果,并将它们可视化在图形界面上。查询引擎的具体工作流程如下:
[0032](I)查询引擎接收查询请求后,将请求分发到各个数据站点(S1, S2...SJ。
[0033](II)各站点收到查询请求后,并行地调用优化了的VF2算法执行本地计算。考虑到本地化的运算会导致匹配结果缺失,因此在执行本地化运算前,对于当前站点S1的边界节点VcX即位于本站点,但是存在子节点位于其他站点),如果其与模式图Q中的某个节点Uci具有相同的节点标签(可扩展至具有类似语义),则S i向其他站点S ,请求边界节点V ^勺邻居节点。S1接收到S ,返回的数据后,进行本地运算,并将结果返回查询引擎。
[0034](III)查询引擎收集到所有返回的计算结果后,对结果进行整合。考虑到查询结果集有时会非常大,而用户可能只对排名靠前的K个匹配结果感兴趣,因此查询引擎利用排序功能识别top-K个匹配项;而排序依据来源于对社交网络的观察:一个匹配结果与外部连接地紧密程度反映了该匹配结果的社会影响,因此排名功能利用匹配结果的度数(出入度之和)作为衡量匹配结果重要性的指标。
[0035]三、增量计算模块
[0036]真实的社交网络图G往往非常大,并且经常变化。对于给定的图G,模式图Q和图G的增量AG,在每一次图G更新后重新计算模式图Q(G+AG)将是一个非常消耗资源的过程。而当增量AG很小时,增量计算比每一次重新计算效率高得多。本模块通过运用增量算法,对已有的匹配结果进行增量计算,以保证结果的正确性和完整性。增量计算的核心思路依据子图同构的“本地化”特性,其算法如下:
[0037](I)将模式图Q视为无向图Q’,并计算出无向图Q’的直径d。
[0038](2)对于图G中每一条边的更新Ae= (V,V’)(增删节点不会影响匹配结果,故忽略之),分别计算V和V’在d步内可达的节点,并从图G中导出该子图,称为图G(Ae,Q);对图G(Ae,Q)和模式图Q进行同构计算。
[0039]本发明通过实施例所述方法实现了以下效果:
[0040]实现了对社交网络“大数据”的分布式存储,维护,及结构匹配计算;从而通过并行处理的方式,极大提高了面向大规模图数据开展分析、计算的能力;
[0041]实现了更为轻量级的图数据表示,及更加便捷的图数据管理。对于图数据,我们采用了更为复杂,但却更加易用的十字链表作为其基础数据结构;同时采用了更加精炼的方式,确保数据开销更小。我们在十字链表的基础上,实现了非常高效的节点、边的增删改操作,使得图数据的维护非常便利。
[0042]实现了增量维护计算,以克服社交网络更新频繁,而批量计算又开销巨大的严重瓶颈。
[0043]实现了模式图的可视化构建,以及查询结果的可视化。帮助用户更加便捷的描述查询请求,以及更加直观的理解查询结果。
[0044]可以理解的是,以上实施方式仅仅是为了说明本发明的原理而采用的示例性实施方式,然而本发明并不局限于此。对于本领域内的普通技术人员而言,在不脱离本发明的精神和实质的情况下,可以做出各种变型和改进,这些变型和改进也视为本发明的保护范围。
【主权项】
1.基于图结构匹配的社交网络分析方法,其特征在于,包括下述步骤: a、图形化界面帮助用户管理图数据,构建模式图及可视化查询结果; b、查询引擎调用分布式算法执行结构匹配计算,同时对匹配结果进行评估,选取top-K个结果,并将它们可视化在图形界面上; C、运用增量算法,对已有的匹配结果进行增量计算,以保证结果的正确性和完整性。2.根据权利要求1所述的基于图结构匹配的社交网络分析方法,其特征在于,步骤b通过以下步骤实现: bl、查询引擎接收查询请求后,将请求分发到各个数据站点;b2、各站点收到查询请求后,并行地调用优化了的VF2算法执行本地计算;b3、查询引擎收集到所有返回的计算结果后,查询引擎利用排序功能识别top-K个匹配项,排序功能利用匹配结果的度数对结果进行整合。3.根据权利要求1所述的基于图结构匹配的社交网络分析方法,其特征在于,步骤c通过以下步骤实现: Cl、将模式图Q视为无向图Q’,并计算出无向图Q’的直径d ; c2、对于给定的图G中每一条边的更新Ae= (V, V’),分别计算V和V’在d步内可达的节点,并从图G中导出该子图,称为图G( △ e,Q);对图G( △ e,Q)和模式图Q进行同构计笪并ο
【专利摘要】本发明公开了一种基于图结构匹配的社交网络分析方法,涉及图结构匹配技术、增量计算技术等领域。主要包括下述步骤:a、图形化界面帮助用户管理图数据,构建模式图及可视化查询结果。b、查询引擎调用分布式算法执行结构匹配计算,同时对匹配结果进行评估,选取top-K个结果,并将它们可视化在图形界面上。c、运用增量算法,对已有的匹配结果进行增量计算,以保证结果的正确性和完整性。针对社交网络“大数据”,通过分布式,可视化及增量计算技术,实现高效、便捷的数据分析与维护,进而为专家推荐、社交圈子识别,社会位置分析等热点应用提供关键技术支撑。
【IPC分类】G06F17/30, G06Q50/00
【公开号】CN105138600
【申请号】CN201510477246
【发明人】王欣, 于成业, 杜彤, 赵亮, 刘传银, 郝妙, 钟吉英
【申请人】四川长虹电器股份有限公司
【公开日】2015年12月9日
【申请日】2015年8月6日
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1