基于随机游走的动态流图数据顶点重要性更新方法和装置与流程

文档序号:24070784发布日期:2021-02-26 15:07阅读:53来源:国知局
基于随机游走的动态流图数据顶点重要性更新方法和装置与流程
增顶点的所有连接边,将这些连接边的另一端连接该超顶点,从而获取新图,该新 图的各个顶点通过预设的随机游走方式生成随机游走路径,根据所述随机游走路径 经过各个所述新增顶点的总次数,计算或更新各个新增顶点的pagerank值;
[0015]
所述随机游走方式具体为,某一顶点以α为概率向其他出边的后续顶点游走, 以出度的倒数为概率选择其任意出边游走,每个顶点以1-α为概率停止游走,如果 继续向后续的顶点游走,最多不超过r步,当遇到无出边的顶点时,即刻停止此 轮游走。
[0016]
进一步地,从任意顶点开始的所述随机游走方式重复进行预设的第一轮数。
[0017]
进一步地,在每一时刻动态流图数据更新过程中,通过预设的增量计算方式, 更新各个顶点的pagerank值;所述动态流图数据更新过程形成的变化包括新增边、 新增顶点、删除顶点和删除边;
[0018]
所述增量计算方式包括:
[0019]
新增边第一处理步骤:若新增边e=(u,v)中顶点u和顶点v均为已有顶点,计 算经过顶点u增加的次数采用所述随机游走方式,从顶点u开始,进行轮 的随机游走,得到顶点u随机游走路径;
[0020]
若所述顶点u随机游走路径经过新增边e且经过任意顶点i,则在原有经过顶 点i的随机游走路径的总次数上加1,若所述顶点u随机游走路径不经过新增边e 但经过任意顶点i,原有经过顶点i的随机游走路径的次数上减1,从而计算并更 新各个顶点的pagerank值。
[0021]
进一步地,所述增量计算方式还包括:
[0022]
新增边第二处理步骤:若新增边e为新增顶点和已有顶点的边,则将动态流图 数据的顶点总数量加一,并采用所述新增边第一处理步骤更新各个顶点的 pagerank值。
[0023]
进一步地,所述增量计算方式还包括:
[0024]
删除边第一处理步骤:若删除边e=(u,v)中顶点u和顶点v均为已有顶点,计 算导致经过顶点u减少的次数采用所述随机游走方式,随机选择顶点u的出度 顶点和顶点v作为起点进行轮的随机游走,得到顶点u随机游走路径;
[0025]
若从顶点u的出度顶点开始的所述顶点u随机游走路径经过任意顶点i,则在 原有经过顶点i的总次数上加1;如果从顶点v开始的所述顶点u随机游走路径经 过任意顶点i,则在原有经过顶点i的总次数上减1,从而计算并更新各个顶点的 pagerank值。
[0026]
进一步地,所述增量计算方式还包括:
[0027]
删除边第二处理步骤:若删除边e为删除一个顶点导致该边被删除,则将动态 流图数据的顶点总数量减一,并采用所述删除边第一处理步骤更新各个顶点的 pagerank值。
[0028]
进一步地,所述增量计算方式还包括:对动态流图数据更新过程形成的所述变 化依次处理,直至遍历所有变化。
[0029]
进一步地,所述动态流图数据更新过程中不受影响的顶点沿用该顶点原有的 pagerank值。
[0030]
本发明还提供一种基于随机游走的动态流图数据顶点重要性更新装置,包括存 储器和处理器,所述存储器存储有计算机程序,处理器调用所述计算机程序执行如 下步骤:
[0031]
按照时间序列实时获取关联数据,实时更新动态流图数据;
[0032]
在每一时刻动态流图数据更新过程中获取受影响顶点和新增顶点;
[0033]
所述动态流图数据中的各个顶点通过预设的随机游走方式生成随机游走路径;
[0034]
根据所述随机游走路径经过各个所述受影响顶点的总次数,计算或更新各个受 影响顶点的pagerank值;
[0035]
将所述动态流图数据的原有顶点聚合为一个超顶点,并保留动态流图数据中新 增顶点的所有连接边,将这些连接边的另一端连接该超顶点,从而获取新图,该新 图的各个顶点通过预设的随机游走方式生成随机游走路径,根据所述随机游走路径 经过各个所述新增顶点的总次数,计算或更新各个新增顶点的pagerank值;
[0036]
所述随机游走方式具体为,某一顶点以α为概率向其他出边的后续顶点游走, 以出度的倒数为概率选择其任意出边游走,每个顶点以1-α为概率停止游走,如果 继续向后续的顶点游走,最多不超过r步,当遇到无出边的顶点时,即刻停止此 轮游走。
[0037]
进一步地,在每一时刻动态流图数据更新过程中,通过预设的增量计算方式, 更新各个顶点的pagerank值;所述动态流图数据更新过程形成的变化包括新增边、 新增顶点、删除顶点和删除边;
[0038]
所述增量计算方式包括:
[0039]
新增边第一处理步骤:若新增边e=(u,v)中顶点u和顶点v均为已有顶点,计 算经过顶点u增加的次数采用所述随机游走方式,从顶点u开始,进行轮 的随机游走,得到顶点u随机游走路径;
[0040]
若所述顶点u随机游走路径经过新增边e且经过任意顶点i,则在原有经过顶 点i的随机游走路径的总次数上加1,若所述顶点u随机游走路径不经过新增边e 但经过任意顶点i,原有经过顶点i的随机游走路径的次数上减1,从而计算并更 新各个顶点的pagerank值。
[0041]
与现有技术相比,本发明具有以下优点:
[0042]
(1)本发明通过随机游走产生的随机游走路径,计算图顶点的pagerank值, 通过随机游走充分体现顶点被访问的概率变化,可以准确地更新顶点的pagerank;
[0043]
借鉴声波传播原理,确定流图中动态变化对已有图的影响区域,在已有的随机 游走路径信息基础上,确定需要随机游走的新增轮次,通过确定受影响顶点被经过 的游走概率来更新pagerank;对于新增顶点利用聚合增量的思想,形成带有超顶 点的新图,再通过随机游走完成新增顶点pagerank的计算;
[0044]
由于计算过程尽可能利用已有计算结果,大大地加快了更新pagerank的速度; 增量更新得到动态流图pagerank也精确有效,为实时性要求较高的动态流图应用 领域提供一种可靠、快速地更新pagerank的方法。
[0045]
(2)本发明利用增量计算的思想,对动态流图产生变化和受到影响的部分顶 点进行pagerank更新,同时保留和沿用不受影响顶点的paegrank,这样可以大大 减少求解计算量,快速得到并且确保顶点pagerank的正确性。
[0046]
(3)本发明使用被改变的随机游走路径条数作为重新随机游走的轮次,尽可 能反映出随机游走经过顶点i被改变的真实次数,提高任意顶点的pagerank 增量计算的
准确性。
[0047]
(4)为了尽量反应真实的顶点pagerank值,本发明从任意一顶点开始的随 机游走重复m轮。
附图说明
[0048]
图1为动态流图pagerank更新的增量计算方案变化示意图;图2为动态流图数据的变化示意图。
具体实施方式
[0049]
下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方 案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范 围不限于下述的实施例。
[0050]
实施例1
[0051]
本实施例提供一种基于随机游走的动态流图数据顶点重要性更新方法,包括以 下步骤:
[0052]
按照时间序列实时获取关联数据,实时更新动态流图数据;
[0053]
在每一时刻动态流图数据更新过程中获取受影响顶点和新增顶点;
[0054]
所述动态流图数据中的各个顶点通过预设的随机游走方式生成随机游走路径;
[0055]
根据所述随机游走路径经过各个所述受影响顶点的总次数,计算或更新各个受 影响顶点的pagerank值;
[0056]
将所述动态流图数据的原有顶点聚合为一个超顶点,并保留动态流图数据中新 增顶点的所有连接边,将这些连接边的另一端连接该超顶点,从而获取新图,该新 图的各个顶点通过预设的随机游走方式生成随机游走路径,根据所述随机游走路径 经过各个所述新增顶点的总次数,计算或更新各个新增顶点的pagerank值;
[0057]
所述随机游走方式具体为,某一顶点以α为概率向其他出边的后续顶点游走, 以出度的倒数为概率选择其任意出边游走,每个顶点以1-α为概率停止游走,如果 继续向后续的顶点游走,最多不超过r步,当遇到无出边的顶点时,即刻停止此 轮游走。
[0058]
作为一种优选的实施方式,从任意顶点开始的所述随机游走方式重复进行预设 的第一轮数。
[0059]
作为一种优选的实施方式,在每一时刻动态流图数据更新过程中,通过预设的 增量计算方式,更新各个顶点的pagerank值;所述动态流图数据更新过程形成的 变化包括新增边、新增顶点、删除顶点和删除边;
[0060]
所述增量计算方式包括:
[0061]
新增边第一处理步骤:若新增边e=(u,v)中顶点u和顶点v均为已有顶点,计 算经过顶点u增加的次数采用所述随机游走方式,从顶点u开始,进行轮 的随机游走,得到顶点u随机游走路径;
[0062]
若所述顶点u随机游走路径经过新增边e且经过任意顶点i,则在原有经过顶 点i的随机游走路径的总次数上加1,若所述顶点u随机游走路径不经过新增边e 但经过任意顶点i,原有经过顶点i的随机游走路径的次数上减1,从而计算并更 新各个顶点的pagerank
值。
[0063]
进一步地,所述增量计算方式还包括:
[0064]
新增边第二处理步骤:若新增边e为新增顶点和已有顶点的边,则将动态流图 数据的顶点总数量加一,并采用所述新增边第一处理步骤更新各个顶点的 pagerank值。
[0065]
进一步地,所述增量计算方式还包括:
[0066]
删除边第一处理步骤:若删除边e=(u,v)中顶点u和顶点v均为已有顶点,计 算导致经过顶点u减少的次数采用所述随机游走方式,随机选择顶点u的出度 顶点和顶点v作为起点进行轮的随机游走,得到顶点u随机游走路径;
[0067]
若从顶点u的出度顶点开始的所述顶点u随机游走路径经过任意顶点i,则在 原有经过顶点i的总次数上加1;如果从顶点v开始的所述顶点u随机游走路径经 过任意顶点i,则在原有经过顶点i的总次数上减1,从而计算并更新各个顶点的 pagerank值。
[0068]
进一步地,所述增量计算方式还包括:
[0069]
删除边第二处理步骤:若删除边e为删除一个顶点导致该边被删除,则将动态 流图数据的顶点总数量减一,并采用所述删除边第一处理步骤更新各个顶点的 pagerank值。
[0070]
进一步地,所述增量计算方式还包括:对动态流图数据更新过程形成的所述变 化依次处理,直至遍历所有变化。
[0071]
进一步地,所述动态流图数据更新过程中不受影响的顶点沿用该顶点原有的 pagerank值。
[0072]
本发明还提供一种基于随机游走的动态流图数据顶点重要性更新装置,包括存 储器和处理器,所述存储器存储有计算机程序,处理器调用所述计算机程序执行如 上所述的一种基于随机游走的动态流图数据顶点重要性更新方法。
[0073]
下面对本方法的关键部分进行具体描述。
[0074]
1)总体介绍
[0075]
在图1中,随着带有图变化信息的δg
t
的持续到达,根据声波传播原理确定受 δg
t
影响的顶点,通过随机游走方法增量式地更新这些顶点的pagerank,未受影响 的顶点沿用之前已计算得到的pagerank。在图1中,当新增顶点的到来时,需要 构造带有超顶点的新图,同样利用随机游走方法计算新增顶点的pagerank。从而 完成所有顶点的实时更新。
[0076]
2)动态流图建模和随机游走方式定义
[0077]
关联数据按照时间序列1,2,3,

,t,

源源不断地到达,从而得到动态流图数据 g1,g2,g3,

,g
t
,

。由于数据不会突变,因此满足g
t
=g
t-1
+δg
t
,其中δg
t
为t时 刻流图中顶点和边的增加或删除等图变化信息,g
t
为根据δg
t
中给定的图变化信息 而不断变化、从开始到t时刻累计的所有图数据。一般来说,δg
t
是个规模很小的 图,不妨记δg
t
=(δv,δe)=(δv0+δv
+
+δv-,δe
+
+δe-),其中δv0为新增或 删除边连接的g
t-1
中原有顶点集,δv
+
为t时刻新增加的顶点集,δv-为t时刻删 除的顶点集,δe
+
为t时刻新增加的边集,δe-为t时刻删除的边集。
[0078]
随机游走方式定义为:由图g=(v,e)中所有顶点开始以α为概率向其出边的后 续顶点游走,α也称为随机游走系数,以出度的倒数为概率选择其任意出边游走, 每个顶点以1-α为概率停止游走。如果继续向后续的顶点游走,最多不超过r步, 特别当遇到无出边的
息以及关注商品的变化,基于如上所述的一种基于随机游走的动态流图数据顶点重 要性更新方法,更新出商品的pagerank值,将更新后的排序较高的商品推荐给用 户。
[0097]
本实施例还提供一种用户朋友预测方法,该方法在社交网络上,根据社交信息, 基于如上所述的一种基于随机游走的动态流图数据顶点重要性更新方法,计算一用 户相连的其他用户的pagerank值,找到与该用户联系紧密的朋友圈。
[0098]
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员 无需创造性劳动就可以根据本发明的构思做出诸多修改和变化。因此,凡本技术领 域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的 实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1