基于随机游走人员亲密度的计算系统及方法与流程

文档序号:12666287阅读:921来源:国知局
基于随机游走人员亲密度的计算系统及方法与流程

本发明涉及一种计算系统及方法,特别是涉及一种基于随机游走人员亲密度的计算系统及方法。



背景技术:

随机游走模型的基本思想是,从一个或一系列顶点开始遍历一张图,在任意一个顶点,遍历者将以概率1-A游走到这个顶点的邻居顶点,以概率A随机跳跃(teleport)到图中的任何一个顶点,称A为跳转发生概率。每次游走后得出一个概率分布,该概分布刻画了图中每一个顶点被访问到的概率,用这个概率分布作为下一次游走的输入并反复迭代这一过程当,满足一定前提条件时这个概率分布会趋于收敛收敛即可以得到一个稳定的概率分布。在数据挖掘领域,传统的都是利用随机游走模型,构造大量数据,根据随机游走数据分布特征,解决一些多标签分类问题、判断证券价格走势等。然而,这些方法需要构建大量数据,容易造成数据冗余,计算量大,耗时耗材。



技术实现要素:

本发明所要解决的技术问题是提供一种基于随机游走人员亲密度的计算系统及方法,其能够通过对随机游走算法的改进,使该方法执行效率更高,更加节省资源;通过使用最终收敛的转移矩阵作为亲密度的衡量,将人与人之间的关系更加准确。

本发明是通过下述技术方案来解决上述技术问题的:一种基于随机游走人员亲密度的计算系统,其包括语义网络引擎模块、亲密度计算推荐引擎模块,语义网络引擎模块与亲密度计算推荐引擎模块相连,其中语义网络引擎模块包括数据抽取模块、关系权重自动识别器模块,数据抽取模块与关系权重自动识别器模块相连;亲密度计算推荐引擎模块包括添加阻尼系数的随机游走训练模块、马尔可夫矩阵收敛性能评估模块,添加阻尼系数的随机游走训练模块与马尔可夫矩阵收敛性能评估模块相连。

优选地,所述数据抽取模块从实体库、属性库、关系库中将数据抽取到分布式图形数据库中。

优选地,所述关系权重自动识别器模块将分布式图形数据库中的数据按照权重进行计算形成多图模型的建立。

优选地,所述添加阻尼系数的随机游走训练模块使用随机游走训练算法,将多图模型的数据对相关人员进行处理,形成一个亲密度关系矩阵。

优选地,所述马尔可夫矩阵收敛性能评估模块做为对随机游走训练模块形成的矩阵进行正确性验证,验证完成后形成最终亲密度矩阵。

本发明还提供一种基于随机游走人员亲密度的计算方法,其包括以下步骤:

步骤一,抽取、清洗数据,构建包含人物实体与属性实体,以及实体与实体间的语义网络;

步骤二,通过对权重的匹配计算形成多图模型;

步骤三,对整个语义网络使用改进的随机游走算法进行计算;

步骤四,使用最终收敛的转移矩阵作为亲密度的衡量。

本发明的积极进步效果在于:本发明能够通过实体库、属性库、关系库,分布式图形数据库、关系权重自动识别器和关系权重规则器,构建一个大型语义网络;通过人与人之间关系既有直接关系,以及间接关系构建一个亲密度关系矩阵;在矩阵构建成功后,可以使用到不同的应用场景,使查询人际关系更加便捷。

附图说明

图1为本发明的结构示意图。

图2为本发明的流程图。

具体实施方式

下面结合附图给出本发明较佳实施例,以详细说明本发明的技术方案。

如图1所示,本发明基于随机游走人员亲密度的计算系统包括语义网络引擎模块、亲密度计算推荐引擎模块,语义网络引擎模块与亲密度计算推荐引擎模块相连,其中:

语义网络引擎模块包括数据抽取模块、关系权重自动识别器模块,数据抽取模块与关系权重自动识别器模块相连;

亲密度计算推荐引擎模块包括添加阻尼系数的随机游走训练模块、马尔可夫矩阵收敛性能评估模块,添加阻尼系数的随机游走训练模块与马尔可夫矩阵收敛性能评估模块相连。

所述数据抽取模块从实体库、属性库、关系库中将数据抽取到分布式图形数据库中。

所述关系权重自动识别器模块将分布式图形数据库中的数据按照权重进行计算形成多图模型的建立。

所述添加阻尼系数的随机游走训练模块使用随机游走训练算法,将多图模型的数据对相关人员进行处理,形成一个亲密度关系矩阵。

所述马尔可夫矩阵收敛性能评估模块做为对随机游走训练模块形成的矩阵进行正确性验证,验证完成后形成最终亲密度矩阵。

如图2所示,本发明基于随机游走人员亲密度的计算方法包括以下步骤:

步骤S1,抽取、清洗数据,构建包含人物实体与属性实体,以及实体与实体间的语义网络;将数据从外部数据库中抽取,清洗,然后存入分布式图形数据库中将模型持久化存储;

步骤S2,通过对权重的匹配计算形成多图模型;将分布式图形数据库中的多图模型与权重库中设置的计算权重进行匹配、计算形成多图模型;

步骤S3,对整个语义网络使用改进的随机游走算法进行计算;通过对随机算法改进,对步骤S2形成的多图模型进行计算,形成一个人员亲密度关系矩阵;

步骤S4,使用最终收敛的转移矩阵作为亲密度的衡量;主要是对步骤S3形成的矩阵进行衡量,衡量计算出现不稳定情况将会停止,如果是稳定矩阵那么就将稳定的矩阵关系存入数据库中。

以上所述的具体实施例,对本发明的解决的技术问题、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1