一种用于度量有向加权图中节点亲密度的推荐系统及方法

文档序号:6518912阅读:1670来源:国知局
一种用于度量有向加权图中节点亲密度的推荐系统及方法
【专利摘要】一种用于度量有向加权图中节点亲密度推荐系统及方法,(1)获得给定图中边的权重:根据用户的需求,给出图中边的权重定义,并根据此定义计算边的权重;(2)将给定图中边的权值进行归一化处理:获得边的权重之后,将边的权重进行归一化处理,以便之后计算非直接相连节点之间的亲密度;(3)获得给定图中节点的重要性度量:计算图中节点的重要性,在相同的拓扑结构下,重要的节点与给定节点之间的亲密度也应该较高;(4)在给定图中加入新的虚拟节点:在虚拟节点与已有节点之间加入边,并根据节点重要性为边指定权重(5)计算最终节点间亲密度结果:在修改之后的加权图上,利用重启型随机游走算法,计算出指定节点与其它节点之间的亲密度。
【专利说明】—种用于度量有向加权图中节点亲密度的推荐系统及方法
【技术领域】
[0001]本发明一种用于度量有向加权图中节点亲密度的推荐系统及方法,属于数据挖掘【技术领域】。
【背景技术】
[0002]在科学研究中,包括SNS、生物医学领域在内的许多领域问题都可以被抽象为图论问题,目前已经有许多应用都在处理这种基于图的知识表示,在这些应用中,发现k个感兴趣的实体之间的关联关系往往具有十分重要的意义,例如在公共安全领域,通过分析多个嫌疑人之间关系可以发现与所有嫌疑人都有较强联系的核心罪犯,在生物医学领域,通过分析基因与蛋白质之间关联关系,可以发现某种药物对疾病的影响,从而得到新的疾病治疗方法。
[0003]计算图中节点之间的亲密度是一个十分重要的图论挖掘任务,并且是与领域无关的。目前,针对加权图中节点之间的亲密度计算已经有许多方法,其中应用较为广泛的有CEPS算法、DAP算法和MING算法。CEPS算法采用随机游走方法计算两个节点之间亲密度,但该方法所需的空间复杂性较高,无法用于大规模图的挖掘任务。MING方法针对CEPS的缺点,采用了一种预处理方法,去除了一些无用的节点,在效率上得到了很大提升,但MING只能应用于无向图中,无法满足有向图中的挖掘任务。DAP方法提出了一种有向图中节点亲密度的度量算法,但该方法每次运算只能获得两个给定节点间的亲密度,而且计算过程涉及大量矩阵运算,算法复杂性较高。
[0004]除了效率与可扩展性之外,目前已有的方法都是利用图本身的链接结构特征来计算节点间的亲密度,从而得到推荐结果。这些方法在计算过程中往往只考虑图中边的权重而忽略了节点本身的重要性,这样就降低了最终推荐结果的准确性,使用户查询效率降低。

【发明内容】

[0005]本发明的技术解决问题是:克服现有技术的不足,提供一种用于度量有向加权图中节点亲密度的推荐系统及方法,能够得到更加准确的节点之间亲密度度量,提高了推荐的准确度,从而提高了用户的查询效率。
[0006]本发明技术解决方案:一种用于度量有向加权图中节点亲密度的推荐系统,包括:边权重计算模块、节点重要性度量模块和节点亲密度计算模块;
[0007]边权重计算模块,根据用户的需求,给出有向图中边的权重定义,根据此权重定义计算给定的有向图中所有边的权重并进行归一化处理;具体实现为:给出直连节点之间边权重的定义,节点亲密度在不同的领域中具有不同的定义,因此需要用户根据自己的实际需求给出边权重的明确定义;在有向图中,节点之间的亲密度关系属于单向关系,以I (A — B)表示节点A对节点B的亲密度,有I (A — B)古I (B — A);根据用户给出的边权重定义,计算给定有向图中所有边的权重;将所得到的边的权重进行归一化处理,使给定的有向图变为有向加权图;[0008]节点重要性度量模块,在边权重计算模块所产生的加权图基础上,根据加权图的链接结构特征以及节点自身属性特征,对于加权图中的每一个节点计算出一个重要性度量,然后在加权图中加入一个新的虚拟节点。在加权图中原有节点与虚拟节点之间加入有向边,并根据所得到的节点重要性度量为新加入的边指定权重,重要的节点所对应的边的权重也较高;同时,在加权图中虚拟节点和原有节点之间也加入有向边,并根据原有节点的出度为新加入的边指定权重。加入虚拟节点之后产生的有向加权图将输出至节点亲密度计算模块;
[0009]节点亲密度计算模块,利用边权重计算模块、节点重要性度量模块所产生的有向加权图,利用重启型随机游走算法,计算出指定节点与其它节点之间的亲密度,亲密度计算结果由原有节点的重要性与边的权重共同决定。
[0010]所述节点重要性度量模块中在新加入的虚拟节点到加权图中原有节点之间加入有向边,边的权重计算公式如下:
,
【权利要求】
1.一种用于度量有向加权图中节点亲密度的推荐系统,其特征在于包括:边权重计算模块、节点重要性度量模块和节点亲密度计算模块; 边权重计算模块,根据用户的需求,给出有向图中边的权重定义,根据此权重定义计算给定的有向图中所有边的权重并进行归一化处理;具体实现为:给出直连节点之间边权重的定义,节点亲密度在不同的领域中具有不同的定义,因此需要用户根据自己的实际需求给出边权重的明确定义;在有向图中,节点之间的亲密度关系属于单向关系,以I (A —B)表示节点A对节点B的亲密度,有I (A — B)古I (B — A);根据用户给出的边权重定义,计算给定有向图中所有边的权重;将所得到的边的权重进行归一化处理,使给定的有向图变为有向加权图; 节点重要性度量模块,在边权重计算模块所产生的加权图基础上,根据加权图的链接结构特征以及节点自身属性特征,对于加权图中的每一个节点计算出一个重要性度量,然后在加权图中加入一个新的虚拟节点。在加权图中原有节点与虚拟节点之间加入有向边,并根据所得到的节点重要性度量为新加入的边指定权重,重要的节点所对应的边的权重也较高;同时,在加权图中虚拟节点和原有节点之间也加入有向边,并根据原有节点的出度为新加入的边指定权重。加入虚拟节点之后产生的有向加权图将输出至节点亲密度计算模块; 节点亲密度计算模块,利用边权重计算模块、节点重要性度量模块所产生的有向加权图,利用重启型随机游走算法RWR,计算出指定节点与其它节点之间的亲密度,亲密度计算结果由原有节点的重要性与边的权重共同决定。
2.根据权利要求1所述的用于度量有向加权图中节点亲密度的推荐系统,其特征在于:所述节点重要性度量模块中在新加入的虚拟节点到加权图中原有节点之间加入有向边,边的权重计算公式如下:
3.根据权利要求1所述的用于度量有向加权图中节点亲密度的推荐系统,其特征在于:所述节点重要性度量模块中的加权图中原有节点到新加入的虚拟节点之间存在有向边,边的权重计算公式如下:
4.根据权利要求1所述的用于度量有向加权图中节点亲密度的推荐系统,其特征在于:所述节点亲密度计算模块中使用重启型随机游走算法RWR计算节点之间亲密度,计算公式如下:p(t+1) = (1-C).Wt.pt+c.E 其中Pt是n维列向量,表示第t次迭代后游走者到达加权图中各个节点的概率,η为给定加权图的节点数,c表示从任意节点直接返回出发点的返回概率,取值为0.15,w表示给定加权图的转移矩阵,T代表矩阵的转置,E是η维单位向量,若用户指定起始点为j,则E的第j维为I,其它维为O,初始时p° = E。
5.一种用于度量有向加权图中节点亲密度的推荐方法,其特征在于实现步骤如下:首先根据用户的需求,给出加权图中边的权重定义,根据此定义计算边的权重并进行归一化处理;获得给定图中节点的重要性度量,在相同的拓扑结构下,重要的节点与给定节点之间的亲密度也应该更高;在给定加权图中加入新的虚拟节点,在虚拟节点与已有节点之间加入有向边,并根据节点重要性为新加入的边指定权重;在修改之后的加权图上,利用重启型随机游走算法,计算出 指定节点与其它节点之间的亲密度。
【文档编号】G06F17/30GK103559407SQ201310566167
【公开日】2014年2月5日 申请日期:2013年11月14日 优先权日:2013年11月14日
【发明者】李超, 吕志强, 赵彩贝, 朱耿良 申请人:北京航空航天大学深圳研究院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1