一种基于引用传播网络的作者影响力计算方法

文档序号:8339735阅读:181来源:国知局
一种基于引用传播网络的作者影响力计算方法
【技术领域】
[0001] 本发明涉及一种基于引用传播网络的作者影响力计算方法。
【背景技术】
[0002] 近年来,分析与评估人或事的的影响力是社会关系网络理论与方法应用研宄中的 热点问题。对作者的影响力评估便是其中之一。传统的方法一般从作者发文数量,总被引 用次数,被引用文章篇数等来度量。这些方法简单快速,但也十分粗糙,暗藏着不公平、不合 理,使得评估结果备受争议。作者发文的数量固然能够在一定程度上反应其学术能力,然其 发文质量也应该加以权衡。
[0003] 传统的作者影响力评估方法一般从以下儿个方面来衡量:(1)用影响因子的概念 来评定杂志的影响力,即用某杂志近两年发表的论文被引用的次数和该杂志近两年发表的 论文总数的比值来确定杂志的影响因子,然而,这种通过度量杂志影响因子,从杂志整体质 量侧面来度量论文质量去评估作者影响力的方法缺乏时效性。(2)将PageRank算法引入到 论文引用网络中对论文以及期刊进行影响力评分从而对作者的影响力进行分析。一篇论文 的PageRank值是由所有引用它的其他文章的重要性经过递归算法得到的,但是,新发表论 文通常比旧论文应该更有创新性,虽然其被引用次数暂时不会很多,新论文的影响权重一 般应比旧论文的影响权重更大。PageRank算法忽略了新论文的创新性价值,并且在大规模 的引用网络中以递归思想为核心的PageRank算法的时间复杂度很高。另外,当某作者发表 的论文不仅被与其近关系作者引用,同时还被与其关系远的作者引用,说明其影响力是很 大的。所以,论文的影响力因素还应该考虑引用与被引用作者之间的关系的强弱和关系远 近,这些都是以论文为主体的引用网络忽略了作者关系,这是传统的随机游走模型算法所 欠缺的。
[0004] 因此,有必要设计一种基于引用传播网络的作者影响力计算方法。

【发明内容】

[0005] 本发明所要解决的技术问题是提供一种基于引用传播网络的作者影响力计算方 法,该基于引用传播网络的作者影响力计算方法得到的作者影响力指标更合理,且易于实 施,计算简便。
[0006] 发明的技术解决方案如下:
[0007] -种基于引用传播网络的作者影响力计算方法,包括以下步骤:
[0008] 步骤1 :建立引用关系网络和同事关系网络:基于论文公共信息数据库构造作者 引用关系网络和同事关系网络;
[0009] 步骤2 :建立引用传播网络:
[0010]引用传播网络为作者引用关系网络和同事关系网络的融合网络;
[0011] 首先以引用关系网络为基础,遍历分析引用关系,然后,获取存在引用关系的作者 之间存在的同事关系,按照引用关系双方的同事关系远近,计算引用传播网络中作者的引 用传播距离;并整合到引用关系的属性值中,得到引用传播网络;
[0012] 引用关系的属性值包括(1)作者k和j之间的引用传播距离值、(2)作者k和j 之间的存在的论文引用记录以及(3)每一次引用的属性,即该次引用是自引用还是非自引 用;
[0013] 步骤3 :基于引用传播网络计算作者的影响力Influence :
[0014] 计算公式,
【主权项】
1. 一种基于引用传播网络的作者影响力计算方法,其特征在于,包括以下步骤: 步骤1 :建立引用关系网络和同事关系网络:基于论文公共信息数据库构造作者引用 关系网络和同事关系网络; 步骤2:建立引用传播网络: 引用传播网络为作者引用关系网络和同事关系网络的融合网络; 首先以引用关系网络为基础,遍历分析引用关系,然后,获取存在引用关系的作者之间 存在的同事关系,按照引用关系双方的同事关系远近,计算引用传播网络中作者的引用传 播距离;并整合到引用关系的属性值中,得到引用传播网络; 引用关系的属性值包括(1)作者k和j之间的引用传播距离值、(2)作者k和j之间 的存在的论文引用记录以及(3)每一次引用的属性,即该次引用是自引用还是非自引用; 步骤3 :基于引用传播网络计算作者的影响力Influence : 计算公式)
其中,Ai为引用变量,若引用关系为自引用,则记为0.5,反之记为1 ; Dot表示在引用传播网络中作者引用关系的传播距离; Dsmax表示在引用传播网络中所有作者引用关系的传播距离中的最大值。
2. 根据权利要求1所述的基于引用传播网络的作者影响力计算方法,其特征在于,在 论文公共信息数据库中提取论文信息,论文信息包括论文名、作者、作者机构、发表时间和 参考文献,采用Ne 〇4j图数据库进行存储获取的所述论文信息; 若一篇文章与该文章引用的文章没有相同的作者,则该次引用为非自引用,若该2篇 文章有共同的作者,即至少有一个作者相同,则该次引用为自引用; 通过以下cypher语句求得A和B两个作者之间的最短路径; Start n = node ( ''A"),m = node ( "B")match p = shortestPath (n_ [r : cofforkRelation*. . ]-m)return p ; P为最短路径; 如果最短路径P存在,则该2个作者在同事关系网络中的关系最短路径距离长度 sprDistance = p. length ; 如果求得的最短路径不存在,即两作者之间在同事关系网络中不存在可达路径,那么 记 sprDistance = -1 ; 最终形成作者关系距离关系表; 对作者关系距离关系表中的数据进行以下修正: 对取值为-1的所有sprDistance进行修正,即将-1修正为Dsmax+1,Dsmax为网 络中的最大传播距离值,修正之后Ds_+1为整个网络中的最大传播距离值;公式
的〇3_为修正后的值。
【专利摘要】本发明公开了一种基于引用传播网络的作者影响力计算方法,包括以下步骤:步骤1:建立引用关系网络和同事关系网络:基于论文公共信息数据库构造作者引用关系网络和同事关系网络;步骤2:建立引用传播网络:引用传播网络为作者引用关系网络和同事关系网络的融合网络;步骤3:基于引用传播网络计算作者的影响力Influence:计算公式为该基于引用传播网络的作者影响力计算方法得到的作者影响力指标更合理,且易于实施,计算简便。
【IPC分类】G06F17-30
【公开号】CN104657488
【申请号】CN201510097738
【发明人】龙军, 刘旭, 黄芳, 赵贵虎
【申请人】中南大学
【公开日】2015年5月27日
【申请日】2015年3月5日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1