一种基于学术关系网络的专家学术距离评估方法

文档序号:9217252阅读:319来源:国知局
一种基于学术关系网络的专家学术距离评估方法
【技术领域】
[0001] 本发明涉及计算机应用领域,尤其是一种应用计算机评估专家学术距离的方法。
【背景技术】
[0002] 目前就是因为缺少科学合理的评价与评审的制度,所以在科技评价及评审中经常 出现由于主观因素产生的不公平现象。由于现有的评审机制对评审者和被评审者关系难以 把握,甚至有时候评审专家既是申请者也是评审者,这样易使得评审工作由于主观因素出 现的不公平现象。所以制定合理的回避制度对保证学术评价与评审的公平性起着至关重要 的作用。
[0003] 正确的回避评审专家对于评审公平性的保证具有不可估量的意义。评审专家也是 社会上的人,有着自己的关系网络,与其他很多人都存在着很多种的关系类型,但是在评审 的时候,评审专家的其他社会关系会影响专家的判断,对与自己关系密切的申请者的项目 的评分肯定要高于那些与自己关系不怎么强甚至没有关系的申请者的项目的评分。如果没 有对需要回避的评审专家进行回避,则每年选出来的各种项目基金可能不一定是优秀的, 而只是因为那个项目的申请者与评审该项目的专家的关系密切,从而使得该项目获得了高 分,这肯定对于其他的申报人来说是极为不公平的。
[0004] 判断两个人之间是否需要回避的依据是两个人之间的关系是否是强关系,而衡量 关系强弱需要考虑的是两个人之间的学术距离。而目前没有有效的评估方法来评估两个人 之间的学术距离。因此,目前回避评估技术落后,导致科技评价及评审结果不公正、不准确。

【发明内容】

[0005] 本发明提供一种专家学术距离评估方法,能判断两个人之间的关系强弱,有效评 估出是否回避,提高科技评价及评审的公平准确。
[0006] 为实现上述目的,本发明的技术方案如下:
[0007] 一种基于学术关系网络的专家学术距离评估方法,包括如下步骤:第一步,提取学 术社区结构特征、关系跳数结构特征、关系权重结构特征以及邻里重叠度结构特征;学术社 区结构特征区分两人是否在同一学术社区;学术关系跳数结构特征表示两人直接相连或达 到对方需通过人物的个数;学术关系权重结构特征表示在学术关系网络里,人物到其他人 物的权重值;邻里重叠度结构特征表示共同朋友的数量;第二步,使用变异系数的灰色关 联算法来综合评估以上的四个学术距离结构特征,得到综合的学术距离值。
[0008] 其中,学术社区结构特征取值:在一个学术社区里的人的学术社区特征值为1,不 在一个学术社区里的人的学术社区特征值为〇. 5。
[0009] 其中,提取学术社区结构特征时,采用社区层次化检测算法在学术关系网络上进 行社区划分,具体为:首先初始时假设网络中的每个节点都是一个独立的社团,对任意相邻 的节点i和节点j,计算将节点i加入其邻居节点j所在的社团时对应的模块度增量:
[0011] 其中,Si,in是节点与社团C内其他节点所有连边的权重和,W。是社团C内部所有 边的权重和,S。是所有与社团C内部的点相关联的边的权重和,W是网络中所有边的权值之 和,Si是节点i的权重值;
[0012] 计算节点i与所有邻居节点的模块度增量,然后选出其中最大的一个,当该值为 正时,把节点i加入相应的邻居节点所在的社团;否则,节点i留在原社团中,这种社团合并 过程重复进行,直到不再出现合并现象,这样就划分出了第一层社团;
[0013] 然后构造一个新网络,其中的节点是前一阶段划分出的社团,节点之间连边的权 重是两个社团之间所有连边的权重和,利用前面的方法对新网络进行社团划分,得到第二 层社团结构;以此类推,直到不能再划分出更高一层的社团结构为止。
[0014] 其中,学术关系跳数结构特征取值为:在学术关系网络里,如果两个人之间的关系 存在直接连接则这两个人之间的学术关系跳数特征值为1,如果没有直接相连但是可以通 过一个人物达到,则学术关系跳数特征值为2,依次这样下去,直到不可达为止。
[0015] 其中,计算学术关系权重时,先对整个学术关系网络里的权重值进行反转,即先除 掉那些没有直接相连而使权重值为〇的值,用学术关系网络里最大的权重值与学术关系网 络里最小的权重值进行交换,用第二大值与第二小值交换,按照此规则对整个学术关系网 络里的权重值进行交换,接着对学术关系网络里权重值为〇的人物节点的权重值进行值最 大化处理,最后去得到每个节点到其他节点的最短关系权重值。
[0016] 其中,邻里重叠度的定义如下:
[0018] 在公式(3-2)里,分母部分不包括A和B本身。
[0019] 其中,第二步包括:
[0020] 计算学术距离特征灰色关联指数,各个结构特征对每个人物的学术距离指数计算 如下:
[0022] 公式(3-3)表示的是该指标的测量值与最优值之间的差异与整个测量过程中最 好的曲线与最优曲线差异的比值,得到的是这个指标对该人物节点的学术距离贡献度,其 中测量值是指每个节点的四个结构特征的测量值,而最优值是指根据测量值来得到最好的 值,在公式(3-3)里巧〇〇表示的是第i个节点第k个(k= 1,2,3,4)个测量指标的学术 距离指数,P为分辨系数,用来减少因为八_过大而使上面那个函数失真的影响,A_和 Amin分别是测量值与最优值差异的最大值和最小值,计算如下:
[0023]
公式 (3-4)
[0024] 公式(3-4)表示的是所有学术距离特征的测量值与最优值之间差异的绝对值, △_和△min分别是公式(3-4)里的最大与最小值,表示的是测量曲线与最优曲线的差异, 其中X*(k)与Y*(k)分别表示的是测量值与最优值,其公式分别如公式(3-5)和公式(3-6) 所示:
[0025] Xi={X! (1),Xi⑵,Xi(3),Xi⑷} 公式(3-5)
[0026] 公式(3-5)表示的是四个学术距离结构特征的测量值,其中XiOn)表示第i个节 点的四个学术距离结构特征的测量值(m= 1,2,3,4),
[0027] Y= (y(l),y(2),y(3),y(4)) 公式(3-6)
[0028] 公式(3-6)表示的是综合整个学术关系网络得出的整个学术关系网络的测量学 术距离结构特征的最优序列,其中该序列中的y(m)是所有节点中的第m个回避指标因子值 的最优值;采用"均值法"对这些学术距离结构特征进行无量纲化处理,对公式(3-5)、公式 (3-6)里的结果处理后得到的比较数据序列分别如公式(3-7)和公式(3-9)所示:
[0030] 其中Xi(k)表示的是节点i的第k个结构特征值,aver(k)表示的是所有节点第k 个结构特征的平均值:
[0032] 无量纲化后得到的最优数据序列为:
[0034] 其中y(m)表示节点第m个结构特征的最优值,aver(m)表示的是第m个结构特征 的平均值。
[0035] 计算学术距离结构特征变异度权值,结构特征的权重计算如下:
[0037] 公式(3-10)表示各个结构特征权重值的计算,用该结构特征的标准差与其平均 值比值得到该结构特征的相对变异程度,vk表示的是该结构特征的权重值,xlk表示的该结 构特征测量的平均值,Sk表示的是所有结构特征的标准差,计算公式如下:
[0039] 公式(3-11)表示的是某个结构特征测量指标的标准差,用来反应各个结构特征 值的差异程度,其中Sk表示第k个结构特征的标准差,x, (k)是第i个节点第k个结构特征 的指标值;xlk表示第k个结构特征的平均值,对各个结构特征的变异系数值进行归一化处 理,使各个结构特征的权重值的范围在〇到1之间,并且四个结构特征的权重值之和为1,计 算公式如下:
[0041] 公式(3-12)表示的是各个结构特征权重归一化处理后的结果,其中vk表示的是 第k个结构特征的权重值;
[0042] 综合学术距离的计算,用各个结构特征的学术距离值乘以各个结构特征的权重 值
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1