一种基于baseline的期刊评价方法及评价装置的制造方法

文档序号:9646574阅读:568来源:国知局
一种基于baseline的期刊评价方法及评价装置的制造方法
【技术领域】
[0001]本发明涉及一种期刊评价方法,特别涉及一种基于baseline值的期刊评价方法及评价装置,属于计算机自然语言处理技术领域。
【背景技术】
[0002]期刊评价是文献计量学研究的重要组成部分,它通过对学术期刊的发展规律和增长趋势进行量化分析,揭示学科文献数量在期刊中的分布规律,为优化学术期刊的使用提供重要参考。合理的期刊评价一方面有助于优选高质量的期刊,从而为高水平的馆藏资源建设提供参考;另一方面有助于期刊编辑工作水平的提高,从而提升期刊学术水平。公平合理的期刊评价方法可以优化论文遴选结果,凸显前沿和热点论题、论著,鼓励科技创新,推动学术期刊质量水平的提高,促进期刊出版竞争机制的完善。
[0003]合理的学术期刊评价方法可以科学得进行期刊选定,并对期刊发展方向提供参考。但是传统的衡量论文重要性的算法以论文被引用量为衡量标准,对论文中的所有引文赋予相同的权重,无法突出具有新颖性、作为baseline的引文的重要性。所以对基于basel ine值的期刊评价方法的研究很有意义。
[0004]在衡量论文重要性指标中,最重要的是期刊影响因子、SJR (SCImago JournalRanking)。
[0005]期刊影响因子以期刊为对象,统计在一定时期内期刊论文的被引用程度。期刊影响因子计算论文量、时间、被引用次数三个因素。期刊影响因子的具体实现公式如下:
[0006]IF (k) = (nk !+nk 2) / (Nk !+Nk 2)
[0007]其中,IF为影响因子,k为某年,Nk !+Nk 2为该刊在前一两年发表的论文数量,n k i和nk 2为该刊在k年的被引用数量。即某刊在2015年的影响因子是其2014和2013两年刊载的论文在2015年的被引总数除该刊在2014和2013这两年的载文总数(可引论文)。
[0008]SJR指数同时考虑了期刊被应用的数量与质量,是基于Scopus数据库的数据应用与PageRank类似的算法提出的指标,它利用期刊之间的引用关系来计算期刊的重要性,将期刊A引用期刊B的次数解释为期刊A对期刊B所投的票数。这样,期刊B在期刊A处得到的分数为期刊A的得分(代表期刊A的重要性)乘以期刊A对期刊B所投的票数。
[0009]期刊影响因子、SJR等现存的指标存在的缺点是:①只考虑论文被其他论文引用、关注的重要性,未考虑论文本身的重要性;?属于“篇均”指标,因而综述性期刊因为综述论文被引次数多,持续时间长等特点数值出现膨胀,这对偏重原创性研究论文的期刊不利;③没有为原创性研究论文和综述论文赋予不同的权重,对有创新性、开拓性的论文带来不公平的评价结果。因此需要新的期刊评价的方法,解决以上问题。

【发明内容】

[0010]本发明的目的是为了期刊评价过程中出现的评价指标不公平的问题,提出一种基于baseline值的期刊评价方法及评价装置,同时考虑文章被关注度与新颖度。它的优势在于对引用的质量进行评估,赋予作为论文baseline的引文更高的权重,从而更公平、全面的对期刊进行评价。通过本发明方法可以综合考虑论文本身的质量以及“篇均”指标,从而对原创性研究论文和综述论文给出公平的评价结果。
[0011]本发明的目的是通过下述技术方案实现的:
[0012]—种基于论文baseline值的期刊评价的方法,其具体操作步骤为:
[0013]步骤一、计算期刊的baseline评价值Vbaseline;
[0014]对期刊的baseline评价值进行计算,这是对期刊引用质量的评价,具体步骤为:
[0015]步骤1.1:建立期刊的baseline引文的网络;
[0016]如果期刊A以期刊B的论文为baseline,代表在期刊网络中节点A指向节点B ;以此为基础建立期刊论文网络;
[0017]作为优选,期刊A是否以期刊B的论文为baseline使用预先训练好的baseline分类器判定。
[0018]所述baseline分类器通过以下过程进行训练:
[0019]步骤1.1.1:人工标注数据集,对于一篇文献,人工判断其引文中的哪些被作为baseline ;
[0020]步骤1.1.2:根据标注数据集,把源文献和其baseline构成的文献对,作为正例,生成特征向量;
[0021]步骤1.1.3:根据标注数据集,把源文献和其引文中不是baseline的文献构成的文献对作为负例,生成特征向量;
[0022]步骤1.1.4:使用多种分类模型进行训练和测试得到baseline分类器。
[0023]作为优选,所述特征向量包括标题相似度、摘要相似度、是否有相同作者、年份差和引文的引用次数。
[0024]步骤1.2:使用改进的PageRank算法,将期刊A以期刊B的论文为baseline的次数解释为期刊A对期刊B所投的票数,期刊B在期刊A处得到的分数为期刊A的得分乘以期刊A对期刊B所投的票数;
[0025]步骤1.3:根据期刊论文网络,将各期刊从其相邻期刊处所得的分数累加即为其更新后分数,返回步骤1.2迭代计算直到收敛,得到期刊的baseline评价值;
[0026]步骤二、计算期刊所有引用的评价值l_t;
[0027]对期刊的所有引用使用改进的PageRank算法进行迭代计算,这是对期刊引用数量的评价,具体步骤为:
[0028]步骤2.1:建立期刊引文网络;
[0029]期刊A引用期刊B的论文代表在期刊网络中节点A指向节点B。
[0030]步骤2.2:使用改进的PageRank算法,将期刊A引用期刊B的论文的次数解释为期刊A对期刊B所投的票数,期刊B在期刊A处得到的分数为期刊A的得分乘以期刊A对期刊B所投的票数;
[0031]步骤2.3:根据期刊引文网络,将各期刊从其相邻期刊处所得的分数累加即为其更新后分数,返回步骤2.2迭代计算直到收敛,得到期刊的引用评价值;
[0032]步骤三、综合Vbaseline以及V OTUnt得到基于baseline值的期刊评价指标V。
[0033]综合计算期刊的所有引用的评价值与baseline引用的评价值,获得平衡了期刊引用数量与引用质量的最终的期刊评价指标。
[0034]作为优选,V=a *Vbaseline+(l_a )*V_nt,其中a为V—在综合指标中所占的比重。
[0035]—种基于论文baseline值的期刊评价装置,包括baseline评价值计算模块、引用评价值计算模块和期刊评价指标计算模块,baseline评价值计算模块、引用评价值计算模块分别与期刊评价指标计算模块相连;
[0036]baseline评价值计算模块用于对输入计算期刊的baseline评价值并输出;
[0037]引用评价值计算模块用于对输入计算期刊的引用评价值并输出;
[0038]期刊评价指标计算模块用于根据baseline评价值和引用评价值计算期刊评价指标并输出。
[0039]作为优选,所述输入为待评价期刊的论文集合,其中论文参数包括标题、摘要、作者、发表年份、发表期刊、引文数量及其弓I用次数。
[0040]作为优选,baseline评价值计算模块由彼此相互连接的basel ine分类器、baseline引文网络建立单元、baseline初值设定单元、baseline值更新单元和baseline引文网络收敛评价单元组成;
[0041]baseline分类器用于对baseline引文网络建立单元输出的论文及其引文判定是否为baseline引文并反馈;
[0042]baseline引文网络建立单元根据输入以及baseline分类器反馈的结果建立baseline引文网络;
[0043]baselin
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1