一种期刊学术影响力的评估和预测方法与流程

文档序号:17541172发布日期:2019-04-29 14:36阅读:438来源:国知局
一种期刊学术影响力的评估和预测方法与流程

本发明属于学术期刊出版和编辑领域,具体涉及一种期刊学术影响力的评估和预测方法。



背景技术:

引文分析法是评价科技期刊学术质量的重要方法之一,其所采用的各种指标中,如被引总频次、影响因子、他引总引比、即年指数等,尤其以影响因子最为重要,在科技期刊的综合评价体系中被赋予较大的权重(柳晓丽.提高科技期刊影响因子的途径探讨.编辑学报,285-286(2006).)。

影响因子是指一本期刊在此前两年中出版的论文在该年度的被引次数总和与这些论文的总数量之比(fersht,a.themostinfluentialjournals:impactfactorandeigenfactor.proceedingsofthenationalacademyofsciencesoftheunitedstatesofamerica106,6883-6884,doi:10.1073/pnas.0903307106(2009).),期刊的影响因子反映了期刊影响力的等级关系,影响因子值越大,期刊影响力也就越大(pasterkamp,g.,rotmans,j.i.,dekleijn,d.v.p.&borst,c.citationfrequency:abiasedmeasureofresearchimpactsignificantlyinfluencedbythegeographicaloriginofresearcharticles.scientometrics70,153-165,doi:10.1007/s11192-007-0109-5(2007).)。人们已普遍认可的论文被引频次即论文质量,被引频次成了论文质量的代名词(vandiest,p.j.,holzel,h.,burnett,d.&crocker,j.impactitis:newcuresforanolddisease.jclinpathol54,817-819(2001).;seglen,p.o.whytheimpactfactorofjournalsshouldnotbeusedforevaluatingresearch.bmj314,497-497(1997).;hansen,h.b.&henriksen,j.h.howwelldoesjournal“impact”workintheassessmentofpapersonclinicalphysiologyandnuclearmedicine?clin.physiol.17,409-418(1997).;hachinski,v.theimpactofimpactfactors.stroke32,2729-2729,doi:doi10.1161/str.32.12.2729(2001).;garfield,e.journalimpactfactor:abriefreview.can.med.assoc.j.161,979-800(1999).;garfield,e.citationindexingforstudyingscience.nature,669-672(1970).;fassoulaki,a.,papilas,k.,paraskeva,a.&patris,k.impactfactorbiasandproposedadjustmentsforitsdetermination.actaanaesthesiolscand46,902-906(2002).)。期刊影响因子高,说明该期刊出版的论文的篇均被引频次高,也即该期刊出版了较多的高质量论文,因此期刊的影响因子反映了该期刊的学术影响力。

然而,影响因子依赖于期刊出版论文的被引频次,而在论文出版时或短时间内,论文被引频次的数据还未显现,因此此时利用论文频次并不能即时确定其所在期刊的影响力的高低。这就导致目前对期刊影响力的评价体系都是针对评价当年的此前两年的期刊被引频次的数据为依据,是滞后的。



技术实现要素:

本申请的发明目的是提供一种能够比较准确地、前瞻性地对期刊影响力进行评估和预测的方法。

为实现上述发明目的,本申请的技术方案如下:

一种期刊学术影响力的评估和预测方法,该评估方法包括以下步骤:

(1)获取待评估期刊的出版论文池,以wos期刊列表为依据,对出版论文池中的参考文献数据进行清洗以筛分出参考期刊,并获取参考期刊的去自引影响因子值ift和被引端半衰期λ,按式(ⅱ)计算参考期刊的去自引影响因子标准值ifnor:

ifnor=ift/λ(ⅱ);

(2)按照式(ⅵ)计算待评估期刊的期刊指数rfv_j:

rfv_j=∑ifnor(ⅵ);

(3)对不同待评估期刊的期刊指数rfv_j进行比较,根据比较结果评估或预测各待评估期刊的学术影响力。

本申请创造性地采用期刊指数rfv_j作为期刊学术影响力的评价指标,由式(ⅵ)可见,期刊指数rfv_j不依赖于极具不确定性的论文被引频次,而是由参考期刊的去自引影响因子标准值决定的。众所周知,参考期刊的去自引影响因子是一个确切值,是成熟的且为学术界所广泛认可和接受的,对于同一期刊而言,利用被引端半衰期对去自引影响因子值作标准化处理获得的去自引影响因子标准值波动性非常小,因此采用期刊指数rfv_j能十分准确地对期刊的学术影响力进行评估或预测,且评估或预测结果科学有效,具有前瞻性的特点。

由于期刊指数rfv_j所依赖的期刊去自引影响因子在论文发表之初就已经存在的且确定的,因此论文一经发表,期刊指数rfv_j即可赋值,这就意味着论文一旦发表就可以利用本申请的方法对期刊的学术影响力进行评估,具有即时性强、稳定性好、可操作性佳等特点,具有十分现实的指导意义。

为了验证期刊指数rfv_j对期刊学术影响力的前瞻性预测作用,本申请随机选取了某一esi学科在某一前溯时间段内的53种期刊,在评价时间节点时统计期刊的被引频次tcv_j,同时计算相应期刊的期刊指数rfv_j,并对tcv_j和rfv_j的相关性进行分析,期刊的被引频次tcv_j可以通过构建期刊与期刊论文被引频次矩阵,并按照式(ⅴ)计算:

tcv_j=∑tc(ⅴ);

式(ⅴ)中,tc表示期刊出版论文的被引频次。

分析发现,在前溯时间段即可确定的期刊指数rfv_j与该期刊在未来的被引频次tcv_j之间存在强相关关系,即期刊指数rfv_j高的期刊在后期也具有高被引频次tcv_j,期刊被引频次tcv_j越高,期刊的学术影响力就越大,这就表明期刊指数rfv_j确实能够前瞻性地对期刊的学术影响力进行评估或预测。

在上述的期刊学术影响力的评估和预测方法中,步骤(1)中,所述的数据清洗包括:

(1.1)剔除非期刊的参考文献,只保留参考来源为期刊的参考文献;

(1.2)剔除不属于wos期刊列表的参考期刊;

(1.3)将所有更名过的参考期刊的名称或issn号与wos期刊列表中期刊的名称或issn号修改为一致。

清洗期刊的目的在于,参考来源中只保留与wos期刊列表中的期刊相匹配的参考期刊,因为wos期刊的去自引影响因子是一种用于评价期刊质量的指标,已被学术界广泛认可并接受。当然,如果学术界出现了其他可以用来表征非期刊的参考来源质量的标准,本申请的评价方法也可以采用。

数据清洗完成后,便可以从wos期刊列表中获取参考期刊的去自引影响因子值和被引端半衰期。被引端半衰期(citedhalf-life)显示的是一份期刊从当前年度向前推算引用数占截止当前年度被引用期刊的总引用数50%的年数,是测度期刊老化速度的一种指标。

其中,被引端半衰期可以从wos期刊列表中获取,若wos期刊列表中,该参考期刊的被引端半衰期的标示为“>10”或“未知”,则统一取值为10。而参考期刊的去自引影响因子值,既可以直接从jcr(journalcitationreport)中获取,也可以按式(ⅰ)计算:

式(ⅰ)中,ift表示t年度该参考期刊的去自引影响因子值,dt-1和dt-2分别表示t-1和t-2年度该参考期刊出版的论文数量,ct表示d论文在t年度中获得的被引频次(不含期刊自引)。

在上述的期刊学术影响力的评估和预测方法中,步骤(2)中期刊指数rfv_j的计算方法可以采用如下两种方式:

其一,步骤(2)包括:构建待评估期刊与参考期刊矩阵,并根据待评估期刊与参考期刊矩阵,按计算式(ⅵ)计算待评估期刊的期刊指数rfv_j。

其二,步骤(2)包括:

(2.1)构建参考期刊与出版论文矩阵,并根据参考期刊与出版论文矩阵计算出版论文的参考期刊值rfv_d:

rfv_d=∑ifnor(ⅲ);

(2.2)构建待评估期刊与出版论文矩阵,并根据待评估期刊与出版论文矩阵计算待评估期刊的期刊指数rfv_j:

rfv_j=∑rfv_d(ⅳ)。

第二种计算方法是对第一种计算方法的分解,两者的思路是完全一致的。

与现有技术相比,本发明的有益效果为:

(1)本申请创造性地采用期刊指数rfv_j作为期刊影响力的评价指标,期刊指数rfv_j是由参考期刊的去自引影响因子标准值决定的;众所周知,参考期刊的去自引影响因子是一个确切值,是成熟的且为学术界所广泛认可和接受的,对于同一期刊而言,利用被引端半衰期对去自引影响因子值作标准化处理获得的去自引影响因子标准值波动性非常小,因此采用期刊指数rfv_j能比较准确地对期刊的学术影响力进行评估或预测,且评估或预测结果科学有效,具有前瞻性的特点。

(2)由于期刊指数rfv_j所依赖的期刊去自引影响因子在论文发表之初就已经存在的且确定的,因此论文一经发表,论文的参考期刊值rfv_d即可赋值,这就意味着论文一旦发表就可以利用本申请的方法对期刊影响力进行评估,具有即时性强、稳定性好、可操作性佳等特点,具有十分现实的指导意义。

附图说明

图1为期刊指数rfv_j与期刊被引频次tcv_j的关系的散点图;

图2为期刊指数对数值ln_rfv_j的数据分布直方图;

图3为期刊被引频次对数值ln_tcv_j的数据分布直方图。

具体实施方式

下面结合附图和具体实施方式对本发明的技术方案做进一步详细说明。

实施例1

本实施例一种期刊影响力的评估方法,该评估方法包括以下步骤:

(1)获取待评估期刊的出版论文池,对出版论文池中的参考文献数据进行清洗以筛分出参考期刊,并获取参考期刊的去自引影响因子值和被引端半衰期,对参考期刊的去自引影响因子作标准化处理;

a、获取待评估期刊的出版论文池:选择esi(essentialscienceindicator,esi)学科“spacescience”下的53种期刊,检索wos(webofscience,wos)数据库,选择论文出版的时间区间2015-2016,选择文献类型“article和review”获得论文29584篇,数据下载时间为2018年10月24日;

b、清洗数据:首先,剔除非期刊的参考文献,只保留参考来源为期刊的参考文献;然后,剔除不属于wos期刊列表的参考期刊;最后,将所有更名过的参考期刊的名称或issn号与wos期刊列表中期刊的名称或issn号修改为一致。

c、从wos期刊列表中获取参考期刊的去自引影响因子值ift和被引端半衰期λ:

其中,参考期刊的去自引影响因子值可以直接从jcr(journalcitationreport,jcr)中获取,也可以按式(ⅰ)计算:

式(ⅰ)中,ift表示t年度该参考期刊的去自引影响因子值,dt-1和dt-2分别表示t-1和t-2年度该参考期刊出版的论文数量,ct表示d论文在t年度中获得的被引频次(不含期刊自引);

d、根据式(ⅱ)对参考期刊的去自引影响因子值作标准化处理:

ifnor=ift/λ(ⅱ);

式(ⅱ)中,ifnor表示参考期刊的去自引影响因子标准值;

(2)构建参考期刊与出版论文矩阵,并根据参考期刊与出版论文矩阵计算出版论文的参考期刊值rfv_d:

rfv_d=∑ifnor(ⅲ);

构建出版论文与被引频次矩阵,并根据出版论文与被引频次矩阵计算出版论文的被引频次tc;

(3)构建待评估期刊与出版论文矩阵,并根据待评估期刊与出版论文矩阵和出版论文的参考期刊值rfv_d计算待评估期刊的期刊指数rfv_j:

rfv_j=∑rfv_d(ⅳ);

并根据待评估期刊与出版论文矩阵和出版论文的被引频次tc计算待评估期刊的被引频次tcv_j:

tcv_j=∑tc(ⅴ);

本实施例所选期刊以及计算获得的待评估期刊(以期刊的issn号表示)的被引频次tcv_j和参考期刊值rfv_j参见表1。

表1待评估期刊的issn号、被引频次tcv_j和期刊指数rfv_j一览

(4)用ibmspss22进行相关性分析,参见2和图1。

表2期刊指数rfv_j与被引频次tcv_j的相关性分析

注:**表示相关性在0.01(双尾)水平上显著。

由表2和图1可见,在esi学科“spacescience”学科类别下,期刊的rfv_j与tcv_j之间存在统计学意义上的强相关关系,表明期刊指数rfv_j可以用来评估期刊的学术影响力,rfv_j值越高,则期刊的学术影响力也越高。

实施例2泛化性验证

为验证该实证研究结论的泛化能力,选择与esi不同的学科分类体系,即选择wos的学科类别“geochemistrygeophysics”,检索wos数据库。选择该类别下的86种期刊,其论文的出版时间区间为2015-2016年;选择文献类型为“article和review”。获得论文20437篇,数据下载时间为2018年10月24日。

按照与实施例1中步骤(1)-(3)相同的方法计算期刊的被引频次tcv_j和期刊指数rfv_j(计算机结果见表3),分别获取被引频次tcv_j排名前5、前10、前20和前30名的期刊,获取期刊指数rfv_j排名前5、前10和前20的期刊,在该样本内对所有的86种期刊进行比对分析,对期刊指数rfv_j的评估结果进行验证,分析结果如表4。

表3待评估期刊的issn号、被引频次tcv_j和期刊指数rfv_j一览

表4泛化性对比分析

由表4可见,验证分析结果显示,(1)rfv_jtop5的期刊中有三种期刊进入了tcv_jtop5的行列,且rfv_jtop5的期刊全部进入了tcv_jtop10的行列;(2)rfv_jtop10的期刊中有4种期刊进入了tcv_jtop5的行列,有8种期刊进入了tcv_jtop10的行列,且rfv_jtop10的期刊全部进入了tcv_jtop20的行列;(3)rfv_jtop20的期刊中有4种期刊进入了tcv_jtop5的行列,有8种期刊进入了tcv_jtop10的行列,有15种期刊进入了tcv_jtop20的行列,且rfv_jtop20的期刊全部进入了tcv_jtop30的行列。

以上数据表明,在本次对照组的样本中,在该wos学科类别下,期刊指数rfv_j排名靠前的期刊,其对应的被引频次tcv_j排名也是靠前的。很明显地,两者的排名呈现出正相关关系。这与实施例1中得出的结论相吻合。因此,尽管学科分类体系不同,但在同一个学科类别下,该实证研究的结论是可靠的,具有泛化性。

实施例3构建回归模型以预测期刊被引频次

(1)获取数据

随机选择esi(essentialscienceindicator,esi)学科“spacescience”下的36种期刊,在wos(webofscience,wos)数据库检索,精炼“论文出版时间区间(2013-2014)和文献类型(article和review)”,获得论文19557篇。为提高模型的稳健性,分别对期刊被引频次tcv_j和期刊指数rfv_j作对数转换处理:

ln_rfv_j=ln(rfv_j)(ⅶ);

ln_tcv_j=ln(tcv_j)(ⅷ);

ln_rfv_j和ln_tcv_j分别为期刊指数和期刊被引频次的自然对数值。计算(期刊被引频次tcv_j和期刊指数rfv_j的计算方法与实施例1相同)和处理结果见表5。

表5tcv_j和rfv_j原始数据及其对数转换值

(2)使用软件ibmspss22获得期刊指数自然对数值ln_rfv_j和期刊被引频次自然对数值ln_tcv_j的数据分布直方图,见图2和图3;正态性检验见表6;构建一元线性回归模型,模型系数见表7。

表6正态性检验k-s和s-w值

由表6、图2和图3可见,期刊被引频次自然对数值ln_tcv_j和期刊指数自然对数值ln_rfv_j的w-s和s-w显著性值分别为0.200、0.717和0.151和0.314,大于设定的显著性0.05,因此两者近似正态分布。

表7系数a

注:a表示因变量ln_tcv_j。

表8模型摘要

表8中,r显示0.952,即ln_rfv_j和ln_tcv_j的皮尔森相关系数为0.952,调整后的r平方显示为0.903,即预测变量(ln_rfv_j)能够解释90.3%的因变量(ln_tcv_j)。表明本实施例的回归模型是可靠有效的。

根据ibmspss22计算的模型系数(见表7),获得回归模型方程为公式(ⅸ)。

式(ⅶ)中,x为期刊指数自然对数值ln_rfv_j,为期刊被引频次的预测值,标记为“tcv_j预测”。以这个模型检验表1,将表1的期刊被引频次tcv_j与模型计算的“tcv_j预测”对照,结果见表9。

表9表1样本tcv_j与模型预测值“tcv_j预测”对照

期刊被引频次样本值tcv_j(见表1)与预测值“tcv_j预测”的皮尔森和斯皮尔曼相关性分析见表10。

表10样本数据与预测值对照

注:**表示相关性在0.01(双尾)水平上显著。

由表10的相关系分析结果可以认为,本实施例的回归模型在本学科中的期刊被引频次的预测是行之有效的。根据斯皮尔曼的计算值,以该预测值排序来评估各期刊的学术影响力是可行的。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1