本发明属于文献评估方法领域,特别是涉及一种基于多维特征的论文影响力评估方法。
背景技术:
目前主流的评估论文影响力的方法主要基于论文引用量,仅仅根据论文引用量将会面临以下问题:新论文没有或很少引用量,时间上更早发的论文相对于新论文在引用量上更有优势;平等对待每一个引用;仅仅使用论文引用量一个标准过于片面。
因此,如何解决上述问题成为本领域人员研究的重点。
技术实现要素:
本发明的目的就是提供一种基于多维特征的论文影响力评估方法,能有效弥补上述现有技术的不足之处。
本发明的目的通过下述技术方案来实现:
一种基于多维特征的论文影响力评估方法,该方法包括步骤:
1)通过计算机数据检索模块获取论文所属期刊的影响因子x1;
2)通过计算机数据检索模块获取论文的第一机构,及其排名x2;
3)通过计算机数据检索模块获取论文的第一作者的h-index值x3;
4)通过计算机的数据检索模块获取论文发表年份,通过信息处理模块和时间模块获得论文发表年份与现在时间的间隔x4,单位为年;
5)通过计算机数据检索模块获取论文关键词热度x5;
6)通过计算机数据检索模块获取论文被引用数x6;
7)通过计算机数据索引模块获取论文参考文献列表所有文献的期刊影响因子的综合因子x7;
8)通过计算机数据索引模块获取所有引用该论文的论文所发期刊影响因子的综合因子x8;
9)通过计算机数据检索模块获取总机构数n;
10)通过计算机数据处理模块将获得的数据代入公式,计算评估分数score:
作为优选,所述论文参考文献的期刊影响因子的综合因子的获取步骤为:
1)通过计算机获取所有的参考文献所发期刊影响因子集合set1{f1,f2,f3,……,fm};
2)通过计算机获取set1的四分位数;
3)根据set1的四分位数求得每一段的平均值a1,a2,a3,a4;
4)通过计算机计算论文参考文献的期刊影响因子:
x7=0.15×a1+0.2×a2+0.3×a3+0.35×a4。
作为优选,所述引用论文的论文所发期刊影响因子的综合因子的获取步骤为:
1)通过计算机获取所有引用该论文的论文所发期刊影响因子集合set2{g1,g2,g3,……,gu};
2)通过计算机获取set2的四分位数;
3)根据set2的四分位数求得每一段的平均值b1,b2,b3,b4;
4)通过计算机计算引用论文的论文所发期刊影响因子:
x8=0.15×b1+0.2×b2+0.3×b3+0.35×b4。
与现有技术相比,本发明的有益效果在于:
本发明根据除了引用量之外的其他特征获得相应的评估分数;对于一个论文的所有引用链接,其中优质引用给与更大的权值;从论文本身挖掘了所有的特征,来更优更全面的评估论文影响力。
具体实施方式
下面结合具体实施例对本发明作进一步的说明。
实施例一
一种基于多维特征的论文影响力评估方法,该方法包括步骤:
1)通过计算机数据检索模块获取论文所属期刊的影响因子x1,数据检索模块为基于大数据的信息检索系统,该信息检索系统通过互联网检索论文所属期刊的影响因子,期刊的影响因子是代表期刊影响大小的一项定量指标。也就是某刊平均每篇论文的被引用数,它实际上是某刊在某年被全部源刊物引证该刊前两年发表论文的次数,与该刊前两年所发表的全部源论文数之比;
2)通过计算机数据检索模块获取论文的第一机构,及其排名x2;
3)通过计算机数据检索模块获取论文的第一作者的h-index值x3,h-index值,即h指数,是一个混合量化指标,可用于评估研究人员的学术产出数量与学术产出水平;
4)通过计算机的数据检索模块获取论文发表年份,通过信息处理模块和时间模块获得论文发表年份与现在时间的间隔x4,单位为年,信息处理模块为计算机的处理器;
5)通过计算机数据检索模块获取论文关键词热度x5;
6)通过计算机数据检索模块获取论文被引用数x6;
7)通过计算机数据索引模块获取论文参考文献列表所有文献的期刊影响因子的综合因子x7;
8)通过计算机数据索引模块获取所有引用该论文的论文所发期刊影响因子的综合因子x8;
9)通过计算机数据检索模块获取总机构数n。
论文参考文献的期刊影响因子的综合因子的获取步骤为:
1)计算机通过数据检索模块和数据处理模块获取所有的参考文献所发期刊影响因子集合set1{f1,f2,f3,……,fm};
2)计算机通过数据处理模块获取set1的四分位数;
3)计算机通过数据处理模块根据set1的四分位数求得每一段的平均值a1,a2,a3,a4;
4)计算机通过数据处理模块将得到的数据代入公式,计算论文参考文献的期刊影响因子:
x7=0.15×a1+0.2×a2+0.3×a3+0.35×a4。
引用论文的论文所发期刊影响因子的综合因子的获取步骤为:
1)计算机通过数据检索模块和数据处理模块获取所有引用该论文的论文所发期刊影响因子集合set2{g1,g2,g3,……,gu};
2)计算机通过数据处理模块获取set2的四分位数;
3)计算机通过数据处理模块根据set2的四分位数求得每一段的平均值b1,b2,b3,b4;
4)计算机通过数据处理模块将得到的数据代入公式,计算引用论文的论文所发期刊影响因子:
x8=0.15×b1+0.2×b2+0.3×b3+0.35×b4。
其中
0.3*(0.5*x1+0.2*x7+0.3*x8)是与论文相关的期刊因子对论文影响力做出的贡献;
0.1*x5是论文关键词热度对论文影响力的影响。
本实施例中,综合考虑了与论文有关的所有因素,弥补了只考虑论文引用量单一指标所带来的片面评估;使新发的论文也可以相对其他评估方法得到一个更合理的影响力评分;除了引用量之外的其他特征获得相应的评估分数;对于一个论文的所有引用链接,其中优质引用给与更大的权值;从论文本身挖掘了所有的特征,来更优更全面的评估论文影响力。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。