论文影响力的确定方法

文档序号:35140741发布日期:2023-08-17 16:01阅读:28来源:国知局
论文影响力的确定方法

本发明属于论文信息计量的,具体涉及一种论文影响力的确定方法。


背景技术:

1、基于文献被引频次的传统论文影响力计算方法已广泛应用于学术评价、科研绩效管理等领域,并衍生出了期刊影响因子if、科研人员h指数等一系列颇具影响力的计量指标,但这些方法均将所有的引用同等看待,未能有效区分不同引文内容之间的具体差异。同时,随着在线学术交流和出版形式的增加,越来越多的学术成果在互联网上被传播和在线引用,传统的学术论文评价方式已越来越不能满足全面、及时、客观地评价学术论文的需求,将论文的社会影响力指标altmetrics纳入评价体系逐渐成为研究人员关注的焦点。然而,当前对引文文本情感的自动识别仍以构建情感词典方法为主,准确率并不理想;对于社交媒体上提及学术论文的文本进行情感分析的研究也较少。因此,如何有效进行针对学术文本的情感识别、并融合论文的社会影响力指标、进而更细粒度地评价的论文影响力成为一个重要问题。


技术实现思路

1、本发明的目的在于针对现有技术的不足之处,提供一种论文影响力的确定方法,该方法实现了准确率更优的特定文本情感自动分类效果,并通过不同情感赋予不同权重的方式计算影响力指数,实现了更加细粒度的、能够区别不同引文内容和社交媒体提及内容的影响力计算方式。

2、为解决上述技术问题,本发明采用如下技术方案:

3、一种论文影响力的确定方法,包括如下步骤:

4、步骤1、获取待分析论文的施引文献全文,并对其进行数据预处理获得施引文献中的引文文本,并对其中部分引文文本进行标注获得引文文本的标签类别集;

5、步骤2、采用步骤1获得的引文文本的标签类别集作为训练集训练第一deepmoji模型,并采用训练后的第一deepmoji模型对未标注的引文文本进行情感分类;

6、步骤3、获取待分析论文的社交媒体提及文本,对部分社交媒体提及文本进行标注获得社交媒体提及文本的标签类别集,采用该标签类别集训练第二deepmoji模型,并采用训练完成的第二deepmoji模型对未标注的社交媒体提及文本进行情感分类;

7、步骤4、通过赋予步骤2得到的引文文本和步骤3的社交媒体提及文本中不同情感以不同权重的方式计算论文的影响力指数。

8、进一步地,步骤1具体包括如下子步骤:

9、s1.1、从数据库中获取待分析论文的被引文献全文及被引文献对应的施引文献全文,删除无法获取全文的被引文献全文和施引文本;

10、s1.2、将施引文献全文pdf转化为txt格式的文本,保留引用标记;

11、s1.3、利用正则表达式匹配引用标记的方法获取施引文献中的所有引文文本;

12、s1.4、构建引用对象、引用动机和引用情感的标签类别以及对应的划分标准;

13、s1.5、根据已确定的划分标准对引文文本的引用对象、引用动机和引用情感分别进行人工标注,并将引文文本转化为引文文本特征向量,得到引文文本的有标签集合。

14、进一步地,引用对象的标签类别包括背景、术语、方法和结论。

15、进一步地,引用动机包括的标签类别包括背景、基于、支持、批判、不同。

16、进一步地,引用情感的标签类别包括正面、中性、负面。

17、进一步地,步骤2具体包括以下子步骤:

18、s2.1初始化第一deepmoji模型的模型参数,将步骤1中得到的引文文本特征向量输入到第一deepmoji模型的第一层embedding层得到引文文本的embedding特征向量qi;

19、s2.2、将s2.1中得到的引文文本embedding特征向量qi输入第一deepmoji模型的第二层、第三层bilstm层中分别得到特征向量q′i和q″i;

20、s2.3、将s2.1中得到的embedding特征向量qi、s2.2中得到的特征向量q′i、q″i进行拼接,得到特征向量pi并将特征向量pi输入到第一deepmoji模型第三层的attention中得到引文文本的高维特征向量p″i;

21、s2.4、将p″i输入第一deepmoji模型的第四层softmax层,输出引文文本的引用情感、引用情感和引用动机的分类标签;

22、s2.5、以步骤1中得到的标注标签类别结合步骤2.4中得到的引文文本的引用情感、引用情感和引用动机的分类标签对第一deepmoji模型的模型参数进行训练,在训练过程中,建立损失函数,通过反向传播优化模型参数,直至损失函数收敛,得到优化后的第一deepmoji模型的模型参数;

23、s2.6、利用已训练好的第一deepmoji模型对未标注的引文文本的引用情感进行分类。

24、进一步地,步骤2.5中建立的损失函数为交叉熵损失函数l,其公式为:

25、

26、式中,为softmax层输出的引用情感标签,为输出的引用对象标签,为输出的引用动机标签;yi为训练集中人工标注的引用情感标签,y′i为训练集中人工标注的引用对象标签,yi为训练集中人工标注的引用动机标签;i=1,2,…,n,n表示样本总数;λ1和λ2均为模型参数。

27、进一步地,步骤3具体包括如下子步骤:

28、s3.1、在社交媒体平台上通过待分析被提及论文的标题或doi号进行检索,获取社交媒体提及文本;

29、s3.2、确定提及动机和提及情感的标签类别以及其对应的划分标准,并根据构建的标签类别及其划分标准对部分社交媒体提及文本的标签类别进行标注;

30、s3.3、将社交媒体提及文本转化为社交媒体提及文本特征向量,根据步骤s3.2得到的部分社交媒体提及文本的标签类别以及其对应的特征向量得到有标签集合,将集合内的社交媒体提及文本的特征向量逐层输入第二deepmoji模型中对其模型参数进行训练,并利用训练好的第二deepmoji模型对未标注的社交媒体提及文本的提及情感进行分类。

31、进一步地,提及动机的标签类别包括总结或引用文章的发现、批评或质疑文章的内容或发现、认可或推荐文章以及应用于现实生活,提及情感的标签类别包括中性、正面、负面。

32、进一步地,步骤4中构建的论文的影响力指数为:

33、

34、其中,w1为正面引用或提及的权重,w2为中性引用或提及的权重,w3为负面引用或提及的权重;ci为引文文本中的正面引用次数,c′i为引文文本中的中性引用次数,c″i为引文文本中的负面引用次数,ci+c′i+c″i=n;mi为社交媒体提及文本中的正面提及,m′i为社交媒体提及文本中的中性提及,m″i为社交媒体提及文本中的负面提及,mi+m′i+m″i=n′。

35、与现有技术相比,本发明的有益效果为:

36、1、本发明融合了传统的引文分析指标和新兴的altmetrics指标,既体现了论文的学术影响力,又体现了论文的大众关注度和社会影响力,能够更加全面深刻地揭示论文的实际影响力;

37、2、本发明利用人工标注的标签对deepmoji情感分类模型进行微调,提高了deepmoji模型对特定文本分类任务的特征提取能力,获得了更加准确的语义特征向量表示,实现了准确率更优的特定文本情感自动分类效果;

38、3、本发明构建了deepmoji模型的多任务学习框架,在引文文本情感分类任务中借助引用对象分类和引用动机分类两个辅助任务帮助模型训练、在社交媒体提及文本情感分类任务中借助提及动机这一辅助任务帮助模型训练,使其鲁棒性更佳;

39、4、本发明通过deepmoji模型实现了对引文文本和社交媒体上提及论文的文本的自动情感识别,并通过不同情感赋予不同权重的方式计算影响力指数,实现了更加细粒度的、能够区别不同引文内容和社交媒体提及内容的影响力计算方式。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1