基于关键词共现的研究热点图论分析方法

文档序号:6559421阅读:883来源:国知局
专利名称:基于关键词共现的研究热点图论分析方法
技术领域
本发明涉及一种文献知识分析管理技术领域,特别涉及一种基于关键词共现的研究热点图论分析方法。
背景技术
最近几年来,人们对文献管理的研究不断深入,研究的范围不断扩大,文献中标示的关键词范围越来越广,数量越来越多。文献中的关键词是技术内容的提示符,是作者学术思想及学术观点的凝炼,也是文献计量研究的重要指标。同时,有些关键词常常共同出现, 两个或更多关键词在同一篇文献中同时出现的现象,人们称之为关键词共现。关键词共现分析是文献计量学常用的一种重要的量化研究方法,这种方法以文献的关键词为基础,通过描述关键词与关键词之间的关联与结合,提示某一领域学术研究内容的内在相关性和学科领域的微观结构人们通过关键词的共现分析来了解学科的发展动态和发展趋势。某些关键词频频共现,说明这些关键词所反映的学科领域正在蓬勃发展,而且二关键词关系密切,人们通过比较不同时期共现的关键词便可获得关于学科发展、交叉、渗透和兴衰的趋势的相关知识。因此,基于关键词共现对现阶段学术界研究热点的分析,对把握学科的发展动态和发展趋势,具有重要的意义。例如,某一时期发现某一学科有相当一部分科学家的论文显示某两个或更多术语频频共现,便认为这种共现展示了该学科的一个新的蓬勃发展的研究领域。基于关键词共现分析还可以用于科技预测,发现新的学科增长点和突破口。例如,如果有文献研究表明术语A与术语B之间存在较强的共现关系,术语A与术语C之间也存在较强的共现关系,那么,可以推测术语B和术语C之间也可能存在某种关联,通过揭示术语 B和术语C之间的关系便有可能导致科学上的某种创新性发现。现阶段基于关键词共现进行研究热点分析的方法主要采用观察值矩阵表面分析, 这种分析方法通常只研究观察值矩阵所对应网络图的关联度,其分析的关键词局限于文献所列出的3-5个关键词,通常不能全面反应全文的综合内容及创新观点。且该方法在关键词共现的分析过程中,往往通过出现频次来定义关键词共现权重,对关键词之间的关联度研究分析达不到所想要的结果,分析出的关键词并未能覆盖本领域所需讨论的关键技术问题,难以提炼出有待挖掘的研究热点,更难以通过这种方法来展示学科的发展动态和发展趋势。

发明内容
为了解决上述技术问题,本发明提供一种基于关键词共现的研究热点图论分析方法,在文献数据库DB中的每篇文献中提取若干个关键词,其关键词并不局限于文献自身提供的关键词,再对关键词进行权重分析,结合基于赋权图的图论分析算法,得到研究热点关键词。本发明采用的技术解决方案是,一种基于关键词共现的研究热点图论分析方法,包括如下步骤a.从文献数据库DB中获取若干候选关键词Ii1, n2, n3,......,nm的步骤;b.根据上述关键词Iii在文献数据库DB中所有文献中的权重确定该关键词Iii的权值Wi的步骤;c.构建各关键词的无向赋权图G的步骤;d.根据无向赋权图G来求取研究热点关键词的步骤。进一步的,所述步骤a.从文献数据库DB中获取若干候选关键词ηι,η2,η3,......,
nm的步骤,包括al.从需要进行研究热点分析的文献数据库中选取每篇文献的若干关键词;a2.计算每个关键词在文献数据库中的所有文献中出现的频次;a 3.取频次从高到低排列的前m个关键词,依次记为叫,n2, n3,......,nm。更进一步的,所述步骤al.从需要进行研究热点分析的文献数据库中选取每篇文献的若干关键词,其方法是根据语义分析检索引擎选取每篇文献的若干关键词。进一步的,所述步骤b.根据上述关键词Iii在文献数据库DB中所有文献中的权重确定该关键词Ili的权值Wi的步骤,包括bl.根据语义分析检索引擎计算出关键词Iii在语义分析检索引擎中的权重值,权重值介于0到255之间;b2.计算所述的该关键词叫的权值为化
权利要求
1.一种基于关键词共现的研究热点图论分析方法,其特征在于,包括如下步骤a.从文献数据库DB中获取若干候选关键词n”n2,n3,......nm的步骤;b.根据上述关键词Iii在文献数据库DB中所有文献中的权重确定该关键词Iii的权值 Wi的步骤;C.构建各关键词的无向赋权图G的步骤;d.根据无向赋权图G来求取研究热点关键词的步骤。
2.根据权利要求1所述的一种基于关键词共现的研究热点图论分析方法,其特征在于,所述步骤a.从文献数据库DB中获取若干候选关键词ni,n2,n3,......nm的步骤,包括al.从需要进行研究热点分析的文献数据库中选取每篇文献的若干关键词; a2.计算每个关键词在文献数据库中的所有文献中出现的频次; a 3.取频次从高到低排列的前m个关键词,依次记为ni,n2,n3,......nm。
3.根据权利要求2所述的一种基于关键词共现的研究热点图论分析方法,其特征在于,所述步骤al.从需要进行研究热点分析的文献数据库中选取每篇文献的若干关键词, 其方法是运用语义分析检索引擎选取每篇文献的若干关键词。
4.根据权利要求1所述的一种基于关键词共现的研究热点图论分析方法,其特征在于,所述步骤b.根据上述关键词Iii在文献数据库DB中所有文献中的权重确定该关键词Iii 的权值Wi的步骤,包括bl.根据语义分析检索引擎计算出关键词Ili在语义分析检索引擎中的权重值,权重值介于0到255之间;T关键词《的权重倌b2·计算所述_关删值狄=巾文献总数
5.根据权利要求1所述的一种基于关键词共现的研究热点边连通度分析方法,其特征在于,所述步骤c.构建各关键词的无向赋权图G的步骤包括cl.建立关键词点集为In1, n2, n3,......nm},点权值集为Iw1, w2, w3,......wj ;c2.其中,若两个关键词Iii和η」在文献数据库DB的至少一篇文献中共现,则该两个关键词Iii和η」为赋权图中的一条边rvv
6.根据权利要求1所述的一种基于关键词共现的研究热点图论分析方法,其特征在于,所述步骤d.根据无向赋权图G来求取研究热点关键词的步骤包括dl.在无向赋权图G中,计算两顶点Iii和η」之间的距离d(ni,η」),所述的两顶点Iii和 η,·之间的距离d(ni,Iij)为点Iii到点…之间最短路所经的顶点数加1 ;d2.对于点叫,计算点叫的最大距离< =’W. m W.d3.根据点Iii的权值Wi和最大距离Cli来计算WiMi,再求出满足Z = nIfj关键词nt。
7.根据权利要求2或4或5或6所述的一种基于关键词共现的研究热点边连通度分析方法,其特征在于,所述步骤a 3、步骤1^2、步骤c、步骤d2和步骤d3中的2。
8.根据权利要求7所述的一种基于关键词共现的研究热点边连通度分析方法,其特征在于,所述的m = 100。
全文摘要
本发明提供一种基于关键词共现的研究热点图论分析方法,包括如下步骤a.从文献数据库DB中获取若干候选关键词n1,n2,n3,......,nm的步骤;b.根据上述关键词ni在文献数据库DB中所有文献中的权重确定该关键词ni的权值wi的步骤;c.构建各关键词的无向赋权图G的步骤;d.根据无向赋权图G来求取研究热点关键词的步骤。采用本发明的方法分析出的关键词能覆盖本领域所需讨论的关键技术问题,能够提炼出有待挖掘的研究热点,作为科技预测、发现新的学科增长点的突破口,从而推动学科的进步和发展。本发明的方法适用于文献知识分析管理技术领域,也同样适用于科学研究领域。
文档编号G06F17/30GK102214245SQ20111019390
公开日2011年10月12日 申请日期2011年7月12日 优先权日2011年7月12日
发明者吴一纯, 缪惠芳, 蔡岗全, 郑剑香, 陈少敏 申请人:厦门大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1