一种基于赫希曼指数的中小学教育知识图谱分析方法及系统与流程

文档序号:17080787发布日期:2019-03-09 00:14阅读:191来源:国知局
一种基于赫希曼指数的中小学教育知识图谱分析方法及系统与流程
本发明属于中小学教育知识图谱分析
技术领域
,尤其涉及一种基于赫希曼指数的中小学教育知识图谱分析方法,本发明同时提供一种基于赫希曼指数的中小学教育知识图谱分析系统。
背景技术
:2005年美国物理学家hirsch提出了作为评价学者成就的指标赫希曼指数,获得了国际科学界的高度关注,已经称为了科学计量学领域的国际热点问题,braun等随后将赫希曼指数推广于评价期刊,逐渐称为评价学者、期刊的新方法,赫希曼指数的研究已经在多方面、多层次的展开,赫希曼指数的理念同样为研究热点的界定提供了新的思路,现有技术存在自借用赫希曼指数的方法确定科学研究的课题以来,国内将外赫希曼指数应用于中小学教育知识图谱的分析性研究较少,从而导致难以在中小学教育提供科学客观新的研究视角的问题。技术实现要素:本发明提供一种基于赫希曼指数的中小学教育知识图谱分析方法及系统,以解决上述
背景技术
中提出了现有技术存在自借用赫希曼指数的方法确定科学研究的课题以来,国内将外赫希曼指数应用于中小学教育知识图谱的分析性研究较少,从而导致难以在中小学教育提供科学客观新的研究视角的问题。本发明所解决的技术问题采用以下技术方案来实现:一种基于赫希曼指数的中小学教育知识图谱分析方法,包括:通过赫希曼指数界定高被引论文集合,以高被引论文集合中的文献关键词为节点,通过对关键词的频次和关键词之间的连接分析,确定中小学教育领域研究的热点和发展方向。进一步,所述通过赫希曼指数界定高被引论文集合包括:在世界任一学术期刊网络出版总库中选取知识图谱相关的图书分类,检索发表于相应时间段的核心期刊研究论文,将检索到的核心期刊研究论文按照被引频次降序排列,将排列后的核心期刊研究论文根据赫希曼指数统计出中小学教育领域相应时间段的各年的论文对应的赫希曼指数表。进一步,所述以高被引论文集合中的文献关键词为节点,通过对关键词的频次和关键词之间的连接分析包括:经赫希曼指数表与相应的知识图谱所需参数相应匹配,以关键词作为节点,选取每一时区被引频次最高的50个关键词,以最小生成树的方式对记录进行分析,绘制出聚类的中小学教育图谱。进一步,所述通过对关键词的频次和关键词之间的连接分析还包括聚类图谱分析;所述聚类图谱分析包括:根据关键词的词频统计,确定各个节点相对应的高频词频,将每个高频词频作为一个节点,每个节点的大小表示相应的关键词出现的频次的高低,每个节点的颜色和宽度表示相应的关键词在时间维度上出现与发展的序列和频次,每个节点之间的连线代表关键词在相应的文献中出现的频次以及与其他关键词的联系。进一步,所述通过对关键词的频次和关键词之间的连接分析还包括时区图谱分析;所述时区图谱分析包括将中小学教育图谱中一系列表示时区的条形区域按时间顺序从左向右依次排列,将排列后的图谱确定为研究前沿指向知识基础。进一步,所述通过对关键词的频次和关键词之间的连接分析还包括节点分析;所述节点分析包括将共引网络中2个以上的聚类群组且具有中介作用的节点确定为关键节点,将关键节点确定为研究热点。进一步,所述世界任一学术期刊网络出版总库包括中国学术期刊网络出版总库,所述知识图谱相关的图书分类包括中小学教育分类,所述相应时间段包括2000年至今的检索时间范围。进一步,所述赫希曼指数表为:论文发表年份赫希曼指数200061200162200266……201860进一步,所述赫希曼指数表与相应的知识图谱所需参数相应匹配包括选择以时间切片为1年的时间跨度,相应的时间跨度中的主题来源为标题、摘要、主题词、标识符,所述主题词为爆发词。同时,本发明还提供一种基于赫希曼指数的中小学教育知识图谱分析系统,包括知识图谱分析模块;所述知识图谱分析模块用于:通过赫希曼指数界定高被引论文集合,以高被引论文集合中的文献关键词为节点,通过对关键词的频次和关键词之间的连接分析,确定中小学教育领域研究的热点和发展方向。有益技术效果:本专利采用通过赫希曼指数界定高被引论文集合,以高被引论文集合中的文献关键词为节点,通过对关键词的频次和关键词之间的连接分析,确定中小学教育领域研究的热点和发展方向,由于为了准确的分析本世纪以来我国中小学教育领域的研究热点,引入赫希曼指数的定义来界定高被引论文,然后通过分析工具,以文献关键词作为节点,通过对关键词的频次和关键词之间的连接分析,体现了中小学教育领域研究的热点和发展的方向,本专利通过我国中小学教育领域的高被引论文作为研究对象,借鉴赫希曼指数的评价指标,通过最新的信息可视化技术的分析和处理,绘制出知识图谱,展示了我国中小学教育领域发展所依赖的知识基础以及前沿的发展趋势。附图说明图1是本发明一种基于赫希曼指数的中小学教育知识图谱分析方法总流程图;图2是本发明一种基于赫希曼指数的中小学教育知识图谱分析系统的关键字聚类图谱;图3是本发明一种基于赫希曼指数的中小学教育知识图谱分析系统的时区图谱;具体实施方式以下结合附图对本发明做进一步描述:图中:s101-通过赫希曼指数界定高被引论文集合;s102-以高被引论文集合中的文献关键词为节点;s103-通过对关键词的频次和关键词之间的连接分析;s104-确定中小学教育领域研究的热点和发展方向;实施例:本实施例:如图1所示,一种基于赫希曼指数的中小学教育知识图谱分析方法,包括:通过赫希曼指数界定高被引论文集合s101,以高被引论文集合中的文献关键词为节点s102,通过对关键词的频次和关键词之间的连接分析s103,确定中小学教育领域研究的热点和发展方向s104。由于采用通过赫希曼指数界定高被引论文集合s101,以高被引论文集合中的文献关键词为节点s102,通过对关键词的频次和关键词之间的连接分析s103,确定中小学教育领域研究的热点和发展方向s104,由于为了准确的分析本世纪以来我国中小学教育领域的研究热点,引入赫希曼指数的定义来界定高被引论文,然后通过分析工具,以文献关键词作为节点,通过对关键词的频次和关键词之间的连接分析s103,体现了中小学教育领域研究的热点和发展的方向,本专利通过我国中小学教育领域的高被引论文作为研究对象,借鉴赫希曼指数的评价指标,通过最新的信息可视化技术的分析和处理,绘制出知识图谱,展示了我国中小学教育领域发展所依赖的知识基础以及前沿的发展趋势。所述通过赫希曼指数界定高被引论文集合s101包括:在世界任一学术期刊网络出版总库中选取知识图谱相关的图书分类,检索发表于相应时间段的核心期刊研究论文,将检索到的核心期刊研究论文按照被引频次降序排列,将排列后的核心期刊研究论文根据赫希曼指数统计出中小学教育领域相应时间段的各年的论文对应的赫希曼指数表。由于采用所述通过赫希曼指数界定高被引论文集合s101包括在世界任一学术期刊网络出版总库中选取知识图谱相关的图书分类,检索发表于相应时间段的核心期刊研究论文,将检索到的核心期刊研究论文按照被引频次降序排列,将排列后的核心期刊研究论文根据赫希曼指数统计出中小学教育领域相应时间段的各年的论文对应的赫希曼指数表,由于本专利利用cnki数据库中的中国学术期刊网络出版总库,选取“图书情报与数字图书馆”分类,分别检索发表于2000年至今的核心期刊研究论文,按照被引频次降序排列,根据前文对赫希曼指数的定义,统计出中小学教育领域2000年至今各年的论文的赫希曼指数并形成赫希曼指数表。所述以高被引论文集合中的文献关键词为节点s102,通过对关键词的频次和关键词之间的连接分析s103包括:经赫希曼指数表与相应的知识图谱所需参数相应匹配,以关键词作为节点,选取每一时区被引频次最高的50个关键词,以最小生成树的方式对记录进行分析,绘制出聚类的中小学教育图谱。由于采用经赫希曼指数表与相应的知识图谱所需参数相应匹配,以关键词作为节点,选取每一时区被引频次最高的50个关键词,以最小生成树的方式对记录进行分析,绘制出聚类的中小学教育图谱,由于将统计出来的687篇文献记录输出保存,转换为可以识别的标准格式,然后对需要的参数进行配置,选择时间跨度为时间切片为1年来,主体来源为标题、摘要、主题词、标识符,主体词类型为爆发词,以关键词作为节点,选却每一时区被引频次最高的50个关键词,以最小生成树的方式对记录进行分析,绘制出聚类的图谱。如图2所示,所述通过对关键词的频次和关键词之间的连接分析s103还包括聚类图谱分析;所述聚类图谱分析包括:根据关键词的词频统计,确定各个节点相对应的高频词频,将每个高频词频作为一个节点,每个节点的大小表示相应的关键词出现的频次的高低,每个节点的颜色和宽度表示相应的关键词在时间维度上出现与发展的序列和频次,每个节点之间的连线代表关键词在相应的文献中出现的频次以及与其他关键词的联系。由于采用所述聚类图谱分析包括根据关键词的词频统计,确定各个节点相对应的高频词频,将每个高频词频作为一个节点,每个节点的大小表示相应的关键词出现的频次的高低,每个节点的颜色和宽度表示相应的关键词在时间维度上出现与发展的序列和频次,每个节点之间的连线代表关键词在相应的文献中出现的频次以及与其他关键词的联系,由于根据网络节点的组配,绘制出中小学教育领域高被引论文中关键词的分析图谱,图谱中有630个节点,1200条连线组成,即分析文献中有630个关键词通过1200条连线进行组配,根据关键词的词频统计,出现频次较高的有“中小学德育发展”、“学龄前智育发展”“中学生兴趣培养”等关键词,这和聚类视图中显示出的各个节点相对应,每个节点代表一个关键词,节点的大小表示这个关键词出现的频次的高低,节点的年轮颜色和宽度代表关键词在时间维度上出现与发展的序列和频次,节点之间连线代表关键词在文章中出现的频次以及与其他关键词的联系,同时,在图谱中没有显示出来的,还有一些散落在四周的小节点,它们与图谱的中心没有直接的关联,如期刊学科分类、期刊评价以及赫希曼指数等,但反应出我国近12年来中小学教育领域的新兴研究以及与其他领域相结合尚不成熟的研究。如图3所示,所述通过对关键词的频次和关键词之间的连接分析s103还包括时区图谱分析;所述时区图谱分析包括将中小学教育图谱中一系列表示时区的条形区域按时间顺序从左向右依次排列,将排列后的图谱确定为研究前沿指向知识基础。由于采用所述通过对关键词的频次和关键词之间的连接分析s103还包括时区图谱分析;所述时区图谱分析包括将中小学教育图谱中一系列表示时区的条形区域按时间顺序从左向右依次排列,将排列后的图谱确定为研究前沿指向知识基础,由于对关键词聚类进行时区分析,绘制出中小学教育领域高被引文献中文关键词时区图谱,该时区图谱是由一系列表示时区的条形区域组成,时区按时间顺序从左向右排列,因而研究前沿指向知识基础。所述通过对关键词的频次和关键词之间的连接分析s103还包括节点分析;所述节点分析包括将共引网络中2个以上的聚类群组且具有中介作用的节点确定为关键节点,将关键节点确定为研究热点。由于采用述通过对关键词的频次和关键词之间的连接分析s103还包括节点分析,所述节点分析包括将共引网络中2个以上的聚类群组且具有中介作用的节点确定为关键节点,将关键节点确定为研究热点,由于共引网络中有7个关键节点,关键节点是共引网络中连接2个以上聚类群组且具有中介作用的节点,包括中学生、小学生、学龄前儿童等,关键节点反映了当前的研究热点,这7个关键节点,都是围绕中小学教育这一主体在中小学教育中的基础性研究,反映出一直以来的主流研究主题。所述世界任一学术期刊网络出版总库包括中国学术期刊网络出版总库,所述知识图谱相关的图书分类包括中小学教育分类,所述相应时间段包括2000年至今的检索时间范围。所述赫希曼指数表为:论文发表年份赫希曼指数200061200162200266……201860所述赫希曼指数表与相应的知识图谱所需参数相应匹配包括选择以时间切片为1年的时间跨度,相应的时间跨度中的主题来源为标题、摘要、主题词、标识符,所述主题词为爆发词。一种基于赫希曼指数的中小学教育知识图谱分析系统,包括知识图谱分析模块;所述知识图谱分析模块用于:通过赫希曼指数界定高被引论文集合s101,以高被引论文集合中的文献关键词为节点s102,通过对关键词的频次和关键词之间的连接分析s103,确定中小学教育领域研究的热点和发展方向s104。本发明还提供一种基于赫希曼指数的中小学教育知识图谱分析系统,由于知识图谱是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体、挖掘、分析、构建、绘制和显示只是以及他们之间的相互关联,为信息可视化领域提供多元、分时、动态的第二代信息可视化技术,它能够绘制科学知识图谱,显示一个学科和知识域在一定时期发展的趋势和动向,形成若干研究前沿领域的演进历程。工作原理:本专利通过赫希曼指数界定高被引论文集合,以高被引论文集合中的文献关键词为节点,通过对关键词的频次和关键词之间的连接分析,确定中小学教育领域研究的热点和发展方向,由于为了准确的分析本世纪以来我国中小学教育领域的研究热点,引入赫希曼指数的定义来界定高被引论文,然后通过分析工具,以文献关键词作为节点,通过对关键词的频次和关键词之间的连接分析,体现了中小学教育领域研究的热点和发展的方向,本专利通过我国中小学教育领域的高被引论文作为研究对象,借鉴赫希曼指数的评价指标,通过最新的信息可视化技术的分析和处理,绘制出知识图谱,展示了我国中小学教育领域发展所依赖的知识基础以及前沿的发展趋势,本发明解决了现有技术存在自借用赫希曼指数的方法确定科学研究的课题以来,国内将外赫希曼指数应用于中小学教育知识图谱的分析性研究较少,从而导致难以在中小学教育提供科学客观新的研究视角的问题,具有展示了我国中小学教育领域发展所依赖的知识基础以及前沿的发展趋势的有益技术效果。利用本发明的技术方案,或本领域的技术人员在本发明技术方案的启发下,设计出类似的技术方案,而达到上述技术效果的,均是落入本发明的保护范围。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1