一种基于共词和共引分析的中小学教育知识图谱分析系统的制作方法

文档序号:16880957发布日期:2019-02-15 22:08阅读:194来源:国知局
一种基于共词和共引分析的中小学教育知识图谱分析系统的制作方法
本发明属于中小学教育知识图谱分析
技术领域
,尤其涉及一种基于共词和共引分析的中小学教育知识图谱分析系统。
背景技术
:“知识图谱”是基于cnki中国期刊全文数据库,采用“主题”检索方式,选取关键词为“中小学教师教育”,时间节点设定为过去某一节点至今,来源类别选取为“核心期刊”与“cssci”,经过合理筛选共得到有效文献233篇,以此为样本对象。基于检索到的有效数据,采用聚类分析工具citespaceⅴ,定性与定量相结合,从多维度对样本进行统计分析、可视化处理,图谱中节点环的大小表示频次,外部带有小圈的节点环表示具有高中介中心度的关键节点。中介中心度高的节点对其它节点具有控制作用,可以体现出该节点在整个网络中的重要地位。对关键词的前五十位进行提取,将中文意义相同的关键词进行合并,统一表示,最终得到关键词共现频次和中心度统计表,现有技术存在为了更好的了解当前国内外学术界关于中小学教育领域研究的热点情况,以期能够为我国中小学教师教育发展提供参考的问题。技术实现要素:本发明提供一种基于共词和共引分析的中小学教育知识图谱分析系统,以解决上述
背景技术
中提出了现有技术存在为了更好的了解当前国内外学术界关于中小学教育领域研究的热点情况,以期能够为我国中小学教师教育发展提供参考的问题。本发明所解决的技术问题采用以下技术方案来实现:一种基于共词和共引分析的中小学教育知识图谱分析系统,包括:确定知识图谱相关的典型中小学教育知识刊物;将下载的典型中小学教育知识刊物的作者进行共引分析并生成刊物共引矩阵;将刊物共引矩阵进行多维尺度分析、聚类分析以及因子分析后绘制出中小学教育领域存在的主要学术知识以及关注热点的知识图谱。进一步,所述共引分析包括共词分析与共引分析。进一步,所述共引分析包括:根据典型中小学教育知识刊物的作者的被引频次,选择被引频次居于前100位的作者进行具有索引的共引分析并形成刊物共引矩阵。进一步,所述共引分析的索引包括:若刊物共引矩阵中n位作者同时被引用时,则确定所述n位作者与引用作者都是该专题研究的同业人员;若所述同业人员被引用频率越高,则确定所述同业人员之间的学科专业关系密切度高。进一步,所述刊物共引矩阵的映射表包括:序号作者在共引矩阵出现的频次刊物作者190name(1)285name(2)370name(3)465name(4)550name(5)………n10name(n)进一步,所述多维尺度分析包括:将刊物共引矩阵中高度相似性的刊物作者聚集在一起,形成学科研究的学术群体,并且在刊物共引矩阵中与其联系频次多的刊物作者确定为中小学教育领域内的核心作者。进一步,所述聚类分析包括:将每一个刊物作者看成一个独立类,将最近的两个独立类合并为一个聚合类,重新计算聚合类之间的距离,将距离最近的聚合类合并为一个扩充后的聚合类,将扩充后的聚合类反复聚合后形成最终的聚合类。进一步,将多维尺度分析分析后的刊物共引矩阵和聚类分析后的刊物共引矩阵结合为中小学教育领域存在的主要学术知识的知识图谱。进一步,所述因子分析包括:通过主成分分析法对刊物共引矩阵中的刊物作者进行分析,通过斜交转换来简化因子结构,根据刊物作者共引因子分析的结果,得到累计方差贡献率的主成分。进一步,将因子分析后的刊物共引矩阵结合为中小学教育领域存在的关注热点的知识图谱。有益技术效果:本专利采用确定知识图谱相关的典型中小学教育知识刊物;将下载的典型中小学教育知识刊物的作者进行共引分析并生成刊物共引矩阵;将刊物共引矩阵进行多维尺度分析、聚类分析以及因子分析后绘制出中小学教育领域存在的主要学术知识以及关注热点的知识图谱,由于知识图谱分析方法的基本思路是首先通过软件对所下载的文章作者进行共引分析,生成共引矩阵,在此基础上,利用软件进行多维尺度分析、聚类分析、因子分析,进而绘制出中小学教师教育的只是图谱,通过采用科学计量方法,通过对下载的文章的作者进行共引分析,生成共引矩阵,在此基础上,利用多维尺度分析、聚类分析、因子分析,绘制出我国中小学教师教育现状的知识图谱,从而形象揭示出该领域存在的三大主要学术群体及其关注热点。附图说明图1是本发明一种基于共词和共引分析的中小学教育知识图谱分析系统总流程图;图2是本发明一种基于共词和共引分析的中小学教育知识图谱分析系统的共词和共引分析流程图;图3是本发明一种基于共词和共引分析的中小学教育知识图谱分析系统的多维尺度分析、聚类分析以及因子分析流程图。具体实施方式以下结合附图对本发明做进一步描述:图中:s101-确定知识图谱相关的典型中小学教育知识刊物;s102-将下载的典型中小学教育知识刊物的作者进行共引分析并生成刊物共引矩阵;s103-将刊物共引矩阵进行多维尺度分析、聚类分析以及因子分析后绘制出中小学教育领域存在的主要学术知识以及关注热点的知识图谱;s201-根据典型中小学教育知识刊物的作者的被引频次;s202-选择被引频次居于前100位的作者进行具有索引的共引分析并形成刊物共引矩阵;s203-若刊物共引矩阵中n位作者同时被引用时,则确定所述n位作者与引用作者都是该专题研究的同业人员;s204-若所述同业人员被引用频率越高,则确定所述同业人员之间的学科专业关系密切度高;s301-将刊物共引矩阵中高度相似性的刊物作者聚集在一起,形成学科研究的学术群体,并且在刊物共引矩阵中与其联系频次多的刊物作者确定为中小学教育领域内的核心作者;s302-将每一个刊物作者看成一个独立类,将最近的两个独立类合并为一个聚合类,重新计算聚合类之间的距离,将距离最近的聚合类合并为一个扩充后的聚合类,将扩充后的聚合类反复聚合后形成最终的聚合类;s303-将多维尺度分析分析后的刊物共引矩阵和聚类分析后的刊物共引矩阵结合为中小学教育领域存在的主要学术知识的知识图谱;s304-通过主成分分析法对刊物共引矩阵中的刊物作者进行分析,通过斜交转换来简化因子结构,根据刊物作者共引因子分析的结果,得到累计方差贡献率的主成分;s305-将因子分析后的刊物共引矩阵结合为中小学教育领域存在的关注热点的知识图谱;实施例:本实施例:如图1所示,一种基于共词和共引分析的中小学教育知识图谱分析系统,包括:确定知识图谱相关的典型中小学教育知识刊物s101;将下载的典型中小学教育知识刊物的作者进行共引分析并生成刊物共引矩阵s102;将刊物共引矩阵进行多维尺度分析、聚类分析以及因子分析后绘制出中小学教育领域存在的主要学术知识以及关注热点的知识图谱s103。由于采用确定知识图谱相关的典型中小学教育知识刊物;将下载的典型中小学教育知识刊物的作者进行共引分析并生成刊物共引矩阵;将刊物共引矩阵进行多维尺度分析、聚类分析以及因子分析后绘制出中小学教育领域存在的主要学术知识以及关注热点的知识图谱,由于知识图谱分析方法的基本思路是首先通过软件对所下载的文章作者进行共引分析,生成共引矩阵,在此基础上,利用软件进行多维尺度分析、聚类分析、因子分析,进而绘制出中小学教师教育的只是图谱,通过采用科学计量方法,通过对下载的文章的作者进行共引分析,生成共引矩阵,在此基础上,利用多维尺度分析、聚类分析、因子分析,绘制出我国中小学教师教育现状的知识图谱,从而形象揭示出该领域存在的三大主要学术群体及其关注热点。如图2所示,所述共引分析包括共词分析与共引分析。所述共引分析包括:根据典型中小学教育知识刊物的作者的被引频次s201,选择被引频次居于前100位的作者进行具有索引的共引分析并形成刊物共引矩阵s202。由于采用所述共引分析包括共词分析与共引分析,所述共引分析包括:根据典型中小学教育知识刊物的作者的被引频次,选择被引频次居于前100位的作者进行具有索引的共引分析并形成刊物共引矩阵,由于利用相关软件进行共引分析,其中包括共词分析和共引分析,对作者的共现分析也称为作者共引分析,它是绘制只是图谱最基本的方法之一,根据作者被引频次居前100位的作者进行共引分析并生成共引矩阵,然后经分析软件得到相关系数矩阵。所述共引分析的索引包括:若刊物共引矩阵中n位作者同时被引用时,则确定所述n位作者与引用作者都是该专题研究的同业人员s203;若所述同业人员被引用频率越高,则确定所述同业人员之间的学科专业关系密切度高s204。由于采用所述共引分析的索引包括:若刊物共引矩阵中n位作者同时被引用时,则确定所述n位作者与引用作者都是该专题研究的同业人员;若所述同业人员被引用频率越高,则确定所述同业人员之间的学科专业关系密切度高,当n位作者被某一文献的作者同时引用时,则可认为这n为作者与引用作者都是该专题研究的同行,且被共引频率最高,说明他们之间的学科专业关系较为密切,在知识图谱中的位置也越接近,因此得到刊物共引矩阵的映射表。所述刊物共引矩阵的映射表包括:序号作者在共引矩阵出现的频次刊物作者190name(1)285name(2)370name(3)465name(4)550name(5)………n10name(n)如图3所示,所述多维尺度分析包括:将刊物共引矩阵中高度相似性的刊物作者聚集在一起,形成学科研究的学术群体,并且在刊物共引矩阵中与其联系频次多的刊物作者确定为中小学教育领域内的核心作者s301。由于采用所述多维尺度分析包括:将刊物共引矩阵中高度相似性的刊物作者聚集在一起,形成学科研究的学术群体,并且在刊物共引矩阵中与其联系频次多的刊物作者确定为中小学教育领域内的核心作者,由于通过多维尺度分析,多维尺度分析是通过低维空间,通常为二维空间展示对象之间的联系,并利用平面距离来反应对象之间的相似程度,在作者共引知识图谱中,作者的位置显示了作者之间的相似性,有高度相似性的作者聚集在一起,形成学科研究的无形学术群体,并且越在中间的作者表明与他有联系的作者越多,在学科里的位置也就越核心,因此,通过多维尺度分析,教育学术热点及其研究群体就非常容易判断。所述聚类分析包括:将每一个刊物作者看成一个独立类,将最近的两个独立类合并为一个聚合类,重新计算聚合类之间的距离,将距离最近的聚合类合并为一个扩充后的聚合类,将扩充后的聚合类反复聚合后形成最终的聚合类s302。由于采用将每一个刊物作者看成一个独立类,将最近的两个独立类合并为一个聚合类,重新计算聚合类之间的距离,将距离最近的聚合类合并为一个扩充后的聚合类,将扩充后的聚合类反复聚合后形成最终的聚合类,由于在统计学上把按照一定的要求和规律,对事物进行分类的方法,称为聚类分析,聚类化即是将一群异质的群体区隔为同构性质较高的群集或子群,聚类化并没有事先明确定义的类别来进行分类,非聚类化操作中,不需要事先定义好该如何分类,数据是依靠自身的相似性来聚类在一起的,而聚类的意义也是要靠事后的定性说明才能得知,由于使用系统逐次聚类分析法,对作者进行聚类时,首先将每一个作者看成独立的一类,再把最近的两类合并,然后重新计算类与类之间的距离,最后把距离最近的两类合并,每一步减少一类,一直持续到所有的作者归为一类。将多维尺度分析分析后的刊物共引矩阵和聚类分析后的刊物共引矩阵结合为中小学教育领域存在的主要学术知识的知识图谱s303。所述因子分析包括:通过主成分分析法对刊物共引矩阵中的刊物作者进行分析,通过斜交转换来简化因子结构,根据刊物作者共引因子分析的结果,得到累计方差贡献率的主成分s304。由于采用通过主成分分析法对刊物共引矩阵中的刊物作者进行分析,通过斜交转换来简化因子结构,根据刊物作者共引因子分析的结果,得到累计方差贡献率的主成分s304,由于由作者共引的因子分析可知中小学教育的研究领域中,学术领域1(“学龄前教育”研究领域)较为活跃,学术领域2(“小学教育”研究领域)最为活跃,学术领域2(“中学教育”研究领域)备受关注,由此,反映出当代中小学教育研究发展的新特点。将因子分析后的刊物共引矩阵结合为中小学教育领域存在的关注热点的知识图谱s305。由于站在系统论的角度,从整体上对中小学教育系统研究领域做出考察,理清了中小学教育中的各种关系,更好推动了我国基础教育事业的建设,增加了基础教育创新的能力。工作原理:本专利通过确定知识图谱相关的典型中小学教育知识刊物;将下载的典型中小学教育知识刊物的作者进行共引分析并生成刊物共引矩阵;将刊物共引矩阵进行多维尺度分析、聚类分析以及因子分析后绘制出中小学教育领域存在的主要学术知识以及关注热点的知识图谱,由于知识图谱分析方法的基本思路是首先通过软件对所下载的文章作者进行共引分析,生成共引矩阵,在此基础上,利用软件进行多维尺度分析、聚类分析、因子分析,进而绘制出中小学教师教育的只是图谱,通过采用科学计量方法,通过对下载的文章的作者进行共引分析,生成共引矩阵,在此基础上,利用多维尺度分析、聚类分析、因子分析,绘制出我国中小学教师教育现状的知识图谱,本发明解决了现有技术存在为了更好的了解当前国内外学术界关于中小学教育领域研究的热点情况,以期能够为我国中小学教师教育发展提供参考的问题,具有形象揭示出该领域存在的三大主要学术群体及其关注热点,教育学术热点及其研究群体就非常容易判断的有益技术效果。利用本发明的技术方案,或本领域的技术人员在本发明技术方案的启发下,设计出类似的技术方案,而达到上述技术效果的,均是落入本发明的保护范围。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1