本发明涉及英语教材分析,更具体地说,它涉及一种英语教材分析方法。
背景技术:
1、尽管大学英语教材历年来培养学生的综合语言能力方面有着很大建树,但其中的文化呈现却仍出现失衡的现象,主要表现为文化呈现内容和文化呈现方式两个方面的失衡,这也就意味着为了响应国家推进本国国际传播力的建设,大学教材中的文化呈现方式仍需改进。为助力高校通识教育、进一步精进大学英语教材的编写,培养拥有国际传播力人才以及强化其跨文化交流能力,满足“中国情怀”与“国际视野”并重的人才素质培养要求,现阶段对大学英语教材中的文化呈现进行分析显得尤为重要,但是对于英语教材的跨文化能力培养的分析本质上还是要分析其对于学生的影响,但是这部分数据需要采访学生来获取,来源较为困难。
技术实现思路
1、本发明提供一种英语教材分析方法,解决相关技术中对于英语教材的跨文化能力培养的分析的数据来源困难导致无法准确分析的技术问题。
2、本发明提供了一种英语教材分析方法,包括以下步骤:
3、步骤11,提取英语教材使用知识图谱;
4、步骤12,对英语教材中的实体进行矢量化,生成第一实体矢量;
5、步骤13,将英语教材使用知识图谱中的实体映射为节点,以节点为中心随机游走为实体生成实体顶点集;
6、步骤14,为所有实体对应的节点生成第二实体矢量,对于其中一个节点v,首先计算节点v在实体顶点集的1层的多个中间矢量,将这些中间矢量标记为中心矢量;计算节点v在第2-n层的中间矢量,并标记为非中心矢量,n为图结构的最大层数;
7、步骤15,以中心矢量为中心对非中心矢量进行聚类生成多个聚类簇,为每个聚类簇生成一个簇中心,基于所有的簇中心计算节点v第二实体矢量;
8、节点v的第二实体矢量vz的计算公式如下:
9、
10、其中,cy表示第y个簇中心,y表示簇中心的数量,w表示变换权值,b表示变换偏置,σ表示sigmod激活函数,表示节点v对应的第一实体矢量。
11、节点v在第h层的第i个中间矢量的计算公式如下:
12、
13、
14、
15、其中,w表示变换权值,b表示变换偏置,σ表示sigmod激活函数,表示中的第i个随机子集,表示节点v在图结构的第h层与其连接的节点的集合,表示节点e的第一实体矢量,表示节点v的第一实体矢量,ρ表示伸缩系数,缺省值为0.2或第一实体矢量的分量数的倒数;
16、节点v在第h层的第i个中间矢量和节点v的第二实体矢量分别由图神经网络的第一隐藏层和第二隐藏层进行计算,图神经网络训练时输出连接分类器,分类器输入节点的第二实体矢量,以学生传播的融合文化知识表示的实体的节点的第二实体矢量输入分类器,对应的实体类型包括源于英语教材的指导和不源于英语教材的指导;
17、步骤16,通过训练的图神经网络以及分类器对所有以学生传播的融合文化知识表示的实体的类型进行判别。
18、进一步地,英语教材使用知识图谱中的实体包括:英语教材、学生、融合文化知识。
19、进一步地,文本类型的实体,通过词向量生成的方法来进行向量化表示。
20、进一步地,图片类型的实体,通过卷积神经网络进行向量化表示。
21、进一步地,以节点为中心随机游走为实体生成实体顶点集的方法包括:
22、步骤21,以当前待建立实体顶点集的节点为中心开始进行随机游走,直至游走的步数达到步数阈值;
23、步骤22,将游走的节点加入实体顶点集内,如果游走的次数小于设定的次数阈值,则对游走的次数累加一次之后返回步骤21,否则结束步骤。
24、进一步地,实体顶点集内存在连接的两个顶点对应同一次游走中的两次相邻的步数。
25、进一步地,实体顶点集划分为多层,分别为第0-n层,其中n为次数阈值,第0层的节点为实体顶点集的中心节点。
26、进一步地,训练时以已知对应的实体类型的节点作为样本来构建损失函数。
27、进一步地,统计英语教材所关联的类型为源于英语教材的指导的融合文化知识的数量来评价英语教材培养跨文化能力的影响,数量越大影响越大。
28、本发明的有益效果在于:
29、本发明借助网络数据获取的手段来发现融合文化知识的信息,并构建学生、英语教材、融合文化知识的知识图谱,并基于知识图谱的分析结合采访学生来获取的少量数据来训练图神经网络,通过训练的图神经网络来对融合文化知识进行分类,结合其与英语教材和学生的关系来评价英语教材的跨文化能力培养。
1.一种英语教材分析方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种英语教材分析方法,其特征在于,英语教材使用知识图谱中的实体包括:英语教材、学生、融合文化知识。
3.根据权利要求1所述的一种英语教材分析方法,其特征在于,文本类型的实体,通过词向量生成的方法来进行向量化表示。
4.根据权利要求1所述的一种英语教材分析方法,其特征在于,图片类型的实体,通过卷积神经网络进行向量化表示。
5.根据权利要求1所述的一种英语教材分析方法,其特征在于,以节点为中心随机游走为实体生成实体顶点集的方法包括:
6.根据权利要求5所述的一种英语教材分析方法,其特征在于,实体顶点集内存在连接的两个顶点对应同一次游走中的两次相邻的步数。
7.根据权利要求6所述的一种英语教材分析方法,其特征在于,实体顶点集划分为多层,分别为第0-n层,其中n为次数阈值,第0层的节点为实体顶点集的中心节点。
8.根据权利要求1所述的一种英语教材分析方法,其特征在于,训练时以已知对应的实体类型的节点作为样本来构建损失函数。
9.根据权利要求1所述的一种英语教材分析方法,其特征在于,统计英语教材所关联的类型为源于英语教材的指导的融合文化知识的数量来评价英语教材培养跨文化能力的影响,数量越大影响越大。