自适应英语学习词库图谱管理方法和系统与流程

文档序号:18740326发布日期:2019-09-21 01:41阅读:319来源:国知局
自适应英语学习词库图谱管理方法和系统与流程

本发明涉及自适应英语词汇管理领域,尤其涉及一种自适应英语学习词库图谱管理方法和系统。



背景技术:

当前英语学习领域主要具有三个方面的背景,一是不同阶段的用户群体在碎片时间使用手机软件进行学习英语的场景越来越多;二是词汇作为学习英语的基础,其占比在上述描述的场景中较大;三是需要建立词汇间的相关性,需要生成词汇图谱。目前市面上有简易的词汇内容管理系统,但仅满足词汇的手动添加管理。

目前市面上的词汇录入工具或系统,基本满足于简单的添加删除修改词汇信息,在词汇图谱建立与管理上的功能较少,且主要以人工方式进行输入词汇,音频资源。这种模式人工成本高,耗费时间久,产生的错误率偏高,出现错误后的及时发现率低,易造成学习产品不稳定。



技术实现要素:

有鉴于现有技术的上述缺陷,本发明提供一种自适应的英语词库图谱管理方法和系统,能够实现词汇列表导入后的词汇图谱关系创建以及词汇音频资源自动生成,可快速对词汇建立图谱关系,有效降低人工成本,降低词汇输入错误率,减少词汇编辑流程,降低词汇图谱关联复杂度。

一方面,本发明提供一种自适应英语学习词库图谱管理方法,包括以下步骤:获取目标词汇;对目标词汇进行后缀词过滤,以得到目标词汇被过滤掉后缀词的字符串;从词库中检索包含字符串的词汇,以得到后缀关联词汇;以及建立目标词汇与后缀关联词汇的图谱关联关系。

在一些实施例中,可选的,获取目标词汇的步骤进一步包括:对客户端接收到的新增或修改的词汇进行标准化处理,得到待处理词汇;以及在词库中检索待处理词汇,其中,如果在词库中未检索到待处理词汇,将待处理词汇作为目标词汇。

在一些实施例中,可选的,标准化处理的步骤进一步包括:去除词汇前后的空格,将词汇中的单词转换为小写,并通过哈希运算生成唯一码。

在一些实施例中,可选的,获取目标词汇的步骤进一步包括:获取目标词汇的音频,其中,音频通过调用音频API生成。

在一些实施例中,可选的,后缀词过滤的步骤进一步包括:判断目标词汇是否包含后缀词列表中的后缀词;以及如果目标词汇包含后缀词,在目标词汇中移除后缀词以得到字符串。

在一些实施例中,可选的,还包括以下步骤:对目标词汇进行前缀词匹配,以得到与目标词汇相匹配的前缀词;以及建立目标词汇与前缀词的图谱关联关系,从而建立与包含前缀词的其他词汇的间接图谱关系。

在一些实施例中,可选的,前缀词匹配的步骤进一步包括:判断目标词汇是否包含前缀词列表中的前缀词;以及如果目标词汇包含前缀词,前缀词即为与目标词汇相匹配的前缀词。

在一些实施例中,可选的,还包括以下步骤:在词库中增加目标词汇,并根据所得到的与目标词汇相关的图谱关联关系更新词库图谱。

在一些实施例中,可选的,如果目标词汇为新增的词汇,针对目标词汇创建新的图谱;以及如果目标词汇为修改的词汇,更新原有的图谱。

另一方面,本发明还提供一种自适应英语学习词库图谱管理系统,系统被配置为能够执行上述的方法,其中,系统包括:词汇信息管理模块,被配置为能够对词汇进行导入创建、更新、删除操作;词汇资源生成模块,被配置为能够自动生成新增词汇的音频,并上传到资源服务器;词汇图谱类型管理模块,被配置为能够对词汇图谱进行创建、更新、删除操作;自动化词汇图谱识别模块,被配置为能够自动生成新增词汇的图谱关系;以及词汇图谱关系管理模块,被配置为能够对词汇图谱关系进行创建、更新,删除操作。

本发明的有益效果至少包括:提供了高效的词汇知识点录入方式,自动的生成了词汇音频资源,自动的知识点图谱识别并关联。传统的人工录入方式,对一百个词汇的录入及上传音频需要耗费一至二小时,采用本发明的技术方案后,从词汇录入到资源上传完成,可以达到不超过3分钟。在维护词汇图谱关系上,人工方式对一个词汇关联图谱,至少需要5分钟,而采用了知识点自动识别图谱后,可以降低至10秒内。

以下将结合附图对本发明的构思、具体结构及产生的技术效果作进一步说明,以充分地了解本发明的目的、特征和效果。

附图说明

当结合附图阅读以下详细说明时,本发明将变得更易于理解,在整个附图中,相同的附图标记代表相同的零件,其中:

图1为本发明自适应英语学习词库图谱管理系统的一个实施例的框图。

图2-6为本发明自适应英语学习词库管理系统各模块的实施例的框图。

具体实施方式

下面将对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都应属于本发明保护的范围。

本发明提供一种自适应英语学习词库图谱管理方法,包括以下步骤:

一、获取目标词汇。通过客户端管理词汇,可以导入、创建、修改、删除词汇。在一些实施例中,还可以通过客户端上传编辑好的excel词汇文档进行批量导入,服务器端接收文件并解析出其中的每个词汇,从而显著提高效率。

在一些实施例中,可以对客户端接收到的新增或修改的词汇进行标准化处理,得到待处理词汇。其中,标准化处理可包括以下一种或多种操作:去除词汇前后的空格,将词汇中的单词转换为小写,通过哈希运算生成唯一码。经过标准化处理,能够更便于进行后续的检索、新增、修改等操作。

然后在词库中检索待处理词汇。如果在词库中未检索到待处理词汇,将待处理词汇作为目标词汇。在一些实施例中,在检测存储系统中无此词汇后,可创建此词汇,并设置此词汇标志为“新建”。此外,还可以在客户端页面修改或删除词汇信息,服务器端接受请求后,相应地修改或删除存储系统中的数据。

在一些实施例中,还可以获取目标词汇的音频。在一些实施例中,系统可以设定固定的时间周期(例如每1分钟)开启一个任务,自动检测存储系统中标志为“新建”的词汇列表,随后循环调用第三方音频API生成音频,同时将生成的音频文件上传到资源文件服务器.在上传成功后,修改该词汇的设置标志为“音频下载成功”。词汇与其音频文件结合在一起,能够有效地提高英语学习的便利性和学习效果。

二、针对目标词汇建立关联图谱。在一些实施例中,可以仅对标志为“音频下载成功”的词汇建立关联图谱,从而使得图谱中所有出现的词汇均具有相对应的音频。

在一些实施例中,可以针对目标词汇建立后缀词关联图谱,包括:

1、对目标词汇进行后缀词过滤,以得到目标词汇被过滤掉后缀词的字符串。其中,包括判断目标词汇是否包含后缀词列表中的后缀词;以及如果目标词汇包含后缀词,在目标词汇中移除后缀词以得到字符串。

2、从词库中检索包含字符串的词汇,以得到后缀关联词汇。

3、建立目标词汇与后缀关联词汇的图谱关联关系。

例如对于词汇“provision”,首先使用后缀词列表(如sion,ion,ance,ence,ment,ness,ure,able,ible,al,tive,ful,ous,fy,ish,ize等)对词汇进行过滤,发现包括后缀词“sion”,从而过滤后得到字符串“provi”。

然后从词库或存储系统中检索或筛选出包含字符串“provi”的词汇列表,如“provide,provident,providence,provided,provider”等。随后将“provision”与这些词汇逐个建立图谱关联。

通过后缀词过滤再检索到的这些词汇,通常具有相似的拼写,并具有相似或有关联的含义,将这些词汇有机地关联到一起,使得在英语学习的过程中,不仅能够一次性学习多个词汇,并且能够有效地加深理解和记忆。

在一些实施例中,还可以针对目标词汇建立前缀词关联图谱,包括:

1、对目标词汇进行前缀词匹配,以得到与目标词汇相匹配的前缀词。其中,包括判断目标词汇是否包含前缀词列表中的前缀词;以及如果目标词汇包含前缀词,前缀词即为与目标词汇相匹配的前缀词。

2、建立所述目标词汇与所述前缀词的图谱关联关系,从而建立与包含所述前缀词的其他词汇的间接图谱关系。

例如对于词汇“provision”,将其与前缀词列表(如ac,ad,ap,at,com,con,be,de,dis,em,en,ex,extra,im,in,inter,micro,mis,ob,op,over,per,pre,pro,re,sub,suc,sug,trans,un,uni,up等)进行比较和匹配,发现它与“pro”前缀匹配。

然后对“pro”前缀词与“provision”建立图谱关联。由于词库中已有词汇已经建立了与前缀词的关联图谱,这样“provision”就与包含“pro”前缀的所有单词(如“progress,program”等)有了间接的图谱关联关系。

基于相同的前缀词,这些词汇通常具有相似或部分相似的含义,有利于通过前缀词理解和学习不同的词汇及含义。通过前缀词匹配并与包含同样前缀词的词汇进行关联,使得在英语学习的过程中,不仅能够一次性学习多个词汇,并且能够有效地加深理解和记忆。

进行前缀词匹配和进行后缀词过滤这两个步骤并无顺序要求。在一些实施例中,可以先前缀词匹配再后缀词过滤,也可以先后缀词过滤再前缀词匹配,还可同时进行前缀词匹配和后缀词过滤。在另一些实施例中,也可以仅进行前缀词匹配,或者仅进行后缀词过滤。

三、在词库中增加目标词汇,并根据所得到的与目标词汇相关的图谱关联关系更新词库图谱。如果目标词汇为新增的词汇,则针对目标词汇创建新的图谱并加入词库图谱;以及如果目标词汇为修改的词汇,则更新原有的图谱。

在一些实施例中,图谱关联关系可以是一对一的对应关系,也可以根据同一个词汇的多个关联关系生成该词汇的关联关系图谱,有助于对该词汇或包含该词汇的知识点进行学习。并且在一些实施例中,还可以根据多个相关联的词汇生成关联关系图谱,有助于对单个知识点进行延伸学习或对相关联知识点进行多角度地理解和分析。

如图1所示,本发明提供一种自适应英语学习词库图谱管理系统,包括:词汇信息管理模块,用于对词汇进行导入创建、更新、删除操作;词汇资源生成模块,用于自动生成新增词汇的音频,并上传到资源服务器;词汇图谱类型管理模块,用于对词汇图谱进行创建、更新、删除操作;自动化词汇图谱识别模块,用于自动生成新增词汇的图谱关系;以及词汇图谱关系管理模块,用于对词汇图谱关系进行创建、更新,删除操作。

在一些实施例中,本发明自适应英语学习词库管理系统各模块的实现方法如图2、图3、图4、图5、图6所示,下面对图2、图3、图4、图5和图6进行详细说明:

1、管理词汇主要功能是导入、修改、删除词汇。它的过程实现,如图2所示,1、通过客户端上传编辑好的excel词汇文档,服务器端接收文件并解析出每词汇,将每个词汇去除前后空格,并通过哈希运算生成唯一码,在检测存储系统中无此词汇后,创建此词汇,并设置此词汇标志为“新建”;2、在客户端页面修改或删除词汇信息,服务器端接受请求后,修改或删除存储系统中的数据。

2、系统自动生成词汇资源模块的过程实现,如图3所示,系统设定每1分钟开启一个任务,自动检测存储系统中标志为“新建”的词汇列表,随后循环调用第三方音频API生成音频,同时将生成的音频文件上传到资源文件服务器,在上传成功后,修改该词汇的设置标志为“音频下载成功”。

3、知识点图谱类型管理的过程,如图4所示,在客户端页面新增、修改或删除图谱类型,服务器端接受请求后,对存储系统进行图谱类型的新增、修改或删除操作。

4、知识点图谱自动化关联模块,主要是对新增的词汇进行图谱关系生成,对做修改的词汇进行动态更新,如图5所示,具体步骤如下:

步骤1,系统从存储系统中筛选出标志为“音频下载成功”的词汇列表;

步骤2,对知识点过滤后缀词,具体过滤的后缀词列表为(sion,ion,ance,ence,ment,ness,ure,able,ible,al,tive,ful,ous,fy,ish,ize),并对过滤后剩余的字符串做小写处理;

步骤3,从存储系统中筛选包含执行步骤2所得字符串的词汇,并对所有词汇做小写;

步骤4.将步骤3中所得词汇与步骤1中的词汇的图谱关系,保存到存储系统中;

步骤5.判断步骤1中的词汇是否包含前缀词(前缀词列表为ac,ad,ap,at,com,con,be,de,dis,em,en,ex,extra,im,in,inter,micro,mis,ob,op,over,per,pre,pro,re,sub,suc,sug,trans,un,uni,up);

步骤6.将步骤5中包含的前缀词与词汇建立图谱关联,保存到存储系统中。

如词汇“provision”,首先在步骤2中对词汇过滤后缀词“sion”,得到“provi”;

然后进入步骤3,从存储系统中筛选出包含“provi”的词汇列表,如“provide,provident,providence,provided,provider”等;

随后步骤4,将“provision”与这些词汇逐个建立图谱关联;

接着步骤5中,对“provision”与前缀词列表进行比较,它与“pro”前缀匹配,

在步骤6中,对“pro”前缀词与“provision”建立图谱关联,这样“provision”就与“pro”前缀的所有单词(如“progress,program”等)有了间接的图谱关系

注:以上步骤2、3、4与步骤5、6可以互换,即前缀词过滤后图谱关联与后缀词过滤后图谱关联两个执行过程无顺序要求。

5、知识点图谱关联关系管理的过程实现,如图6所示,在客户端页面新增、修改或删除图谱关系管理,服务器端接受请求后,对存储系统进行图谱关系的新增、修改或删除操作。

在一些实施例中,上述的各种方法可以在一个或多个处理装置(例如,数字处理器、模拟处理器、被设计成用于处理信息的数字电路、被设计成用于处理信息的模拟电路、状态机和/或用于以电子方式处理信息的其他机构)中被实现。该一个或多个处理装置可以包括响应于以电子方式存储在电子存储介质上的指令来执行方法的一些或所有操作的一个或多个装置。该一个或多个处理装置可以包括通过硬件、固件和/或软件被配置而专门设计成用于执行方法的一项或多项操作的一个或多个装置。以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

本发明的实施方式可以在硬件、固件、软件或其各种组合中进行。还可以作为存储在机器可读介质上的且可以使用一个或多个处理装置读取和执行的指令来实现本发明。在一个实施方式中,机器可读介质可以包括用于存储和/或传输呈机器(例如,计算装置)可读形式的信息的各种机构。例如,机器可读存储介质可以包括只读存储器、随机存取存储器、磁盘存储介质、光存储介质、快闪存储器装置以及用于存储信息的其他介质,并且机器可读传输介质可以包括多种形式的传播信号(包括载波、红外信号、数字信号)以及用于传输信息的其他介质。虽然在执行某些动作的特定示例性方面和实施方式的角度可以在以上公开内容中描述固件、软件、例程或指令,但将明显的是,这类描述仅出于方便目的并且这类动作实际上由计算装置、处理装置、处理器、控制器、或执行固件、软件、例程或指令的其他装置或机器产生。

本说明书使用示例来公开本发明,其中的一个或多个示例被描述或者图示于说明书及其附图之中。每个示例都是为了解释本发明而提供,而不是为了限制本发明。事实上,对于本领域技术人员而言显而易见的是,不脱离本发明的范围或精神的情况下可以对本发明进行各种修改和变型。例如,作为一个实施例的一部分的图示的或描述的特征可以与另一个实施例一起使用,以得到更进一步的实施例。因此,其意图是本发明涵盖在所附权利要求书及其等同物的范围内进行的修改和变型。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1