一种基于多属性分级的多语言词汇学习辅助方法与系统与流程

文档序号:11832681阅读:385来源:国知局
一种基于多属性分级的多语言词汇学习辅助方法与系统与流程

本发明属于计算机软件及语言学习辅助技术领域,可用于多语种词汇的学习辅助功能。

技术背景

近年来,学习2门及2门以上外语的人越来越多,在学习2门以上外语之后就会出现需要记忆大量的词汇以及不同语言相同含义词汇之间相互贯通使用的问题。同时随着学习外语层次越来越高,等级越来越高级,词汇记的越来越多,会发现自己母语能力及词汇的掌握反而低于外语,也就是外语能力倒挂的问题。对于在国内生活为主主要使用中文的人前言,外语语言能力高于中文会是一个比较头疼的问题,因此就有了提高中文语言能力的迫切需求。需要能够基于中文的表达来融会贯通多种语言的使用。但目前现有的外语学习教材都只是单一外语对应中文或者外语对应单一外语的教材,基本没有中文对应多语言的教材。

同时现有的无论中文的词汇教材或词汇红宝书或外语的相关教材基本都分为初中高及商务的教材,基本都是以一段课文为基础引出某些词汇,词汇也都是根据拼音顺序进行排列,有些高级一些的词汇书可以根据词汇所属的若干分类如设施建筑、食物餐饮、文化艺术、感情心理等进行罗列,但也只是以全罗列为目标,同时在翻阅了多本类似的教材后会发现教材全部罗列的词汇会因教材内容的不同而词汇的范围都有所出入,使得学习者搞不清词汇的完全范围。同时现有的词汇教材都是以一段课文或列出所有的词汇学习者被动的接受死记硬背的方式,学习者无法筛选搜索或查询基于某种属性的词汇,同时教材也没有对词汇常用的语言场景进行描述。因此需要一种能对词汇进行全罗列,同时对词汇的多种属性进行描述包括常用的语言场景及词汇重要程度分级的学习教材或辅助系统。而随着计算机技术的发展,现有的计算机软件及数据库技术完全可以实现如上所述的需求。



技术实现要素:

基于以上需求与不足,本发明通过以下方法来达到辅助中文词汇及对应的多语种词汇学习的目的:

1、一种基于多场景重要性分级的多语种词汇学习辅助方法。其特征在于:将词汇分类录入到21个数据库中,对多种词汇对应的属性进行判断并写入数据,并基于词汇使用场景对词汇重要性进行判断分级并写入数据,然后通过选出某一等级及词汇属性组合的词汇对应显示相应的外语语种的对应词汇或表达式以辅助多语种词汇学习的方法。

2、如1所述一种将中文词汇分为21个独立数据库并独立进行操作的方法。其特征在于:根据中文词汇首字发音的首字母,包括20个辅音字母及一组元音共21组,将对应发音的词汇整理到21个独立数据库以便于并行相同的处理逻辑独立进行操作以提升效率的方法。

3、如1所述一种对数据库中中文词汇根据词汇发音的拼音首字母进行索引的方法。其特征在于:数据库中的每一个词汇都对应写有两位数据,分别存储词汇对应首字的发音的拼音如XU,以及整个词汇发音拼音首字母的缩写数据如XD、XDR用于索引及数据操作。

4、如1所述一种对词汇多种属性进行判断并写入数据的方法。其特征在于:对词汇的词性数据,词汇的褒贬性属性,及词汇末位字发音四声属性数据进行判断并录入,词性数据对应如名词为0动词为1形容词副词为2词组性词汇为3等,褒贬性属性褒义为0贬义为1,四声属性既末位字发音的1234声,123声对应为0,4声对应为1。

5、如1所述一种分不同语言场景的词汇重要性分级方法。其特征在于:在数据库中列有多个列代表不同的语言使用场景,包括轻松的聊天、说明问题、辩论、长篇演讲、开心的时刻、难过的时刻、商业、广告等场景,对应每个场景进行词义的深刻性及词汇的使用频度的判断并设定重要性等级,设为0到3共4个等级3为最高等级,具体数值判定则通过上下两个或多个词汇进行相互比较来设定相同、低于或高于的等级数值。

6、一种基于多场景重要性分级的多语种词汇学习辅助系统。其特征在于,包括:

全体词汇及基于发音分类的字的展示功能模块,对全体词汇及发音的字进行展示;

词汇筛选及分类显示功能模块,通过使用者设置筛选的参数包括词汇属性及分级属性筛选出相应的词汇并进行多种方式的分类显示;

单一或多外语语种词汇对应显示功能模块,使用者可选择单一或多个或某个发音分类及分级组合或全词汇的中文词汇同时选择某一或多种外语语种输出中文词汇后对应外语对应的词汇的文本进行显示;

选择音频方式辅助文本显示的功能模块,通过TTS文本语音转换技术或直接将输出的文本转换形成音频文件以音频的方式展示相应的词汇,以结合音频及文本的方式深化记忆以及在不方便查看的情况下通过音频学习记忆词汇;

随机模式随机显示某一等级词汇的功能模块,通过设置某一分级及属性的组合条件筛选出对应的词汇并形成结果数据库并编列序号,通过随机生成一个随机数显示对应序号的词汇,并显示词汇属性及对应外语词汇辅助词汇的学习。

7、如6所述的全词汇及基于发音分类的字展示功能模块,其特征在于:全词汇展示功能将全体词汇根据词汇首字发音进行归类,根据整个词汇发音首字母缩写进行排序与分类,并根据词汇分级数据采用不同的文字颜色及不同底色的组合设置词汇属性形成文本进行显示;基于发音分类的字展示功能将270个中文字发音的拼音根据首字母进行归类排序,在每一个发音后列出该发音常用的字并形成文本进行全展示,字根据该字对应词汇在每一分级中词汇多少采用同该级词汇相同的文字颜色组合显示出不同的字的分级。

8、如6所述的词汇筛选及分类显示功能模块,其特征在于:所选出的分级的词汇形成的文本同7中所述全词汇展示的分级文字颜色分类保持一致,不论选择几类分级包括1类,对应该分级的词汇都进行该分级颜色的文本显示。

9、如6所述的随机模式随机显示某一等级词汇的功能模块,其特征在于:随机数生成逻辑包括先在270个首字发音中随机选择一个发音,并根据该分类对应的某级词汇数量的限值形成随机数显示对应的词汇、随机数生成可以采用多种计算逻辑,或者可以根据包括使用者选择职业,结合选择的词汇的场景选出有意义的270个发音中的某一个并通过随机数显示某一该发音的词汇。

有益效果

本发明所述功能拥有如下有益效果:

1)本发明通过根据词汇使用场景对在该场景中词汇词意的深刻度及使用的频度进行分级的方法,使使用者可以高效的掌握中文核心的重要的词汇,快速提高使用者在若干场景下语言的表达能力或书面语言组织能力,通过对词汇的全列举,提高了使用者对词汇掌握程度的信心。

2)本方法通过对词汇多属性的全列举,使使用者可以通过选择某些属性组成公式进行筛选以发掘词汇间的词汇本身深刻的逻辑,提高使用者对中文词汇的掌握程度。

3)在掌握中文词汇的基础上,对重要的词汇选择同时显示多语种对应词汇,使使用者能基于中文的表达逻辑转换为多种外语进行表达,也有助于提高使用者多种外语之间词汇互相的对应理解,快速掌握多门语言及相互的互译。

附图说明

图1为本发明词汇数据库数据结构示意图

图2为实施例中词汇文本显示效果示意图

图3为实施例中基于发音分类的字显示效果图

图4为实施例中筛选结果数据库方式显示效果示意图

图5为实施例中多语言词汇文本方式显示效果示意图

具体实施方式

下面将结合图示对本发明的词汇多属性结合分级方法及辅助系统各模块的实现进行描述。本发明系统的实现可以通过开发独立应用软件、通过网页操作asp php技术,甚至直接使用XLS软件以XLS文件的方式来实现。本实施例仅对数据库的设置及功能的实现进行说明。

1、词汇数据库的准备

词汇数据的来源可以有多种途径,包括网上下载的中文词汇数据库,现有的电子词典软件或输入法软件的词汇数据库,通过直接导入或手工输入的方式来完成词汇数据库的准备。

单一数据库与21个数据库的比较:

在将词汇数据输入到数据库的过程中遇到了词汇数据量过于庞大的问题,总词汇数超过6万条,两个字词汇就有3万5千多条还包括三字词汇及四字成语,因此通过建立21个数据库分别对应20个辅音字母及一组元音共21组,将对应首字发音的词汇分别录入对应的数据库的方法,单一词汇库的词汇条数不多于5000条。相对于单一词汇数据库上述方法拥有以下优势:1)数据库读取及写入时延较大数据库短;2)数据库操作写入或读取出现错误率较低;3)除全体词汇操作外后续筛选操作由于仅对单一数据库操作效率更高;4)后续数据库维护操作如备份修改等更为方便。

词汇属性数据的录入

如图1所示格式将词汇属性相关数据录入数据库中,其中首字项为词汇对应首字的发音的拼音如XU,缩写项为整个词汇发音拼音首字母的缩写数据如XD、XDR,词性项对应数据为名词为0动词为1形容词副词为2词组性词汇为3,褒贬性属性褒义为0贬义为1,四声属性既末位字发音的1234声,123声对应为0,4声对应为1。

2、多场景词汇重要性等级的判别及数据设置

如图1所示格式将词汇等级数据录入数据库中,对应每个场景对词义的深刻性及词汇的使用频度判断并设定重要性等级,设为0到3共4个等级3为最高等级,具体数值判定则通过上下两个或多个词汇进行相互比较来设定相同、低于或高于的等级数值。使用者可以根据自己的想法对场景类别及等级数值进行修改与保存。

3、全体词汇文本格式的展示

当使用者选择全体词汇文本方式展示时,系统将对各个数据库进行操作,形成如图2所示文本。文本可以为一个单一文本文件,或对应各个数据库分为21个文件通过按钮间接的实现连续的显示。如图2所示文本中词汇根据词汇分级数据采用不同的文字颜色及不同底色的组合设置词汇属性形成文本进行显示,用户需要选择某一词汇语言场景需要采用该场景下词汇分级数据为依据。

4、基于发音分类的字展示

编写形成如图3所示文本,将270个中文字发音的拼音根据首字母进行归类排序,在每一个发音后列出该发音常用的字并形成文本进行全展示,字根据该字对应词汇在每一分级中词汇多少采用同该级词汇相同的文字颜色组合显示出不同的字的分级。当使用者选择基于发音分类的字展示功能时即显示如图3所示内容。

4、多属性组合条件的筛选与显示

使用者可以输入所有属性并形成条件公式对词汇进行筛选,例如词性=0名词、四声=0 123声、场景说明、等级=3的条件公式。用户可以选择文本方式如上述格式进行显示,或选择数据库方式如图4所示直接显示筛选结果数据库表单进行显示。

5、音频格式的输出

音频方式需要在选择输出文本的方式下使用,数据库方式不支持,支持筛选输出文本的音频方式。当使用者选择了支持音频方式选项,通过TTS文本语音转换功能对基于如图2所示的文本进行朗读输出。

6、多语言词汇的显示

用户可通过选择多外语模式显示多外语语种词汇,用户可以输入某或若干个词汇及对应外语种类单独显示词汇对应的外语词汇。或选择某个发音分类及分级组合或全体词汇的中文词汇同时选择某一或多种外语语种输出中文词汇后对应外语对应的词汇的文本进行显示如图5所示,如选择了多个分级则各分级中文词汇显示为不同颜色组合的词汇文本。用户也可以选择数据库方式,如图4所示进行显示。

7、随机词汇的显示

使用者可以进入随机显示模式,通过选择某场景及某等级并点击随机显示按钮,系统就会显示出一个该等级对应的词汇,也可以选择同时显示对应外语语种词汇。随机数生成逻辑包括先在270个首字发音中随机选择一个发音,并根据该分类对应的某级词汇数量的限值形成随机数显示对应的词汇、随机数生成可以采用多种计算逻辑,或者可以根据包括使用者选择的职业,结合选择的词汇的场景选出有意义的270个发音中的某一个并通过随机数显示某一该发音的词汇。

以上仅是本发明的一个实施例,任何在本发明的原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1