基于图形式上下文语境和机器学习的单词记忆方法及其装置的制作方法

文档序号:6587210阅读:537来源:国知局
专利名称:基于图形式上下文语境和机器学习的单词记忆方法及其装置的制作方法
技术领域
本发明涉及由机器辅助进行的外语学习领域,提供了一种基于上下文语境和机器学习的单词记忆方法及其装置。
背景技术
目前的主流单词记忆系统通常都是以文字的方式来表达单词的意思,忽悠了把单词放在语境下记忆才更加有效这个语言学学者已经得出很多年的结论。本系统采用直观的图形方式对单词的语境进行表达,能更好地帮助用户进行形象的记忆。另外,目前的主流的智能单词记忆系统都是根据Hermann Ebbinghaus遗忘曲线进行开发的。然而,HermannEbbinghaus遗忘曲线是1886年根据Hermann Ebbinghaus本人对一组无意义的符号进行记忆得到的模型。所以模型本身只代表Hermann Ebbinghaus本人的记忆能力,忽略了各个用户之间记忆能力的差异。并且,其记忆对象是无意义的符号,没有考虑各单词在实际使用中的重要程度。本系统综合考虑了用户差异和单词差异,因而可以让单词记忆更加有效和更加有针对性。

发明内容
本发明的目的在于提供一种能够自动地为用户选择需要记忆的单词和制定复习的日程表,达到高效率的记忆的基于图形式上下文语境和机器学习的单词记忆方法及其装置。为实现上述目的本发明采用以下技术方案:
一种基于上下文语境和机器学习的单词记忆方法,其特征在于包括以下步骤:
O查询不理解单词;
2)系统调用已学习好的数据库,找到所查单词的同义词、反义词、近似词以及重要程度,并以图形化的语境方式展示给用户;
3)将单词加入生词本;
4)在用户需要时,系统根据用户的记忆能力、记忆周期、已经弱项单词为其选择所需复习的单词,并提供图形化的复习界面;
5)在用户需要时,系统根据用户的记忆能力、记忆周期、已经弱项单词为其选择所需测试的单词,并提供图形化的测试界面;
6)系统根据用户在复习和测试中的表现,使用逻辑回归(LogisticRegression)技术自动识别用户的记忆能力、记忆周期、以及弱项单词,作为每次复习和测试的参考。上述方案中,所述步骤2中数据库的学习采用处理步骤包括:
21)搜集文章;
22)结合现有字典,对每个单词的出现的同义词、反义词、近似词进行记录;
23)搜集考题集合;24)对每个单词的出现的同义词、反义词、近似词进行筛选,保留常用的、容易被作为考
点的单词,同时按照以下公式估计每个单词在各项考试中的重要程度,
权利要求
1.一种基于上下文语境和机器学习的单词记忆方法,其特征在于包括以下步骤: 1)查询不理解单词; 2)系统调用已学习好的数据库,找到所查单词的同义词、反义词、近似词以及重要程度,并以图形化的语境方式展示给用户; 3)将单词加入生词本; 4)在用户需要时,系统根据用户的记忆能力、记忆周期、已经弱项单词为其选择所需复习的单词,并提供图形化的复习界面; 5)在用户需要时,系统根据用户的记忆能力、记忆周期、已经弱项单词为其选择所需测试的单词,并提供图形化的测试界面; 6)系统根据用户在复习和测试中的表现,使用逻辑回归技术自动识别用户的记忆能力、记忆周期、以及弱项单词,作为每次复习和测试的参考。
2.根据权利要求1所述的一种基于上下文语境和机器学习的单词记忆方法,其特征在于:所述步骤2中数据库的学习采用处理步骤包括: 21)搜集文章; 22)结合现有字典,对每个单词的出现的同义词、反义词、近似词进行记录; 23)搜集考题集合; 24)对每个单词的出现的同义词、反义词、近似词进行筛选,保留常用的、容易被作为考点的单词,同时按照以下公式估计每个单词在各项考试中的重要程度,tRtp (x) - rt + Sy(X).ci + Ant(X).β + Ana(x) - γΙπιη χ)=--;-1ginmeimx) ■ φ )■ 公式中ImpO为当单词的重要程度,RepO为当前单词在各项考试中出现的频率,SyO为同义词个数,AntO为反义词个数,AnaO为相似词个数,Novelty O为该单词最后一次在考试中出现的时间距当前时间的跨度,CC, β Υ,π, φ为一组平衡的系数,该组系数在数据库的基础上使用逻辑回归技术通过计算机自动学习到。
3.根据权利要求1所述的一种基于上下文语境和机器学习的单词记忆方法,其特征在于:所述步骤2中图形化的复习界面的图形化语境展示方法采用处理步骤包括: 31)查询步骤2中所述的数据库,获得每个单词的同义词、反义词、近似词、并计算其重要程度: 32)以当前单词为中心,将其同义词、反义词、近似词按照重要程度由内至外、同时上至下以环状分布在当前单词周围形成一个图形化的语境,以达到直观记忆的目的。
4.根据权利要求1所述的一种基于上下文语境和机器学习的单词记忆系统,其特征在于:所述步骤4中选择所需复习的单词采用处理步骤包括: 41)按以下公式计算每个单词的需复习权重Rew(X), Iiwp(X) * Ca) + Forg(S).I Rew(x)=- Acrrar(X) 公式中,公式中ImpO为当单词的重要程度,Forg(x)为根据Hermann Ebbinghaus遗忘曲线计算出的遗忘度,Accur (X)为用户在测试中对X表现出的正确率,ω, T为平衡因子,通过使用逻辑回归技术自动获取。42)根据各单词的需复习权重对单词进行排序,选取权重高于0.8的词推荐用户进行复习。
5.根据权利要求1所述的一种基于上下文语境和机器学习的单词记忆系统,其特征在于:所述步骤5中选择所需测试的单词采用处理步骤包括: 51)按以下公式计算每个单词的需测试权重Test(x),
6.一种基于上下文语境和机器学习的单词记忆装置,其特征在于包括: 数据库学习模块:对每个单词的出现的同义词、反义词、近似词进行筛选记录; 图形化的复习界面模块:根据用户的记忆能力、记忆周期、已经弱项单词为其选择所需复习(Review)的单词或测试(Test)的单词,并提供图形化的复习界面; 复习单词处理模块:筛选出并对单词排序; 测试单词处理模块:筛选出所需测试的单词,并对单词进行测试,记录测试正确率。
7.根据权利要求6所述的一种基于上下文语境和机器学习的单词记忆装置,其特征在于:所述数据库学习模块的处理步骤包括: 71)搜集文章; 72)结合现有字典,对每个单词的出现的同义词、反义词、近似词进行记录; 73)搜集考题集合; 74)对每个单词的出现的同义词、反义词、近似词进行筛选,保留常用的、容易被作为考点的单词,同时按照以下公式估计每个单词在各项考试中的重要程度
8.根据权利要求6所述的一种基于上下文语境和机器学习的单词记忆装置,其特征在于:所述图形化的复习界面模块的图形化语境展示方法采用处理步骤包括: 81)查询数据库学习模块的数据库,获得每个单词的同义词、反义词、近似词、并计算其重要程度: 82)以当前单词为中心,将其同义词、反义词、近似词按照重要程度由内至外、同时上至下以环状分布在当前单词周围形成一个图形化的语境,以达到直观记忆的目的。
9.根据权利要求6所述的一种基于上下文语境和机器学习的单词记忆装置,其特征在于:所述复习单词处理模块的处理步骤包括: 91)按以下公式计算每个单词的需复习权重Rew(X),
10.根据权利要求6所述的一种基于上下文语境和机器学习的单词记忆装置,其特征在于:所述测试单词处理模块的处理步骤包括: 101)按以下公式计算每个单词的需测试权重Test(x),
全文摘要
本发明涉及由机器辅助进行的外语学习领域,提供了一种基于上下文语境和机器学习的单词记忆方法及其装置。该系统有两个特点1.能将每个单词的同义词、反义词、近似词、以及重要程度自动地以图形方式呈现出来,从而为每个单词构建一个上下文相关(Context Related)的语境,帮助用户进行更形象直观的单词记忆;2.该系统能自动地识别用户的记忆能力、记忆周期、以及弱项单词(用户最不容易记住的单词),从而自动地为用户选择需要记忆的单词和制定复习的日程表,达到高效率的记忆。经过40个用户2年的测试表明,使用该系统的用户的年均单词记忆量达到1万个以上,年最高单词记忆量为3万个。
文档编号G06F17/30GK103116648SQ20131006285
公开日2013年5月22日 申请日期2013年2月28日 优先权日2013年2月28日
发明者魏骁勇, 杨震群 申请人:魏骁勇
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1