利用互联网资源进行语言词汇学习的方法和系统的制作方法

文档序号:6440584阅读:240来源:国知局
专利名称:利用互联网资源进行语言词汇学习的方法和系统的制作方法
技术领域
本发明涉及的技术领域为一种利用计算机和互联网来进行语言词汇学习的方法和系统。更详细地说,本发明是一种通过组织和利用互联网的大量资源来进行语言词汇学习的方法和系统,这些词汇包括一般的语言学习中出现的词汇和一些标准语言测试(例如TOFEL、GRE和GMAT等等)中出现的词汇。本发明也适用于语言学习的其他领域,包括拼写、语法和阅读等等。
背景技术
在此之前已有许多利用计算机和互联网来进行语言学习和教学的解决方案。在计算机辅助语言学习的应用软件中,使用图片、游戏和字谜是比较流行的做法。随着互联网、远程教育、在线教学的出现,教学材料发布、教学资源远程访问和通过超文本链接的交叉引用都得到了很快的发展。互联网已成为目前语言学习方法和系统中的一个关键角色。然而,所有这些已有的解决方案基本上都只是把互联网作为一种语言学习中的交流工具。
本发明基於一种全新的理念,那就是,将整个互联网资源的集合体看作为一本书来进行语言词汇学习。尽管目前的科技已经很发达,但读书对人们来说仍然是最主要的语言学习方法,因为其他途径,例如图片、游戏和字谜等等,都无法象书本那样可以提供人们最为丰富和完整的语境上下文。所有互联网资源的聚集将会是一本惊人的教科书,它里面汇聚了成千上万的故事、小说、散文、笔记和各种文体的学习资料。本发明就是在此基础上提出的一种高效的语言学习的方法和系统。它将告诉你如何阅读这本巨大的书。

发明内容
本发明的主旨就是互联网不仅仅是一个交流工具,而也是一本独一无二的书。它里面蕴藏着丰富的各式各样的故事、小说、散文和笔记等等,在这些文体的内容中有着你在学习中所碰到的几乎所有的单词和词组。
本发明的目的是开发一种方法和系统来有效的组织和利用这些互联网资源进行语言词汇学习。
本发明主要由以下几方面组成(1)将单词和词组组织和储存到一个词汇数据库中(2)查找并选择每个单词或词组的互联网页面(3)将这些词汇作为关键字标引相关的互联网页面(4)审核并更新词汇和互联网资源信息的索引(5)从词汇数据库中随机选择和显示词汇和互联网资源信息,并给予每个单词相等的几率被显示(6)根据当前给出的单词或词组打开一个使用了该单词或词组的互联网页面(7)自动查找和高亮显示互联网页面中的这些单词和词组(8)在屏幕一角显示一个浏览词汇的小窗口和提供一个独立客户端可执行的程序来适合于用户的多种学习时间在本发明的基础上,互联网资源可以被有效地用于语言词汇学习。在词汇数据库中经过整合组织的单词和词组为访问互联网资源提供了一个高效准确的入口。因为每个单词或词组都有它所链接的具体的互联网页面,用户可以用最快的速度查找到他最想看到的页面。自动查找和高亮显示页面文本中当前词汇的功能可以使读者在所读的页面中迅速寻找到这些单词或词组。由於互联网页面通常会被频繁的更新和改动,因而很有必要定期地审核和更新这些互联网页面的索引。浏览词汇袖珍小窗口的设计可以使程序与浏览器或其他软件一起使用,以适合于用户的不同的学习时间,例如在家中或语言课堂上学习、在登录计算机之后、在退出计算机之前、或者利用做其他工作的空闲时间来学习。不管计算机是否在线,客户端程序作为一个独立的程序可以提供完整的功能,因此用户在计算机离线之后也可以继续进行学习。
本发明的最大长处在於可以最大限度的利用互联网上大量免费的资源进行语言词汇学习。目前,互联网上有着大量的学习资料。通过使用本发明的方法和系统,用户可以有效地从这些资料中学习常用或非常用的单词和词组。正在准备TOFEL、GRE或GMAT考试的学生们经常需要背记很多非常用的英语单词和词组,原因是他们从课本上所能学习到的词汇是很有限的。本发明可以为他们提供一条方便而有效的途径,那就是通过互联网上大量的故事、小说、散文、笔记或其他文体内容中的这些单词和词组来进行更为高效的学习。
本发明的另一大优点是可以在用户阅读到这些互联网页面时,首先自动为他们在文本内容中查找到并高亮显示这些词汇。因为用户是先看到这些单词,然后根据这些单词打开某个使用了这些单词或词汇的页面,所以迅速吸引他们的注意力来帮助他们记忆这些词汇更显得非常重要。
本发明的另一大优点是可以让用户自由制定学习时间表,而不必局限於电脑一定要在线而与服务器连接。通常来说,用户都有自己的多种学习时间来进行语言学习。在课堂学习或在家中学习是比较常规的做法。有时候用户也会利用很短的时间段,如登录电脑时、退出电脑时、或者在其他工作的休息间隙过程中来学习词汇。本发明设计了一个小巧的放置在显示屏的一角的词汇浏览窗口,以及一个可以独立进行运行而提供完整功能的客户端程序来达到这一目的。


如果想更深入的了解本发明,请看本发明的详细说明以及附图。
图1显示了本发明的理念,即把整个互联网资源的整体当作一本书来进行语言词汇学习。
图2显示了本发明的方法和系统的大纲。
图3为一个流程图,它显示了审核词汇和资源信息索引的有效性的过程中的多个步骤。
图4说明了本发明所使用的一种算法,用来随机地从数据库中选择并显示词汇,同时又可使数据库中的每个词汇都有相等的几率被显示。
具体实施例方式
如图1所示,本发明的理念由来是把整个互联网资源看作是一本书。如何最佳地利用这本巨大的书来进行语言学习是一个非常重要而须开发的领域。远程教育、在线教学、远程访问教学内容和学习资源正在迅速发展,但这些途径主要均是把互联网当作一个学习中的沟通交流工具。因为网页有个超文本链接的特性,也有很多的方案是将相关的网页链接在一个页面上显示,或者将一些内容在网页之间做上链接,但它们的主要目的都是为了方便快捷地交叉引用。目前并没有一种方法或系统是有系统地使用语言中的某个组成部分(如词汇)作为关键字来打开大量的网页并在内容中高亮显示这些词汇,来达到语言词汇学习的目的。
图2显示了本发明的方法和系统的大纲。整个框架是基於客户端与服务器相互作用的软件设计模式。词汇和网页信息的数据被存储在数据库中,并且互相标引。服务器从数据库中获得这些标引了的数据后把他们发送到客户端。客户端可以是一个网页浏览器,也可以是一个具有词汇浏览窗口的程序。如果客户端是一个浏览器,单词和词组将在浏览器中显示,相关的网页会同时被显示和链接出来。当用户点击网页资源的链接时,相关的网页就会在浏览器中载入。如果客户端是一个具有词汇浏览窗口的程序,词汇和网页资源信息会在词汇浏览窗口中显示,当用户点击了一个网页资源的链接时,程序会自动调用浏览器而打开相关网页,并自动查找和高亮显示页面文本中的当前单词或词组让用户浏览。当计算机是在在线状态下,程序会更新局部词汇数据库,以便当计算机在离线状态时,用户也可以浏览和记忆词汇。在判断词汇和网页资源之间的索引是否仍旧有效的过程中,本发明使用了一个审核引擎来进行审核工作。
本发明的方法主要包含括词汇和网页资源信息的数据流中的几个步骤。首先,单词和词组被存储到词汇数据库中并按个人、TOEFL、GRE、GMAT和SAT等类别分门别类的进行归类。然后,与这些词汇相关的网页信息被存储在数据库中并进行标引。数据会被周期性地从数据库中被取出而与实际网页中的内容进行对比,从而审核这些词汇的网页索引是否有效。最后,这些数据被从数据库中取出而让用户浏览。
图3是一个审核词汇和网页资源信息之间索引各个步骤的流程图。考虑到网页地址和网页内容的频繁异动性,必须周期性地对这些词汇和网页资源信息进行审核以确保它们的有效性。首先,词汇和网页资源信息从数据库中被取出,然后从互联网中获得网页内容。如果在获得网页内容的过程中失败,表示该网页资源信息对该词汇来说是无效的。如果内容被成功地获得,则会继续用该词汇的字符串去与网页文本相匹配。如果无法在网页文本中找到该字符串,则表示该网页已经被更改过,即无效了。审核结果被用来更新词汇数据库中的词汇的网页资源信息的数据。整个审核过程确保用户在打开一个网页阅读时该词汇可以在页面中被找到。
图4说明了本发明所使用的一种算法,用来随机地从数据库中选择并显示词汇,同时又使数据库中的每个词汇都有相等的几率被显示。所有的单词和词组通过用户代码和词汇类别码来从数据库中取出。在一个具体的类别中,一个单词是被随机地从数据库中取出的,这个随机数在每次它被显示时都被重新设置。拥有最小随机数的单词会被通过使用关系数据库的升序功能而优先选出。同时,单词和词组被根据用户浏览次数而进行分组和排序。除非某个单词被人为地设置了一个浏览优先级(见下文),否则,被浏览次数多的单词将不会在浏览次数少的单词之前显示。这样就保证了每一个词汇有相等的几率被显示。基於升序功能,所查找的单词总会是缓冲区中的第一条记录。这样选择记录的程序会在第一行记录被取得后迅速终止,从而消除冗余而提高进程的速度。
在选择和显示词汇时还有两个相关算法。一个是设置浏览优先级,另一个是移动单词到个人的生词本中。这两种方法为用户提供了一种人为地控制单词出现濒率的方法,让用户可以在一段时间内,更频繁地碰到这些单词和词组。举例来说,如果用户设定了某个单词的浏览优先级为“每隔8个单词显示一次”,则该单词会在每8个其它单词被显示后显示。用户也可以将某些单词和词组添加到他们个人的生词本中,以便进行多次浏览并记忆。
用户可以将TOEFL、GRE、GMAT等类别的单词或词组转移到个人生词本中。同时用户也可以自行输入或修改他们自己的单词或词组。基本的功能包括单词和词组的添加、删除、修改等等。从总词库中被转移到个人生词本的单词以及用户自行添加的单词均可以被修改和更新。个人生词本中的单词和词组可以从可被浏览的状态改变为非浏览的状态,反之亦然。这样就允许用户将个人生词本中的某些单词和词组维持为非浏览的状态,在必要时变为可以被浏览的状态以方便再次学习。
在数据从数据库中被取出后,词汇可以以两种形式显示,一种为浏览形式,另一种为测试形式。如果是浏览形式,显示的词汇信息包括定义、例句和提示等等。如果是测试形式,显示的是与词汇用法或定义相关的多选题,以及该用户以前的测试分数记录。网页资源信息会一直显示,以方便用户打开相关网页。用户界面可以是一个浏览器或者一个具有词汇浏览窗口的程序。当用户点击了网页资源的链接后,相关页面会在浏览器中载入,客户端程序也会自动的在页面文本中查找和高亮显示当前单词和词汇来吸引用户的注意。
词汇浏览窗口特别为迎合用户的多种学习时间而设计。在语言学习中,用户或者上语言课学习,或者在课后花上几个小时来学习单词,或者是在登录计算机、退出计算机或其他工作休息间隙之间来学习记忆单词。为了适应用户的多种时间选择,词汇浏览窗口在设计时尽可能袖珍小巧,并且被放置于屏幕的一角,可以很方便地和浏览器或其他程序同时使用。因为用户可能是在课堂上或家中使用台式或笔记本电脑,电脑可能连接在或未连接在互联网上,所以客户端程序被设计成一个独立的应用程序,它可以灵活地根据互联网连接情况而决定是否连接到服务器上。当用户在网上时,程序和服务器交换数据,新的词汇和网页资源信息被从服务器端的数据库中获得。当用户是离线状态时,客户端程序可以使用客户端局部的数据库独立运行。用户也可以设定时间自动显示下一个词汇。当下一个词汇被自动显示的时候,词汇浏览窗口会在屏幕上跳动以提醒用户新的词汇已被显示。词汇浏览窗口可以自动在用户启动电脑或登录时自动启动。
本发明特别注重于为用户提供丰富和全面的词汇上下文来帮助他们来学习和记忆词汇。词汇上下文的重要性已经被许多语言专家和教师所肯定。研究显示通过上下文记忆词汇比单纯记忆一组单词或词组要更加有效得多。本发明利用丰富多样的互联网资源的上下文来为用户在记忆词汇时提供更为深度的感受来帮助他们进行记忆。
通过使用本发明的方法和系统,用户可以全面利用大量的免费和易于访问的互联网资源来进行词汇学习。他们所要学习的单词和词组在互联网上有着丰富多种的上下文语境,并且可以很方便地访问到。由於本发明采用的方法和系统可以覆盖大量的词汇,足够可以满足用户学习各种常用或非常用的单词或词组的需求,因而对正在学习或即将参加TOEFL、GRE或GMAT测试的用户会有很大的帮助。
在网页文本中自动查找并高亮显示单词可以在用户开始阅读之前迅速吸引他们的注意力。可独立地运行并能实现所有的功能的客户端程序使得用户在电脑没有连接在网上时也同样可以进行学习。精心设计的袖珍词汇浏览窗口可以方便地与浏览器或其他程序同时使用。这样用户就可根据自己的多种学习时间,比如在课堂或家中学习,在登录、退出电脑或在其他工作间隙之间来进行语言词汇学习。
虽然本发明在以上的描述中提及了一些特徵和细节,但本发明的范围及定义仍以以下权利要求中所声明的为准。
附说明书附图附图标记说明图1.将互联网资源的整体作为一本书来进行语言词汇学习的理念(1)词汇和相关网页资源信息的索引,即有关在哪一个网页上,一位网页的作者在他或她所著的故事、小说、散文或笔记中使用了该词汇的信息图2.本发明的方法和系统总览(1)在文本内容中自动查找和高亮显示所查询的词汇(2)打开与词汇相关的互联网网页(3)访问互联网资源(4)获取网页中的内容信息(5)网页资源信息索引图3.对数据库中的词汇与相关网页资源信息索引的有效性进行审核的流程4.随机从数据库中取出并显示单词和词组同时使每个单词或词组都有相等的几率被选出的算法(1)词汇被分门别类地归类为个人词汇、TOEFL词汇、GRE词汇、GMAT词汇、SAT词汇等类别(2)根据随机数和浏览次数将词汇进行排序(3)设置随机数,更新浏览次数(4)在浏览窗口中显示目前排序在第一位的词汇(5)当第一个记录被取出后立即停止在缓冲区中对记录进行查找的循环缓冲区
权利要求
权利要求如下1)利用互联网资源进行语言词汇学习的方法,该方法包含以下部分(a)组织并存储单词和词组到一个词汇数据库中(b)为每个单词和词组查找并选择相关的网页(c)将单词或词组作为关键字标引这些相关的网页(d)审核并更新单词或词组与这些互联网资源信息的索引(e)从词汇数据库中取得词汇和相关的互联网资源信息(f)打开一个使用了当前单词或词组的网页
2)权利要求1中所指的方法,还包括以下部分(a)在网页文本中自动查找并高亮显示当前的单词或词组,以吸引用户的注意力(b)设计一个袖珍词汇浏览窗口,用来显示在屏幕的一角,以便与浏览器或其他应用程序一同使用(c)设计一个独立的客户端运行程序,可以在用户计算机在线时与服务器交互数据,在用户计算机处於离线状态时作为一个独立的客户端程序运行并实现全部功能。
3)权利要求1中所指的方法,还包括词汇和相关的网页资源信息被随机地从数据库中取出并显示,同时每个单词或词组有相等的几率被选出
4)权利要求3中所指的方法,还包括以下部分(a)在词汇每次显示时为其设置一个随机数(b)在词汇每次显示时更新该词汇的显示次数(c)使用数据库的升序功能,使得所要显示的单词总会是缓冲区中的第一条记录,确保了词汇选择时的速度和高效
5)权利要求1中所指的方法,还包括词汇可以被设置显示优先级,以便让用户设定一些单词和词汇的显示频率
6)权利要求1中所指的方法,还包括词汇和相关网页资源信息可以被添加到用户的个人生词本中,有针对性地进行学习和记忆
7)利用互联网资源进行语言词汇学习的系统,包括以下部分(a)一个词汇数据库,用来存储词汇数据和相关网页资源信息(b)一个审核机制,用来访问网页资源,获取网页中的内容信息,用其中的文本信息与词汇相比较和匹配,从而验证数据库中的这些网页资源信息的索引是否有效(c)一个服务器端,用来从词汇数据库中获取数据并发送到用户的浏览器或客户端程序(d)一个网页浏览器,用来显示词汇和相关网页资源信息,打开某个相关的网页(e)一个客户端程序,用来显示词汇和相关网页资源信息,打开某个相关的网页,并可以自动查找和高亮显示网页中所载有的当前词汇(f)一个客户端局部数据库,用来存储更新的词汇和相关网页资源信息,以便计算机离线时可以显示相关信息
8)权利要求7中所指的系统中,词汇数据库中的每一条数据记录包含的成分有词汇、词汇定义、范例、提示和网页资源信息等
9)权利要求7中所指的系统中,词汇和相关网页资源信息的显示部分分包括(a)显示词汇和网页资源信息(b)显示用来测试词汇定义和用法的多选题(c)显示用户过去测试的成绩记录(d)根据用户自行设定的时间间隔自动显示下一个单词或词组
10)权利要求7中所指的系统,还包括(a)可为词汇设置显示优先级(b)可将词汇添加到用户个人生词本中(c)可将词汇从可以被浏览的状态变更为非浏览的状态或从非浏览的状态变更为可以被浏览的状态,并可添加、更新和删除个人生词本中的词汇
全文摘要
本说明书描述了一种利用互联网资源进行语言词汇学习的方法和系统。该方法和系统适用于一般的语言学习和一些标准语言测试,如TOEFL、GRE和GMAT等的学习和准备中。词汇和相关的网页资源信息被组织和储存到词汇数据库中。用户通过浏览器或具有词汇浏览窗口的程序来浏览词汇,然后打开一个使用了当前单词或词组的网页,从而利用网页资源充分的上下文语境而进行语言词汇的学习。网页页面中载有的单词或词组被自动地查找并高亮显示出来以吸引用户的注意力。数据库中的数据被周期性地进行审核,以确保词汇和网页资源信息索引的有效性。本发明的最大的优点在於可以充分有效地利用互联网上大量的免费资源,包括故事、小说、散文、笔记或其他文体的文章来进行语言词汇的学习。
文档编号G06F17/30GK1525354SQ03104060
公开日2004年9月1日 申请日期2003年2月24日 优先权日2003年2月24日
发明者王雅量, 王存, 叶峰, 王继, 郭晓玲 申请人:王雅量
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1