基于词频的单词表排序的制作方法

文档序号:2623245阅读:577来源:国知局
专利名称:基于词频的单词表排序的制作方法
技术领域
目前,基于字母的文字,如英文,俄文等,其单词(以下也称词汇)表的排 序基本方法为顺字母序,也有逆序方法。不同的排序方法在辅助单词记忆,提 高单词学习效果方面有不同用处。本发明以单词(词汇)的词频(即单词在某
一范围内出现的频率)为依据按一定顺序排列,以方便根据词频选择单词进行 记忆。
背景技术
目前的单词表,主要两个目的, 一个是査询, 一个是背诵记忆。现有的词汇 表(单词表)的字母顺序排序方法,着眼点是单词本身的査询,如《快速突破 英语专业八级词汇10000》(ISBN978-7-81111-449-2)。有的词汇表,着眼于单 词本身的方便记忆,采用了其它排序方法,如字母逆序法来排序,如《最新GRE 词汇逆序速记宝典》(ISBN: 9787500070399)。但迄今为止,这些方法,无非是 就单词考虑单词,见效慢。进行新的排序方法,是有必要的。
以下所有部分仅以英文单词举例,其它基于字母的文字如俄文法文等皆类同。

发明内容
本发明是为了解决学习词汇的问题。
一定文档中最常见的单词出现的频率近似服从指数分布,比如,1000个最常见的单词,在一篇文档中出现的概率大概是一半,5000个,则是97%左右。也 可以用其它分布进行拟合单词出现的频率。总之,单词出现频率不等,是一个
显然的事实。本发明的理论基础,只建立在各单词的词频不等上。
词频的统计范围,不限于全部单词,也可以只包含某一指定范围的单词如GRE 单词,某专业领域内的单词,最常见的8000个单词,等。词汇也可以只统计原 词,而将派生词排除在词频统计外,而采用其它方式排列,比如放在原词的条 目下,如将派生词abbreviation放在原词abbreviate下面。
本方法造成的单词表,可以用于记忆单词,但着眼点不仅仅限于单词本身, 而是放在整个单词的应用环境中,要考虑到方便阅读,方便写作,方便听力, 方便交流等,因此,优先记忆阅读等过程中最常见的单词是必要的。所以,统 计词频并按照其为依据进行一定的排序是必要的。
统计词频后,按照词频高低进行排序。比如,frost出现的频率比denim高, 于是,单词表中先出现frost,后出现denim。也可以相反的词频顺序。也可以 分类进行词频顺序排列,如先按照头1字母进行分类,然后再按词频排序。
基于词频对单词(词汇)进行一定的排序,就做成了一个单词(词汇)表。 即是本发明的内容。
具体实施例方式
其实施,首先是统计词频,仅仅这点不是本发明所要求的权利范围。所以, 可以采取任何方式,比如,对于电子或软件产品而言,词频不仅可以是静态的, 还可以是动态的采集而来,不赘述。
以词频为依据对单词(词汇)表进行排序,是具体实施步骤。也是本发明的权利范围。
最终单词(词汇)表的表现形式,不仅可以采用传统印刷品的方式,也可以 采用电子或软件产品的方式。对于电子或软件产品而言,还可以自定义公式, 实现个性化的词频排列顺序。
权利要求
1、一种单词(词汇)表的排序方法。其特征在于对字母类文字,如英语等,其排序依据(或依据之一)为词频的高低。其词频统计范围不限于全部单词,也可以只包含某一指定范围的单词。
全文摘要
本发明以单词(词汇)的词频(即单词在某一范围内出现的频率)为依据按一定顺序排列,以方便根据词频选择单词进行记忆。基于词频对单词(词汇)进行一定的排序,就做成了一个单词(词汇)表。即是本发明的内容。
文档编号G09B19/06GK101587662SQ20091000088
公开日2009年11月25日 申请日期2009年1月20日 优先权日2009年1月20日
发明者郭传喜 申请人:郭传喜
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1