语言输入梯度加速法的制作方法

文档序号:6406744阅读:201来源:国知局
专利名称:语言输入梯度加速法的制作方法
技术领域
本发明涉及一种用于计算机、电子打字机等电脑设备上的键盘式语言输入方法和实现该方法的设备,它适用于世界上各种主要语言。
键盘式输入是在计算机上输入语言的最主要和最普遍的手段。
计算机键盘是机械式打字机在计算机设备中的自然延续。计算机键盘和打字机键盘在基本键位的排列上是一致的。
对于拼音文字,例如英语,用计算机键盘输入语言与用打字机打印语言几乎是相同的。计算机逐个字符接受并存储或显示操作员在键盘上输入的语言信息。这是一种直接输入方式。
对于非拼音的形意文字,例如汉语,在计算机上输入语言,一般是采用编码的方法,按某种规则把语言中的字和词用字母或数字等键盘通用符号编码,由计算机程序将接收到的字符串转换成对应的字或词后存储或显示。这是一种间接输入方式。
目前在我国大陆、香港和台湾市场上流行的各种主要汉语编码输入法,尚未达到易学性和高效性的良好统一,能被各种层次广大用户普遍接受的很少。从社会普遍应用的角度考察,目前汉语的间接输入方式从整体上讲确实还比不上拼音文字的直接输入方式方便快捷。
由于这种状况,我国国家科研机构和民间科研力量都在大力继续研究汉语输入方法的改进,希望取得汉语输入的新突破。
迄今为止的绝大部分汉语键盘式输入的研究,都遵循基本相同的思路继续研制寻找新的编码系统。各种新编码系统不断问世。虽然每一种编码系统一般都具有自己的特色,但各种不同的编码系统之间缺少兼容性与相通性。编码系统越多,用户越是难于选择;而且由于每一种科技产品都有它的生命周期,编码方法也不例外,一旦市场主导的编码系统发生淘汰与更新,大量用户立刻陷入已掌握的编码方法也要随之淘汰、必须重新学习新系统的状况。这样势必造成对人类主体知识资源的巨大浪费。
如果提升到较高的层面,可以考虑另一种思路是否存在着适用于任何编码系统的独立的高速输入方法。
从更广泛的角度考察,还可以提出这样的问题,是否存在着适合于任何语言系统的独立的高速输入方法。
这是电脑键盘式语言输入方法改进的根本性问题。换言之,目前缺少一种独立于任何具体语言系统,独立于任何语言中的具体编码系统的普遍适用的语言高速输入方法。
电脑键盘是西文打字机在计算机设备中的自然延续,所以西文的计算机键盘输入法也是机械式打字机打字法的自然延续。由于计算机键盘的击键力度明显小于机械式打字机,它能够提高打字员的击键速度从而提高输入速度。但提高的幅度很有限。除此以外,西文计算机键盘输入与打字机打字相比,缺乏根本性的进步。
直接式输入方式是传统机械式打字机唯一可以使用的方法,因为机械式打字机没办法采用间接输入方法。但这并不意味着直接式输入方法就是最好的输入法。换言之,对西文输入来说,计算机键盘输入没有能够摆脱机械式打字机直接输入这种传统模式的束缚。
如果仅仅从表面层次分析,就会得出间接输入方式不如直接输入方式直观方便的结论。但实际上,汉语编码计算机键盘间接输入的方法,却包含了计算机键盘输入改革与发展的方向,蕴藏着巨大的优越性。可是这一发展方向和潜在的优越性并没有得到清醒的认识和足够的重视。
撇开具体的语种和编码方法,从基本方法论上考察,间接输入的本质是计算机程序对接收的字符串进行智能化的预处理。这实际上代表着计算机键盘输入发展进步的根本方向,是提高计算机键盘输入速度的主要途径,具有普遍的适用意义。
本发明的目的是提供一种灵活通用的计算机键盘输入的方法和实现该方法的设备。它独立于任何具体语言,独立于任何一种语言中的具体编码方法;它与现有的计算机键盘完全兼容;它能够显著提高计算机键盘的语言输入速度;它适用于任何一种语言,适用于任何一种语言中的任何一种编码系统。
本发明的目的是这样实现的设计提供一种跨语种、跨编码的词库词长梯度分离的普遍适用原则,根据此原则,能够将每一种语言的常用词全集根据词长的差异划分成两到四个子集;在此基础上,实施词长梯度多重分流截尾加速输入的程序处理技术;配合以在传统计算机键盘上设置输入加速键;加速键的设置可以有多种方式,第一种方案是把空格键改造成两到四个空格键,指定其中一到三键为空格/加速双重功能键,第二种方案是在现有键盘上增加一到三个加速功能专用键,第三种方案是不改变现有键盘,但选择指定一到三个已有键位作为原有功能/加速功能双重键,第四种方案是在以上三种方案之间进行某种组合;用加速键的尾键切换方式将程序根据词长梯度检索分流出的高频词输入计算机,从而使计算机键盘输入的实际速率大大提高。
以下详细介绍具体实施方案。我们将主要以三梯度加速输入方案为例叙述。也可以实施简化的双梯度加速输入方案或强化的四梯度加速输入方案,这三种方案的基本原理是相通的。
一、在计算机传统键盘上设置加速键如上文所述,在计算机键盘上设置输入加速功能键有多种变通的实施方法,包括对现有键盘不做任何物理上的改变,仅仅对某些选定的键位增设加速功能。我们下面主要以对传统空格键改造为例进行介绍,因为发明者认为这是较好的实现方法。其他的实施方法,由于原则相通,可以类推。
把传统键盘的单空格键改造成为左右两空格键,或者改造成为左中右三个空格键,或者改造成为左、中左、中右、右四个空格键,如

图1、图2和图3所示。双空格键方式中,右空格键是空格加速双功能键。三空格键方式中,右侧两个空格键是空格加速双功能键。四空格键方式中,右侧三个空格键是空格加速双功能键。一般设置三个空格键。以下叙述主要对应于三空格键方式(图2)。
二、词库词长梯度分离的通用原则所谓词库词长梯度分离,是把一种特定语言中的常用词、词组、和短语根据它们词长的数量差异划分成若干个子集、一般划分为三个子集。也可以划分为两个或四个子集。现主要以三个子集为例说明。
词、词组和短语是语言的建筑材料。在拼音文字中,词可以由一个到数十个字母组成。在汉语中,词是由一个到数个汉字组成,撇开具体语种,人类的任何一种书面语中的词、词组和短语都可以看作是平面上线性排列的符号串。为方便起见,将此符号串的长度,即符号的个数,统称为词长。
对于每一种语言,按照词长的差异,把词、词组和短语划分为三个子集。我们主要以具有代表性的英语和汉语为例说明划分方法,其他语言可以用相通的原则类推。
英语把由1到5个字母组成的词归入一个子集,把6到10个字母组成的词、词组和短语归入一个子集,把超过10个字母组成的词、词组和短语归入一个子集。对后两个子集分别建立词库,称作梯度二词库和梯度三词库。
汉语把单字词归入一个子集,把双字词归入一个子集,把三字和三字以上的词、词组和短语归入一个子集。对三个子集分别建立词库。分别称作梯度一、梯度二和梯度三词库,也就是单字词库、双字词库和多字词库。
需要说明的是,以上划分方法不是唯一的。对于每一种语言,应当根据该语言中词条相对于词长的静态数量分布和动态使用度分布、同时结合认知心理学的认知操作复杂度分析原理,确定词长划分的分界线。
三、词长梯度多重分流截尾加速输入技术在计算机存储介质中,分别对两个(拼音文字)或三个词库(汉语)子集库中的词、词组和短语按高频优先的原则建立方便检索与显示的数据结构。这里所谓两个或三个词库是功能上的而非物理上的,数据结构的实现方法可以有多种。
将左空格键规定为普通空格键(1),中空格键规定为一级加速键(2),右空格键规定为二极加速键(3)。在通常状态下它们都起普通空格键的作用,在语言加速输入状态下,中右两空格键即有空格键的功能,又有尾键切换加速输入的功能。
当用户在键盘上输入时,计算机对接收到的字符串在两个(拼音文字)或三个词库(汉语)中进行并行分流式检索,将前缀字母或前缀码相同的候选词集合中对应的两个(英语)或三个(汉语)高频词检索出,同时在屏幕上显示。用户根据目标词的匹配情况,击打对应的加速尾键或普通空格键以结束输入。如果目标词没有出现,用户继续输入后续字符,计算机按同样原理继续工作,直至用户需要的目标词被检索出完成匹配输入为止。
下面举两个直观的例子说明上述原理的运用方法。一个例子是汉语输入,另一个是英语输入。
汉语在汉语编码输入状态下,计算机程序对用户输入的每一个汉语编码字符进行检索,将对应的高频字,高频双字词和高频多字词在提示行按从左到右的方式排列显示(也可以采用其他排列方式和显示技术,例如窗口技术等)。高频字用左空格键(1)结束;高频双字词用中空格键(2)结束(一级加速);高频多字词用右空格键(3)结束(二级加速)。
假定用户用全拼音方式输入,目标词为“改革开放”,全部编码是“gaigekaifang”,不考虑重码时共十二个字符。当输入第一个字符“g”时,提示行显示如下。
全拼:g:个:工作:国务院(一码加速字词)高频一级加速二级加速字高频双字词高频多字词用户需要的目标词还未在提示行出现,继续输入下一个字符“a”,提示行显示如下。
全拼:ga:该:高兴:改革开放(双码加速字词)此时目标词已检索出并显示,用户只需击打右空格键,目标词“改革开放”就自动到位,不需再考虑后续的编码字符。
又如,在以上例子中,若用户要输入的目标词是“国务院”,那么一键“g”加中空格键就可以完成输入。
英语传统英文输入是计算机将从键盘上接收到的非功能性字符,包括英文字母和数字,直接存储并显示。在本方案下,可以设置普通输入与加速输入两种状态,用一功能键进行切换。普通输入状态的处理方法与原来相同,加速输入状态的处理方法叙述如下。
当计算机从键盘上接收到的字符串是英文字母串时,立即将此字母串在屏幕的提示行显示,同时在梯度二词库(由6到10个字母组成的词、词组和短语库)中和梯度三词库(由多于10个字母组成的词、词组和短语库)中检索出前缀字母相同的对应的高频词,在提示行按左右排列顺序显示(同样可以采用其他的显示方式),用户根据目标词的匹配情况,击打对应的空格键(1)、(2)或(3)以结束输入。
例如,用户要输入的目标词是“international”,当第一个字母“i”被计算机接收后,根据以上处理过程在提示行显示为*i*important*interesting(后两项为单字母加速词)输入一级加速二级加速字母高频词高频词用户需要的目标词尚未出现,继续输入下一个字母“n”,提示行显示为
*in*inside*international(后两项为双字母加速词)此时目标词已检索出并显示,用户击打右空格键,目标词“international”自动到位并存储进相应文件,不需再输入它的后续字母。
在加速输入状态中,左空格键的作用与普通输入状态没有区别。例如,在上述例子中,用户也可以将‘international’的每一个字母全部输入,然后打左空格键结束输入。六个字母以内的词也是用左空格键结束。
需要指出的是,上述目标词的匹配反应过程从表面上看与汉语输入中的重码字选择操作过程有些类似,实质上却有本质的差别。在汉语输入重码字的选择操作中,用户不知道目标字或词将在提示行的什么位置上出现,他或她必须顺序注视搜索提示行显示的多个甚至全部显示项,直到找到目标字或词为止,经常还需要换页检索。在本加速输入方案中,提示行最多只有三个显示项,且用户对于目标词的出现已有定向预测性,只需在预定位置上观察目标词是否出现,反应的过程很快,并且能够在短期操作实践中进一步提高。此外,实验心理学的研究早已证实,视知觉的瞬间注意广度在一个线性行上一般不超过四个组块,在此范围内认知操作反应具有并行性,所以速度极高。超过这个范围,认知操作反应时间将迅速增长。所以定向匹配反应与多项选择反应存在显著差异,前者比后者速度高得多。
四、其他变通的实施方案以上我们已经详细介绍了实施方案原理和实施过程的各个部分,其中键盘加速键的设置与指法操作可以有多种变通的方法。这里再介绍一种,其他的方法可以类推派生出多种。
用任意数字键兼做一级加速键,用分号键兼做二级加速键。其余的操作原理都不变。注意数字键和分号键本身的功能并不受影响,可以由计算机程序方便地控制它们在两种功能之间自动来回转换。当进入一个字或词的输入状态时,它们也自动进入加速功能键的状态;当一个字或词的输入完成之后,它们自动恢复到原有符号键的状态。
语言梯度加速输入法的优点是很明显的。
首先,它是一种超越任何具体语言,任何具体编码系统之上的通用的方法,可以与任何语言或任何编码系统有机地结合在一起。它适用于任何书面语言,任何编码系统。这是迄今为止任何一种编码方案输入方案所不具备的。
第二,它能使语言的键盘输入速度显著提高。我们按三梯度加速输入方案在数据库中对使用频度最高的两万个英语词条进行了初步的模拟测试,对使用频度最高的一万六千个汉语词条进行了模拟测试(采用简易音部码汉语输入法中的双拼加形码的编码方案),英语的词输入平均击键次数减少55%左右(与原词长比较),汉语输入的平均击键次数减少60%以上(与按字输入的码长比较),也就是说,两者的输入速度可分别提高1.2倍和1.67倍。
第三,对于汉语编码输入,词长梯度分流、加速键尾码切换的原理使大量重码字词以简码截尾方式完成输入,它能显著地扩大编码空间(采用n梯度加速输入法使原编码空间增加n倍),降低重码率,从而进一步提高输入速度。
第四,它与现有计算机键盘兼容,易学易用。
下面结合汉语输入,介绍一个利用现行通用键盘实现的方案。由于在以上技术方案的叙述中已详细介绍了实施原理与过程的各个方面,并配有实例,所以以下介绍较为简略。
1.采用根据简易音码输入法(专利申请号为92108715.2)原理设计的双拼加形码的编码规则,规定每个字或词最多可有五码(这五码相当于拼音文字中的原有词长,在实际输入中绝大部分字词的输入都在三码以内完成)。
字词取码规则如下第一字第二字第三字末字合计单字五码五码双字词前两码前三码五码三字词前两码前一码前两码五码多字词前两码前一码前一码前一码五码说明单字的五码的排列顺序是声母+韵母+一到三个形码2.将数字键[1].[2].[3].[4].[5]统一设置为一级加速键,[6].[7].[8].[9].
统一设置为二级加速键。多键加速功能统一的设置方法可以方便指法操作,提高击键速度。
3.将动态覆盖率达到99.9%以上的汉语常用词,包括短语、词组、成语和俗语共五万条分别收入三个词库单字词库、双字词库和多字词库,根据统计语言学和认知心理学相结合的原理给每一个词赋以一个优先权数。在此基础上,运用算法理论与计算机技术(例如并行处理技术)在三个词库中建立方便高速检索的数据结构,在每一个词库中,前缀码相同的候选词集合中优先权数最高者最先被检索到。我们称它们为高频词。
4.用户从键盘上输入汉语时,计算机程序在提示行从左向右同时显示高频字、高频双字词、高频多字词。用户用空格键结束高频字的输入,用一级加速键结束高频双字词的输入,用二级加速键结束高频多字词的输入。
5.将系统设计成能够与各种流行的汉字操作系统兼容,能够悬挂到这些操作系统下运行。
权利要求
1.一种用于计算机、电子打字机等电脑设备上的键盘式语言输入方法和实现该方法的设备,其特征是采用适用于各种语言、各种编码系统的词长梯度分离原则,将每一种语言的常用词全集,包括词组和短语,根据词长的差异划分成两到四个子集,在此基础上,实施词长梯度多重分流截尾加速输入的程序处理技术,在传统计算机键盘上设置输入加速键,用加速键尾键切换方式将程序根据词长梯度检索分流出的高频词输入计算机。
2.根据权利要求1所述的方法,其特征是把一种特定语言中的常用词、词组、和短语构成的词汇全集,根据它们相对于词长的静态数量分布和动态使用度分布,以词长的数量差异为界线划分成两到四个子集,一般划分为三个子集。
3.根据权利要求1和2所述的方法,其特征是在计算机存储介质中,对划分出的两到四个词汇子集分别建立词库,在每个词库中的对词、词组和短语按高频优先的原则建立方便检索与显示的数据结构。
4.根据权利要求1所述的方法和设备,其特征是在传统计算机键盘上设置输入加速键;加速键的设置有以下几种方式,第一种是把传统计算机键盘的单空格键分隔成两到四个空格键,指定其中一到三键为空格/加速双重功能键(2)、(3),第二种是在现有键盘上增加一到三个加速功能专用键,第三种是不改变现有键盘,但选择指定一到三个已有键位作为原有功能/加速功能双重键,第四种是在以上三种方案之间进行组合。
5.根据权利要求1、2、3和4所述的方法和设备,其特征是计算机对接收到的语言字符串或编码字符串分别在两个到四个词库子集中进行并行分流式检索,将前缀字母或前缀码相同的候选词集合中对应的两到四个高频词检索出,同时在屏幕上显示,用户根据目标词的匹配情况,击打对应的加速尾键或普通空格键以结束输入。
全文摘要
一种用于计算机、电子打字机等电脑设备上的键盘式语言输入方法和实施该方法的设备。它适用于各种语言、各种编码系统,与通用键盘完全兼容。它能够将各种语言、各种编码系统的输入速度提高100%到200%。
文档编号G06F3/023GK1085671SQ9211271
公开日1994年4月20日 申请日期1992年11月7日 优先权日1992年11月7日
发明者徐火辉, 王璐 申请人:王璐, 徐火辉
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1