字母字符输入装置和方法

文档序号:7605290阅读:1013来源:国知局
专利名称:字母字符输入装置和方法
技术领域
本发明涉及从袖珍键盘输入字符的装置和方法,更具体地,本发明涉及从诸如电话袖珍键盘等具有少量按钮的袖珍键盘输入字符的装置和方法。
背景技术
随着移动通信的发展,主要用于语音通话的移动工作站中增添了一种接收和发送诸如文本消息之类的数字信息的功能。因此,移动工作站上用来输入电话号码的按键另外还具有了输入字符的功能,这样便减少了用作移动工作站输入装置的袖珍键盘的尺寸,从而限制了袖珍键盘上按键的数目。每种语言的字母通常都超过袖珍键盘上的12个键的数目。因此,存在用电话袖珍键盘上的按键单独表示每个字符,或者以两种或者多种不同按键的组合来表示每个字符的需求。

发明内容
本发明是对现有的专利申请(申请号为PCT/KR00/00601、PCT/KR01/00076、PCT/KR01/02267、PCT/KR02/01355以及PCT/KR03/01433)做出的改进。本说明书中将对上述在先申请的内容给出部分地介绍,未写入本说明书中的部分请参考上述在先申请的相应部分。


以下附图是本说明书的一部分,将结合说明书一起解释本发明的实施例,并与具体实施例一起解释本发明的原理。
图1-1是基本英文袖珍键盘的一个示例图;图1-2是中间的字符指定为代表字符而其它字符为连续字符(如英文)的连续性袖珍键盘的示例图;图1-3是3或4个字符分为一个组的基本英文袖珍键盘的示例图;图2-1是日语连续性袖珍键盘示例(1)的示意图;图2-2是日语连续性袖珍键盘示例(2)的示意图;图2-3是二维多次使用(或再使用)交叉控制处理方法的示意图;图2-4是二维交叉控制处理方法的示意图;图3-1(无)图4-1是由一个基本辅音和一个基本元音组成分组(1)的示意图;图4-2是由一个基本辅音和一个基本元音组成分组(2)的示意图;图4-3是由一个基本辅音和一个基本元音组成分组(3)的示意图;图4-4是一对辅音和一个元音分为一组时重复选择方法的处理流程图;图4-5是使用韩语的元音成分的袖珍键盘(1)的示意图;图4-6是使用韩语的元音成分的袖珍键盘(2)的示意图;图4-7是使用韩语的元音成分的袖珍键盘(3)的示意图;图4-8是使用韩语的元音成分的袖珍键盘(4)的示意图;图5-1是使用拼音索引输入中文字符的示意图;图5-2是使用完全关联简码(Fully-Associated Simple Code)输入英文词或短语的示意图;图5-3是并行输入方法(1)内识别和处理输入值为简码的示意图;图5-4是并行输入方法(2)内识别和处理输入值为简码的示意图;图5-5是通过客户端和服务器并行输入方法的示意图;图5-6是在索引内对词或短语进行分组的示意图;图6-1是第一服务器(即交换服务器)解释从客户端发送来的简码并将通过解释简码获得的信息发送给使用该信息的第三服务器的示意图;图7-1是通过控制处理方法(1)输入各种符号的连续性袖珍键盘的示意图;图7-2是通过控制处理方法(2)输入各种符号的连续性袖珍键盘的示意图;
图8-1(无)图9-1(无)图10-1是使用罗马字符的语言(1)的辅音元音分开型袖珍键盘(Consonant-Vowel Separated Keypad,CVSK)的示意图;图10-2是使用罗马字符的语言(2)的辅音元音分开型袖珍键盘的示意图;图10-3是使用罗马字符的语言(3)的辅音元音分开型袖珍键盘的示意图;图10-4是使用罗马字符的语言(4)的辅音元音分开型袖珍键盘的示意图;图10-5是辅音元音分开型袖珍键盘的快捷输入方法以及在并行输入方法(中文)内识别和处理输入值为简码的示意图;图10-6是使用罗马字符的语言(5)的辅音元音分开型袖珍键盘的示意图;图10-7是辅音元音分开型袖珍键盘(1)内受限语言输入方法(Language Restricted Input Method)的流程图;图10-8是辅音元音分开型袖珍键盘(2)内受限语言输入方法的流程图;图10-9是不完全辅音元音分开型袖珍键盘内受限语言输入方法的流程图;图11-1是输入值在客户端解释时系统配置的示意图;图11-2是输入值在服务器侧解释时系统配置的示意图;图11-3至11-10是处理简码(在并行输入方法内)的示意图;图11-11是简码(即快捷码或快捷输入值)类型的示意图;图12-1(无)图13-1至13-4是通过部分完全输入方法以及通过部分快捷输入方法输入词或短语的并行输入方法的示意图;图14-1至14-2是使用长按的控制处理方法的示意图;图14-3是长按后使用短按的示意图;
图14-4是短按后使用长按的示意图。
具体实施例方式
首先,现有技术文件的内容将通过下述的语言进行介绍。尽管没有具体说明,但是很明显,与某一语言相关的现有技术文件的内容也可以应用于其它语言。
1.一般补充说明1.1现有技术和本发明中袖珍键盘的各种应用很明显,已有技术文献和本发明中提出的袖珍键盘可以使用在所有具有电话袖珍键盘形式的应用中,包括移动终端分的数字袖珍键盘或者标准袖珍键盘、以软件形式在屏幕上实现的按键或者门锁。尽管标准袖珍键盘的数字按键与在先申请文件和本发明袖珍键盘的数字按钮布局上有所不同,但是,在先申请文件和本发明中的袖珍键盘按钮按键布局可以适用于标准袖珍键盘的按键。例如,在先申请文件和本发明中指定给按键[1]的字符可设置给袖珍键盘数字按键的按键[1],等等,其中的方法可以应用于字符的输入、简码的使用和不同代码的记录。
1.2连续击键延迟时间(SSDT)和非连续击键延迟时间(DSDT)的确定对于如朝鲜语和印地语等辅音和元音交替出现的一些语言,向每个按键分派一对代表性辅音和元音,以便一次击键输入辅音而两次击键输入元音。可以实现一种算法,首先识别在预定的延迟时间(例如0.1秒)间隔中给出的一个按键的两次击键为元音,并且能使用户更容易地有效输入元音。所述延迟时间可根据连续按下相同按键中一次击键通常需要的时间间隔。为简便起见,这种延迟时间称为“连续击键延迟时间(Successive Stroke Delay Time,SSDT)”。另外,还可以实现一种算法,首先识别在预定时间(例如1秒)间隔内给出的按键的两次击键为两个辅音。为简便起见,这种延迟时间称为“非连续击键延迟时间(Discrete Stroke Delay Time,DSDT)”。这种方法也可以应用于相同按键的三次或者更多次击键。
例如,如图4-1或4-2所示,如果用户以0.08秒的延迟时间间隔按下按键[1]两次,则该两次击键首先被识别为一个元音,即“⊥”;如果延迟时间为1.1秒,则该两次击键首先识别为两个辅音,即 和 如果延迟时间为0.5秒,则可根据表现元音和辅音出现方式的对应语言的结构确定用户是要输入一个元音还是要输入两个辅音。甚至如果两次击键的延迟时间是0.08或者1.1秒时,也可以根据表现元音和辅音出现方式的对应语言的结构确定是将两次击键识别为一个元音还是识别为两个辅音。
按照惯例,该时间间隔是固定的(例如1秒),以便将对应时间内连续按下两次按键识别为两次连续的击键,而将在比对应时间长的时间间隔内连续两次按下按键识别为两次非连续的击键。识别两次连续的击键(例如0.1秒)和识别两次非连续的击键(例如1秒)的基准时间是有区别的。
通常,在输入方便性方面,RSM优于在先申请文件中的PWSM。因此,这种具有RSM优点(即输入规则简单并且方便)的方法使用元音和辅音交替出现的具体语言的结构,以便避免多义性,并且以下面的方式使算法的实现更简化SSDT不同于DSDT,并且允许用户指定SSDT和DSDT。
2.多维交叉控制处理方法图2-2所示的示例中“あ”行中字符为代表性字符,且该行字符按照如上述表格所示的词典排列方式指定给各个按键。虽然第四及第五控制可额外指定给本申请人在先申请文件中介绍的第二及第三控制所用的控制键上,但是仅仅将第二及第三控制指定给该控制键,其原因是为了使击键次数减至最少,并对该示例中的控制键进行最佳运用。
图2-2中所示的输入连续字符(succession character)的方法与本案申请人在先申请文件中公开的相同。例如,当输入一个基本字符之后开始选择一个控制时,输入便如“い=あ+[*]”。接着,图2-2示出了一种输入每个字符的衍生字符(即变换字符)的方法,即长音、浊音及半浊音。
在图2-2中,每一个可用作控制键的按键(按键[*]及[#])都可以用作连续控制键,因此没有用于衍生字符的控制键。但是在一个目标字符的基本字符是连续性字符的情况下,在该连续性字符输入后,未作连续控制键使用的连续控制键可被用作衍生字符控制键(为简便起见,称作“反向控制键”)。
例如,输入为い=い+“反向控制键”=あ+[*]+[#]和ご=こ+“反向控制键”=か+[#]+[#]+[*]。可以理解,在该控制处理方法中,鉴于い是基本字符い的衍生字符,输入い时未用作连续性控制键的反向控制键在输入衍生字符时用作了控制键。本案申请人在先申请文件中所记载的跳跃控制处理方法(Jump Control Processing Method,JCPM)亦可用于本例中。以链型(chain-type)控制处理方法的观点而言,每敲击一次反向控制键便选择了输入前一输入字符(如こ)的衍生字符(如ご)的“下一控制”。
由于は行上的字符具有两个衍生字符,即浊音及半浊音,此时敲击反向控制键一次代表长音,而敲击反向控制键两次代表半浊音。亦即,输入为ぶ=ふ+“反向控制键”=は+[*]+[*]+[#],ぷ=ふ+“反向控制键两次”=は+[*]+[*]+[#]+[#]。
然而,上述相同的方法却不适用于目标字符的基本字符是代表字符的情况。这种情况下,代表字符的衍生字符被额外指定给连续控制键中的一个,以输入目标字符。
例如,[*]键用于输入一个代表字符的衍生字符(长音、浊音或半浊音),其输入为あ=あ+[*]+[*]+[*];亦即,一个代表字符的衍生字符(长音、浊音或半浊音)被当作第四连续字符,其可使用[*]键输入。该规则归纳于以下表格


上述利用反向控制键扩大控制键功能范围从而输入更多字符或类似符号的方法称作“交叉控制处理方法(CCPM)”、“曲折控制方法(Zigzag ControlProcessing Method,ZCCP)”或“多维交叉控制处理(MCCP)”。MCCP可以应用在有三个或更多控制键的情况。
很明显,以上表格中除第一列以外的空白处还可用来输入其他字符或各种符号。上述的例子中,仅仅使用了一个反向控制键;也就是说,当ぷ的输入为ぷ=ふ+“反向控制键两次”=は+[*]+[*]+[#]+[#]时,一个反向控制键[#]通过重复选择该反向控制键而用作作为连续控制键的[*]键。为简便起见,该方法称作“二维交叉控制处理方法(2CCPM)”或“二阶段交叉控制处理”。
也就是说,使用一个控制键输入一个字符的情况称作“一维交叉控制处理(1CCP)”,即以一维的方式使用该控制键。相反地,二维(交叉)控制处理方法中使用两个不同的控制键输入一个字符。例如,假设ご是こ的衍生字符,其输入为ご=こ+“反向控制键”=か+[#]+[#]+[*]。虽然该反向控制键被定义为输入代表字符(即き、く)的第一和第二连续字符的控制键,但本例中反向控制键([*]键)被用作输入こ的衍生字符ご的一个衍生字符控制键。可以理解,相较一维输入方式中使用一个控制键,在“二维”方式中使用两个控制键。
上述的输入还可以是ぷ=ふ+“一次反向控制键”+“前次控制键的反向控制键一次”=は+[*]+[*]+[#]+[*]。如果重复使用输入ぷ最后所用的控制键(如[#]键)不能输入一个衍生字符,则可再次使用前次反向控制键的反向控制键,以输入另一个衍生字符或连续字符。为简便起见,该方法称作“三维交叉控制处理(3CCP)”或“三阶段交叉控制处理”。这就是说,使用多维交叉控制处理方法可以无限的扩大袖珍键盘上字符和其它字符的可用输入数量。此外,前次输入字符的连续字符或衍生字符通过该控制处理方法可以很容易地输入。
以上说明在图2-3中有示出,该图中以具有两个衍生字符(浊音及半浊音)的は行为例进行说明。在图2-3中,标在一个圆圈内颜色较浅的符号“…”表示,若有必要,额外的字符或符号可以类似的方式使用多维控制处理方法输入,在上述表格的空白处输入另一个字符或符号。在图2-3中,[*]键及[#]键分别在正交方向上被使用。
在本案申请人的在先申请文件中,并非五十字母表中代表字符的第二至第五控制被指定给[*]键,并且[*]键被用作输入衍生字符如长音、浊音和半浊音的控制键。这就是说,二维控制处理方法也可以用在本案申请人的在先申请中。亦即,在输入为い=い+{衍生字符}=い+[*]+[#]时使用两个控制按键。在本案申请人的在先申请中,控制键仅用作连续控制(第二、第三、第四或第五)键或衍生字符(长音、浊音或半浊音)控制键。相反,本发明的二维控制处理方法中,输入一个连续字符后,连续控制键亦可用作衍生字符控制键。对比在先申请中的二维控制处理,这种主控制键(上述例子中的连续控制键)作为衍生字符控制键的再使用称作“二维再使用控制处理(2RCP)”或“二维多重使用控制处理(2MCP)”。
在先申请中所载的方法简单并具一致性,但其所需的击键次数相对较多。为了更加理解在先申请与本发明的区别,图2-4所示是在先申请中一个控制键仅用作连续控制(第二、第三第四或第五)键或衍生字符(长音、浊音或半浊音)控制键的情况。在图2-3及2-4中,颜色较浅的标记部分可以扩展使用。
在上述例子中,交叉控制处理方法中控制在基本字符输入后才开始选择,但也可在基本字符输入之前选择一个控制,其方式与在先申请文件中设置控制在基本字符之后或之前选择的方式类似。例如,输入为い=“反向控制键”+い=[#]+[*]+あ。但是在交叉控制处理中输入基本字符之后选择控制键更方便。
上述原则也适用于任何其它语言,如日语。例如,当使用[*]键及[#]键以CPMERC方式输入阿拉伯文的连续字符时,可使用多维交叉控制处理方法输入附属型元音。例如泰国语,使用[*]键及[#]键作为连续辅音和连续元音的输入的情况下,可使用多维交叉处理方法来输入音调符号。
3.朝鲜语输入中使用元音单元的方法图4-1、4-2及4-3所示为一种输入方法,其中成对的朝鲜语基本辅音与基本元音指定给各个按键,且标记在袖珍键盘上的每个基本辅音与基本元音通过重复选择处理方法输入。在图4-1中,送气音、紧辅音及扩展辅音通过控制处理方法输入。在图4-2中,送气音和紧辅音通过控制处理方法输入。在图4-3中,送气音、紧辅音、基本元音及扩展元音通过控制处理方法输入。
图4.4不仅是实现本发明的流程图,而且能够实现更有效的编程。例如,在考虑图4-4中的末辅音的情况下,可通过检查该辅音是否能形成两个末辅音来实现更有效地编程。
现有技术文件中提出的朝鲜语输入的示例可以应用于其它具有相似特征(即,具有辅音和元音交替出现的结构)的语言中。对于其它的语言,可以考虑相应语言中辅音和元音出现的特征。
例如,使用基本辅音与基本元音的印地语输入系统可以以与朝鲜语输入相同的方式输入,不过仍需要考虑印地语的特征。印地语输入系统的建立比朝鲜语输入系统的建立更简单,这是因为印地语中辅音和元音出现的规则比朝鲜语的更简单。
图4-5至4-8所示为参考本申请的在先申请文件并结合本发明使用朝鲜语中的元音单元并利用元音按键作为控制键的一个示例。
4.简码应用方法和SIM/CIM4.1与字符相关的简码的产生在利用数据通信终端访问信息系统时,字符的输入是绝对必要的。有一些情况下,这些字符编码为数字。小型数据通信终端通常具有一个普通袖珍键盘形式的接口。此处所用的术语“代码”指任何类型的代码,其类型很多,包括电话号码、股票指数(列出的公司)代码、城市代码、地区代码、地铁站代码、银行代码等等。各种名称的编码在简化输入方面具有优点。
此处使用的数据通信终端包括任何类型的数据通信终端,例如PC、移动通信装置、智能电话、PDA、双向文本收发器、ATM(自动售货机)等等,也包括非通信终端如电子日记本。此处使用的信息系统包括任何一种通过图形用户界面(GUI)视觉可访问的系统或者仅仅视觉可访问的系统,例如ARS。该系统还包括服务器系统,在更广泛的意义上,还包括与服务器系统通信的终端的客户软件。
分配给按键的字母可以用来记忆不同的代码。实现该目的的方法有很多种,包括简单命名(simple naming)、起始命名(initial naming)或者完全命名(full naming),以下将给出详细的说明。
简单命名就是将与给定的单词或者短语相关的数字指定为代码。例如,一个韩国公司名称 具有与 和 相关的简码“1799”,如图4-2所示。在这种情况下,与简码“1799”相关的 中的字符 和 用粗体标记,以便用户容易注意到特定单词的简码。此外,该简码还可以从单词或者短语中提取。例如, 的简码不限于“1799”,因为在简单命名方法中,代码可由属于给定单词的任何字符相关的数字组成。例如, 的简码可设置为与 |和 相关的一个值, 的简码还可变成与 和 相关的“1729”,或者是与 和 相关的“1949”,或者是与所有构成 的字符相关的“13294293”。为简便起见,与形成一个给定单词或者短语的所有字符相关的代码的指定被称为“完全相关简单命名(Fully Associated Simple Naming,FASN)”,与形成一个给定单词或者短语的部分字符相关的代码的指定被称为“部分相关简单命名(PASN)”。在这两种情况下,简单命名(即简码)与构成给定的单词或者短语的字符相关。该方法同样可以应用于其它语言,也可以用于朝鲜语。例如,“caption”可以具有与辅音“CPTN”相关的简码“2786”作为部分相关代码,为简便起见将其称为“辅音相关简码(Consonant-Associated Simple Code)”。
以元音开头的单词“escape”的辅音相关简码为“727”,对应于“SCP”,与“scape”的辅音相关简码相同。因此,为了使定义的简码和对应的词或短语的重叠最小,并改善使用该简码的方便性,可以考虑使用与后接辅音的第一个元音相关的简码。这种简码称作“基于第一元音+辅音的简码(First Vowel+Consonant-based Simple Code,1VCSC)”。与其它简码相同,这种简码的优点在于具体某个单词的简码可机械地生成。
短语和单词可以通过简单命名方式来编码。对于在先申请文件的示例中的短语 来说,可使用表示意思的所有字母(音节)提取得到一个简码“8314”映射 和 对于英语,在先申请文件的示例中的“data tonight”的简码为“3886”,对应音值为d、t、t和n的字符。
起始命名是部分相关简单命名的一个特例。对于朝鲜语,起始命名方法将映射到一个音节(字母)的起始辅音的数字指定为代码。为简便起见,这种方法称为“基于音节(字母)的起始命名(Syllable_Based Initial Naming,SBIN)”。例如,使用该方法提取的 的基于音节起始码是与每个音节(字母)的起始辅音相关的“1799”。基于音节的起始命名方法还可以像朝鲜语一样应用于其它语言。例如,根据该方法,英语单词“entertainment”具有与e、t、t和m相关的基于音节起始码“3886”。基于音节的起始命名方法对于一个音节构成一个字母的朝鲜语更加有用。该方法也可用于中文及日语等其它一个字符行程一个音节的语言。就中文而言,“北京”(第一个音调符号附于第一个“e”上,第二个音调符号附于最后一个“i”上)的基于音节起始码为“25”(与b和j相关,如图1-1所示)或“14”(如图10-1到10-4)。
同样,起始命名方法也可以应用在短语中。例如,在先申请文件的示例中的短语 具有起始码“81”,对应每个词的起始字符 和 根据该方法,英语短语“dance with the wolf”的起始码为“3979”,对应d、w、t和w。当将代码指定给整个短语时,基于单词的起始命名方法对于每种语言都更有用。
为简便起见,简码(即,完全相关简码和部分相关简码)和起始码(即,基于音节的起始代码和基于单词的起始代码)都称为“简码(在较宽的意义上)”或者“快捷码”。特别地,完全相关简码、辅音相关简码、基于音节的起始代码和基于单词的起始代码均遵循它们的产生规则,并且因此在实际中普遍使用。此外,根据规则由其它方法产生的简码也很容易使用。
完整命名是将要根据特定字符输入方法进行编码的一个给定词或短语的输入值,因而随使用的字符输入方法而变化。与给定的单词或者短语相对应的数字值被一个字符一个字符地编码。例如,如图4-2所示,根据PWSM(在在先申请文件中已公开), 的完整代码为“7745888944”。根据BRSM(在在先申请文件中已公开), 的完整代码变为“7448884”。如果使用不同于图4-2的另一种袖珍键盘或者另一种字符输入方法,可以根据该袖珍键盘或者该字符输入方法来给出特定的完整代码值。
4.2现有的中文字符输入方法一般中文字符输入方法需输入与该中文相对应的英文字符,使用“英文-中文转换键”显示可转换的中文字符,并选择对应的中文字符,与在朝鲜语模式下输入中文字符的情况一样。亦即,当用户输入中文语音对应的罗马字符后,系统搜寻对应的中文字符并提供给用户,如图5-1所示。中文的完整代码可基于该中文字符的英文发音来定义。
4.3唯一简码如果客户终端负责解码简码(即,当客户终端具有一特定的单词或者短语及其简码值时),则与输入简码相对应的单词或者短语被传输到服务器。在服务器根据应用的特征请求简码而客户终端能够对简码解码的情况下,客户终端将简码本身(即,显示数字)发送给服务器,然后由服务器解码该简码。因此,既可以在客户终端又可以在服务器中对该简码进行解码。
对于多个单词或者短语对应一个简码的情况,肯定有许多单词或短语对应一个相同的简码。CIM中简码之间的多义性被称为“第二多义性”。尽管在这种情况下系统可以向简码添加一个序列号,以存储唯一代码值,但仍会发生第二多义性,因为用户通常都使用与一个特定单词或者短语相关的简码。当然,系统必须按照使用的优先权来向用户推荐这该单词或者短语。对于不同单词或者短语对应相同简码的情况,系统需根据基于该单词或者短语的使用频率的优先权向该简码添加一个序列号,并利用该序列号作为优先权推荐单词或者短语给用户。在此申请中,系统不需要添加一个序列号给简码,并具有关于优先权的分离信息。
例如,当 和 的基于音节初始码均为“9196”时,系统按照每个单词的使用频率来向该简码添加序列号,并且使用该序列号作为优先权向用户推荐单词。如果 的使用频率较高,则系统向该单词赋予优先权,并且为 定义一个新的简码“91961”,为 定义新的简码“91962”。类似地,“先生”(元音a是第一音调)和“学生”(第一个e是第二音调)具有相同的基于音节起始码“97”,则可根据单词的使用频率在每一个单词加上一个序列号。如,如果“先生”的使用频率比“学生”高,则“先生”的基于音节起始码为“971”,“学生”的则为“972”。这种带有序列号的简码简称为“唯一简码”,而不具有序列号的重叠简码称为“简码”,二者在此都称为“简码”。
在上述“先生”和“学生”的例子中,当用户仅键入“97”时,系统将显示“先生”与“学生”供用户选择。当用户键入“971”时,系统将“971”视为“先生”。
将作为上述基于音节起始码的基础的“x”及“s”突出显示,会给用户带来更好的视觉效果。一种突出显示的方法是将“先生”(XianSheng)以大写字母开头。系统可以从该部分大写的单词中提取简码“97”。
4.4简码的使用下面是指定给不同城市名称的简码(例如,基于音节的起始码)的示例,在铁路信息系统等中非常有用因为 和 具有相同的基于音节起始码,所以系统向该简码添加序列号,如 和 如果用户仅仅向系统输入“78”,系统正确执行反馈(例如,提供 和 的列表,或者以语音方式告知该列表),从而用户可以选择 或 如果最初用户输入“781”,则系统识别该简码为 如果服务器要求的是单词 而非简码“78”,则客户终端将简码解释为 并将其发送给服务器。在服务器根据应用的特征请求简码而客户终端能够对简码解码的情况下,客户终端只需将简码本身发送给服务器。
在给城市名指定简码(完全相关简码、音节起始码、辅音相关简码、第一元音+辅音相关简码)的其他例子中,“北京”(Beijing)的基于基于音节简码为“25”,对应“b”和“j”;完全相关简码为“2345464”;辅音相关简码为“2564”,对应“b”、“j”、“n”和“g”,如图1-1所示。
股票指数(列出的公司)代码的简码如下,其在各种股票信息系统中很有用 例如, 的基于音节起始码的基础 以粗体标记出来,以便向用户提供更强的视觉效果。
银行代码的简码如下,其在ATM和各种金融信息系统中非常有用 (银行)=14, (银行)=82,…很明显,预定义的简码可以按照以下方式应用于单词或者短语的输入用户输入预定义的简码,然后客户(终端)向用户提供解码后的简码。这种方法称为“快捷输入方法(SIM)”,将在后面与“并行输入方法(CIM)”一起进行介绍。
4.5基于选择频率的优先权自动变更最初, 比 的优先权高。如果特定用户倾向于非常频繁地选择 就使 比 优先。为此,如果没有特殊地限制,就可以使用交换序列号以变更优先权的方法。可选择地,系统可以改变关于优先权的分离信息。
系统或者用户可以指定(再指定)确定 的使用频率是否明显高出的标准。例如,若用户十次有八次都选择 则自动变更已有的优先权。系统可根据给定的选择项来要求用户确认优先权的变更。
上述的方法也可用于其它语言,如上述的例子中,“先生”和“学生”可以分别替换 和 4.6简码的自动指定以及将简码相关的字符标记为粗体完全相关简码、辅音相关简码、基于音节的起始码和基于单词的起始码都遵循它们的产生规则。因此,定义好简码的产生规则后,用户输入一个具体的单词或者短语以便指定一个简码给该单词或者短语,然后对应的简码被自动提取出来并存储在系统中。在此,与简码相关的字符标记为粗体,以方便用户使用。对于英语,与简码相关的字符以大写字符的形式凸显出来。
在先申请文件公开了“SIM”和“快捷/完全CIM”。快捷输入方法的简码在系统内定义,然后由用户来变更。用户可以进一步为另一个单词或者短语指定简码。
新单词或者短语的简码指定需要遵循定义的简码产生规则,例如在先申请文件中公开的完全相关简码、部分相关简码、辅音相关简码、基于音节的起始码或基于单词的起始码。例如,为了根据基于单词的起始码方法来产生“dance with the wolf”的简码,用户必须输入“dance with the wolf”,然后在简码创建模式下输入作为基于单词的起始码的“3983”。同样,为了根据基于音节的起始码产生 的简码,用户需要输入 然后在简码创建模式下输入“9196”。
如果用户使系统记住期望的简码类型,就能够为具体单词或者短语自动指定简码,从而免去输入期望的代码类型的麻烦。例如,当用户在系统中将期望的简码类型设置为基于音节的起始码时,只要简单地输入 系统就自动指定 的简码为“9196”。同样,用户设置系统使用基于音节起始码,则输入“先生”,系统便自动指定“97”为“先生”的简码。
如前所述,与简码相关的英文字符可以大写并标记为粗体。对此,当用户事先指定在简码中使用大写,则输入“DaTe ToNight”时,系统自动确定简码为与大写字母“DTTN”相对应的“3886”。另外,如果用户输入“ToNight ShoW”,系统自动确定简码为与大写字母“TNSW”相对应的“8679”。
4.7使用简码输入单词或者短语的SIM和CIM当用户输入简码(除非另外特别说明,该简码包括初始码作为简码的具体形式),系统(客户系统或者服务器系统)可以将简码识别为与其相对应的单词或者短语。很明显,当系统将具体的简码识别为相对应的单词或者短语并且显示该单词或者短语时,用户可以利用该显示的单词或者短语输入新单词。
在其它国家使用的字符输入方法中,可通过以下方式实现一种字符输入系统终端(客户系统)存储具有逐个单词指定的“完全相关简码”的索引,然后根据单词优先权顺序显示与用户输入的给定代码相对应的单词,从而允许用户确定目标单词。更多的信息可以参考互联网站,推荐的有http//www.tegic.com和http//www.zicorp.com。在下文,这种方法称为“完全相关SIM”或者“外国的方法”,这种方法还被称为“类似T9输入方法(T9 Like Input Method,T9LIM)”,因为使用这种方法的代表性输入系统是Tegic公司所提供的“T9”。图5-2所示即为T9系统的输入示例。如图5-2所示,当用户键入“622…”来输入“meet”时,系统即提供给用户“off”一字;只有当用户键入“6228”时,系统才显示“meet”。
Tegic公司和Zi公司的方法与本申请人在先申请文件中的袖珍键盘字符输入方法之间的比较显示本申请人的字符输入方法为每个字符分配一个唯一代码,从而允许用全码来输入目标字符或者目标单词(短语),而前述外国的方法分配完全相关简码给每个单词,并允许使用简码来输入目标字符。
外国的方法有以下缺点(1)它允许排他地输入预定义的单词,因为代码分派给了每个单词;(2)当不同的单词共用一个代码时,输入使用频率较低的单词比较难,因为用户需要很麻烦地使用切换键或者移动键来选择和确认目标单词;(3)在输入单词期间,可能会暂时出现除目标单词之外的单词;(4)实现该系统需要很大的存储容量和较高的成本。
可以将一简码(即,部分相关简码或者完全相关简码)指定给一个常用的单词或者短语,并且在输入该目标单词或者短语时,使用该简码。当然,该常用的单词或者短语及其简码可以在系统中预定义,并且提供给用户,或者完全由用户来指定。可选择地,用户应该可以随意变更系统中预定义的简码。允许用户指定简码是有好处的,因为这样用户就可以知道特定常用单词或者短语的简码值。
为简便起见,在本发明中,使用简码(包括部分相关简码、完全相关简码和起始码)输入目标字符或者短语的方法被称为“快捷输入方法(SIM)”而使用全码输入目标字符的方法称为“完全输入方法(FIM)”。如后面所述,也可以使用SIM和FIM的组合,这种方法称为“快捷/完全并行输入方法(快捷CIM)”或者简称为“并行输入方法(CIM)”。
即使唯一代码分派给每个字符,并用之输入目标字符,还是会因为FIM中的重复选择而产生多义性。为简便起见,这种多义性称为“第一多义性”或者“字符多义性”。相反,在诸如外国的方法(即SIM)等方法中,代码分配给每个单词并用之输入目标单词,共用相同简码的不同单词之间会发生多义性。为简便起见,这种多义性称为“第二多义性”或者“单词(短语)多义性”。术语“多义性”在这里指第一多义性。
输入时存在两种情况其一是系统首先将特定输入值解释为简码(即,使用SIM的第一步骤,或者将快捷输入模式用作为基本输入模式),当没有任何简码对应该输入值时,系统将其识别为全码(即,使用FIM的第二步骤);另一个是系统首先检查特定的输入值是否构成全码(即,使用FIM的第一步骤,或者将完全输入模式用作为基本输入模式),若输入值不构成全码,然后系统将输入值识别为简码(即,使用SIM的第二步骤)。首先将输入值解释为简码的情况应用“快捷输入模式”作为基本输入模式,而首先将输入值解释为全码的情况应用“完全输入模式”作为基本输入模式。优选地,通常输入常用单词或者短语的情况首先应用SIM(即,应用快捷输入模式作为基本输入模式),而并非输入常用的单词或者短语的情况首先应用FIM(即,应用完全输入模式作为基本输入模式)。
在指定为基本输入模式的完全输入模式中,系统首先将输入值解释为全码并且错误地将输入简码识别为不想要的单词。例如,在图4-2中,当BRSM用作SIM时,单词 的简码指定为“877”(使用基于音节的起始码),并且系统首先将输入的简码“877”解释为全码,从而将 识别为 这种情况也适用于诸如或者 之类的单词,在其中,第二和第三音节(字母)的起始辅音对应于相同的按键。另一方面,在指定为基本输入模式的快捷输入模式中,系统首先将输入值解释为简码,并错误地将输入的全码识别为不想要的单词。这种CIM中简码和全码之间的多义性称为“第三多义性”。
同样也可以通过使用切换键或者移动键选择目标单词来克服第三多义性。另一种可选择的方法是在一个单词单元中,在输入导致第三多义性的输入值之前,在完全输入模式和快捷输入模式之间切换输入模式。这与本申请人在先申请文件中所描述的方法较为相似,在其中,设置有あ/ア控制(即,平假名/片假名转换控制),以便在平假名模式下输入片假名,或者在片假名模式下输入平假名。例如,在完全输入模式指定为基本输入模式的情况下,选择“快捷/完全”控制之后,系统最初将输入值识别为简码,并且参考索引向用户提供与输入值相对应的目标单词。同样,在快捷输入模式指定为基本输入模式的情况下,选择“快捷/完全”控制之后,系统最初将输入值识别为全码。“快捷/完全”控制可以在输入目标单词之前或者之后进行选择,但是在输入目标单词之前选择控制设置更为方便。
在CIM中,系统可以确定输入值是全码还是简码。为了消除前述的第一多义性,该决定可在单词单元中参考索引来作出,或者该决定可在后面将要介绍的输入输入值的过程中作出。
在将完全输入模式指定为基本输入模式的情况下应用CIM时,系统一个输入一个输入地(即,一个值一个值地)检查每个输入代码是否构成全码,并且在认为输入代码值没有构成全码时,将输入值确定为简码,然后参考索引向用户发送与该简码相对应的单词或者短语,从而提高CIM的效率。同样,在将快捷输入模式指定为基本输入模式的情况下应用CIM时,系统检查每个输入代码值是否等于索引中列出的输入值,并且当没有单词与输入值相匹配时,将输入代码值识别为FIM的预定全码。这意味着通过使用FIM规则,一开始输入时就可以消除第三多义性。这也同样适用于使用在先申请文件中没有作为FIM公开的字符输入方法的情况。以下将通过下述的示例介绍在先申请文件中的FIM(基本重复选择方法和部分-整体选择方法)。
例如,对于朝鲜语来说,在使用BRSM时通过全码输入的所有音节的第二输入值和第三输入值应该是常量,如图4-2所示。如果违背该规则,输入值将被视为简码。当紧辅音可以通过基本辅音的结合来处理时,相关的标准可应用于使用BRSM的所有情况。
在所有的语言中,当PWSM用作FIM时,两个输入值对应于一个字符,并且一个输入值相对于另一个而受到限制。例如在输入英语的情况下,如图1-1所示,假设仅仅使用水平直线组合(Horizontal Straight Combination,HSC),未应用PWSM输入数字。如果第一行的按键[1]、[2]和[3]用作与一个字符相对应的第一输入值(第一按键)使用时,第二输入值也对应第一行的按键[1]、[2]和[3]。同样,当在[2]+[1]之后选择第二行的按键[4]、[5]或[6]时,下一个要构成全码的值是第二行中按键[4]、[5]和[6]中的一个。当输入值违反这个规则时,系统则将输入值视为简码并向用户推荐对应于该简码的单词。例如,在PWSM用作FIM且FIM用作基本输入模式的CIM中,当用户键入“4357”作为“help”的简码时,在第二值”3”输入时,系统即识别出该输入值不构成一全码,然后系统将该输入值视作简码。
如图4-2中所示使用PWSM时,响应第一按键[1]输入的完全编码的下一按键只能是按键[1]或[2]。如果违反这个规则,则系统认为输入值是简码而非全码,并且参考索引向用户推荐与输入值相对应的目标单词。如果如图1-3所示,四个字符P,Q,R和S分派给按键[7]。则四个字符中的一个可以分配给网格单元构成PWSM中的垂直相邻组合(Vertical Adjacent Combination,VAC)。这种情况下选择按键[7]以形成一个字符的全码时,下一个按键可能是第三行的[7]、[8]或[9],或者按键[4]。如果违反这个规则,则将输入值视为简码。这也同样适用于所有使用在先申请文件中公开的PWSM的所有语言。
例如,在PWSM用作FIM且为基本输入模式的情况下,北京(Beijing)的简码在图1-1的简码索引中存成基于音节起始码“25”,当用户键入“25”时,系统将在按下键[2]后再击键[5]时(即自字头开始)识别此输入值“25”不构成全码(按水平直线组合的位置上的按键应为[1]、[2]和[3]中的一个)。然后系统根据简码索引提供与输入值”25”对应的“北京”。在中文模式,系统将对应简码“25”的中文字符(即北京)作为一个单词提供给用户(因为中文字符“北京”构成一个目标单词)。对于除中文外的其它使用语音字符的语言而言,系统提供简码“25”对应的“Beijing”给用户。如果有多个词和短语对应简码“25”时,系统将所有词和短语列出来供用户选择,或用户可通过重覆键击一特定键(以交替的方式)来选择所需的词,如图5-4所示。
因此,图5-4中所示的同时输入法(CIM)将例如北京(Beijing)等常用词的简码注册在简码索引中,并同时使用“完全输入法(Full)”和“快捷输入法(SIM)”而无需FIM及SIM模式转换,从而减少使用简码输入注册单词的按键次数。
如图4-5所示,基本辅音被分配给每个按键。因此,当朝鲜语中常用的基于音节起始码作为简码使用时,在使用SIM和FIM时均可以避免第三多义性。这就是说,在使用CIM的情况下,用户输入基于音节起始码时,第二输入的输入值(当通过CPM输入送气辅音和紧辅音时)很难构成全码。因此系统参考简码的索引并按照优先次序向用户推荐正确的单词。同样的原理也适用于CIM中全码的输入。
如上所述,本发明的核心在于使用CIM时能够在输入字符期间确定输入值是否为简码或全码。相同的原理也适用于系统使用在先申请文件和本发明中的FIM或者其它FIM的情况。例如,一种字符输入方法使用第一按键和第二按键的结合,其中第一按键用于每个字符的输入,第二按键对应第一按键的字符的顺序。亦即,以图1-1为例,其输入为“P=[7]+[1]”。在图1-1中,因第二按键为键[1]、[2]和[3]三者中的一个,因此当输入值违反该原则时,系统将该输入值视作简码。具体地,如上例所述,本申请的FIM的优点在于,在输入期间可以检查输入值是否构成FIM中的全码。
此外,如已有技术文献和本申请所述,可以在客户端或者服务器中实现简码或者全码的解释。为了克服在先申请文件中的第一多义性(字符多义性),在索引中查找目标单词时,一种应用于简码或者全码的解释的方案是,系统在第一阶段参考客户的索引,然后在第二阶段参考服务器的索引。另一种选择是,系统可以在第一阶段参考服务器的索引,然后在第二阶段参考客户的索引。此外,当系统在第一阶段参考客户的索引然后在第二阶段参考服务器的索引将输入值解释为简码但未找到输入值的简码时,则以以下方式将输入值解释为全码在第一阶段参考客户的索引,另外在第二阶段参考服务器的索引。另一种选择是,系统在第一阶段参考客户和服务器的索引将输入值解释为简码,然后允许用户选择目标单词。关于该解释方法(简码或者全码)和解释地点(客户或者服务器)还可以各种类似的变化。也就是说,有各种解释方法(简码或者全码)和解释地点(客户或者服务器)的组合。如图5-5中,(A)、(B)、(C)和(D)的各种组合可用于输入值,例如(A)-(B)-(C)-(D)或(A)-(C)-(B)-(D)等等。
同时使用SIM和FIM有以下优点(1)在使用FIM时,允许用户输入几乎所有单词,包括词典中不存在的单词以及预定单词;(2)使用SIM时用户可以为其希望的常用单词或短语指定简码(部分相关简码或完全相关简码);(3)用户可以指定部分相关简码,以便显著地减少输入的击键数目;基于单词起始码可指定给短语也可以指定给单词。相反,外国的方法一个单词一个单词地查找所有输入单词的索引,为了减少相同代码被指定给不同单词的可能性,其必须使用完全相关简码。
另外,该系统具有一“索引”,包括有特定常用单词或者短语和该单词或者短语的代码值,该索引需要的存储器容量比外国的方法小很多。这种索引与包括有为消除多义性的正确或不正确的多义性单词的系统中的“索引”相同。
在每种语言中,一个特定单词中的辅音都具有音值,因而一种从辅音中提取缩略词的方法得到广泛使用。以英语为例,军事术语“captain”缩写为“CPT”,其包括的辅音具有“captain”的音值,“sergeant”为“SGT”,“staff sergeant”为“SSG”,“sergeant first class”为“SFC”。尽管“captain”和“private”有两个音节,作为缩写词提取的辅音被认为代表了各个音节。因此,“captain”的简码是与“CPT”相关的“278”。
本发明的系统能够基于音节来为常用的单词或者短语指定部分相关简码,并且该系统能够使用SIM,所以在输入字符需要较少劳动力的意义上,本发明非常有意义。音节在发音学上定义为“心理实体(psychological noumenon)”。辅音具有音节的音值。从元音提取的缩写“AAI”来推出“captain”是不可能的。但是,“captain”可很容易从辅音提取的缩写“CPTN”或者“CPT”中推出。据报道,任何英语句子都可以根据每个单词中去掉元音的连续辅音来推导出来。这就是说,部分相关简码结合构成音节的每个辅音的使用使得用户能自然地应用SIM,并且使用更方便。
具体地,可以在缩略词的基础上使用简码,因为在英语国家中广泛使用缩略词,例如,所列出的公司名称通常以缩略词来表示。
用户可以为特定的单词或者短语指定简码的类型(即,部分相关简码或完全相关简码),其优点是容易记住常用单词或者短语的代码值。此外,如果用户仅需要使用部分常用单词或者短语,则为每个单词或者短语指定简码(例如,1,2,3,等等)好过于与每个单词或者短语的字符相关的代码。
4.8简码/相应的单词或者短语的分组和搜索范围的指定多数情况下为多个单词或短语指定简码时会发生大量重叠。简码间的多义性(即,第二多义性)可以通过将与简码相对应的单词或者短语分组并且搜索仅用于特定单词或者短语组的简码来减少。一个单词或者短语无需仅属于一个组,它可以包括在多个组中。
例如,简单命名之后的单词或者短语分成公司名称、城市名称、常用单词(或短语)等类别,并且常用单词(或短语)这一组可以细分成社会、政治等子类别。尽管本实施例提供的是两级三类分组,该分组还可以是三级、四级或者更多级别的树型分组,如5-6所示。如果用户(系统)将简码的搜索范围限制在公司名称一组,则系统在公司名称类中搜索与特定的输入简码相应的命名的单词或者短语,从而减少第二多义性。同样,当用户将搜索范围限制在常用单词或者短语组时,系统在常用单词或者短语组及其所有子组中搜索命名的单词或者短语。如果用户将搜索范围限制在常用单词或者短语组的社会子组中,则系统在社会子组及其所有下级组中搜索命名的单词或者短语。
图5-6中所示的三类分组类似于视窗浏览器(Window explorer)的文件夹。系统可以自动重新设置搜索的范围。例如,当用户选择行政单位级别中的一特定城市为城市名称子组时,下一输入值的搜寻范围是该特定城市的下一级行政区划名称。例如,当用户选择城市 时,下一选择范围为汉城内的 当用户选择 (Yangcheon-gu)”时,下一选择范围将为Yangcheon-gu中的 4.9交换服务器的使用对简码的解释可以在客户端或者服务器中执行。可选择地,可以使用专门负责解释简码(包括某些情况下的全码)的交换服务器,向客户终端或者另一个服务器提供与该简码相对应的单词或者短语。如图6-1所示,在图中,客户终端首先对简码解码,如果其不能解释与输入的简码相对应的单词或者短语,则在第二阶段由交换服务器解释与输入简码相对应的单词或者短语。一旦解释失败,在第三阶段每个服务器可以解释与输入简码相对应的单词或者短语。第三简码编解码服务器(为简便起见,称为“第三服务器”)是安装有使用输入简码或者其相应单词或者短语的应用程序的服务器。
利用交换服务器,即使当第三服务器要求的是单词或者短语而非简码时,用户也可输入简码。即使第三服务器没有存储简码和与该简码相对应的单词或者短语,交换服务器也可解释由用户输入的简码,向第三服务器发送相应的单词或者短语。
当输入简码时,系统在索引中查询与该简码相对应的单词或者短语,并且将该单词或者短语一个输入一个输入地(即,一个值一个值地)或者以单词为单位(即,一个单词一个单词地)反馈给客户终端或者每个服务器。
4.10单词单位的区分这里使用的术语“单词单位”指一个单词从词头到词尾的长度。单词单位可通过结合区别各个单词的所有因素来确定,例如词头、空格、模式转换、回车等等等。例如,可通过词头~词尾、空格~空格、空格~模式转换等来识别单词的输入。单词单位的反馈可以通过目前支持网络环境的编程语言来实现。
4.11简码和相应的单词或者短语的下载客户还能够从服务器中下载简码和与该简码相对应的单词或者短语,而不用直接存储简码和与其相对应的单词或者短语。
下载可以以单词或者短语为单位,或者以前述的单词或者短语组(即,树型结构分组)的形式来进行。如果选择了一个分组,客户可以下载该选择的分组及其所有子组。在下载期间,客户终端可以维持服务器所设置的单词或者短语的树型结构,或者将属于相应分组和其子组的单词或者短语分配给用户指定的分组。主要功能是对简码进行解码的交换服务器可以负责这项操作。
5.删除键的使用删除键的使用与在先申请文件中公开的“最后输入的取消”相关。例如,当用户想要输入 但是选择[1]+[*](如图4-2所示)而误输入 时,使用删除键可以取消最后的输入[*],并将 恢复为 这在重复按下控制按键输入连续字符时非常有用。连续按删除键可以删除前面通过已知的方法输入的字符。例如,按一次取消键可以将输入 恢复为 再按一次取消键就变为 接着又按一次取消键就变为 对于罗马字母,在输入“aba..”(其中“a..”是包括“..”和“a”的带衍生字符)的基础上按一次取消键可得到“aba”,再按一次删除键变为“ab”,接着再按一次删除键变为“a”。这就是说,前面形成的单词以字符为单位来删除。
6.语言限制输入方法(LRIM)语言限制输入方法(Language Restricted Input Method)利用特定语言中生成单词的辅音和辅音规则来降低字符输入的多义性,以下将给出详细介绍。
很明显,在没有具体说明的情况下,以下介绍的某一语言的特征亦可适用于其它语言,同样也适用于非罗马字符语言。
6.1用于罗马字符语言的辅-元音分离袖珍键盘上的中文限制输入方法6.1.1中文的结构中文字符通常有两部份,一部分是21个声母,另一部分是16个韵母(其中韵母ㄝ(^e)几乎不被使用)。声母对应辅音,而韵母对应元音。中文发音的标记在中国内地是基于罗马字系统(拼音)形成的,在台湾,其发音标记则为注音(Bo-po-mo-fo)系统。罗马字系统使用拉丁语辅音和元音字母(即罗马字母)拼出中文字的发音。以下括号部份所示即为对应注音符号的罗马字符。

以下介绍复合韵母,复合韵母是一个起始元音(三个元音“i“u”和“ü”中的一个)和一个韵母的组合。下表所示即为复合韵母的列表。

上述表格中,“i+a”是有效的,但“i+u”是不可能的。
6.1.2中文的罗马拼音由上述表格可知,在使用罗马字符的中文字拼音中,21个声母是18个罗马字符的组合,而16个韵母则是7个单韵母的组合,或是罗马字母中元音和辅音的组合。
在各单韵母中,“^e”及“ü”分别被视为“e”及“u”的衍生字符,并以控制处理法输入。具有四个声调的五个基本元音也可以通过控制处理方法输入。因此,对于使用罗马字符的中文字来讲,所有韵母皆可通过五个罗马字母基本元音来输入,即利用控制处理输入英文字母(即罗马字母)中没有的衍生字符,此方法在前述的法文及德文的衍生字符输入法中已有说明。下表所示为利用控制处理方法输入中文韵母时确定基本字符(基本元音)和连续字符(连续元音)间关系的示例。

在上例中,具有一声到四声的字符为连续字符,其中“^e”几乎不使用,因此其出现频率最低。优先顺序是以使用频率或其它因素决定的。例如,“”不被视作第六连续字符,而被视作第二连续字符,此时其它连续字符的优先顺序往后顺延之。
例如,当控制键为[*]键,且在一个基本字符输入后选择控制时,输入为“ē=e+[*]”、“é=e+[*]+[*]”、“ě=e+[*]+[*]+[*]”、“è=e+[*]+[*]+[*]+[*]”及“ê=e+[*]+[*]+[*]+[*]+[*]”。若PWSM用于图1-1中所示的按键“e”上时,“人”(rén第二声)的全码便为“7832**65”。很明显,输入按键上的“e”时还可以使用除PWSM外的其它方法输入(如简单重覆选择法)。
因此,使用单个控制键可简化输入方法。同样的方法也可用于使用注音符号而无罗马字母的情况(例如该相同输入方法可用于图1-1中所示的在对应的罗马字符上标注注音符号的袖珍键盘)。
6.1.3辅-元音分离袖珍键盘(CVSK)上的中文限制RSM(CRRSM)中文字符中的所有声母都可以通过18个罗马字符输入,只有输入zh、ch及sh时罗马字母辅音需要连续使用。“y”或“w”则用于仅有声母没有韵母的中文音节的罗马拼音上。例如,“衣”的输入为“衣=yi(一声)”,“五”的输入为“五=wu(三声)”。
如本申请人的在先申请文件中所述,在一个字符构成一个音节的中文中使用基于音节起始码作为简码更为方便。因此最好将18个罗马字母辅音分别分配给单个数字键。故本发明中,18个罗马字母辅音两个一组,并分别分配给数字键[1]至[9]。
bp/dt/gk/zj/cq/sx/mn/lr/hf以上所示是基于发音相似性对罗马字母辅音的分组,由此当多个单词或短语对应相同的简码时,该多个发音相似的单词或短语具有相同的基于音节起始码。该分组仅仅是一个示例,还可以有各种修改。该分组可基于罗马字符的词典编排顺序、对应罗马字符的注音符号的词典编排顺序或其他发音相似性进行。基于发音相似性分组的优点是可以减少多义性,因发在任何使用罗马字母的语言中发音相似的辅音很少连续出现。此外,尽管有多个单词或短语对应于同一简码(特别是基于音节起始码),但其发音(音值)相近,因而这种分组方法可将使用的混淆降至最低,并使简码的使用更为方便。
“zh”、“ch”及“sh”是中文字中的声母,“z”和“h”、“c”和“h”或“s”和“h”不属于同一分组。(不分在同一组不是很重要,因为中文音节通常由一个声母和一个韵母构成。但是对于“w”、“y”或“v”的输入而言,“s”、“h”及“w”不适于分在同一组,且“w”通过敲击对应键三次的方式输入)。
如图10-1所示,该九个分组分别分配给[1]至[9]九个键代,且各字符皆通过重覆选择的方法输入。根据中文的特征,在输入声母时,罗马字母辅音很少连续出现,除“zh”、“ch”及“sh”外。因而可以使用重覆选择输入法输入罗马字符而不会出现多义性。例如,如图10-1中所示,输入为“b=[1]”和“p=[1]+[1]”。当然,同一键所代表的字符可按使用频率进行顺序排列,并可通过敲击一次对应键的方式来选择使用频率最高的字符。
很少用于中文的罗马字符“v”可分配给该九组中的一。例如“v”可加至发音相似的“f”所属的组中(或不加以明确规定),并通过敲击对应键三次来输入。“衣=yi(一声)”或“五=(三声)”中的“w”及“y”亦可分至适当的辅音组中(或不加以明确规定),并通过重覆选择方法输入(如,敲击相应按键三次)。例如,当“y”被分给包含/l、r/的一组时,“l”、“r”和“y”分别通过敲击相应按键一次、二次和三次的方式来输入(图10-1中的键[8])。当“w”被分给包含/m、n/的分组时,“m”、“n”和“w”可分别通过敲击相应按键一次、二次和三次的方式输入(图10-1中的键[7])。
利用罗马字母辅音和元音的重覆出现特性减少使用重复选择方法的罗马拼音系统的多义性的方法被称作“中文限制重覆选择方法(Chinese Restricted Repeat Selection Method,CRRSM)”。这种方法可应用于包括中文的任何语言,称作“语言限制重覆选择方法(Language Restricted Repeat Selection Method,LRRSM)”,专用于中文的称作“中文限制RSM”。用于朝鲜语和印地语的LRRSM使用重复选择方法,将多对基本辅音和基本元音分配给单个按键,可基于辅音和元音的交替出现减少多义性。同样地,在使用朝鲜语元音元素的方法中,送气音的控制通过重复选择方法使用元音“-”不会连续出现的原则来选择,这种方法称为“朝鲜语限制RSM(Korean Restricted RSM)”。
具体地,当分配给辅音的按键(辅音按键)与分配给元音的按键(元音按键)是分开的时,如图10-1至10-4所示,通过使用每种语言辅音和元音相结合的特征,重复选择方法可明显减少多义性。图10-1至10-4中所示的每个按键分配有小量辅音(如一个、两个或三个)且辅音按键与元音按键分开的袖珍键盘称为“辅-元音分离袖珍键盘(CVSK)”。
图10-1中所示的袖珍键盘上标示的中文罗马拼音中的罗马字符辅音和元音也可以使用重覆选择方法来输入而不会出现多义性。当用户连续选择辅音按键(图10-1中的[1]至[9]键)中的一个输入一个声母时,系统识别其为标注在该键上的第二辅音。这是因为相同罗马字符不会在中文声母输入中连续出现。当前述键击两次的按键被指定为“w”、“y”及“v”时,系统很容易就能识别再一次的键击(即总共三次)用于输入“w”、“y”或“v”。系统可将三次键击[7]键解释为输入“w=777”,因为中文中没有“mmm”、“mn”或“nm”的声母结构。
如图10-1所示,“a”、“e”、“i”、“o”、“u”及“..u”六个元音两个一组,分成三组,并分配给4×3袖珍键盘的三个按键(如[*]、
及[#]键)。这样各个元音利用重覆选择方法进行输入而不会有多义性,这是因为中文中相同罗马字母元音很少连续出现两次。例如,中文拼音中不可能出现″…aa…″。
对于双韵母“ai”、“ei”及“ou”与复合韵母“ia”、“ie”及“uo”而言,“a”和“i”或“e”和“i”不属于同一组。若将“a”和“i”分在同一组,并指定给同一个按键(如[*]键),敲击该按键三次(即“***”)会在“ai”和“ia”之间产生混淆。图10-1所示即为考虑此情況之后的一个分组示例。当然,元音分组及分配方式并不限于图10-1所示,在不违背上述限制的前提下,其可以有各种修改。图10-1中的各个元音可通过重覆选择输入法进行输入。例如,“i”的输入为“i=
”,“o”的输入为“o=
+
”,“iao”的输入为“iao=
+[*]+
+
”。
对于双韵母“ai”、“ei”及“ou”与复合韵母“ia”、“ie”及“uo”而言,“a”和“i”、“e”和“i”或“o”和“u”不属于同一组。若将“a”和“i”分在同一组,并指定给同一个按键(如[*]键),敲击该按键三次(即“***”)会在“ai”和“ia”之间产生混淆。图10-1所示即为考虑此情況之后的一个分组示例。当然,元音分组及分配方式并不限于图10-1所示,在不违背上述限制的前提下,其可以有各种修改。图10-1中的各个元音可通过重覆选择输入法进行输入。例如,“i”的输入为“i=
”,“o”的输入为“o=
+
”,“iao”的输入为“iao=
+[*]+
+
”。
只要“a”和“i”、“e”和“i”以及“o”及“u”不分在同一组,“a、e、o”可分在一组中(如图10-2及图10-4所示),“i、u、ü”可分在另一组中。当然此规则亦可以进行修改。这两个元音分组可分配给特定的按键(如分别分配给[*]及[#]键),辅音“w、y、v”可为另一组分配给另一个按键(如
键)。当3个元音字符组成一个元音组(如“a、e、o”)且指定给一个按键时,键击该按键三次可识别为元音“o”而不会出现混淆,因为键击相应按键三次所识别的“ae”、“ea”、“aaa”不会在中文韵母中出现。在本例中,“ao”的输入为键击分配给该字符的相应按键四次而不会出现混淆,因为中文韵母中没有“oa”。如图10-6所示,字符“v”未标示在袖珍键盘上,这是因为输入中文时不使用“v”。将“w、y”分在同一组并分配给一个按键意味着将半辅音分成在一组并分配给一个按键。
在图10-2、10-4和10-6中,当“a、e、o”分在同一组时,只有复合韵母“ao”出现在中文拼音中。若只把“a、o”分在同一组并分配给一个按键,则三击该按键即识别为“ao”而不会有多义性。当三个字符(即“a、e、o”)分配给同一按键时,每个字符可根据以“a-o-e”的顺序敲击该按键来选择,三次敲击该按键可识别为“ao”或“e”,因而出现多义性。因而在三个或多于三个的字符分配给一个按键的情况下,只允许两个字符的组合,并通过设置该两个字符可能形成的组合的选择顺序分别为一次按键(即一次按压)和3次按键而非一次按键和两次按键,该字符的识别才不会出现多义性。此外,将该两个字符分别设置为两次按键和三次按键也是可行的,在这种情况下,“ao”通过5次键击对应按键来识别而不会出现多义性。也就是说,在通过敲击相应按键的次数来设置分配的字符的选择顺序时,连续出现的字符的选择顺序不应设置为一次击键和两次击键。
如图10-1至图10-4所示,输入中文拼音的韵母时,同一按键需要键击2到3次,系统通过感应按键的键击次数来识别目标字符。以罗马字符输入韵母时,如图10-1-图10-3所示,输入复合韵母“iou”中的“io”时
键需要连续键击三次。系统暂时将
识别为“i”,然后键击除
键以外的另一个按键时,系统确认“0”即为“i”。再一次键击
键时,系统暂时将“00”识别为“o”,然后等到
键以外的另一按键被击时,最终确认为“o”。再次键击
键时,系统确认“000”为“io”。因为中文拼音里没有“oi”,[*]键最多可被击2次,系统暂时识别“*”为“a”,然后确认识别“**”为“e”,如图10-1和10-3所示。因为中文拼音中相同的罗马字母元音不会连续出现,因而同一按键上的元音也不会连续出现。
之所以可以实现准确的中文(在中文以外的语言输入中准确性更高)字符输入体系,是因为当对应的辅音键(如图10-1中的[1]键)被键击一次或多次时,系统可识别其为该按键上的辅音中一个某一个,然后当其他辅音键(如图10-1中的[9]键)接着被键击时,系统识别该第一按键的辅音与第二按键的辅音是连续输入的。此外,另一个原因是,每个按键只分配了两个字符,比分配三个字符要好。根据本申请的在先申请文件,当一个辅音和一个元音被分在一组时,每个按键上分配两个字符,相对于每个按键分配三个字符的情况来说,可充分减少多义性的出现。申请人所提出的“连续击键延迟时间(SSDT)”和“非连续击键延迟时间(DSDT)”可有效地应用于每个按键分配两个字符的情况。
图10-7所示为CVSK袖珍键盘中重复选择方法的一般流程图。图10-7中,假设输入值仅仅为辅音键或元音键,即假设没有特殊用途或特殊功能键(如,输入连续字符的连续控制键)。图10-7所示并非唯一的方法,仅供参考之用。图10-7中没有描述一个按键的一次键击解释为对应按键的第一字符的详细流程,但是该流程在步骤(R0)中实现。图10-7中的(R)步骤中都有考虑语言的限制,而且(R)步骤可以插入到某些过程(即,步骤)中。若第一输入值是辅音键中的一个,该按键仅分配有两个字符,且分配给该按键的字符不会连续出现(例如,图10-1中的[1]键),则步骤(R1)中,当该按键被连续键击两次时,系统确认识别该输入值为一个辅音(如图10-1中的“P”)。这与图4-4中利用语言限制消除多义性的情况(即,在RSM中确认目标字符而没有多义性或减少多义性的情况)相类似,但是图10-7中的方法流程比图4-4的更为简单。
同一辅音键或其他辅音键被连续键击后再键击一个元音键时,系统可从输入值中确认目标字符,然后进入元音输入过程。元音输入过程的第一输入值为辅音输入过程中的最后一个输入键。这与从元音输入转换到辅音输入的情况相同。
图10-7中,利用语言限制(R),结合辅音与元音的可能组合索引(如“ch”、“sh”、“Zh”、“iao”、“iou”、“ia”、“ie”、“uai”、“uei”、“ua”、“uo”、“ue”、“ai”、“ao″、“ua”、“uo”、“üe”、“ou”…)或辅音与元音的不可能组合的索引(“bb”、“aa”、“ee”、“oa”…)(特定袖珍键盘上),可以识别字符。当输入值出现多义性时,系统通过排除不可能的组合识别目标字符。例如,图10-2中(应用了中文限制),系统将“ao”存入可能组合索引,然后当输入代表“ao”的“0000”时,系统识别“0000”为“ao”。另一种方法是,如图10-2和10-4中,
键最多被键击4次,且没有一次误输入,则系统结合特定袖珍键盘将“0000”识别为“ao”。其余过程可按照图10-7的流程来完成。
图10-7中省略的部分与已描述的过程相似。没有省略步骤的图10-7的较一般的流程如图10-8所示,其原理与图10-7完全相同。图10-8中的(1)部分表示一个按键的有效输入,标在指向(1)部分的箭头上的“n<-(n+1)”表示再一次击键。
当用拼音表示中文音节时,使用韵母诸如“en”、“eng”、“an”、“ang”或“er”的情况下,音节的结尾为一个英文辅音(英文字母辅音)(例如,ren人)。也就是说,可位于一个单词或短语的音节尾端的英文字母辅音为“n”、“g”和“r”。为方便起见,该可位于中文拼音的音节尾端的英文字母辅音称为“拼音音节的可用结尾辅音”(Available Final Conconants of Pinyin Syllable,AFCPS)。
在音节使用可用结尾辅音的情况下,即,使用如“en”、“eng”、“an”、“ang”或“er”作韵母的音节中,如果两个音节具有相同的英文辅音,则前一音节和后一音节间会出现混淆。例如,输入“Zhongguo(中国)”时,“~gg~”可被识别为“~k~”。如上所示,在该特定情况中会出现混淆。但是,如果可用结尾辅音(即“n”、“g”、“r”等)通过两次键击含有该辅音的分组对应的按键来输入(如图10-6所示,当含有“n”、“g”和“r”的分组中只分配有两个字符时),则可以消除多义性。
如图10-6所示,以“rennai(忍耐)”为例,可输入“88**7777*#”而不会出现混淆,因为可位于中文拼音音节结尾的辅音“n”可通过两次键击对应键[7]来选择。用于输入“nn”的“7777”可被识别为“nn”而不会出现混淆(因为中文拼音中一个单词或短语中不会出现“mmmm”、“nmm”、“mnm”和“mmn”的组合)。也即,如图10-6所示,如果“g”和“k”的选择顺序为“k-g”,该中文拼音可准确输入。
如上所述,为了避免出现多义性,需要通过键击对应分组的按键两来选择可用结尾辅音,且该对应分组中只能有两个字符。如果三个英文字母如“m”、“n”、“w”分为一组并根据击键次数按“m-n-w”的顺序进行选择,尽管“n”通过键击对应键两次来选择,当用户输入“renmin(人民)”时还是会在“renmin(人民)”和“rewin”之间产生混淆(系统可将“renmin(人民)”的输入值识别为实际在中文拼音中不存在的“rewin”,但是“rewin”是有效的中文拼音组合)。
因此,如图10-4所示,如果英文辅音可三个辅音一个分组,则需要将中文拼音音节中的可用结尾辅音(即“n”、“g”和“r”)分别分组,且每组只能有两个字符。此外,在辅音两两分组的情况下,如果将可用结尾辅音中的“n”与“r”或“g”与“r”分在同一组,还是会产生多义性。例如,如果“n”和“r”分在同一组,在输入“~nr~”时,在“~nr~!”和“~rn~”间会产生混淆。“g”和“r”分在同一组时同样如此。
在图10-*中,“n”和“g”分配在不同组中,因而能准确输入。当然,即使“n”和“g”分在同一组中,如果该组中只有“n”和“g”,其也可以准确输入。例如,“n”和“g”分作一组并指定给键[5],当敲击键[5]三次(即,输入“555”)以输入“元音+ng”时,不会识别为“元音+gn”而是“元音+ng”,其原因是可使用中文拼音中不会出现“元音+gn”的语言限制。如上所述,在“n”和“g”分作一组的情况下,如果按键敲击次数的选择顺序是“g-n”,则当对应键被敲击两次时表示“n”,再多敲击一次时表示“ng”。因此,可自然地实现WISWYG(所见即所得,更准确的讲为,所键即所见)。在图10-2、10-4和10-6中,元音“a”、“e”和“o”分作一组并指定给键[*](参见图10-6)。如果键击次数的选择顺序为“o-e-a”,当敲击键[*]三次时,系统识别其为“a”,当再多敲击该键一次时,则自然表示“ao”。
在只有“n”和“g”分在同一组并分配给一个按键的条件下,当键入一个元音键后再输入“5555”时,系统识别其为“元音+ngg”;输入“55555”时,系统则识别其为“元音+ngn”。如果在中文拼音中“元音+ng”经常使用,则将“n”和“g”分在同一组可增加输入的方便性。但是,这种方法不是很好,因为将类似发音的辅音分在同一组还不如使用简码。
在将其他辅音(如“m”)与“n”和“g”一起分在一组的情况下,如果按照“m-n-g”或“m-g-n”的顺序选择其中的一个辅音以输入中文拼音,则该选择辅音可被准确识别。例如,当根据击键次数按照“m-g-n”的顺序选择一个想要的辅音时,敲击一个元音键后再敲击对应键五次被识别为“元音+ng”。此外,敲击对应键六次被识别为“元音+ngg”,敲击对应键八次被识别为“元音+ngn”。但是,这种方法不是很好,因为输入“ng”时需要重复的按键次数过多。
图10-7、10-8和10-9中,在处理并非一个单词第一个辅音的中间辅音的过程中连续输入辅音“nX”、“ngX”和“rX”(大写字母X指英文辅音表示的词首字母)等的情况下,输入值被处理为拼音的可用辅音组合。原因是英文辅音如“nX”、“ngX”和“rX”并不连续用作单词的词首。最后,在输入中文拼音时,用在一个单词或短语中间的英文辅音有四个,即“~ngch~”、“~ngsh~”、“~ngzh~”到最大值。图10-7、10-8和10-9中,在处理位于单词中间的辅音的过程中便使用了这种语言限制。
在音节的末尾使用一个英文辅音时会出现多义性,但是以下将介绍一种不会出现多义性的输入辅音的方法。由于根据按键次数的选择顺序可从分配给该按键的字母字符中任意确定,这一点在申请人的在先申请文件中已经给出了详细的描述。音频音节的可用结尾辅音的使用频率很高,这是因为他们既可以用作一个音节的声母,又能用作韵母。多义性不会经常出现,从含有可用结尾辅音的每个分组中选择一个可用结尾辅音的顺序可在考虑输入方便性的基础上进行确定,因为即使出现多义性时,不存在的拼音(如“rewin”)可参考中文罗马字母拼音/中文字符索引排除出去。
在上述的图10-1中,平决每个罗马字符的输入需要键击对应按键1.5次。考虑中文的使用频率,可通过键击一次对应按键来输入常用字符,从而使输入每个字符所需的键击次数最小化。
6.1.4用作控制键的功能键原始功能的再激活在图10-1中输入罗马字母元音的衍生字符时,3*4袖珍键盘外的一个“单独键”可用作控制键。例如,中文输入模式下可利用左光标键[<]来输入“ē=e+[<]”、“é=e+[<]+[<]”、“ě=e+[<]+[<]+[<]”、“è=e+[<]+[<]+[<]+[<]”及“ê=e+[<]+[<]+[<]+[<]+[<]”。连续击五次左光标键不能选择能与”e”相关的控制时,便可再次激活该按键的移动功能(“e”已输入)。删除键(简记作“[X]”)可用作衍生字符输入的控制键,如“ē=e+[X]”、“é=e+[X]+[X]”、“ě=e+[X]+[X]+[X]”、“è=e+[X]+[X]+[X]+[X]”及“ê=e+[X]+[X]+[X]+[X]+[X]”。连续键击五次刪除键可刪除前面已输入的“e”。如此,具有其他功能的按键可用作控制键,当根据控制键的键击次数进行选择后没有控制需要选择时,其原始功能(如移动功能)被再次激活。
上例中左光标键的移动功能被再次激活后,再次键击左光标键[<]就可以激活左移功能。也就是说,输入“e”后键击[<]键五次可使光标从“e”往左移动一格,再一次的键击[<]键可使光标再往左一格。此规则适用于各种语言的输入。
6.1.5辅-元音分开式袖珍键盘上的中文限制RSM(包括3*4袖珍键盘上衍生字符的输入)以下介绍3*4袖珍键盘上具有上标符号(如音调符号)的罗马字母元音衍生字符的输入方式。
在上述复合韵母表中,不能出现在“i”之后的元音是“i”及“u”(换言之,“a”、“e”或“o”可出现在“i”之后),不能出现在“u”之后的元音为“u”及“i”(换言之,“a”、“e”或“o”可出现在“u”之后)。这样的话,图10-2中所示的元音布置是有效的。图10-2中,为了在元音“i”、“a”或“e”的左侧加一个音调符号,右侧的代表元音“u”的[#]键可用作控制键。同样地,左侧的[*]键用作音调符号控制键,为右侧的元音“o”或“u”附加一个音调符号。例如,输入可以是“/o(二声)=o+[*]+[*]=
+
+
+[*]+[*]”、“/a(二声)=a+[#]+[#]=
+[#]+[#]”及“ê=e+[#]+[#]+[#]+[#]+[#]=
+
+[#]+[#]+[#]+[#]+[#]”;双韵母“ao”的输入为“ao=a+o=
+
+
+
”。系统可以很容易的识别,因为元音“a”或“e”不会出现在“a”之后且无“oa”存在。元音“ü”的形状与元音“u”相似,可通过键击两次代表“u”的按键来输入(采用隐藏重覆选择方法(Hiding Repeat Selection Method))。
上述方法利用了中文语言的特性,即中文中元音“u”不会出现在“a”或“e”之后,且元音“i”不会出现在元音“o”后。图10-2中,若使用上述限制下的罗马字母元音连接规则,“a”与“i”或“e”与“i”或“o”与“u”不分在同一组且三个按键中每个分配两个元音,则不可以将分配给元音的按键用作控制键。图10-2中,“i”和“u”分别指定给[*]键或[#]键的原因是为了使用户能很容易识别此键为控制键,并考虑了袖珍键盘布置的平衡性。图10-2中输入元音的平均键击次数与图10-1中一样,约为1.5次。
在图10-2的一个改进示例中,分配给
键的三个字符中的部分可以指定给4×3袖珍键盘外的一个“单独键”。例如,可将该三个字符中的某些字符分配给上、下、左移键中的任一按键。
在图10-1至图10-4中使用重复选择输入方法可实现无混淆的输入罗马拼音,这是因为辅音键[1]至[9]与元音键[*]、
和[#]分隔开,且中文的拼音遵守罗马字母的辅音和元音出现规则。
6.2辅-元音分开式袖珍键盘上的英文限制RSM与中文输入法类似,在如图10-1至图10-4所示的辅-元音分开式袖珍键盘(CVSK)上使用重复选择输入法输入英文也极少出现多义性。这是因为每种使用罗马字母的语言的单词都由交替出现的辅音和元音组成。
在英文中,从“词首”开始的辅音最高重复率可表示成“CCCCVCCCC”(如“强度”),其中C代表辅音,而V代表元音。在词首最多出现三个辅音,即“st~”或“sp~”(例如spree、spleen、strength等)。
图10-1中,当用户在含有两个或三个辅音的按键上(假设只有“ü”未分配在图10-1中)键入“622~”以输入英文单词“student”时,系统将把在“词首”出现的“622”识别为“st”而非“sdd”(因为三个辅音连续出现在一英文词首中仅限于“st~”或“sp~”,系统内存有此英文单词生成规则或字符连接规则)。在输入“stu~”的“u”时,需要选择对应该元音的按键,以便系统辨识该元音(如“u”)出现在上述辅音组(如“st”)之后。在“stu”输入后,用户键击“2”以输入“d”时,系统识别出现辅音。同样地,当用户键入“~**7722”以输入“student”的“~ent”时,系统能在用户输入“**”时识别为“e”而非“aa”,这是因为如在先申请文件中所述,英文中的“a”不会连续出现。虽然“7722”可解释为“mmt”、“ndd”、“nt”或“mmdd”,但是通过确定在先申请文件中已介绍的不同的“连续击键延迟时间”和“非连续击键延迟时间”,重复选择输入法所产生的多义性可明显减少。
目前的标准英文袖珍键盘上(图1-1),辅音和元音的组合被分配给每个按键,考虑了具体语言的单词生成规则(字符连接规则)之后,可以减少重复选择法所产生的多义性。但是,此种语言限制输入法(特别是使用重复选择法作为完全输入法时)很难应用在单一按键上分配有辅音和元音的组合的情况。例如,在图1-1中当用户以重复选择输入法输入“student”时,“stu~”的输入码为“777888~”,此时系统不能判断“777”(即“s”)之后的“888是“ut(即sut)”、“tu(即stu)”还是“v(即sv)”(当然,系统可判断出“888”并非“ttt”,因为在英文限制输入法中“ttt”不会出现在“s”之后)。同样地,当用户键入“333”以输入“~de~”时,“de”和“ed”之间会发生混淆,系统可认为“~de~”之前输入的“888777”为“sut”、“stu”或“sv”。故在这三个示例中,系统可将“333”当作“~de~”或“~ed~”。
因此,即使使用了语言限制输入法,重复选择法用作完全输入法时会产生多义性,因为即使在语言限制输入法中使用了辅音和元音出现规则(即单词生成规则和字符连接规则),系统还是不能清楚的确定输入值是输入辅音还是输入元音。在辅音与辅音分别指定的情况中(如图10-1至10-4所示),在重复选择法中,系统将键击分配给元音的按键识别为输入该元音,将键击分配给辅音的按键识别为输入该辅音,从而明显减少多义性。
使用罗马字母的英语中,至少两个元音连续出现的情况很经常(如“captain”中的“ai”)。在实际单词中,相同元音(基本元音“a”、“e”、“i”、“o”和“u”)连续出现的情况相对较多,如“food”或“teen”中的“oo”或“ee”,但“uu”(如“vacuum”)却很少出现。本案申请人未在英文词典中发现类似“…aa…”或“…ii…”的单词。因此,分配五个基本英文元音给按键[*]、
或[#],通过一次键击选择“a”,两次键击选择“e”、“o”和“u”中的一个,多数情况下可以避免多义性的出现。例如,当元音“a”和“o”在重复选择方法中分配给[*]键时,系统将认为两次键击[*]键为输入元音“o”而非“aa”。同样地,当“i”和“u”分配给
键时,系统将认为两次键击
键为输入元音“u”而非两个元音“ii”。尽管实际单词中不是绝对不存在“aa”或“ii”,但通过确定在先申请文件中已介绍的不同的“连续击键延迟时间”和“非连续击键延迟时间”,多义性几乎可以消除。另一元音“e”分配给[#]键,并通过键击该键一次来选择。
为使[*]、
和[#]键中的一个能用作特殊用途键,用户只需将元音“e”分配给其他元音键。例如,“i”、“e”或“u”可都分配给
键。元音“u”通过键击
键三次来输入,因为“u”是英文中最少使用的元音。当“i”、“e”或“u”可都分配给
键时,“i”和“e”之间很难发生混淆(分别键击一次和两次来输入),且英文中辅音“i”不连续出现(即不出现“…ii…”)。但是,当三次键击
键输入“u”时,在“u”、“ie”和“ei”之间会发生混淆,不过这种情况很少出现,因为元音“u”的使用频率不高。
由上可知,使用辅-元音分开式袖珍键盘可明显减少多义性。此外,输入元音时,通过键击一次按键,用该分配有多个元音的按键来选择该不会在现有字典的英文单词中连续出现的元音,几乎不会出现多义性。
相同规则可适用于每个按键约分配有两个或三个元音的袖珍键盘,同样地,以键击对应键一次来选择不连续出现的元音,最少使用的元音则以连续键击对应键三次来输入。
尽管上述说明以使用罗马字符的英文为例,该方法亦可用于其它使用罗马字符的语言。
6.3辅-元音分开式袖珍键盘上的印尼语限制RSM印尼语也使用罗马字符(英文字符)来表示其文字。印尼语音节构成方式如下(其中“C”代表辅音,“V”代表元音)。
Vbe-a(tariff)VCam-bil(catch)CVgo-sok(rub)CVCpon-dol(hut)CCVtra-di-si(tradition)CCVCcon-trak(contract)
CVCCteks-tur(textile)CCCVkon-struk-si(construction)CCCVCstrip-tis(striptease)由上可知,含有三个或更多辅音的单词是源于英文单词的外来字。因此假设除“st~”或“sp~”之外,印尼语中字首不会出现三或多个连续辅音。使用单词生成规则(字符连接规则)后,便可应用印尼语限制重覆选择法。
“q”和“x”用作科学类符号,如物理或数学符号,很少用作字符输入。所以“q”和“x”不安排在特定按键组内,“q”和“x”可通过键击对应键三次来输入。与中文类似的是,印尼语的发音可用两个或多个罗马字符拼写出来,包括“ny”、“sy”、“kh”和“ng”。
此外,不能独立成音节的辅音组有bl、br、dr、dw、dy、fl、fr、gl、kr、ks、kw、pl、ps、rps、rs、sk、skr、sl、sp、spr、sr、str、sw等等。具体地,“skr~”、“spr~”、“str~”出现在字首位置,在语言限制并行输入方法中可用作识别输入值是否是全码还是简码的标准,后续将给出详细说明。(尽管申请人尚未清楚“rps”是否会出现在字首,若其可位于字首,其可作为判断输入值是全码还是简码的标准。)任何将21个英文字母辅音中除“q”和“x”之外的19个辅音分成9组的方法都是可行的,但是该分组方法需要考虑印尼语的特性。例如,可按以下进行分组BP/DT/GK/CJ/MN/LR/SZ/FV/HWY“q”和“x”可分在合适的组中。例如,将“q”分在“GK”组中,“x”分在“SZ”组中。
印尼语元音用五个元音“a”、“i”、“u”、“e”和“o”来表示,且有三个双辅音“ai”、“au”和“oi”,其中“oi”很少使用。因此,将该五个元音分成二组或三组时,最好不要将“a”与“i”或“a”与“u”分在同一组。例如,可分为ae/uo/i。与英文一样,各个分组中不连续出现的辅音(或不常连续使用的辅音)最好通过键击对应键一次来选择。
6.4辅-元音分开式袖珍键盘上的日语限制RSM
日语常用输入方法为使用罗马字符输入日语的发音,然后转换成日语。因此图10-1至10-4中所示的辅-元音分开式袖珍键盘上的罗马字符可用于输入日语发音然后转换成日语。あ、い、う、え和お分别转写为a、i、u、e和o,而な、に、ぬ、ね和の分别转写为na、ni、nu、ne及no。其它字符则可以转写成罗马字母辅音和元音的组合。
在日语中,当使用促音(Soku-on sound)或拗音(You-on sound)(以小写字母表示)时,罗马字母辅音连续出现两次。假设あ、い、う、え和お的组合很少在包含连续罗马字母元音的字中连续出现,最多两个或三个罗马字母元音连续出现的情况也是相当少的。因此,“a”、“i”、“u”、“e”和“o”五个罗马字母元音分成三组,如图10-1至图10-4所示,并分配给三个按键。这样,以重覆选择输入法输入元音时很少会出现混淆。在日语中,输入“a”对应“あ”,输入“na”对应“な”(此输入规测适用于其它日语字符)。因此系统在识别到用户键入的输入值“na”时便提供“な”。
用于五十音表内的日语拼音体系的有14个罗马字母辅音,包含k、s、t、n、h、m、y、r、w、g、z、d、b和p。拗音可用两个罗马字母辅音的组合(如“cha”或“sha”)、含“y”的组合(如“kya”)、或“j”来表示。在ch、sh、ky、ny、hy、my、ry、gy、py或py中以及使用促音的情况下,罗马字母辅音连续出现两次或多次。使用促音时,k、s、t和p中的相同字母会连续出现(如“ippai”)。因此在输入日语字符时16个罗马字母辅音(14个辅音+c和j)都是不可或缺的。辅-元音分开式袖珍键盘可加以设计,以使上述辅音的输入更为容易。其它五个罗马字母辅音f、l、q、v和x亦是英文输入所需要的,但主要对上述16个罗马字母辅音进行分组。例如,可通过以下分组来实现BP/DT/GK/CJ/H/MN/R/SZ/YW/=>九组BP/DT/GK/CJ/H/MN/Y/SZ/RW/=>九组BP/DT/GK/CJ/HR/MN/SZ/YW/=>八组英文输入所需的五个罗马字母辅音可适当加在各个分组中,与中文输入的分组相似。在上述分成八组的例子中,3×4袖珍键盘上的其余四个按键用作元音键;若只使用三个元音键,那么另一个按键可用作英文输入所需的辅音键。
6.5语言限制的故意取消LRRSM的应用使FIM不管字典中是否存在该单词都能实现所有单词的输入的优点得不到发挥。因此最好能够允许用户确定是否使用语言限制。但是即使在“语言限制输入模式”启动语言限制输入方法的情况下,用户若想输入不存于词典中的字,违反单词生成规则(字符连接规则)时,必须在输入基本字符之后输入一个特定功能键(如空格键、左移键或单词结束键),以确认该目标字符并输入下一字符。这种方法便可以输入所有可能的字符组合。例如,当用户在图10-1中的“英文限制输入模式”下输入“622~”时,系统识别该输入值为“st~”,而非“sdd~”。若要输入“sdd~”,用户只需输入“62”,然后键击空格键或左移功能键,然后输入“2”;又或者先输入“62”,然后键击某一装置激活“单词结束功能(例如,一个结束单词的控制键)”,然后输入“2”。若“62”输入后激活单词结束功能,系统将认为下一输入“2”为“d”,因为“2”是“字首”的第一个输入值。这种在某一具体语言限制输入模式下故意激活单词结束功能以克服语言限制的方法称为“语言限制的故意取消(intentional cancellation of language restriction)”,上述“sdd~”的例子便是“英文限制的故意取消”。
同样地,在图10-2所示的中文限制输入模式下(采用中文限制RSM),输入英文中的辅音组合“ui”而非中文拼音时,用户只需键入“u”、单词结束键(如上所述),然后输入“i”。不然,用户在图10-2中文限制输入模式(使用中文限制RSM)下输入“u”后选择分配给“i”的按键时,将会输入“u”的衍生字符,如在先申请文件所述(例如,若系统设置为将考虑给“u”加上音调符号后的字符或“u”的衍生字符(如“u”上加有“..”的“..u”))(因为在中文限制RSM中,在输入元音“u”或“o”后代表“i”的按键用作控制键)。因此用户可在中文限制输入模式下输入任何不出现在中文罗马拼音中的字(例如,字母的各种组合,包括英文单词)。换言之,在中文限制输入模式(例如使用中文限制RSM的模式)下,使用中文的用户无需改变输入模式就可以输入所有不出现在中文中的字符组合。这就是“中文限制的故意取消”。
同样的方法也可用于使用三元音元素的朝鲜语中辅音或元音当作单个字符输入的情况。如,在图4-5中输入作为单一字符的辅音 及元音 时,用户必须在单词起始状态选择[1]键,接着键击单词结束功能键,然后回到单词起始状态键入门键。连续键击[1]键和[*]键则输入 标准袖珍键盘中(即标准英文及朝鲜语袖珍键盘中),键击右移键可代替输入一个空格,激活单词结束功能。若按键中加设右移键,该方法也可用于本发明中。
6.6取消语言限制的延迟时间三个或更多的字符分配给同一个按键的情况下可以采用“连续击键延迟时间”和“非连续击键延迟时间”。如,当图1-1中的标准英文袖珍键盘的连续击键延迟时间设置为0.1秒时,系统会将0.1秒内的连续两次键击[2]键视为“B”。
同样地,当连续键击[2]键三次(即[2]+[2]+[2]),且第一和第二输入值(即[2]键的第一及第二次键击)间的时间延迟间隔小于预定时间(如0.1秒),且第二及第三输入值间的延迟时间间隔也小于该预定时间时(如0.1秒)(即[2]+少于0.1秒+[2]+少于0.1秒+[2]),系统将识别为输入“C”。该系统还可设置为当[2]键连续被选择三次(即[2]+[2]+[2])且总时间延迟小于连续键击时间延迟的两倍(如0.2秒)时,识别该输入为“C”。
输入英文的情况下,若“..u”未出现在图10-1中,且严格遵守元音“a”或“i”在英文中不连续出现的规则,则用户可在英文限制重复选择模式下通过激活单词结束功能来输入缩写单词如“NII”。但是“NI”的输入可以在输入后一预定的时间结束时被确认,不需要激活单词结束功能。该预定时间即在先申请文件中提到的“非连续击键延迟时间”,一般比“非连续击键延迟时间”长。例如,输入“NI”2秒钟后,不需激活单词结束功能“NI”的输入便可被系统确认,然后系统又重新回到单词开始状态。这一延迟时间称作“暂时取消语言限制的延迟时间(Delay Time for Temporary Cancellation of Language Restriction,DTTCLR)”,一般最好由用户设定。很明显,这种方法可以用于每一种语言的输入。
各种延迟时间可概括如下连续击键延迟时间(SSDT)≤非连续击键延迟时间(DSDT)≤暂时取消语言限制的延迟时间(DTTCLR)上述三种延迟时间可设为相同值,但是最好非连续击键延迟时间比连续击键延迟时间长,暂时取消语言限制的延迟时间比非连续击键的延迟时间长。
6.7辅-元音分开式袖珍键盘上的葡萄牙语限制重复选择方法葡萄牙语里的k、w、y只出现在缩写或外来语中,但在输入文本时还是需要用到。葡萄牙语里的复合辅音如下bl,cl,dl,fl,gl,pl,tl,br,cr,dr,fr,gr,pr,tr,vr此外还有gn、mn、pn、ps、pt、tm、ch、lh、nh、rr、ss等复合辅音。因此为葡萄牙语限制输入方法配置辅-元音分开式袖珍键盘(CVSK)时,最好不要将连续出现的字符分在一组中。例如,可参考图10-*。虽然图10-*中m和n被分在一组,这还可以进行修改。图10-*中的袖珍键盘可用于其它语言,也可以用于中文,这是因为其上的字符都是根据发音的相似性(即,具有相似发音的浊音字符和清音字符被分在同一组中,例如,/bp/,/dt/,/gk/…)来进行分组的,大多数语言中具有相似发音的字符很少连续许出。
葡萄牙语的基本辅音有a、e、i、o、u五个,其中a、e、o为强元音,i、e为弱元音。“一个强元音+一个弱元音”的两个不同元音连续出现的组合有6种(即ai、au、ei、eu、oi、ou),“一个弱元音+一个弱元音”的组合有1种(即ui)。因此可以将强元音和弱元音分开分组(例如,图10-6中去掉“..+u”后的袖珍键盘)。只要将强元音和弱元音分开分组,其他各种分组方式都是可行的,例如,该五个元音可按以下分组/a/eo/ui/。
6.8辅-元音分开式袖珍键盘上的西班牙语限制重复选择方法西班牙语里有一个英文字符里没有的字符“~+n”(在“n”的前面附加“~”的字符)。西班牙语里的“k”和“w”仅用于外来语,但在文本输入时需要用到。西班牙语里的复合辅音有bl,Cl,dl,fl,gl,pl
br,cr,dr,fr,gr,pr,tr因此,配置使用西班牙语限制输入方法的辅-元音分开式袖珍键盘时,最好不要将“i”和“r”分在同一组,而且连续出现的辅音不要分在同一组。辅音的分组可参考图10-1~图10-4以及图10-6。
西班牙语里的基本辅音有a、e、i、o、u五个,其中a、e、o为强元音,i、e为弱元音。“强元音+弱元音”构成的两个不同元音连续出现的组合有6种,“弱元音+强元音”构成的组合有6种,“弱元音+弱元音”构成的组合有2种(即“iu”和“ui”)。三元音由“弱元音+强元音+弱元音”组成。因此应将强元音和弱元音分开分组(例如,图10-6中去掉“..+u”后的袖珍键盘)。在输入由“弱元音+弱元音”组成的复合元音时会出现多义性。在输入“iu”和“ui”时,可以使用连续击键延迟时间、非连续击键延迟时间、语言限制的故意取消和其他申请人提出的方法来克服多义性。同一辅音连续出现时,或同一元音连续出现时,或者其他出现多义性的情况下,上述方法也同样适用。
6.9辅-元音分开式袖珍键盘上的意大利语限制重复选择方法在意大利语中,j、k、w、x、y只出现在古文或外来语里,还用于输入英文。除上述5个辅音以外,其他的辅音被视为主辅音,分成好几个组,而上述5个辅音额外进行合适分组。
意大利语里的双元音有ia、io、ie、iu、ai、ei、oi、ui、uo、ou、eu等。除“iu”和“ui”外,其他均为强元音(即a、e、o)和弱元音(即u、i)的组合。三元音则由“弱元音+强元音+弱元音”组成。这样的话,可将元音分成一组强元音和一组弱元音,例如/aeo/和/ui/。输入“ui”和“iu”时则会出现多义性。
6.10辅-元音分开式袖珍键盘上的德语语言限制重复选择方法德语里的复合辅音有ch、chs、ck、ds、dt、ng、nk、pf、ph、sch、sp、st、th、ts、tz、tsch等。为了确保连续出现的辅音不会分在相同组中,可参考图10-*的辅音分组。德语中的“sch~”为3个辅音连续出现在词首的典型例子,其可使用“语言限制并行输入法”来输入。“tsch”也出现在词首,但其出现的频率很少。
德语里有5个短元音,还有些元音是在“a”、“o”、“u”上附加“..”。双元音有“au”、“ei”、“ai”、“eu”、“..+au”、“ie”等。结合短元音(即基本元音)输入元音时,“ie”和“ei”之间会产生混淆。所以须将i和e分到不同的组中。例如,由可将短元音分成/aeo/和/ui/,当然还可以有其他修改。
当相同辅音或相同元音连续出现时,可利用上述申请人所提出的方法来避免出现多义性。
6.11越南语限制输入法6.11.1辅-元音分开式袖珍键盘上的越南语限制输入法越南语的音节以“元音”、“辅音+元音”、“元音+辅音”或”辅音+元音+辅音”为主。尽管多音节字正在逐步增加,越南语中的字基本上都是由单音节构成。大量的单音节字意味着很容易实现基于CVSK的文字输入系统。
越南语里有“a”、“e”、“i”(或“y”)、“o”、“u”5个基本元音和“v+a”(“v”附加在“a”上,以下“x+元音”表示“x”附加在该元音上)、“^+a”、“^+o”、“,+o”、“,+u”6个衍生元音。“y”是“i”的长音。因此,可在CVSK上配置5个基本元音,衍生元音则通过控制处理方法(CPM)来输入。CVSK还可配置为使用部分基本元音和部分衍生元音,或者使用所有11个元音。
越南语的双辅音和三重辅音比较多,所以若将5个基本元音分成如图10-*中所示的2到3个组,很难在应用重复选择方法时不产生多义性。越南语有6个声调,其中5个声调符号附着在元音的上方或下方。越南语中同一元音不会连续出现,这对于元音输入来说是非常有用的特性。因此,5个基本元音分别分到不同的5个组中,衍生元音则通过隐藏重复选择方法来输入,并通过控制处理方法将声调符号添加到元音(即基本元音或衍生元音)上。此时可将“y”视为“i”的衍生字符。也就是说,元音被分成五组,例如/‘a’,‘v+a’,‘^+a’/‘o’,‘^+o’,‘,+o’/‘u’,‘,+u’/‘i’,‘y’/‘e’,‘^+e’/。以此为基础,也可将含有衍生元音的两个组合在一起,组成4个组。例如分成/‘a’,‘v+a’,‘^+a’/‘o’,‘^+o’,‘,+o’/‘u’,‘,+u’/‘i’,‘y’,‘e’,‘^+e’/4个组也是可行的。将元音分成5个组时,应用重复选择方法输入该元音不会产生多义性。各个组中的某个字符可指定为代表字符(即代表元音)标示在按键上,剩下的字符可不标示在按键上。一般情况下将基本字符(即短元音)指定为代表字符。将元音分成4个组时,“i”和“e”均标示在袖珍键盘上。依据击键次数的字符选择顺序在考虑字符的使用频率和其他各种因素后确定。
越南语的辅音中有一个字符“-+d”(“-”划过“d”的中部),并且不使用“f”和“z”。“-+d”可视为“d”的衍生字符,通过(隐藏/不隐藏)重复选择方法或控制处理方法来输入。根据某些书里面介绍的,越南语中也不使用“f”、“w”和“z”。也有另一些书中说“w”和“j”在越南语中用作半辅音。因此可以认为越南语不使用“f”和“z”,而且“w”的出现频率也很低。所以本发明的实施例中视为“w”不用在越南语中,但必要时也可以将其分入合适的分组中。
越南语的复合辅音(包括双辅音和三重辅音)有ch、gh、gi、kh、ng、ngh、nh、ph、qu、th、tr等。其中“gi”和“qu”是辅音和元音的结合,本实施例中不予考虑。越南语以单音节字为主,这意味着很少有音节以“辅音+元音+辅音”的结构连续出现,因而除了上述复合辅音外,辅音不会连续出现。
因此,将上述复合辅音分成几个组并采用重复选择方法时,如果构成一个复合辅音的各个辅音未分在同一个组,则可以像中文输入一样避免出现多义性。
例如,可将辅音分成8组,例如/bp/dt/gk/cq/sx/mn/lr/hvj/,或者可以分成6组,例如/bpv/dt/gkq/sxc/mnj/hlr/,还可以将辅音分成特定个组。越南语中不使用的辅音“f”和“z”可分别加入某一分组中。
若将辅音分成8个组且元音分成6个组时,越南语中的所有字符可设置在3*4的袖珍键盘上。若将辅音分成6个组且将元音分成5个组时,所有的辅音和元音可设置在11个按键上,而其余剩下的按键可用作控制键,用来给元音添加声调符号。若将辅音分成6个组且将元音分成4个组时,所有的辅音和元音可设置在10个数字键上,能实现仅有数字表示的简码。此时3*4袖珍键盘上剩余的按键可用作控制键。
通过使用辅音和元音对,可以应用重复选择方法(RSM),这种情况可以参考朝鲜语的输入。当分出10对辅音和元音后,剩余的辅音和元音可通过控制处理方法(CPM)来输入。
6.12辅-元音分开式袖珍键盘上的俄语限制输入法用辅-元音分开式袖珍键盘输入俄语可参考申请人申请号为PCT/KR02/00247的在先申请文件。
俄语字母表中有33个字符,其中有10个元音,20个辅音,和1个半元音(即半辅音)以及2个标记字符(即硬辅音标记和软辅音标记)。
俄语里的33个字符(大写和小写)按照字典顺序排列如下АБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЪЭЮЯабвгдеёжзийклмнопрстуфхцчшщъыъэюя20个辅音可分为以下浊辅音和清辅音,括号内的罗马字符表示发音

俄语的元音可分为硬元音和软元音

俄语辅音分组时,可将有相似音价(phonetic value)的一对浊辅音和清辅音分到相同组中。例如/б(b)п(p)/д(d)т(t)/等等。与申请人在先申请文件中的示例一样,没有浊辅音和清辅音关系的辅音可分入适当的分组中。以下是分组的一些例子,当然还可以有其他修改。
分成10组的示例例1БП/ДТ/ГК/ВФ/ЗС/ЖШ/ЛР/МН/ХЦ/ЧЩ例2БВ/ГК/ДТ/ЖЗ/ЛР/МН/ПФ/СХ/ЦЧ/ШЩ分成9组的示例(b)п(p)/д(d)т(t)/г(g)к(k)/в(v)ф(f)х(x)/з(z)с(s)/ж(zh)ш(sh)/ц(ts)ч(tsh)щ(shsh)/л(l)р(r)/м(m)н(n)分成8组的示例
(b)п(p)/д(d)т(t)/г(g)к(k)/в(v)ф(f)х(x)/з(z)с(s)/ж(zh)ш(sh)/ц(ts)ч(tsh)щ(shsh)/л(l)р(r)/м(m)н(n)分成7组的示例……上述示例中,可将半辅音“Й”、轻辅音符号“Ъ”和软辅音符号“Ъ”额外分到适当的分组中。在上述的分组布置中,为了使袖珍键盘更简洁,部分字符(如,Й、Ъ、Ъ和其他字符)不标示在按键上。
10个俄语元音可分成5组,每组由一个硬元音和一个软元音组成。10个元音字符有11个元音发音,但是只有5个基本音素,即(a)、(e)、(i)、(o)、(u)。其中,(e)和(o)只出现在重音音节中,因此,可将元音(a)和(o)的音素视为强元音。其余的3个元音是没有重音的元音音素。因此,俄语里10个元音中5个作为基本元音,其中强元音分在同一个组,其余3个基本元音分作另一组或分成几个组。这是因为相同类型的元音几乎很少连续出现(强元音后接强元音)很少连续出现。例如,可按以下方式分成两组/а(a)о(o)/у(u)э(e)и(i)/,或分成3组,如/а(a)o(o)/у(u)э(e)/и(i)/。对于与基本元音配对的元音的输入,可应用重复选择方法,将其视为与对应的基本元音分在同一组,或者采用控制处理方法,将其视为每个对应基本元音的连续字符。
使用辅音组和元音组,可对辅-元音分开式袖珍键盘进行适当的设置(例如,5组元音和7组辅音,或者3组元音和9组辅音)。俄语与英语相似,虽然有几个辅音连续出现(如CCCVC…)的情况,但是很少,俄语音节的主要结构为辅音和元音的交替出现(如CV、CVCV、CVCVCV、…)。因此,在辅-元音分开式袖珍键盘上使用重复选择方法输入俄语单词时基本上不会出现多义性(或者出现多义性的情况较少)。
6.13辅-元音分开式袖珍键盘上的印地语限制输入法申请人的在先申请文件PCT/KR00/00601中已经介绍了根据发音相似性将印地语辅音分成9组的例子,而本发明将介绍将辅音分成10组的例子。印地语中具有很强的发音相似性关系的辅音被分在同一组中。例如,上图中发音为(k)、(kh)、(g)、(gh)的辅音分入相同的组中。该方法也适用于其他具有相似发音的分组。35个印地语辅音中,除了字符底部标有“.”的_(ud)和_(udh)外,其他33个辅音可分成9组或9组。_(ud)和_(udh)可分别视为_(d)和_(dh)的衍生字符,分别分入其所对应的基本字符所属的分组中。
印地语元音如下所示,在申请人的在先申请文件中已经进行了介绍。
以下为方便起见,印地语元音用下划线加上旁边括号内表示印地语字符发音的英文字母来表示(下划线部分视为对应该发音的印地语字符)。为简便起见,将_(aa)写为(a-),_(ee)写为(i-),_(oo)写为(o-),_(ae)写为(e),_(aae)写为(ai)。
根据某些印地语教材的介绍,元音_(ri)可视为一个辅音。除元音_(ri)之外的10个元音按照上图中的元音对分成5组。
印地语的单元音可分为短元音和长元音,短元音有(a)、(i)、(u),长元音有_(a-)、_(i-)、_(u-)。剩下的4个元音为复合元音,可用单元音的组合来表示。即,_(e)=(a)+(i)或(a)+(i-),_(ai)=(a)+(e),_(o)=(a)+(u)或(a)+(u-),_(au)=(a)+(o)。这样的话,基本元音(a)、(i)、(u)分别分到3个组中并分配给3个按键,然后通过键击对应按键一次来选择基本元音,而对应每个基本元音的长元音通过键击该对应按键两次来选择。剩下的4个复合元音则通过基本元音的组合来输入。输入复合辅音的方法与输入朝鲜语的方法类似,例如 例如,将_(a)、_(i)和_(u)分别指定给[*]、
和[#]键,则输入为“__(a-)=**”,“e=*0”或“*00”。输入“**0”期间键击“**”键时,系统暂时识别“**”为“_(a-)”,连续键击“0”后,系统识别“**0”为“(a)+(e)=_(ai)”。与此相似,输入“**#”期间键击“**”键,系统先将“**”识别为“_(a-)”,然后接着键击“#”时,系统最终将“**#”识别为“(a)+(o)=_(au)”。
该方法在10个印地语元音不再一个单词中连续出现的情况下可以完全实现。若有连续出现的元音时,就会发生多义性。例如,输入“0”时,系统不能区分“**0=_(a)+_(i)”和“**0=_(ai)”。但是尽管印地语中有元音连续出现的情况,但是不常见,因此当输入值表示一个复合辅音如“**0=_(ai)”时,可应用“印地语限制”使系统首先将输入值识别为复合元音。为了便于实现,系统可先存储由基本元音组成的复合元音,然后系统通过检测元音键的键击次数来识别元音。当系统识别到的元音组合是不可能的元音组合时(例如“_(a)”和“_(i)”),将输入值识别为预定义的复合元音。
这一示例中,如果用户想输入长元音_(a-)和短元音_(i)时,可以使用“语言限制的故意取消或”或“取消语言限制的延迟时间”。在上述例子中,先输入“**”后,通过延迟一段预定时间或人为地激活结束单词功能暂时取消印地语限制,,然后键入“0”。
假设_(a)在印地语单词中不会连续出现,因为还有_(a-)。尽管_(a)很少在一个单词中连续出现,在将“**”识别为“_(a-)”时可以应用“印地语限制输入法”。连续输入“_(a)”时可以使用“语言限制的故意取消或”或“取消语言限制的延迟时间”。例如,键入“*”后,激活“单词结束”功能,然后再次键击“*”。
假设10印地语元音(或包括“_(ri)”的11个元音)不会或很少在一个单词中连续出现,在印地语辅-元音分开式袖珍键盘上输入印地语元音时可以适用重复选择方法。
例如,3个短元音中不会有同一元音连续出现在一个印地语单词中,因为已经有与3个短元音的对应的3个长元音存在。因此,将元音分成3个组并分配给3个按键时,3个短元音应分为3组,3个长元音也应分为3组,每组短元音应分别加入对应的长元音组,剩下的4个元音(或剩下的5个元音,包括“_(ri)”)也适当地分成3组,然后分别加入前述的3个短元音组中。分在一组的一个短元音、一个长元音和复合元音按照预定的顺序来选择。当选择顺序设定为“短元音+长元音+复合元音”时,短元音和长元音的输入方法(即输入按键的操作)与上面介绍的方法相同,只有输入复合元音的按键操作与上述方法不同。一般分别用键击对应按键一次和两次来输入一个短元音和一个长元音。复合元音则通过重复键击对应按键来输入。
元音的分组方式,每个元音组的元音数量,以及每组中元音的选择顺序是任意的。即使当一组元音指定给一个按键时,也不需要将所有元音标示在按键上。印地语元音连续出现时,则可以使用“语言限制的故意取消或”或“取消语言限制的延迟时间”。
大多数印地语音节结构为一个辅音和一个元音交替出现,有时也有辅音连续出现的情况。以垂直线结束的辅音后接着出现一个辅音时,省略该垂直线,然后将第一个辅音和第二个辅音结合起来形成一个结合辅音。结尾没有垂直线的辅音后面接着出现一个辅音时,在第一个辅音下面附加上一个符号如“\”,然后两个辅音形成一个结合辅音。除此之外,还有一些规则和一些不规律的情况。连续出现的辅音的输入被系统识别后(暂时地或者经过确认后地),使用商用的印地语单词处理器很容易输出一个正确的结合辅音。
即使在英语不是母语的国家,也将英文字母标示在袖珍键盘上并用来输入英文。印地语和英语均是印度的官方语言,因而很自然的使用简码和字符输入,将具有相似发音的印地语辅音和英文辅音分在同一组并分配给同一按键。以下是一个示例,还可以进行各种变化
在上述例子中,相对比较容易确定对应“g”和“k”的印地语字符,也容易配置在印度使用的英文CVSK。上述例子中,英文辅音如“z”和“w”可像中文输入法一样分配到适当的分组中或单独进行分组。为了简化袖珍键盘,仅将一个分组中的部分字符而不是所有字符标示在袖珍键盘(应用隐藏控制处理方法)上。例如,当上述表格中的第一组分配给一个按键时,只有_(k)和_(g)或_(k)和_(g)中的一个需要标示在该按键上。各字符的选择顺序可以任意设定。元音_(ri)可分配给/RL/所属的按键。
为了简化袖珍键盘上字母的排列,仅仅将英文元音(英文字母元音)标示在袖珍键盘上。如上所述,对于印地语元音,一般都仅使用英文元音来表示,因为印地语元音和英文元音的发音非常相似。此外,如上面印地语辅音与英文辅音的对比表所示,对应辅音组/GK/、/MN/、/DT/、/BP/、/RL/…的印地语辅音发音彼此非常相似,并未标示出来,而仅仅标示英文辅音,这样使得袖珍键盘更加简洁。印地语字母被省略的情况下,像在中文限制输入模式下无歧义的输入中文拼音一样,在印地语限制输入模式下,根据印地语限制也可以无歧义的输入印地语。
6.14半辅音分开式CVSK上的语言限制输入法各种语言中半辅音(即半元音)都不常用。在英语里,一般将“w”、“y”和“j”视为半辅音。有些语言中“j”不是半辅音,也有一些语言中“v”是半辅音。一般几乎大部分语言都将“w”和“y”视为半辅音。
将半辅音分为单独的一组与将发音相似的字符分在一组一样,因为半辅音具有相似的音值,并具有类似元音的特性。
有些英文字符(如,西班牙语中“k”和“w”只用于外来语)在某些语言中不使用,而有些字符(例如,申请人在先申请文件中介绍的衍生字符或附加字符)不用在英文中。某一语言不使用的英文字符需要用来输入英文,因为英文是通用的。因此,当某一语言不使用的英文字符的数量不大时,这些字符与半辅音分在一组并指定给一个按键,如图10-6中所示的中文输入。
某一语言不使用的英文字符也可以分成一组并指定给一个按键。
6.15不完全辅-元音分开式袖珍键盘上的语言限制输入法通过优化配置CVSK并应用重复选择方法,可以消除或最小化多义性。CVSK还可以简化系统算法。当然,各种变化也是可行的。即使部分辅音和元音分在同一组并指定给同一按键,也只是对CVSK的语言限制输入法进行修改。这种袖珍键盘称为“不完全辅-元音分开式袖珍键盘”,指定有辅音和元音的按键称为“辅-元音混合键(CVMB)”。
例如,元音“i”和半辅音“y”可以分在同一组中并指定给同一个按键,然后元音和辅音(在该示例中半辅音)按照预定的顺序进行选择。剩下的按键分成辅音键和元音键。如果中文中没有“iy”和“yi”,则可以无歧义的输入中文拼音。在该示例中,假设“y”通过键击辅-元音混合键一次来选择,“i”通过键击辅-元音混合键两次来选择。键入一个辅音键后再键击该辅-元音混合键时,前一辅音键的辅音被确认输入。这样,系统还可以确认该辅-元音混合键的输入为“i”,而不会暂时识别其为“y”。因为中文中辅音“y”不会出现在一个辅音后面,可以采用这一语言限制。
再例如,元音“i”和辅音“j”可分为一组,或者元音“i”和辅音“k”分为一组,然后使用(语言限制)重复选择方法。当中文中出现“…ik…”或“…ki…”时就会产生混淆。若没有特殊理由,就将辅音和元音分配给同一按键,将使系统的算法更复杂,降低系统的效率,还不于在完全辅-元音分开式袖珍键盘上应用语言限制重复选择方法。但是对于特殊原因(例如,将辅音分配给10个数字键)的情况,某些按键可能是辅-元音混合键(例如朝鲜语输入的例子)。
图10-7还可以进行修改,如图10-9所示,其也适用于具有不止一个的辅-元音混合键的情况,以及2个或多个辅音与2个或多个元音分配给一个辅-元音混合键的情况。在不完全辅-元音分开式袖珍键盘上应用语言限制比在辅-元音分开式袖珍键盘上应用语言限制(参考上述“i”和“y”的例子)要复杂,展示特定语言中辅音和元音的结合规则的详细流程也比图10-9更复杂。图10-9是对图10-7的修改,简要的示出了一般的非完全辅-元音分开式袖珍键盘。
例如,基于图5-1中的标准英文袖珍键盘输入中文拼音时,元音的识别不会出现混淆,因为5个元音分别指定给了不同的按键。后接“~元音+n”的辅音的识别不会产生混淆。输入“~元音+n+m”以及“~n+X”(“X”指表示英文辅音的大写字母)的情况下,当输入能与元音“o”结合并与元音“o”一起指定给按键[6]的元音(例如“a”)时,“a”和“o”能立即识别为“~ao”。但是,由于一般拼音音节不以“m”结尾,前述的输入值将被识别为“~anm+元音”,该元音为下一输入值所输入的元音。如果在能与“a”结合的元音后输入“n+m=666”时,系统将其处理为“~emn~”而不是“~eo”,使用了“eo”的组合不可能出现的语言限制(由于“~emn~”不会出现在中文拼音中)。
当在“~元音+ng”结尾的音节后面输入一个辅音时,可能会出现多义性。例如,“~ngg~”可能被识别为“~nh~”。中文输入模式下,系统可以从中文索引中搜索所有与“~ngg~”和“~nh~”对应的中文字,然后提供给用户。“~ngh+元音~”可被识别为“~ni+元音”。如果下一个元音不能与“i”结合(例如“u”),该输入值将识别为“~nghu”,否则,系统将搜索并处理所有与“~ngh+元音”以及“~ni+元音”对应的中文字。此外,出现部分混淆的情况下,系统还能搜索所有对应能够给出的解释结果的字,然后将搜索结果提供给用户。
图1-1所示的标准英文袖珍键盘中,应用中文限制重复选择方法输入一个中文拼音时,“~ngh+元音~”可被识别为“~ni+元音”,这时,系统可以从拼音索引中搜索和处理所有对应该两种情况的字。如果拼音索引中存有该全码(基于图1-1使用RSM的全码),与应用中文限制RSM一样,系统将从索引中搜索所有输入值能够创建的字(例如“~ngh+元音”和“~ni+元音”),然后识别对应的字。
例如,图1-1和图5-1中采用重复选择方法时,“222”将会被识别为“aaa”、“ab”、“ba”和“c”。因此,图1-1和图5-1中,“Beijing”的输入为“22334445444664”,该连续的数字组将会被识别为多个字母的组合。连续数字组“~22”可解释为“aa”或“b”,“~33”能解释为“dd”或“e”。因此,“2233~”可解释为“aadd~”、“aae~”、“bdd~”和“be~”。若再加入输入值,可能的组合将呈几何级数递增。为简便起见,对应该输入值的可分析的字符组合称为“可用字符组合”或“候选字符组合”。
但是,键入“22~”时,其可解释为“aa~”或“b~”。这时,当系统发现索引中没有字的起始为“aa~”时,系统排除“aa~”的组合,处理该输入值“22~”为“b~”。使用中文拼音不会以“aa~”开始的语言限制将输入值“22~”识别为“b~”的情况与之类似。因此,键入“2233~”时,系统从索引中搜索与“bdd~”和“be~”两个组合相关的字。然后,当系统发现没有开头为“bdd~”的字时,系统根据与“bdd~”不相关的下一输入值将其处理为“be~”。使用中文拼音不会以“bdd~”开始的语言限制将输入值“2233~”识别为“be~”的情况与之类似。“22334~”的输入值可解释为“beg~”,“223344~”的输入值可解释为“begg~”或“beh~”。这时,当系统发现拼音索引中没有以“begg~”开始的字时,系统将“223344~”的输入值处理为“beh~”。使用语言限制输入法(例如,根据中文拼音的构建规则,“begg~”不是有效音节,只有“beh~”时有效音节)的情况与之类似。接着再输入“4”使输入值为“2233444~”时,其可解释为“behg~”或“bei~”。当系统发现拼音索引中没有以“behg~”开头的字时,将“2233444~”的输入值处理为“bei~”。这与使用中文限制输入法将“2233444~”解释为“bei~”的情况相似,因为“behg~”不是有效的拼音组合。
系统内存有可能输入的所有字和全码,“Beijing=22334445444664”内,候选字符组合的数量是128个(2*2*4*1*4*2*1=128)。当然,将这128个候选字符组合与索引进行比较并处理对应的字也属于本发明的范围。然而,系统从输入一开始就能识别输入值,因而根据输入值的增加排除索引中没有的字符组合(例如“aa~”、“bdd~”、“behg~”等等)的方法是非常有用的。
系统能够仅仅搜索根据相同输入值的连续增加创建的所有候选字符组合中存在于索引中的候选字符组合。如果输入值的所有候选字符组合都未出现在索引中,系统将该输入值处理为约定类型的简码。
6.16非隐藏型控制处理方法的应用辅-元音分开式袖珍键盘中,可将一个按键(3*4键区内或外的)指定为控制键,键击对应按键一次可以输入该按键的代表字符,剩下的字符则通过控制处理方法(CPM)来输入。例如,图10-6中,指定给
键的“w”、“y”和“v”可重新指定给其他辅音键,然后用
作为控制键的输入为“p=b+0=10”(当设置在代表字符后选择控制键时)。这一部分的内容已在申请人的在先申请文件中给出了介绍。
7.基于输入值长度的并行输入法存储在简码索引中的快捷码的长度可小于一预定数。具体情况下,用户或系统可以指定快捷码的类型(例如,类型1(城市名)、类型2(银行名)、…,其中类型1和类型2按照在先申请文件中的树状结构进行分组))。如果快捷码的类型指定为类型1(城市名称)且该快捷码的长度小于3,则在以SIM作为基本输入模式的并行输入模式中,输入值的长度超过3时,系统将该输入值视为全码。相反,在基于FIM的CIM(应用FIM作为基本输入模式的CIM)中,当用户输入三个输入值并激活单词结束功能(例如空格)时,系统将该输入值视为简码(或快捷码)。
这一方法尤其对中文中特定类型(城市名称—北京,公司名称—四通集团…)的快捷码长度小于一预定值的情况非常有用(在朝鲜语或中文中,特定类型名词通常都包括有比预定数量少的音节,所以自然将基于音节起始码当作快捷码。例如,大部份的朝鲜银行名称皆由两个音节组成,其基于音节起始码的长度为2)。
以上方法对于不需在输入之初决定输入值究竟为快捷码还是全码的情况比较有用,即系统可以依据输入值的长度是否大于预定值来判断输入值为简码或全码。亦即,不论输入值何时输入的,系统只需检查输入值的长度是否大于预定长度,不需要参照快捷码索引。这样可以简化系统的实现,增强系统的性能。
8.语言限制并行输入法(CIM)
在语言限制并行输入法中,在基于FIM的并行输入模式下(采用FIM作为基本输入模式的CIM),当输入值违反特定语言的“单词构建规则”(即违反语言限制)时,系统将该输入值视为简码。当判定简码索引中没有与输入值一致的值时,系统再将该输入值视为全码。
8.1以LRRSM作为FIM的语言限制并行输入法(CIM)8.1.1中文具体地,图10-1至10-4中所示的中文的基于音节起始码具有辅音键([1]至[9])的数值(元音“a”、“o”或“e”很少单独使用,偶尔用也是作为感叹词。“i”、“u”或“..u”单独使用时,以“y”、“w”或“y”开头)。对于使用重复选择法的全码而言,在图10-1至图10-4所示的例子中,需要选择[*]、
和[#]键中的一个来输入一个元音作为第二或第三输入值。在使用申请人在先申请文件的朝鲜语输入例子中所介绍的“并行输入法”的情况下,这一特征对在输入开始时确定输入值是否构成全码非常有用。
例如,当用户使用并行输入法在基于FIM的CIM模式下输入“693…=shk…”时,系统将在输入第三输入值[3]时识别该输入值不构成全码(因为辅音“k”不会出现在“sh”之后),并将该输入值视为简码。当用户输入“112…=pd…”时,系统在第二输入值[2]输入时识别该输入值不构成全码(因为在中文中输入“11”不能被视作“bb”,而被视作“p”,且罗马字母辅音“d”或“t”出现在”p”之后是不能构成中文音节的),并将该输入值视为简码。同样地,当用户输入“7771…=wb…”时,系统将在第四输入值[1]输入时将该输入值视为简码。大多数情况下,系统能在用户输入第二值或第三值时确定输入值是全码还是简码。
若用户输入“14…=bj…”,系统在第二输入值[4输入时]将判定该输入值不构成有效的中文音节(因为罗马字母辅音组合“bj”不会出现在中文的声母中),并将该输入值视为简码。亦即,系统将为用户提供对应简码“14”的字“Beijing”或“北京”。若在简码索引中没有简码“14”或“14…”,系统将视该输入值为全码,并将“bj”提供给用户。
这与使用元音元素的朝鲜语输入的情况相同(图4-5中)。图4-5中所示的完全输入法不是朝鲜语限制RSM。当用户在基于FlM的并行输入法下键入无法形成朝鲜语音节的“12”时,系统将该输入值视为简码,并根据简码索引将对应该简码的字或短语提供给用户。但是若确定简码索引中无对应“12”的简码时,系统将该输入值视为全码,并将 提供给用户。
为便于了解,图5-4和10-5中简码索引中的简码按字母顺序分类。但存储在系统中的简码的排列顺序不是很重要,如果需要搜索简码索引时,系统将对该简码进行分类并检查输入值是否出现在简码索引中。
在以快捷输入法作为基本输入模式(基于SIM的CIM)的并行输入法中,(假设将被搜索的简码索引中只包含有图10-1中[1]和[9]键组成的基于音节起始码),当输入值“1*…”的第二值[*]输入时,系统将不搜索检索索引而将该输入值视为全码。此例与图4-5中的朝鲜语输入示例相同。
图5-4和10-5中,中文拼音/中文字符索引和简码索引被解释为一个索引,但是,如图10-0所示,很明显存在中文拼音,中文字符索引(其被称为“拼音索引”,是一种存储“对应中文字符的拼音+拼音”用于根据输入的拼音搜索对应中文字的索引),也存在简码,拼音索引(称作“简码索引”,是一种存储“与中文字的拼音+拼音对应的简码+简码”或“对应拼音的简码+简码”索引)。
如图5-4和10-5所示,简码索引中不仅可以存储基于音节起始码,还可以存储其他类型的简码,如辅音相关简码,其还可以将各种类型的简码存储在一起。与上面一样,可以根据简码的类型创建各种索引,例如基于音节起始码索引、辅音相关简码索引、完全关联简码索引。
如图10-10所示,假设“北京”的基于音节起始码为“14”,辅音相关简码为“1473”,完全关联简码为“1*#4#73”。当图10-10的袖珍键盘采用中文限制基于FIM的CIM时,在基于音节起始码“14”和辅音相关简码“1473”的情况下,在输入第二输入值“7”时,系统将该输入值视为简码,并搜索和处理索引。然而,在“Beijing”具有完全关联简码“1*#4#73”的情况下,如果输入值“1*#…”被解释为全码,则变成“bai…”,且“1*4”不违反中文拼音的构建规则。但是, “baiz…”(以及“baij…”)是中文拼音,但不存在于图10-11所示的拼音索引中(因为根据下一输入值其还可变成“baij…”)。因此,系统根据输入的一个接一个的输入值将该输入值解释为全码,并参考拼音索引搜索对应的字或短语,不管何时输入值被识别为“b…=>ba…=>bai…=>baiz…”。如图10-10所示,搜索对应的中文拼音直至出现“bai~”,但是当输入值被识别为“baiz~”(也可能是“baij~”)(如图10-10(1)),系统检查到拼音索引中没有对应的字或短语。因此,输入值“1*#4…”即“baiz…”将被视为简码,系统将参考简码索引搜索对应的字或短语(如图10-11(2)-(A)和(2)-(B))。如果在简码索引中也没有搜索到与输入值“1*#4#…”对应的字或短语,则系统将该输入值视为全码,并将其处理为“bai…”。
由于考虑中文象形文字的特性,所有拼音和中文字的索引(拼音/中文字索引)必须存在系统中,当输入值尽管是有效拼音音节但不存在于拼音/中文字索引中时,系统将该输入值视为简码并进行处理。也就是说,当系统不能识别该输入值不是全码时,将其视为简码进行处理。
但系统中存有同一字的不同类型的简码时,如图10-10或10-11所示,一个中文拼音的简码索引可构建成多种类结构。当系统将输入值视为简码进行处理时(即,输入值被当作快捷输入来处理),可以选择图10-11(2)-(A)和(2)-(B)的处理流程中的一个。在图10-11(2)-(B)的处理过程中,索引中没有简码。图10-11(2)-(B)的处理过程中比较每个输入值能组成的拼音组合与索引的拼音,搜索对应的中文拼音。当该音节输至“1*”时,由于有两个字母指定给键[2],有三个字母指定给键[*],因而可用的拼音组合有6个(2×3)(即可能字符组合为6个)。为方便起见,其被称为“使用简码的可用(字母)字符组合”或“可用(字母)字符组合”。图10-11中,当音节输至“1*#”时,可产生12种组合;当音节输至“1*#4”时,由于有两个字母指定给键[#],可产生24种组合。但是,由于实际在中文字典中不存在以“poi…”开始的中文拼音,因而可以排除以“poi…”开头的组合。亦即,“poi…”以及“poiZ…”和“poij…”都是关于输入值“1*#4”的以“poi…”开始的组合,都应被排除。与上面一样,系统可从排除了索引中不存在的组合后的可用字符组合中搜索对应输入值的拼音。
如图10-11(2)-(A)所示,该索引中必须具有一简码,但是,即使使用不规则定义的简码,系统也能处理。使用图10-11(2)-(B)的处理过程的前提是简码未存储在索引中,但是输入规则的简码(例如,完全关联简码)时,系统知道预定的简码类型(例如,完全关联简码)。
考虑到中文必须具有所有拼音/中文字索引的特性,如图10-12和图10-13所示,当解释为全码的输入值未存在于索引中时,系统可将该输入值视为简码(即,快捷输入值)进行处理。在基于FIM的CIM应用中,图10-12示出了可应用于中文输入的处理流程。同样地,其也可以应用于使用基于音节起始码或辅音相关简码的基于FIM的CIM中。例如,当输入一个基于音节起始码时,系统解释其为一个全码,并搜索拼音索引,大多数情况下当第二或第三输入值输入时,系统能识别该输入值不存在于拼音索引中。图101-3所示为在系统使用中文的语言特性(即中文限制)搜索拼音索引前检查输入值是否包括在有效拼音音节中的流程图。
不仅在中文输入系统中,在其他语言的输入系统中也一样,当系统中存储所有单词的索引时,如图10-12和图10-13的流程所示,系统解释输入值为全码,检查该输入值是否具有对应值,然后无论该输入值何时一个接一个输入,将该输入值视为快捷码进行处理。
8.1.2英文及其它语言当系统识别到以“st~”或“sp~”开头的单词的第四个辅音以及不以“st~”或“sp~”开头的单词的第三个辅音时,将该输入值视为简码。
例如,当用户在图1-1所示的袖珍键盘上使用简单重复选择法输入“467=gms…”时,系统将在第三输入值[7]输入后将该输入值视为简码,因为该输入值违反了单词构建规则。如果简码索引中包含有“install”的完全关键简码“4678255”,系统将对应该简码的单词“install”提供给用户。如果搜索范围内的简码索引中没有对应“467…“的简码,系统再次将该输入值视为全码。
在辅-元音分开式袖珍键盘上采用英文限制RSM作为FIM时,如上所述,系统可确定输入值是否违反英文单词构建规则(例如,不以“st~”或“sp~”起始,没有英文单词以三个辅音开头),从而更有效的使用并行输入法。
8.2以CPMERC作为FIM的语言限制并行输入法图1-1中,当用户通过键击对应按键一次输入作为代表字符的每个按键的第一个字符并使用控制处理方法输入其他字符时(即当用户应用CPMERC时),可以采用语言限制并行输入法,若输入值违反了上述的英文单词构建规则的话,将该输入值视为简码。
例如,图1-1中,当用户使用控制处理方法输入作为代表字符的第一字符和其他字符时,“gms…”的输入值“467…”的第三输入值[7]被输入时,系统将该输入值视为简码,因为该输入值违反了英文单词的构建规则。
同样地,这一方法还可适用于除英语外的其他语言,具体细节与使用RSM作为FIM的语言限制并行输入法(LRCIM)相类似。
8.3语言限制并行输入法中第三歧义的克服当用户输入“scope”的完全关联简码“72673”时,系统在第一阶段将该简码识别为全码,将输入值视为“72673=pampd”,不违反英文单词构建规则。因此,系统首先将输入值视为全码,然后将其解释为简码,以致产生“第三歧义”,该输入值还是解释为对应该简码的“scope”。
这一例子中,系统首先提供给用户“pampd”。但当用户想输入“scope”时,键击一特定键(例如,向下箭头键[v])便可以选择“scope”。如果输入“72673”后单词输入结束(例如,键入空格键),系统将“pampd”和“scope”的列表提供给用户,使用户选择其中的一个。在此,“pampd”产生于对输入值的第一次解释,而“scope”产生于对输入值作为简码的第二次解释。
同样的方法也适用于使用CPMERC作为FIM的并行输入法。在基于FIM的CIM和基于SIM的CIM中,尽管在输入值输入后单词结束处该输入值出现在简码索引中,如果被视为全码的该输入值不违反语言限制(例如,如果出现第三歧义),系统将促使用户选择目标单词或短语(通过重复地键击一特定键或从给定的列表中选择)。
同样的方法也适用于除英语外的其他语言(特别是使用CPMERC的日语)。
选择多个候选项中的一个时,用户可以使用移动键中的一个键来选择系统输出的候选项中的目标单词或短语。其可应用于出现歧义的所有情况,包括出现第三歧义的情况。
9.使用违反语言限制的文本(或字符串)的并行输入法(CIM)客户端或服务器也可以解释输入值(全码或简码)。图11-1和图11-2分别示出了通过客户端和服务器对输入值的解释。亦即,“系统”这一概念既指客户端系统,也指服务器系统。当输入值为简码且客户系统解释该输入值并将对应该简码的单词或短语以文本发送给服务器系统时,服务器系统使用该文本提供各种服务。同样地,即使当输入值作为数字发送给服务器系统且服务器系统由解释该数字时,服务器系统解释简码并使用该简码用于各种服务。客户系统发送DTMF音频给服务器系统并由服务器系统使用该传输的输入值的情况也是客户端发送数字值给服务器的一个例子。
当在语言限并行输入方法中一个输入值违反语言限制(即输入值不构成特定语言的有效音节)时,系统将视该输入值为简码,但是简码索引不包含对应该输入值的简码。这时,系统再次将该输入值视为全码。例如,图4-5中,当用户键入 的输入值“7799”,但客户端系统的简码索引中未储存“7799”或对应“7799”的 这时系统将该输入值视为 例如,当客户端将输入值“7799”或与其对应的 发送给股票信息系统中的服务器端时,股票信息服务器便可毫无困难的解释“7799”(假设股票信息服务器中存储有简码“7799”及与其对应的 但当客户端将该输入值“7799”视为简码,且该客户端系统的简码索引中不包含“7799”时,客户端系统再次将该输入值视为全码,并发送文本 给服务器。这种情况下,股票信息服务器不能使用该文本。
如果客户端发送的文本 是没有意义的值,那么股票信息服务器提取用于输入 的“7799”,并搜索对应词 然后使用搜索到的单词。另一种只适用朝鲜语中基于音节起始码用作简码的情况的方法是,系统搜索音节的第一个辅音与对应该简码的字 一致的 然后提供服务。 的基于音节起始码也是“7799”这种情况下,“7799”解释为 使得系统需要搜索音节第一辅音为对应 的 以及对应 的 或 的单词或短语,也要搜索音节第一辅音与 相同的单词或短语。亦即,系统搜索音节第一辅音与 一起指定的字符(考虑到送气音和紧辅音也分配给基本辅音键)相同的单词或短语。
同样的方法也适用于使用键盘而不是袖珍键盘的PC环境。在使用现有的PC作为客户端的股票信息系统中,为了搜索 的股票价格,用户需要输入 当用户输入 并将该输入值发送给服务器时,股价信息服务器系统识别到 不存在于公司名称列表中,便利用上述的两种方法提供服务(一种方法是提取“7799”搜索 另一方法是搜索音节第一辅音与 相同的 另一种方法中,服务器索引储存 (对应简码的字符)”,也存储“7799(简码)”与 (对应该简码的单词)”,服务器确定来自客户端的输入值 不构成有效的朝鲜语音节,然后将输入值与索引中存储的简码对应的字符进行比较,从而系统能找出用户想输入的 上述内容可参照图11-3,其中(A)、(B)或(C)是可选择的。
客户端使用现有PC通过键盘或类似装置输入字符时(例如,使用PC的文字处理器),使用基于音节起始码输入音节的第一辅音,然后(客户端或服务器)系统将基于音节起始码转换成目标单词,从而实现快速输入字符或用于各种信息系统中。例如,当用户输入 代替 时,系统搜索索引,然后提供给用户音节第一辅音为 的 此外,还可以采用上述的另一种方法(提取基于特定键区的输入值的简码,搜索简码索引,存储对应索引中简码的字符),如图11-5,其中(A)、(B)或(C)是可选择的。
如前所述,常用的单词或短语登记为特定功能键和数字键的组合,并使用该特定功能键和数字键的组合来输入,不用考虑该单词或短语的连接。例如, 被存储为常用单词,可通过按键“alt+1”来输入。
同样地,“四通集团(satongjipdan申请人对中文发音不了解,便用该单词的朝鲜语发音的罗马字母表示,但也适用中文发音)”的基于音节起始码是“6242”,对应“s、t、j、d”。当用户键入“6242”且“6242”和“四通集团(satongjipdan)”未存储在客户端系统中时,客户端系统提供“sdzd”给用户。然后用户将“sdzd”发送给服务器,服务器认为“sdzd”不构成有效中文音节,从“sdzd”中提取“6242”,并搜索对应该简码“6242”(该例中为基于音节起始码)的“四通集团”(假设服务器系统中存储有该简码以及对应该简码的单词或短语)。
与朝鲜语中系统搜索音节的第一辅音与 以及一起指定的其他字符相同的单词一样,图10-2中,系统提供给用户音节第一辅音与“sdzd”和其他可用辅音组合(例如,16种组合,包括“xdjd”、“stjt”、“sdjt”等)相同的单词。
服务器系统中存有对应该简码的字符组“sdzd”,并且客戶端发送的“sdzd”不能构成有效中文音节,这样的话,服务器系统将输入值与索引中与该简码对应的字符进行比较,找出用户想输入的“四通集团”。
图11-4是对上述内容的图示说明,其中(A)、(B)或(C)是可选择的。
图11-3和图11-4的处理流程可以在服务器或者客户终端中实现。
不仅具有袖珍键盘的设备,而且信息通信设备如PC也是搜索罗马拼音音节第一辅音与用户输入的输入值“stjd”相同的单词(“四通集团”),然后将该单词提供给用户。可选择地,用户输入“stjd”时,系统(即PC)登记简码(对应简码的字符)为各个音节的第一辅音“stjd”,用户输入第二辅音时,视该输入值为快捷输入值(考虑到用户执行快捷输入),因为该输入值违反了中文语言限制(出现了除sh、ch或zh之外的两个罗马字母辅音)。从输入值“stjd”中提取简码(如“6242”)可通过预先设定的袖珍键盘来执行(如图10-2)。参考图11-6,其中(A)、(B)或(C)是可选择的。
图11-6(B)中比较由输入值创建的单词,并未用存储在索引中的单词或短语的每个音节的第一字符(“sa-tong-jip-dan=>stjd”)创建有效拼音音节(例如,“stjd”作为“基于音节起始值”)。这意味着该基于音节起始值用作快捷输入值。图10-*中所示的袖珍键盘中,对应“stjd”的基于音节起始码是“622442”。如图所示,图11-6(B)可通过用于输入中文字符的拼音索引来实现而无需简码索引。同样地,当输入“基于辅音输入值”时,系统可通过比较输入值生成的文本与拼音索引中单词的辅音来解释单词或短语。
总之,与简码的分类类似,用于快捷输入的输入值可有规律地识别,并可分成“基于音节起始值”(例如,“Beijing”的基于音节起始值为“144=bj”)、“基于辅音起始值”(“Beijing”的基于辅音起始值是“144773=bjng”)、“元音+基于音节起始值”、“基于单词起始值”等等。当输入值违反语言限制时,系统将输入值视为快捷输入值进行处理。
“快捷输入值”的种类如图11-11的表格所示。图11-11中,一个快捷输入值(A)包括(B)到(L),其所示为快捷输入值的简写,可由系统根据有规律的规则进行识别。快捷输入值的种类还包括与部分字母相关的部分关联简码以及仅具有部分字母的快捷输入值。如图所示,“完全输入值”(Z)可以是FIM的全码。
如上所述,很明显本发明中未介绍的快捷输入值的使用也属于并行输入法(CIM)的范畴,因为CIM的关键是如果输入值满足某个条件(例如,输入值违反了全码的构成规则,或者输入值不能构成特定语言的有效音节)时系统将该输入值视为快捷输入值进行处理(也即系统不视该输入值为指定FIM的全码)。图11-11的表中,(H)到(L)的快捷输入值不仅可以用于具有袖珍键盘的设备,还可以用于例如PC等设备,如图11-5和图11-6所示。图11-6(B)所示为基于音节起始值用作快捷输入值的一个示例。术语“简码”或“快捷码”专指快捷输入值,且(H)到(L)的快捷输入值是广义上的简码。也就是说,图11-11中,(I)的“基于音节起始值”又可称为“基于音节起始值简码”,(H)到(L)的快捷输入值亦相同。
图10-*中,当输入“14=bz”的基于音节起始值后,系统从索引中搜索每个音节的辅音与“bz”对应的单词或短语。在此,当再输入“4”变成“144=bj”时,系统搜索每个音节的起始辅音与“bj”对应的单词或短语(例如,“Beijing”)。
当输入前述快捷输入值中的任意一个时,本发明能够分析该任意快捷输入值为各种类型的快捷输入值。例如,系统首先将某一快捷输入值视为一个预定的快捷输入值(例如,一个基于音节起始值),接着将其视为其他的快捷输入值(例如,基于辅音输入值),再接着将其视为另一种快捷输入值,然后,分析该一个快捷输入值为各种类型的快捷输入值。基于如10-*,当输入“144=bj”的快捷输入值后,系统首先搜索每个音节的起始字符对应“bj”的单词或短语(例如,“Beijing”),然后搜索辅音与存储在索引中的该单词或短语相对应的单词或短语(不管第一个结果是否存在)。
如图11-11所示,即使用户输入任一快捷输入值,系统也能分析。如果采用上述方法,一个快捷输入值将具有多个搜索结果,其输出的优先顺序可根据使用的快捷输入值的类型进行确定。例如,作为基于音节起始值解释并搜索的单词或短语优先输出,然后输出作为基于辅音输入值解释和搜索的单词或短语。如果用户主要使用基于音节起始值作为快捷输入值,则最好优先输出由基于音节起始值解释的单词或短语。因此,最好由用户根据快捷输入值的类型指定优先顺序。此外,如果用户只想使用基于辅音起始值,最好将系统设置为仅分析快捷输入值为基于辅音起始值。如上所述,通过解释为同一类型的快捷输入值而获得的单词或短语的优先输出顺序可通过各种因素确定,例如使用的频率。输出的优先顺序可根据每个解释并搜索出的单词或短语的使用频率来确定,而不考虑用于快捷输入值解释的快捷输入值的类型。
输入“jinzhi(禁止)”和“zhujian(逐渐)”时,分别具有对应“jz”和“zj”的基于音节起始值,且该基于音节起始值均为“444”。这种情况下,若采用基于FIM的CIM,输入第三输入值“4”时,系统就可以识别出该输入值不构成拼音音节。基于图10-*,如果该基于音节起始值是指定给同一个按键的不同字母,则会搜索所有可能的单词或短语。也就是说,将搜索音节对应与快捷输入值“444”相关的“jz”和“zj”的所有单词或短语。
同样地,若采用基于SIM的CIM,系统视该输入值为图11-11(B)到(L)的快捷输入值。此外,该输入值可首先被视为基于音节起始值,然后被视为基于音节起始码,接着被视为基于辅音起始值,然后以相同的方式作为其他快捷输入值进行处理。当系统将该输入值作为快捷输入值进行处理后检查到索引中没有对应的单词时,系统将该输入值视为全码进行处理。因而最好允许用户预先指定一种用户常用的快捷输入值。
输入“jinzhi(禁止)”和“zhujian(逐渐)”时,为了解决使用基于音节起始值所出现的问题,可以按照如下方法获得基于音节起始值简码和卷舌音的基于音节起始码。中文中的卷舌音“ch”、“sh”和“zh”实际上是单声母,仅标示有一个音调符号,但是在英文模式下表示为两个字母的组合。因此,图10-6中“zhujian”的基于音节起始值简码还包括“h”,通过对应“zh+j”的“4944”来输入。对应“zh+j”的基于音节起始码是“494”。图10-*所示的袖珍键盘中,因“jinzhi(禁止)”和“zhujian(逐渐)”的基于音节起始值简码均为“444”而产生的歧义是可以避免的,因为卷舌音“ch”、“sh”和“zh”的起始字母“c”、“s”和“z”分配给了与第二字母“h”所在按键不同的按键。
在使用基于音节起始值简码作为快捷输入值的基于FIM的CIM中,系统将输入值“4~”识别为“z~”,将输入值“49~”识别为“zh~”。但是,即使系统在处理该输入值“49~”为“zh~”后将对应的单词或短语输出给用户也毫无意义,因为有大量以“zh~”开头的单词。因此,系统将输入值“49”分析为基于音节起始值简码,然后输出具有“z_h_”(下划线部分是元音位置)音节结构的单词或短语。如果仅将“49”解释为“zh”,很难立刻输入基于音节起始值为“z_h_”的单词。由于大部分中文字包括一个或两个音节(字母),快速输入卷舌音对于快捷输入具有两个音节单词来说是很有用的。如图10-17中,显示设备上[在乎]旁边的[…]表示若有多个对应“z_h_”的单词,则其他的单词已经输出。当然,对应“zh_”的单词也能在显示序列中输出,并且可以根据用户的要求将系统设置为首先输出对应“zh_”的单词。一般将系统设置为首先输出对应“z_h_”的单词。
当系统识别到“49”后输入的一个元音(例如,键入元音键)时,处理该输入值为“zh_”(即,将该输入值处理为全码)。当系统识别到“49”后输入的一个辅音(例如,键入辅音键)时,处理该输入值为“zh_X_”(大写字母“X”表示代表任一声母的英文辅音)。也即,在基于FIM的CIM中,系统首先将卷舌音“ch”、“sh”和“zh”的输入解释为简码(例如,基于音节起始值简码或基于音节起始码),然后根据下一输入值是否是元音或辅音将其解释为全码或简码。
将基于辅音起始值简码视为快捷输入值并采用快捷基于FIM的CIM时具有与上述情况相似的结果。尽管基于辅音起始值加码被视为快捷输入值并采用了快捷基于FIM的CIM,但是当在字首输入卷舌音时(在输入系统中键入“OK”或“enter”键后,或者指定类型的单词输入完成后),该输入值被作为快捷输入值进行处理(搜索与声母为“z_h_”的单词相对应的所有单词(其他卷舌音“ch”和“sh”的处理方法相同))。
以上描述结合图10-*进行,但是很明显上述概念还可以应用在其他袖珍键盘上。
上述方法同样可以用于任何其他修改后的字符组(可有在屏幕上实现的各种类型的字符组),也可用于PC键盘或袖珍键盘。
10.使用通过简码获得的可用字符组合的CIM前面介绍的方法中使用基于音节起始码作为简码的示例中,简码与各个音节的第一辅音之间的比较可以应用在客户端没有简码索引(例如,“6242”、)只有具体单词或短语的索引(例如“satongjipdan”及“四通集团”)的情况中。例如,当用户选择“62..”中的第二个键[2]时,系统识别到该输入值违反了中文语言限制,并搜索索引中各个音节第一辅音与输入值“62..=sd…,st…,xd…,xt…”(称为“可用字符组合”)相同的单词。随着按键键入数量的增加,可用字符组合的数量也增加。可用字符组合用于从索引中比较/搜索单词。如图11-7所示,图11-7的索引中,“四通集团”行(即,记录)中包括“stjp”和“sd..”,“xd…”,“xt…”等多种组合(24=16种),然后系统通过比较“sd…”与该多种组合的值将对应“sd…”的“四通集团”提供给用户。这种概念与上述方法相同,但并不推荐。如图11-9所示,两种方法都包括有比较根据输入值获得的可用字符组与索引中单词或短语(图11-9中的中文拼音)。
同样地,假设客户端没有简码索引(如“7799”及 但有具体单词或短语索引(如 用户键入“77…”以输入 此时,当用户选择第二键[7]时,系统识别到该输入值违反了韩语语言限制,然后从索引中搜索各个音节的第一辅音与输入值 (“可用字符组合”)相同的字,如图11-8所示。
如果索引中没有单词与该输入值相同,系统将该输入值视为全码并将其提供给用户。仅当用户键入一个基于音节起始码时,上述方法与在具有单词索引而没有简码索引的系统中使用并行输入法具有相同的效果。该方法中系统识别输入值违反全码构成规则的流程与基于FIM的并行输入法中的也相同,但是搜索对应输入值的单词或短语的流程不同。亦即,识别到输入值违反全码构建规测或者语言限制时,鉴于该输入值是基于音节起始码,系统认为该输入值不是全码并解释(或搜索)对应该输入值的单词给用户,无需使用简码。
并行输入法的核心是,系统可自动识别输入值违反全码构建规则或语言限制并将输入值视为简码(即考虑用户执行快捷输入多于完全输入)。因而这一方法仅在具体示例中搜索对应输入值的单词的步骤上对上述并行输入法进行了修改(使用基于音节起始码)。
与基于音节起始码一样,自动从完全关联简码、辅音相关简码和起始元音+辅音相关简码中提取简码的情况下,也可以通过比较输入值的“可用字符组合”与索引的单词从索引中搜索出目标单词。图10-11中,无论输入值何时一个接一个的输入,将输入值解释为全码后,系统发现拼音索引中没有解释为该全码的拼音时,系统可以通过比较输入值的“可用字符组合”与单词索引来搜索目标单词。以上如图11-10所示,图11-10所示是使用完全关联简码的一个示例,是图10-11((2)-(B)部分)的一部分。
11.存储全码的输入系统内的FIM和CIM在先申请文件中已经介绍过,在一个特定的袖珍键盘上使用具体语言限制FIM时(例如在标准英文袖珍键盘上通过RSM进行英文输入和拼音输入)很难识别出对应输入值的正确单词。在中文输入中已经介绍过,如果系统具有所有单词的索引,输入值首先被解释成全码,然后如果索引中没有该输入值,则被解释成指定类型的简码。该方法不仅适用中文也使用所有语言。
以下将主要介绍中文输入。如图10-14所示,如果存储所有中文拼音的系统内存储有所有全码,该系统可以很容易的搜索对应输入值的单词或短语,并识别出目标字母。如果采用了基于FIM的CIM,当系统识别到索引中没有对应的全码时,将输入值识别为指定类型的简码进行处理。图10-14中输入“北京”的处理过程便是将输入值解释并处理成全码的过程。由于全码存储在索引中,因而可通过搜索索引来进行解释。
若采用依据语言限制输入法的FIM,能区别单词而不会产生歧义,这时在索引中存储全码是没有用的。但是其在采用会产生歧义的FIM如RSM的情况下非常有用,所有的目标单词都存储在索引中。在前述“非完全CVSK上的语言限制输入法”中已经介绍过,采用会出现歧义的FIM(还可以应用在除中文外的其他语言中)时,若用户想要输入的所有单词都存在索引中,可使用全码处理该输入值。
很明显,上述的方法还可以应用于除中文外的其他语言。此外,上述方法不仅适用图1-1所示的袖珍键盘,还适用图10-*中所示的袖珍键盘或其他各种袖珍键盘。
12.用于同时处理输入值为各种类型代码(即各种类型的输入值)的CIMCIM可以将输入值视为预定类型的代码(输入值)进行处理。例如,图10-14中,如果一个输入值被同时被视为全码(A)和完全关联简码(B)进行处理,系统能识别与输入值“1*#”相关的解释为全码的“bai”和解释为完全关联简码的“bei”。这时,系统能同时提供给用户“bai”和“bei”。
系统采用基于FIM的CIM将输入值“1*#”解释为全码时仅输出“bei”,而系统采用基于SIM的CIM将输入值“1*#”解释为指定类型的快捷码时仅输出“bai”,这两者之间是有区别的。同样,在该CIM中,当系统识别到一特定类型代码中不存在该输入值时,系统仅将该输入值视为一不同类型的代码进行处理。结果,其也属于上述CIM的范畴。如图10-14所示,无需将全码和完全关联简码存储在系统的索引中,并且该输入值可被同时解释为各种类型的代码。
13.歧义发生时单词的优先顺序一种具体输入法中(例如,完全输入法或特定类型的快捷输入法),如果相同的输入值导致出现歧义,如图10-14及其他图所示,系统能根据基于优先顺序的输入顺序输出目标单词。例如,图101-4中,采用完全输入法产生歧义时,系统根据全码(A)之间的“优先顺序(A)”输出一个目标单词并将该目标单词推荐给用户。
接下来将介绍将输入值解释为各种类型的代码。如上所述,图10-14中,若输入值“1*#”被解释为全码,则为“bai”,如果其被解释为完全关联简码,则为“bei”。同样,解释输入值为不同类型代码而出现歧义时,系统能根据图10-14中的优先顺序“(A)+(B)优先”(即输入值被同时视为(A)和(B)优先)将目标单词提供给用户。
例如,在CIM中,输入值首先被视为全码进行处理,但是当违反了全码构建规则,或者违反了特定语言的音节构建规则,或者系统识别到索引中没有对应的全码时,系统将该输入值视为基于音节起始码和基于音节起始值简码进行处理。这时当输入值被视为快捷码进行处理时,该输入值可以基于歧义发生时在“基于音节起始码”和“基于音节起始值简码”之间建立的优先顺序进行处理(即,如果基于音节起始码是(C),而基于音节起始值简码是(D),则可根据“(C)+(D)优先”的优先顺序输出目标单词)。
以上介绍的是中文输入,如果目标单词不是中文字而是中文拼音的话,很明显也可以相同的方法适用其他语言。
14.采用CPM(控制处理方法)作为FIM(完全输入法)的CIM如图2-1和2-2所示,假设控制键是按键[*]和[#],并采用了非代表字符控制处理法(CPMERC)和CIM,如果索引中的单词仅包括代表字符并采用基于SIM的CIM,键入[*]或[#]作为输入值时,系统能将该输入值视为全码进行处理。
如图2-1和2-2中输入日语的例子中,假设所有的快捷码都只有数字值。这种情况下,系统存储所有的单词,但在索引中只有代表字符(其可包含在快捷码索引中或单独构成索引),并采用CIM。这时,系统可根据仅具有代表字符的单词索引(或者,该简码索引包括有单词,但该单词仅具有代表字符)将输入值解释为全码的结果和输入值解释为快捷码的结果根据预定优先顺序作为目标单词提供给用户。
例如,图2-1和2-2中,如果将输入值“111”作为全码进行处理(即,如果采用基于FIM的CIM),其被解释为“あああ”。如果仅含有代表字符的所有单词索引中不存在以“ああ~”开头的单词,仅存在“あい”或“あい~”。则系统将“あい”或“あい~”优先于“ああ~”提供给用户。
如图10-15和10-16所示,输入值“11”被解释为全码,系统搜索“仅包含代表字符的所有单词的索引”,并检查该单词是否有效,因为该单词仅包括有代表字符。在此,如果解释“11”为全码所获得的“ああ”存在于索引中,系统识别该输入值为有效单词。当系统检查到所有单词的仅包含代表字符的索引中没有对应该输入值的单词时,通过再次将该输入值解释为简码来识别对应该输入值的“あい”。图10-15中,系统识别“あい”为与输入值“11”相关的最佳单词。由于“あい…”(“…”表示增加给“あい”的字符)可根据连续输入值“11”显示,系统将其在“あい”后输出。同样地,由于目标单词可能会是“ああ”,尽管其在索引中不存在,也能在“あい”后输出。图10-15中,“あい…”和“ああ”用灰色表示,并位于第二和第三推荐顺序。这意味着系统能将输入单词输出为“あい…”或“ああ”,或者仅仅输出“あい”。
图10-15中,(1)、(2)和(3)按顺序发生,或同时发生,如前“用于同时处理输入值为各种类型代码的CIM”中所述。同样,索引中显示的全码和简码仅仅是为了帮助理解。很明显即使该全码和简码未存储在索引中(如果该简码可以像基于音节起始码或完全关联简码一样有规律的解释)也能实现同样的处理。如图10-16所示,仅包含代表字符的所有单词的索引和简码索引存在于同一索引中的例子也与上述例子相同。具体实施例中的数据结构可以是各种类型的。
该系统的操作结果与前述的基于SIM的CIM中的相似。这一次不采用基于SIM的CIM,而采用基于FIM的CIM或一般的CIM。
上述方法不仅适用于采用CPMERC作为FIM的CIM,也适用于采用CPM作为FIM的所有CIM。
15.中文转换朝鲜语字符或罗马字符与中文拼音以及中文字的对应关系是一对多,例如,有多个中文字符(如礼意、礼仪、锐意…)对应一个朝鲜语 在中文中,对应“beijing”的中文字有北京、背景等等。因此,“中文连续字符”通过多次键击中文转换键来选择(如,北京(第二个),背景(第三个))。例如,输入“beijing”后,键击一次中文转换键选择“北京”,再键击该键一次选择“背景”。可选择地,用户可以从给出的列表中选择中文字符。
在中文输入中,一个索引中必须存有要输入的所有中文字符(称为“目标中文字符”)。这样的话,即使在输入中文拼音的罗马字符期间也能将系统确认的目标中文字符提供给用户。例如,若除“北京”外没有字以“beij…”开头,当用户输入“beij”时系统就将“北京”提供给用户。如果拼音索引中只有“beijing(=北京)”,即使在输入期间用户没有决定目标中文字符,当系统最后识别到“beijing”时,其将“beijing”转换成“北京”并输出。
在日语中,平假名与片假名间存在一对一的关系,而平假名或片假名与中文字间为一对多的关系。如前所述,在平假名输入后选择片假名转换控制(如图2-1中的“あ/ア”控制)可将平假名模式转换为片假名模式。在图2-1中,以交叉控制处理法输入衍生字符,并通过键击
键两次选择“あ/ア”控制。对应平假名或片假名的中文字通过键击
键多次来选择。例如,若“あ/ア”控制设定为在代表字符之后选择时,输入平假名单词(或字符)输入后键入
+
可将输入转换为对应该平假名输入的片假名,再一次键击
键则将片假名转换为中文字。相反地,在片假名模式下输入片假名后键击
+
则将片假名转换成对应的平假名,再一次键击
键将该平假名转换成中文字。
16.简码索引的建立申请人所提及的简码有“完全关联简码”、“基于音节起始码”、“辅音相关简码”、“第一元音+辅音相关简码”、“基于单词起始码”,均可以机械地(即,自动地)从单词或短语中提取得到。因此,系统可为通过全完输入法(FIM)输入的单词自动建立一个简码索引,并且该简码索引可用于CIM。类似图5-5的环境中,简码索引存储在客户端或者服务器端,或者也可以存储在客户端和服务器两者中。
对于同一个单词可以生成各种类型的简码(例如,完全关联简码和基于音节起始码)。一般用户使用某一种简码更为方便,因而用户需要知道简码的类型。自动建立简码索引的好处是用户输入的单词越多,简码索引就越丰富。
从特定语言的特定单词种提取基于音节起始码时,系统需要从单词种分离音节。系统可以根据特定语言的音节分离规则来从单词中分出各音节。从单词中分离音节是很容易的,因为各语言中都有音节分离规则,所以在此就不再详述。
例如,中文拼音的“zhongguo”的音节可按照元音“o”和“uo”分为“zhong”和“guo”,这比本发明的中文识别处理更容易实现。通过从单词的前端正向扫描进行音节分离时,例如,系统可识别出“zho”后面的辅音“n”属于第一音节,因为后续辅音是“g”。同样地,系统可识别出第一个“g”属于第一个音节,第二个“g”属于下一个音节,因为第二个“g”是在第一个“g”后面键入的(中文拼音中一个音节可以“~ng”结尾)。系统可识别出“u”是一个元音,属于第二个音节,连续显示的“o”也是一个元音,属于第二个音节(英文元音“uo”在连续出现在中文拼音中)。系统可将“zhongguo”的音节分成“zhong”和“guo”,因为“o”后面再没有字符,然后识别“zhongguo”的基于音节起始码为“43”。当然,系统根据对应语言的音节分离规则自动分离一个特定单词或短语的音节的方法还可以适用于其他语言。
17.从没有特殊符号的单词或短语中选择目标单词或短语元音上没有附着音调符号时,“beijing”对应“北京”和“背景”,这时,可以通过重复键击预定的按键来选择目标单词或短语,或者由用户从列表中选择该目标单词或短语。
同样,一种语言(包括中文)中,当只输入单词的基本元音而没有音调符号或词缀时,系统通过感应预定按键的重复键击来识别目标字符或短语。或者,系统搜索索引并提供给用户一个包含对应带词缀的单词或短语的列表,然后通过检测用户对列表的选择来识别目标单词或短语。
这种方法在类似越南语中有很多衍生字符和音调的情况下非常有用。但是,系统必须保持索引中含有带词缀的单词或短语。同样,含有带词缀的单词或短语的索引需要通过用户的输入来创建。例如,当输入单词“^+abc”(“^”附着在“a”上)时,系统存入“^+abc”(系统存储对应“abc”的“abc”和“^+abc”两者)。输入“abc”然后键入一个预定按键时,系统提供给用户“^+abc”,或者系统提供给用户包含有“abc”和“^+abc”以及其他对应“abc”的单词的列表。若“abc”就是目标单词,则用户无需键入预定按键,或从提供的列表中选择“abc”。该列表可在任何时间提供给用户,例如一个单词输入结束后或者单词输入期间。
18.部分通过完全输入法和部分通过快捷输入法输入单词或短语的并行输入法从索引中输入对应输入单词(控制线输入)的单词并让用户选择目标单词的方法已得到广泛使用。例如,微软的视窗系统具有“自动完成”功能。当然,即使是全码输入时(以全码进行输入),也从存储在索引(例如,并行输入的索引)中的各音节(单词或短语)中输出对应的音节(单词或短语),然后由用户选择目标单词或短语。
以下将基于图4-5到图4-8中的输入系统进行描述。例如,假设单词如 和 存储在索引中,如果输入 系统将以合适的形式输出对应 的单词(即,以 开头的单词如 类似手机的环境下,输入值产生的内容显示在输入行上(图13-1中LCD的上端),从索引中输出的单词或短语以表格或类似形式显示在LCD的底端。用户可通过移动键(即浏览键)选择、确认并输入目标单词。例如,图13-1示出了手机的LCD,图13-1所示为在LCD底端输出与根据完全输入形成的音节对应的单词的例子。
为了输入 先键入 然后通过快捷输入法(使用基于音节起始值简码快捷输入)输入剩下的音节。也即键入 5723”。此时,第一音节为 且余下音节的起始值为 的目标单词(即 提供给用户。
朝鲜语中有一般的音节具有第一辅音,而剩下的音节没有第一辅音。 中,如果连续输入“1*05723”,其对应 这时,系统可识别一般的完全输入 在键入“2”时,系统识别到该输入值的一部分不能构成正常的朝鲜语音节,从而识别出以快捷输入法输入的余下部分(如, 上述内容也属于在先申请文件中介绍的“并行输入法(基于FIM的并行输入法)”的范畴。以全码识别的音节(如 自然是识别为全码,而余下的输入值(如 识别为简码。
这时,将从索引中搜索出包含有从输入值形成的音节的对应单词(例如,如果 存储在索引中)提供给用户,将对应简码输入值的单词(例如,如果 存储在索引中)提供给用户,或将上述单词均输出。如果上述两种情况下搜索的单词均被输出,则根据确定规则(如,根据部分由全码识别的单词的优先顺序、单词的优先顺序或属于特定组的单词的优先顺序)将一具体单词显示在LCD的上端。由于单词可通过各种方式显示在LCD上,因而最好由用户设定输出顺序。
输入从两种情况搜数出的单词时,当对应 的 和 输出在LCD的底端时,如果用户选择 对应 的所有所有单词都改为 或者如果用户选择 对应 的 改为 如果仅有 存储在索引中,则不能输出对应输入值“1*05723”的 因此,系统可同时将“1*05723”分析成 和 并参考索引输出目标单词(提供给用户)。将 解释为 时,如果作为快捷输入起始的 前面的音节到最后一个辅音截止,则该音节只能是前面辅音(即 最后一个辅音作为单个辅音放在 和 之间。看起来可能很复杂,但是具有基本的朝鲜语结构知识的人都很容易理解。上述方法也适用最后辅音是双辅音的情况。图13-2所示为按照“指定优先输出的特定组内的单词、部分以全码分析的单词、不包含全码分析部分的单词等等”的优先输出顺序输出候选单词的例子。此时,“”属于指定优先输出的组中,因此被输出到最上端。
如果用户想仅解释 键入 后,执行决定音节的指定操作后(例如,一预定时间段内没有输入,或者键击[>]键一次),键入“5723”仅解释为 并且只搜索该对应的单词。同时,该例子中,对应包括有之前已识别的音节 的 的单词(如 可被输出,对应除 外的 的单词(如 若其存储在索引中)也可被输出,或者上述的所有单词均被输出,如图13-3所示。
此处,音节可通过键击用于判定音节的[>]键一次来确定。此外,[>]键可用作空格键,因此确定音节后,[>]键可用来输入空格。也就是说,如果用户输入 后键击[>]键一次,音节 被确定,如果再次键击[>]键,形成 +空格)。亦即,键入“10*>5723”时,系统将其识别为 然后提供给用户对应的单词 当然,如果系统参考图13-3中的索引,则即使只键入“10*>57”系统都能输出 这种并行输入法中,包括全码形成的音节的音节输出方法对于在完全输入期间提供候选单词时从候选单词列表中决定目标单词来说是非常有用的。此外,仅对应通过快捷输入处理的输入值(即,将输入值处理为简码)的候选音节输出方法对于以快捷输入法快速输入常用的后缀或词缀来说是非常有用的。例如,输入 后,(通过预定工具确定输入内容后)输入 以输出 (假设其存储在索引中)。如前所述,常用后缀如 存储在索引中的特定组中(例如后缀组),然后,通过并行输入输出候选单词时,首先输出对应该组的单词。如果 和 均存储在索引中,输入 时, 和 均被列为候选单词。
再例如,输入 时,系统识别 为完全输入值,而“38”因其不是正确的音节而被识别为快捷输入值。同样,如果只有 存储在索引中,则输出 相反,如果只有 存储在索引中,仅输出 如果 和 均存储在索引中,则都被输出。但是,根据规则(包括/不包括识别为全码的部分)最好只输出一个单词。此外,输入 时,如果以完全输入法输入 后连续键入 系统识别其为 因此,如果用户想在以完全输入法输出 后以快捷输入法输入 时,用户输入 并确认该输入音节 后(例如,键击[>]键一次结束该音节),可输入 此时,即使 与索引中其他对应 的单词(如 相比优先顺序很低,如果 存储在索引中,则系统可以先于其他与输入值“5*025*0>38”相关的候选单词(如 输出 此外,在用户以快捷输入法输入某些音节如 且以完全输入法输入某些音节时,系统可将其识别为 当输入“157=c”时,系统解释简码“157”(例如,基于音节起始值简码或基于单词简码),然后搜索每个音节对应 的单词。输入“*6”时,系统识别“1 且 亦即,系统将之前输入的“15”识别为快捷输入值,如果再次输入“23”,因其不是正确的音节,系统将其识别为快捷输入值。该例子中,系统还识别 为部分全码以及部分快捷码,从而提供 给用户。
如上所述,一个中文音节由“声母+韵母”构成。此外,在基于中文拼音系统的中文发音表示法中,声母是罗马字母辅音,韵母是罗马字母元音或“元音+n”或“元音+ng”。亦即,拼音表示的中文字音节的形式有“辅音+元音”、“辅音+元音+n”或“辅音+元音+ng”。拼音系统中很少有音节以元音“a”、“e”或“o”开始。这样,如前所述,可以位于拼音系统中一个音节的尾端的罗马字母辅音只有“n”和“ng”,其即相当于朝鲜语中的最后辅音。即,一个音节的最后辅音只能是“n”和“ng”。
例如,如果“中华”、“民国”、“中华民国”等存储在一个拼音系统中,以完全输入法通过罗马字系统输入“中华(zhonghua=49***7739##*,如图10-6)”,以快捷输入法(使用基于音节起始值简码作为快捷输入值)通过键入“mg=73(如图10-6)”输入“民国(minguo)”。为了输入“中华”,用户键入对应的拼音(“zhonghua=49***7739##*”),从列出的候选中文字中选择并确认一个,然后输入“mg=73”。可选择地,用户输入“zhonghua=49***7739##*”,接着输入“mg=73”。前一种情况下,自然系统仅输出对应“73=mg”的候选字符“民国(minguo)”、“民歌(minge)”…。后一种情况下,系统识别输入值“49***7739##*”为“中华”,并输出对应识别为快捷输入值的“73”的“民国”和“中华民国”。输入相对于“49***7739##*73=zhonghua+mg”的“49***7739##*7”时,系统将最后的数字“7”识别为以普通完全输入法输入的拼音声母,但是当键入最后数字“3”时,系统将最后输入值“73”识别为快捷值。朝鲜语的输入与之相同。因此,系统可以输出包括有对应全码输入值“49***7739##*”的“中华”和对应快捷输入值“73”的“民国”的“中华民国”,如图13-4所示。
相反,当用户以快捷输入法输入相对于“中华”的“zh=49”,并在未从候选字中选择并输入“中华”的情况下接着以完全输入法输入相对于“民国”的“7#773##***”时,系统可输出对应“z_h_minguo”的“中华民国”。同样,当用户键入“73##***”以输入“民国(minguo)”时,系统可识别“73##***=mguo=m_guo”然后输出“民国”。输入“73”时,系统将其识别为快捷输入值,并搜索对应“m_g_”的字,然后识别“##***=uo”为形成第二个音节的元音。在“mg”后输入“uo”使对应“m_g_”的候选字限定为“民国”。
用户在以另一种方式输入“中华”(各种中文输入方式中的一种,如快捷输入、完全输入、通过键击中文字符输入等等)后再以快捷输入法输入相对于“民国”的“73”时,如果系统仅仅将输入值“73”识别为简码而输出对应“m_g_”的字,系统将输出多个候选字的列表(例如,“民国(minguo)”、“民歌(minge)”…)。但是,如果“中华民国”存储在索引中,系统可识别“中华+mg=中华+73”为“中华民国”而不考虑在索引中存储“民国”。此例中,由于中文中先输入“中华”,系统可先于其他候选字(例如“民歌(minge)”…)输出对应输入值“mg=73”的“民国”。
此例中,输入“zhong…”时,系统将其识别为“zho”+“n_g_”或“zhon”+“g_”。但是,由于以“zho”或“zhon”开始的音节实际上在中文字典中没有(因此自然不包含在拼音索引中),系统参考索引将其识别为相对于“zhong…”的“中”。如果他们包含在索引中,输入“zhong”时,系统可按照预定输出顺序输出候选字。图10-6中,系统可将“zhongg…=49***7733”识别为“zhonk..”=“zho”+“n_k_”或“zhon”+“k_”。如上所述,这与同时以全码和快捷输入值(简码)处理输入值的并行输入法相似。
如上所述是使用“基于音节起始值简码”作为快捷输入值(即简码)的例子。如果采用“基于音节起始码”作为快捷输入值(即简码),图11-3到图11-10中所示的例子也可用于简码识别。
19.利用长按键的字符输入法和控制处理方法一般来说,可通过键击一个按键一次来表示一个对象(例如,字母、数字、母语非英文的语言中的英文字母、字符(特殊字符)、功能、特定目的的控制,又称作“字母及其他”(alphabet etc.))。用户可以通过长按特定键一次来输入不同于键击一次输入的对象的另一对象。下文中,长时间按下特定键称为“长按”或“长击”。下文中,当未提到“长按”时,表示正常的键击按键,称为“短击”。下文中,将以英文为例描述一般的情况,并将对每一种语言进行解释以描述每种语言适用的情况。很明显,以一种语言为例解释的问题可以相同的方式适用于其他各种语言。
19.1英文(以及其他语言)19.1.1使用长按的字母输入目前使用的输入对应数字的方法是长按特定数字键。但是这种方法不仅仅适用于数值的输入。例如,假设如图1-1所示按一次每个数字键表示输入分配给该按键的字符中的第一字符(例如,键击[2]键一次输入“A”),长按该键则表示输入分配给该同一按键的字符中的第二字符(例如,“B”)。但是,输入常用字符时最好不要采用长按按键的方式,因为这会破坏自然地输入流程。因此,最好对不常使用的“字母及其他”应用长按键输入。此外,最好可由用户根据用户的输入速度设定长按按键的时间。
本发明中适当地使用了长按键的输入方式,因此,本发明能简化具体输入方法的输入规则,扩大表示范围,消除歧义。为方便起见,长按[2]键表示为“2~”,在“2”的后面附加一个“~”。如上所述,采用现有的重复选择方法时,如图1-1中键击[2]键三次时会出现歧义,因为不能识别“222”是否表示“C”、“AAA”、“AB”或“BA”。
例如,图1-1中,定义“A”通过长按或按一次[2]键来输入,“B”通过在输入“A”后按一次该相同按键来输入,“C”通过“B”输入后按一次该相同的按键来输入。如果连接输入分配给相同按键的字符,当输入第二字符后的字符时,可通过长按该按键来输入而不会出现歧义。例如,输入“DACB”时,可键入“322~222~2”而不会出现歧义。当分配给同一个按键的A、C和B连续输入时,不会出现歧义,因为“C”和“B”通过长按该键来输入。这种输入方法与现有的重复选择方法类似,当连续输入分配给同一按键的字符时可通过长按键方式消除歧义。当然,“DACB=322~222~2”时,也可以通过长按[2]键来输入“A”(即“2~”)。
上述例子中,分配给特定按键(既包括明确指定也包括暗示指定)的字符中的一个(例如“A”)称为代表字符,余下的字符(例如“B”、“C”)称为连续字符(succession characters)。连续字符通过键击对应的按键几次来输入。也即,如果分配给一个按键的字符的顺序是“A(代表字符)-B(第二连续字符-C(第三连续字符)”,系统识别“A=2~”,“B=A+2=2~2”,“C=B+2=A+2+2=2~22”。此外,如果分配给同一按键的字符并非连续输入时,“A”不仅可通过长按键的方式输入,还可以通过普通的键击(短击)按键输入,也就是说,代表字符可像现有的重复选择方法中一样通过按一次对应键(即,短击)来输入。下文中,为方便起见,该方法称为“利用长按代表字符的重复选择法”。
两个字符仅通过一个按键输入时,其中的一个字符通过正常的按一次该键按(即,短击)来输入,另一个字符通过长按该按键(即,长按)来输入(例如,图10-1中,“B=1”,“P=1~”)。但是,如图1-1所示,三个字符分配给一个按键时(例如[2]键)(包括明确指定和暗示指定),如果第一个字符通过键击该键一次来输入(例如,“A=2”),第二个字符通过长按该键来输入(例如,“B=2~”),而第三个字符通过键击该键两次来输入(例如,“C=22”)或者通过长按后再键击一次该键来输入(例如,“C=2~2”),输入第三个字符时还是会出现歧义。原因是如果定义“C=22”,其可被识别为“AA”,如果定义“C=2~2”,其可被识别为“BA”。这一例子中,第一、第二和第三字符可任意选择。此外,上述方法相较传统的简单重复选择法能明显减少歧义。
使用长按键的重复选择法具有以下几个优点字符可无歧义的输入,分配给同一按键的字母、数字、字符可有效的输入。例如,假设特定字符“A1、A2、A3、…”分配给一个按键[X](包括明确指定和暗示指定),一个特定的数字“N1”也分配给按键[X],特定字符“S1、S2、S3、…”也分配给按键[X],则分配给按键[X]的字符可通过长按按键的方式输入。例如,字符“A1”被指定被代表字符,通过长按按键[X]来输入。“A1、A2、A3、N1、S1、S2、S3”的输入如图14-3所示。图14-3中,通过“xx~xxxx”或“x~x~xxxx”输入“A1S1”。此例中,对于英文并非母语的语言中,还可以加入英文字符“E1、E2、E3、…”并指定给同一个按键。
此外,输入分配给按键[X]的对象时(例如,A1、A2、A3、N1、S1、S2、S3),可不通过使用长按代表字符的重复选择法来输入分配给该按键的数字和字符(特殊字符),而使用现有的重复选择法。但是,必须采用“预定时间延迟”或者一个对象输入后键入一个分开键(例如,“并行输入法中介绍的键击[>]键一次”)来避免歧义,因为连续输入分配给同一按键的对象时会产生歧义。例如,A1、A2、A3、N1、S1、S2、S3均分配给按键[X],通过重复选择法输入“S1A1”时,可键入“xxxxx>x”。这样处理是为了避免使用重复选择法时出现歧义,但与现有重复选择法的区别在于特定字符、数字、字符分配给同一按键并通过键击该按键来输入。
母语字符“A1、A2、A3”分配给按键[X]时,系统识别“x=A”、“xx=B”、“xxx=C”,或者如果键击该按键的次数超出定义的最大次数时(例如,[X]键被键击四次),系统根据循环反复方法识别“xxxx=A”以及“xxxxx=B”。当用户在使用重复选择法时按错按键[X]的次数时,该循环反复方法可允许通过重复键击[X]键来输入目标字符。但是,如申请人所介绍的,当用户使用删除键仅删除“最后(或最近)输入值”而不是整个音节时,不需要用到循环反复方法。也即,当用户想要输入“xx=B”但是键入“xxx=C”时,用户可键击一次删除键来输入“B”,而不用再额外地键入“xx”来输入“B”。
图14-4所示为短击一个特定按键后通过长按该键输入字符的处理过程示意图。图14-4中,A1、A2、A3、…所在行所示是使用现有重复选择法的输入过程。B2在通过短击特定键输入A1后通过长按该相同键(例如,[X]键)来输入。也即,“A1”通过“x”输入,“B2”通过“xx~”输入。此处,如果特定字符的输入未定义为长按[X]键,并且假设只有A1和B2使用[X]键来输入,则不会出现歧义。即使长按[X]键被定义为输入一个特定字符(例如,字符“E1”),如果不同时使用“A1”和“E1”(即不连续出现),使用语言限制(A1和E2不同时使用的语言限制)后A1、B2和E1可无歧义的输入。
图14-4中,如果长按[X]键为定义为输入特定字符,A1、B2和C3能被无歧义的识别。此外,A1、A2和D3中,“A1=x”和“A2=xx=A1A1”之间会产生混淆,但是如果在具体语言中A1不连续使用,A1、A2和D3在使用语言限制(A1不连续使用的语言限制)的情况下可无歧义的输入。为方便起见,图14-4中所示的方法称为“短击后长按的重复选择法”。例如,如图10-6中,通过“#”输入“i”,通过“#~”输入“u”,则可通过“##~”输入一个元音(例如,“..u”-字符“u”带上标“..”)而不会出现歧义(中文拼音中“i”和“u”不会连续使用)。当然,由于“i”不会连续使用,可通过“##”输入其他对象。该方法也同样适应于其他语言。图14-4中,可采用该方法输入A1、A2和A3行的下一个字符(例如,S1、S2、S3、…)。
19.1.2使用长按键的控制处理方法以下将介绍控制的选择方法的一个示例。在例子中,假设控制设置为在输入代表字符之后选择。上述的例子中,“A”可通过短击[2]键或者长按[2]键来输入,即“A”的输入与现有的重复选择法类似。但是,一个特定对象可通过键击特定按键一次来输入,而另一个对象可通过长按同一按键来输入。例如,一个特定对象(例如,字符x-“x”不是真的指“x”而是任何字符)可通过键击特定按键(例如[1]键)一次来输入,而另一个对象(例如,任何一个字符“y”)可通过长按同一按键来输入。也即,“字符x”通过“1”输入,“字符y”通过“1~”输入。此处,由于“字符x”和“字符y”是任意的,即使由“长按代表字符的重复选择法”定义“A=2~”或“A=2”,通过正常键击按键输入(即,短击)的“A”对应“字符x”,而通过长按按键输入的“A”对应“字符y”。
以上方法可用于以同样的方式进行控制选择。例如,一个特定对象(例如,“控制a1”)可通过键击特定按键(例如,作为控制键的[*]键)一次来输入,而另一个对象(例如,“控制b1”)可通过长按同一按键来输入。“控制a2”、“控制a3”、…可通过重复键击控制键来选择。此时,“控制b1”通过长按控制键选择后,通过重复键击该控制键而不是长按该控制键来选择控制b2”、“控制b3”、“控制b4”、…是很重要的,这时不会出现歧义。更详细的解释,请参考前面描述的代表字符“A”通过长按按键输入而后面的字符通过短击按键输入的例子。
为方便起见,通过特定按键(例如,[1]键)和“控制b1”的结合输入的对象称为“B1”,其输入如下“A1=x+{control a1}=1*”,“A2=x+{control a2}=1**”,“A3=x+{control a3}=1***”,…,“B1=x+{control b1}=1*~”,“B2=x+{control b2}=1*~*”,“B3=x+{control b3}=1*~**”,…当然,可通过分别长按一次、两次、三次来选择控制b1、控制b2和控制b3。但是,一般来说频繁使用长按按键不是很好。在B1、B2、B3、…的例子中,为方便起见,通过一次长按控制键后正常键击该按键的输入称为“长按后重复键击”,该控制处理方法称为“长按后重复键击的控制处理方法”。群组A1、A2、…表示本申请提出的“现有的控制处理方法”,群组B1、B2、…表示“长按后重复键击的控制处理方法”。图14-1为上述方法的处理过程示意图。以上是在长按输入代表字符的重复选择法中仅对第一控制选择应用长按的例子。此外,如图14-2所示,通过长按按键还可以提供各种扩展(例如,C组和D组)。
当然,通过长按其他按键(例如,上述例子中的[1]键)而不是该控制键也可以输入另一个对象(例如,上述例子中的字符“y”)。此外,由于通过长按重复选择法可无歧义的识别袖珍键盘上每个按键分配的字符(图1-1中,三个字符)(例如,“A=2~”、“B=2~2”、“C=2~22”),三个字符中的一个字符通过操作一个数字键进行选择后,其他组中的其他字符可在重复键击或长按该控制键后通过重复键击方法输入。也即,图1-1中,特定组(如组1)中的字符(包括字符、数字、母语、英文字母等)可在输入“A”后通过重复键击控制键来输入,然后其他特定组(如组2)中的另一个字符可通过“长按后重复键击”来输入。同样,组3的一个字符可通过“B”输入和重复键击控制键的结合来输入,组4的一个字符可通过长按后重复键击来输入。图1-1中,任何组中的字符还可以通过控制键的重复键击来输入,或者根据显示在袖珍键盘按键上的三个字符和定义的规则(例如,“2~222”)通过长按后重复键击来输入。
朝鲜语输入(图4-5到图4-8)和日语输入(图2-1和图2-2)的例子中,长按后重复键击的控制处理方法对于间断使用(不频繁使用)的数字和英文字符(英文非母语的语言中)的输入非常有用。下文中,仅简单介绍语言的应用,但其适用于其他各种语言。
19.2朝鲜语图4-5到图4-8中,上述方法同样适用于通过重复键击基本辅音对应的按键输入衍生字符(例如,送气辅音、紧辅音以及与元音一起分配的辅音)的情况(例如, 或 也即,连续使用分配给同一个按键的字符时,第二字符后的字符通过长按该键来输入。例如,图4-5中,如果连续键击[1]键定义为 连续使用 不会被识别为 而是 这时,如果第二个 通过长按输入,则可识别为 也即, 中第二个音节的 通过长按对应键来输入。同样, 中第二个音节的 也通过长按对应键来输入,即 该例子中,可用输入衍生字符的控制处理方法代替该方法(可采用两种方法中的一种或者两种方法都采用)。
除代表字符外的另一个字符,例如送气辅音或者紧辅音,可以通过长按的方式输入。如果通过长按输入送气辅音,则紧辅音通过基本辅音的结合来输入。当然,如在先申请文件中所述,输入 时会出现歧义,因其会被识别为 是 的最后辅音)。
同样,可采用长按的方法输入与元音一起分配的辅音(例如图4-5和图4-6中分配给按键[o]的 也即, 通过“0~”输入。基于在先申请文件中介绍过的图4-5, 或 或 (在先申请文件中介绍的具体示例中)比使用长按输入更有效。与元音一起分配的辅音的输入方法以及使用长按的输入方法都是可选择采用的。
以下将介绍使用“长按后重复键击的控制处理方法”的例子。http//www.Simplecode.net以及附带的模拟程序中介绍了本发明的发明人的一个典型朝鲜语输入系统(在该主页中还介绍了老式朝鲜语字符的输入以及并行输入技术),其还介绍了无需模式转换而实现的数字和英文字母的输入。
按照使用频率的一般顺序,输入通过“母语字母—各种特定字符(即各种符号)—数字—英文字母”的顺序执行。如图4-5所示,没有用于输入数字和英文的控制键。此时,数字可通过数字键和长按[*]键的结合来输入(即“*~=1*~”)。也即,数字“1”通过“1*~”来输入。[*]键首先是一个元音键,同时也可以用作控制键。如果键击[*]键一次,显示元音 如果长按[*]键一次,则显示某一对象(上述例子中的“数字控制”)。
英文字母可通过各种方法输入。例如,“A”可通过“2#~”输入,“B”可通过“2#~#”输入,“C”可通过“2#~##”输入。“2#~#”不会被识别为“A”和元音 (即 而是“B”。这是因为朝鲜语中没有音节以元音 开头(即朝鲜语限制)。如果长按以及重复键击[*]键用于其他目的,则英文字母可视为数字的连续字符,因此,可给出各种定义如“A=2*~*”或“A=2*~#(采用交叉控制处理方法)”、“B=2*~**”或“B=2*~##”。
以下将介绍另一个长按控制处理方法的例子。图4-5到图4-8中,如果元音“”或“”通过重复键击分配有元音“-”的按键来输入(即“-=*”、“=**”、“=***”),则为了输入一个字符最多需要连续键击[*]键三次。这种情况下,送气辅音控制可通过“最大可能重复次数+1”次的键击来选择。也即,通过键入“1****”来输入 。这种情况下,为了按键键击次数,送气辅音控制定义为“*~”,因此,可定义 上述方法也可同样适用于视为衍生字符的紧辅音以及与元音分配在一起的辅音的输入。
此外,控制处理方法中,其可应用于各种通过重复选择法选择送气辅音控制的情况。此外,可选择地,衍生字符可通过长按对应键和/或重复键击对应键来输入。数字可使用其他按键(例如[#]键)输入。
19.3日语如图2.1和图2-2所示,输入日语时会键入多个连续字符,而对于使用重复选择法输入连续字符来说本系统非常有用。也即,可定义“あ=1”或“あ=1~”、“い=1~1”、“う=1~11”、“え=1~111”以及“お=1~1111”。如上所述,如果连续使用分配给同一按键的字符,即使仅有其中的第二个字符通过长按来输入(即“1~”),余下的字符通过一次键击简单输入,也不会出现歧义。但是,图2-1和图2-2中,采用连续(字符)控制处理方法后输入日文单词时可键击按键较少次数而不会出现歧义,也可以将连续(字符)控制处理方法与长按代表字符的重复选择法一起使用。
图2.1和图2-2所示为使用长按连续(字符)控制处理方法而不是长按代表字符的重复选择法输入衍生字符(即变形字符或连续字符)的例子。图2-2中通过控制处理方法输入连续字符时,以及图2-3中输入代表字符(如“は”)的衍生字符(如“ば”、“は”)时,按键键击次数太多,输入不自然。这种情况下,代表字符的衍生字符(如“は”)可定义为通过长按对应键(图2-2中的[6]键)来输入,剩下的衍生字符可定义为“ぱ=ば+预定控制键(如[*]键)=6~*”。
此时,如果不使用长按该字符所分配的按键来输入衍生字符,则既可使用孔按代表字符的重复选择法也可使用利用控制处理法的连续字符输入法。该衍生字符(如“ば”、“ぱ”)可通过长按任何控制键(如[*]键)以及代表字符“は”的结合来输入。也即,可定义“ば(任何衍生字符)=は+*~=6*~”,“ぱ(另一个衍生字符)=は+*~*=6*~*”。即使“ば”有多个衍生字符,也可以使用长按后重复键击方法无歧义的输入该衍生字符,如“6*~**”、“6*~***”等等。这是因为由于“*”和“*~”指示不同的对象,“**”和“*~*”也指示不同的对象(在此指不同的控制)。
此时重要的是,任何控制都可以通过长按按键来选择,并且可通过重复键击使用的按键(如控制键)或长按一次该按键后再长按该按键来无歧义的指示不同的对象(如,不同的控制)。
同样,朝鲜语输入中提到的数字和英文字母输入也适用于此。例如,可定义“数字2=2#~”,“A=2#~#”,“B=2#~##”、…19.4中文图10-1到图10-6示出了袖珍键盘上中文拼音的输入而没有歧义(或很少出现歧义)。但是,通过“11”输入由“b_b_”(下划线部分为包含元音的拼音音节)组成的单词的快捷输入“bb”时,如果应用“b”不连续使用的中文限制,“11”将被识别为“p”。这种情况下,如上所述,通过“1”输入“b”后,通过一预定时间延迟或者一特定操作(如键击[>]键)将输入值“1”确定为“b”,然后“b”被输入。连续输入分配给同一按键的字符时会出现多义性的问题。这一问题可通过采用长按代表字符控制处理方法([1]键的代表字符“b”通过“1~”输入)予以解决。例如,连续使用字符“b”输入“bb”时,可通过长按同一按键输入第二个字符,即,可通过“1~1~”或“11~”输入“bb”。
以下将介绍数字和字符的输入,如图10-6所示。由于在中文模式下输入英文字母后无需转换便可以输入英文,因此在此不对英文的输入进行介绍。图10-6中,可定义“数字1=1*~”。图10-6中,键击[*]键一次识别为“a”,“*~”(长按)指示不同的对象(该例中为“数字控制”)。图10-6中,最好该使用长按的控制处理方法和[#]键的重复键击能适用于各种字符的输入。例如,圆点(.)、逗号(,)、冒号()和分号(;)对应[2]键,可定义“圆点(.)==2#~”,“逗号(,)=2#~#”,“冒号()=2#~##”,“分号(;)=2#~###”。“2#~#”不会识别为“圆点(.)+i”而是“逗号(,)”,因为中文限制中单词的拼音不会以“i”开头(类似朝鲜语输入的例子)。同样,“2#~##”也不会识别为“圆点(.)+i+i”或“逗号(,)+i”而是“冒号()”。如果用户想要输入“圆点(.)+i”,则在输入“2#~”后一预定的时间延迟后或者进行一特定操作后(如键入[>]键),用户可确认“圆点(.)”然后键击“#”输入“i”。
图10-6中,输入某一特定组的字符时未使用[*]键。原因是采用“长按后重复键击”可能会出现歧义,因为中文中没有拼音以“a”、“e”或“o”开头。另外的原因是由于一个按键只分配有一个数字,可通过长按[*]键一次来输入数字。图10-1到图10-5中,由于没有拼音以分配给[*]键和[#]键的“i”和“u”开头,因而总是可以通过控制处理方法使用长按后重复键击[*]键和[#]键来输入数字和字符。
很明显,上述的方法不仅适用于图10-1到图10-6中所示的袖珍键盘,还适用于其他各种袖珍键盘。
19.5使用罗马字符的语言使用罗马字符的欧洲语言包括有大量的在基本字符上附加附标的衍生字符。输入使用罗马字符的欧洲语言时,可采用上述的各种长按方法输入衍生字符和特殊字符。
发明效果本发明能使用索引并采用完全输入法(FIM)能有效的输入目标单词或短语。此外,本发明公开了有效应用(语言限制)并行输入法(CIM)的实施例。
此外,本发明提出了一种通过结合长按特定按键和重复键击特定按键输入各种字符或通过结合长按特定按键和重复键击控制键输入各种字符的输入系统。
权利要求
1.一种从袖珍键盘输入字符的方法,所述袖珍键盘具有多个至少分配有一个或多个字符的按键,所述方法包括如下步骤(a)识别字母字符所分配的按键的选择;(b)按照完全输入法(FIM)比较输入值与系统的索引内存储的全码;(c)识别所述输入值对应所述索引内全码的单词或短语为目标单词或短语。
2.根据权利要求1所述的输入字符的方法,其中所述步骤(b)包括确认所述索引中没有对应所述输入值的全码时将所述输入值处理为简码的步骤。
3.一种从袖珍键盘输入字符的方法,所述方法包括考虑并处理一输入值为指定类型的代码(全码或简码)的步骤。
4.一种从袖珍键盘输入字符的方法,所述方法包括如下步骤(a)识别不包括控制键的按键的重复选择;(b)将一输入值视为全码进行处理,同时确定由所述输入值生成的单词是否存在于包含有仅由代表字符组成的所有单词的一索引中,或者是否存在于包括所述索引的一个索引中;(c)步骤(b)中,当识别到由所述输入值生成的单词不存在于所述索引中时,处理所述输入值为简码。
5.一种从袖珍键盘输入字符的方法,所述方法包括如下步骤(a)通过并行输入法(CIM)处理一输入值,同时处理所述输入值的一部分为预定的全码;(b)当由所述全码生成的字符不构成特定单词的有效音节时,处理识别为全码的所述输入值后面的输入值的一部分为简码。
6.根据权利要求5所述的从袖珍键盘输入字符的方法,其中所述步骤(b)包括分离除由输入全码生成的音节的最后辅音外的音节,并将用于输入所述最后辅音的输入值以及在所述最后辅音后输入的视为简码的输入值均处理为简码的步骤。
7.一种从袖珍键盘输入字符的方法,所述方法包括根据重复键击分配有多个字符的按键识别字符,并依据长按所述按键以及长按后重复键击所述按键的预定顺序识别所述字符的步骤。
8.根据权利要求7所述的从袖珍键盘输入字符的方法,进一步包括通过短击或长按所述按键识别分配给所述按键的代表字符,并在连续输入分配给所述同一按键的字符时,通过长按所述按键输入第二连续字符和其他连续字符的步骤。
9.一种从袖珍键盘输入字符的方法,所述方法包括通过将输入特定字符的按键的输入值与长按一特定控制键相结合识别一指定字符的步骤。
10.根据权利要求9所述的从袖珍键盘输入字符的方法,进一步包括通过将长按所述控制键与正常短击所述控制键相结合识别一预定字符的步骤。
11.一种从袖珍键盘输入字符的方法,所述方法包括通过将正常短击一特定键与长按所述功能键相结合识别一预定字符的步骤。
12.一种从袖珍键盘输入中文字的方法,所述方法包括如下步骤(a)识别中文拼音中一声母的输入(ch、sh或zh);(b)处理所述声母对应所述两个辅音的一简码(快捷输入值)。
13.一种从袖珍键盘输入字符的方法,所述方法包括如下步骤(a)解释一输入值为一预定全码;(b)如果有多个可用字符组合,将可用字符组合与系统的一索引内(所有的单词均存储在所述索引内)存储的单词进行比较,排除不可能的字符组合;(c)通过步骤(b)中未排除的可用字符组合解释目标单词或短语。
14.根据权利要求9所述的从袖珍键盘输入字符的方法,进一步包括如果一特定控制键是元音键且一特定单词不以元音开头时,通过将长按所述特定控制键与正常短击所述控制键相结合识别所述字符(包括数字和特殊字符)的步骤。
全文摘要
本发明使用索引并采用完全输入法(FIM)能有效的输入目标单词或短语。而且本发明公开了一个有效应用(语言限制)并行输入法(CIM)的实施例。此外,本发明提出了一种通过结合长按特定按键和重复键击特定按键输入各种字符或通过结合长按特定按键和重复键击控制键输入各种字符的输入系统。
文档编号H04B1/40GK1759593SQ200480006532
公开日2006年4月12日 申请日期2004年1月24日 优先权日2003年1月22日
发明者金旻谦 申请人:金旻谦
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1