一种汉字输入法的制作方法

文档序号:23313997发布日期:2020-12-15 11:46阅读:229来源:国知局
一种汉字输入法的制作方法

本发明涉及一种汉字输入法,更具体地,涉及一种用于计算器系统的汉字输入法以及其相关的汉字编码方法。



背景技术:

中文计算机普及已经超过四分之一个世纪,而坊间上亦流传着各种不同的中文输入法,林林总总,多不胜数。例如,有些中文输入法基于手写,其辨识率一般较低,并未能用作快速的输入。有些输入法则基于汉字拼音,但碍于语言中有大量同音字,选字的步骤也会减慢输入的速度。



技术实现要素:

因此,本发明的实施例提供了一种新的汉字输入法以克服上述的技术问题。

在一个方面,本发明提供了一种汉字编码的方法,包括以下步骤:将需要输入的汉字或词语,基于分解规则分拆成一个或多个字体部分,其中每个所述字体部分包括:至少包含一个基本字形;以及基于选码规则,就每个所述字体部分,根据其包含的所述基本字形,各选取一个对应字码来代表;以及基于编码规则,将所选取的对应字码组合成字码组合以代表所述需要输入的汉字或词语。其中,所述字体部分包括:基于所述分解规则规定无需分拆或不能分拆的所述需要输入的汉字或所述需要输入的词语中的个别汉字;其中,所述词语包括:分别由两个或多个汉字组合而成。

优选地,所述基本字形包括:被规定为字体中的最小单元,其不能被分解,并被设定成与其他基本字形组合成所有汉字。

优选地,所述基本字形包括:按字形结构分为九种类形,包括以边数来定义的四边字形、三边字形、两边字形和一边字形;以笔数来定义的一笔字形、两笔字形、三笔字形和四笔字形以及相交字形。

优选地,所述四边字形包括:大致呈方形的「口」字形。

优选地,所述三边字形包括:「口」字形的四个边之中缺失任意一边的字形。

优选地,所述两边字形包括:三边字形再缺失其中一边的字形;包括大致具有方形或菱形中其中一角的字形、具有锐角的字形或具有钩形的字形;其中所述方形角、菱形角、锐角、钩形角代表所述两边字形的附加描述。

优选地,所述一笔字形、两笔字形、三笔字形、四笔字形包括:具有一至四笔互不相交、笔顺相连,以及全都不与其他笔画相交或全都与其他一个或多个笔画相交的横、直、斜和/或点的笔画;其中所述横、直、斜、点代表所述一至四笔字形的所述附加描述;其中所述一笔字形中的一横、一直、一斜相等于所述一边字形。

优选地,所述相交字形包括:只含两线相交的字形。

优选地,所述基本字形还包括:至少一个特殊定义字形。

优选地,所述四边字形包括:当「口」字形的其中一个笔画延伸至「口」字形之外时,所述延伸笔画在所述「口」字形的边缘分开,并分属于所述「口」字形及其他基本字形;其中所述属于「口」字形以外的所述笔画部分,代表所述四边字形的所述附加描述。

优选地,所述两边字形包括:当单一笔画具有多于一个转角位时,所述多角笔画在所述角位分开,并分属于一个两边字形及其他基本字形。

优选地,所述基本字形包括:除所述「口」字形的延伸笔画和多角笔画外,单一笔画不能分属两个或多个基本字形。

优选地,所述基本字形包括:一个所述基本字形或一个有附加描述的所述基本字形,以一个字母特征代表;其中,以不同的字母特征来代表有不同附加描述的同一个基本字形;其中,所述附加描述包括对所述基本字形笔画结构的规定或/和对所述基本字形以外的笔画结构的规定。

优选地,每个所述字母特征包括:被分成十个组别,同组的每个所述字母特征所代表的基本字形具有相同的边数或/和笔数。

优选地,所述每个组别的字母特征包括:包含不多于两种所述基本字形,同一组别中不同的所述字母特征由所述不多于两种的基本字形加上不同的附加描述来构成。

优选地,所述每个组别的字母特征包括:一个或多个同组的所述字母特征以一个所述对应字码代表。

优选地,所述对应字码包括:每个所述字体部分中的每个基本字形,根据代表它的所述字母特征与一个所述对应字码互相对应。

优选地,所述每个组别的字母特征包括:由低至高,以数字1至10来代表所述每个组别中的字母特征的选码优先权级别。

优选地,所述十个选码优先权级别包括:所述每个组别中的字母特征所代表的所述基本字形的边数或/和笔数愈多,其选码优先权级别愈高。

优选地,所述十个选码优先权级别包括:每个所述对应字码根据所代表的所述字母特征与一个所述选码优先权级别互相对应。

优选地,所述选码规则包括:比较所述字体部分中每个基本字形所属的字母特征的选码优先权级别,其中选取级别最高的一个所述字母特征所属的对应字码来代表所述字体部分。

优选地,所述选码规则包括:当所述选码优先权级别最高的字母特征多于一个时,其中选取级别最高,并且所代表的基本字形的书写笔顺较先的一个所述字母特征所属的对应字码来代表所述字体部分。

优选地,所述分解规则包括:按分拆步骤的复杂程度,由简单至复杂,所述分解规则分为:两码模式、一般模式、半元法模式和超半元模式;所述分解规则模式还包括词语模式。

优选地,所述分解规则包括:基于其中一种所述分解规则模式规定的步骤,以及基于所述分解规则的拆字方法将所述需要输入的汉字或词语分拆成一个或多个所述字体部分。

优选地,所述每种分解规则模式包括:当每个所述字体部分包含多于一个基本字形,并且按所述分解规则模式的规定需要被分拆成两个较小的字体部分时,基于所述拆字方法将所述字体部分分拆成两个较小的字体部分;并且重复直至完成所述分解规则模式规定的步骤为止;其中每当规定需要分拆的所述字体部分只得一个基本字形,不能再分解时,略过所述步骤。

优选地,所述两码模式所规定的分拆步骤包括:将需要输入的汉字,基于所述拆字方法分拆成两个字体部分。

优选地,所述一般模式所规定的分拆步骤包括:将需要输入的汉字,基于所述拆字方法分拆成两个字体部分,以及将所得的每一个字体部分,各自基于所述拆字方法进一步分拆成两个较小的字体部分。

优选地,所述半元法模式所规定的分拆步骤包括:将需要输入的汉字,基于所述拆字方法分拆成两个字体部分;以及,当所得的两个字体部分中,有一个为半元字形,同时所述半元字形处于所述需要输入的汉字的规定位置时,将所述半元字形以外的另一个字体部分,基于半元字形以外部分所规定的分拆步骤进一步分拆成不多于三个较小的字体部分。

优选地,所述超半元模式所规定的分拆步骤包括:将需要输入的汉字,基于所述拆字方法分拆成两个字体部分;以及当所得的两个字体部分中,有一个为超半元字形,同时所述超半元字形处于所述需要输入的汉字的规定位置时,将所述超半元字形,基于所述拆字方法进一步分拆成两个较小的字体部分;以及,将所述超半元字形以外的另一个字体部分,基于所述半元字形以外部分所规定的分拆步骤进一步分拆成不多于三个较小的字体部分。

优选地,所述半元字形包括:分别为三十四个汉字字体中最常出现的部首或部首偏旁字形,以及与这些字形相似的字形。

优选地,所述超半元字形包括:在所述半元字形中的十个字形。

优选地,所述半元法模式或超半元模式包括:所述半元字形或超半元字形的规定位置是所述半元字形在汉字字体中最常出现的位置。

优选地,其中所述半元字形以外部分所规定的分拆步骤包括:将所述半元字形或超半元字形以外的另一个字体部分,基于所述拆字方法进一步分拆成两个较小的字体部分;以及,当所得的两个较小的字体部分中,笔顺较先的一个也是一个半元字形或只包含一个基本字形时,基于所述拆字方法,把其中笔顺较后的一个进一步分拆成两个更小的字体部分;以及,当所述笔顺较先的一个不是一个半元字形或所述笔顺较后的一个只包含一个基本字形时,基于所述拆字方法,把所述笔顺较先的一个进一步分拆成两个更小的字体部分;其中所述半元字形以外部分所规定的分拆步骤还包括:将所述半元字形或超半元字形以外的另一个字体部分,基于所述拆字方法进一步分拆成两个较小的字体部分;以及,将所得的每一个字体部分,各自基于所述拆字方法进一步分拆成两个更小的字体部分;以及,当从以上步骤所得的字体部分超过三个时,比较代表从以上步骤所得的各个字体部分的对应字码所对应的选码优先权级别,把其中所属选码优先权级别最低,同时所对应的基本字形的笔须较后的一个所述字体部分剔除,不作为取码用的所述字体部分。

优选地,所述词语模式所规定的分拆步骤包括:当需要输入的是两字词语时,选择所述两字词语的第一及第二个字,基于所述拆字方法各自分拆成两个字体部分;当需要输入的是三字词语时,选择所述三字词语的第一个字,基于所述拆字方法分拆成两个字体部分,以及选择所述三字词语的第二及第三个字,无需分拆各自作为一个字体部分;当需要输入的是三个以上字数的词语时,选择所述词语的第一、第二、第三及最后一个字,无需分拆各自作为一个字体部分,其中未被选择的字,不作为取码用的所述字体部分。

优选地,所述拆字方法包括:优先选择将所述需要输入的汉字或需要进一步分解的字体部分分拆成各自包含一个字、部首或常用字形的两个字体部分。

优选地,所述拆字方法包括:优先选择将所述需要输入的汉字或需要进一步分解的字体部分分拆成大小相近或形状方正的两个字体部分。

优选地,所述拆字方法包括:当所述需要输入的汉字或需要进一步分解的字体部分中,包含互相分离的部分时,优先选择将所述汉字或所述字体部分分拆成所述原先互相分离的两个字体部分。

优选地,所述拆字方法包括:当所述需要输入的汉字或需要进一步分解的字体部分中,没有互相分离的部分时,优先选择将所述汉字或所述字体部分分拆成在所述汉字或所述字体部分中没有笔画互相交迭的两个字体部分。

优选地,所述拆字方法包括:当所述需要输入的汉字或需要进一步分解的字体部分只有笔画互相交迭的部分时,优先选择将所述汉字或所述字体部分分拆成一个笔画横向、另一个笔画纵向的两个字体部分。

优选地,所述拆字方法包括:当所述需要输入的汉字或需要进一步分解的字体部分具有与其他汉字或其他字体部分相似的部分时,优先选择针对二者的相异之处将所述汉字或所述字体部分分拆成两个字体部分。

优选地,所述拆字方法包括:当所述需要输入的汉字或需要进一步分解的字体部分具有由一个字形夹着另一字形的结构时,优先选择将所述汉字或所述字体部分分拆成所述夹着和被夹着字形的两个字体部分。

优选地,所述拆字方法包括:当所述需要输入的汉字或需要进一步分解的字体部分中,没有互相分离的部分时,优先选择分开一个所述「口」字形的延伸笔画或多角笔画将所述汉字或所述字体部分分拆成两个字体部分。

优选地,所述编码规则包括:所述字码组合中的各个所述对应字码,根据其「对应」的基本字形的书写笔顺由先至后来排列。

优选地,所述对应字码包括:包括不同的字母模式,每个所述字母模式以不同数量的对应字码来代表每个所述字母特征组别中的不同字母特征。

优选地,所述字母模式包括:十个字母模式包含十个对应字码,各以一个所述对应字码代表每一个组别中的不同字母特征。

优选地,所述字母模式包括:四十个字母模式包含四十个对应字码,分别以五个、四个或三个所述对应字码代表每一个组别中的不同字母特征。

优选地,所述字母模式包括:二十六个字母模式包含二十六个对应字码,分别以三个、两个或一个所述对应字码代表每一个组别中的不同字母特征。

另一方面,本发明提供了一种汉字输入法,包括:接收利用键盘输入的输入字码组合;将输入字码组合与根据前述的所述汉字编码的方法所建立的汉字编码表中,代表每个汉字或词语的所述字码组合进行配对;以及显示与所述输入字码组合匹配的所述字码组合所代表的汉字或词语。

优选地,所述输入字码包括:与所述汉字编码表的记录完全匹配的字码组合。

优选地,所述输入字码包括:与所述汉字编码表的记录部分匹配的字码组合。

优选地,所述显示与所述输入字码组合匹配的汉字包括:以文字索引方式显示所有与所述记录至少部分地匹配的汉字或词语。

优选地,所述显示与所述输入字码组合匹配的汉字包括:当需要显示多个在所述记录中与所述输入字码组合部分匹配的汉字时,所述每个汉字的排列次序,根据所述每个汉字编码的字码组合中的对应字码所代表的字母特征的选码优先权级别,由低至高顺序排列来显示。

优选地,所述接收利用键盘输入的输入字码组合包括:键盘上每个代表所述输入字码的按键与一个同名的所述对应字码互相对应。

优选地,所述按键包括:与其对应的所述对应字码在所述键盘上的位置,根据所代表的字母特征的选码优先权级别,由1至10顺序排列。

优选地,所述按键包括:与其对应的所述对应字码在所述键盘上的位置,根据所代表的字母特征包含的附加描述,按横、直、斜、点来排列,其中有同类附加描述的被处于相邻位置。

优选地,所述代表每个输入字码的按键包括:在特定的模式中,一个所述按键与两个所述对应字码互相对应;选择/选按所述按键等同输入所述两个对应字码。

优选地,所述键盘包括:电子系统/设备中用于输入讯息的工具。

优选地,所述按键包括:在所述键盘上能够与所述对应字码互相对应的方式。

在另一方面,本发明提供了一种汉字编码的方法,包括以下步骤:将需要输入的汉字,基于分解规则分拆成一个或多个字体部分,其中每个所述字体部分包括至少一个基本字形;基于选码规则,选取所述每个字体部分中的一个基本字形所对应的字码;以及基于编码规则,将所选取的字码组合成字码组合以代表所述需要输入的汉字;其中,当每个所述字体部分能够基于所述分解规则进一步被分拆时,基于分解规则将每个所述字体部分分拆成至少两个更小的字体部分。

优选地,所述至少一个基本字形包括十组字母特征,每组字母特征以一个或多个所述对应字码代表。

优选地,其中所述至少一个基本字形特征还包括特殊定义字形。

优选地,所述对应字码包括于计算机键盘上0至9数字按键代表所述每组字母特征。

优选地,所述对应字码还包括于计算机键盘上位于0至9数字下方的字符。

优选地,所述每组字母特征以计算机键盘上0至9按键中的其中一个数字以及所述数字在计算机键盘上的正下方的一至三个字符代表,其中所述数字与所述正下方的一至三个字符分别代表同一组字母特征中的不同字形。

优选地,每个所述多个半元字形代表汉字结构中常见的字形结构。

优选地,所述编码规则包括以一个字码或两个字码的组合代表所述半元字形。

优选地,所述编码规则还包括以三个字码的组合代表所述汉字中的所述半元字形以外的余下部分。

优选地,所述分解规则包括将所述需要输入的汉字分拆成两个字体部分,并当其中每一个字体部分能再基于所述分解规则进一步分解时,将每一个字体部分基于所述分解规则分解成两个细部。

优选地,每个所述细部以单一字码代表。

优选地,所述分解规则包括当所述需要输入的汉字或需要进一步分解的字体部分由两个字、部首和/或常用字形组成时,将所述汉字或所述字体部分分拆成两个部分。

优选地,所述分解规则包括当所述需要输入的汉字或需要进一步分解的字体部分由两个大小相近的部分组成时,将所述汉字或所述字体部分分拆成两个部分。

优选地,所述分解规则包括当所述需要输入的汉字或需要进一步分解的字体部分由两个字体中互相分离的部分组成时,将所述汉字或所述字体部分分拆成两个部分。

优选地,所述分解规则包括当所述需要输入的汉字或需要进一步分解的字体部分具有与其他汉字或其他字体部分相似的部分时,针对二者的相异之处将所述汉字或所述字体部分分拆成两个部分。

优选地,所述分解规则包括当所述需要输入的汉字或需要进一步分解的字体部分具有一个夹着另一部分的字体部分时,将所述汉字或所述字体部分分拆成两个部分。

优选地,所述分解规则包括当所述需要输入的汉字或需要进一步分解的字体部分具有单一笔画中有多于一个弯角时,将所述汉字或所述字体部分分拆成两个部分。

优选地,所述分解规则包括当所述需要输入的汉字或需要进一步分解的字体部分具有明显的所述至少一个基本字形以及相连的其他字体部分,将所述汉字或所述字体部分分拆成两个部分。

优选地,所述分解规则还包括以单一字码表示不能分解的汉字或字体部分。

优选地,所述基于编码规则还包括跟据所述字母特征的选码优先权来选取所述字码组合。

优选地,所述选码优先权包括优先选取代表较繁复的基本字形的字码。

优选地,所述选码优先权包括跟据所述字体部分的书写笔顺来选取字码。

优选地,所述编码规则包括限定所述字码组合为具有一至两个字码。

本发明中的输入法因此提供了许多优点。其中,输入法所利用的汉字编码方法「萃取」了汉字字形结构中一些最简单、最容易辨认的结构─边数(四边到一边)、笔数(一笔到四笔)和相交字形来定义基本字形。各个字母的基本字形只会包含上述三种特征结构的其中之一,不会夹杂其他笔画或字形,因此能达到一目了然的效果。

由于所述基本字形包含可以排列成顺序的特征,而输入法的其他规则亦配合这个性质来设定,因此对输入法的学习和使用都有莫大的帮助。

另外,本发明中的汉字编码的方法使用了取繁舍简的方法(以其中字形所属字母特征的等级最高者取码,而等级则会参考字形的边数和笔数来定义)。其好处是边数或笔数愈多,其结构就愈突出,在字体中就越显眼,这就变成选取字体中最容易辨认的部分来编码。同时在配合本发明的其他规则下,常常能够选出不同的字之间的相异之处来编码,减少重码的机会。

附图说明

参照本说明书的余下部分和附图可以对本发明的性能和优点作进一步的理解;这些附图中同一个组件/部分的标号相同。在某些情况下,子标记被放在某个标号与连字符后面以表示许多相似组件/部分的其中一个。当提到某个标号但没有特别写明某一个已有的子标记时,就是指所有这些类似的组件/部分。

图1展示了根据本发明的一个实施例的汉字编码的方法;

图2展示了「口」字型的不同拆字的可能性以及选码优先权的示例,以及「中华码」的键盘布局、字母特征和基本字形;

图3展示了「金石码」的字母特征;

图4展示了图1所示的汉字编码中的基本字形和字母特征,以及代表选码优先权的十个组别;

图5展示了「金石码」的键盘布局;

图6展示了「金石码」配合「半元法」的半元字形;

图7展示了图5所示「金石码」键盘布局演变成「廿六码」的键盘布局;以及

图8及图9展示了「金石码」配合「简体字」使用时的键盘布局以及其简体半元字形。

具体实施方式

从以下的叙述可以轻易得知本发明的各个实施例所提供的其它不同的好处和优点。

发明人认为一套成功的输入法须要满足下列两个条件:(1)容易学习和掌握。(2)有效率。要达到以上其中一种要求并不太难,但由于中文字形结构极为复杂多变,字体形态丰富多样,因此要平衡上述两者而找出当中「优化」的形式,却不是一件容易的事。

大致上,可以把中文输入法分为两类,一种字母数量较少,相对较容易学习,但很难避免要选字,无法达到最高效率。另一种字母数量较多,效率比较高,但一般较难掌握。前者适合用于体积细小的器材,如手提电话;后者则可配合键盘于计算机上使用,满足对输入速度有更高要求的使用者。以上两类输入法模式各有所长,但要使用者同时掌握两种不同的输入方法,这就未免有点强人所难。

参考图1,本发明提供了一种汉字编码的方法,包括以下步骤:将需要输入的汉字或词语,基于分解规则分拆成一个或多个字体部分,其中每个所述字体部分包括:至少包含一个基本字形;以及基于选码规则,就每个所述字体部分,根据其包含的所述基本字形,各选取一个对应字码来代表;以及基于编码规则,将所选取的对应字码组合成字码组合以代表所述需要输入的汉字或词语。其中,所述字体部分包括:基于所述分解规则规定无需分拆或不能分拆的所述需要输入的汉字或所述需要输入的词语中的个别汉字;其中,所述词语包括:分别由两个或多个汉字组合而成。

如图1所示,本发明的汉字编码的方法可将表意文字,尤其汉字「翻译」成字码组合,例如汉字「解」(102)可通过汉字编码方法(100)转换成字码组合「4762」(104)。由于「4762」中每一个码都可以利用计算机键盘直接输入到计算器/计算机设备,因此通过建立汉字编码表将不同的表意文字和对应的字码纪绿,便可用作为计算机/计算器的输入法。在使用输入法时,用户会先通过一定规则来将需要输入的汉字在脑海中先转换成可利用键盘直接输入的字码,通过键入正确的字码到设备中来呼叫出需要输入的汉字并「输入」到设备中。

上述取码规则示例介绍了如何按每个字的不同结构,把字母排列成不同的编码。当字母被指定到键盘上的各个按键后,就能够经由打出编码来输入对应的文字。

编码与文字的对应关系是输入法的基础。只要为每个文字配对好编码,可以利用如微软的「通用输入法编辑工具」和「莱姆输入法」等第三方软件在计算机或手提电话中建立半分输入法来使用。或者,一套专属的程序将更能发挥输入法的效能。

例如,用户可在计算机设备中执行一种汉字输入法以输入需要输入的汉字。计算机设备接收利用键盘输入的输入字码组合,然后将输入字码组合与本发明的汉字编码的方法所建立汉字编码表进行配对;以及显示与所述输入字码组合匹配的汉字。本发明的输入法可以被命名为「半分输入法」,并在以下的示例中进一步被阐述。

优选地,所述分解规则的一般模式所规定的分拆步骤包括:将需要输入的汉字,基于所述拆字方法分拆成两个字体部分,并且将所得的每一个字体部分,各自基于所述拆字方法进一步分拆成两个较小的字体部分。例如,如图1所示的「解」字(102)一样,可以将一个字的字体像切生果一样一分为二得到左(102a)、右(102b)两个字体部分,然后把所得的两个部分各自再上、下一分为二得到102a-i,102a-ii,102b-i及102b-ii四个部分(可称为细部)。根据这四个部分的笔画结构以及基于选码规则各取一个字码,并按笔顺排列,就得出这个字基于编码规则的字码组合。

在一个示例中,「基本字形」被定义为构成各种字体的最小单元(包括九种最简单的字形结构)。它不能再被分解,只可以取一个字母(相等于对应字码)。其中,一个字母代表一个或多个「字母特征」,每个「字母特征」由一个「基本字形」或一个有附加描述的「基本字形」构成。因此每个「基本字形」可以经由其「字母特征」对应到一个代表它的字母上。

优选地,所述分解规则包括:当每个所述字体部分包含多于一个基本字形,并且按所述分解规则模式的规定需要被分拆成两个较小的字体部分时,基于所述拆字方法将所述字体部分分拆成两个较小的字体部分。此步骤可一再重复,直至完成所述分解规则模式规定的步骤为止。有些汉字经分拆后的某一个部分(或整个字),可能只有一个「基本字形」,不能再分,因此会有一些字的编码是少于四个字母的。所述分解规则还包括:每当规定需要分拆的所述字体部分或所述需要输入的汉字只得一个基本字形,不能再分拆时,略过所述步骤。

就笔顺而言,一个「基本字形」的多个笔画之间,若夹杂着其他部分的字形笔画,应以各自的第一个笔画作为其笔顺次序。如「田」字,其中「口」的最后一笔,虽在「十」之后,但取码时则应以「口、十」作为顺序。

通常,单凭直觉就能够轻松地把一个字一分为二。至于二分为四,这不过是再次一分为二而已。对于某些人而言,明确的指引可能是优选的。发明人归纳出六种法则,作为分拆字体的方法。它们分别是〈字、半、分,同、双、切〉。其中〈字、半、分〉主要是依照直觉来定义的,占大多数;而〈同、双、切〉则是因应须要而定的法规,属少数特例。

优选地,所述拆字方法包括:优先选择将所述需要输入的汉字或需要进一步分解的字体部分分拆成各自包含一个字、部首或常用字形的两个字体部分。〈字〉当一个字体是由两个不同(相同也可以)的「字」组合而成的时候,要分拆它们,可说是最容易不过的事了。如「明」可分成「日、月」两字。这也是最常见的方式。但当借助「字中的字」来把字体一分为二的时候,应注意一些部首和常用字符,如:「亠、、」…等,亦包含在〈字〉的定义中。

所述拆字方法还包括:优先选择将所述需要输入的汉字或需要进一步分解的字体部分分拆成大小相近或形状方正的两个字体部分。〈半〉选择能够使分开的两个部分,形状上较为「平均、对称、规则」的方式来分拆字体。包括:(1)两个部分大小相近。(2)用较简单的分割线(直线)来分拆字体。如「高」会被分拆为「、冋」,而非「亠、」或「、口」。

所述拆字方法包括:当所述需要输入的汉字或需要进一步分解的字体部分中,包含互相分离的部分时,优先选择将所述汉字或所述字体部分分拆成所述原先互相分离的两个字体部分;以及当没有互相分离的部分时,优先选择将所述汉字或所述字体部分分拆成在所述汉字或所述字体部分中没有笔画互相交迭的两个字体部分;以及当只有笔画互相交迭的部分时,优先选择将所述汉字或所述字体部分分拆成一个笔画横向、另一个笔画纵向的两个字体部分。〈分〉自然而然,会优先选择字体中两个完全分离的部分来分拆它们。其次是只互相接触,而没有彼此交迭的两个部分。交迭在一起的笔画结构通常都会是最后的选择。如「隶」会被分拆为「」,而非「、氺」。

所述拆字方法包括:当所述需要输入的汉字或需要进一步分解的字体部分具有与其他汉字或其他字体部分相似的部分时,优先选择针对二者的相异之处将所述汉字或所述字体部分分拆成两个字体部分。〈同〉请观察「虎、虚、虑」,「塞、寨、赛」等字形极为相似的字组,为了避免它们的编码完全一样,优选地针对它们的相异之处来分拆。如:「虎─虍、几」,「虚─虍、业」…等。

所述拆字方法包括:当所述需要输入的汉字或需要进一步分解的字体部分具有由一个字形夹着另一字形的结构时,优先选择将所述汉字或所述字体部分分拆成所述夹着和被夹着字形的两个字体部分。〈双〉这种分拆方式的结果,会使其中一个部分像双唇一样夹着另一个部分。如:「街─行、圭」,「瓣─辡、瓜」…等。但请注意:在编码的时候,仍须按笔顺来排列其顺序。如「街」的顺序是「彳、土、土、亍」。

属于〈同〉和〈双〉分拆方式的字体,很多时候亦可套用〈字〉的定义来解释。只是它们的分割线很不规则,较难辨识,故另设类别,加以说明。此外,它们数量不多,约各有二十组。

所述拆字方法包括:当所述需要输入的汉字或需要进一步分解的字体部分中,没有互相分离的部分时,优先选择分开一个所述「口」字形的延伸笔画或多角笔画将所述汉字或所述字体部分分拆成两个字体部分。〈切〉汉字基本上是由不同的笔画所构成的,在使用者脑海中,可谓根深蒂固。因此,在拆字的时候,应该尽量避免把单一笔画强行切开。但在半分输入法中,下列两种情况,仍须把笔画切开,才能得出合理的编码。

所述两边字形包括:当单一笔画具有多于一个转角位时,所述多角笔画可在所述角位分开,并分属于一个两边字形及其他基本字形。

有极少数字体,在单一笔画中有多于一个钩角(转角位)。如「乃」字中的须要在「转角」处把其切开,才能得到「乛」、两个符合半分输入法「字母特征」定义的字符。

所述四边字形包括:当「口」字形的其中一个笔画延伸至「口」字形之外时,所述延伸笔画可在所述「口」字形的边缘分开,并分属于所述「口」字形及其他基本字形。

「口」形字体在汉字中十分常见。它也是半分输入法的「字母特征」中,一个非常重要的元素。而某些字体结构,虽然有明显的「口」形特征,但却带有一条(且仅有一条)长尾巴。例如:「巳、尸、艮」等。这时,也要使用〈切〉的方式,把它们分拆为「口、乚」、「口、丿」、等字符。

须谨记「一刀切」这个守则,因为切两次来获得一个「口」形是绝对不容许的。例如:「巨」字就必须被拆解成「且」则须分拆为「冃、一」。

分拆法则的定立,其目的是希望用户能够以最简单、直觉的方式来拆解字体。虽然〈字、半、分〉三种法则常常可以得出相同的分拆结果,但有时也会互相冲突。这时,基于上述原则,只须选择最容易分辨的方式来拆解它们即可(输入法对最容易分辨的方式会有所优化,但其余的方式通常都可以使用)。

以下为半分输入法(十个字母模式)所定义的各个字母的「字母特征」。

优选地,每个所述字母特征包括:被分成十个组别,每个所述组别包含不多于两种基本字形,同一组别中不同的所述字母特征可以由所述不多于两种的基本字形加上不同的附加描述来构成,并且同组的每个所述字母特征所代表的基本字形具有相同的边数或/和笔数。所述字母模式包括:十个字母模式包含十个对应字码,各以一个所述对应字码代表每一个组别中的不同字母特征。半分输入法(十个字母模式)有十个字母。默认使用键盘上方的数字键作为按键。依照键盘上的位置,由右至左,它们的字母名称和按键名称(相等于对应字码)分别是:「口=0」、「中=9」、「日=8」、「月=7」、「心=6」、「人=5」、「手=4」、「十=3」、「華=2」、「一=1」。为方便陈述,以下会以它们的按键名称代替它们的中文字母名称来称呼它们。如:﹝0﹞即表示字母「口」、﹝9﹞表示字母「中」…余此类推。所述的汉字输入法还包括:键盘上代表所述每个输入字码的按键与一个同名的所述对应字码互相对应。

所述四边字形包括:大致呈方形的「口」字形。「口」形是半分输入法「字母特征」的基础。﹝0﹞、﹝9﹞、﹝8﹞三个字母的「字母特征」都是「口」─有四边。它们的分别在于「囗」内有没有其他笔画。﹝0﹞的内部是没有任何东西的。如:「口、巳、尸」等。﹝8﹞的内部有一或两横画,即「日、目」两种字形。而「口」内有其他字形结构的都归类为﹝9﹞。如:「中、田,四、巴」…。但请注意三个字母的取码都只是「口」这个框框,而框框以外的其余部分,都是可被分拆出来另作取码之用的。如「回」字的编码是﹝90﹞,不只是﹝9﹞(其中所述「字母特征」的定义参考到「口」字形以外的部分,这个称为外部特征,属于所述基本字形附加描述的一种形式)。

所述三边字形包括:「口」字形的四个边之中缺失任意一边的字形。把「口」形除去一边,变成「冂」形,它有三边。这就是﹝7﹞的「字母特征」。它有四个方向─两旁的笔画容许略带倾斜或小钩。如:「安、用、凡、且、卯(左边上部)、尹、山、廿」等字都包含有属于﹝7﹞的「字母特征」的字形。

所述两边字形包括:三边字形再缺失其中一边的字形,大致具有方形中其中一角的字形。例如把「冂」形再除去一边,变成形─只有两边。成为﹝6﹞的「字母特征」。同样有四个方向,亦可略带倾斜或小钩。如:等。此外,部分字形如「心」字的「乚」、「方」字的在某些书体中,其「角」的形态较不明显,但它们仍是字母﹝6﹞的成员。

所述两边字形还包括:大致具有菱形中其中一角的字形、具有锐角的字形或具有钩形的字形。其中所述方形角、菱形角、锐角、钩形角代表所述两边字形的附加描述。两边的字体亦可称为「角形」。﹝5﹞和﹝4﹞的「字母特征」也是「角形」。相较之下,可以把﹝6﹞的「字母特征」中的四种形态,比喻为一个方形上的各个不同方向的角─而﹝5﹞的「字母特征」则可类推为一个菱形上的各个角─如:「水(右边部分)」等。但基于汉字字形的真实情况─﹝5﹞只有向上和向左两个方向(以角尖而言)的字形。在半分输入法中「丷、冫」等字形会被界定为两点,稍后将另有说明。﹝4﹞的「角形」特征是锐角或钩形。有四种形态,包括:其中小钩的笔画可略带倾斜。例如等字的相关部分。

所述一笔字形、两笔字形、三笔字形、四笔字形包括:具有一至四笔互不相交、笔顺相连,以及全都不与其他笔画相交或全都与其他一个或多个笔画相交的横、直、点和/或斜的笔画。其中所述横、直、斜、点代表所述一至四笔字形的所述附加描述。其中所述一笔字形中的一横、一直、一斜相等于所述一边字形。一边的「字母特征」落在字母﹝1﹞的身上。而一点被包含其内亦不难理解,故「一、丨、丿、丶」(一横、一直、一斜、一点)皆属字母﹝1﹞。﹝2﹞的「字母特征」是二横、二直、二斜、二点。字形包括:「二、介(下半部)、八、勿(中间部分)、木(左右两撇)、丷、冫」等。

所述相交字形包括:只含两线相交的字形。相交字形被安排在字母﹝3﹞上。其「字母特征」是两线相交,有三种形态,分别是:「十、乂、」。两线相交的结构必须清晰、明确,不应再与其他笔画相交。如:「廾」字就只能分为﹝12﹞、「巿」字应解作﹝171﹞。

以上可被称为各字母的「主特征」。因为「字母特征」中还有一个「延伸部分」(相等于一笔至四笔的字形)。这表示﹝1﹞和﹝2﹞的「字母特征」的模式可延伸到其他字母。这使得字母﹝3﹞亦包含了三横、三直、三斜、三点作为其「字母特征」。如:「三、川、彡、氵」…等。而字母﹝4﹞则包含了四直和四点。「杰、雨、氺」等字的相关部分均符合四点的定义。四直则只有「舞」字的中间部分一例。因汉字笔画的实际情况─不存在五横、六点等字形。因此,其他字母都没有「延伸特征」。

「延伸部分」虽然使﹝3﹞和﹝4﹞变成具有「双重特征」,但三横取﹝3﹞,四点取﹝4﹞这个形式非常简单直接,顺理成章,不应做成太大的困难。

此外,所述基本字形还包括特殊定义字形。以下是半分输入法其中五个特殊定义的字形:

·草花头「艹」─因它成双成对的形态,整个部分取字母﹝2﹞(此亦可以避免因它有多种写法而引致的混乱)

·竖心边「忄」─因是「心」字的偏旁字形,整个部分取字母﹝6﹞(此字形亦有多种写法)

·企人边「亻」─因是「人」字的偏旁字形,整个部分取字母﹝5﹞

·衣字旁「衤」─因是「衣」字的偏旁字形,整个部分取字母﹝4﹞

·另外,整个「心」字也是特殊定义字形,同样取字母﹝6﹞。

此外由于结构特殊,「本」(十、八、一)、「州」(、川)、「」(丿、二、丨)三个字形的字形定义亦与一般的方式不同。

虽然,当一个字被分为四个部分后,通常各个部分(即「细部」)都已经变得非常简单。许多时候,一个「细部」中,就只得一个「基本字形」,无须取舍。但相反,一个「细部」中仍包含多个「基本字形」的情况亦为数不少。以下将解释应选取那个「基本字形」来对应字码。

参考图2及图4,其中101代表由低至高的十个选码优先级别。所述编码规则还包括跟据所述字母特征的选码优先权来选取所述字码组合。优选地,所述每个组别的字母特征包括:由低至高,以数字1至10来代表所述每个组别中的字母特征的选码优先权级别。比较所述字体部分中每个基本字形所属的字母特征的选码优先权级别,其中级别最高的一个所述字母特征所属的对应字码,会被选取来代表所述字体部分。例如当一个「细部」中有多个「基本字形」可取为编码时,优先选取代表较繁复(所述字形结构较复杂)的基本字形的字码。

只要忽略部分细节,可以很容易地看出来:各个字母的「字母特征」所对应的基本字形,依其在键盘上的位置,由右到左,会由「四边」逐步简化为「一边」;由「四笔」逐步简化为「一笔」(其中边数或笔数较多,代表字形结构也较复杂,而把相交字形安排在字母﹝3﹞上,亦大致能反应出它字形结构的复杂程度)。

优选地,所述选码优先权级别包括:所述每个组别中的字母特征所代表的基本字形的边数或/和笔数愈多,其选码优先权级别愈高。所述按键包括:与其对应的所述对应字码在所述键盘上的位置,根据所代表的字母特征的选码优先权级别,由1至10顺序排列。

如果把按键﹝0﹞中的数字想象为「10」,按键名称就会变成一个由「1」至「10」的顺序(相等于所述字母特征的选码优先权的十个级别,字母﹝0﹞代表级别10,其他字母名称与级别相同)。这样做的好处是─可以把上述问题的答案,写成一个非常简洁的陈述:比较一个「细部」中的各个「基本字形」,就其所对应的字母名称─「取最大数字为码」。例如,如图2所示,属于字母﹝0﹞的字形会优先被选取,其次是字母﹝9﹞的字形,然后是﹝8﹞、﹝7﹞……余此类推。

在另一示例中,以「塔」字为例,编码的时候,须要在其「细部」─「合」字中取一码,但「合」包含﹝5﹞、﹝1﹞、﹝0﹞三个字母,而由于﹝0﹞(等于﹝10﹞)数字较大,故被选取,成为「塔」字的编码─﹝3120﹞的最后一个字母。

参考图1,其中103代表「解」字的不同部分102a-i、102a-ii、102b-i及102b-ii各自可供选择的字母,深色字体代表每个部分中选码优先权级别最高(所代表的数字最大)的一个,图中的104则显示了根据选码优先权的规则,在各个部分中选择级别最高的字母,得出「解」字的编码─﹝4762﹞。

由于上述十个按键名称在键盘上是由右至左,由大到小地排列的,这就相等于较右边的字母拥有优先被选为编码的权利。

同时,在定义字母、编排按键的时候,也是根据字形特征的复杂程度,由右至左,由繁到简(由四边到一边、由四笔到一笔)地排列的,所以,「取最大数字」实际上就是取繁舍简。半分输入法利用数字大小的人所共知,以「取最大数字」这个方便的技巧来达到此一目的。以下三种说法,其实际意义是完全相等的:取繁舍简=取右舍左=取最大数字。

此外,所述选码规则包括:当所述选码优先权级别最高的字母特征多于一个时,其中级别最高,并且所代表的基本字形的书写笔顺较先的一个所述字母特征所属的对应字码,会被选取来代表所述字体部分。在一些极特殊的例子中,还须要运用以下规则来帮助决定如何在一个「细部」中取舍字形:当一个「细部」中包含有多于一个「最大数字」的字形时,选其中笔顺较先的那个来取码。

「取繁舍简」是半分输入法最关键的部分。它以一种全新的方式来解构字形,初次接触它的人,可能因此而有一个误解:「字体中的每个「细部」,都要各自比较其『繁简』,岂不费时失事。」然而,假如把约六千个最常用的字,全部「一分为二,二分为四」。这将会得到很多不同的「细部」字体。而在这许许多多的字体当中,就只能够找到十种是包含有两个不同「口」形(四边)的。即仅有十种情况,须要在﹝0、9、8﹞三个字母之间进行取舍。而同时有两个不同「角」形(两边),须要在﹝6、5、4﹞间取舍的,则稍多一点,约有六十多种。因此,在大部分情况中,只须舍去那些简单的点、线笔画,就能正确取码。

最后补充一点:有少数字体写法之间的差异非常微小,难于辨别,在半分输入法中会予以忽略。如:「(玉部)→王」、「(肉部)→月」、「辉(左边部分)→光」。

十个字母的半分输入法可说简单易用,但若要满足追求速度快、效率高的用户,可配合利用键盘上其他按键作为对应字码。优选地,所述对应字码包括:可以有不同的字母模式,每个所述字母模式以不同数量的对应字码来代表每个所述字母特征组别中的不同字母特征。例如,所述字母模式包括:四十个字母模式包含四十个对应字码,分别以五个、四个或三个所述对应字码代表每个组别中的不同字母特征。

细看半分输入法的十个字母,隐约可见,每个字母都包含有多个不同的元素,如﹝1﹞就包含了「一横」、「一直」、「一斜」、「一点」四种特征。只要让每种特征自成一个字母,转瞬之间,在其他规则一律不变之下,就已经得到一个拥有多字母优点,效率更高的新输入法模式了。其中「横、直、斜、点」相等于所述「一笔」字形的附加描述。

为区分它们,发明人把有十个字母的半分输入法命名为「中华码」(十个字母模式);细分后,有四十个字母的模式则取名「金石码」(四十个字母模式)。但它们之间并没有主从之分。可以说:把「中华码」的十个字母细分成「金石码」的四十个字母;但也可以反过来说:把「金石码」中几个相关的字母放在同一个按键上,成为「中华码」。这相等于可以用字母特征「一笔」来代表﹝1﹞,也可以用「一横」、「一直」、「一斜」、「一点」四个字母特征来代表﹝1﹞

这种配置是有利的,例如,十个字母的模式适合手提电话使用,四十个字母的模式则可配合计算机键盘使用。可理解的是,不同的设备具有不同的输入接口,其中包括实体或虚拟键盘,而键盘上可提供不同数目的按键供用户输入字码。

参考图5,显示了「金石码」的键盘布局。图3则依照各个字母在键盘上的位置(但略为调整)列出它们的「字母特征」。图4则是各个字母、字母特征及其所属字形的对照列表。

大致上,每个字母会被细分为四个新字母,由同一个字母细分出来的各个新字母会成为一组,同组字母会被顺序编排在原字母及其下方的按键上。依键盘位置,例如较常见的qwerty键盘布局,由左至右,由上而下,分别是:

﹝1﹞被细分成:﹝1﹞=「一横」、﹝q﹞=「一直」、﹝a﹞=「一斜」、﹝z﹞=「一点」(说明中,仍会以按键名称来代替字母名称)。

﹝2﹞被细分成:﹝2﹞=「二横」、﹝w﹞=「二直」、﹝s﹞=「二斜」、﹝x﹞=「二点」。

﹝3﹞被细分成:﹝3﹞=「十」字形,其上、下方必须各有一横或一斜的「简单」笔画。即「王」字或「壬」字中间的「十」字形。﹝e﹞=同样是「十」字形,但只下方必须有一「简单」横画,即「土」字或「士」字中的「十」字形。﹝d﹞=也是「十」字形,可理解为上述两个同组字母以外的其他「十」字形。以下两类特征的字形同属字母﹝d﹞:(1)只上方有横、斜笔画。如「干、千」两字中的「十」字形。(2)与「非简单」横、斜笔画相触的十字形。例如「早、支、孛」等字。同一道理:「至」、「堂」等字中的「十」字形则属于字母﹝e﹞,而非字母﹝3﹞。两种字形。

本组字母另有「延伸特征」,分别是:﹝3﹞=「三横」、﹝e﹞=「三直」、﹝d﹞=「三斜」、﹝c﹞=「三点」。

从﹝3组别﹞的情况可见,字母﹝3﹞、﹝e﹞、﹝d﹞的「字母特征」都是「十」字形,要决定某个字形属于那个字母,必须考虑到「十」以外的其他笔画,这个称为「外部特征」(包含在所述基本字形的附加描述中)。在中华码时,﹝0﹞、﹝9﹞、﹝8﹞三个字母已经是利用「外部特征」来分辨的。来到金石码,「外部特征」会更为重要,请小心留意。再提醒大家:构成「外部特征」的笔画是可以作为另一个部分来取码的。

此外,当列举含有「外部特征」的字例时,通常是针对说明中字母的取码部分而言,「外部特征」不包括其中。为使行文简洁,这点,下文将不再另作注明。其意即对上第二段中,加有底线的内容将被省略掉。

﹝4﹞被细分成:﹝r﹞=「乛」、此组别的「延伸特征」分别是:﹝r﹞=「四直」、﹝v﹞=「四点」。

﹝5﹞被细分成:﹝5﹞=「人」,但必须具「外部特征」─两侧有其他笔画,呈「大」字形。如:「大、火、脊」…等。﹝t﹞=「人」、「入」两种字形。﹝g﹞=「金」的上部分。﹝g﹞与﹝t﹞的分别是﹝g﹞的下方会有一个与其相关的字体,如:「全、食、个」…,但﹝t﹞则无此特征(以上三个字母都是角尖向上的,只是「外部特征」不同)。角尖向左,如:「女、巡、水」…。

﹝6」被细分成:和「乚」两种字形(角在下方)。但「心」字中的「乚」则除外。﹝y﹞=「心」字形(特殊定义字形)。两种字形(角在上方)。等字形。请注意字形略呈钝角状,其中一边或两边是向外微斜的(这是它与﹝h﹞的分别所在)。

﹝7﹞被细分成:﹝7﹞=「匚」和(开口向左、右两边)。﹝u﹞=「凵」(开口向上)。﹝j﹞=「冖」和「几」两种字形。﹝m﹞=「冂」(开口向下),其内必须有(并且仅有)二或三横画的「外部特征」。如:「月、且、直」等。注意「丹、用、角、再」等字并不包括其中。

一般字母会被细分成四个新字母,但﹝7组别﹞因实际须要,必须向隔邻﹝8组别﹞借用一个按键位置─「,」。故﹝,﹞=「冂」(与﹝m﹞同为开口向下)。可理解为﹝7组别﹞中,﹝m﹞和﹝j﹞以外的其他开口向下的字形。如:「巾、丹、同、皿」。

﹝8﹞被细分成:﹝8﹞=「口」形内有(并且仅有)一横画「外部特征」的字体。如:「日、曰」。﹝i﹞=有一条长「尾巴」作为「外部特征」的字体。如:「艮、殷」。﹝k﹞=「口」形内有两横画的字体。如:「目、自」。

﹝9﹞被细分成:﹝9﹞=「口」形内有两条直线、斜线或曲线由上而下的字体。如:「罒、曲、四」。﹝o﹞=「口」形内有一条直线或斜线由上而下的字体。如:「中、史、巴」。﹝l﹞=可把它的「字母特征」理解为另外三个同组字母中,不包含的其他所有﹝9组别﹞的字形。如:「因、国、田、由、甲」…等。﹝.﹞=「口」内有一个「十」字形作为「外部特征」,但中线必须贯穿上、下。如:「申、更、电」(注意「田、由、甲」等字不包括其中)。

﹝0﹞被细分成:﹝0﹞=不与其他笔画相触的「口」字形。如:「合、沿、或」。但「言」字下方的「口」形除外。﹝p﹞=「言」字下方的「口」字形。另加有一条长「尾巴」的字体。如:「巳、尸、追」。﹝;﹞=下方有其他笔画与之相触的「口」形。如:「足、兄、京、豆」。﹝/﹞=上方有其他笔画与之相触的「口」形。如:「古、石、名、各」。

有极少数「口」形字体,上、下方皆有笔画与其相触,应以较后才被拆解的结构来定义它们的字母。例如「克」字,因为它会先被分拆成「十、兄」两个部分,故其「口」形会根据「兄」的字形,取字母﹝;﹞。

基于书写习惯各有不同,接触与否,只是近似形容,应以所附字例为准。

对于其余四个「特殊定义」的字形,用它们的「中文字母名称」来说明会较为容易记忆(按键名称则列于括号内)。分别是:「忄」=﹝心﹞(y)、「亻」=﹝人﹞(t)、「衤」=﹝衣﹞(v)、「艹」(草花头)=﹝華﹞(w)。

各字母「细分」后,在「取繁舍简」的时候,会沿用之前的「数字」。这表示同组字母中的各个字母,其「数字」是相同的。故它们之间就会以笔顺来取舍。这样可以使被选择用来取码的字形与「中华码」完全一致。

至此,半分输入法两个主要的字母模式已经介绍完毕。其他的模式属于辅助性质。例如,既然可以把四十个字母,几个一组地放在十个按键上,得出一种不同的字母模式,那么,也可以依样画葫芦,造出二十六个字母的输入法模式,以迎合惯用二十六个英文字母的用户。

图7显示了这种字母模式─「廿六码」的键盘布局。主要是把上排数字键的字母与其下方按键上的字母合并,右边符号键上的字母则左移,并入邻近的按键中。只须依照图7中,各按键上的「金石码」字母名称(一个按键会包含多个字母名称)来操作即可(严格来说:字母并无减少,只是按键减少了)。但要注意字母﹝p﹞的两个「字母特征」─「言」字的「口」形和带有一条长尾巴的字形,会分开并入不同的按键﹝p﹞和﹝l﹞中。

虽然,可以任意地造出不同字母数量的输入法模式,但这样却不能保证每种模式都可以满足容易学习和有效率这两个要求。半分输入法不是随便把不同字母合并或分开的,相反在经过无数次相互配搭、反复修正,才使各个字母在「合」起来时,依然彼此相关,不会让人感到杂乱无章,或者格格不入。「分」开的时候,又各自有其明显的特征,不容易混淆。最终让每种模式都拥有选字率低和容易掌握两大优点。

例如多字母模式必然会有较多的字母特征,如果分拆字体的时候,不同模式要考虑不同的字母特征,就不能保持它们的简单和一致性。但半分输入法的拆字方法只会考虑到九种最简单的基本字形,不涉及字母特征,因此,一位多字母模式的用户与一位使用十个字母模式的用户唯一的分别是:他只须从一个基本字形的字形方向、点与线之分别、笔画角度的差异和其「外部特征」辨别它是其所属组别的几个字母中的那一个即可(其他规则一律不变)。

在上述的中华码、金石码、廿六码等例子中,当所述输入字码与所述汉字编码表的记录完全匹配,便可以输入匹配的汉字到设备中。或者,输入法可以设置为接收与所述汉字编码表的记录(至少)部分匹配的输入字码组合,便可以输入匹配的汉字到设备中。例如,以文字索引方式显示所有与所述记录至少部分地匹配的汉字,让使用者选择,把所需的汉字输入到设备中。

优选地,所述代表每个输入字码的按键包括:一个所述按键可以与两个所述对应字码互相对应。选择/选按所述按键等同输入所述两个对应字码。

另一种字母模式可以称作「一码」。在这个例子中,可以把「中华码」的字母,两个、两个地合成一系列新字母(有超过一百个之多)。如…﹝12﹞、﹝13﹞…﹝91﹞、﹝92﹞…等等。以「异」字为例来示范如何使用「一码」模式来输入文字。「异」字的「中华码」编码是﹝0612﹞,第一部分的编码是﹝06﹞,故按下字母﹝06﹞的按键,这时选字表就会把选字按照第二部分的编码排列出来,在「12」的位置上找到「异」字,完成输入。虽然,字母和选字都不少,但它们都是顺序排列的,只要适当训练,仍能快速地输入文字。上例中若编码﹝06﹞的选字太多,亦可再按下字母﹝12﹞的按键来输入完整的编码。而把这个模式稍加修改,就可以成为如传统字典一类,有相似操作须要的系统的文字索引方式。

除不同的「字母模式」外,半分输入法另有两种「编码模式」(相等于所述分解规则的不同模式),用以扩大半分输入法的适用范围。优选地,所述半元字形包括三十四个汉字字体中最常出现的部首或部首偏旁字形,以及与这些字形相似的字形。

发明人认为这个示例中的模式为进阶模式,以下称为「半元法」。优选地,此模式能够在不增加「编码数」(每个字的编码所包含的字母数量的平均值)的同时,把「选字率」(打完一个字的编码后,还须要再选字的机率)降至最低。可以设置为半分输入法基本模式的一部分。

由于「中华码」在不使用「半元法」的情况下,其输入效率已经足以「凌驾」其他字母数量相近的输入法。考虑到应该让初学者尽快掌握和应用,所以把「半元法」设定成进阶技巧,留待用者自行决定是否学习。

「半元法」的主角是三十四个「半元字形」。请参考附图6。图中各个「半元字形」依其所属字母在键盘上的位置排列。若把它们与附图5的「金石码」字母作一对比,可见,除部分被本身的偏旁字形所取代外,两者极为相似。

「半元字形」只可以被视为「准半元」。因为它们必须在「正确」的位置上,才可以成为真正的「半元」。「正确」位置可以简单理解为这些字形最常出现的位置(一个字的上、下、左、右其中一方)。而下面则是它们的严格说明。

「宀、疒、艹、、辶、心」等半元字形,因为只会出现在一个字的上或下「半部」(约相等于「一分为二」后的其中一个部分),所以无须特别记住。而其余的半元字形,除「鳥」外,全部必须位于「左半部」。故只要记住「鳥」是唯一的「右半元」─它必须在「右半部」即可。

认识了如何「正确」地辨别「半元」后,就可以了解它们的取码方式。编码规则可以包括以一个字码代表所述半元字形,并以三个字码的组合代表所述汉字中的所述半元字形以外的余下部分。例如,当一个字若包含有「半元」,则「半元」本身只取一码,而该字的其余部分(以下简称「另一半」)则取三码。

「另一半」会被拆解(即二分为四)为两个部分(即细部),当中的第一个部分可理解为「首部」(笔顺较先的部分),而余下的则称为「次部」(笔顺较后的部分)。「另一半」取三码的规则是:「首部」会优先取两码,而「次部」则取一码。若「首部」只得一码(只得一个「基本字形」,不能再分),则「次部」可取两码。

但若果「首部」也是一个「半元字形」,情况则会完全逆转。「首部」只取一码,而「次部」返可优先取两码。而如果「次部」只得一码,则属「半元字形」的「首部」仍可取两码。取两码的意思就是「一分为二,各取一码」。这是半分输入法取码的标准模式。

具体而言,「半元法」定义出汉字结构中最常出现的字形结构(三十四个「半元字形」),然后,尽量减少它们在编码中所占的「席位」。「半元」把两个「席位」中的一个让给「另一半」;而属于「半元字形」的「首部」亦会把取两码的机会让给「次部」。如此,字体间相异的部分就较容易被选取出来作为编码,避免出现编码相同的情况,从而降低选字率。

或者,编码规则可以包括以两个字码的组合代表所述半元字形,并以三个字码的组合代表所述汉字中的所述半元字形以外的余下部分。在「廿六码」中使用「半元法」时,其中十个半元─「、王、糹、火、巾、目、酉、車、言、石」,不会跟一般半元那样只取一码,它们须依旧取两码(因此「廿六码」有部分字的编码是有五个字母的)。这样可弥补此模式因字母数量较少,选字率略高于「金石码」的不足。

「另一半」取三码的方法,可以有另一个更简单的形式。其规则如下:若「首部」和「次部」皆有两码可取,剔除「数字」最小的那个。

有利地,「半元法」可说是最适合追求极速、高效的使用者。但如果不介意有适量的选字,从相反的方向出发,也可以把半分输入法的编码方式简化,例如,编码规则可以包括限定所述字码组合为具有一至两个字码。在这一个示例中,打每一个字时,最多也只须按下两个字母。这个模式可以理解为简易模式─「两码模式」的取码方式是:「一分为二,各取一码」。

优选地,可以用以下比喻来说明三种编码模式之间的分别:「一般(不用半元法)=二加二」、「半元法=一加三或三加一」、「两码模式=一加一」。

另外,简体字也可利用半分输入法。图8-9显示了简体半分输入法的键盘布局。其下方则列出简体字版的「半元字形」。

同时参考图5–6,繁、简「半分」之间最明显的分别在于字母名称(中文字母名称作用是方便表述,只使用按键名称,半分输入法依然可以如常运作)。由于在简体字中,「车(車)、鸟(鳥)、华(華)」三个原字母,因为字形改变而必须「迁」往其他按键(不再是字母),原先的位置会被「申」、「艮」、「卄」所取代。

此外,「言、金」两字的偏旁写法在简体字中有很大的转变,因此,沿用「特殊定义」的方式来处理它们,以避免繁、简体字的取码结果有太大的差异。

讠─「言」字的偏旁写法,整个字形取字母﹝言﹞(p)/中华码(0)。

钅─「金」字的偏旁写法,整个字形取字母﹝金﹞(g)/中华码(5)。

「半元法」方面,两个被「迁徙」的「半元」中,由于「车」的新「特征」─「」所属的按键上已另有「半元」,所以它必须从「半元」家族中剔除。而「鸟」因为是「右半元」,虽与「马」同处于一个按键上,但仍可保留「半元」的地位。

本发明的输入法还可提供以下辅助功能的操作技巧。如输入词语、打繁出简等。

输入词语的规则包括:「两字词」─两个字各取两码。「三字词」─第一个字取两码,其余两个字各取一码。「四字词」─四个字各取一码。「多于四个字的词语」─首三个字各取一码,最后一个字取一码。

其他功能可以协助执笔忘字的使用者,方法是在某个字的编码前方加上「附加按键」(不是半分输入法字母所用的按键,如][\=-等)或「附加字母」(半分输入法字母的按键)来达成的。后者因为是「字母键」,在配合一个本身编码只有三个或以下字母的字使用时,必须重复该「附加字母」,使加起来的编码总数达到五个(使用「超半元」时则为六个)字母。以避免与一般字的编码混淆。以下举例说明:

「同音字输入」─在「美」字的编码的前方加按「附加按键」─﹝-﹞或「附加字母」─﹝0﹞可打出其同音字「每」。(以下会用符号﹝﹞标记「附加按键」和「附加字母」,不再另作说明。)

「近音字输入」─在「美」字的编码的前方加按﹝=﹞或﹝9﹞可打出它的近音字「微」。

「词首输入」─在「美观」一词的第一个字「美」字的编码的前方加按﹝[﹞或﹝8﹞可打出该词的第二个字「观」。

「词尾输入」─在「美观」一词的第二个字「观」字的编码的前方加按﹝]﹞或﹝7﹞可打出该词的第一个字「美」。

「打繁出简」─在「華」字的编码的前方加按﹝’﹞或﹝6﹞可打出它的简体字「华」。

「打简出繁」─在「华」字的编码的前方加按﹝\﹞或﹝5﹞可打出它的繁体字「華」。

输入词语时,为了避免词语的编码与一般单字的编码相同而增加选字率,亦可在词语编码的前方另加「附加字母」。包括:「四个或以上字数的词语」可用﹝4﹞、「三字词」可用﹝3﹞、「两字词」可用﹝2﹞。

由于金石码在配合半元法使用时,选字率很低,可以为每个须要选字的字另设一个编码,以避开选字操作。

「代选编码」─在「居」字的编码的前方加按﹝s﹞或在「居」字的「两码模式」编码的前方加按﹝2﹞都可无须选字而打出「居」。(第二种方法可不用理会「附加字母」的编码总数不少于五个的规定,但因应须要,部分字会有额外的规则。)

以上各项功能都只是编码上的安排,对输入法程序没有额外的要求。另外,半分输入法也提供了一些须要输入法程序配合的使用方式。例如:当capslock被启用时,可以用词语编码输入词语。这样,在不影响选字率之余,又无须加按「附加字母」。

由此可见,半分输入法虽以「分」为名,但它的真正意图却恰恰相反。有利的是,半分输入法能够找到「易学」与「效率」的最佳平衡点,并同时包含「多字母」和「少字母」两种模式及其优点。最终,让中文输入法「统一」在一个简单、有效的编码方式上。

因此,在介绍了几个实施例之后,本领域的技术人员可以认识到,不同的改动、另外的结构、等同物,都可以被使用而不会背离本发明的本质。相应的,以上的描述不应该被视为对本申请的权利要求所确定的本发明范围的限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1