周码群计算机汉字输入法的制作方法

文档序号:6600474阅读:246来源:国知局
专利名称:周码群计算机汉字输入法的制作方法
技术领域
本发明涉及一种计算机汉字输入方法。
现有的计算机汉字输入的方法众多,除以汉字频率为序的字频序号方法(如字频码法)与以平凡特性为序的平凡序号方法(如国标码法、区位码法、电报码法等)外,其它方法均以汉字固有属性为基础,且其输入的汉字代码大致可分为音码、形码和音形(含形音)结合码。通常,音码可选用汉字读音的声母、韵母、声调等要素,形码可选用汉字的字形构件、字体结构、笔画画数等要素,音形结合码则是音码和形码所选用要素的适当结合。总之,汉字属性要素可统归为汉字的“声”、“韵”、“调”、“形”、“体”、“画”六大要素。在实际应用中,通常以形码和音形结合码为主。就独立的形码方案和音形结合码方案中“形”的部分而言,又通常以对汉字字形构件的拆分和输入方法为核心内容。在此方面,现有方案的处理方式各异,如CN86107235A公开的“词字二元编码输入汉字系统及其键盘”,CN1047930A公开的“音形结合式汉字输入方法及其键盘”等。但是,现有汉字字形构件的拆分及输入方案普遍存在以下问题字形构件的拆分及输入方式较为单一、死板,不但难于记忆,更严重的是不便适应不同文化程度和使用要求的人们使用。因此,不论是独立的形码方案还是音形结合码方案,均不能让用户根据自己的文化程度、习惯偏好、用途场合而灵活地对汉字字形进行拆分及输入。所以,上述现有计算机汉字输入方法有待于作更进一步的改进。
本发明的目的是以对汉字字形构件的拆分及输入方法的改进为核心,提供一种适应面宽、使用灵活、好学易记、输入快捷、易于普及的计算机汉字输入方法。
本发明的计算机汉字输入方法使用现有通用的西文键盘作为操作键盘。其主要内容包括(a)确定汉字的“声”、“韵”、“调”、“形”、“体”、“画”六个要素的代码;(b)以键盘的某一键符作为配尾符;(c)汉字输入操作。具体说明如下(1)按以下方式确定汉字的“声”、“韵”、“调”、“形”、“体”、“画”六个要素的代码(1.1)以汉字读音的声母或其简化英文码符作为“声”要素的代码。
(1.2)以汉字读音的韵母或其简化英文码符作为“韵”要素的代码。
(1.3)以汉字读音的声调之英文代码作为“调”要素的代码。
(1.4)“形”要素的代码由汉字字形构件组中各子构件所对应的子“形”要素代码共同构成,且以其汉字字形子构件的各自简称之声母或简化英文码符作为与之对应的子“形”要素代码。
(1.5)以汉字字体结构的英文代码作为“体”要素的代码。
(1.6)以汉字笔画画数的英文代码作为“画”要素的代码。
需要特别指出的是在上述方式(1.4)中,字形构件组的构成方法是本发明的特点之一。在本发明中,汉字的“形”要素与汉字的字形构件组相对应,而任一汉字的字形构件组则由对该汉字进行拆分时所得的全部字形子构件共同构成。此处所说的汉字字形子构件简称子构件,包括了单笔画、非字笔画组、成字笔画组三种类型。对任一汉字的拆分至少进行一轮,且首轮拆分的拆分对象必须是所论汉字本身;每轮拆分,均按书写先后(其某一子构件的诸笔画中若至少有一笔画居先,则称该子构件居先)依次从当前拆分对象中逐一拆分出其当前轮各子构件,并使所得当前轮各子构件必须且仅包含当前拆分对象的所有笔画;若当前轮拆分所得最末子构件为非字笔画组或成字笔画组,则以该最末子构件为新一轮拆分对象而继续进行下一轮拆分,直至某一轮拆分所得最末子构件已是单笔画为止;最后,将每一轮所得各子构件按其拆出先后顺次排列,即得所论汉字的字形构件组。本发明中,所谓成字笔画组是指由多个单笔画构成的某一特定汉字的一部分,且这部分本身若独立则恰为或者颇似某一汉字(注其相似方式,包括对所似汉字的变形相似、镜象相似、旋转相似等);所谓非字笔画组是指由多个单笔画构成的某一特定汉字的一部分,但这部分本身若独立则既不为也不似某一汉字。例如,对汉字“中”进行拆分,其首轮拆分对象即为汉字“中”本身。首轮拆分时,按书写先后可将该拆分对象“中”拆分为“口”+“丨”;其中,“口”为成字笔画组,“丨”为单笔画。由于首轮拆分所得最末子构件“丨”已为单笔画,故不再继续往下拆分(注意此时,尽管汉字“中”的首轮拆分所得子构件“口”也为成字笔画组,但是由于该子构件并不是最末子构件,故不对该子构件“口”进行再拆分)。因此,汉字“中”的字形构件组亦即由子构件“口”和“丨”共同构成。又如,对汉字“词”进行拆分,其首轮拆分对象即为汉字“词”本身。首轮拆分时,按书写先后可将该拆分对象“词”拆分为“讠”+“司”,其中“讠”、“司”分别为非字笔画组和成字笔画组。由于首轮拆分所得最末子构件“司”为成字笔画组,故需以该最末子构件“司”为新的拆分对象继续进行第二轮拆分,即可按书写先后再将该拆分对象“司”拆分为“”+“一”+“口”。由于第二轮拆分所得最末子构件“口”仍为成字笔画组,故还需以该最末子构件“口”为新的拆分对象继续进行第三轮拆分,即可按书写先后再将该拆分对象“口”拆分为“冂”+“一”。由于第三轮拆分所得最末子构件“一”已为单笔画,故不再继续往下拆分。因此,本例的拆分中,汉字“词”的字形构件组即由子构件“讠”、“司”、“”、“一”、“口”、“冂”和“一”共同构成。
应当注意,本发明中对同一汉字,一般都可按不同形式进行拆分,从而形成其风格相同但特色各异的字形构件组与“形”要素的代码。因此,用户完全可以根据自己对汉字的掌握和理解程度、按照自己的习惯和偏好、针对自己的用途和场合特点等,方便灵活、能上能下地选择与之相宜的有关形式来进行拆分和输入汉字。例如对上例中的同一汉字“词”,初学汉字的某小学生,可将“词”字全部拆分成单笔画,故可得该字形构件组由仅含单笔画的子构件“丶”、“ ”、“”、“一”、“丨”、“冂”和“一”构成;当该小学生已学会偏旁“讠”,但未学过汉字“口”、“司”时,则可将“词”字中笔画组“讠”部分作为非字笔画组进行拆分,而仅将“词”字中笔画组“司”部分按单笔画进行拆分,故可得该字形构件组由同时含单笔画、非字笔画组的子构件“讠”、“”、“一”、“丨”、“ ”和“一”构成;当该小学生已学会偏旁“讠”和汉字“口”、“司”时,便可将“词”字中笔画组“讠”部分、“口”笔画组中笔画组“冂”部分都作为非字笔画组进行拆分,而将“词”字中笔画组“司”部分、“司”笔画组中笔画组“口”部分均按成字笔画组进行拆分,故可得该字形构件组由同时含单笔画、非字笔画组、成字笔画组的子构件“讠”、“司”、“”、“一”、“口”、“冂”和“一”构成。显然,为使拆分及输入速度加快,通常应遵从“能分大不分小”这一基本拆形原则,同时,还可按“拆分字形,先整体后局部;拆分局部,先成字(笔画组)后其它(即非字笔画组、单笔画);拆分其它,先非字(笔画组)后单笔(画)”的口诀进行由大到小的有序拆分。
在本发明中,“形”要素的代码由字形构件组中各子构件所对应的子“形”要素代码共同构成;“形”要素的代码中各子“形”要素代码,按与之对应的各子构件在字形构件组中的位置顺次排列,且以其子构件的各自简称之声母或简化英文码符作为子“形”要素代码。本发明可使用的子“形”要素代码系列举例如附表1~3所示。附表1中,给出了从“二笔”到“九笔”共十种类型的单笔画子“形”要素代码系列;其中,每个类型的代码系列又进一步分为声笔、英笔、键笔和纯数笔四个子码系列,且声笔子码由单笔画名称之简称的声母而得,英笔和键笔子码为其简化英文码符,至于纯数笔子码则是与键笔子码相对应的、位于通用键盘右方的阿拉伯数字小键盘上的纯数字码符(注意与此处的键笔相似,后述的键调、键体、键画亦各有其对应的纯数调、纯数体、纯数画;但是,凡纯数笔、纯数调、纯数体、纯数画,均仅仅供完全不懂汉语拼音和英文字母的用户输入汉字之用,故并不提倡之。限于篇幅,以下从略)。实际使用时,只需选用某一类型中的某个子码系列即可。此处,推荐使用“八笔”这一类型中声笔的单笔画子“形”要素代码系列。在后面的汉字输入实施例中,单笔画子“形”要素均选用“八笔”类型中声笔的代码系列。附表2中,给出了非字笔画组子“形”要素代码;其中,前69个为简体笔画组,后33个为繁体笔画组(专用于繁体汉字的输入;在繁体字中,这些笔画组均为非字笔画组)。附表3中,给出了成字笔画组子“形”要素代码,共包含了1069个成字笔画组代码。应当指出本发明为了给某些特殊用户所专用的、非标准普通话的、特殊定义的声母或韵母提供支持,允许用特殊定义的声母或韵母来取代标准普通话的声母或韵母;例如,为了给不想或不善区分标准普通话声母“c和ch”、“s和sh”、“z和zh”、“f和h”、“l和n”等的特殊用户(例如某方言区的用户)提供支持,允许对此处各组声母分别合用本组中任指定的一个声母作其代表。
与上述方式(1.1)、(1.2)和(1.3)所对应的“声”、“韵”、“调”要素之代码具有多种形式,即既可以沿用现有音码方案中的代码系列,也可以设置新的代码系列。本发明可采用的“声”、“韵”、“调”代码系列举例如附表4所示,它提供了全声、缩声和首声三种类型的“声”要素代码系列;提供了全韵、简韵、短韵、缩韵和尾韵五种类型的“韵”要素代码系列;还提供了名调、数调、中调、英调、键调、曲调和纯数调七种类型的“调”要素代码系列。其中,前六种“调”要素对应的代码,均为汉字读音的声调之英文代码。在附表4中,标有“(假)”者是为代码形式齐整化而设定的假声母或假韵母(注可不用之)。实际使用时,“声”、“韵”、“调”要素均仅选取与本要素对应的一种代码系列即可。此处推荐“声”要素选取首声或缩声代码系列,“韵”要素选取缩韵或尾韵代码系列,“调”要素选取英调或数调代码系列。在后面的汉字输入实施例中,“声”要素选用首声代码系列,“韵”要素选用缩韵代码系列,“调”要素选用英调代码系列。
与上述方式(1.5)、(1.6)所对应的“体”和“画”要素之代码也具有多种形式,即同样既可沿用现有方案中涉及“体”和“画”要素的代码系列,也可以设置新的代码系列。本发明可采用的“体”要素、“画”要素的代码系列举例分别如附表5、附表6所示。附表5中,提供了从“三体”到“八体”共六种类型的“体”要素代码系列;其中,每个类型的代码系列又进一步分为声体、英体、键体和纯数体四个子码系列。实际应用时,只需选用某一类型的某个子码系列即可。此处,推荐使用“八体”这一类型中声体的“体”要素代码系列。附表6中,提供了全画、英画、键画、数画和纯数画五种类型的“画”要素代码系列。实际应用时,也只需选用某一类型中的某个子码系列即可。此处,推荐使用数画代码系列。在后面的汉字输入实施例中,“体”要素选用的是“八体”类型中声体子代码系列,“画”要素选用的是数画代码系列。
(2)以键盘的某一键符作为输入代码的配尾符。
在汉字输入过程中,当输入代码的码符个数未达到设定的额定码符个数时,通常可在所输入代码之后添加适当个数的配尾符,以配齐其额定码符个数(注本发明中,对非齐整化汉字编码方式下的各使用要素的代码,除其末尾使用要素的代码可用配尾符配齐至全码数外,其余使用要素的代码均用其本身而不用配尾符)。本发明使用的配尾符,可为某一固定的键盘键符,亦可为随输入代码的码符而变化的键盘键符(如以输入代码的末尾码符作为配尾符)。此处推荐使用固定的键盘键符作为配尾符。在后面的的汉字输入实施例中,选取字母键符“O”作为配尾符。
(3)对欲输入字,按以下步骤进行输入(3.1)选取前述汉字六个要素中的“形”要素和另外五个要素中的0~5个要素作为使用要素,并对选定的各个使用要素进行排序(此处特指对其前后位置的安排与确定),并确保选定的各使用要素在排序中至少出现一次;然后,击键输入所选定的使用要素排序结果。
(3.2)确定在所选使用要素排序下的各使用要素的额定码符个数。若采用计算机所默认的当前使用要素排序下各使用要素的额定码符个数之预设定值,则直接进入下一步骤;否则,击修改设定值键进入修改有关设定值的操作,并在输入额定码符个数的新设定值之后,击认可键确认之并进入下一步骤。
(3.3)由各使用要素的额定码符个数之和求得全码数。
(3.4)根据步骤(3.1)确定的使用要素排序,按(1)给出的方法,依次确定排序中各使用要素所对应的代码,并得到使用要素的代码序列。
(3.5)根据步骤(3.2)确定的各使用要素之额定码符个数,对所述使用要素的代码序列中各使用要素之代码的码符个数进行修正,使之与所述额定码符个数相等;若某一使用要素之代码的码符个数超过额定码符个数,则删除该使用要素之代码尾部的多余码符;若某一使用要素之代码的码符个数少于额定码符个数,则在该使用要素之代码尾部添加适当个数的配尾符,直至补足其差额为止。最后,得到使用要素的修正代码序列。
(3.6)依次击键输入使用要素之修正代码序列中的各码符,并按下列情况之一,完成欲输入字的正常输入若在输入完与步骤(3.3)所得全码数相等的全部码符之前,计算机显示屏提示区出现了欲输入字,则击设定的上屏键使之上屏,完成其输入;
若在刚输入完与步骤(3.3)所得全码数相等的全部码符后,计算机显示屏提示区恰出现欲输入字,并因它无其重码字而自动上屏,则自动完成其输入;
若在刚输完与步骤(3.3)所得全码数相等的全部码符后,计算机显示屏提示区恰出现欲输入字,但它有其重码字,则击设定的上屏键使之上屏,完成其输入;
若在输完与步骤(3.3)所得全码数相等的全部码符后,计算机显示屏提示区并未出现欲输入字,则先击设定的翻屏键进行翻屏查看,直至欲输入字恰出现,再击设定的上屏键使之上屏,完成其输入。
需要说明的是,在上述步骤(3.1)中,既可仅选取“形”要素作为使用要素(此时即构成单纯的形码方案,如后述),也可同时选取“形”要素与“声”、“韵”、“调”、“体”、“画”中的一个至五个要素作为使用要素,而“形”要素则作为必选的一种要素;此外,所选定的使用要素在其排序中还可重复出现。例如,可选取由以下汉字要素组合方式构成的复合型使用要素“形”、“声”要素;“形”、“声”、“韵”要素;“形”、“声”、“韵”、“调”要素;“形”、“画”要素;“形”、“体”要素;“形”、“声”、“体”要素;“形”、“声”、“韵”、“体”要素;“形”、“声”、“韵”、“画”要素;“形”、“声”、“韵”、“调”、“体”要素;“形”、“声”、“韵”、“调”、“画”要素;“形”、“声”、“韵”、“调”、“体”、“画”要素等等。本发明中,通过对选定的使用要素进行排序,可得到多种排序结果。例如,在选定由“形”、“画”要素构成的复合型使用要素后,既可选取“画、形”的要素排序方式,也可选取“画、形、形”的要素排序方式,亦可选取“形、画、形”的要素排序方式,还可选取“画、形、画、形”的要素排序方式。其中,在第一个排序方式“画、形”中,“画”、“形”要素分别是汉字的笔画数和“形”要素;在第二个排序方式“画、形、形”中,“画”要素是汉字的笔画数,前一“形”要素是指汉字的首字形子构件(或者部首)部分的“形”要素,后一“形”要素是指汉字的非首字形子构件(或者非部首)部分的“形”要素;在第三个排序方式“形、画、形”中,前一“形”要素是指汉字的首字形子构件(或者部首)部分的“形”要素,“画”要素为汉字的非首字形子构件(或者非部首)部分的笔画数,后一“形”要素是指汉字的非首字形子构件(或者非部首)部分的“形”要素;在第四个排序方式“画、形、画、形”中,前一“画”、“形”要素分别为汉字首字形子构件(或者部首)部分的笔画数和“形”要素,后一“画”、“形”要素分别为汉字非首字形子构件(或者非部首)部分的笔画数和“形”要素。本发明推荐的使用要素排序方式为(a)“形”要素(即仅选“形”要素作为使用要素);(b)“声、形”要素;(c)“声、韵、形”要素;(d)“声、韵、调、形”要素;(e)“形、声”要素;(f)“形、声、韵”要素;(g)“形、声、韵、调”要素;(h)“形、体”要素;(i)“画、形”要素。在把选定的使用要素排序结果输入计算机时,可按计算机的提示或要求进行操作。若计算机要求键入与选定的使用要素排序结果所对应的英文或数字代码,则键入其英文或数字代码;若计算机以移动选项式菜单进行提示,则可击键移动至所欲选项处,再击认可键(如回车键或其它约定键符)确认之。
在步骤(3.2)中,所谓额定码符个数即是指通常所说的某一要素的码长。就“形”要素而言,不但涉及“形”要素所包含的全部码符的额定个数,而且涉及“形”要素中各子“形”要素的码符之额定个数。本发明中额定码符个数的取值范围为1~4。在后面的汉字输入举例中,采用计算机的默认值,即子“形”要素和“声”、“韵”、“调”、“体”要素的额定码符个数为1,“画”要素的额定码符个数为2;当仅选“形”要素为使用要素时,“形”要素的额定码符个数为4(此时即为全码数,见下述);当选取使用要素的排序方式为“声、形”、“形、声”、“形、体”之一时,“形”要素的额定码符个数为3;当选取使用要素的排序方式为“声、韵、形”、“形、声、韵”、“画、形”之一时,“形”要素的额定码符个数为2;当选取使用要素的排序方式为“声、韵、调、形”、“形、声、韵、调”之一时,“形”要素的额定码符个数为1。本步骤中所述修改设定值键为特定的进入修改设定值操作的控制键,该键可为键盘上的某一单独键或组合键。认可键可为回车键或其它约定键符。
在步骤(3.3)中,所谓全码数即是指通常所说的全码长。本发明中全码数的取值范围为2~8,推荐的取值为4或5。在后面的汉字输入实施例中,采用计算机的默认值,其值为4。
在步骤(3.4)中,即是依据所选定的使用要素排序,依次用欲输入字的使用要素代码取代该排序中的相应使用要素,从而将使用要素排序转换为使用要素代码序列。在后面的汉字输入实施例中,汉字的使用要素代码取自附表1~6。
在步骤(3.6)中,由于欲输入字在本发明的相应计算机软件中可能被处理为高频字或较高频字,故依据“高频先见”的原则,在输入码符个数尚未达到全码数时,欲输入字有可能“提前”出现于计算机显示屏提示区;此时,尽管所输入的码符数还少于设定的全码数,但已不必再继续输入后面的码符,而只需击上屏键使之上屏即可。在输毕全码数个数的码符(以下简称全码)之前,对出现于显示屏提示区的欲输入字,通常需击上屏键对其认可,并让它到达显示屏正文区当前光标位置(即通常所说的上屏),从而完成其输入。该上屏键可为键盘上的空格键、数字键、复合键(例如,双按键“Alt-数字键”)等。在后面的汉字输入实施例中,上屏键主要采用数字键,所用数字键的数字与显示屏提示区中欲输入字的序号相对应。另外,在输入毕全码的情形下,若无与欲输入字编码相同的重码字,则该欲输入字会自动上屏并完成其输入,而此时便无需再击上屏键。在输入毕全码且欲输入字有重码字的情形下,若欲输入汉字已出现于显示屏提示区,则可击上屏键使之上屏,完成其输入;若欲输入字并未出现于显示屏提示区,则说明该欲输入汉字不在当前屏,故先击翻屏键变换显示屏提示区的显示内容,至欲输入字出现于显示屏提示区,再击上屏键使之上屏,完成其输入。此处所述翻屏键,可为键盘上的“-”、“=”键,或“,”、“.”键,“←”、“→”键,等等。
还需要说明的是,一旦经步骤(3.1)、(3.2)和(3.3)选定了使用要素的排序、额定码符个数和全码数,只要不退出并改变该选定结果,则计算机对之将自行默认并保持不变。亦即是说,在输完第一个欲输入字后,只要用户不另行改变所选定结果,则可从步骤(3.4)开始继续输入其余汉字,而无需再重复执行步骤(3.1)、(3.2)和(3.3)。
本发明的汉字输入方法与前述现有汉字输入方法相比,不论是仅选“形”要素的单纯形码方案还是“形”要素与其余汉字要素相结合的方案,其汉字字形构件的拆分及输入方式均极为灵活方便,使用者不但喜学乐用、易懂好记、输入快捷,并且可根据自己的文化程度、习惯偏好、用途场合而自如地进行操作,一改现有计算机汉字输入法的死板、生硬、枯燥和乏味,使计算机汉字输入的学习及具体操作有了普适性、灵活性、简便性、快捷性与趣味性。不论就字形构件的拆分及输入方式而言,还是就“形”要素与其余要素的组合及排序形式而言,其可选性极强,其方便性极大,其简便性极好,其适用对象与范围也相应极宽,真可谓是一种码系设计周到、使用对象周全、普及提高周至的群体式计算机汉字输入方法,即可简称之为“周码群计算机汉字输入法”。
在此,应当特别说明的是本发明的汉字输入方法之适用范围,绝不仅限于计算机(尽管此处以它为主),也同样包括其它类似设备(例如,电子字典、词典、打字机、字幕机、翻译器等)。
以下结合实施例,对本发明的内容作进一步的说明,但本发明的内容不仅限于实施例中所涉及的内容。
实施例1欲输入字为“猫”,按纯“形”之码系方式输入,具体操作如下a.在计算机显示屏菜单下选定使用要素仅为“形”要素,即单纯的“形”码方案。采用计算机默认的额定码符个数和全码数,即子“形”要素的额定码符个数为1,“形”要素的额定码符个数为4,全码数为4。
b.按前述“形”要素的确定方法,将汉字“猫”拆分为字形构件组“犭”、“苗”、“艹”、“田”、“口”、“十”、“一”、“丨”(注其子构件的全称依次为“反爪旁、苗字形、草类头、田字形、口字形、十字形、横笔画、竖笔画”,简称依次为“反、苗、草、田、口、十、横、竖”)。此处共拆分四轮,第一轮以汉字“猫”本身为拆分对象,第二轮以成字笔画组“苗”为拆分对象,第三轮以成字笔画组“田”为拆分对象,第四轮以成字笔画组“十”为拆分对象。根据附表1~3,得该字形构件组中各子构件对应的子“形”要素代码为“f”、“m”、“c”、“t”、“k”、“s”、“h”、“s”(注此处的“f”是反爪旁“犭”的简称“反”之汉语拼音声母首字符,其余类同;以下从略)。各子“形”要素代码按与之对应的子构件在字形构件组中的位置顺次排列后,即得汉字“猫”的“形”要素代码“fmctkshs”,亦即本例中使用要素的代码序列。
c.按计算机默认的额定码符个数和全码数对上述使用要素代码序列进行修正此处删除该代码序列尾部多余的码符,得其使用要素的修正代码序列“fmct”(全码数为4)。
d.依次击键输入该代码序列“fmct”中的各码符。在输入“f”、“m”、“c”三个码符后,计算机显示屏提示区恰出现欲输入字“猫”,其序号(即该字之前所标注的序号)为3;故击数字键“3”使“猫”字上屏,从而完成其输入。
需要深入说明的是①在本发明中,考虑到当汉字字形构件组中的子构件个数(本例为8)大于“形”要素额定码符个数(本例为4)时,对汉字“形”的部分施行编码所能用到的字形构件组中的子构件,实际上至多是其字形构件组的前“形”要素额定码符个数(本例为前4个)的子构件,可称这些子构件(本例为“犭”、“苗”、“艹”、“田”)为其字形构件组的简化字形构件组;因此,这种情况下的构造字形构件组的实际操作,完全可以并且应当简化为只构造其简化字形构件组的操作,即实际操作时,只需根据欲输入字的“形”要素额定码符个数(本例为4),部分地拆出欲输入字的前几个(本例为前4个)相关子构件(本例为“犭”、“苗”、“艹”、“田”)以构成简化字形构件组,即可满足其对汉字的“形”的部分施行编码的需要,而无需完整地继续拆出其后面的剩余子构件,从而加快汉字的拆分与输入速度。同理,可将由字形构件组所决定的“形”要素代码,对应地简化为由其简化字形构件组所决定的“形”要素简化代码(本例为“fmct”);将使用要素的代码序列,对应地简化为使用要素的简化代码序列(本例为“fmct”)。以下实施例中,凡此类情况均采用这种更简便快捷的方式简化字形构件组、“形”要素简化代码、使用要素的简化代码序列。
②对于使用频率较高的欲输入字,常常无需输足其全码数的码符就可使它以当前字的方式出现在显示屏提示区,故这时只需击上屏键使之上屏即可;但是,此时即使再继续输入完其全码数的各码符,也丝毫不影响欲输入字在显示屏提示区的既成存在与击键上屏。
实施例2欲输入字为“中”,按“声”、“形”为序之码系方式输入,具体操作如下a.在计算机显示屏菜单下选定使用要素及其排序为“声”、“形”要素。采用计算机默认的额定码符个数和全码数,即子“形”要素和“声”要素的额定码符个数为1,“形”要素的额定码符个数为3,全码数为4。
b.根据附表4,得汉字“中”的“声”要素代码为“z”(即声母“zh”的首字符,下同)。按前述方法,汉字“中”的字形构件组由子构件“口”、“丨”构成(注其子构件的全称依次为“口字形、竖笔画”,简称依次为“口、竖”);根据附表1和附表3,得汉字“中”的“形”要素代码为“ks”。最后,得本例中使用要素的代码序列“zks”。
c.按计算机默认的额定码符个数和全码数对上述使用要素代码序列进行修正此处在该序列的尾部添加一个配尾符“o”,得其使用要素的修正代码序列“zkso”。
d.依次击键输入该代码序列“zkso”中的各码符。在输入“z”、“k”两个码符后,计算机显示屏提示区恰出现欲输入字“中”,其序号为2;故击数字键“2”使“中”字上屏,从而完成其输入。
需要说明的是,实际操作时,当使用要素的代码序列中的所含码符个数少于全码数时,亦可先不考虑补足配尾符“o”,而留待依次击键输入该代码序列中各码符后,若计算机显示屏提示区仍未出现欲输入字,再补充输入配尾符“o”,直至欲输入字出现或码符个数达到全码数。
实施例3
欲输入字为“壮”,按“声”、“韵”、“形”为序之码系方式输入,具体操作如下a.选定使用要素及其排序为“声”、“韵”、“形”要素。采用计算机默认的额定码符个数和全码数,即子“形”要素和“声”、“韵”要素的额定码符个数为1,“形”要素的额定码符个数为2,全码数为4。
b.根据附表4,得汉字“壮”的“声”、“韵”要素代码分别为“z”(即声母“zh”的首字符)、“s”(即韵母“uang”的压缩表示)。其简化字形构件组由“丬”、“士”构成(注其子构件的全称依次为“将字旁、士字形”,简称依次为“将、士”);根据附表2和附表3,得其“形”要素简化代码为“js”。最后,得本例中使用要素的简化代码序列“zsjs”。
c.对上述序列进行修正,得其使用要素的修正代码序列“zsjs”。(注在采用简化字形构件组的情况下,因其使用要素的简化代码序列长度恰好为全码数,故此时的使用要素简化代码序列也必定为使用要素修正代码序列。因此,本步骤可略。下类同。)d.依次击键输入该代码序列“zsjs”中的各码符。在输完该序列中四个码符后,计算机显示屏提示区恰出现欲输入字“壮”,其序号为4,且无其重码字;故“壮”字自动上屏,从而自动完成其输入。
实施例4欲输入字为“漆”和“工”,欲输入标点符号为“。”,按“声”、“韵”、“调”、“形”为序之码系方式输入,具体操作如下a.选定使用要素及其排序为“声”、“韵”、“调”、“形”要素。采用计算机默认的额定码符个数和全码数,即子“形”要素和“声”、“韵”、“调”要素的额定码符个数为1,“形”要素的额定码符个数为1,全码数为4。
b.根据附表4,得汉字“漆”的“声”、“韵”、“调”要素代码分别为“q”(即声母)、“i”(即韵母)、“a”(即一声)。其简化字形构件组为“氵”(注其子构件的全称为“三点水”,简称为“三”);根据附表2~3,得其“形”要素简化代码为“s”。最后,得本例中“漆”的使用要素简化代码序列“qias”。同理,得“工”的使用要素简化代码序列“gpae”。
c.对上述序列进行修正,得“漆”的使用要素的修正代码序列“qias”。同理,得“工”的使用要素的修正代码序列“gpae”(注本步骤可略)。
d.依次击键输入“漆”的修正代码序列“qias”中的各码符。在输完该序列中“q”、“i”、“a”、“s”四个码符后,计算机显示屏提示区恰出现欲输入字“漆”,其序号为4,但有其重码字;直接继续击键输入下一欲输入字“工”的修正代码序列“gpae”的首码符“g”,便将“漆”字自动顶出并使它自动上屏,从而完成“漆”字的输入。此处,也可击数字键“4”使“漆”字上屏。
e.继续依次击键输入欲输入字“工”的修正代码序列“gpae”中的其余码符。在输入完该序列中第二个码符“p”(即韵母“ong”的压缩表示),计算机显示屏提示区恰出现欲输入字“工”,其序号为2;因该字为当前字(所谓当前字,是指在输入欲输入字的编码过程中,其计算机显示屏提示区中刚出现的、其字尾用光标动态标示出的当前屏首选汉字。它或者是与所输入的每个当前码符彼此对应的、逐码后移的、一码一字的当前屏某个汉字,或者是翻屏查看时的当前屏首汉字),故可直接继续输入下一欲输入之非汉字编码符号的句号“。”,便将“工”字自动顶出并使它和句号“。”一起上屏,从而完成“工”和“。”的输入。
实施例5欲输入字为“来”,按“形”、“声”为序之码系方式输入,具体操作如下a.选定使用要素及其排序为“形”、“声”要素。采用计算机默认的额定码符个数和全码数,即子“形”要素和“声”要素的额定码符个数为1,“形”要素的额定码符个数为3,全码数为4。
b.根据附表4,得汉字“来”的“声”要素代码为“1”。其简化字形构件组为“未”、“ ”、“丶”(注其子构件的全称为“未字形、内八点、点笔画”,简称依次为“未”、“内”、“点”);根据附表1~3,得其“形”要素简化代码为“wnd”。最后,得本例中使用要素的简化代码序列“wndl”。
c.对上述序列进行修正,得其使用要素的修正代码序列“wndl”(注本步骤可略)。
d.依次击键输入该代码序列“wndl”中的各码符。在输完该序列中首码符“w”后,计算机显示屏提示区恰出现欲输入字“来”,其序号为1;因该字为当前字,故可击当前字上屏键-空格键,使“来”字上屏,从而完成其输入。
实施例6欲输入字为“淇”,按“形”、“声”、“韵”为序之码系方式输入,具体操作如下a.选定使用要素及其排序为“形”、“声”、“韵”要素。采用计算机默认的额定码符个数和全码数,即子“形”要素和“声”、“韵”要素的额定码符个数为1,“形”要素的额定码符个数为2,全码数为4。
b.根据附表4,得汉字“淇”的“声”、“韵”要素代码分别为“q”、“i”。其简化字形构件组为“氵”、“其”(注其子构件的全称为“三点水、其字形”,简称依次为“三”、“其”);根据附表2~3,得其“形”要素简化代码为“sq”。最后,得本例中使用要素的简化代码序列“sqqi”。
c.对上述序列进行修正,得其使用要素的修正代码序列“sqqi”(注本步骤可略)。
d.依次击键输入该代码序列“sqqi”中的各码符。在输入“s”、“q”、“q”、“i”四个码符后,计算机当前显示屏提示区并未出现欲输入字“淇”,于是先击(向后)翻屏键“=”查看下一屏,发现欲输入字“淇”恰出现在显示屏提示区,其序号为8;故可击准当前字上屏键-数字键“8”或双按键“Alt-8”,使“淇”字上屏,从而完成其输入。
实施例7欲输入字为“祈”,按“形”、“声”、“韵”、“调”为序之码系方式输入,具体操作如下a.选定使用要素及其排序为“形”、“声”、“韵”、“调”要素。采用计算机默认的额定码符个数和全码数,即子“形”要素和“声”、“韵”、“调”要素的额定码符个数为1,“形”要素的额定码符个数为1,全码数为4。
b.根据附表4,得汉字“祈”的“声”、“韵”、“调”要素代码分别为“q”、“i”、“b”(即二声)。其简化字形构件组为“礻”(注其子构件的全称为“神类旁”,简称为“神”);根据附表2,得其“形”要素简化代码为“s”。最后,得本例中使用要素的简化代码序列“sqib”。
c.对上述序列进行修正,得其使用要素的修正代码序列“sqib”(注本步骤可略)。
d.依次击键输入该代码序列“sqib”中的各码符。在输入“s”、“q”、“i”、“b”四个字符后,计算机显示屏提示区出现有重码字的欲输入字“祈”,其序号为6;故可击数字键“6”(注若不慎误击翻屏键“=”或“-”查看下一屏,发现欲输入字“祈”又出现在下一屏提示区,但其序号改为3,则可改击数字键“3”),使“祈”字上屏,从而完成其输入。
实施例8欲输入字为“周”,按“形”、“体”为序之码系方式输入,具体操作如下a.选定使用要素及其排序为“形”、“体”要素。采用计算机默认的额定码符个数和全码数,即子“形”要素和“体”要素的额定码符个数为1,“形”要素的额定码符个数为3,全码数为4。
b.根据附表5,得汉字“周”的“体”要素代码为“s”(即三包围结构)。其简化字形构件组为“冂”、“土”、“口”(注其子构件的全称为“门形框”、“土字形”、“口字形”,简称为“门”、“土”、“口”);根据附表2~3,得其“形”要素简化代码为“mtk”。最后,得本例中使用要素的简化代码序列“mtks”。
c.对上述序列进行修正,得其使用要素的修正代码序列“mtks”(注本步骤可略)。
d.依次击键输入该代码序列“mtks”中的各码符。在输入“m”、“t”二个码符后,计算机显示屏提示区恰出现欲输入字“周”,其序号为2;故可击当前字上屏键的空格键或者准当前字上屏键的数字键“2”(注即使再继续输入其第三个码符“k”甚至第四个码符“s”后,尽管此时的当前字已不再是“周”,然而这对“周”字及其序号的既成存在毫无影响,即虽不能击当前字上屏键的空格键使“周”字上屏,但仍可击准当前字上屏键的数字键“2”),使“周”字上屏,从而完成其输入。
实施例9欲输入字为“武”,按“画”、“形”为序之码系方式输入,具体操作如下a.选定使用要素及其排序为“画”、“形”要素。采用计算机默认的额定码符个数和全码数,即子“形”要素的额定码符个数为1,“画”要素的额定码符个数为2,“形”要素的额定码符个数为2,全码数为4。
b.根据附表6,得汉字“武”的“画”要素代码为“ob”(意即笔画数“8”表示为“08”)。其简化字形构件组为“二”、“止”(注其子构件的全称为“似二形”、“似止形”,简称为“二”、“止”);根据附表2,得其“形”要素简化代码为“ez”。最后,得本例中使用要素的简化代码序列“obez”。
c.对上述序列进行修正,得其使用要素的修正代码序列“obez”(注本步骤可略)。
d.依次击键输入该代码序列“obez”中的各码符。在输入“o”、“b”、“e”、“z”四个码符后,计算机显示屏提示区恰出现欲输入字“武”,其序号为4,且无其重码字;故欲输入字“武”自动上屏,从而自动完成其输入。
另外,利用本发明的汉字输入方法尚可完成汉语词组的输入,以提高中文输入速度。实施词组输入时,可先确定欲输入词的关键字序列及各关键字的字码,再选取各关键字字码的相关码符构成词码,并将该词码输入计算机,然后视欲输入词出现在计算机显示屏提示区的不同情况而分别采用类似于前述单字(即单个汉字)上屏的对应操作,使欲输入词上屏,从而完成其输入。限于篇幅,此处仅给出其关键内容-“确定欲输入词词码的具体方法”如下a.确定欲输入词的关键字序列设欲输入词内的汉字个数为m,设定的全码数(注前述单字的全码数与此处词组的全码数,恒保持一致)为n,则当m≤n,关键字序列由欲输入词内的全部汉字依序构成;
当m>n,关键字序列由欲输入词内的前n-1个与最末一个汉字依序构成;
b.确定关键字的字码关键字序列中各关键字的字码,亦即前述单字之使用要素的修正代码序列或简化代码序列,且各关键字所选的使用要素及排序均相同。
c.构成词码先求n除以m的商s,设余数为r,再按下述前增式词码构成法或后增式词码构成法,构成欲输入词词码(c.1)若s=0(即m>n),则两种词码构成法所得词码,均由各关键字字码的首码符依序构成;
(c.2)若s>0且r=0(即m≤n,且n能被m所整除),则两种词码构成法所得词码,均由各关键字字码的前s个码符依序构成;
(c.3)若s>0但r≠0(即m<n,但n不能被m所整除),则前增式词码构成法所得词码,由前r个关键字字码的前s+1个码符及后m-r个关键字字码的前s个码符依序构成;
后增式词码构成法所得词码,由前m-r个关键字字码的前s个码符及后r个关键字字码的前s+1个码符依序构成。
例如,在按“声”、“形”为序的码系方式输入且全码数为4时,下列各欲输入词词码的构成过程如下①对欲输入词“中华国宝熊猫”,得其上述方式(c.1)的词码参数为m=6,n=4,s=0。用上述两种词码构成法,可同得词组“中华国宝熊猫”→“中”+“华”+“国”+“猫”→“z”+“h”+“g”+“m”→词码“zhgm”。
②对欲输入词“中华”,得其上述方式(c.2)的词码参数为m=2,n=4,s=2,r=0。用上述两种词码构成法,可同得词组“中华”→“中”+“华”→“zk”+“hh”→词码“zkhh”。
③对欲输入词“中华国宝”,得其上述方式(c.2)的词码参数为m=4,n=4,s=1,r=0。用上述两种词码构成法,可同得词组“中华国宝”→“中”+“华”+“国”+“宝”→“z”+“h”+“g”+“b”→词码“zhgb”。
④对欲输入词“中华宝”,得其上述方式(c.3)的词码参数为m=3,n=4,s=1,r=1。若用前增式词码构成法,则得词组“中华宝”→“中”+“华”+“宝”→“zk”+“h”+“b”→词码“zkhb”;若用后增式词码构成法,则得词组“中华宝”→“中”+“华”+“宝”→“z”+“h”+“bb”→词码“zhbb”。















权利要求
1.一种使用现有通用西文键盘的计算机汉字输入方法,其特征在于(1)按以下方式分别确定汉字的“声”、“韵”、“调”、“形”、“体”、“画”六个要素的代码(1.1)以汉字读音的声母或其简化英文码符作为“声”要素的代码,(1.2)以汉字读音的韵母或其简化英文码符作为“韵”要素的代码,(1.3)以汉字读音的声调之英文代码作为“调”要素的代码,(1.4)汉字的“形”要素与汉字字形构件组相对应,任一汉字的字形构件组由对该汉字进行拆分所得的全部字形子构件共同构成,汉字字形子构件包括单笔画、非字笔画组、成字笔画组三种类型,对任一汉字的拆分至少进行一轮,每轮拆分中所得各字形子构件必须且仅包含拆分对象的所有笔画,各字形子构件按书写先后依次从拆分对象中拆分,首轮拆分的拆分对象为汉字本身,若当前轮拆分所得最末子构件为非字笔画组或成字笔画组,则以该最末子构件为拆分对象进行下一轮拆分,直至某轮拆分所得最末子构件是单笔画为止,字形构件组中各子构件按拆出先后顺次排列,“形”要素的代码由字形构件组中各子构件所对应的子“形”要素代码共同构成,“形”要素的代码中各子“形”要素代码按与之对应的各子构件在字形构件组中的位置顺次排列,且以子构件的各自简称之声母或简化英文码符作为子“形”要素代码,(1.5)以汉字字体结构的英文代码作为“体”要素的代码,(1.6)以汉字笔画画数的英文代码作为“画”要素的代码,(2)以键盘的某一键符作为输入代码的配尾符;(3)对欲输入字,按以下步骤进行输入(3.1)选取所述汉字六个要素中的“形”要素和另外五个要素中的0~5个要素作为使用要素,并对选定的各个使用要素进行排序,选定的各使用要素在排序中至少出现一次,然后击键输入所选定的排序结果;(3.2)确定在所选使用要素排序下的各使用要素的额定码符个数,若采用计算机所默认的当前使用要素排序下各使用要素的额定码符个数之预设定值,则直接进入下一步骤,否则击修改设定值键进入修改设定值的操作,并在输入额定码符个数的新设定值之后,击认可键进入下一步骤;(3.3)由各使用要素的额定码符个数之和求得全码数;(3.4)根据步骤(3.1)确定的使用要素排序,按(1)给出的方法,依次确定排序中各使用要素所对应的代码,得到使用要素的代码序列;(3.5)根据步骤(3.2)确定的各使用要素之额定码符个数,对所述使用要素的代码序列中各使用要素之代码的码符个数进行修正,使之与所述额定码符个数相等,若某一使用要素之代码的码符个数超过额定码符个数,则删除该使用要素之代码尾部的多余码符,若某一使用要素之代码的码符个数少于额定码符个数,则在该使用要素之代码尾符至补足其差额为止,最后得到使用要素的修正代码序列;(3.6)依次击键输入使用要素之修正代码序列中的各码符,并按下列情况之一,完成欲输入字的正常输入若在输入完步骤(3.3)所得全码数相等的全部码符之前,计算机显示屏提示区出现了欲输入字,则击设定在上屏键完成其输入;若在输出完步骤(3.3)所得全码数相等的全部码符后,欲输入字自动上屏,则自动完成其输入;若在输入完步骤(3.3)所得全码数相等的全部码符合是,计算机显示屏提示区出现欲输入字,则击设定的上屏键完成其输入;若在输入完步骤(3.3)所得全码数相等的全部码符后,计算机显示屏提示区并未出现欲输入字,则先击设定的翻屏键进行翻屏查看,直至欲输入字出现于显示屏提示区,再击设定的上屏键完成其输入。
2.如权利要求1所述的计算机汉字输入方法,其特征在于仅选取汉字的“形”要素作为使用要素。
3.如权利要求1所述的计算机汉字输入方法,其特征在于选取汉字的“形”要素和“声”要素作为使用要素,且使用要素排序为“声”要素在前,“形”要素在后。
4.如权利要求1所述的计算机汉字输入方法,其特征在于选取汉字的“形”、“声”、“韵”要素作为使用要素,且使用要素排序为“声”、“韵”、“形”顺次排列。
5.如权利要求1所述的计算机汉字输入方法,其特征在于选取汉字的“形”、“声”、“韵”、“调”要素作为使用要素,且使用要素排序为“声”、“韵”、“调”、“形”顺次排列。
6.如权利要求1所述的计算机汉字输入方法,其特征在于选取汉字的“形”要素和“声”要素作为使用要素,且使用要素排序为“形”要素在前,“声”要素在后。
7.如权利要求1所述的计算机汉字输入方法,其特征在于选取汉字的“形”、“声”、“韵”要素作为使用要素,且使用要素排序为“形”、“声”、“韵”顺次排列。
8.如权利要求1所述的计算机汉字输入方法,其特征在于选取汉字的“形”、“声”、“韵”、“调”要素作为使用要素,且使用要素排序为“形”、“声”、“韵”、“调”顺次排列。
9.如权利要求1所述的计算机汉字输入方法,其特征在于选取汉字的“形”要素和“体”要素作为使用要素,且使用要素排序为“形”要素在前,“体”要素在后。
10.如权利要求1所述的计算机汉字输入方法,其特征在于选取汉字的“形”要素和“画”要素作为使用要素,且使用要素排序为“画”要素在前,“形”要素在后。
全文摘要
一种使用现有通用西文键盘的计算机汉字输入方法,该方法包括a.确定汉字的“声、韵、调、形、体、画”六个要素的代码;b.选定配尾符;c.汉字输入操作。汉字的“形”要素代码由汉字字形构件组中各子构件所对应的子“形”要素代码共同构成。汉字输入操作包括a.选定使用要素及其排序;b.确定各使用要素的额定码符个数;c.求得全码数;d.确定使用要素代码序列;e.确定使用要素修正代码序列;f.击键输入修正代码序列。该方法中使用要素的选定及排序,字形构件的拆分及输入方式均灵活方便,适用于不同对象。
文档编号G06F3/023GK1101441SQ9411199
公开日1995年4月12日 申请日期1994年11月23日 优先权日1994年11月23日
发明者周启海 申请人:周启海
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1