组合式音形义汉字编码输入法的制作方法

文档序号:6361510阅读:481来源:国知局
专利名称:组合式音形义汉字编码输入法的制作方法
技术领域
本发明属于用于计算机或其他对汉字字符信息进行处理装置的汉字编码输入方法。
背景技术
本发明是对本申请人在此前提出的申请号为03112606.5发明专利技术申请案的一个实施方案。
发明目的本发明的目的是提出实施03112606.5号专利申请案的一类更适用于以词语输入为主的汉字编码输入的具体实施方案。

发明内容
本发明的计算机使用的组合式音形义汉字编码输入法,利用计算机通过字母键盘或者手机、计算机的数字键盘,输入汉字或词语,具体的实现步骤如下一、根据主形编码部件的含义归并设定25类编码部件字母型义类码,具体如下所示

二、设定编码部件字母型代码、编码部件字母型义类码根据GF3001规范要求,选取编码部件。选定的编码部件根据义相同或形相近等明显关联性,归并成编码部件组,并从每个编码部件组中选定一个主形编码部件作代表,每个编码部件赋予与其编码部件组的主形编码部件完成相同的编码部件字母型代码和编码部件字母型义类码。
为了更好适用于以词语输入为主的现代汉语文字的计算机或其他对汉字字符信息进行处理、存储、传输、显现、输入和输出装置的汉字输入,本发明对编码部件的设置和编码部件的字母型代码和字母型义类码的设置等又进行了一些新的设定。对于不是以汉语拼音首字母作编码部件字母型代码的有构词能力的成字编码部件,都再增设一个以其汉语拼音首字母作代码的编码部件字母型代码;还把一些非拼音首字母的成字编码部件的字母型全码改成拼音首字母的编码部件字母型全码;还对部分非成字编码部件以其与另一个编码部件组成的一个汉字增设为该编码部件组的主形编码部件;还调整、增加了一些编码部件;还对一些有两种字义和两种读音的编码部件增加了只作表达其成字编码部件的拼音首字母编码部件字母型全码,具体有“一”字母型全码为“YN”;“月”字母型全码为“YO”;“孑”字母型全码为“JC”;“行”字母型全码为“HF”。本汉字编码输入法设定的404个编码部件组中702个编码部件的部件形状、部件字母型代码、部件字母型义类码对照列于对照表《404个编码部件组、702个编码部件的编码部件字母型代码、编码部件字母型义类码对照表)》。为了叙述方便,把那些具有两种编码部件字母型代码的一类编码部件称之为双代码编码部件,只有一种编码部件字母型代码的一类编码部件称之为单代码编码部件;又把双代码编码部件中把以拼音首字母作编码部件字母型代码的编码部件的代码,称之为双代码编码部件拼音首字母字母型代码,简称首音字母型代码;把以非拼音首字母作编码部件字母型代码的编码部件的代码,称之为双代码编码部件非拼音首字母字母型代码,简称非首音字母型代码。那些单代码编码部件中除一些没有独立构词能力的编码部件以外,都是以拼音首字母作编码部件代码。
在编码部件的设定方面,当然还可以再增加一些或再减少一些编码部件,这只对编码输入法的重码率、重码字词键选率等技术指标产生一些影响,但对整个汉字编码输入法不构成根本性影响。
根据《对照表》的每个编码部件的字母型代码,把它分配设置在计算机通用字母键盘相应的字母键位上;同样根据上述《对照表》的每个编码部件的字母型义类码,把它分配设置在计算机通用键盘的相应的字母键上。这样,每个字母键位上,设置了具有相同字母型代码的编码部件集合和具有相同字母型义类码的另一个编码部件集合,这字母键的字母也就成为这些编码部件的字母型代码,同样也成为那些编码部件的字母型义类码。
三、设定27个含有构字能力特别强的主形编码部件的组为高频编码部件组,确定其组内的各个高频编码部件共计35个,高频编码部件在汉字结构中的主部位位置,具体见附图1《27个高频编码部件组的部件组号、高频编码部件的部件序号、基础部件表号、高频编码部件、部件字母型代码、部件字母型义类码、取码提示及其主部件位置对照表》。
四、设定字母码、编码部件字母型代码、字母型义类码转换成数字码、数字型代码、数字型义类码的方式,以及设定编码部件数字型全码为了在计算机数字键盘或者手机数字键上实现组合式音形义数字型汉字编码输入,把字母码及每个编码部件字母型代码、字母型义类码,根据GB/T18031-2000《信息技术数字键盘汉字输入通用要求》以如下两种方式转换成数字码及相应的数字型代码、数字型义类码第一种转换法,10键位法以1个数字码替换相应的几个字母码,具体为以1替换a、b、c;以2替换d、e、f;以3替换g、h、i;以4替换j、k;以5替换l、m;以6替换n、p;以7替换o、q、r;以8替换s、t、u;以9替换w、x;以0替换y、z。从而得到编码部件相应的数字型代码、数字型义类码以及拼音首字母的字母码转换成的数字码。对于双代码编码部件,只采用双代码编码部件拼音首字母字母型代码及其编码部件义类码转换成相应的数字型代码、数字型义类码;为了降低重码率,对于“广”、“女”、“石”三个编码部件组的编码部件不以上述方式转换,而定义其编码部件数字型代码加上数字型义类码分别为33、66、74;对于五类汉字笔画也不以上述方式转换,而定义为“一”横类笔画数字型代码为1;“丨”竖类笔画数字型代码为2;“丿”撇类笔画数字型代码为3;“丶”点类笔画数字型代码为4;“乛”折类笔画数字型代码为5;所有笔画类数字型义类码都为7。
第二种转换法,8键位法以1个数字码替换相应的几个字母码,具体为以2替换a、b、c;以3替换d、e、f;以4替换g、h、i;以5替换j、k、l;以6替换m、n、o;以7替换p、q、r、s;以8替换t、u;以9替换w、x、y、z;从而得到编码部件相应的数字型代码、数字型义类码;对于双代码编码部件,只采用双代码编码部件拼音首字母字母型代码、字母型义类码转换成相应的数字型代码、数字型义类码;为了降低重码率,定义“言”、“广”、“月”、“石”、“木”、“心”编码部件组,其数字型代码加上数字型义类码分别为46、44、96、74、89、94。对于五类汉字笔画,也不以上述方式转换,而定义为“一”横类笔画数字型代码为1;“丨”竖类笔画数字型代码为2;“丿”撇类笔画数字型代码为3;“丶”点类笔画数字型代码为4;“乛”折类笔画数字型代码为5;所有笔画类数字型义类码都为6。
为了降低重码率,每个编码部件的数字型全码定义为编码部件数字型代码+编码部件数字型义类码+编码部件的首笔画或者末笔画的部件数字型代码。由于所取笔画前后位置不同,每个编码部件能得到两类数字型全码,一种称为首笔画数字型全码,另一种称为末笔画数字型全码,相应能设计成两类数字型汉字编码输入法。
为了便于叙述,规定对某编码部件取3码,就是依次取其数字型全码;取2码,就是依次取其数字型代码和数字型义类码;取1码,就是取其数字型代码。
对于高频编码部件首笔画数字型全码如附图2《27个高频编码部件的部件组号、高频编码部件的部件序号、基础部件表号、高频编码部件、部件字母型代码、部件字母型义类码、10键位首笔数字型全码、8键位首笔数字型全码,取码提示及其主部件位置对照表》中所示。
五、组合式音形义汉字编码输入法利用上述方法形成的字母型汉字编码资源可以实现组合式音形义汉字的字母型编码输入,利用上述方法形成的数字型汉字编码资源可以实现组合式音形义汉字的数字型编码输入。组合式音形义汉字编码输入法由组合式音形义字母型汉字编码输入法和组合式音形义数字型字编码输入法两部分组成,既可以在同一台计算机上切换调用,也可以分别在两台计算机上单独使用;也可在其他处理汉字字符信息的装置上使用。
第一部分组合式音形义字母型汉字编码输入法为了实现现代汉语以词语输入为主的需要,同时解决使用者对不知道读音的汉字的输入,本发明对汉字字符集中的每个汉字赋予拼音首字母音形义字母型汉字编码和非拼音首字母音形义字母型汉字编码的两套编码,或者对那些能知读音的常用汉字赋予拼音首字母音形义字母型汉字编码,对于整个汉字字符集用非拼音首字母音形义字母型汉字编码方法赋予编码,这样可以适当降低汉字编码输入的重码率。用拼音首字母音形义字母型汉字编码实现汉字、词语的编码输入,用非拼音首字母的音形义字母型汉字编码实现使用者不知道读音的汉字的编码输入。为此,称之为组合式音形义字母型汉字编码输入法。上述两种编码可以编制在同一张码表中,这样重码率会提高,但使用时不需要切换;也可以分别编制在两张码表中,切换调用;当然也可以只设置拼音首字母音形义字母型汉字编码码表,采用拼音首字母音形义字母型汉字编码方法实现汉字的编码输入,遇到不知道读音的汉字,用疑问键代替拼音首字母,在显示窗中显示后,再用选择键选择;或者只设置非拼音首字母音形义字母型汉字编码码表,采用非拼音首字母音形义字母型汉字编码方法实现汉字的编码输入。
对设定采用的汉字字符集(如GB2312汉字字符集,或GB18030的汉字字符集,或方正兰亭的64447个汉字字符集)中的每个汉字及其现代汉语词语,根据所述的字母型汉字编码方法确定的编码,编制码表,利用汉字编码输入软件,把通过计算机字母键盘上输入的汉字、词语的外码,通过应用程序,从字库里调出相应的汉字的内码,进行显示、打印等操作。下面就组成组合式音形义字母型汉字编码输入法的两类汉字编码方法提出技术方案,在实际使用中只要在这两类汉字编码方法中各选择一种编码方法,组合在一起组成组合式音形义字母型汉字编码输入法;当然也可以只选择上述两类方法中的一种,完成汉字的编码输入。两类汉字编码技术方案分述如下(一)拼音首字母音形义字母型汉字编码方法设定码长为4,输入时,击4个编码字母键,如有重码字、词出现,再击选择键选择。对于码长不足4的汉字编码,以结束键结束,如有重码,再用选择键选择。为了区分字和词语,结束键可以分别设置,如用空格键作词语的结束键,Enter键作字的结束键,或者用Enter键作词语的结束键,空格键作字的结束键。在大小写字母的确定上,可以用小写字母给简体汉字编码,用大写字母给繁体汉字编码,或者相反设定,可以用小写字母给繁体汉字编码,用大写字母给简体汉字编码。利用字母编码资源,实现编码输入。为了减少击键次数,也可以选择一些常用的汉字,根据其拼音首字母音形义字母型汉字编码的第1、第2、第3的编码字母码设置出一批1码、2码、3码的简码,用结束键结束,选择键确定要输入的汉字。
由于本发明提出了让部分编码部件有两种字母型代码的技术方案,这样对于部分单个编码部件或者对于2个或者2个以上编码部件组成的汉字取编码时,又有两种方法。一种方法,在汉字编码部件输入时对于双代码编码部件,采用双代码编码部件拼音首字母字母型全码;在对2个或者2个以上编码部件组成的汉字取编码时,涉及到双代码编码部件取码时采用双代码编码部件非拼音首字母字母型代码、字母型义类码,故称之为拼音首字母混合式音形义字母型汉字编码。另一种方法,在成字编码部件输入时,对于双代码编码部件,仍然采用双代码编码部件拼音首字母字母型全码;在对由2个或者2个以上编码部件组成的汉字取编码时,涉及到双代码编码部件取码时,采用双代码编码部件拼音首字母字母型代码、字母型义类码,故称之为拼音首字母单一式音形义字母型汉字编码。这两种方法的编码都能实现汉字编码输入,比较而言,后者,思维上比较顺畅一些,但由于减少了参与编码的字母型代码数量,相对而言,重码率会提高。具体取码的技术方案分述如下A.4码法拼音首字母混合式音形义首部余部字母型汉字编码方法成字编码部件的编码对于双代码编码部件,依次取双代码编码部件拼音首字母字母型代码、字母型义类码,即双代码编码部件拼音首字母字母型全码;对于单全码编码部件,依次取其编码部件字母型代码、字母型义类码,即单代码编码部件字母型全码。
对于2个或者2个以上编码部件组成的汉字,取编码时,涉及到双代码编码部件取码时,采用双代码编码部件非拼音字母字母型代码、字母型义类码;首编码部件为高频编码部件的合体汉字其取码技术方案为对于由2个编码部件组成的汉字,先取该汉字汉语拼音首字母、再依次取第1编码部件字母型代码、第2编码部件字母型代码、第2编码部件字母型义类码;对于由3个或3个以上编码部件组成的汉字,先取该汉字汉语拼音首字母、再依次取第1编码部件、第2编码部件、末编码部件的字母型代码。对于首编码部件为非高频编码部件的2个以上编码部件组成的汉字其取码技术方案,可以从以下技术方案中任选一种a式对于首编码部件为非高频编码部件的由2个或者2个以上编码部件组成的汉字,先取该汉字汉语拼音首字母,再依次取首编码部件字母型代码、首编码部件字母型义类码、末编码部件字母型代码。其公式表述汉字拼音首字母+首部件字母型代码+首部件字母型义类码+末部件字母型代码b式其公式表示汉字拼音首字母+首部件字母型代码+末部件字母型代码+首部件字母型义类码c式2个编码部件组成的汉字,其公式表述汉字拼音首字母+首部件字母型代码+首部件字母型义类码+末部件字母型代码由3个或3个以上编码部件组成的汉字,其公式表述
汉字拼音首字母+首部件字母型代码+次部件字母型代码+末部件字母代码d式由2个编码部件组成的汉字,其公式表述汉字拼音首字母+首部件字母型代码+末部件字母型代码+首部件字母型义类码由3个或3个以上编码部件组成的汉字,其公式表述汉字拼音首字母+首部件字母型代码+次部件字母型代码+末部件字母型代码B、4码法拼音首字母混合式部首余部字母型汉字编码方法码长设定为4;成字编码部件的编码,对于双代码编码部件,依次取双代码编码部件拼音首字母字母型代码、字母型义类码,即双代码编码部件拼音首字母字母型全码;对于单代码编码部件,依次取其编码部件字母型代码、字母型义类码,即单代码编码部件字母型全码;对于2个或者2个以上编码部件组成的汉字,取编码,涉及到双代码编码部件取码时,采用双代码编码部件非拼音首字母字母型代码、字母型义类码;部首编码部件为高频编码部件的合体汉字其取码技术方案为对于由2个编码部件组成的汉字,先取该汉字汉语拼音首字母,再确定取部首编码部件字母型代码、余部编码部件字母型代码、余部编码部件字母型义类码,并以编码部件的首笔画先后为序,依次取编码,组合成整个汉字编码;对于由3个或3个以上编码部件组成的汉字,先取该汉字汉语拼音首字母、再确定取部首编码部件字母型代码、余部的第1编码部件字母型代码、余部的末编码部件字母型代码,并以编码部件的首笔画先后为序,依次取编码,组合成整个汉字编码;对于部首码部件为非高频编码部件的2个或2个以上编码部件组成的汉字,其取码技术方案如下先取该汉字汉语拼音首字母,再确定取部首编码部件字母型代码、部首编码部件字母型义类码、余部的首编码部件字母型代码,并以编码部件的首笔画先后为序,依次取编码,再组合成整个汉字的编码;4码法拼音首字母混合式音形义部首余部字母型汉字编码方法与上述A的4码法拼音首字母混合式音形义首部余部字母型汉字编码方法一样,对部首为非高频编码部件的2个以上编码部件组成的汉字的编码,还可有相应的多种形式。
C.4码法拼音首字母单一式音形义字母型汉字编码方法成字编码部件的编码,对于双代码编码部件,仍然依次取双代码编码部件拼音首字母字母型代码、字母型义类码,即双代码编码部件拼音首字母字母型全码;对于单代码编码部件,依次取其编码部件字母型代码、字母型义类码,即单代码编码部件字母型全码;对于2个或者2个以上编码部件组成的汉字取码时,涉及到双代码编码部件取码时,一律采用双代码编码部件拼音首字母字母型代码、字母型义类码,其他取码技术方案与拼音首字母混合式音形义首部余部字母型汉字编码方法和4码法拼音首字母混合式部首余部音形义字母型汉字编码方法完全一样。
为了减少重码率,在上述的编码中,在取汉字的拼音首字母时,也可以把声母发zh、ch、sh音的,设计成分别用e、u、i字母码替代。
(二)非拼音首字母音形义字母型汉字编码方法非拼音首字母音形义字母型编码可以从本申请人在03112606.5发明专利申请案中提出的字母型输入法类选取4码法部首余部音形义字母型汉字编码方法或者选取4码法首部余部音形义字母型汉字编码方法,也可以从下述的字母型汉字编码方法中任选一种。在取码涉及到双代码编码部件时,采用双代码编码部件非拼音首字母字母型代码、字母型义类,字母型全码;当然也可设计采用双代码编码部件拼音首字母字母型代码。
A.4码法非拼音首字母音形义首部余部字母型汉字编码方法码长设定为4;对于单个编码部件的汉字,依次取编码部件字母型代码、字母型义类码,因不足码长,用结束键结束;对于首部为处于主部位的高频编码部件的多个编码部件组成的汉字编码方案为对于由2个编码部件组成的汉字,依次取第1编码部件字母型代码、第2编码部件字母型代码、第2编码部件字母型义类码,因不足码长,用结束键结束;对于由3个编码部件组成的汉字,依次取第1、第2、第3编码部件的字母型代码、第3编码部件字母型义类码;对于由4个或者4个以上编码部件组成的汉字,依次取第1、第2、第3、末编码部件字母型代码。
对于首部为普通编码部件或者为非处于主部位的高频编码部件的由多个编码部件组成的汉字编码方案为对于由2个编码部件组成的汉字,依次取第1编码部件字母型代码、第1编码部件字母型义类码、第2编码部件字母型代码、第2编码部件字母型义类码;对于由3个或者3个以上编码部件组成的汉字,依次取第1编码部件字母型代码、第1编码部件字母型义类码、第2、第末个编码部件字母型代码。
B.4码法非拼音首字母4编码部件以上的汉字首部都取1码式音形义首部余部字母型汉字编码方法只是在由4个或4个以上编码部件组成的汉字,并且首部为普通编码部件或者非处于主部位的高频编码部件的汉字,其首部编码部件只取1码,即整个汉字的编码为依次取首编码部件、第2、第3、末编码部件字母型代码。除此之外的各类汉字的取编码与4码法非拼音首字母音形义首部余部字母型汉字编码方法的完全一样。
C.4码法非拼音首字母4编码部件以上的汉字部首都取1码式音形义部首余部字母型汉字编码方法对于部首为普通编码部件或者为非处于主部位的高频编码部件的由4个或4个以上编码部件组成的汉字其编码为依次取第1、第2、第3、第末编码部件字母型代码。除此之外其他各类汉字的取编码都与4码法音形义部首余部字母型汉字编码方法一样。
D.5码法非拼音首字母音形义首部余部字母型汉字编码方法为了降低在输入大汉字字符集中的汉字时的重码率,在4码法组合式音形义字母型汉字编码方法中,还可以切换调用的方法设置5码法非拼音首字母音形义首部余部字母型汉字编码方法或者5码法非拼音首字母5编码部件以上汉字首部都取1码式音形义首部余部字母型汉字编码方法或者5码法非拼音首字母5编码部件以上部首都取1码式音形义部首余部字母型汉字编码方法。不过4码法的与5码法的编码要分别设置在两张码表中,用操作系统中相应的软件切换调用。
具体技术方案为码长设为5。对于单个编码部件的汉字,依次取其字母型代码、字母型义类码,用结束键结束,对于首部为处于主部位的高频编码部件的多个编码部件组成的汉字编码方案为对于由4个或者4个以下的编码部件组成的汉字,首部编码部件取1码,即取其字母型代码,余部的各编码部件先满足各取1码,如果有富余取码数,再依次满足余部的末编码部件、余部的次末编码部件取2码的要求,根据以上确定的组成汉字的每个编码部件取码数,依据首笔画的先后为序,依次取编码;如果余部的编码部件都取2码后,仍然还有富余取码数,而且又为上下结构的型的汉字,可以设计成再加字型识别码字母“A”;如果取码总数,不足码长,用结束键结束;对于由5个或者5个以上编码部件组成的汉字,依次取第1、第2、第3、第4、末编码部件字母型代码;对于由首部编码部件为普通编码部件或者为非处于主部位的高频编码部件的多个编码部件组成的汉字,编码方案为对于由2个编码部件组成的汉字,依次取第1编码部件字型代码、第1编码部件字母型义类代码、第2编码部件字母型代码、第2编码部件字母型义类码,不足码长(如果是上下结构型的汉字可以设计成再加结构识别码字母“A”);用结束键结束;对于由3个编码部件组成的汉字,依次取第1编码部件字母型代码、第1编码部件字母型义类码、第2编码部件字母型代码、第2编码部件字母义类码、第3编码部件字母型代码;由4个或者4个以上的编码部件组成的汉字,依次取第1编码部件字母型代码、第1编码部件字母型义类码、第2、第3、第末个编码部件字母型代码。
E.5码法非拼音首字母5编码部件以上汉字首部都取1码式音形义首部余部字母型汉字编码方法对于首部编码部件为普通编码部件或者为非处于主部位的高频编码部件的由5个或5个以上编码部件组成的汉字,其编码为依次取第1、第2、第3、第4、第末编码部件字母型代码。除此之外,其他各类汉字取编码都与5码法非拼音首字母音形义首部余部字母型汉字编码方法的一样。
F.5码法非拼音首字母5编码部件以上汉字部首都取1码式音形义部首余部字母型汉字编码方法对于部首为普通编码部件或者为非处于主部位的高频编码部件的由5个或者5个以上编码部件组成的汉字,其编码为依次取第1、第2、第3、第4、第末编码部件字母型代码。除此之外,其他各类汉字取编码都与5码法音形义部首余部字母型汉字编码方法的一样。
(三)拼音首字母音形义字母型汉语词语编码方法利用确定的一种拼音首字母音形义字母型汉字编码方法对每个汉字的编码,对汉语词语取码,击相应的字母键,如有重码,再用重码选择键选择。词语编码的标准码长与汉字的一样也是为4。具体取码方法如下对于由2个汉字组成的词语,依次取第1个汉字的第1、第2个编码字母、第2个汉字的第1、第2个编码字母;对于由3个汉字组成的词语,依次取第1、第2、第3个汉字的第1个编码字母和第3个汉字的第2个编码字母;对于由4个或者4个以上汉字组成的词语,依次取第1、第2、第3、末个汉字的第1个编码字母;如有重码,再用选择键选择。
词语的简码编码2码简码对于2字组词语编码,取词语的第1、第2个汉字的第1个编码字母,用空格键或者选用回车键作结束键(为了与汉字的2码简码或2码成字编码部件的输入区分开来,结束键的取法正好与单个汉字的相反,即如果汉字简码定下来用回车键作结束键,词语简码就以空格键作结束键),如有重码,再用选择键选择;3码简码词语编码对于2字组词,依次取第1个汉字的第1个编码字母和第2个汉字的第1、第2编码字母,用结束键结束,如有重码,再用选择键选择;对于由3个或3个以上汉字组成词语,依次取第1、第2、末个汉字第1编码字母,用结束键结束,如有重码,再用重码选择键选择。
第二部分组合式音形义数字型汉字编码输入法与组合式音形义字母型汉字编码输入法一样,组合式音形义数字型汉字编码输入法对每个汉字赋予两种数字型编码,一种称之为基于拼音首字母的音形义数字型汉字编码,另一种称之为非基于拼音首字母的音形义数字型汉字编码。对于词语的编码只采用基于拼音首字母的音形义数字型汉字编码而设计编制。以上两种编码可以编制在同一张码表中,编码输入操作中不需要切换,但重码率会高一些;也可以分别编制在二张码表中,切换调用;当然也可以只设置基于拼音首字母的音形义数字型汉字编码方法,遇到不知道读音的汉字,查清读音后再输入。当然也可以只设置非基于拼音首字母的音形义数字型汉字编码方法。实现数字型汉字编码输入的过程对设定的汉字字符集之中的每个汉字及词语集之中的词语,根据所述的编码方法编制码表,利用输入法软件,把在数字键盘上输入的汉字、词语的外码,通过应用程序,从字库里调出相应的汉字内码,进行显示等操作。下面就组成组合式音形义数字型汉字编码输入法的两类数字型编码提出技术方案,在实际使用中一般只要在这两类数字型汉字编码中各选择一种编码的方法,组合在一起组成组合式音形义数字型汉字编码输入法;也可以单独选择一种编码方法完成汉字编码输入。即或者只设置基于拼音首字母的音形义数字型汉字编码码表,只采用基于拼音首字母的音形义数字型汉字编码方法;或者只设置非基于拼音首字母的音形义数字型汉字编码码表,只采用非基于拼音首字母的音形义数字型汉字编码方法。两类数字型汉字编码和汉字词语编码方案分述如下(四)6码法基于拼音首字母的首笔画数字全码式音形义数字型汉字编码方法设定码长为6。输入时,击6个编码数字键,如有重码字、词显示,再击选择键。对于码长不足6的,用结束键结束,如有重码,再用选择键选择。上述设定同样适用于非基于拼音首字母的音形义数字型汉字编码输入和基于拼音首字母的音形义数字型汉字词语编码输入。
对于编码部件的数字型全码的采用,只能在首笔画数字型全码与末笔画数字型全码两者中取其中之一。本方法采用首笔画数字型全码。
对于单个编码部件(无论是成字编码部件还是非成字编码部件)的汉字编码,在基于拼音首字母的音形义数字型汉字编码中,还是在非基于拼音首字母的音形义数字型汉字编码中都是一样的,即取其数字型代码、数字型义类码、首笔画数字型代码,即首笔画数字型全码;对于由2个或2个以上的编码部件组成的汉字,把组成汉字的编码部件分为首部和余部两部分,汉字的第1个编码部件为首部,其余统称为余部。取编码,分如下三个部分依次确定其数字型编码第1部分,取根据汉字的汉语拼音的首字母转化成相应的1个数字码;第2部分,取汉字首部编码如果首部为处于主部位的高频编码部件,则对首部的那个编码部件取2码,即依次取其数字型代码和数字型义类码;如果首部为非处于主部位的高频编码部件或者为普通编码部件,则对首部的那个编码部件取3码;第3部分,对汉字的余部取编码把码长数减去拼音首字母数字码个数1,再减去首部取编码的个数(2或3)的差数称之为剩余取码数,如果余部的编码部件个数大于等于剩余取码数,则在必须满足末编码部件取1码的前提下依次对余部的各个编码部件取1码,直到取码数之和等于剩余取码数;如果余部的编码部件个数小于剩余取码数,余部各编码部件的取码个数这样确定余部各编码部件都取1码后其取码数之和还不到剩余取码数,则依次先满足末编码部件、次末编码部件取2码的要求,直到取码数之和等于剩余取码数;如果余部只有1个编码部件,而取了2码后还不到剩余取码数,则进一步取3码;根据上述方法确定的余部各编码部件的取码个数,依次取编码。
把上述第1、第2、第3三个部分取的数字型编码,依次组合成整个汉字的编码。
(五)6码法非基于拼音首字母的首笔画数字全码式音形义数字型汉字编码方法设定码长为6;采用首笔画数字型全码;同样把汉字分成首部和余部两部分,对首部、余部分别确定编码,方法如下对首部如果首部是处于主部位的高频编码部件,则取2码,即依次取其数字型代码、数字型义类码;如果首部是非处于主部位的高频编码部件或者是普通编码部件,则取3码,即依次取其数字型代码、数字型义类码、首笔画数字型代码;对余部如果余部的编码部件个数大于等于剩余取码数,则在必须满足末编码部件取1码的前提下依次对余部的各个编码部件取1码,直到取码数之和等于剩余取码数;如果余部的编码部件个数小于剩余取码数,余部各编码部件的取码个数这样确定余部各编码部件取1码后,再依次先满足末编码部件、次末编码部件取2码的要求,直到取码数之和等于剩余取码数,如果余部只有1个编码部件,则取3码,如果还不到剩余取码数,则用结束键结束;根据上述方法确定的余部各编码部件的取码个数,依次取编码;再把上述对首部、余部取的编码,依次组合成整个汉字的编码。
为了减少击键次数,可以选择一些常用的汉字,根据其基于拼音首字母音形义数字型汉字编码的第1、第2、第3、第4的编码数字码设置出一批1码、2码、3码、4码的简码输入,用结束键结束,选择键选择,确定要输入的汉字。
(六)组合式音形义数字型汉语词语编码方法数字型汉语词语编码输入法码长为6;用以下方法确定词语中各汉字的取码个数首先设定,对汉字取1码,即取汉字的基于拼音首字母的音形义数字型汉字编码的第1个数字码,对汉字取2码,即依次取汉字的基于拼音首字母的音形义数字型汉字编码的第1、第2个数字码,对汉字取3码,即依次取汉字的基于拼音首字母的音形义数字型汉字编码的第1、第2、第3个数字码;用以下方法确定词语中各个汉字的取码个数在必须满足词语中末个汉字取1码的前提下依次对词语的各个汉字取1码,直到词语各汉字取码数之和等于码长数为止,如果词语各汉字都取1码后,其取码数之和仍不到码长数,则依次满足词语的末个汉字、次末个汉字......取2码的要求,直到其取码数之和等于码长数;对于2个汉字组成的词语,每个汉字各取3码。根据上述方法确定的词语中多个汉字取码个数,依次取数字型编码组成整个词语的数字型编码。
为了减少击键次数,也可以选择一些常用的汉语词语,根据其基于拼音首字母音形义数字型汉字编码,设置一批2码、3码、4码的简码词语输入,用结束键结束,选择键确定要输入的词语。2码简码词语编码,依次取2字组词语的汉字第1个数字码;3码简码词语编码,依次取2字组词语的第1汉字的第1个数字码、第2个汉字的第1个、第2个数字码,或依次取3字组词语的各汉字的第1个数字码;4码简码词语编码对2字组词语依次取第1汉字的第1、第2个数字码、第2个汉字的第1、第2个数字码;对于3字组词语,依次取第1、2、3汉字的第1个数字码、第3个汉字的第2个数字码;对于4字组词语或4字以上的词语,依次取第1、2、3、末个汉字的第1个数字码。
为了便于输入,降低重码率也可以通过数字键盘上常设的一些符号键或它们的组合,实现标点符号引导、英文大小写字母引导、结束引导、重码选择引导、空格引导、数字数值引导、切换汉字字集引导、手机原字母输入方式引导等功能。
有益的效果组合式音形义汉字编码输入法与已有技术比较具有显著的有益的效果。它充分地应用字母型、数字型编码资源实现了主要基于汉字拼音首字母的汉字、词语的字母型、数字型的汉字编码输入,对于读不准音的汉字又能用源于同一发明思想的非拼音首字母的汉字编码方法实现编码输入,且能实现大字符集,甚至能实现十万汉字的大字符集汉字编码输入。本发明充分利用人们已经掌握的汉字音形义方面的知识,从整体上认识编码部件,进行编码,理据性比较强,便于使用者记忆掌握,有利于推广应用。组合式音形义字母型汉字编码输入采用字、词、简码混合输入,平均码长可以达到小于2.2(键/字),重码字词键选率可以达到小于1.5%;组合式音形义数字型汉字编码输入,采用字、词、简码混合输入平均码长小于4(键/字),逐字字段输入平均码长小于5(键/字),字、词混合输重码字词键选率小于10%,逐字字段输入重码字键选率小于8%。
说明《404个编码部件组、702个编码部件的编码部件字母型代码、编码部件字母型义类码对照表》对照表中“部件代码”栏目,把单代码编码部件的部件代码和双代码编码部件的双代码编码部件非拼音首字母字母型代码都列于下面;“首音代码”栏目,把双代码编码部件中以拼音首字母作编码部件字母型代码的双代码编码部件拼音首字母字母型代码(简称首音代码)列于此栏目中;还把“一”、“月”、“孑”、“行”等4个有两种读音两种含义的编码部件,其拼音首字母字母型代码也列于此栏目内。且“一”、“孑”、“月”,因字母型义类码不相同,因此以两种编码部件形式分列于对照表中。


附图1是《字母型汉字编码输入法用的字母键盘盘面布置示意图》。
附图2是《27个高频编码部件组号、高频编码部件的部件序号、基础部件表号、高频编码部件、部件字母型代码、部件字母型义类码、10键位首笔数字全码、8键位首笔数字全码、取码提示及其主部位位置对照表》。对照表中“部件组号”、“部件序号”二栏目分别为高频编码件组、高频编码部件在附图1《对照表》中所列的编码部件组的顺序号和编码部件的顺序号;“基础部件表号”为GF3001-1997所列的部件序号;“10键位首笔数字全码”栏目,列出各高频编码部件10键位转换法的首笔画数字型全码;“8键位首笔数字全码”栏目,列出各高频编码部件8键位转换法的首笔画数字型全码;“主部位位置”栏目,列出了各高频编码部件在整个汉字中处于主部位的位置。
附图3是《10键位1数字码替代多字母码数字键盘盘面键位布置结构示意图之一》附图4是《10键位1数字码替代多字母码数字键盘盘面键位布置结构示意图之二》附图5是《8键位1数字码替代多字母码数字键盘盘面键位布置结构示意图》具体实施方法组合式音形义汉字编码输入法的字母型汉字编码输入法,可以采用4码法拼音首字母混合式a式音形义首部余部字母型汉字编码和4码法非拼音首字母音形义首部余部字母型汉字编码组合而成。用前者对例字、例词语编码如下所示中ZW;国GWLI;日RT;木MZ;大DR;杜DUTK;旰GOGD;旱HOTG;氰QQTQ;氯LQTS;鹃JKMN;羧SIDS;酸SIGS;微WRFP;徽HRFP;中国ZWGW;杜鹃DUJK;现代化XDHP;联合国LHGW。用后者对例字编码如下所示中ZW;国WLIK;日OT;木UZ;大DR;杜UTK;旰OGD;旱OTGD;氰QTQY;氯QTJS;鹃KMRN;谲IMJK;裼IIOU;襻IIUS;呝KFYG;凒BKSD。
组合式音形义汉字编码输入法的数字型汉字编码输入法,可以采用8键位6码法基于拼音首字母首笔画数字型全码音形义数字型汉字编码方法和6码法非基于拼音首字母首笔画数字型全码音形义数字型汉字编码方法组合而成。用前者对例字、例词语编码如下所示中992;国495295;言464;广444;石741;心944;月963;日782;木891;大371;杜389851;旰478431;旱478243;氰778379;氯578357;鹃556276;羧793467;酸794167;微923377;徽423377;中国992495;杜鹃389556;联合国534549;中共中央949999;中国共产党944239;中国人民解放军947655。
后者用8键位6码法非基于拼音首字母首笔画数字型全码音形义数字型汉字编码,对例字编码如下所示中992;言464;广444;石741;心944;日782;木891;大371;杜89851;旰78431;旱782431;氰783791;氯783575;鹃562762;羧934627;酸941627;谲466525;裼944797;襻944817;呝563594;凒254737;微233747;徽233747。
404个编码部件组、702个编码部件的编码部件字母型代码、编码部件字母型义类码对照表











权利要求
1.一种组合式音形义汉字编码输入法,利用计算机通用字母键盘或者手机、计算机的数字键盘,输入汉字、词语,其特征在于一、根据主形编码部件的含义归并设定了25类义类并赋一个字母作义类码,编码部件的25类编码部件义类名称、字母型义类码如下所示
二、选定的编码部件根据义相同或形相近等明显关联性,归并成404个编码部件组,并从每个编码部件组中选定一个主形编码部件作代表,每个编码部件赋予与其编码部件组的主形编码部件完全相同的编码部件字母型代码和编码部件字母型义类码,404个编码部件组中702个编码部件的部件形状、部件字母型代码、部件字母型义类码对照列于下面
三、设定27个构字能力特别强的主形编码部件组,确定其组内的各个高频编码部件,共计35个,高频编码部件以及其在汉字结构中的主部位的位置,对照列于下面
四、利用上述字母型汉字编码资源形成组合式音形义字母型汉字编码输入法,其编码方法可由拼音首字母音形义字母型汉字编码方法和非拼音首字母音形义字母型汉字编码方法中各任选一种组合而成;两种汉字编码方法和词语编码方法如下所述(一)拼音首字母音形义字母型汉字编码方法可以是4码法拼音首字母混合式a式音形义首部余部字母型汉字编码方法,实现编码的具体方法如下所述码长设定为4;成字编码部件的编码对于双代码编码部件,依次取双代码编码部件拼音首字母字母型代码、字母型义类码,即双代码编码部件拼音首字母字母型全码;对于单代码编码部件,依次取其编码部件字母型代码、字母型义类码,即单代码编码部件字母型全码;对于2个或者2个以上编码部件组成的汉字,取编码时,涉及到双代码编码部件取码时,采用双代码编码部件非拼音首字母字母型代码、字母型义类码;首编码部件为高频编码部件的合体汉字其取码技术方案为对于由2个编码部件组成的汉字,先取该汉字汉语拼音首字母、再依次取第1编码部件字母型代码、第2编码部件字母型代码、第2编码部件字母型义类码;对于由3个或3个以上编码部件组成的汉字,先取该汉字汉语拼音首字母、再依次取第1编码部件、第2编码部件、末编码部件的字母型代码;对于首编码部件为非高频编码件的由2个或者2个以上编码部件组成的汉字,先取该汉字汉语拼音首字母,再依次取首编码部件字母型代码、首编码部件字母型义类码、末编码部件的字母型代码,其公式表示汉字拼音首字母+首部件字母型代码+首部件字母型义类码+末部件字母型代码(二)非拼音首字母音形义字母型汉字编码方法可以是4码法非拼音首字母音形义首部余部字母型汉字编码方法,实现编码的具体方法如下码长设定为4;在取码涉及到双代码编码部件时,都采用双代码编码部件非拼音首字母字母型代码、字母型义类码、字母型全码;对于单个编码部件的汉字,依次取编码部件字母型代码、字母型义类码,因不足码长,用结束键结束;对于首部为处于主部位的高频编码部件的多个编码部件组成的汉字编码方案为对于由2个编码部件组成的汉字,依次取第1编码部件字母型代码、第2编码部件字母型代码、第2编码部件字母型义类码,因不足码长,用结束键结束;对于由3个编码部件组成的汉字,依次取第1、第2、第3编码部件的字母型代码、第3编码部件字母型义类码;对于由4个或者4个以上编码部件组成的汉字,依次取第1、第2、第3、末编码部件字母型代码;对于首部为普通编码部件或者为非处于主部位的高频编码部件由多个编码部件组成的汉字编码方案为对于由2个编码部件组成的汉字,依次取第1编码部件字母型代码、第1编码部件字母型义类码、第2编码部件字母型代码、第2编码部件字母型义类码;对于由3个或者3个以上编码部件组成的汉字,依次取第1编码部件字母型代码、第1编码部件字母型义类码、第2、第末个编码部件字母型代码;(三)组合式音形义字母型汉字编码输入法的词语编码输入的词语编码采用拼音首字母音形义字母型汉语词语编码方法,实现编码的具体方法如下所述利用确定的一种拼音首字母音形义字母型汉字编码方法对每个汉字的编码;词语编码的标准码长与汉字的一样也是为4,具体取码方法如下对于由2个汉字组成的词语,依次取第1个汉字的第1、第2个编码字母、第2个汉字的第1、第2个编码字母;对于由3个汉字组成的词语,依次取第1、第2、第3个汉字的第1个编码字母和第3个汉字的第2个编码字母;对于由4个或者4个以上汉字组成的词语,依次取第1、第2、第3、末个汉字的第1个编码字母。
2.一种组合式音形义数字型汉字编码输入法,利用手机或者计算机通用键盘的数字键盘,输入汉字或词语,其特征在于把权利要求1所述字母型汉字编码资源以如下所述的方式以及设定,形成数字型汉字编码资源8键位转换法以1个数字码替换相应的几个字母码,具体为以2替换a、b、c;以3替换d、e、f;以4替换g、h、i;以5替换j、k、l;以6替代m、n、o;以7替换p、q、r、s;以8替换t、u;以9替换w、x、y、z;从而得到编码部件相应的数字型代码、数字型义类码以及拼音首字母字母码转换成的数字码;对于双代码编码部件只采用双代码编码部件拼音首字母字母型代码、字母型义类码转换成相应的数字型代码、数字型义类码;但“言”、“广”、“月”、“石”、“木”、“心”6个编码部件组中的编码部件,不以上述方式转换,而定义其数字型代码加上数字型义类码依次为46、44、96、74、89、94;对于五类笔画也不以上述方式转换,而定义为“一”横类笔画数字型代码为1;“丨”竖类笔画数字型代码为2;“丿”撇类笔画数字型代码为3;“丶”点类笔画数字型代码为4; 折类笔画数字型代码为5;所有笔画的数字型义类码都为6;定义编码部件数字型代码+编码部件数字型义类码+首笔画数字型代码为编码部件首笔画数字型全码;组合式音形义数字型汉字编码输入法,其编码方法可由基于拼音首字母的音形义数字型汉字编码方法和非基于拼音首字母的音形义数字型汉字编码方法中各任选一种组合而成;(一)基于拼音首字母的音形义数字型汉字编码方法可以是6码法基于拼音首字母首笔画数字全码式的音形义数字型汉字编码方法,实现编码的具体方法如下所述码长设定为6;采用首笔画数字型全码;对于单个编码部件的汉字编码,依次取其数字型代码、数字型义类码、首笔画数字型代码,即首笔画数字型全码;对于由2个或2个以上的编码部件组成的汉字,把组成汉字的编码部件分为首部和余部两部分,汉字的第1个编码部件为首部,其余统称为余部,取编码,分如下三个部分依次确定其数字型编码第1部分为根据汉字的汉语拼音的首字母转化成相应的数字码;第2部分,取汉字首部编码如果首部为处于主部位的高频编码部件,则对首部的那个编码部件取2码,即依次取其数字型代码和数字型义类码;如果首部为非处于主部位的高频编码部件或者为普通编码部件,则对首部的那个编码部件取3码,即取其首笔画数字型全码;第3部分,对汉字的余部取编码把码长数减去拼音首字母数字码个数1,再减去首部取编码的个数(2或3)的差数称之为剩余取码数,如果余部的编码部件个数大于等于剩余取码数,则在必须满足末编码部件取1码的前提下依次对余部的编码部件取1码,直到取码数之和等于剩余取码数;如果余部的编码部件个数小于剩余取码数,余部各编码部件的取码个数这样确定余部各编码部件都取1码后其取码数之和还不到剩余码数,则依次先满足末编码部件、次末编码部件取2码的要求,直到取码数之和等于剩余取码数,如果余部只有1个编码部件,而取了2码后还不到剩余取码数,则进一步取3码;根据上述方法确定的余部各编码部件的取码个数,依次取编码;把上述第1、第2、第3三个部分取的数字型编码,依次组合成整个汉字的编码;(二)非基于拼音首字母的音形义数字型汉字编码方法可以采用6码法非基于拼音首字母首笔画数字全码式的音形义数字型汉字编码方法,实现编码的具体方法如下所述设定码长为6;采用首笔画数字型全码;同样把合体汉字分成首部和余部两部分,对首部、余部分别确定编码,方法如下对于首部如果首部是处于主部位的高频编码部件,则取2码,即依次取其数字型代码、数字型义类码;如果首部是非处于主部位的高频编码部件或者是普遍编码部件,则取3码,即依次取其数字型代码、数字型义类码、首笔画数字型代码;对于余部如果余部的编码部件个数大于等于剩余取码数,则在必须满足末编码部件取1码的前提下依次对余部的各个编码部件取1码,直到取码数之和等于剩余取码数;如果余部的编码部件个数小于剩余取码数,余部各编码部件的取码个数这样确定余部各编码部件都取1码后,再依次先满足末编码部件、次末编码部件取2码的要求,直到取码数之和等于剩余取码数,如果余部只有1个编码部件,则取3码,如果还不到剩余取码数,则用结束键结束;根据上述方法确定的余部各编码部件的取码个数,依次取编码;再把上述对首部、余部取的编码,依次组合成整个汉字的编码;对于单个编码部件的汉字编码,依次取其数字型代码、数字型义类码、首笔画数字型代码,即首笔画数字型全码;(三)组合式音形义数字型汉字编码输入法的词语编码输入的词语编码采用组合式音形义数字型汉语词语编码方法,实现编码的具体方法如下所述首先设定,对汉字取1码,即取汉字的基于拼音首字母的音形义数字型汉字编码的第1个数字码;对汉字取2码,即依次取汉字的基于拼音首字母的音形义数字型汉字编码的第1、第2个数字码;对汉字取3码,即依次取汉字的基于拼音首字母的音形义数字型汉字编码的第1、第2、第3个数字码;用以下方法确定词语中各个汉字的取码个数在必须满足词语中末个汉字取1码为的前提下依次对词语的各个汉字取1码,直到词语各汉字取码数之和等于码长数为止,如果词语各汉字都取1码后,其取码数之和仍不到码长数,则依次满足词语的末个汉字、次末个汉字......取2码的要求,直到其取码数之和等于码长数;对于2个汉字组成的词语,每个汉字各取3码;根据上述方法确定的词语中各个汉字取码个数,依次取数字型编码组成整个词语的数字型编码。
3.根据权利要求2所述的组合式音形义数字型汉字编码输入法,其特征在于字母码转换成数字码,编码部件字母型代码、字母型义类码转换成数字型代码、数字型义类码的方式采用10键位转换法,以及设定编码部件数字型全码的具体方法如下所述10键位转换法以1个数字码替换相应的几个字母码,具体为以1替换a、b、c;以2替换d、e、f;以3替换g、h、i;以4替换j、k;以5替换l、m;以6替换n、p;以7替换o、q、r;以8替换s、t、u;以9替换w、x;以0替换y、z;从而得到编码部件相应的数字型代码、数字型义类码以及拼音首字母的字母码转换成为的数字码;对于双代码编码部件只采用双代码编码部件拼音首字母字母型代码、字母型义类码转换成相应的数字型代码、数字型义类码;但“广”、“女”、“石”3个编码部件组中的编码部件,不以上述方式转换,而是定义其数字型代码加上数字型义类码依次为33、66、74;对于五类笔画也不以上述方式转换,而定义为“一”横类笔画数字型代码为1;“丨”竖类笔画数字型代码为2;“丿”撇类笔画数字型代码为3;“丶”点类笔画数字型代码为4; 折类笔画数字型代码为5;所有笔画的数字型义类码都为7;定义编码部件数字型代码+编码部件数字型义类码+首笔画数字型代码为编码部件首笔画数字型全码;
4.根据权利要求1所述的组合式音形义汉字编码输入法,其特征在于组合式音形义字母型汉字编码输入法中,只设置拼音首字母音形义字母型汉字编码方法;
5.根据权利要求1所述的组合式音形义汉字编码输入法,其特征在于组合式音形义字母型汉字编码输入法中,只设置非拼音字母音形义字母型汉字编码方法;
6.根据权利要求2所述的组合式音形义数字型汉字编码输入法中,其特征在于组合式音形义数字型汉字编码输入法中,只设置非基于拼音首字母音形义数字型汉字编码方法。
7.根据权利要求2所述的组合式音形义数字型汉字编码输入法中,其特征在于组合式音形义数字型汉字编码输入法中,只设置基于拼音首字母音形义数字型汉字编码方法。
8.根据权利要求1所述的组合式音形义汉字编码输入法,其特征在于拼音首字母音形义字母型汉字编码方法可以是4码法拼音首字母混合式音形义部首余部字母型汉字编码方法,实现编码的具体方法如下所述码长设定为4,成字编码部件的编码,对于双全码编码部件,依次取双全码编码部件拼音首字母字母型代码、字母型义类码,即双全码编码部件拼音首字母字母型全码;对于单全码编码部件,依次取其编码部件字母型代码、字母型义类码,即单全码编码部件字母型全码;对于2个或者2个以上编码部件组成的汉字,取编码涉及到双全码编码部件取码时,采用双全码编码部件非拼音首字母字母型代码、字母型义类码;部首编码部件为高频编码部件的合体汉字其取码技术方案为对于由2个编码部件组成的汉字,先取该汉字汉语拼音首字母,再确定取部首编码部件字母型代码、余部编码部件字母型代码、余部编码部件字母型义类码,并以编码部件的首笔画先后为序,依次取编码;对于由3个或3个以上编码部件组成的汉字,先取该汉字汉语拼音首字母、再确定取部首编码部件字母型代码、余部的第一编码部件字母型代码、余部的末编码部件字母型代码,并以编码部件的首笔画先后为序,依次取编码,组合成整个汉字编码。
9.根据权利要求1所述的组合式音形义汉字编码输入法,其特征在于拼音首字母音形义字母型汉字编码方法可以是4码法拼音首字母单一式音形义字母型汉字编码方法,涉及到双代码编码部件取码时,一律采用双代码编码部件拼音首字母字母型代码、字母型义类码。
10.根据权利要求1所述的组合式音形义汉字编码输入法,其特征在于非拼音首字母音形义字母型汉字编码方法可以采用5码法非拼音首字母音形义首部余部字母型汉字编码方法,实现编码的具体方法如下所述编码的码长设为5;在取码涉及到双全码编码部件时,采用双全码编码部件非拼音首字母字母型代码、字母型义类码、字母型全码;对于单个编码部件的汉字,依次取其字母型代码、字母型义类码,用结束键结束;对于首部为处于主部位的高频编码部件的多个编码部件组成的汉字,编码方案为对于由4个或者4个以下的编码部件组成的汉字,首部编码部件取1码,即取其字母型代码,余部的各编码部件先满足各取1码,如果有富余取码数,再依次满足末编码部件、次末编码部件取2码的要求,根据以上确定的组成汉字的每个编码部件取码数,依据首笔画的先后为序,依次取编码,如果余部的编码部件都取2码后,仍然还有富余取码数,而且又为上下结构型的汉字,可以设计成再加字型识别码字母“A”;如果取码总数,不足码长,用结束键结束;对于由5个或者5个以上编码部件组成的汉字,依次取第1、第2、第3、第4、末编码部件字母型代码;对于由首部编码部件为普通编码部件或者为非处于主部位的高频编码部件的多个编码部件组成的汉字,编码方案为对于由2个编码部件组成的汉字,依次取第1编码部件字母型代码、第1编码部件字母型义类码、第2编码部件字母型代码、第2编码部件字母型义类码,不足码长(如果是上下结构型的汉字可以设计成再加结构识别码字母“A”),用结束键结束;对于由3个编码部件组成的汉字,依次取第1编码部件字母型代码、第1编码部件字母型义类码、第2编码部件字母型代码、第2编码部件字母型义类码、第3编码部件字母型代码;由4个或者4个以上的编码部件组成的汉字,依次取第1编码部件字母型代码、第1编码部件字母型义类码、第2、第3、第末个编码部件字母型代码。
全文摘要
组合式音形义汉字编码输入法,根据GF3001规范选取702个编码部件,归成404个编码部件组,并归纳成25个义类,主要根据拼音首字母,赋予部件字母型代码、义类码,并根据GB/T18031-2000把字母码转换成数字码,利用字母型和数字型编码资源提出了组合式字母型汉字编码输入法、组合式数字型汉字编码输入法等两类汉字编码输入法,输入法采用拼音首字母与非拼音首字母两类编码方法组合而成,适应以词输入为主的趋势,又解决了读不准音的汉字的输入,平均码长、重码字词键选率能达到国家标准规范的要求,重码率也处于先进水平。
文档编号G06F3/023GK1570817SQ0313173
公开日2005年1月26日 申请日期2003年7月22日 优先权日2003年7月22日
发明者黄振荣 申请人:黄振荣
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1