一种汉字输入方法

文档序号:6605967阅读:442来源:国知局
专利名称:一种汉字输入方法
技术领域
本发明涉及汉字拼形码输入方法。
目前汉字编码方案千花竞放,但概括起来只有四类拼形码、拼音码、音形码、序号码。其中拼形码方案占绝对多数,众多的拼形码方案基本上都是以形拼形,郁困在笔画、笔形、偏旁、部首、部件、结构类型等字形信息的圈子里,因此无论哪种构件编码,由于与键符都没有直观和有规律的对应关系,都需要人为规定,所以这些拼形码均需要专门学习、记忆,甚至专门训练,这大大限制了计算机汉字的普及应用。拼音编码只要学过汉语拼音几乎不用再学习,便可以输入,但由于输入速度慢,且遇到生字就无法输入,故也难以普及应用。
本发明地目的在于发明一种既容易学,又打得快的汉字输入方法。
本发明是这样实现的将汉字分为四个层次,一是笔画,二是偏旁,三是根字,四是一般汉字;
一、笔画的取码见表1
汉字基本笔画及取码表 表1
表中取码为各笔画名称读音的声母;
二、无名旁取码见表2
无名旁取码表 表2
表2为无名旁取码表,大部分无名旁只需要取单码,这个单码就是无名旁的首笔画码,少数无名旁需要取双码,即首、末笔画码。
三、偏旁部首取码见表3
偏旁部首取码表 表3
表4中前四个偏旁部首没有名称,它们是按形取码的,如“彐、
”因形似字母“E”而取码,
因形似古汉字“屮”(音CAO)而取码,“乂”则因酷似字母“X”而取码,这几个名旁应属于从无名旁向名旁过渡性质偏旁,它们与无名旁取码上的区别为首码不是笔画码,但后面的笔画码取码却似无名旁,具有不确定性。如
偏旁,在取三码时,除首码外,再选取首、末笔画码,如需取四码,除首码外,再选取首、末前、末笔画码,所以,前三个偏旁部首只取两码,后面的码,酌情选取相应的笔画码,在绝大多数情况下,一般偏旁部首,只要有两码就够用了,接下来的27个偏旁部首按名称只取首码,后面是笔画码,按首、末前、末笔画的顺序依次排列,其中“宀”是取“盖”字声母代码,“刂、刂”是取“刀”字声母为代码,“艹、廾”是取“草”字韵母中第一个字母为代码,“扌”是取“手”字韵母中第一个字母为代码,其余21个偏旁部首都是取各自名称第一个字的声母为代码,再往后的22个偏旁部首都是按规定取双码,后面的两码是首/末笔画码。其中前十个偏旁部首的首码是按各自名称的首字或次字声母取的,次码则是按各自的内含名旁取的。如
含“夕”,“”含“七”,“钅”含“”,
含“刀”,“丬”含“冫”,“纟”含“一”,
含“冫”,“厃”含“厂”,“攵”含“乂”,“夂”含“又”,“丷”和“”是将各自的关联字音八(BA)、小(XO)倒过来,韵母在前、声母在后取的前两码,“彑”也是将其关联字音“互”声韵倒置取的前两码,“囗”介于偏旁部首与汉字之间,它是古字“国”,现一般称为方框,“囗”按“方”、“国”二字声母取前两码,“衤”俗称“布衣旁”,本方案取其名称前二字声母为首次码,“礻”和“罒”所对应的汉字都不是根字,故改换新名称,再各取前二字声母为首次码,余下的四个应属于名旁组了,“”由“丷”和“一”组合而成,


组合而成,
由“冂”和“丶”组合而成,
由“”和“丶”组合而成,故各分取两部分的首码依次排列而做为首次码,再往下,是按规定取三码的四个复部首,末码则取首笔画码,首码取各自名称的首字声母,次码则是在各部首内含多个名旁中选笔画多者,而不是按顺序,取次码后,再按偏旁的顺序取码,凡复部首取码均遵循这个原则,故“”部首的次码按“止”取码,最后的12个偏旁部首首码都是笔画码了,单笔画“丶”、“丿”、“丨”在取笔画读音声母为首码后,后三码均补字母“O”,三个钩笔画均取“G”为首码,后面再按各自名称另二字读音声母取码,本方案规定,凡偏旁首其名称冠以数字三、四的,其首码均按首笔画取码,后面是其它笔画码,只有“氵”是按其首笔画读音点(DIW)取韵母第一个字母为首码,也算是按首笔画取码,后面是其它笔画码,由于首笔画声母未用,所以首笔画声母为次码,这是“氵”取码较特殊之处,最后一个偏旁部首,“饣”取码特殊,这是因为在字符集拓展后,“食字旁”有四种形态“饣、飠、
”,为了使这几个部首使用同一个首码,根据这几个部首的共同特点,首笔画相同,故取首笔画为首码。
本方案规定主部首(按书写顺序位于字首,且处于指定位置,并有规定高度或宽度的部首)取单码见表4
主部首取码表 表4
副部首(位于字首,如果不是主部首,就是副部首)的取码,属于无名旁的按无名旁取码,属于偏旁部首的按偏旁部首取码,属于根字的按根字取码。
四、根字的取码方法有下面七种(1)多声码既多音根字的取码见表5
多声码表表5
表中前五个多音根字是同声异韵根字,其取码方法是共同声母为首码,两个韵母依次排列于后,够四码即将多余字母略去,不够四码末码仍为共同声母,接下来的六个多音根字是异声根字,取码方法为前后两字音的声母依次排列,后两码是首末笔画码,“单”字是将三个字音声母依次排列,末码为首笔画码,“石”字和“镸”字首码为前字音声母,次码为内含名旁声母(“石”含“口”名旁,故次码为“K”;“镸”含“厶”故次码为“M”),末前码为后字音声母,末码为首笔画码,可以看出,异声根字不取韵母码。
(2)本声码,即按根字本来读音所取的码见表6
本声码表 表6
从表中可以看出,本声根字取码方法非常简单,字音码在前、笔画码在后,补足四码即可,本声根字一般是独体字或无名旁字,表中前边57个根字首码为字音声母,次码为字音韵母,后面两码为首末笔画码,接下来的17个根字首码为字音声母,次码和末码为字音复韵母,末码为首笔画码,最后11个根字是单字母音节,首码为字音码,后面三码为首、末前、末笔画码,本声根字共85个,只要掌握了这些根字的读音,取码就不成问题,反之,不掌握根字的读音,从取码表中也可找出字音。
(3)、内声码见表7
内声码表 表7
从表中可以看出内声码取码方法也很简单,首码为其对应根字读音声母,次码为该根字内含名旁读音声母或名称读音声母,后面两码为该根字韵母,在对应根字为单韵母时,末码补首笔画码,前81个根字都是双字母音节,用首码(声母)和末前码(单韵母)可拼出该根字读音,因不足四码,末码补首笔画码,接下来的24个根字是复韵母音节,用首码(声母)与末前、末码(二码合成复韵母)可拼出该根字读音,最后的5个根字是单字母音节,故首码为字音,次码为内含名旁声母,末前、末码为首末笔画码,内声码表中根字右边的括号内,是该根字所含的名旁,次码是根据根字所含名旁而取的,内声根字中的名旁只取单码,这一点在取码中需要注意。
(4)、近声码(双向近声和单向近声码)见表8、表9
双向近声码表 表8
表8中前46组形近根字的取码特点是其代码由双音组成,首末二码为本根字读音,中间二码为形近根字读音,每组两个形近根字的代码由相同的四个字母组成,只不过顺序不同。接下来的17组形近根字的共同特点是横线左边为单韵母根字,横线右边为复韵母根字。故左边的根字只取声母码,后三码为形近根字读音;而右边的根字首码为本根字声母,次码和末前码为形近根字读音,末码为本根字复韵母中的第一个字母,如“见——贝”,“见”字代码为“JBEI”,首码为“见”字声母,后三码为形近根字“贝”读音;而“贝”取码为“BJWE”,首码为“贝”字声母,次码和末前码为形近根字“见”读音,末码为“贝”字复韵母“EI”中的第一个字母。“丐——
”与“犬——太”取码规则相同,故不赘述,最后8组形近根字因各有一个根字是单字母音节,双音码凑不够四码时,就需要首笔画码补足,当本根字为单字母音节时,末码无韵母可取,故末码用首笔画码,当形近根字为单字母音节时,末前码无韵母可取,故末前码取首笔画码,“卬、予、聿”三个根字不用笔画码,是由于它们的形近根字都是复韵母根字。
单向近声码表 表9
在表9中,形体栏中左边的字为取码根字,括号内的根字或名旁是形近根字或形近名旁,是取码根字取码的根据,表中前38个取码根字取码方法与双向近声码相同,只是后12个近声根字取码方法有些不同,“幺”和“也”的形近根字都是多音根字,取码方法是首末码为取码根字读音,中间二码为多音根字的两个声母。最后10个取码根字的特别之处在于它们都是依据形近名旁取码的,其取码方法是首末码为取码根字声韵母,形近名旁取单码做为次码,末前码为取码根字的首笔画码。
(5)、同声码见表10
同声码表 表10
同声码本应分别属于内声码或近声码,但由于情况特殊,取码方法也不同,所以把它们归为一类。
所谓同声码,是指在取内声码或近声码时,取码根字的声母与内含名旁或形近根字的声母相同,如“庚”字,其内含名旁“广”与“庚”字声母相同;又如“才”与“寸”互为形近根字,它们声母相同,这些取码根字叫同声根字,同声根字所取的码叫同声码。再如“百”字,与形近根字“白”不仅声母相同,韵母也相同,故“百”字叫做同音根字,“百字所取的码叫同音码。因同音码数量很少,故归入同声码表中。
表10中左栏为双向近同声码,中栏“严”字为单向近同声码,“严”字上边都是内同声码,右栏为同音码。
近同声码与内同声码取码规则相同首码为共同声母,本韵母在前,内近声韵母在后,依次排列,够四码即略去多余字母,不够四码者,补上一个共同声母为末码。如“才——寸”互为形近根字,“才”字取码为“CAIU”,“寸”字取码为“CUNA”,前三码为取码字读音,末码为形近根字韵母,多余的一个字母略去。又如“声”字取码为“SEIS”,前两码是“声”字读音,末前码为内含“士”字韵母,因不够四码,再补一个共同声母,后两码倒着拼是内含“士”字读音。再如“隶”字取码“LIDL”,前两码为本字读音,后两码倒着读就是内含名旁“两点水”的前二字声母。
其中“师、亚、正、严”四个根字取码特殊,因这四个字既是同声根字,又是近声根字,又可算做内声根字,三重身份,其取码特殊之点在于次码为笔画码。这个笔画码不是首、末等笔画,而是这四个根字与其形近根字相区别的笔画码,前三字与形近根字的区别笔画为横,“严”字与“亚”字区别笔画为“撇”。这四个根字首码仍为共同声母,区别笔画码为次码,取码根字韵母和形近根字韵母按顺序为末前、末码。
右栏同音码取码规则为前两码为共同声母,后面是共同韵母(只取一次),不够四码则补首笔画码。单字母音节“义”、“甬”二根字按音只能取前两码,后两码则补首、末笔画码。
(6)、特殊码见表11
特殊码表 表11
特殊码是根字按特殊规则所取的码,取特殊码的根字共有32个,其中有一般根字,但大多为特殊根字,有些特殊根字并不取特殊码,所以特殊码的判定主要看取码规则是否特殊,表11中前三个根字是一般根字,其中“衣”字为常用部首,前面已介绍过其取码,“木”字取码在主部首取码中也讲过,“木”字取码应属于本声码,只不过是声韵倒置,后两码是首末笔画码,“山”字按形取首码,再仿照近声码取形近根字“凵”的读音为次、末前码,末码取“山”字声母,将“山”字取码“EQWS”后两码倒着拼,正好是“山”字读音。
除去三个一般根字,其余取特殊码的都是特殊根字了,前20个特殊根字取码规则为本字读音声母为首码,次码则是在多个名旁中选笔画多者,取其读音声母为次码。四笔画以上者仍按四画计算,几个相同名旁可以算做一个复名旁,笔画加在一起计算,笔画相同者按顺序选用。在特殊根字后的括号内是我们所选用的名旁或名旁组,取完前两码后,再按顺序取首末偏旁码(名旁与无名旁一样对待)。
接下来的六个特殊根字有一共同特点,就是首偏旁首码与整字读音声母相同。在这种情况下,首偏旁代码与整字声母合二为一,次码不再选名旁码,直接按顺序取偏旁码即可。不够四码,即取整字读音韵母,仍不够四码,再取首笔画码。如“和”字首码“H”代表整字声母和首偏旁代码,次码只能取“口”偏旁代码“K”了,不够四码,无偏旁码可取了,只好取整字韵母“E”,仍不够四码,再取首笔画码“P”,故“和”字取码为“HKEP”。
最后三个含复部首根字编码规则是整字读音声母为首码,首笔画码为次码,复部首读音声母为末前码,末码为整字读音韵母,“殷”字为单字母音节,无韵母可取,末码则取末笔画码(因首笔画码已用过)。
(7)、变形码见表12
变形码表 表12
变形码是指变形根字所取的码,根字在参与组字时,由于所处位置的不同,常常发生一些变形。变形根字本来数量不小,但许多变形根字都是单笔画变形,且变形后笔画名称并不改变。我们说的笔画名称,是指五种基本笔画。如“子”字做为副部首时常变形为“孑”,“横”画变为“提”笔画,像这样不改变笔画名称的变形,一般并不做为变形字处理。类似的情况还有“点”画和“捺”画的互变,“竖钩”和“竖”画的互变等等,凡在笔画名称内的变形,仍按原根字取码。
五、一般汉字的取码。
(一)、几点说明
1、根字与根旁。
一般汉字拆分后,拆出来的字则称为根字,拆出来的不成字的部分则称为根旁,根旁包括一些无名旁,偏旁部首,对于拆出的根字或根旁,在取码中一视同仁。
2、根顺。
根字和根旁都可以简称为根。它们在书写中的先后顺序称为根顺,在书写一般汉字时,不见得是写完一个根再写下一个根,例如“臧”字可分为“戈、爿、臣”三个根,而书写时,先写“戈”字的一横,接着就写变形根字“爿”,再写“臣”字,最后写“戈”字的后三个笔画。在判断根顺时,应按各根第一笔画的书写顺序为根顺。据此规定,“戈”字应为首根。
3、冗余偏旁和冗余根。
在汉字的偏旁系列中,并非每个偏旁均属必要信息。例如偏旁系列“口、囗、犬、口、囗”中,省略任何一个“口”时,我们都还可以认定这个字还是“器”字,因此对于认知“器”而言,任何一个角上的单个“口”都可以是冗余的。为了编码的需要,本方案规定像“器、嚣”这样四个角上均为同一偏旁的右上角那个偏旁为冗余偏旁。对冗余偏旁不取码,如“器”取码为“KQKK”。
汉字接含根的多少,又可分为单根字,双根字、三根字、四根字和多根字,不用说,单根字就是根字,因本码最大码长为四码,故多根字中含有冗余根。象“器”字中的冗余偏旁也属于冗余根。
(二)、一般汉字的取码。
1、双根字的取码。
含主部首的双根字,主部首取单码作首码,其余三码由后根取。如“你”字,“亻”取“L”,“尔”字全码为“EXRP”,取主部首码“L”和“尔”字前三码,故“你”字取码“LEXR”。含副部首的双根字,先取两根的首码为整字的前两码,再取两根的次码为整字的后两码。如“财”字,取码为“BCJA”,“贝”字取码为“BJWE”,“才”字取码为“CAIU”,“财”字的前两码为“贝”字和“才”字的首码,“财”字的后两码为“贝”字和“才”字的次码。
2、三根字的取码。
含主部首的三根字,三根各取首码后,再取末根的次码为整字的末码。如“蜢”字取码为“CZMX”,前三码为三个根的首码,末码是末根“皿”的次码。
含副部首的三根字,三根各取首码后,再取副部首的次码为整字的末码,如“联”字取码为“EATR”,前三码为“耳、并、天”三根的首码,末码为副部首“耳”的次码。
3、四根字的取码。
对于四根字,不必区分首根是主部首或副部首,依次序取各根的首码即可,如“醌”字取码为“YRBB”,为四个根“酉、日、比、匕、”的首码依次排列。又如“瞟”字拆分为四个根“目、西、二、小”各取首码,“瞟”字取码为“MXEX”。
4、多根字的取码。
对于多根字,也不必区分首根是主部首还是副部首,只要对前二根和后二根依顺序取首码做为整字的编码,即“前二后二”。如“嚷”字拆分为“口、亠、口、口、
”六个根,中间的两个“口”根不取码,前后四个根各取首码,故“嚷”字取码为“KDHP”。又如“微”字拆分为“彳、山、一、几、攵”,中间的“一”根不取码,故“微”字取码为“CEJW”。多根字中间不取码的根称为冗余根。
(三)、需要拆开的常见根组合。
为了方便用户取码,这里将一些根组合的拆分讲一下。所谓根组合是指某些复笔组字结构,实际上是由两个根组合在一起的。因为本码对复笔交叉结构一律不拆分,故根组合仅指粘连在一起的两个根,在取码时应拆开分别取码。如
应拆分为“丿”和“刀”,“”应拆分为“小”和“丶”,
应拆分为“丿”和“口”,
应拆分为“丿”和“罒”,
应拆分为“口”和“”,
应拆分为“干”和“”,
应拆分为“丷”和

应拆分为“一”和

应拆分为
和“丶”。这些根组合拆开后,只有
是无名旁,其余都是名旁,给取码带来了方便。
本发明与现有技术相比具有下列优点1)本发明使用26个英文字母作码,最长码长为4个,单字静态重码率在使用简码后降为零,实现了一字一码;2)本码对独体字不拆分,对交叉复笔结构不拆分,这符合语文教学规范,符合人们的拆字习惯,拆分到根字为止,容易学习和掌握;3)本发明虽为形码,但充分利用了根字字音,以声拼形,编码单元直接转换为键符,基本上丢掉了笔画,直接输入取码快捷,输入方便;4)本码可简称为文声码,用文之声来组字之形,就一般汉字而言可以做到见字识码,就根字而言,可以做到既见字识码,又可以见码识字;5)由于采用模糊拼音(见表13),所以会不会讲普通话都可以正确输入;6)本发明是汉字文化的继承和发扬,它更新或提出了一些概念,在构字基本单元上取得了突破;7)本发明适合于中小学的识字教育,适合于不同层次的用户,适合于全国统一使用。
模糊拼音韵母表 表13
下面对本发明进行详细说明。
据小字符集统计,本方案静态重码率约为2.1%,在使用简码后,不再有重码。
使用简码可以减少击键次数,提高输入速度,做到一字一码,不用屏幕选字,适合进行盲打。在本方案中,每个汉字的全码均为四个字母。在小字符集中有5100多汉字,除可按其全码输入外,还可以只取前边的1~3个码,再加空格键输入,也就是说,只取其全码最前边的1个、2个或3个码输入,这就是一、二、三级简码。
一级简码爱(A)不(B)长(C)的(D)而(E)方(F)工(G)和(H)一(I)就(J)可(K)了(L)民(M)年(N)用(O)平(P)去(Q)人(R)是(S)同(T)木(U)为(V)我(W)下(X)有(Y)在(Z)
二级简码见表14
二级简码汉字表表14
三级简码有4400多个汉字,其表略。
六、词语编码(1)两字词编码每字取其全码的前两码,共4码组成一组词语编码。例如“歌唱”编码为“KKKR”,“天气”取码为“TFQW”,“爱国”取码为“AZFV”。词语编码的前两码为首字编码的首次码,后两码为末字的首次码。如遇一级简码字(如爱字)参与组词时,要从其全码中取前两码。(2)三字词编码前两字各取其首码,最后一字取它的首次码,依次序排列,共四码。例如“计算机”取码为“YZUJ”,“爱国者”取码为“AFLR”,“接班人”取码为“OWRE”。词语编码的前两码为前两字的首码,后两码为最后一个字的首次码。当末字为一级简码字时,要从它的全码中取前两码。(3)四字词编码每字各取首码,共四码组成一组词语编码。例如“不约而同”编码为“BSET”,“高瞻远瞩”取码为“DMIM”,“后来居上”取码为“PLSS”。四字词编码为各字首码按顺序排列即可。(4)多字词语编码取第一、二、三及最末一个汉字的首码,共四码组成一组词语编码。例如“电子计算机”取码为“DZYU”,“算”字不取码。“爱国主义教育”取码为“AFZD”、“义”字与“教”字不取码。又如“创历史最高水平”取码为RCSP,“最高、水”三字不取码。
多字词语的取码规则可理解为“前三后一”。
词语编码均为等长四码,而且单字和词语可以混合输入,见字打字,见词打词,其间不用换档或其它附加操作。
权利要求
1、一种汉字输入方法,其特征在于本发明是这样实现的将汉字分为四个层次,一是笔画,二是偏旁,三是根字,四是一般汉字;
一、笔画的取码见表1
汉字基本笔画及取码表 表1
表中取码为各笔画名称读音的声母;
二、无名旁取码见表2
无名旁取码表 表2
表2为无名旁取码表,大部分无名旁只需要取单码,这个单码就是无名旁的首笔画码,少数无名旁需要取双码,即首、末笔画码。
三、偏旁部首取码见表3
偏旁部首取码表表3
表4中前四个偏旁部首没有名称,它们是按形取码的,如“彐、”因形似字母“E”而取码,
因形似古汉字“屮”(音CAO)而取码,“”则因酷似字母“X”而取码,这几个名旁应属于从无名旁向名旁过渡性质偏旁,它们与无名旁取码上的区别为首码不是笔画码,但后面的笔画码取码却似无名旁,具有不确定性。如
偏旁,在取三码时,除首码外,再选取首、末笔画码,如需取四码,除首码外,再选取首、末前、末笔画码,所以,前三个偏旁部首只取两码,后面的码,酌情选取相应的笔画码,在绝大多数情况下,一般偏旁部首,只要有两码就够用了,接下来的27个偏旁部首按名称只取首码,后面是笔画码,按首、末前、末笔画的顺序依次排列,其中“宀”是取“盖”字声母代码,“刂、刂”是取“刀”字声母为代码,“艹、廾”是取“草”字韵母中第一个字母为代码,“扌”是取“手”字韵母中第一个字母为代码,其余21个偏旁部首都是取各自名称第一个字的声母为代码,再往后的22个偏旁部首都是按规定取双码,后面的两码是首/末笔画码。其中前十个偏旁部首的首码是按各自名称的首字或次字声母取的,次码则是按各自的内含名旁取的。如
含“夕”,“”含“七”,“钅”含“矢”,“贸”含“刀”,“丬”含“冫”,“纟”含“一”,“求”含“冫”,“危”含“厂”,“攵”含“乂”,“夂”含“又”,“并”和“光”是将各自的关联字音八(BA)、小(XO)倒过来,韵母在前、声母在后取的前两码,“互”也是将其关联字音“互”声韵倒置取的前两码,“囗”介于偏旁部首与汉字之间,它是古字“国”,现一般称为方框,“囗”按“方”、“国”二字声母取前两码,“衤”俗称“布衣旁”,本方案取其名称前二字声母为首次码,“礻”和“罢”所对应的汉字都不是根字,故改换新名称,再各取前二字声母为首次码,余下的四个应属于名旁组了,“”由“丷”和“一”组合而成,


组合而成,
由“冂”和“丶”组合而成,
由“矢”和“丶”组合而成,故各分取两部分的首码依次排列而做为首次码,再往下,是按规定取三码的四个复部首,末码则取首笔画码,首码取各自名称的首字声母,次码则是在各部首内含多个名旁中选笔画多者,而不是按顺序,取次码后,再按偏旁的顺序取码,凡复部首取码均遵循这个原则,故“”部首的次码按“止”取码,最后的12个偏旁部首首码都是笔画码了,单笔画“丶”、“丿”、“丨”在取笔画读音声母为首码后,后三码均补字母“O”,三个钩笔画均取“G”为首码,后面再按各自名称另二字读音声母取码,本方案规定,凡偏旁首其名称冠以数字三、四的,其首码均按首笔画取码,后面是其它笔画码,只有“氵”是按其首笔画读音点(DIW)取韵母第一个字母为首码,也算是按首笔画取码,后面是其它笔画码,由于首笔画声母未用,所以首笔画声母为次码,这是“氵”取码较特殊之处,最后一个偏旁部首,“饣”取码特殊,这是因为在字符集拓展后,“食字旁”有四种形态“饣、食、
”,为了使这几个部首使用同一个首码,根据这几个部首的共同特点,首笔画相同,故取首笔画为首码。
本方案规定主部首(按书写顺序位于字首,且处于指定位置,并有规定高度或宽度的部首)取单码见表4
主部首取码表 表4
副部首(位于字首,如果不是主部首,就是副部首)的取码,属于无名旁的按无名旁取码,属于偏旁部首的按偏旁部首取码,属于根字的按根字取码。
四、根字的取码方法有下面七种(1)多声码既多音根字的取码见表5
多声码表表5
表中前五个多音根字是同声异韵根字,其取码方法是共同声母为首码,两个韵母依次排列于后,够四码即将多余字母略去,不够四码末码仍为共同声母,接下来的六个多音根字是异声根字,取码方法为前后两字音的声母依次排列,后两码是首末笔画码,“单”字是将三个字音声母依次排列,末码为首笔画码,“石”字和“肆”字首码为前字音声母,次码为内含名旁声母(“石”含“口”名旁,故次码为“K”;“镸”含“厶”故次码为“M”),末前码为后字音声母,末码为首笔画码,可以看出,异声根字不取韵母码。
(2)本声码,即按根字本来读音所取的码见表6
本 声 码 表 表6
从表中可以看出,本声根字取码方法非常简单,字音码在前、笔画码在后,补足四码即可,本声根字一般是独体字或无名旁字,表中前边57个根字首码为字音声母,次码为字音韵母,后面两码为首末笔画码,接下来的17个根字首码为字音声母,次码和末码为字音复韵母,末码为首笔画码,最后11个根字是单字母音节,首码为字音码,后面三码为首、末前、末笔画码,本声根字共85个,只要掌握了这些根字的读音,取码就不成问题,反之,不掌握根字的读音,从取码表中也可找出字音。
(3)、内声码见表7
内 声 码 表 表7
从表中可以看出内声码取码方法也很简单,首码为其对应根字读音声母,次码为该根字内含名旁读音声母或名称读音声母,后面两码为该根字韵母,在对应根字为单韵母时,末码补首笔画码,前81个根字都是双字母音节,用首码(声母)和末前码(单韵母)可拼出该根字读音,因不足四码,末码补首笔画码,接下来的24个根字是复韵母音节,用首码(声母)与末前、末码(二码合成复韵母)可拼出该根字读音,最后的5个根字是单字母音节,故首码为字音,次码为内含名旁声母,末前、末码为首末笔画码,内声码表中根字右边的括号内,是该根字所含的名旁,次码是根据根字所含名旁而取的,内声根字中的名旁只取单码,这一点在取码中需要注意。
(4)、近声码(双向近声和单向近声码)见表8、表9
双 向 近 声 码 表 表8
表8中前46组形近根字的取码特点是其代码由双音组成,首末二码为本根字读音,中间二码为形近根字读音,每组两个形近根字的代码由相同的四个字母组成,只不过顺序不同。接下来的17组形近根字的共同特点是横线左边为单韵母根字,横线右边为复韵母根字。故左边的根字只取声母码,后三码为形近根字读音;而右边的根字首码为本根字声母,次码和末前码为形近根字读音,末码为本根字复韵母中的第一个字母,如“见——贝”,“见”字代码为“JBEI”,首码为“见”字声母,后三码为形近根字“贝”读音;而“贝”取码为“BJWE”,首码为“贝”字声母,次码和末前码为形近根字“见”读音,末码为“贝”字复韵母“EI”中的第一个字母。“丐——
”与“犬——太”取码规则相同,故不赘述,最后8组形近根字因各有一个根字是单字母音节,双音码凑不够四码时,就需要首笔画码补足,当本根字为单字母音节时,末码无韵母可取,故末码用首笔画码,当形近根字为单字母音节时,末前码无韵母可取,故末前码取首笔画码,“仰、予、聿”三个根字不用笔画码,是由于它们的形近根字都是复韵母根字。
单 向 近 声 码 表 表9
在表9中,形体栏中左边的字为取码根字,括号内的根字或名旁是形近根字或形近名旁,是取码根字取码的根据,表中前38个取码根字取码方法与双向近声码相同,只是后12个近声根字取码方法有些不同,“幺”和“也”的形近根字都是多音根字,取码方法是首末码为取码根字读音,中间二码为多音根字的两个声母。最后10个取码根字的特别之处在于它们都是依据形近名旁取码的,其取码方法是首末码为取码根字声韵母,形近名旁取单码做为次码,末前码为取码根字的首笔画码。
(5)、同声码见表10
同 声 码 表 表10
同声码本应分别属于内声码或近声码,但由于情况特殊,取码方法也不同,所以把它们归为一类。
所谓同声码,是指在取内声码或近声码时,取码根字的声母与内含名旁或形近根字的声母相同,如“庚”字,其内含名旁“广”与“庚”字声母相同;又如“才”与“寸”互为形近根字,它们声母相同,这些取码根字叫同声根字,同声根字所取的码叫同声码。再如“百”字,与形近根字“白”不仅声母相同,韵母也相同,故“百”字叫做同音根字,“百字所取的码叫同音码。因同音码数量很少,故归入同声码表中。
表10中左栏为双向近同声码,中栏“严”字为单向近同声码,“严”字上边都是内同声码,右栏为同音码。
近同声码与内同声码取码规则相同首码为共同声母,本韵母在前,内近声韵母在后,依次排列,够四码即略去多余字母,不够四码者,补上一个共同声母为末码。如“才——寸”互为形近根字,“才”字取码为“CAIU”,“寸”字取码为“CUNA”,前三码为取码字读音,末码为形近根字韵母,多余的一个字母略去。又如“声”字取码为“SEIS”,前两码是“声”字读音,末前码为内含“士”字韵母,因不够四码,再补一个共同声母,后两码倒着拼是内含“士”字读音。再如“隶”字取码“LIDL”,前两码为本字读音,后两码倒着读就是内含名旁“两点水”的前二字声母。
其中“师、亚、正、严”四个根字取码特殊,因这四个字既是同声根字,又是近声根字,又可算做内声根字,三重身份,其取码特殊之点在于次码为笔画码。这个笔画码不是首、末等笔画,而是这四个根字与其形近根字相区别的笔画码,前三字与形近根字的区别笔画为横,“严”字与“亚”字区别笔画为“撇”。这四个根字首码仍为共同声母,区别笔画码为次码,取码根字韵母和形近根字韵母按顺序为末前、末码。
右栏同音码取码规则为前两码为共同声母,后面是共同韵母(只取一次),不够四码则补首笔画码。单字母音节“义”、“甬”二根字按音只能取前两码,后两码则补首、末笔画码。
(6)、特殊码见表11
特 殊 码 表 表11
特殊码是根字按特殊规则所取的码,取特殊码的根字共有32个,其中有一般根字,但大多为特殊根字,有些特殊根字并不取特殊码,所以特殊码的判定主要看取码规则是否特殊,表11中前三个根字是一般根字,其中“衣”字为常用部首,前面已介绍过其取码,“木”字取码在主部首取码中也讲过,“木”字取码应属于本声码,只不过是声韵倒置,后两码是首末笔画码,“山”字按形取首码,再仿照近声码取形近根字“凵”的读音为次、末前码,末码取“山”字声母,将“山”字取码“EQWS”后两码倒着拼,正好是“山”字读音。
除去三个一般根字,其余取特殊码的都是特殊根字了,前20个特殊根字取码规则为本字读音声母为首码,次码则是在多个名旁中选笔画多者,取其读音声母为次码。四笔画以上者仍按四画计算,几个相同名旁可以算做一个复名旁,笔画加在一起计算,笔画相同者按顺序选用。在特殊根字后的括号内是我们所选用的名旁或名旁组,取完前两码后,再按顺序取首末偏旁码(名旁与无名旁一样对待)。
接下来的六个特殊根字有一共同特点,就是首偏旁首码与整字读音声母相同。在这种情况下,首偏旁代码与整字声母合二为一,次码不再选名旁码,直接按顺序取偏旁码即可。不够四码,即取整字读音韵母,仍不够四码,再取首笔画码。如“和”字首码“H”代表整字声母和首偏旁代码,次码只能取“口”偏旁代码“K”了,不够四码,无偏旁码可取了,只好取整字韵母“E”,仍不够四码,再取首笔画码“P”,故“和”字取码为“HKEP”。
最后三个含复部首根字编码规则是整字读音声母为首码,首笔画码为次码,复部首读音声母为末前码,末码为整字读音韵母,“殷”字为单字母音节,无韵母可取,末码则取末笔画码(因首笔画码已用过)。
(7)、变形码见表12
变 形 码 表 表12
变形码是指变形根字所取的码,根字在参与组字时,由于所处位置的不同,常常发生一些变形。变形根字本来数量不小,但许多变形根字都是单笔画变形,且变形后笔画名称并不改变。我们说的笔画名称,是指五种基本笔画。如“子”字做为副部首时常变形为“孑”,“横”画变为“提”笔画,像这样不改变笔画名称的变形,一般并不做为变形字处理。类似的情况还有“点”画和“捺”画的互变,“竖钩”和“竖”画的互变等等,凡在笔画名称内的变形,仍按原根字取码。
五、一般汉字的取码。
(一)、几点说明
1、根字与根旁。
一般汉字拆分后,拆出来的字则称为根字,拆出来的不成字的部分则称为根旁,根旁包括一些无名旁,偏旁部首,对于拆出的根字或根旁,在取码中一视同仁。
2、根顺。
根字和根旁都可以简称为根。它们在书写中的先后顺序称为根顺,在书写一般汉字时,不见得是写完一个根再写下一个根,例如“臧”字可分为“戈、爿、臣”三个根,而书写时,先写“戈”字的一横,接着就写变形根字“爿”,再写“臣”字,最后写“戈”字的后三个笔画。在判断根顺时,应按各根第一笔画的书写顺序为根顺。据此规定,“戈”字应为首根。
3、冗余偏旁和冗余根。
在汉字的偏旁系列中,并非每个偏旁均属必要信息。例如偏旁系列“口、囗、犬、口、囗”中,省略任何一个“口”时,我们都还可以认定这个字还是“器”字,因此对于认知“器”而言,任何一个角上的单个“口”都可以是冗余的。为了编码的需要,本方案规定像“器、嚣”这样四个角上均为同一偏旁的右上角那个偏旁为冗余偏旁。对冗余偏旁不取码,如“器”取码为“KQKK”。
汉字接含根的多少,又可分为单根字,双根字、三根字、四根字和多根字,不用说,单根字就是根字,因本码最大码长为四码,故多根字中含有冗余根。象“器”字中的冗余偏旁也属于冗余根。
(二)、一般汉字的取码。
1、双根字的取码。
含主部首的双根字,主部首取单码作首码,其余三码由后根取。如“你”字,“亻”取“L”,“尔”字全码为“EXRP”,取主部首码“L”和“尔”字前三码,故“你”字取码“LEXR”。含副部首的双根字,先取两根的首码为整字的前两码,再取两根的次码为整字的后两码。如“财”字,取码为“BCJA”,“贝”字取码为“BJWE”,“才”字取码为“CAIU”,“财”字的前两码为“贝”字和“才”字的首码,“财”字的后两码为“贝”字和“才”字的次码。
2、三根字的取码。
含主部首的三根字,三根各取首码后,再取末根的次码为整字的末码。如“蜢”字取码为“CZMX”,前三码为三个根的首码,末码是末根“皿”的次码。
含副部首的三根字,三根各取首码后,再取副部首的次码为整字的末码,如“联”字取码为“EATR”,前三码为“耳、并、天”三根的首码,末码为副部首“耳”的次码。
3、四根字的取码。
对于四根字,不必区分首根是主部首或副部首,依次序取各根的首码即可,如“醌”字取码为“YRBB”,为四个根“酉、日、比、匕、”的首码依次排列。又如“瞟”字拆分为四个根“目、西、二、小”各取首码,“瞟”字取码为“MXEX”。
4、多根字的取码。
对于多根字,也不必区分首根是主部首还是副部首,只要对前二根和后二根依顺序取首码做为整字的编码,即“前二后二”。如“嚷”字拆分为“口、亠、口、口、
衣”六个根,中间的两个“口”根不取码,前后四个根各取首码,故“嚷”字取码为“KDHP”。又如“微”字拆分为“彳、山、一、几、攵”,中间的“一”根不取码,故“微”字取码为“CEJW”。多根字中间不取码的根称为冗余根。
(三)、需要拆开的常见根组合。
为了方便用户取码,这里将一些根组合的拆分讲一下。所谓根组合是指某些复笔组字结构,实际上是由两个根组合在一起的。因为本码对复笔交叉结构一律不拆分,故根组合仅指粘连在一起的两个根,在取码时应拆开分别取码。如
应拆分为“丿”和“刀”,“”应拆分为“小”和“丶”,
应拆分为“丿”和“口”,
应拆分为“丿”和“罒”,
应拆分为“口”和“”,
应拆分为“干”和“”,
应拆分为“丷”和“下”,
应拆分为“一”和

应拆分为
和“丶”。这些根组合拆开后,只有
是无名旁,其余都是名旁,给取码带来了方便。
2、根据权利要求1所述的输入方法,其特征在于一级简码共26个汉字。
3、根据权利要求1所述的输入方法,其特征在于二级简码共664个汉字,见表14。
4、根据权利要求1所述的输入方法,两字词语的编码方法是每字取其全码的前两码,共四码。
5、根据权利要求1所述的输入方法,三字词编码是取前两字的首码,最后一个字取它的首、次码,共四码。
6、根据权利要求1所述的输入方法,四字词语编码方法是每字取首码,共四码。
7、根据权利要求1所述的输入方法多字词语的编码方法是取第一、二、三及最末一字汉字的首码,共四码。
全文摘要
本发明涉及一种汉字拼形码输入方法,它利用汉字中根字的读音以及根旁名称或笔画读音,以声拼形来输入汉字,它有拆字到根字为止,独体字不拆分,码长相等,重码率为零的优点。
文档编号G06F3/023GK1229208SQ9910262
公开日1999年9月22日 申请日期1999年3月16日 优先权日1999年3月16日
发明者赵明辉 申请人:赵明辉
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1