计算机汉字音形模糊输入法的制作方法

文档序号:6554652阅读:297来源:国知局
专利名称:计算机汉字音形模糊输入法的制作方法
众所周知,计算机汉字输入是中国人进行计算机文字处理的一大难题。十多年来,虽然很多国人发明了大量的汉字输入码,但得到广泛应用的只有拼音输入法和‘五笔字型’。对于那些既记不住字根又读不准字音的人,现在还是什么输入方法也掌握不了(或者输入速度很慢),依然靠手写交专业录入人员输入。
本人经十余年的调查研究,发现所有这些输入方法,虽然各有其特点,但无论学习难度还是输入速度,和‘五笔字型’都没有实质的区别。对于专业录入人员,‘五笔字型’已先入为主,而且哪儿都有,当然就不可能去学习其他类似的输入方法。对于一般人员,这种输入方法之所以难掌握,一是记的东西太多,二是不直观,不经常用就忘。因为字根是编码的发明人自定的,为了减少字根数,往往都取得比较小,很多比较复杂的单字都无法做到直观输入。例如单字‘矗’最直观的方法显然是分成三个‘直’,可任何以字根做编码部件的输入法都不可能将‘直’作为字根。还有一种汉字输入方法是将汉字拆开按形状和键盘上的字母对应,但无论如何拆分也只有很少的单字能和拉丁字母的形状相吻合,绝大多数都有各种各样的解释。例如有一种编码将‘工’看作大写的英文‘I’取码i,其实也可看成‘T’和数字‘一’,取码t1,还可以看作‘H’取码h。因为在该编码中将 等看作‘躺着的K’。甚至还可以看作罗马字‘I’直接取数字1。因此这种编码的很多部件不是牵强附会,就是具有‘多义性’,表面上好象不要记,实际上都要按发明人规定的方式去想象,因此要记的东西并不少,当然也难以直观。
我认为编码部件和键盘键位最直观的对应方法是读音的第一个拼音字母,例如上述‘矗’字最直观的取码方法是按‘直直直’取码zzz。虽然这种方法对于那些连第一个拼音字母都不会的人也有一定的难度,但这样的人毕竟是极少数,而且随着时问的推移,这样的人会越来越少。
为了解决这个难题,本人曾发明了‘音形三码’计算机汉字输入法。这种输入码将所有相连结构都作为编码部件(字体),并按其读音的第一个拼音字母和键位对应。因此不用背编码部件,和键位的对应关系也很直观,但在使用过程中发现还存在以下几个问题1.相连结构是一个模糊的定义,有些似连非连的部件可能有‘二义性’。例如‘圭’可是看成一个字体取码g,也可看成两个字体‘土土’取码tt。类似的还有‘亲、老、者’等等。
2.有些字体不可读,有些字体虽然可读,但使用者不会读怎么取码?3.独体字怎么取码?原来的规则用户难以掌握。
4.有些单字按字体取码仍然不直观。例如‘繁’按字体应分成‘ 、母、攵、糸’取码fpj(繁 糸)。而很多人都分成‘每、攵、糸’或‘敏、糸’取码。这就说明按规则取码还不直观。
何谓直观?这是一个因人而异的模糊概念,这和年龄、职业、个人经历、文化程度、地理位置等等都有关系。不同人对‘直观’有不同的理解。要使输入方法对所有的人都感到直观易记,唯一的办法是对同一个单字配有多种不同的输入码。‘音形模糊输入法’基本上解决了这个难题。这种输入方法的最大特点就是绝大多数单字都有多个输入码,只要掌握几条最基本的取码原则,就可根据自己理解从中选择比较直观的输入码。它和音形三码的主要区别是1.采用‘字块’作为编码部件,对于一同个单字,这种部件的取法不是固定的,因此有多种分解方法,输入码也不是唯一的。例如上述‘繁’可分成四个字块‘ 、母、攵、糸’取码,也可分成三个字块‘每、攵、糸’取码,还可分成两个字块‘敏、糸’取码。
这里的‘字块’和音形三码中的‘字体’的最大区别是‘字块’只是单字的一部分,不一定要求相连。‘字体’必须是相连结构。一个单字按字块可以有多种分解方法,但按字体分解是唯一的。例如上述‘繁’按字块有三种分解方法,但按字体只有第一种分解方法。
2.对于不可读字块可以按形状相似的可读字取码,也可以一律取逗号键(音形三码中的不可读字体只能按相似字取码),对于可读但不会读的字块,可以按读音取码,也可以取逗号键(音形三码要记很多相似字和难认字体的读音)。
3.独体字也采用了模糊输入法,同样一个字可能有多种输入码(音形三码要记独体字的内含字)。
4.所有单字不分结构类型,一律按书写顺序取四码(音形三码按左右和上下两种结构分别取三码)。
下面就权利要求书中所提到的一些问题作详细说明。
(一)单字的取码Ⅰ.基本原则①先分后拆先将单字按不相连的部分分成若干‘字块’(相邻的字块也可合并),只要能分就要先按字块分开取码,不能先拆开取码。关于字块的对应码见下面第Ⅲ节。例如‘穗’可以先分成三个字块‘禾、 、心’取三码,或分成两个字块‘禾、惠’取两码,即使‘ ’不可读,也不能先拆开取码。
②先取后补分开后如不足四码,再将已取过的部件分(或拆)开取码,称为补码。例如‘穗’按‘先分后拆’的原则先分成两个字块‘禾、惠’,取码hh。如按下述第二套取码方法(不取字音),则还需两个部件,这时再将第二个字块‘惠’分成‘ 、心’取码,x(称为补码,其中‘ ’不可读取逗号键)。因此单字‘穗’的取码为hk,x。同理‘菇’可按(艹姑女古)取码vgng,即先分成‘艹、姑’,‘女、古’是补码。
或按(艹女古ナ)取码vngp,即先分成。‘艹、女、古’,‘ナ’是补码。
以下补码部件一律用斜体阴影字表示。
③先大后小在将字块拆开取码时,应先取包含起笔的最大可读字,无字取起笔。然后再取剩余部分包含起笔的最大可读字,无字取剩余部分的起笔。依此类推,最多取四码。最后一码取剩余部分包含末笔的最大可读字,无字取末笔。例如‘革’可拆成‘廿、口、十’‘龙’可拆成‘ナ、匕、丶’‘典’可拆成‘冂、艹、一、八’‘免’可拆成‘ 、口、儿’‘兔’可拆成‘免、丶’‘鸟’可拆成‘勺、 一,为了直观,有时也可不按书写顺序,尽量取大。或按相似字拆。例如‘革’也可拆成‘廿、中、一’‘龙’也可拆成‘尤、丿’‘鸟’也可拆成‘乌、丶’‘典’也可拆成‘曲、八’Ⅱ.取码方法(字块与键位的对应规则请参阅权利要求书中的(一)Ⅲ)
A.第一套取码方法所有单字的第一码都取字音,简称‘音形输入法’。
1.独体字(所有笔形都相连)(1)方法一。共取三码第一码为单字的第一个拼音字母。
第二码为包含起笔的最大可读字的第一个拼音字母(不一定按书写顺序),如无可读字,第二码取起笔的对应码。
第三码为剩余部分包含末笔的最大可读字的第一个拼音字母(不一定按书写顺序),如无可读字,第三码取剩余部分末笔的对应码(其他剩余部分不取)。
例如‘龙’拆成‘尤、丿’取码lyp‘革’拆成‘廿、中’取码gnz‘鸟’拆成‘乌、丶’取码nwd‘夷’拆成‘大、弓’取码ydg‘更’拆成‘一、史’取码gqs‘单’拆成‘丷、甲’取码dij(2)方法二。按书写顺序取码第一码为单字的第一个拼音字母。
第二码为包含起笔的最大可读字的第一个拼音字母,无可读字取起笔。
第三码为取完第二码后,再取剩余部分包含起笔的最大可读字的第一拼音字母,无可读字取起笔的对应码。
第四码为取完二、三码后,取剩余部分包含末笔的最大可读字的第一个拼音字母,无可读字取末笔的对应码。例如‘龙’拆成‘ナ、匕、丶’取码lcud‘革’拆成‘廿、口、十’取码gnkp。‘鸟’拆成‘勺、 、一’取码nszq‘夷’拆成‘一、弓、人’取码yqgr。
‘更’拆成‘一、日、乂’取码gqrc‘单’拆成‘丷、日、十’取码dirp。
如取了第三码后,单字的所有笔形都已取完,则无第四码,和方法一相同。
2.双体字(如单字分成两个字块)(1)方法一第一码为单字的第一个拼音字母。
第二码为第一个字块的对应码。第三码为第二字块的对应码。
第四码按以下规则取码①如第二个字块可分(以下■代表多笔不可读字体)。
第四码取单字第二字块包含起笔的最大可读字读音的第一个拼音字母,无可读字取起笔的对应码(双笔)或逗号(多笔)。注意以下示图只表示取码顺序,与汉字结构类型无关。第一码为单字的第一个拼音字母,图中未标出。例如‘哟’取码ykyj(哟口约纟)‘纟’念绞丝取j。
‘提’取码tosr(提扌是日)‘藩’取码fvpa(藩艹潘氵)‘氵’为特殊偏旁,取码a‘穗’取码shh,(穗禾惠■)‘ ’为多笔不可读字体‘海’取码hamp(海氵每丿)‘’为双笔不可读字体②如第二个字块不可分,第一个字块可分。
第四码取单字第一字块包含起笔的最大可读字读音的第一个拼音字母,无可读字取起笔的对应码(双笔)或逗号(多笔)。例如‘勋’取码xylk(勋员力口)‘鄹’取码zjeq(鄹聚阝取)‘阝’念耳朵取e。
‘繁’取码fmjm(繁敏糸每)‘糸’念绞丝取j。‘骜’取码aam,(熬敖马■)‘ ’为多笔不可读字体。‘资’取码zcbd(资次贝丶)‘冫’为双笔不可读字体。
③如单字的两个字块都不可分。
第四码为第二字块包含起笔的最大可读字的第一个拼音字母(不一定按书写顺序),如无可读字,第四码取第二字块起笔的对应码。例如‘妹’取码mnwu(妹女未木)‘茂’取码mvwg(茂艹戊戈)‘沾’取码zazs(沾氵占丿)‘占’含起笔无可读字‘沈’取码sa,b(沈氵■冖)‘冖’=宀取b‘攻’取码ggwp(攻工攵丿)‘攵’含起笔无可读字(2)方法二第①、②种情况同方法一。
如单字的两个字块都不可分,第一码取单字本身的第一个拼音字母,第二码取第一个字块的对应码。第三、四码按以下规则取码第三码为第二字块包含起笔的最大可读字的第一个拼音字母(不一定按书写顺序),如无可读字,第四码取起笔的对应码。
第四码为第二字块剩余部分包含末笔的最大可读字的第一个拼音字母(不一定按书写顺序),如无可读字,第四码取末笔的对应码。
‘妹’取码mnuq(妹女木一)‘茂’取码mvgp(茂艹戈丿)‘沾’取码zask(沾氵丨口)‘沈’取码sabe(沈氵冖儿)‘攻’取码ggpc(攻工丿乂)以上两种方法的第③种情况,如第二个字块为单笔、数码或偏旁‘辶廴’,则第三码取此单笔、数码或偏旁‘辶廴’的对应码,第四码取‘o’键。
例如‘礼’取码lszo(礼礻)‘旦’取码drqo(旦日一)‘连’取码lclo(连车辶)‘廷’取码trlo(廷壬廴)3.多体字(如单字分成三个或三个以上字块)第一码为单字的第一个拼音字母。单字的第二、第三和第四码分别为单字的第一、第二和最后字块的对应码。例如‘哟’取码ykjs(哟口纟勺)‘穗’取码sh,x(穗禾■心)‘繁’取码fmwj(繁每攵糸)或取码fpmj(繁 母糸)对于GBK大字库中的汉字,由于大多数是一些难认的单字,如采用上述第一套取码方法,很多字的第一码就不会,这时可切换到下面第二套取码方法。
B.第二套取码方法单字的所有输入码都分(拆)开取。简称‘形音输入法’。
1.独体字第一码取包含起笔的最大可读字的第一个拼音字母,无可读字取单字起笔的对应码。
第二码取第一码剩余部分包含起笔的最大可读字的第一个拼音字母,无可读字取这一部分起笔的对应码。
第三码取前两码剩余部分包含起笔的最大可读字的第一个拼音字母,无可读字取这一部分起笔的对应码。
第四码取前三码剩余部分包含末笔的最大可读字的第一个拼音字母,无可读字取这一部分末笔的对应码。例如‘典’拆成‘冂艹一八’取码kvqi‘乗’拆成‘千艹一八’取码qvqi‘丳’拆成‘口口丿丨’取码kkps‘畢’拆成‘日艹二丨’取码rvws以下几种情况需要补‘o’键。
①如单字取完三码后所有笔形都已取完,则第四码取‘o’键。例如‘堇’拆成‘廿中三’取码nzeo‘更’拆成‘一日乂’取码qrco‘両’拆成‘一冂山’取码qkso‘畢’拆成‘甲艹二’取码jvwo②如单字取完两码后,所有笔形都已取完,则单字的第三和第四码都取‘o’键。例如‘克’拆成‘古、儿’取码geoo‘里’拆成‘日、土’取码rtoo‘币’拆成‘丿、巾’取码pjoo‘夷’拆成‘大、弓’取码dgoo③如取完一码后,只剩单笔或数码,则第单字三码补取‘o’键,此时无第四码。
例如‘王’拆成‘干一’取码gqo,‘兰’拆成‘丷三’取码ieo,‘中’拆成‘口丨’取码kso,‘厂’拆成‘一丿’取码qpo。
注独体字的取码也不是唯一的,例如上面‘畢’就有两种方法取码。又如‘克’还可拆成‘十兄取码pxoo或拆成‘十口儿’取码pkeo‘王’还可拆成‘三丨’取码eso或拆成‘一土’取码qtoo④少数易认难拆的独体字,可取读音第一个字母加逗号和‘o’键。难认又难拆分的独体字,可取两个逗号加‘o’键。例如凹a,o凸t,o長c,o畢b,o龜g,o粛s,o‘丗、丣、戼、肅、镸、黽’等都可取码‘,,o’。
2.双体字第一码取第一字块的对应码,第二码取第二字块的对应码,第三、第四码必须按以下规则补码①如第二个字块可分开。
第三码取单字第二字块包含起笔的最大可读字读音的第一个拼音字母,无可读字取起笔的对应码(双笔)或逗号(多笔)。
第四码取单字第二字块剩余部分包含末笔的最大可读字读音的第一个拼音字母,无可读字取末笔的对应码(双笔)或逗号(多笔)。例如‘哟’取码kyjs(口约纟勺)‘纟’念绞丝取j。
‘提’取码osr,(扌是日■)‘疋’为不可读多笔‘藩’取码vpaf(艹潘氵番)‘穗’取码hh,x(禾惠■心)‘海’取码ampm(氵每丿母)‘’为不可读双笔②如第二个字块不可分,第一字块可分。
第三码取单字第一字块包含起笔的最大可读字读音的第一个拼音字母,无可读字取起笔的对应码(双笔)或逗号(多笔)。
第四码取单字第一字块剩余部分包含末笔的最大可读字读音的第一个拼音字母,无可读字取末笔的对应码(双笔)或逗号(多笔)。例如‘勋’取码ylkb(员力口贝)‘鄹’取码jeq,(聚阝取■)‘乑’为不可读多笔‘繁’取码mjmw(敏糸每攵)‘鷔’取码am,w(敖马■攵)‘资’取码cbdq(次贝丶欠)‘冫’为不可读双笔第三码为第二字块包含起笔的最大可读字的第一个拼音字母(不一定按书写顺序),如无可读字,第三码取起笔的对应码。
第四码为第二字块剩余部分包含末笔的最大可读字的第一个拼音字母(不一定按书写顺序),如无可读字,第四码取末笔的对应码。例如‘妹’取码mwuq(女未木一)‘茂’取码vwgp(艹戊戈丿)‘捷’取码o,pr(扌■十人)‘沈’取码a,be(氵■冖儿)‘号’取码k,qz(口■一 )如第二字块不可读,有时也可按独体字的取码方法拆开取其一、二、末码作为单字的第二、三、四码。如只能拆成两部分,单字的第四码取o键。例如‘捷’取码opkr(扌十彐人)‘疌’拆成‘十彐一人’‘场’取码tzpp(土ㄋ丿丿)‘ ’拆成‘ㄋ丿丿’‘号’取码kqzo(口一 )‘丂’拆成‘一 ‘榷’取码ubzo(木冖隹)‘隺’拆成‘冖隹’‘沈’取码abeo(氵冖儿)‘冘’拆成‘冖儿’④如单字的第二字块是单笔、数码或偏旁‘辶廴’,则单字的第二码取码此单笔、数码或偏旁‘辶廴’的对应码,第三码补‘o’键。此时无第四码。
例如‘礼’取码szo(礻)‘旦’取码rqo(日一)‘连’取码clo(车辶)‘廷’取码rlo(壬廴)3.三体字单字的第一、第二和第三码分别取第一、第二和第三个字块的对应码。
①单字第四码补取第三字块包含起笔的最大可读字的对应码。如无可读字,取起笔对应码(第三字块不可分或第三字块可分且分出的第一部分是双笔),或取逗号(第三字块可分且分出的第一部分是多笔)。例如‘露’取码yzgw(雨足各夊)分出‘夊’可读‘潝’取码ahyx(氵合羽习)分出‘习’分可读‘嗨’取码kamp(口氵每)分出‘’双笔不可读‘镲’取码jbj,(钅宀祭■)分出‘ ’多笔不可读‘篟’取码zeq,(亻青)分出‘’多笔不可读‘泽’取码ayw s(氵又■二)‘ ’含起笔有可读字‘潭’取码axz r(氵西早日)‘早’含起笔有可读字‘铴’取码ja,z(钅氵■ㄋ)‘ ’含起笔无可读字‘狮’取码q,,q(犭■■一)‘币’含起笔无可读字‘葃’取码vrz p(艹日乍丿)‘乍’含起笔无可读字②如第三字块不可读,有时也可按独体字的取码方法拆开取其第一最后一码作为单字的第三、四码。例如‘泽’取码ayws(氵又二丨)‘ ’拆成‘二丨’‘概’取码ugke(木艮匚儿)‘旡’拆成‘匚儿’‘降’取码ewks(阝夊匚丨)‘ ’拆成‘匚丨’‘獅’取码q,qj(犭■一巾)‘币’拆成‘一巾’‘铴’取码jaz p(钅氵ㄋ丿)‘ ’拆成‘ㄋ丿丿’
③如单字的第三字块是单笔、数码或偏旁‘辶廴’,则第三码取其对应码,第四码一律补取‘o’键。例如‘矧’取码sgso(矢弓丨)‘冥’取码bryo(冖日六)‘逛’取码qwlo(犭王辶)‘挺’取码orlo(扌壬廴)4.多体字(如单字分成四个或四个以上字块)。
单字的第一、第二、第三和第四码,分别为单字的第一、第二、第三和最后字块的对应码。例如‘赣’可分成‘立早夊工贝’五个字块,取码lzwb(立早夊贝)。‘瀚’可分成‘氵十早人羽’五个字块,取码apzy(氵十早羽)。‘襻’可分成‘衤木乂乂木大手’七个字块,取码yuco(衤木乂手)。
Ⅲ.字块和键位的对应关系1.如字块本身就是单字。按其读音的第一个拼音字母和键位对应。
此项和音形三码的字体与键位的对应关系相同。
2.如字块是十个文数码。按第一排拉丁字母键对应,即一q二w三e四r五t六y七u八i九o十p小写数码字本身的取码为对应码加一个句号键,大写数码字本身的取码为对应码加两个句号键。
此项和音形三码相同3.如字块是笔形。除‘横’按数码‘一’对应于‘q’外,其余都取读音的第一个拼音字母。即、(点)d丨(竖)s一(横)q丿(撇)p∠乛ㄋ(折)z(捺)n此项和音形三码基本相同,仅将原来的笔形‘角’合并为‘折’。
4.如字块是偏旁部首。取习惯念法的第一个拼音字母。
此项定义和音形三码相同,但是对于一些变形的偏旁部首,音形三码要求必须按对应的偏旁取码,这里也可取逗号键。例如 (疋)、 (羊)、 (牛)、采(采)、(心)、丬 、户(户)、 (手)等变形的偏旁部首,除可按对应的偏旁取码外,也可取逗号。
5.八个特殊偏旁木u扌手o 讠言i 辶廴L亻e氵水a艹 v月f此项在音形三码的基础上作了如下调整辶廴子原来都取逗号键,现辶廴取L键,子按其音取z键。
亻原来取L键,现取e键。
6.以下字块按形状合并匕=七u(作为数码)丷=八i(作为数码)士=土t 口=方f匚冂凵彐=框k ナ乂=叉c …=宀b此项在音形三码的基础上作了简化。例如‘匚、冂、凵、彐’原来分别取名为区框、同顶、山底,雪底,对应于q、t、s、x。现一律读‘框’取k。‘廴’原读‘建旁’取j,现和‘辶’合并取L。
7.其余字块统称为不可读字块。
(1)双笔不可读字块。按起笔和键位对应。
此项和音形三码基本相同,但将起笔‘角’合并为‘折’。此外,一部分不可读双笔结构也可取逗号键。
(2)多笔(两笔以上)不可读字块。有两种方法和键位对应①一律取逗号键。
②按形状相似的可读字取码。
两个不可读字体可以合并成一个不可读字块,不能将两个可读字体或一个可读与一个不可读字体合并成一个不可读字块。例如 就是由两个不可读字体合并成的一个不可读字体。‘款’的右边,不能将‘土、示’合并成一个不可读字体。‘蕙’的上面,不能将‘艹、 ’合并成一个不可读字体。
此项改变较大,原音形三码要求一律按对应的相似字取码,比较难记。现在只要取逗号键就可以了(一部分也可按相似字取码)。此外,绝大多数难认的可读字体,除了按其读音取码外,也可取逗号。例如聿(yu)、夬(jue)、乇(tuo)、彖(tuan)、豕(Shi)、豸(zhi)等除按读音取码外,都可取逗号键。
Ⅳ.符号码一律和名称同步,即按相应名称取码。
字符取码的简单方法是标点符一律先取逗号键,然后到提示行查找。其他字符可先取句号键,然后到提示行查找。
此项的主要改进是原来是先取句号键,然后取字符名称的简码,现在除保留了原来的取码外,还增加了和字符名称相同的输入码。例如¥(人民币)原来的取码为‘.rb’。现在增加了直接按其名称‘人民币’取码‘rmb;’。这样可以不用记简码,直接按名称输入。
注词语的取码规则和音形三码完全相同。
现在所有编码都是要求用户按照发明人制定规则输入汉字,因此必须先记规则。一般说,规则越少,‘多义性’的字就越多。对用户而言,不仅要记规则,而且还要按发明人的意图,从多种解释中选择一种。如不符合规则,即使用户感到很直观也不能输入。虽然表面上规则少,但不一定比‘五笔字型’容易学。音形模糊输入法正好相反根据人们最直观的取码方法来制定编码规则。一个字如有‘二义性’则编两个输入码,如有‘多义性’则编相应的多个输入码。有些编码虽然符合规则,但很不直观,因此就没有编进输入码。反之,有些虽然不符合规则,但比较直观,因此也编进输入码。比如‘彧’看成‘或’加两撇取码‘hppo’,就比按规则取码‘,kqo’更直观。用户在使用时,只要掌握三条基本原则,并不需拘泥于编码规则,就可以按书写顺序输入。而且一旦掌握,可以终身不忘。音形模糊输入法的最主要特征在于‘模糊’,即很多汉字都有多个输入码,用户可以根据自己的理解,选择最直观的输入码。
一个汉字能构成多个输入码的主要途径是1.同一汉字有多种分解方法。
例如按第二套取码方法‘虂’有以下四种方法分解取码①‘艹雨足夊口’取码vyzk(艹雨足口)②‘艹雨足各’取码vyzg③‘艹雨路’取码vylz(艹雨路足)④‘艹露’取码vlyl(艹露雨路)2.同一种分解方式可能有不同的取码方法(请参阅前面双体字的取码)。
3.同一部件可能有多种方法和键位对应。
4.除了按规则取码外,还有一些比较直观的非规则码(容错码)。
下面以单字‘镑’按第一套取码方法为例说明(共有八个输入码)。
分成三个字块‘钅 方’ 分成两个字块‘钅旁’ 注bj,f(镑钅■方) bjp,(镑钅旁■) 作为不可读字块bjbf(镑钅宀) bjpb(镑钅旁宀)作为宀取码bbjlf(镑钅立方) bjpl(镑钅旁立)作为立取码lbjdf(镑钅亠方) bjpd(镑钅旁亠)拆开取码(容错码)


注意所有附图只表明单字的取码顺序,用阿拉伯数字表示。分开按书写顺序取字块用从左到右表示(不一定是左右结构),拆开补码时按书写顺序用从上到下表示(不一定是上下结构)。所有附图都与单字的结构类型无关。A.第一套取码方法(第一码为单字字音,图中未标出)图一说明书第3页 2.双体字 方法一 ①第二字块可分图二说明书第3页 2.双体字 方法一 ②第二字块不可分图三说明书第3-4页 2.双体 字方法一 ③两个字块都不可分图四说明书第4页 2.双体字 方法二图五说明书第4页 3.多体字B.第二套取码方法图六说明书第5页 2.双体字 ①第二字块可分图七说明书第5页 2.双体字 ②第二字块不可分图八说明书第6页 2.双体字 ③两个字块都不可分图九说明书第6页 2.三体字 ①第三块可分图十说明书第6页 2.三体字 ②第三块不可分图十一说明书第6页 2.三体字 ③第三块不可读
权利要求
计算机音形模糊输入法是在音形三码的基础上进一步简化的计算机汉字输入方法,其主要特征是没有固定的编码部件,任何人都可将单字按书写顺序分开,然后取读音的第一个拼音字母输入。所谓‘模糊’主要是指一个单字可能有多个输入码,用户可凭直观选用,不用死记规则。(一)单字的取码Ⅰ.基本原则①先分后拆先将单字按不相连的部分分成若干‘字块’(相邻的字块也可合并),只要能分就要先按字块分开取码,不能先拆开取码。关于字块的对应码见下面第Ⅲ节。②先取后补在将单字分开取码后,如不足四码,再将已取过的部件分(或拆)开取码,称为补码。③先大后小在将字块拆开取码时,应先取包含起笔的最大可读字,无可读字取起笔。然后再取剩余部分包含起笔的最大可读字,无可读字取剩余部分的起笔。依此类推,最多取四码。最后一码取剩余部分包含单字末笔的最大可读字,无可读字取末笔。Ⅱ.取码方法A.第一套取码方法所有单字的第一码都取本身读音的第一个拼音字母。简称‘音形输入法’。1.独体字(所有笔形都相连)(1)方法一。共取三码第一码为单字的第一个拼音字母。第二码为包含起笔的最大可读字的第一个拼音字母(不一定按书写顺序),如无可读字,第二码取起笔对应码。第三码为剩余部分包含末笔的最大可读字的第一个拼音字母(不一定按书写顺序),如无可读字,第三码取末笔的对应码。(2)方法二。按书写顺序取码第一码为单字的第一个拼音字母。第二码为包含起笔的最大可读字的第一个拼音字母,无可读字取起笔的对应码。第三码为取完第二码后,再取剩余部分包含起笔的最大可读字的第一拼音字母,无可读字取起笔的对应码。第四码为取完二、三码后,取剩余部分包含末笔的最大可读字的第一个拼音字母,无可读字取末笔的对应码。如取了第三码后,单字的所有笔形都已取完,则不取第四码,此时和方法一相同。2.双体字(如单字分成两个字块)(1)方法一第一码为单字的第一个拼音字母。第二码为第一个字块的对应码。第三码为第二字块的对应码。第四码按以下规则取码①如第二个字块可分开。第四码取单字第二字块包含起笔的最大可读字读音的第一个拼音字母,无可读字取起笔的对应码(双笔)或逗号(多笔)。②如第二个字块不可分,第一个字块可分。第四码取单字第一字块包含起笔的最大可读字读音的第一个拼音字母,无可读字取起笔的对应码(双笔)或逗号(多笔)。③如单字的两个字块都不可分。第四码为第二字块包含起笔的最大可读字的第一个拼音字母(不一定按书写顺序),如无可读字,第四码取第二字块起笔的对应码。(2)方法二第①、②种情况同方法一。如单字的两个字块都不可分,第一码取单字本身的第一个拼音字母,第二码取第一个字块的对应码。第三、四码按以下规则取码第三码为第二字块包含起笔的最大可读字的第一个拼音字母(不一定按书写顺序),如无可读字,第四码取起笔的对应码。第四码为第二字块剩余部分包含末笔的最大可读字的第一个拼音字母(不一定按书写顺序),如无可读字,第四码取末笔的对应码。以上两种方法,如第二个字块为单笔、数码或偏旁‘辶廴’,则第三码取此单笔、数码或偏旁‘辶廴’的对应码,第四码取‘o’键。3.多体字(如单字分成三个或三个以上字块)第一码为单字的第一个拼音字母。单字的第二、第三和第四码分别为单字的第一、第二和最后字块的对应码。B.第二套取码方法单字的所有输入码都分(拆)开取。简称‘形音输入法’。1.独体字第一码取包含起笔的最大可读字的第一个拼音字母,无可读字取单字起笔的对应码。第二码取第一码剩余部分包含起笔的最大可读字的第一个拼音字母,无可读字取这一部分起笔的对应码。第三码取前两码剩余部分包含起笔的最大可读字的第一个拼音字母,无可读字取这一部分起笔的对应码。第四码取前三码剩余部分包含末笔的最大可读字的第一个拼音字母,无可读字取这一部分末笔的对应码。以下情况需补‘o’键①如单字取完三码后所有笔形都已取完,则第四码补‘o’键。②如单字取完两码后所有笔形都已取完,则需补两个‘o’键。。③如单字取完一码后只剩单笔或数码,则单字的第二码取此笔形或数码的对应码。第三码补‘o’键,此时无第四码。④少数易认难拆的独体字,可取读音第一个字母加逗号和‘o’键。难认又难拆分的独体字,可取两个逗号加‘o’键。2.双体字第一码取第一字块的对应码,第二码取第二字块的对应码,第三、第四码按以下规则取码①如第二个字块可分开。第三码取单字第二字块包含起笔的最大可读字读音的第一个拼音字母,无可读字取起笔的对应码(双笔)或逗号(多笔)。第四码取单字第二字块剩余部分包含末笔的最大可读字读音的第一个拼音字母,无可读字取末笔的对应码(双笔)或逗号(多笔)。②如第二个字块不可分,第一字块可分。第三码取单字第一字块包含起笔的最大可读字读音的第一个拼音字母,无可读字取起笔的对应码(双笔)或逗号(多笔)。第四码取单字第一字块剩余部分包含末笔的最大可读字读音的第一个拼音字母,无可读字取末笔的对应码(双笔)或逗号(多笔)。⑨如单字的两个字块都不可分。第三码为第二字块包含起笔的最大可读字的第一个拼音字母(不一定按书写顺序),如无可读字,第三码取起笔的对应码。第四码为第二字块剩余部分包含末笔的最大可读字的第一个拼音字母(不一定按书写顺序),如无可读字,第四码取末笔的对应码。如第二字块不可读,有时也可按独体字的取码方法将其拆开取其一、二、末码作为单字的第二、三、四码。如只能拆成两部分,单字的第四码取‘o’键。④如单字的第二字块是单笔、数码或偏旁‘辶廴’,则单字的第二码取码此单笔、数码或偏旁。‘辶廴’的对应码,第三码取‘o’键。此时无第四码。3.三体字①单字的第一、第二和第三码分别取第一、第二和第三个字块的对应码。单字的第四码取第三字块包含其起笔的最大可读字的对应码。如无可读字,第四码取起笔的对应码逗号。②如第三字块不可读,有时也可按独体字的取码方法拆开取其第一和最后一码作为单字的第三、四码。③如第三字块是单笔、数码或偏旁‘辶廴’,单字的第三码取其对应码,第四码一律取‘o’键。4.多体字(如单字分成四个或四个以上字块)。单字的第一、第二、第三和第四码,分别为单字的第一、第二、第三和最后字块的对应码。Ⅲ.字块和键位的对应关系1.如字块本身就是单字。按其读音的第一个拼音字母和键位对应。2.如字块是十个文数码。按第一排拉丁字母键对应,即一q二w三e四r五t六y七u八i九o十p小写数码字本身的取码为对应码加一个句号键,大写数码字本身的取码为对应码加两个句号键。3.如字块是笔形。除‘横’按数码‘一’对应于‘q’外,其余都取读音的第一个拼音字母。即(点)d 丨(竖)s一(横)q 丿(撇)p ∠乛ㄋ(折)z(捺)n4.如字块是偏旁部首。取习惯念法的第一个拼音字母。5.八个特殊偏旁木u 扌手o 讠言i 辶廴 亻e 氵水a v月f6.以下字块按形状合并匕=七u(作为数码)丷=八i(作为数码)士=土t 口=方f匚冂凵彐=框k ナ乂=叉c 冖 宀b7.其余字块统称为不可读字块。(1)如是双笔,则按起笔和键位对应。(2)如是多笔(两笔以上)。则有两种方法和键位对应①一律取逗号键。②按形状相似的可读字取码。两个不可读字体可以合并成一个不可读字块,不能将两个可读字体或一个可读与一个不可读字体合并成一个不可读字块。Ⅳ.符号码一律和名称同步,即按相应名称取码。字符取码的简单方法是标点符一律先取逗号键,然后到提示行查找。其他字符可先取句号键,然后到提示行查找。
全文摘要
计算机汉字音形模糊输入法是一种无固定编码部件的计算机汉字输入方法。由于一个单字有多种方法分解成几个字块,每个字块又有多种方法和键位对应,因此一个单字有几个乃至十几个输入码。根据先分后拆、先取后补、先大后小的原则,不用背字根,也不用拼音,任何人都可以选择自己认为最直观的输入码,按书写顺序输入汉字。
文档编号G06F3/023GK1309342SQ00100829
公开日2001年8月22日 申请日期2000年2月16日 优先权日2000年2月16日
发明者石啸生 申请人:石啸生
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1