汉字全形码输入方法

文档序号:6600478阅读:949来源:国知局
专利名称:汉字全形码输入方法
技术领域
本发明属于计算机汉字输入技术领域。
目前计算机汉字输入方案,都需要记忆相当多的规则和数码,专业录入人员经培训后可以熟练地掌握,但对广大使用电脑的非专业录入人员,例如作家、电化教学工作者、家用电脑使用者、以及将电脑作为工具进行工作的生产管理人员,使用这些编码方案就显得力不从心了,一方面要对输入的文稿内容进行思考,一方面又要随时恪守许多输入规则和数码,这二者很难融合起来。
本发明的目的是发明一种按照汉字本身的书写习惯进行录入的,不需要更多的记忆规则的汉字输入方法,使其能克服现有技术的以上缺点,更快、更自然地进行汉字输入。
本发明的方法是通过以下手段实现的。
采用由两位阿拉伯数字为单元的拆分码和鉴别码对汉字进行全形编码输入。根据汉字书写时起笔笔形(横、竖、撇、点、折)将计算机的英文字母键盘划分为五个输入区,给出相应的笔形码。每个输入区由代表不同笔画数(笔画码)的编号按键组成,汉字的字元以其起笔笔形的区码和笔画数的画码组成的两位阿拉伯数字构成的笔画码为基本输入单元,对于多字元字,其各字元的输入顺序以汉字规范书写顺序为准。当汉字的字元的笔画数多于该区的最大画码时,采用所谓笔形码输入两位阿拉伯数字的高位代表其首笔笔形的区码,低位代表其末笔笔形的区码。笔画码和笔形码构成拆分码。
鉴别码仅用在三个码长的拆分码仍不能唯一确定被输入汉字时使用。分为字形鉴别码和笔形鉴别码两种,字形鉴别码由两位阿拉伯数字代表,其高位为该字末笔笔形的区码,其低位为以五个阿拉伯数字之一代表的字形结构码“1”为独体形字;“2“为左右形字;“3”为上下形字;“4”为包围形字;“5”为内外形字。笔形鉴别码亦由两位阿拉伯数字代表(1)左右形字以第一字元末笔笔形的区码为高位,第二字元末笔笔形的区码为低位鉴别笔形;(2)上下形字以第二字元末笔的区码为高位,第三字元末笔笔形的区码为低位鉴别笔形;(3)包围形内外形字把外元除开后,以其他两个字元的末笔笔形的区码鉴别笔形。
五个输入区可这样划分一区(笔形码为“一”),首笔为“横”的输入区二区(笔形码为“丨”),首笔为“竖”的输入区三区(笔形码为“丿”),首笔为“撇”的输入区四区(笔形码为“丶”),首笔为“点捺”的输入区五区(笔形码为“乙”),首笔为“折”的输入区在“横区”中拆分码为11(M);12(N);13(B)14(V);15(C);16(X);17(Z)键表示起笔为横,笔画数分别是1至7画的字元;在“竖区”中拆分码为21(G);22(F);23(D)24(S);25(A)键表示起笔为竖,笔画数分别是1至5画的字元;在“撇区”中拆分码为31(T);32(R);33(E)34(W);35(Q)键表示起笔为撇,笔画数分别是1至5画的字元;
在“点区”中拆分码为41(Y);42(U);43(I)44(O);45(P)键表示起笔为点,笔画数分别是1至5画的字元;在“折区“中拆分码为51(H);52(J);53(K)54(L)键表示起笔为折,笔画数分别是1至4画的字元。
键盘的分布规律如键盘图所示。
由于本发明方法从汉字的笔形、笔画和字形入手,充分照顾到汉字的书写习惯,从汉字的字形规范化角度来编制汉字的输入方法,输入方式自然,不需要人为地记忆更多的规则,熟悉后有较高的输入速度,尤其适合于专业录入人员进行“无记忆输入”。另外,采用本发明方法,初学汉字的人既能自如地输入汉字,又能逐步掌握汉字的规范书写方法,为汉字电脑的初级教育带来独到的好处。
下面,结合输入法中的一些规定,从拆分码的使用、拆分中的有关规定、鉴别码的使用、疑难字的处理四个方面,通过举例,将本发明方法作一个系统的详述。
拆分码的使用一,笔形规定汉字较早有所谓“永”字笔形法,即把汉字规定为八种笔形。1936年就有人提出“五笔形”概念,这种主张逐渐被人们接受,特别是近代,几乎所有的词典字书都按“五笔形”排序。这种方法可称作“札”字笔形法,即(1)横(包括“提”);(2)竖;(3)撇;(4)捺(包括“点”);(5)折(包括所有带钩、带弯的笔形)。“汉字全形输入法”也按照习惯把笔形规定为横、竖、撇、点、折五种,并且,把这五种笔形划为五个区,一区为“横”;二区为“竖”;三区为“撇”;四区为“捺”;五区为“折”。
二,字形规定文字学上只有独体字及合体字,因为合体字中的部件可按上下、左右、内外等方式排列,所以,汉字字形一般有独体字、上下字、左右字、内外字四种字形。“汉字全形输入法”又把内外形字中有两边包围的字规定为包围形字,如进、远、赵、趋、魁、历、压、疼、痴、摩、鏖等,把三边及四边包围的字规定为内外形字,如区、同、闲、国等。因此,“汉字全形输入法”的字形有(1)独体形字;(2)左右形字;(3)上下形字;(4)包围形字;(5)内外形字五种。
三,笔画码及笔形码一个特定的汉字是由笔形、字形、笔画数构成的,一旦这三种因素中有一种因素出错就会使这个字发生音义差错。发生笔形错误的如千干;夭天;王壬。发生字形错误的如员呗;标柰;呐呙。发生笔画数错误的如免兔;氏氐;厄卮。因此,“汉字全形输入法”要求使用者不要发生上述错误。
“汉字全形输入法”规定一区输入部件笔画数最多为七画,其含义是这个部件起笔是“横”笔画数在七画以内(包括七画)如“碧”字中的“王”这个部件起笔是“横”,属一区部件,笔画数是四画,输入码是14。其中高位的“1”代表一区(“横”笔画区);“4”表示“王”这部件是四画。二区、三区、四区输入部件笔画数最多为五画。五区输入部件笔画数最多为四画。象上述“碧”字,它的拆分码是“王14”、“白35”、“石15”,这些部件都没有超过各区规定的笔画数,这样形成的编码称作“笔画码”。但是,由于汉字笔画多少极不一致,有不少部件都超过了各区规定的笔画数,对于这些部件我们使用它们起笔的笔形与它们的末笔笔形为输入码,如“解”字中的“角”这个部件它的输入码是“32”,其中高位的“3”及低位的“2”都代表笔形,“3”是撇,“2”是竖。象这样形成的编码就称作“笔形码”。
使用本发明方法对汉字的拆分原则,可概括为四句话二十个字按规定画码;依笔画顺序;拆最大字元;取中部对称。按规定画码“画”指的是汉字部件能够取的最多笔画数。一区(横笔形区)为7画,二区(竖笔形区)、三区(撇笔形区)、四区(点笔形区)各为5画,五区(折笔形区)为四画。“码”指的是“码长”,即一字取多少码。“全形法”的“码”有两种性质,一是拆分码,二是鉴别码。“拆分码”是拆分汉字形成的编码。“全形法”规定拆分码最多为三码长,即一个字最多拆三次。“鉴别码”是鉴别汉字的字形或笔形的编码,它是编码的最后的一位。因此,一个汉字的编码是由“拆分码”加“鉴别码”形成的,总码长是四位。注意,“全形法”中并不是所有字都要输入“鉴别码”,有四千多字只有“拆分码”,也就是说有四千多字是三码字,其中在三百六十个是二码字。
依笔画顺序依写字的先后顺序拆分汉字部件。写字的先后顺序一般不会搞错。这里再把汉字的先后顺序重申一下先横后竖(十);先撇后捺(人);从上到下(三);从外到内(向);先中间后左右(小);先里头后封口(国);先旁包后里头(历);先里头后旁包(这);先主体后穿心(韦);先主体后点点(戈);先点点后主体(义)。
这些方法基本上概括了汉字写字顺序。对于极少数起笔有二义性的字,这里再重新定义一下(字末编号是该字的首尾笔形)匕九几兆35;长及34;北25;女毋母51;以54;比15;非21;山22;出52;犭豸33;力刀乃53;敝44。
字的末笔这里也再说明一下。一个字(或一个部件)的末笔大多在字的最下面如王、里、鱼、点、国、早、羊。在右下,如木、头、最、这、建、数。这是最多的两种末笔。末笔在右上的只有戈、求、犬、尤、甫等字,这些字的共同特点是末笔只有独立的一点。末笔在左下的字有才、犭、豸、身等字,这些字的共同特点是末笔都是撇笔形。还有一种末笔在中间的字,如册、舟、女、子、马、母,这些字的共同特点是,末笔都是横笔形。末笔在内的字有内、同、青、月、间、魁、起等字。归纳起末笔的位置有如下这些下、右下、右上、左下、中部、内部。
拆最大字元更明确的说是拆最大字元字。一个字作为另一个字的部件使用时它只有两种可能性。一是作一码输入,二是拆分为两码(因为,一个字拆分码最多只有三码长,所以,一个字作部件使用时最多只能拆分为二码)。拆分为二码时,有个怎样取码的问题,这里我们规定取最大字元字的原则。如“舍”拆分码是“人32干13口23”,如果把它作为“啥”字的部件使用时,它就必需拆分为两码,怎样把“舍”拆分为两码呢?这里就要使用“拆最大字元字”的方法。所谓“拆最大字元字”是指这个部件中包含有的一个笔画最多的字。“舍”字中最大的部件字是“古”字,它就是取“拆最大字元字”的标准。“舍”字把“古”字元取走后,余下的“人一”作为一个输入码,“人一”共三画,起笔是撇,它的码值是“33”,因此,“啥”字的拆分是“口23 33古15”。有时侯一个部件中没有包含部件字如“浚”字,右边的部件没有包含部件字,但是,它有三个有称谓的部首“ 52八32夂33”,问题是如何把为三个部件编为两个输入码,这里也要采取“拆最大字元字”法。在比较最大字元时,是把首字元与末字元比较,其他字元暂时不管,把最大字元确定后,再把未确定的其他字元结合成一个输入码(不管余下的是一个、两个、还是更多)。象上面的“ 、八、夂”都是有称谓的部首字元,首字元是两画,末字元是三画,因此,末字元“夂”就是我们要确定的“最大字元”码值是“33”把这个最大字元确定以后,余下的“ 、八”合起来作为一个输入码,码值是“54”(合起来共计四画,起笔是“折”所以码值是“54”——起笔是第五区,笔画数是四画),这样,“浚”字的完整的拆分码就是“43 5434”。这里还要强调,“拆最大字元字”一定是把首字元与末字元相比较,不要把所有的字元都拿来相比较。比如“离”作字元使用在“篱”字中时,就不能把“离”字中的“凶”作最大字元来处理,因为“凶”不是首字元,也不是末字元。离字共十画由“亠42凶34”及最后一个“”四画的符号相组成,这个符号字元与“亠”比较是一个最大字元,但是,我们并没有把它作为标准的最大字元来提取,因为它是一个没有称谓的符号字元(在一般的字典中无法确定它),因此,我们把衣字头“亠”这个常用的有称谓的部首作为最大字元来处理,把“凶”及这个符号字元作为一个输入码,由于这两个字元合起的笔画数已超过三区规定的笔画数(两个字元加起来是八画三区规定笔画数是五画),因此就用这个字元的首尾笔形作输入码,码值是“34”,于是“篱”字的拆分码就是“竹34亠42 34”,其中一、三码是笔形码,第二码是笔画码。以上是上下形字元的取码方法。
包围形及内外形字作字元使用时,又是怎样取最大字元呢?这里我们举例说明。“厥”字拆分码为“厂12 43欠34”,当它用在“蕨”字中作部件时,它只能拆为两个拆分码,从表面上看是乎应该是“厂1244”,如果这样拆就违背了取最大字元字的方法,因为“厥”字中的第一码“厂12”是一个两画字,而第三码“欠34”却是一个四画字,因此“欠”是最大优选字元,把“欠34”字元取了后,“厥”就只有“厂”及一个六画的符号字元“43(六画符号字元的笔形码)”,所以,这个符号字元和“厂”字元应结合为一个输入码,这个输入码是笔形码,码值是“13”。不难看出“蕨”字的拆分码应该是“艹1213欠34”。又如“堰”字中右边的这个部件,一般字典也没有这个字,它是由“匚日女”三个部件组成在一、三字元中“女”是多笔画,所以要优选,而把“匚日”作为一个输入码,它是一个笔画码,码值是“16”,因此,“堰”字的拆分码应该是“土13 16女53”这三码都是笔画码。这个问题在“取中部对称”方法中还要论述。
取中部对称有一些汉字部件(特别是一些独体字),它们没有层次感,如果按笔画顺序无法取出字元字,这时就要采用“取中部对称”的办法来处理。如“重”字的拆分码是“千33日24二12”其中的“千33”就是采用取中部字元的方法。“射”字的拆分码是“34三13寸13”,其中的“三13”也是用取中部字元的方法。
“盘”字的拆分码是“35一11皿25”,取中部字元是“一11”。
“属”字的拆分码是“尸53 34口23”,取中部字元是“口23”。
“盥”字的拆分码是“31水54皿25”,其中符号字元“31”是取对称字元,“水54”字元是取中部字元。符号字元“31”是笔形码,其他是笔画码。
“取中部对称”的方法应遵循两个原则1,采用“取中部对称”时,另一个字元应具备不可拆分性;2,字元本身按笔画顺序取不出字元字或有称谓的符号字元(如“离”字不能取中部的“凶”,因为按笔画顺序可以取一个“亠”字头)。
拆分中的有关规定一,一般情况一个字应拆分为三码,不能拆为三码的应符合二码字的条件。
二,二码字中两个字元必须是笔画码的非拆分字元。两码字可以取单画的中部字元,如“工”(二12丨21)。
三,1,三码字不能取两个单画字元,如“成”不能拆为“戈14丿31乙51”,因此,“成”字是两码字(戊15乙51)。2,不能取不按笔画顺序的单画码(“戈”字类字元例外)如“配”不能拆为“西16一11己53”,因此,“配”是两码字,拆为“酉17己53”。但允许取按笔画顺序形成的单画字元,如“许”可拆为“讠42丿31干13”。
四,留部首字元,拆非部首字元1,部首字元与非部首字元组合的字,一般情况拆非部首字元,如“颏”拆为“44人32页16”。
2,一个字如果由两个部首字元组成,应本着拆右不拆左、拆下不拆上、拆内不拆外的原则处理,如“靓”拆为“青11冂22儿32”;“类”拆为“米44一11人32”;“魁”拆为“鬼34冫42十12”。
3,部首字元与取中部字元组合的字,一般情况可拆部首字元(除非部首字是非拆分字元,才按取中部字元的办法处理)如“蛮”拆为“亦44中24 12”;“弯”拆为“六44 22弓53”;“龋”拆为“止24凶34禹34”;“属”拆为“尸53 34口23”。
五,词汇输入法词汇输入法中不存在“鉴别码”,只有“拆分码”,因此,使用词汇输入更能减少记忆量,提高输入速度。
1,二字词每个字输入两码。如“中国”一词的输入码是“23 21 23 15”它们都是“笔画码”。“一般”一词中的“一”因为是单笔画字,输入码只有一个所以“一般”一词只有三个输入码“11 31 34”,三码输入后如果提示行是唯一的一个词,就用“空格键”输入该词,如果不是唯一的词就使用模拟空格键“Z”输入该词。上述的“一般”这个词,三个拆分码输入完了的时侯还与“搬”发生重码这时就使用模拟空格键“Z”来输入“一般”这个词。“唯一”这个词的输入码是“23 31 11”三码输入后,提示行只有“唯一”一个词,因此,就使用空格键直接输入它。
2,三字词第一个字输入二码,二、三字各输入一码,如有单画码,处理方法同上。如“思想性25 44 14 41”其中一、二码是笔画码,三、四码是笔形码。
3,四字词每个字各输入一码。如“愚公移山”“2434 34 23”,其中一、三是笔形码,二、四是笔画码。
4,五字以上的词按一、二、三及末字各输入一码。如“中华人民共和国23 32 32 21”,其中一、三是笔画码,二、四是笔形码。
鉴别码的使用一,字形鉴别全形输入法中最大的拆分码只有三码长,国标汉字中约有四千二百个只有拆分码的字(包括二拆分码,即二码字)。有二千四百个字需输入全码(即四码长的字),这个第四码不是拆分汉字形成的,而是一个以识别字形为标准的编码,因此,把它称作“鉴别码”。其方法是以该字最后一个笔画的笔形为“高位”该字的字形为“低位”输入一个编码。如“惭”它的拆分码是“忄43车14斤34”三拆分码输入完了的时侯,由于它不是唯一的一个字,因此,需要输入一个鉴别码,“惭”字最后的笔形是“丨竖”是第二笔形,字形是左右形属第二字形,因此,它的鉴别码是“22”高位的“2”代表第二笔形,低位的“2”代表第二字形(左右形字)。字形鉴别法中有三类字元不作字的末笔。它们是“口”字框;“戈”字类(戊弋);“辶”字框,如“进远蓬”等。这三类字要把带“框”的字元去掉后,把另外一个字元的末作为个字的末笔来处理。如“崮”的字形鉴别码是用“古”字元的末笔“横”作字形(13)鉴别码;“栽”字是把“16”码的“戈”类字元去掉后,用“八”字元的末笔“点”(44)作字形鉴别码。
二,笔形鉴别拆分码加字形鉴别码构成全形输入法。它可以满足绝大多数人的需要,对于专业打字员要求尽量作到无重码字,而可适当增加一定的记忆量。为满足这部分人的需要,全形输入法在字形鉴别法的基础上,增加了笔形鉴别法,笔形鉴别法有如下几条规定1,左右型字以第一字元的末笔字形对第二字元末笔字形。如“淞”(氵43木14公34 44)其中“44”就是一个笔形鉴别码,它是以第一字元“氵”的末笔笔形“点”对第二字元“木”的末笔笔形“点”形成的。
2,上下型字以第二字元的末笔笔形对第三字元末笔笔形。如“菖”(艹12日24日24 11),其中“11”就是一个笔形鉴别码,它是以第二字元“日”的末笔笔形“横”对第三字元“日”的末笔笔形“横”形成的。
3,有一些字元不作笔形鉴别码使用。它们是(1)单画码字元;(2)末笔笔形相交叉的字元。如“又车牛”等;(3)笔形码字元;(4)包围型字及内外型的包围码(如辶廴勹凵匚冂囗厂广疒戈戊),或是由两个字元组成的包围码,如“馨”字中的“声17殳34”组成“馨”字的包围码这两个字元都不作“鉴别码”使用。这里要说明一点,象“馨”字类的字,文字学上称作上下型字,在“全形法”中我们把类字称作“包围型”字,因为,这类字上下界限不明显,“香”有部分被包围的特征。属于这类字的还有“人”“八”“夂”“大”字头的字,如“公分合各”等。注意,不要把“瓮”这样字当作“包围型”字处理,它是“上下型”字。
4,一个字中如有一个非鉴别字元,就以另外两个字元的末笔形作鉴别码,如“貘”是左右型字,用笔形鉴别法应“豸”的末笔形“撇”对第二字元的“横”笔形,但“豸”是一个笔形码不能作鉴别码使用,因此就用第二字元的末笔笔形“横”对第三字元的末笔笔形“点”,所以,“貘”字的笔形鉴别码是“14”,它的全码是“33 17 13 14”,第一码是笔形码,二、三码是笔画码,最后是笔形鉴别码。如果一个字中有两个非鉴别码,就用另一字元的首尾笔形作鉴别码,如“轸”字中的“车”与“人”都是非鉴别码,就用“彡”这个字元的首尾笔形“33”作“轸”字的笔形鉴别码。
5,笔形鉴别法一般使用在有三个拆分码的字中,只有6个二拆分码的字使用了笔形鉴别法。这6个字是仉32 3225;圮13 53 15;叱23 32 21;叻23 52 21;俪32 17 24;沩43 44 44。使用笔形鉴别这种方法后,几乎达到无重码。
三,特殊识别除了上面讲到的“字形鉴别法”、“笔形鉴别法”外,专业打字员还要记住17个特殊识别字,这样就可以作到完全无重码。这17个字中,有14个最后一码是“Z”键,它们是“洛泼冉佑趾莸岢岬廨淅潸轱飚綦”。有三个字最后一码是“X”键,它们是“恪澌巳”。
这里需要说明的是,不管你使用哪种鉴别方法,拆分法是完全一致的。
键盘的规定 从键盘图上可以看出“全形法键盘”分布得非常有规律。最下面的MNBVCXZ七个英文键对应着“全形码”一区的11、12、13、14、15、16、17。从一区顺时针往上数是二区的21、22、23、24 25;三区的31、32、33、34、35;四区的41、42 43、44、45;五区的51、52、53、54。每个键位上有一个高频键字,键字的起笔笔形完全与各区相对应。
在笔画码和笔形码的论述中,我们已经了解“全形码”的码值含义。这里我们再作进一步说明。“全形码”的码值由两位阿拉伯数字组成,高位代表笔形,低位代表1,笔画数;2,部件(字元)末笔笔形;3,代表字形。如“部”字的拆分码为“45 23 52”。“45”表示“立”这个部件起笔是“点笔形”,笔画数是五画;“23”表示“口”这个部件起笔是“竖笔形”,笔画数是三画;“52”表示“阝”这个部件起笔是“折笔形”,笔画数是二画。
又如“解”字的拆分码是“32 52 34”。其中“32”中的“2”表示“角”这个部件的末笔笔形是“竖笔形”,“32”这个码就称作“角”字元的笔形码。“52 34”与上述例子相同,它们都是笔画码。
关于码值低位代表字形的问题已在“鉴别法”中讲述。
全形法键盘中有三个键负有一些特殊的使命,它们是16(X)键、17(Z)键、51(H)键。16、17键在拆分法中只有笔画数单义(“横”起笔区的六画键及七画键)16键兼作了如下功能1,在二拆分码的字中,有一部分字需要输入字形鉴别码,而使这部分字成为“三输入码”字,如果这三个输入码的字与三个拆分码的字有重码时,我们就把“Z”当作“空格键”来使用,称作“模拟空格键”。如“仇”字的拆分码是“32 32”,由于这两个码不是唯一编码,因此,需要输入一个字形鉴别码“52”(“仇”是左右型字,属第二字形,末笔是第五笔形,因此字形鉴别码是“52”)后还与“伤”发生重码,这时我们就用“Z”作“模拟空格键”使用在“仇”字的最后一码中。“Z”作“模拟空格键”只限于二拆分码的字中。
2,在专业版的“全形输入法”中,有11个三拆分码的字使用了“Z”键,这种情况下使用的“Z”,把它称作“重码处理键”。这11个字是洛佑趾莸岢岬淅潸轱飚綦。
“17”键的特殊功能1,询问键。(1)询问部首符号字元。如要询问“43”键上有哪些符号字元,先输入一个“43”,接着输入“XX”,提示行有“忄丬氵宀辶”这些都是非拆分字元。(2)询问非拆分字元。如要询问“14”键上有哪些非拆分字元,先输入“XX”,再输入“14”,提示行上“王韦牙瓦戈;屯巨专丐”等字,分号前的字是部首字,分号后的字是非部首字。
2,在专业版的“全形输入法”中,有三个字的第四码使用了“X”键,在这里“X”也称作“重码处理键”。这三个字是“恪澌巳”。
“51”键的特殊功能由于五区只有四个键,它处理部件的笔画数最多只有四画。如果要在五区处理第五笔形和第五字形,也就是说如果要五区输入“55”这个码,我们就使用“51”键来代替“55”,从而使“51”键具有“51”与“55”双重功能。如鼐(乃52目25 51)其中“51”是一个八画的笔形码,本来应该是“55”码,由于没有“55”这个码,因此输入一个“51”双功能键。旎(方44 32尼51),其中“51”码与“鼐”字中的“51”码属于一种情况,都是笔形码。园(口23二12儿32 51)其中“51”是字形鉴别码,“园”字是第五字形,本来应该输入“55”字形鉴别码,由于没有“55”键,因此用“51”键代替。“囤”(口23屯54 51)其中“51”是二拆分字“囤”的字形鉴别码,情况同“园”字中的“51”,都是字形鉴别码。
疑难字一,取中部字元的字1,作字元使用时的拆法束1423 更1324 雨1444 身3413 舟3511 母5411来1542 夹1442 衍3543 垂3315 重3321 乘3525聿5412 禹3423 巫1334 亦4422 吏1323 夷1353肃5434 非2424 兆3244 五1252 曲2422 金3142隶5354 事1751 函5242 发54412,整字的拆法亦423232 惠142444 軎162123 爽133434 盥315425柬112523 妻125353 秉335332 胤325324 渊433244脊443224 曲221311 丧134253 兜343532 赍143424辔511423 噩142121 懋145344 燮444152 蘅123534棘161422 函524452 承521353 丞515411 互125211隶535144 事145351 乎314212 身331331 舟334211二,取最大字元的字1,作字元使用时的拆法甫1324 皮5352 我3314 成1551 戊1431 兼4232州4333 延3452 廷3452 高4523 商4423 鱼3221卑3533 者1335 老1432 考1333 言4423 黑2144衣4234 厥1334 弟4253 鹿4114 敝4434 茶1514余3314 黄1132 善4123 喜1641 兼42322,整字的拆法拾113323 啥233315 搽111514 荼123314 睦251513凌421335 悻431513 俊325433 稿354523 高452223商453223 熵444423 摘114515 洞432323 堰131653镢351334 鲎434231 觉434224 黉434214 窖453423涝431344 善424323 膳344241 兼421632 卸332452豕123332 廷331152 臣1422 瓦115341 牙1153雀233241 长3341 爿5321 弟425322 裁121444截121431 哉121423 栽161232 载161212 戴162516武111324 睫251632 敝422534 心4242 兼421632三,类似字元1,“捋”与“将”(注意右边字头)2,“家”与“啄”(“家”字中的“豕”字元无点,7画)3,“肺”与“柿”(“肺”字右边不是“市”字,拆为“一11巾23”)4,“假”与“锻”(注意右边字元)四,起笔难确定及笔形难确定的字1,起笔难确定的字匕九几兆35;长及34;北25;女毋母51;以54;比14;非21;山22出52;犭豸33;力刀乃53;敝44。
2,笔形难确定的字2.1“冫”;“氵”“关”字头;“学”字头;“雨”字中的四点;“丽”字的两点;“火”字中除“人”字元的两点;“年”字中的一点;“兆”字中的四点都是第四笔形(即“点”笔形)。一般来说短撇(如“关”字中的第二笔)、短提(“氵”中的第三笔)和连续形成的点(如“点”字中的最后的四点)或者在字中间(如“年”第四笔“丽”字中的末笔“鼠”字中的第七、八及第十、十一笔)不太好确定的笔形,都可以认定为“点”笔形。
2.2竖撇(即以竖笔形为主收笔时略带撇的笔形。如“齐”字中的最后两笔)与竖笔形组成的两画字元,(竖撇与两竖笔组成的字元起笔为撇,码值为“33”如由“川”字组成“顺”码值为“331224”。)起笔定为“竖”笔形,码值为“22”。如“齐”的拆分码为“4422”加字鉴码后“齐”字的全码为“442224”。另外,“亦”字中的第三画与第四画不能定为“22”因为,第四画不是“竖”笔,而是带钩的折笔形。所以,它的拆分码是“423232”现代汉字中以“亦”为字元的字只有“迹、弈、奕”。(注意,不要把“恋”字头当成了“亦”字,“恋”字头是简化了的偏傍,它带有符号字元的性质。)2.3“月”字是用得比较多的字元,它一般用在字的左(刖)、右(朝)、下(青、胃、背、骨),在下的“月”起笔为竖可以拆分为“2212”。左右“月”不能拆分码值为“34”。因为,在下的“月”只是“月”意符,不能作字独立使用。左右“月”是部首字元字。全形码规定部首字元字如果拆不出一个相等(或多)笔画数的部首字元字为非拆分字元。(注意一定是在规定的笔画数范围内。)另外,左右“月”在仍何字中起笔都作“撇”。如“输”为“143335”该字中的“月”,既可写成竖笔也可写成撇笔,都不会发生识字上的错误,为记意的原因,所以,左右“月”在仍何字中都作撇笔。
2.4“用”字作字元使用时,在仍何地方起笔都是撇。如“甭143421”“拥113421”。
权利要求
1.汉字全形码输入法,以汉字的笔形特征、笔画特征以及字形特征进行编码输入计算机,其特征在于a)采用由两位阿拉伯数字为单元的拆分码和鉴别码对汉字或字元进行编码输入;b)根据汉字书时的起笔笔形(横、竖、撇、捺(点)、折),将计算机英文字母键盘划分为五个输入区,给出相应的区码。每个输入区中由代表不同笔画数(画码)的编号按键组成;汉字的字元(或称作部件)以其起笔笔形的区码和其笔画数的画码组成的两位阿拉伯数字构成的笔画码为基本输入单元;当汉字或字元的笔画数多于该区的最大画码时,采用所谓笔形码输入,两位阿拉伯数字的高位代表其首笔笔形的区码,低位代表其末笔笔形的区码;笔画码和笔形码构成拆分码;c)鉴别码仅用在三个码长的拆分码仍不能唯一确定被输入汉字时使用,鉴别码分为字形鉴别码和笔形鉴别码两种,字形鉴别码以两位阿拉伯数字代表,其高位为该字末笔笔形的区码,其低位为以五个阿拉伯数字之一代表的字形结构码“1”为独体形字;“2”为左右形字;“3”为上下形字;“4”为包围形字;“5”为内外形字;笔形鉴别码亦由两位阿拉伯数字组成(1)左右形字以第一字元末笔笔形的区码为高位,第二字元末笔笔形的区码为低位鉴别笔形;(2)上下形字以第二字元末笔的区码为高位,第三字元末笔笔形的区码为低位鉴别笔形;(3)包围形内外形字把外字元除开后,以其他两个字元的末笔笔形的区码鉴别笔形。
2.根据权利要求1所述之全形码输入法,其特征在于a)所述五个输入区是这样划定的一区(笔形码为“一”),首笔为“横”的输入区二区(笔形码为“丨”),首笔为“竖”的输入区三区(笔形码为“丿”),首笔为“撇”的输入区四区(笔形码为“丶”),首笔为“点捺”的输入区五区(笔形码为“乙”),首笔为“折”的输入区b)在“横区”中拆分码为11(M);12(N);13(B)14(V);15(C);16(X);17(Z)键表示起笔为横,笔画数分别是1至7画的字元;在“竖区”中拆分码为21(G);22(F);23(D)24(S);25(A)键表示起笔为竖,笔画数分别是1至5画的字元;在“撇区”中拆分码为31(T);32(R);33(E)34(W);35(Q)键表示起笔为撇,笔画数分别是1至5画的字元;在“点区”中拆分码为41(Y);42(U);43(I)44(O);45(P)键表示起笔为点,笔画数分别是1至5画的字元;在“折区“中拆分码为51(H);52(J);53(K)54(L)键表示起笔为折,笔画数分别是1至4画的字元。
全文摘要
本发明公开了一种汉字全形码输入方法,根据汉字自然书写时的笔形特征、笔画特征及字形特征,在计算机键盘上划分出“横”、“竖”、“撇”、“捺(点)”、“折”五个首笔形输入区,在各区中又以笔画数设置了若干键码,使用拆分码和鉴别码进行输入。本方法按照汉字本身的书写习惯,从笔形、笔画及字形入手,自然输入,熟悉后有很高的输入速度,尤其适合于非专业录入人员进行无记忆输入。
文档编号G06F3/023GK1118086SQ94113050
公开日1996年3月6日 申请日期1994年12月28日 优先权日1994年12月28日
发明者吴志全 申请人:吴志全
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1