角音码汉字输入法的制作方法

文档序号:6330410阅读:555来源:国知局
专利名称:角音码汉字输入法的制作方法
技术领域
本发明涉及电脑领域中的汉字输入技术。
目前电脑键盘通常采用101-103个键的PC键盘。它是基于数字和英文输入的键盘。若用这种键盘输入汉字尚需按汉字的发音或将汉字进行一些必要的分解,以求汉字的输入码,即需要对汉字进行编码。编码输入是目前唯一广泛使用的汉字电脑输入方法,它的最大特点是将方块汉字按形或按音编码。经检索按角音取码输入汉字的方案有几个,中国专利CN00100644.4、CN91100006.8、CN97101389等,都是以汉字发音作为音码,然后按汉字四角的字形取码。这些方案虽具有拼音码及四角码易学的优点,但是,它们实际上未柔软对应汉字构型复杂的特点,难免重码出现多,为了减少重码又不得不增加码位或作出更多的规则加以限制。
本发明的目的是提供一种能对应汉字结构简易取码的、易学易记且重码较少的角音码电脑汉字输入方法。
本发明目的是通过按具体汉字本身的字形结构特点,柔软地分解成一些单字、复合字、偏旁和/或笔形的组合,然后相应使用字形码、偏旁码和/或笔形码再加上整个汉字的发音首码构成该汉字输入码的方法来实现的。具体讲,本发明采用通用键盘输入汉字,每个汉字全码为四位码,首位码为整个汉字发音的第一个字母,此即为音码,其余三个码(形码)由汉字的字形结构决定,由字形码、偏旁码和/或笔形码构成,取码方法是<1>在编码位置上有偏旁时一律用偏旁码;<2>在编码位置上可分离出单字时用字形码;<3>在编码位置上,既无偏旁,又不能分离出字,就用笔形码。
在上述取码过程中,如果后两个码位共一个笔形且成字,则先用笔形码后用字形码;对于只有一个笔形的单字一律用笔形码;依照上述规则不能编足三位形码的可用字型代码补足,以进一步减少重码率。
上述字形码是指汉字中可分离出的单字或复字以其发音的第一个字母作为字形码;偏旁码是指汉字中的偏旁以其偏旁原字、变形字或形似字发音第一字母作为偏旁码,或以其偏旁原字一级简码或相应笔形码作为偏旁码;笔形码是指按汉字的笔划形状取码,本发明实例使用0-9数字作笔形码。
本发明的编码位置是由相应汉字的编码顺序确定的,单个汉字编码顺序因字形不同而异,单体字编码顺序为左上角、右上角/左下角、右下角;包围形与内外形汉字编码顺序为外左上角、内左上角、内右下角;二合字编码顺序为首部左上角、尾部左上角、右下角;三合字编码顺序为左上角、次部左上角、右下角;四合字编码顺序为左上角、次部左上角、右下角。
本发明方法构成的角音输入码是汉字拼音与四角字形分层次有机的组合,具有拼音码与四角码易学易用的优点。但它与现有技术不同,本发明柔软对应了汉字本身具有的结构非单一的特点,引进了偏旁及复合字的概念,在取码上以偏旁优先、字形次之、笔形补充,大大减少了重码,而且有很快的汉字输入速度。对于标准一、二级汉字库,本发明的角音码有重码249个,较之于五笔码的220个,重码是很相近的,因此二者的输入速度也很相近。而在易学易用上,本发明则大为领先。
下面结合实例进一步说明本发明。
本发明是在研究汉字字形,并将之分解成单字、复合字、偏旁及笔形的基础之上完成的。因此有必要先对汉字的音与形加以分析。
一、汉字的音与形分析本发明构成的角音码实质是音形结合码,以其汉字发音的第一个字母作为角音码的第一码,即为音码。另三个形码由偏旁码、字形码和/或笔形码构成。
关于对形码的认识,举例如下例一、“暗“由“日、立、日”三个单字组成,其形码由各单字发音的第一个字母构成,即“rlr”例二、“馒”由“食”旁和“日、四、又”三个单字组成,其形码构成为左边的“食”旁码“s”,右上角单字“日”和右下角单字“又”二字发音的第一字母,即“sry”。例三、“泽”由“水”旁和“又”字及“ ”笔形组成,其形码构成为“水”旁码“7”,“又”字的字形码“y”和“ ”笔形码“5”即“7y5”。
从上面三个例子可以看出字形码和偏旁码与人们的日常习惯是很相近的,笔形码则以1978年由四川省人民出版社出版的《四角号码新词典》为基础,本发明在取角方式上作了一些改进。下面是本发明的一些定义。
(一)、字形码汉字中可分离出的单字或复字发音的第一个字母,下面列出了部分常用单字的字型码。例口k、田t、车c、豸z、隹z、合h、髟b、日r、曰r、巛c、舛c、内n、匕b、七q、耒l、厶s、孑j、巳s、刍c、氐d、夕x注因汉字中“日”“曰”不易区分,故全取作r(二)、偏旁码1、偏旁的原字发音第一个字母。详列于下b疒(病) e卩、阝(耳) h灬(火)j钅(金) l刂(立刀) q犭(犬)r亻、彳(人) s饣(食) w攵(文)X (穴) y衤、衣(衣) z (足)2、偏旁的原字一级简码。详列于下i艹(草) o讠(言) u辶、廴(走) v(竹)3、字体变形作为偏旁。详列于下b (匕), (半) e (厄) f (夫) j (己), (几)k (克) l (立) n (牛) q (且), (七)S (手) t (土), (屯) w (亡), (王)y (元), (鱼), (羊) z (止) q (佥)4、偏旁形似字发音第一字母,详列于下c (厂) g (鬼) j (几) m冂、、匚、 (门)w (文) x宀、冖、 (穴)Y礻(衣)5、字头所成偏旁,详列于下a (爱) h(虎) r (刃) x勹(旬)6、仅有一个笔形的偏旁“扌、卜”以及原字发音以s开始且其笔形码之和小于9的偏旁“纟、氵、冫“用其笔形码之和作为偏旁码,详列于下3纟 4冫 5扌 7氵 9卜7、偏旁码注意事项(1)关于笔形码的确定可阅下文而知。
(2)“ ”旁只要在编码位置均可作“r”,例如“方”的编码是“f02r”
(3)“礻”旁本应作“示”旁,因为它与“衤”旁极相似,为了减少辨认时间,故取作“衣”旁。
(4)形似字偏旁“ ”指下列类型风fj4v凤fj14凰fjbw(5)门破或刃破则不能视作偏旁,如“内”n422而不能作nm8v,“力”142v而不作14rv。
(6)“冖”上加任何笔形够成的偏旁均作x(三)、笔形码汉字的笔划形状,归纳起来有十种,用0-9分别代表。对照口诀如下横1垂2 3点捺叉4插5方匡67角8八9是小 点下有横变0头展示上述口诀的说明见下表
1、笔形是从角的方位来看待。例如端左上角“亠”为0,右上角“ ”取2,左下角“ ”取1,右下角“”取2颜左上角“亠”为0,右上角“一”取1,左下角“丿”取2,右下角“八”取8烙左上角“ ”为9,右上角“ ”取7,左下角“ ”取8,右下角“口”取6截左上角“ ”为4,右上角“ ”取3,左下角“ ”取2,右下角 ”取52、取角方法2.1一笔可以分角取码。例27以826乱2147七117乙7172几712.2一笔的上下两段和别笔构成两种笔形的,分两角取码。例19水248大49木98火99米2.3下角笔形偏在一角的,按实际位置取码。缺角则缺码。例02产32户1亏21飞211弓722.4一个笔形,前角已用过,后角则视作缺。例11王23冬733之41直5中2卜33、笔形码注意事项3.1笔形应尽量取复笔。例正确43寸5扎2172厂198兴82介28气192少错误13寸212扎2112厂138兴222介322气1132少33.2点下带横折的如“户、永“等字的上角取作3。
3.3单笔取左右!即角形有两单笔或一单笔一复笔的。不论高低,一律取最左(左角)或最右(右角)的笔形。例11非111飞213州225物723.3复笔取高低!即有两复笔可取时,在上角取较高的笔形,在下角取较低的笔形。例42巾211功4247也4152成342皮4二、汉字的三种字型及其取码方法(一).汉字的字型研究汉字的字型,即研究偏旁、单字或复字及笔形在汉字中的位置关系。角音码把汉字分成三种字型左右型、上下型、杂合型,分别赋以字型代码o、u、v,见下表 表中杂合型又称独体字,左右型和上下型又称合体字。两部分合在一起称二合字,三部分合在一起称三合字,四部分或多于四部分合在一起称四合字。在角音码中字型是编码的重要依据,不同的字型具有不同的编码规则。下面分别说明。
1.杂合型(v型)有两种情况(1)单体字由笔画构成,如乘、卜、又、等。也可能由单字加笔形构成,如白、自、革、甚等。
(2)内外型与包围型字的外围由“口、门、戊、几、冂、凵、匚”构成的汉字为内外型,外围形如“ ”的汉字为包围型。如困、间、威、风、凶、同、匡、这、司、病、寿等。
2.左右型(o型)有三种情况(1)二合字两个部分左右排列,汉字左右间有明显的界线和距离,如相、汗、明、扬、体、郇、编等。其中明、郇、编等字的一边是杂合型,但整个汉字是左右型。
(2)三合字整个汉字从左到右排列,或者单独占据一边的部分与另外两部分呈左右排列,如湘、部、到、结等。
(3)四合字四部分或多于四部分从左到右排列,或分别组合后整体呈左右排列,如雠、能、候、鼢等。
3.上下型(u型)也有三种情况
(1)二合字两个部分上下排列,汉字上下间有明显的界线和距离,如节、字、青、忽、愚等。
(2)三合字三个部分上下排列,或者占一层的部分与另外两个部分上下排列,如意、想、忿、型等。
(3)四合字四部分或多于四部分上下排列或分别组合后整体呈上下排列,如豆、鬣、翟、瞿、翡、鬃、盒、煎、箭等。
4、合体字注意事项首部、次部和尾部的区分顺序与通常书写习惯相同。
(二)、取码方法对于一个结构复杂的汉字,在取码位置上可能是一个单字、或一个复合字,也可能是一个偏旁,或者只是一个笔形。其取码方法如下1、在编码位置上有偏旁时一律用偏旁码。例如扁bhm42、在编码位置上可分离出单字时(以不涉及另一取码位置为限)用字形码。例如“没”字的编码是“m7jy”,“馨”字的编码是“xssx”。“殳”在“没”字中“占右上角和右下角”,故编码为“jy”,而在“馨”字中仅占右上角,故取复合字码“s”3、在编码位置上,既无偏旁,又不能分离出字,就用笔形码。例如本b523为了进一步减少重码率,补充下列取码方法1、依照上述规则不能编足四位码可用字型代码补足;也可以实码输入,无需补足四位码。因o、u、v作音码和字形码很少,故本发明实例采用o、u、v作字形代码,以离散重码。
2、如果后两个码位共一个笔形且成字,则先用笔形码后用字形码。例如启qh6k等(也可先用字形码后用笔形码)。
3、对于只有一个笔形的单字一律用笔形码(口例外)。如一1十4中5曳5聿5吏5八8小9。
下面就各种字型的取码方法分别说明。
1.单体字由笔划构成的单体字形码用笔形码,形码顺序为左上角、右上角/左下角(右上角若与左上角或右下角同一笔形则取左下角,下同)、右下角。例如乘c29v、卜b23v、由y56v、上s211、白b261。而对于上部可分解出单体字的汉字,形码顺序为上、左下角、右下角。例如革gn5v、甚sq71。
2.内外型与包围型形码顺序为外左上角、内左上角、内右下角。例如困k649、间jm61、威wwln、凤fj14、周zmsk、凶xm4v、匡km11、这zu04、起qz11、处cw23、司srlk、刃rr32、氨aqxn、裁c403、虱s12c、病bb12、寿s54c、布b442、扁bhm4、差cy113.二合字形码顺序依下述状况而定(1)第一部分是偏旁或是字、或仅有一个笔形,形码顺序为首部左上角、尾部左上角、右下角。例如字zx14、笔bv21、全q811、奉f55u、吝1w6k、汉h714、形xk22、性x921、吗mk12、伸sr5s、的dbx3注首部是字而尾部是偏旁,则首部取两码,(即取左上角、右上角或左上角、左下角),尾部取偏旁码。例如利1291、郇xxre(2)首部既非偏旁或字,又有两个笔形,形码顺序为左上角、右上角(上下型)/左下角(左右型)、右下角。例如寻x17c、状z31q注若取二码部分是包围型或内外型,两码可用外左上角、内右下角。
4.三合字形码顺序为左上角、次部左上角、右下角。例如斑bwww、到dltl、段d7jy、将j3xc、室sxlt、花hirq、型xklt5.四合字形码顺序为左上角、次部左上角、右下角。例如能nsyb、瞿qmmz、豆dlkl。但如果前几部分可合成一字,则先将这一个字视作一部分而取其字形码,这样组合后的四合字就可被视作三合字或二合字而照3、4规则取码。例如翟dyrl、羹gg88。
三、简码输入的方法为了提高输入速度,对于一些经常使用的汉字,角音码方案设计了简码。角音码取其前一码,前两码或前三码构成一二三级简码。由于以Iuvo作第一发音的汉字很少,考虑到偏旁重码的离散问题,我们将Iouv作为草言走竹的一级简码。
1、一级简码a b c d e f g h i j k l m安不产的而发工和草及可了民n o p q r s t u v w你言批起人是同走竹我x y z写以在2、数字简码
1 2 3 4 5 6 7 8 9 0一 二 三 四 五 六 七 八 九 零1s 1b 1q 1w 1z 1y 11s 11b 11q 11w十 百 千 万 兆 亿 拾 佰 仟 萬其它二级、三级简码可在使用中逐步掌握。
四、词汇输入的方法本发明构成的角音码对词汇输入很方便,不管多长的词汇,都只需击四键,而且词汇输入和字的输入统一,不加字或词的输入标记,也无需换档。
词汇的取码方法如下1、双字词分别取每个字的前两码作为输入码。例如输入scr8词汇coh7计算josv机器jmqk汉字h7zx分别f8bk2、三字词前两个汉字各取头一码,第三个汉字取前两码。例如角音码jyms计算机jsjm操作员czyk电影院dyye国务院gwye3、四字词取每个汉字的头一码。例如知识分子zsfz程序设计cxsj千篇一律qpyl说一不二sybe4、多字词超过四个字的词,分别取一、二、三、末字的第一码。例如中华人民共和国zhrg此外,本发明设计有容错码。容错码是指容易搞错的码和允许搞错的码。在实际编码中常会出现种种差错,这些差错的产生有各种原因,且带有一定的普遍性。为了输入能顺利进行,本发明特设计容错码,即承认那些容易写错的码存在的合理性,把它们作为一类正常的可用码保留,使那些和规则不相符的(有错误的)码也可以正常使用。
容错有以下几种类型1、字形码、偏旁码和笔形码容错。例如正确码些xzbe多dx22容错码些xzbl多dx272、字型容错。例如正确码出cs77(看作杂合型)容错码出cs27(看作上下型)3、对于只有一个笔形的汉字,尾码用其韵母的第一字母作为容错码。例如
正确码中z5vv申s5vv事s5vv小x9vv容错码中z5vo申s5ve事s5vi小x9va本发明用“?”键作为学习键,以替代任一码元,通过重码选择来输入汉字。
权利要求
1.一种电脑汉字角音码输入方法,用通用键盘输入,每个汉字全码为四位码,以其整个汉字发音的第一个字母为第一码,即为音码,另三个码由形码组成,其特征在于形码由字形码、偏旁码和/或笔形码构成,其取码由编码位置上的字形决定,具体取码方法是(1)在编码位置上有偏旁时一律用偏旁码(2)在编码位置上可分离出单字时用字形码(3)在编码位置上,既无偏旁,又不能分离出字,就用笔形码。
2.如权利要求1所述的角音码输入方法,其特征在于在取码过程中,如果后两个码位共一个笔形且成字,则先用笔形码后用字形码;对于只有一个笔形的单字一律用笔形码依照上述规则不能编足三位形码的可用字型代码补足。
3.如权利要求1所述的角音码输入方法,其特征在于字形码是指汉字中编码位置可分离出的单字或复字以其发音的第一个字母作为字形码偏旁码是指汉字中的偏旁以其偏旁原字、变形字或形似字发音第一字母作为偏旁码,或以其偏旁原字一级简码或相应笔形码作为偏旁码;笔形码是指按汉字的笔划形状取码。
4.如权利要求1、2或3所述的角音码输入方法,其特征在于编码位置是由相应汉字的编码顺序确定的,单个汉字编码顺序因字形不同而异,单体字取笔形码,编码顺序为左上角、右上角/左下角、右下角;包围形与内外形汉字编码顺序为外左上角、内左上角、内右下角;二合字编码顺序为首部左上角、尾部左上角、右下角;三合字编码顺序为左上角、次部左上角、右下角;四合字编码顺序为左上角、次部左上角、右下角。
5.如权利要求4所述的角音码输入方法,其特征在于双字词的编码是分别取每个字的前两码作为输入码;三字词的编码是前两个汉字各取前一码,第三个汉字取前两码组成,四字词取每个汉字的头一码组成;超过四个字的多字词由分别取1、2、3、末字的第一码组成。
全文摘要
本发明公开了一种电脑汉字角音码输入方法。它通过按具体汉字本身的字形结构特点,柔软地分解成一些单字、复合字、偏旁和/或笔形的组合,然后相应使用字形码、偏旁码和/或笔形码再加上整个汉字的发音首码构成该汉字输入码。本发明能对应汉字结构简易取码、易学易记且重码少,输入速度快。
文档编号G06F3/023GK1310376SQ01107338
公开日2001年8月29日 申请日期2001年4月10日 优先权日2001年4月10日
发明者吴荣常, 黄开蓉 申请人:吴荣常
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1