五三音码及其键盘的制作方法

文档序号:6656979阅读:351来源:国知局
专利名称:五三音码及其键盘的制作方法
技术领域
本发明属于电脑汉字编码输入方法,是本发明人前一项发明五三笔码的延伸和重大改进,它是一种组合五三笔码与音码的发明,所以称之为五三音码,顺便指出,称“五三”而不称“三五”是为了避商业性宣传之嫌。
在键盘上用音码输入汉字时只要掌握汉字拼音便可输入,人们大都能使用,但由于汉字同音字众多,造成重码多,有时甚至不得不从数十个甚至上百个同音字中挑选一个,故输速较低。
为免去同音字选择烦恼,目前所有问世的优秀汉字输入法都主要向三个方向发展。一是智能语句语音输入法,可仍然免不了同音字选择;二是各种组字单元码,特点是将众多的组字单元按笔画或拼音或象形等方式归类,重码低、输速高。由于笔画是一项足以与字母相提并论的有史以来最伟大发明之一,笔画的发明使汉字由象形文字飞跃成为符号文字,所以按笔画归类的组字单元码相对略胜一筹,较为流行,可各种组字单元码有个通病,那就是组字单元数大大多于西文字母数,记不胜记,让一般人望而生畏,无法全民普及;三是各种组字单元与拼音结合的编码,特点是要记忆的组字单元较少,有一定的区分同音字能力,输速较快,但因为组字单元数较少,丢失的信息过多,重码率相对较高,并不能真正有效地免去同音字选择。
这样,目前所有问世的编码都未能同时克服两种主要缺陷或重码率过高,人工干预过多,无法提高输速;或规则繁杂,难学难记,不宜推广。仅仅依据汉字的音、形特征编码似乎已山穷水尽,不可能发明出能同时克服两种主要缺陷的理想的完善的编码了,事实并不如此,五三笔码的问世为汉字输入法最终解决打下了基础。
本发明的目的是提供一种组合五三笔码和音码的电脑汉字编码输入方法,它具有几分钟学会、大部分汉字不必选择同音字、输速快的优点。采用调整方案的,也就是采用以码长最多为2码的五三笔码为基础,组字单元为配合,汉字结构为补充并结合拼音的,甚至可以几乎不选同音字,从而实现高速脱稿输入,而学成时间仅需10分钟。同时克服了上述两种主要缺陷。
由于本发明为五三笔码和音码的组合发明,所以最好先掌握五三笔码的核心部分将汉字的各种笔画归类为横、竖、撇、捺、折五种基本笔画,其中点作捺,提作横,但点提相连时,提作点,因撇捺由上向下倾斜,故归类为斜笔画,而折根据其没折、弯、钩前的运笔方向可分别并入上述三类笔画中,这三类笔画,本发明人称之为根本笔画,它与汉字各种笔画的对应关系见图1所示,顺便指出,所有图中的1、2、3都为横、竖、斜的代号,接着编码,规则是一、对1至4笔的汉字将笔画归类,按书写顺序根据笔画的相交情况编码;二、对5笔及以上汉字按书写顺序根据根本笔画横竖斜的排列组合次序对每三笔进行编码,在依次出现的三个笔画中,横竖斜的排列组合不外乎27种,可一一对应地排列在26个英文字母及某个特定符号键上,一般为标点符号键,如果系统允许的话也可以排列在空格键、回车键上,甚至可以在标准键盘上新增一个键,但这会增加系统成本,为便于输入汉字,本发明人利用26个字母的键位及“;”编码,见图2。
应当指出某几种横竖斜排列组合方式组字频率很低,可将之合并排列在同一键上,这样27种横竖斜排列组合可排列在不足27个字母或符号键上,但这记忆不甚方便,所以一般还是以一一对应地排列好。上述规则是以4笔为界编码的,其实也可以以N笔为界,还可以规定码长最多为L,超过规定时改取最后一码,N、L均为自然数,当码长较短时,补上该汉字的拼音,构成五三音码,音码可前可后,一经选定不得改变,下面是规定码长最多为2码或3码时的五三音码的形部编码具体规则(1)对只有1笔的汉字,横、竖、撇、捺、折的编码分别为1、2、3、4、5;(2)对2至5笔的汉字取其首一笔和末一笔,横、竖、撇、捺、折当没与上一笔相交时,其编码分别为1、2、3、4、5;当只与上一笔相交时其编码分别为6、7、8、9、0;当不止与上一笔相交时,其编码分别为位于键盘左上角的5个字母Q、W、E、R、T;(3)对6笔及以上的汉字取其首三笔和末三笔,对首三笔和末三笔只须根据其横、竖、斜的排列组合情况输入对应的字母或符号键即可;
(4)对1至5笔的汉字或者按书写顺序对每三笔进行编码,对每三笔只需根据其横竖斜的排列组合情况输入对应的字母或符号键即可。若还剩一笔,最末笔为横或竖或撇或捺或折,其编码分别为1或2或3或4或5;若还剩二笔,最末笔为横或竖或撇或捺或折,其编码分别为6或7或8或9或0;当然也可将最末笔改为剩下的第一笔,也可不考虑剩下的笔画数。
(5)对6笔及以上的汉字或者按书写顺序先对头三笔和次三笔编码,若还剩一笔,最末笔为横或竖或撇或捺或折,编码分别为1或2或3或4或5;若还剩二笔,最末笔为横或竖或撇或捺或折,编码分别为6或7或8或9或0;若还剩三笔及以上,改取末三笔。对头三笔、次三笔、末三笔只需根据其横竖斜的排列组合情况输入一一对应的字母或符号即可。
规则(1)~(4)都以6笔为界,其实也可以以3笔及以上的任意笔画数为界。比如规定对4笔及以上的汉字取其首三笔和末三笔,对1至2笔的汉字可直接输入其双拼码,这样完全舍弃了数字键,但会增加点重码。
音码可以为全拼或简拼或混拼或双拼或不完整拼音。采用不完整拼音,因与全拼不一致,会增加重码,一般不采用。为缩短码长提高输速,一般用双拼法,在实施例中选用微软双拼,还约定音码在后,因规则(4)包含规则(1),规则(2)要区分笔画数,规则(5)码长稍长,所以在实施例中按规则(3)、(4)编码。
为提高汉字输入速度还设置了简码、词组、语句输入法。
一、简码数字一至九只需击一次相应的数字健,字母简码见图3,该图的特点是除A、O、E、I、U按拼音末字母,V按象形,“;”按笔画定位外,其余都按拼音首字母定位。冒号前为一级简码,冒号后为与它在句子中用法类似的同类高频字。对同类高频字只需按该图的左右顺序在一级简码后击相应的数字键1、2、3、4、5即可。
按规则(4)编码时,由于全码输入时击数字键不甚方便,一般大部分1至5笔的汉字都可舍去数字键,击其简码。具体讲对1至2笔的汉字可直接输入其双拼码,对4至5笔的汉字可在输入首三笔所对应的字母或符号后再接着输入其双拼音码。用简码输入时利用数字键会大大增加简码数量,二级简码按五三音码形部编码从理论上讲有700多个,若利用数字键可扩充至1000个左右,这会明显提高输速。三级简码从理论上讲可舍弃五三音码4位编码中的任意1位,考虑思维习惯一般舍弃形部编码第二位码或韵母。
二、词组词组输入法有两种一是声韵双拼法;二是按五三音码形部编码,双字词只需直接输入每个汉字的形部编码;三字词输入第一第二个汉字的形部第一位码,再输入第三个汉字的形部编码;四字及以上的多字词只需输入第一、二、三和最后一个汉字形部第一位码。形部编码不足二码,补上“,”键。
三、语句语句输入时只需接连输入句子中每个汉字的声、韵母即可。
实施例一种电脑汉字编码方法五三音码1 JAVS DMNK HJZI BMMA FHFA WSYM若按规则(2)编码,五的编码为11WU,三的编码为11SJ,若按规则(5)编码,种的编码为JLAVS,该实施例在词组输入时采用微软双拼输入法。为尽可能消除重码和避免编码的二义性,单字输入时不支持多音字输入,词组输入时仍支持多音字输入。
有些经常出现在字首或字尾的汉字组字单元组字频率高,若完全按规则(3)、(4)编码,容易集中排列在某一字母或符号键上,这会造成一定数量的重码,因此有必要作适当调整。调整的方法是将这些组字单元从组字频率高的某几种横竖斜排列组合键上抽出,排列到组字频率低的横竖斜排列组合键上,避免容易出现在编码同一位置的组字频率高的组字单元及横竖斜某种排列组合排在同一键上,排列时还考虑了同音字因素,还可酌情参考组字单元和横竖斜27种排列组合的实用频率、键位压缩、指法规则。本发明人综合比较,反复优选后调整方案见图4,图4还调整了横、竖、斜三类笔画的排列次序,该图也即优化五三音码形部编码键盘排列图。下面作具体解说(1)目含且、罒、皿、臼,钅含金,日含 ,足含走,贝含见,扌含キ,讠含言, 含 、已、巳、己、巴、尸、 ,土含士、 、牛,氵含水, 含 ,含心,阝含耳,饣含食字头 ,亻含 ,ㄨ含 ,特别指出广不含疒,麻部,木不含未、口不得与其它笔画相交,贝在字首时,按其末三笔编码,也就是为C,这些被含的组字单元与基本组字单元或互为繁简,或互相同源,或音、形、义基本相同,可视为同种组字单元,就象字母有大小手写体一样。
(2)以上组字单元严格按书写顺序出现在字首或字尾,才排列在相应的字母上,心的前三笔为竖斜斜时,编码为声母X。艹下面为氵时惯常与去氵后的字发生重码,编码非改不可,编码为改的声母G,艹下面为扌,犭前为氵、讠,日、口上面与十相连时编码改为G,口上面为八、冂,编码也为G,一横与二竖相交或相连,一般为H,但艹下面连一到二横时以廿代表,编码为声母N。连三横时编码作为组合组字单元,编码也为G,例如萍的编码为“GJP;”,“故”的编码为GKGU,车、禾应位于字首,亻应在字的左部,ㄨ应该在字尾。不在规定位置时,编码不作调整。女的书写顺序为横折撇,忄的书写顺序点竖点,力刀的书写顺序因人而异,约定在下部时为撇折,其余都为折撇。离散的笔画“乙”形似竖的代号2,约定作竖,己上面为山时不作调整。
(3)木根据其首三笔编码;目、禾分别根据末三笔编码;饣为食的简体,其末三笔为N,日的左部,足的中部象E,亻变形后似W,贝象R,ㄨ形似X,讠象I、口象O, 象P,扌形似F,艹象H,犭的形似反K,反文低象K, 象2个L连成;王形似手写体Z,大有撇有捺象倒立V,钅字头形似V,所以将它们排列在相应的字母键上; 的前三笔出现在字首时,形如U, 出现在字尾时,为倒立的 ,编码为U,土、月、氵、广按声母编码,竹按韵母编码。车的第二笔视为撇折的话,将它横倒看,其首三笔就为竖斜竖,所以编码为B,巾将其横倒看,其笔画为横竖横,所以排列在A上, 起笔形似L,且其三笔从右向左看为斜斜竖,所以将其排列在L上,小的第一三笔为竖斜,兼容在Y键上,小的第一三笔为竖斜,兼容在H键上, 的第一二笔为斜横,下面又有二点,所以排列在J上,米的上半部从左至右点竖点、所以排列在P键上,是一线连三横,所以排在Q上,特别规定马、彳、忄、田、耳、鱼、雨出现在字首时,第二码取依书写顺序出现在其后的次三笔。门、口部取其内次三笔。如其后不足三笔时,仍按原来规则编码。在对首三笔、其后次三笔、末三笔编码时,遇到调整后的组字单元,则要优先按最大的组字单元编码,木、马、虫在字下部时移至字首后编码。另外,阝象B。例如骥的编码为ARJI,固的编码为RGGU,日的编码为E1RI。
(4)由于每个键上最多只有2个基本组字单元,总共才30余个基本组字单元,与俄文字母相当,且主要按笔画或拼音或象形(与西文字母或号相似)等方式排列在键上,极便于记忆,当然个别似乎有点联想、无理。
(5)有的组字单元组字频率高,但因不足3笔,信息含量低,被舍弃,有的组字单元在6笔以上,但组字频率低,实际信息含量不足,也被舍弃。
(6)可以将某几种横竖斜排列组合方式排在同一键上,按规则(4)编码时也可将剩下的笔画归类为另外几种笔画,比如将折分为顺折、逆折等等,这些都属于该领域普通专业技术人员的变形,不影响本发明实质。
有的汉字为左中右结构或上中下结构,两头组字单元又完全相同,形似夹着一个组字单元,本发明人称之为夹字架。对夹字架可去掉其字首或字尾的组字单元,然后编码,在实施例中去掉字尾的组字单元后编码。
左中右结构,中间在三笔及以上,右边为刂,上中下结构,上面为立,下面为儿也属于广义上的夹字架,对这些夹字架可同样去掉字尾的组字单元后编码。
赤部不属于土部,齿、步部不属于止部,所以应按下半部的首三笔编码。与载类似结构重心在车处,与赢类似结构重心在贝处,所以应按重心所在编码。另外约定组字单元玉、甫、戋右角的点忽略不计。
有的汉字为上下结构,并且至少有2个相同的组字单元依次出现在字尾,本发明人称之为叠字架,对叠字架若有2个相同的组字单元,则形部第2码取英文第一个字母A,若有3相同的组字单元,则取英文第二个字母B。左右结构,右面又为上下结构,并且至少有2个相同的组字单元依次出现在字尾,也属于广义上的叠字架,编码为B。
实施例弼WEBI 赢JRY;辅BFFU 荔HBLI一种电脑汉字编码方法五三音码1 NWVS E0DM YONK S9HJ KZZI LHBMXAMA M5FH SCFA 5 3 JEYN XAMA其中电的简码EDM 汉的简码SHJ 方的简码MFH
作为五三音码的一种变形,对6笔及以上的汉字形部编码或者按笔画或拼音或象形等方式先对义部编码,一般当义部在字首时,第二码取字尾三笔,在字尾时取字首三笔,在字中时约定取字首或字尾三笔。由于部首数量划分不一,位置不易确定,相比之下以前一个方案为优选。
本编码字词兼容,不必进行换档等附相操作,重码字极少,重码选择方法和其它输入法相同,另外还设置了去重键“。”也就是将形部编码第二位码改为“。”,这样不影响指法,又可消除重码,利于专职追求高速,“?”键为万能查询键,当某一位码难以确定时,可用“?”代替,再利用提示行选择,不足规定码长的均以空格键结尾。
本编码还提供了一种新的汉字修改方法,它使得汉字修改与西文差不多容易,方法是将光标移至所需要修改的字下,若该字与改后的字同音,双击改后的字的五三音码形部编码,改后的字即上屏,当然这需要强大的软件支持。本方法显然适用于语音语句输入后的修改,软件允许的话,只需念形部编码的读音。
本发明适用于一切大、中、小、微型计算机中文信息处理系统和通讯系统,可广泛应用于中文终端、中文电传、电脑打字和计算机排版印刷等各个方面,可在互联网环境下运行。
本发明可以适用于繁体字的港、澳、台地区,也可以用于日文、韩文,只是日文、韩文汉字与普通话读音不同,组字单元的排列不完全相同,排列方法仍然相同。
五三音码编码规则极为简单、客观,音码部份以双拼法为最快,对于已经掌握双拼法的人来说,不出短短十分钟就能学会,而且学会后就能牢记不忘,没掌握双拼法的人可在练习双拼法时同步学会。单字码长最长不过四码,重码率几乎为0,免去了同音字选择烦恼,音码部分选用南方模糊音几乎不会增加重码,南方模糊音的特点是c、s、z与ch、sh、zh,及in与ing不分,en、eng与清辅音b、p、m、f相拼时区分。支持语句输入,不易疲劳。容量大,从理论上讲可以容纳全部6万多个汉字,做到高速脱稿输入,也就是说不仅适合于盲打,还适合于听打、想打,使得汉字无论是输入速度还是调出速度都要快于西文。


图1、横竖斜三类根本笔画与汉字各种笔画对应关系表。图2、三个笔画中横竖斜的27种排列组合形式在键盘上的一种优选排列图。图3、一级简码和同类高频字。图4、优化五三音码形部编码键盘排列图。图2、图4中1、2、3分别为横、竖、斜的代号。
权利要求
1.一种五三音码,其特征是组合五三笔码和音码,并允许以横竖斜的排列组合不外乎27种,一一对应或大致一一对应地排列在27个或不足27个互不相同的键上为基础,调整某些组字单元包括笔画、若干特定结构汉字的归类编排取码方法的编码。
2.一种五三音码形部编码键盘排列图,其特征是横竖斜的排列组合不外乎27种,一对应或大致一一对应地排列在27个或不足27个互不相同的键上,并允许把某些组字单元排列在键上。
3.根据权利要求1所述的五三音码,其特征是当超过五三笔码规定的最多码长时,改取最后一码,当规定码长较短时,补上该汉字音码,音码可以为全拼或简拼或混拼或双拼或该汉字拼音前2个字母。
4.根据权利要求2所述的优化五三音码形部编码键盘排列图,其特征是横竖斜的排列组合不外乎27种,一一对应地排列在标准键盘的键上,排列组字单元时,一般要考虑两点(1)避免容易出现在编码同一位置的组字频率高的组字单元及横竖斜某种排列组合排列在同一键上,(2)汉字同音字因素,另外还可以参考键位压缩或组字单元及横竖斜排列组合的实用频率或指法规则。
5.根据权利要求4所述的优化五三音码形部编码键盘排列图,其特征是将基本组字单元主要按笔画或拼音或象形方式排在键上,基本组字单元数与西文字母数大体接近,基本组字单元数还可以包含要么互为繁简,要么互相同源,要么音或形或义基本相近的组字单元,有的组字单元甚至还可以规定必须位于汉字的特定位置,或者规定与某些近似的组字单元相区别。
6.根据权利要求3或5所述的优化五三音码,其特征是形部编码为(1)、对1至5笔的汉字按书写顺序根据每三笔的横竖斜排列组合情况编码,当剩下的笔画不足三笔时归类为几种笔画,用数字键编码,一般归类为横竖撇捺折五类笔画,当剩下一笔时,若为横或竖或撇或捺或折,编码分别为五个互不相同的数字,当剩下二笔时,可约定按剩下第一笔或第二笔编码,第一笔或第二笔为横或竖或撇或捺或折,编码分别为另外5个互不相同的数字;(2)、对六笔及以上的汉字根据首三笔和末三笔的横竖斜排列组合情况编码;(3)、遇到排列在键上的组字单元可以规定优先按该组字单元编码,有的组字单元还可以规定移动其在汉字中的位置后编码或取其次三笔;(4)、遇到特定结构的汉字可以规定另行处理。
7.根据权利要求6所述的五三音码,其特征是特定结构的汉字的形部编码规则主要为(1)、对重心在汉字中某一位置的汉字要优先按重心所在编码;(2)、对左中右结构或上中下结构,两头组字单元又完全相同的汉字可约定去掉某一头后编码;(3)、对上下结构并且至少有2个相同的组字单元依次出现在字尾的汉字可用一个或几个优选的字母代替。
8.根据权利要求6所述的五三音码,其特征是对6笔以上的汉字或者先对义部主要按笔画或拼音或象形方式编码,形部编码第二码一般当义部在字首时取其字尾的三笔,义部在字尾时取其字首的三笔,义部在字中时可约定取字首或字尾的三笔,对字首或字尾的三笔根据其横竖斜的排列组合情况编码。
全文摘要
本发明五三音码提供一种组合五三笔码和音码的电脑汉字编码输入方法,它具有几分钟学会、大部分汉字不必选择同音字、输速快的优点。采用调整方案的,也就是采用以码长最多为2码的五三笔码为基础,组字单元为配合,汉字结构为补充并结合拼音的,甚至可以几乎不选同音字,从而实现高速脱稿输入,而学成时间仅需10多分钟。
文档编号G06F3/023GK1325052SQ0111140
公开日2001年12月5日 申请日期2001年3月5日 优先权日2000年3月8日
发明者王治阳 申请人:王治阳
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1