组合编码的计算机汉字输入方法

文档序号:6573111阅读:782来源:国知局
专利名称:组合编码的计算机汉字输入方法
技术领域
本发明属于汉字输入计算机的一种方法。
随着计算机技术的飞速发展、计算机价格的下降以及网络时代和信息社会的迅速到来,计算机已成为人们工作、学习、生活中不可缺少的一部份,我国学习和使用计算机的人也越来越多,但汉字输入计算机所存在的“易学的打不快,快速的不易学”的难题长久未能解决。
计算机从286、386型机,在短短的几年时间里,就迅速发展到了如今的奔腾II、奔腾III,而汉字输入技术仍然多数使用拼音或五笔字型,虽然有千军万“码”不断在攻克电脑打字的难关,每年也有不少新的汉字编码方案产生,不少人宣称已彻底解决电脑汉字输入中“易学的太慢,快速的太难”的问题,如近年出现的“王林快码”、“三维天然码”等。但实际上,许多方案往往偏重于易学性而忽略了快速性,重码率一般在5%以上,重码率较高,影响了输入速度的提高。多年来,很少有编码的重码率能低于五笔字型(五笔字型的重码有215组,共262个重码汉字,重码率为3.8%)。偶尔有一个编码的重码率低于五笔字型,但字根的记忆量也会随之增加,所以至今还没有一个好的编码方案得到人们的公认。
计算机内装的汉字数量已由GB2312的6763个增加到GB13000的20000余,后又增加为GB18030的27000多个,其中有大量的繁体字和生、偏汉字。汉字编码方案不仅要解决简体字的快速录入问题,还应较好地解决繁体字和生、偏汉字的录入问题。
我于1985年开始汉字编码方案的探索与研究,先后搞出了十多个编码方案,其中有音码、形码、音形码,申请中国专利的有87107917、88105844、88107339、90109791、91104401、92105414、92105952。在92105952的专利文献中,我提出了选用26个汉字作为助记汉字,它们包含了130多个字根,把它们安排在26个字母键上,只需记住这26个汉字,就可记住130多个字根。后发现该编码存在如下几个方面的问题1.所选用的26个汉字相互之间无内在联系,不便于记忆;2.所选用的26个汉字不太合理,较容易产生重码,如选用的“好”字,将“女”和“子”安排在一个键上,会造成“委”与“季”、“囝”与“囡”等较多重码;3.所选用的26个汉字中所包含的汉字字根数量较少,一个字根所包含的笔画数量也较少,也容易产生重码,且不便于繁体字的输入;4.所选择的26个汉字与字根中无繁体字,也不便于繁体字的输入;5.用首笔笔画和笔画数确定的代码只采用了15个键,还有11个键未用,也容易产生过多的重码;6.字形码采用声母作为补码来区分重码,不懂得拼音的人或遇上不认识的字不便于使用;7.整个编码系统没能提供一套简易的编码方案供不懂拼音的非专业打字人员快速入门,无法真正实现人人通用。发现上述问题后,需要重新对编码进行调整和优化处理,但花了许多时间和精力,搞了几个方案,效果仍不理想,要在成千上万的汉字中重新找出26个汉字,并保证其有较低的重码率,用一般的方法是不可行的。后来采用了先进的计算机自动处理技术,用计算机将预先选出的汉字进行逐字检测,找出这些汉字所包含字根可能出现的重码率是多少,最后选定26个所含字根重码率低的汉字,这些汉字所安排的键位,也全部利用计算机进行了重码率的测试,从而保证了整个编码方案有较低的重码率。
本发明的目的,在于提供一种通用、易学、快速的汉字输入技术,使专业打字人员和非专业打字人员均能快速掌握的、可轻松、快速输入简、繁汉字的汉字编码系统。
我国使用计算机的人员众多,如采用一种方案就满足所有计算机使用人员输入汉字的需要,这显然是不现实的。对于不同的使用人员,可采用不同的方案,专业打字人员要求打字速度快,可使用重码少的方案,非专业打字人员对打字速度要求不高,可使用不需记忆字根的、可快速入门的方法。
针对上述情况,相应的解决方案是将快速码、拼音码与简易码合并成为组合编码系统(以下简称组合码,见

图1),其中快速码的记忆量很小,只需记住26个汉字即可记住160多个汉字字根,且重码率很低,GB2312中6763个汉字的重码率仅为3.1%,拼音码和简易码不用记忆字根,熟悉了键盘就可输入汉字。并且,经常使用拼音码或简易码,也可逐步掌握快速码的字根和输入方法,从而使用快速码输入汉字,大大提高汉字输入速度。
将快速码、拼音码与简易码分述于下一、快速码快速码为纯字形编码,选用26个汉字作为助记汉字,这26个汉字包含了160多个常用字根(见图2),为帮助记忆,将26个汉字分为如下五组qie kuang lei cha jian yong xu sui lin pan1.Q锲 W筐 E雷 R插 T践2.Y湧 U驉 I髓 O麟 P磐ao shu fu fei shan xie wen wei miao ming chuai3.A傲 S襡 D覆 F狒 G煽4.H谢 J稳 K隗 L缈 N鸣 M
guan xin jiao yao jian5.Z馆 X新 C姣 V鳐 B鞯其余字根按首笔笔画与其笔画数确定代码,首笔笔画可分为“横”、“竖”、“撇”、“捺”(点)、“折”共五种;每种笔画又分为一笔、二笔、三笔、四笔、多笔,共用25键(见图3)。
单字输入单一字根的字任一汉字至少折分为两个字根,只一笔的字,重复取一次,并加一补码。如乙=bbc 一=hhk二个字根的字首字根代码+第二字根代码+补码 如二=hhj汉=ypg 字=zbj 甲=dyu 申=dyi 由=dyo三个字根的字首字根代码+第二字根代码+第三字根代码+补码如三=hhhj 简=wmdk 单=fdei多个字根的字取前三码与最末一码 如五=hybh不足四码的汉字需加一补码,补码根据该字最末一字根的末笔笔画与其前一字根的位置关系确定,末笔笔画有“横”、“竖”、“撇”、“捺”、“折”,位置关系有“右”、“下”、“中”、“上”、“左”,共用25键(见图4)。
词组输入两字词首字首字根代码+首字第二字根代码+第二字首字根代码+第二字第二字根代码如中国=nyew三字词首字首字根代码+第二字首字根代码+第三字首字根代码+第三字第二字根代码如计算机=hwxp多字词首字首字根代码+第二字首字根代码+第三字首字根代码+末字首字根代码如中华人民共和国=nate二、拼音码拼音码为音形编码,分为全拼码与双拼码。
1、全拼码全拼码的有关字母代码zh=V ch=I sh=U ng=G ü=V其余声、韵母代码按汉语拼音不变。
全拼码根据汉语拼音,逐个键入拼音字母,最长码为四码。
单字输入声母代码+韵母代码+首字根代码 如一=yih 汉=hany凡不足四码的汉字,在后面加该字的首字根代码,首字根代码与快速码所用的全部字根代码相同(见图3、图4),这样,可使同音同偏旁的汉字出现在屏幕提示栏,减少拼音码的翻页次数,提高拼音码的输入速度。并且,经常使用熟悉了快速码的字根后,就可自然掌握快速码的字根,进而采用快速码输入汉字,可大大提高输入速度。
词组输入两字词输入首字声母代码+第二字声母代码+首字首字根代码+第二字首字根代码 如中国=vgne三字词输入首字声母代码+第二字声母代码+第三字声母代码+第三字首字根代码 如计算机=jsjx多字词输入输入前三字与末字的声母代码如中华人民共和国=vhrg2、双拼码双拼码的声母代码zh=V ch=I sh=U 零声母=O其余声母代码按汉语拼音不变。
韵母全部用单字母代换(见图5)。
单字输入声母代码+韵母代码+首字根代码 如一=yih 汉=hfy词组的输入与全拼码相同。
三、简易码简易码为字形编码。简易码的字根按首笔笔画与其笔画数确定代码,具体方法与快速码的其余字根相同(见图3)。
单字输入全部单字输入用四码。
单一字根的字字根代码+字根代码+补码+声母代码 如一=hhky二个字根的字首字根代码+第二字根代码+补码+声母代码如二=hhje 汉=dvgh 字=dcjz 甲=oyuj 申=oyiu 由=oyoy声母代码的使用方法与拼音码相同。
其余单字输入方法与快速码相同。
补码的使用方法与快速码相同(见图4)。
词组输入方法与快速码相同。
以上将多种汉字编码组合为一个汉字编码系统,不用切换键,可随意采用快速码、拼音码或简易码输入汉字,由于拼音码只有几百个音节,简易码全部采用四键输入,如果拼音码、简易码与快速码出现重码时,将拼音码与简易码排在快速码之后,就不会使快速码的输入速度受到丝毫影响。
自动提示功能由于快速码采用了26个汉字来帮助记忆160多个汉字的字根,简易码用了25键来表示笔画与不同笔画数,可将这26个汉字与其包含的字根以及简易码所用的笔画安排在相应的键位上,供初学者提示用,当记不清某个汉字或笔画在某一键位上时,只需按下一键,相应的汉字或笔画就提示在屏幕提示栏中。比如按“G”键,提示栏就出现“煽火户尸羽习”和“丶”;按“H”键,提示栏就出现“谢讠言身寸”和“一”;按“T”键,提示栏就出现“践足止戋戈弋”和“丿”;按“Y”键,提示栏就出现“湧氵水用冂力”和“丨”等等,这样就更加方便了字根与笔画的熟悉和记忆。
本编码与现有技术相比,具有以下显著优点该编码系统将拼音码、简易码、快速码结合为一套完整的汉字编码系统,适合各种不同人员输入简、繁汉字使用。懂拼音的可先从拼音码入门,不用记忆字根,上机就可输入汉字,边用边学,逐步掌握快速码的字根后,就可直接采用快速码输入汉字。不懂拼音的可先从简易码入门,同样不需记忆字根,只花几分钟时间熟悉笔画与笔画数在键盘上的安排后,就可输入汉字,其重码率低于拼音码,故打字速度可超过拼音码,熟练掌握简易码后,也可逐步过渡到用快速码输入汉字。专业打字人员可直接使用快速码,只需花较少时间,一般在几十分钟内,就可记住26个汉字与其所在键位,也就记住了160多个汉字字根,便可使用快速码进行快速汉字输入,由于重码率低于一般的编码方案,并装有大量的词组,输入速度可达每分钟100-200字以上。由于组合码中的拼音码与简易码不用记忆字根就可进行电脑打字,就不存在长久不用会忘记的问题。快速码的记忆量非常小,由于规律性强,久了未用也不易忘记。
我已从事了十五年的汉字编码研究,接触到无数的汉字编码方案,经反复比较,并用计算机对多个汉字编码进行重码率的试测和学习掌握时间长短的评估,无论在易学性、快速性、通用性等方面,组合码均优于现有的汉字编码技术。所以说,组合码真正解决了电脑打字中“易学与快速”的矛盾。
由于目前计算机汉字输入技术的落后,严重地阻障了我国计算机的普及与应用,许多人不懂拼音或拼音不准确,又没有时间去死记硬背一大堆汉字字根,只好放弃使用计算机;又有许多人花了不少的时间和精力,死记硬背了字根,学会了某种字形输入方法,但久了不用又会忘记,使中国人宝贵的时间和金钱,都造成了惊人的浪费。如果采用组合码,就不会有这些问题。
“计算机要从娃娃抓起”,那么我国小学生首先就应过电脑打字关,如采用组合码,小学生学完汉语拼音后,就可用组合码中的拼音码输入汉字,熟练后,就可逐步过渡用组合码中的快速码打字,小学生在小学毕业前就可产生出无数电脑打字能手,对将来进一步学习计算机打下了基础。
总之,如果组合码能在我国迅速推广应用,可产生巨大的社会效益与经济效益。
组合码汉字输入系统已在Windows操作系统中实现。
权利要求
1.一种用于计算机的汉字编码系统,将快速码、拼音码、简易码等多种输入方法组合为一体,不用任何切换键,采用通用键盘任意用以上方法输入简体或繁体汉字,其特征在于快速码输入单字按前三末一取码,不足四码时,根据该字末字根的末笔与其前一字根的位置关系确定补码,输入两字词按每字的前两个字根取码,输入三字词按每字的前一字根和末字的第二字根取码,输入多字词按前三末一字的首字根取码,拼音码以汉语拼音为基础,单字输入拼音字母后,再输入该字首字根代码,两字词输入该词每个字的声母代码后,再输入每字的首字根的代码,三字词输入该词每个字的声母代码后,再输入末字的首字根代码,多字词取前三末一字的声母代码,简易码根据汉字字根首笔笔画与笔画数取码,补码以及单字与词组的输入方法与快速码相同,最长码为四码。
2.根据权利要求1所述的汉字编码系统,其特征在于快速码将常用的160多个汉字字根组合成26个汉字,分为五组,并将26个字母键也分为五组,每组字母、汉字与该汉字可拆分的字根是①Q-锲钅金丰刀刂大、W-筐
匚王、E-雷雨田囗十、R-插扌手千臼、T-践足止
上戋戈弋
,②Y-湧氵水マ用冂
力、U-驉 馬马卜虍七、I-髓骨月ナ工辶、O-麟鹿广厂匕米夕

,P-磐舟
几又丆石,③A-傲亻
攵文、S-襡 衤衣
礻示四皿勹虫中、D-覆西彳日夂、F-狒犭弓
、G-煽火灬户尸羽习,④H-谢讠言身寸、J-稳禾三心忄、K-隗阝耳鬼白儿厶、L-缈纟
幺目少
小、N-鸣口鸟鳥乌、M-
门門人土士,⑤Z-館飠饣食艮宀冖
コ、X-新立
木斤
、C-姣女亠八乂、V-鳐鱼魚缶
山凵、B-鞯革艹廾
廿子了。
3.根据权利要求1所述的汉字编码系统,其特征在于简易码的字根按首笔笔画分类,G、F、D、S、A为点类,H、J、K、L、N为横类,T、R、E、W、Q为撇类,Y、U、I、O、P为竖类,B、V、C、X、Z为折类,每类笔画中的五个字母分别为一笔、二笔、三笔、四笔、多笔,共25键。
4.根据权利要求1所述的汉字编码系统,其特征在于采用补码来区分重码,补码按末笔笔画分类,G、F、D、S、A为点类,H、J、K、L、N为横类,T、R、E、W、Q为撇类,Y、U、I、O、P为怪类,B、V、C、X、Z为折类,每类笔画中的五个字母表示的位置关系分别为右、下、中、上、左,共25键。
全文摘要
组合编码的计算机汉字输入方法,用于方便、快捷地将汉字输入计算机。将快速码、拼音码、简易码等多种汉字输入方法融为一体,不用切换,可输入BGK中的2万多简体和繁体汉字。快速码只需记忆26个汉字,就可记住160多个汉字字根,只需几十分钟就可掌握,重码率仅为3%左右,汉字录入速度可超过目前流行的汉字输入方法;拼音码与简易码不用记忆汉字字根,只需几分钟熟悉键盘后就可输入汉字,经常使用拼音码或简易码,也可自然掌握快速码。
文档编号G06F3/023GK1267852SQ0011286
公开日2000年9月27日 申请日期2000年4月18日 优先权日2000年4月18日
发明者李一新 申请人:李一新
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1