汉字词组输入法的制作方法

文档序号:6414147阅读:975来源:国知局
专利名称:汉字词组输入法的制作方法
发明全称汉字词组输入法发明简称汉字词组发明英文代码HZCZ汉字词组输入法作为一种计算机文字输入方案,隶属于计算机应用技术领域。
汉字词组输入法应用于各种中方操作平台,对它的理解、检索、审查,可借助于这些中方平台的各种工具。其中,PWindows 95的输入法生成器为汉字词组输入法的理解、检索、审查提供了极佳的手段,输入法生成器中的码表逆转换,可将汉字词组输入法码表文件反编译为文本文件,通过它可对汉字词组输入法内部的字根设置、字词编码、词库设置进行全面的检索和审查。附PWindows 95输入法生成器码表逆转换自述文件Microsoft Windows 95中文版自述文件1995年12月(C)Microsoft公司版权所有,1995年输入法生成器码表逆转换在输入法生成器中,还提供了其他一些码表输入法的维护工具。其中之一就是码表逆转换。通过它,您可以将已有的码表词库文件(.MB)转换为符合Windows 95格式的码表源文件(.TXT)。具体步骤如下1.单击“开始”按钮,指向“程序”、“附件”,然后单击“输入法生成器”。
2.单击“码表逆转换”功能页。
3.单击“打开文件”按钮,将码表词库文件打开。
4.单击“逆转换”按钮,即可生成一个文本文件。
发明汉字词组输入法的目的,在于设计出一种比五笔字型输入法更为易学、简便、快捷的中文键盘输入方案,突破计算机汉字输入的学习瓶颈与速度瓶颈,让我国计算机的应用跃上一个新台阶。
汉字词组输入法是一种以词组输入为主、单字输入为辅的键盘文字输入方案,它采用特殊的字根键盘设置方案、字词编码方案、词库设置方案,输入操作方案,使它具有编码短、学习容易、操作简便、输入快捷、定位准确等特点。
一,字根键盘方案字根是构成汉字的最基本单位,每个汉字都可以看成由不同的字根所组成的。在汉字词组输入法中,根据汉字内部的部首偏旁构造,和兼容五笔字型的原则,设置字根200个,其中,基本字根194个,附加字根6个。在基本字根中,还包括62个能够单独成为汉字的字根,即成字字根。
基本字根是必备字根,附加字根则是专门为兼容五笔字型而设立的字根,字根键盘方案,是指输入法字根与计算机键盘键位的对应方案。汉字词组输入法的字根键盘方案见附

图1图中,从A到Y这25个键位根据对应字根的起笔走势分为5个区,每个区又分成5个位,200个字根就有规则地分布其中。
1区的字根首笔起势为“横”(包括“提”),2区的字根首笔起势为“竖”(包括“左竖钩”),3区的字根首笔起势为“撇”,4区的字根首笔起势为“捺”(包括“点”),5区的字根首笔起势为“折”(包括“折勾”“竖直弯钩”)没有设置字根的Z字键为查询键和通配键任何编码可以通过该键进行查询和通配。
二,字词编码方案汉字词组输入法采用码长分区技术,三码一字,四码一词,即单字编码全部设置在三个及三个以下的码元区域内,而四个码元的区域全部留给词组使用。
编码码元ABCDEFGHIJKLMNOPQRSTUVWXY选择码元1234567890通配查询码Z单字最大码长3词组码长4编码标识
<p>编码表达式[字词标识]={[排序标识][单字序号][码元序号]+……[排序标识][单字序号][码元序号](附加标识)}式中中括号内容是必备内容,小括号内容是非必备内容。
编码规则汉字词组输入法编码规则分为单字编码与词组编码两部份,共9条规则1,单字编码单字编码,分为键名字、一级简码、二级简码、全码、特例码、成字字根六种情形①,键名字。计算机键盘从A到Y的每一个键位均可由一个常用汉字所代表。这个代表键位的汉字称之为键名字,编码规则是z=000+000+000即完全忽略其排序标识、单字序号、码元序号,仅在对应键位上连击三键。
汉字词组输入法键名字全兼容五笔字型输入法,一共有25个工aaa 子bbb 又ccc 大ddd 月eee 土fff 王ggg 目hhh 水iii日jjj 口kkk 田lll 山mmm 已nnn 火ooo 之ppp 金qqq 白rrr木sss 禾ttt 立uuu 女vvv 人www 纟xxx②,一级简码。仅有一个码元的编码称之为一级简码,汉字词组输入法一级简码与五笔字型输入法完全相同。其编码规则比较特殊,大体是y=p01 或 y=p02一级简码有25个,即一g 地f 在d 要s 工a ——横势起笔上h 是j 中k 国l 同m ——竖势起笔和t 的r 有e 人w 我q ——撇势起笔主y 产u 不i 为o 这p ——捺势起笔民n 了b 发v 以c 经x ——折势起笔③,二级简码。由二个码元组成的编码称之为二级简码,编码规则是e=p01+p02即取其汉字内部的第一、第二个字根码元。
汉字词组输入法设置二级简码616个,全兼容五笔字型输入法的二级简码,并比其二级简码多28个,是目前二级简码最多的键盘输入法。具体见附图2图中,单字编码为该字所在行的码元加该字所在列的码元,如你wq 好vb。
④,全码。全码是指由三个码元编制的单字完全编码,编码规则是a=p01+p02+n01即取单字内部的首、次、尾三个字根码元。字根不足三个者,则第三码元重复第二码元。
⑤,特例码。特例码是指汉字词组输入法为兼容五笔字型而设立的特殊编码,编码规则是t=p01+p02+p03 或t=p01+p02+p0w它的设立必须符合下列条件(1),特例码与五笔字型输入法三级简码完全兼容;(2),特例码必须是常用汉字;(3),特例码不得有重码;(4),特例码不得超过100个。
在现版本中,特例码91个,为把rcn,回lkd,看rhf,吗kcg,拍rtg,去fcu,她vbn,头udi,万dnv,问ukd,应yid,正ghd,走fhu,私tcy,句qkd,岁mqu,血tld,挟rgu,里jfd,闯ucd,德tfl,书nnh,隔bgk,稿tym,斗ufk,海itx,惯nxf,寒pfj,气rnb,倒wgc,滴ium,底yqa,掂rhk,副gkl,婕vgv,哥gks,喝kjq,恒ngj,慌nay,装ufy,魂fcr,既vca,解qev,举iwf,陋bgm,哦kht,趣fhb,烧oat,神pyj,湿ijo,室pgc,似wny,舞rlg,稀tqd,希qdm,洗itf,雄dcw,摇rer,夜ywt,越fha,帐mht,卡hhu,写pgn,罪ldj,哈kwg,汗ifh,源idr,渗icd,捷rgv,迫rpd,殷rvn,梅stx,梯sux,徜tim,箭rue,魏tvr,凋umf,娆vat,奴vcy,伟wfn,谋yaf,熟ybv,位wug,码dcg,缓xef,元fqb,铮qqv,圈lud,飞nui,微mtg,源idr。
特例码不是必备编码,初学者不必刻意学习。
⑥,成字字根。汉字词组输入法的字根设置中,能够单独成为一个汉字的,即是成字字根,编码规则是c=000+p01+n01即先击这个成字字根所在的键位,然后再击这个字根的第一笔划和最后笔划的键位。
汉字词组输入法的成字字根一共62个戋ggt 五ggg 寸fgy 十fgh 士fgg 雨fgy 干fgh 古dgg 石dgg厂dgt 犬dgy 丁sgh 西sgg 酉sgg 戈agt 革agh 七agn 弋agy廿agg 卜hhy 止hhg 日jhg 早jhh 虫jhy 川kth 甲lhh 四lhg皿lhg 骨mhg 贝mhy 由mhg 几mtn 竹tth 身ttt 舟try 手rth斤rth 乃etn 用eth 豕egy 八wty 鱼qtg 儿qtn 夕qty 文yyy广yyt 方yyn 六uyy 辛uyh 门uyn 小ihy 米oyy 己nnn 乙nnn已nnn 心nyy 尸nnt 羽nng 孔bng 也bnn 耳bgg 刀vnt 九vtn
彐vng 臼vtg 巴cnn 马cng 幺xny 弓xnn 匕xtn。
其实,上述成字字根有不少是二级简码,只要键入首、次两码就已足够。
2,词组编码词组编码规则为ce2=p11+p12+p21+p22ce3=p11+p21+p31+p32ca4=p11+p21+p31+n11即①,四码一词。
②,二字词依次取各字的首码和次码;三字词取依次取首字、次字的首码,和来字的首、次两码;四字和四字以上词依次取首、次、三、末字的首码。
③,词组编码仅以基本字根为取码对象,对附加字根暂不提供编码。
三,词库设置方案词库设置是汉字词组输入法的重要组成部分,它遵循三个原则1,丰富性。汉字词组输入法的词库设置以现代汉语词典为蓝本,兼收并蓄其它口语、俚语、常用语,数词,县级以上地名词,词库总条目在六万条以上,其中二字词大于三万五千条,三字词大于八千二百条,四字词大于一万五千条,五字和五字以上词大于二千四百条。
2,实用性。词组的收录注重实用性,力求将实际操作应用到的各种由名词、动词、付词、介词组成的非正式词组收录在案,如“决不”、“再也”、“俯下头”、“越来越”等,使词库的设置能够适应所有文稿的词组输入需要。
3,新颖性。汉字词组输入法贴近实际,贴近时代,词库的设置力求收录现有时代用语和流行用语,紧跟时代步伐。
四,输入操作方案1,单字输入。
①,键名字按击相应键位三下,再按一下空格键;②,一级简码按击相应键位一下,再按一下空格键;③,二级简码依次按击首、次字根相应键位,再按一下空格键;④,全码依次按击首、次、末字根相应键位,再按一下空格键,如字根不足三个,则第三键重复第二键位;⑤,特例码依次按击码元相应键位,再按一下空格键;⑥,成字字根按照编码依次按击相应码元键位,再按一下空格键。
其中,一级简码、二级简码、特例码没有重码。其它编码输入如出现重码,按空格键或继续输入,则首字自动定位到屏幕光标位置;如需输入其它单字则按数字键进行选择。
2,词组输入。
①,依次按击词组码元键位,四码一词。
②,词组输入如出现重码,按空格键或继续输入,则首位词组自动定位到屏幕光标位置;如需输入其它词组则按数字键进行选择。
3,全文输入①,词组输入为主,单字输入为辅。
②,词组输入应尽可能以二字词、三字词和四字词为主。在实际操作中,二字词、三字词和四字词的使用频率最高。整个词库二字词、三字词和四字词的设置也最丰富,分别占据了百分之五十八点三、百分之十三点二和百分之二十四点五的份额,三项合起来就是总词库的百分之九十六。
③,作为词组输入辅助补充部分的单字输入,尽可能以一级简码、二级简码和特例码输入为主。因为这三种编码汉字使用频率最高,同时它们均无重码,有利于提高文字输入速度。
4,学习与操作技巧汉字词组输入法是一套独特的汉字操作方案,也是一套兼容五笔字型规则的方案,它的学习与操作技巧,可分为初学者与五笔字型使用者两部分而言①,对初学者而言(1),基本字根是汉字词组输入法的基础。掌握基本字根设置方案及其编码规则是掌握汉字词组输入法的关键。多练练,多想想,熟能生巧。
(2),附加字根是汉字词组输入法为兼容五笔字型而特地设置的,因此初学者不必刻意学习附加字根。
(3),特例码是汉字词组输入法为兼容五笔字型而设置的特殊编码。虽然掌握好特例码可以提高文字输入速度,但特例码毕竟增加了初学者的学习负担,因此,初学者不必刻意学习特例码。
②,对于五笔字型使用者而言使用汉字词组输入法再也简单不过。只需保持原来的操作习惯和规则就可以准确无误地输入单字和词组。但应注意下面三个问题(1),三码一字;(2),单字内部的最后一个编码必须是这个单字的最后一个字根;(3),在进行二字词和三字词输入时,遇到带有“犭”“豸”“舟”“身”“革”“酉”“骨”“鱼”“牛”“足”这十个部首偏旁的单字时,不必象原来一样把它们拆成两个字根,而只需按击原来第一个字根的键位则可。
③,综上所述,汉字词组输入法的另有一条捷径在学习资料尚且缺乏情况下,不妨先学习五笔字型输入法的字根设置和编码规则(不必学习其字根拆分方法和判别码),然后按上述②项方法轻轻松松转到汉字词组输入法上来。
总之,我们只要多学多思多用,使用汉字词组输入法就一定能够达到炉火纯青的境界,如同前人形容的那样“其得于阳与刚之美者,则其文如霆如电,如长风之出谷,如崇山峻崖,如决长川,如奔骐骥;其得于阴与柔者,则其文如升初日,如清风,如云如霞如烟,如幽林曲涧,如沦如漾,如珠玉之辉,如鸿鹄之鸣。”汉字词组输入法与现有输入法相比所具有的积极效果汉字词组输入法是一项博采众长的的技术方案,它集中了目前众多键盘输入法长处,如双拼双音的词组输入,钱码的三键一字,五笔字型的字根设置,自然码的庞大词库,郑码的快速输入……,从而形成了自己独特的优势。它与上述提到这些输入法相比,具有编码短、学习容易、操作简便、输入快捷等特点。
一,编码短汉字词组输入法是以词组为主的汉字输入方法,采取独特的码长分区技术,三键一字,四码一词,国标一二级字库中的六千七百六十三个汉字均可用三键击出;它是目前我国形码中唯一的一套三码一字输入法,例下
由于汉字词组输入法本身就是三码一字,加上其一、二级简码和庞大的词库,使通篇文稿输入击键次数达到最少程度,平均码长仅2·2;是目前编码最短、按键次数最少、输入速度最快的汉字键盘输入法。
二,适应性广汉字词组输入法中单字输入采用三码编制技术,内核精巧,占用内存小,运行速度快,轻松胜任4M内存、80386以上PC机型。在16M以上内存的奔腾一代、奔腾二代高档机型上,更能充分发挥其32位、64位数据传输技术的强劲威力,使汉字词组输入法浩瀚词组得到淋漓尽致的发挥,如虎添翼。
三,学习容易、操作简便1,汉字词组输入法三码一字,编码短。易为人们所掌握。
2,汉字词组输入法字根接近我国汉字结构的部首偏旁,符合汉字内部的拆分规则。
3,汉字词组输入法完全摒弃判别码,大幅度减轻人们学习负担。
4,汉字词组输入法字根键盘分布规范,点、横、竖、撇、捺、折弯钩俱有相应的键位区域。设置均匀、合理、规律性强。
5,汉字词组输入法兼容五笔字型的键盘方案,凡会使用五笔字型输入法的人均几乎不用学习就能轻松掌握汉字词组输入法。
四,输入快捷汉字词组输入法是以词组输入为主、单字输入为辅的键盘输入法,通篇文稿几乎可以完全使用词组实现快速输入。它以下列条件作为支持1,词组丰富。汉字词组输入法以现代汉语词典为蓝本,兼收并蓄其它口语、俚语、楹联、常用语。同时,除了正式词组之外,凡实际操作使用的各种由名词、动词、付词、介词组成的非正式词组也俱收录在案,适应一般文稿快速输入,现版本设置字词条目达六万六千八百余条,其词组之丰富雄踞各种输入法之首。
2,码长分区技术。汉字词组输入法三码一字,四码一词,从根本上免除字词输出相互屏蔽的矛盾。同时,字词输出浑然一体,不用按键切换,两者相辅相成,相得益彰。“大弦嘈嘈如急雨,小弦切切如私语;嘈嘈切切错杂弹,大珠小珠落玉盘。”3,定位准确。汉字词组输入法不象有些智能输入法那样在整句输入后得重新返回修改,而是将字词直捷地定位到屏幕光标的位置上,令人得心应手,心旷神怡。
4,字根优化。汉字词组输入法通过优化内部字根的方法达到减少词组重码的目的,将词组重码现象降低到最少的程度。在五笔字型输入法中,“狡猾”一词重码就有“狡猾”“狰狞”“狠狠”“猖狂”“猖獗”“逛逛”“狐狸”“狼狈”“狼狗”“狩猎”“猕猴”“急先锋”十二个多;“鲜鱼”“鲸鱼”“鲤鱼”之类渔产品的词组,其重码更为惊人,凡是带有“鱼”字偏旁词组的就有重码。而在汉字词组输入法中,则“狡猾”就是“狡猾”,“狰狞”就是“狰狞”;“鳄鱼”就是“鳄鱼”.“鲤鱼”就是“鲤鱼”决不重码。
汉字词组输入法的最大优势就是快捷、准确的词组输入。
五,全面兼容五笔字型输入法五笔字型输入法是我国应用范围最广、实用性最强的键盘输入法,目前的许多输入法都无法对其兼容而导致其应用的局限性。而汉字词组输入法以广博的内涵对五笔字型全面兼容,从而大幅度拓展了汉字词组输入法的应用区域。它与五笔字型的兼容情况如下
凡是会使用五笔字型输入法的人几乎可以不用学习就可以使用汉字词组输入法。
六,独特的优势汉字词组输入法博采众长,形成其它输入法所不能比拟的独特优势。它与它所兼容的五笔字型输入法相比,许多指标均全面胜出
可以毫不夸张地说,汉字词组输入法在功能、操作、实用程度方面均全面胜出五笔字型输入法,具有其它输入法(包括各种智能输入法)所不能比拟的新颖性、创造性和实用性,完全不失为我国计算机输入文化百花园中的绚丽奇葩,可能是目前最好的中文键盘输入法汉字词组输入法作为一种键盘输入方案,各种中文操作平台为它的实现均提供了有力的工具,如UCDOS的Limd,TWAY的Keytooo。同时,也可以通过汇编语言将其生成各种加挂在DOS或Windows平台的专用输入法软件。本人认为,实现汉字词组输入法的最好方式,是使用美国Microsoft公司提供的中文版Windows 95输入法生成器。通过该输入法生成器,可以生成具有自己个性、与Windows 95中文版风格一致、并能充分发挥Windows 95各种优良特性的汉字词组输入法。
具体步骤如下一,创建汉字词组输入法码表源文件1.单击“开始”按钮,指向“程序”、“附件”,然后单击“写字板”。
2.根据Windows 95输入法格式,和汉字词组输入法键名字、一级简码、二级简码、全码、成字字根、特例码、词组的编码规则,建立汉字词组输入法码表源文件[Description]Name=汉字词组MaxCodes=4MaxElement=2UsedCodes=abcdefghijklmnopqrstuvwxyWildChar=zNumRules=3[Rule]ce2=p11+p12+p21+p22ce3=p11+p21+p31+p32ca4=p11+p21+p31+n11[Text]工aaa子bbb……一g地f……二fg三dg……键qvp码dcc……斤rth石dgg……应yid回lkd……汉字icpb创建wbvf……输入法ltif生成器tdkk……汉字词组ipyx
五笔字型gtpg……汉字词组输入法ipyi中华人民共和国kwwl……④退出,另存为Windows\system\hzcz.txt。
二,创建汉字词组输入法1.单击“附件”中的“输入法生成器”2.选择“词条排序”标签,单击“打开文件”,选择hzcz.txt码表源文件,然后单击“确定”返回。
3.在“词条排序”任务中单击“排序”。
4.排序完成,单击“确定”后返回。
5.选择“创建输入法”标签,单击“浏览”,选mhzw.txt码表源文件。填入输入法信息,然后单击“确定”。可生成输入法文件(HZCZ.IME)和码表文件(HZCZ.MB)。
6.单击“转换”按钮,生成HZCZ.MB的码表文件。
7.然后单击“创建”按钮,添入版本号和机构名称。
8.单击“用户给定”选项,再单击“浏览”按钮,分别选择自己喜爱的图标(.ICO文件)、位图(.BMP)及帮助文件(.HLP文件)其中文件类型 格式 用途位图文件(.BMP)20*20 显示在输入法状态窗口的中英文切换按钮上和版本信息窗中图标文件(.ICO)16*16 显示在“任务栏”上的“指示器”中帮助文件(.HLP)Windows95 对于生成的输入法,系统将自动提供“操作指南”,用户所提供的帮助文件则是关于输入法本身编码的帮助。
9.单击“确定”按钮,即生成一个带有用户自己风格的汉字词组输入法文件(HZCZ.IME)。
10.生成输入法后,系统将提示您是否安装。选择安装后,系统将自动安装输入法。此时,新生成的汉字词组输入法即添加到中文Windows 95系统中,您可以马上象使用其它预装的输入法一样使用这一新生成的输入法了。
权利要求
汉字词组输入法权利要求书根据汉字词组输入法的技术特征,现申请汉字词组输入法的专利保护范围1,汉字词组输入法字根键盘方案的保护。权利要求1所述的字根键盘方案,其特征是①,字根数目200个,其中基本字根194个,附加字根6个;②,字根与计算机键盘键位的对应码元关系是根据汉字词组输入法编码规则而制订;③,字根与计算机键盘的对应特征分区关系是根据汉字词组输入法编码规则而编制。
2,汉字词组输入法编码方案的保护。权利要求2所述的编码方案,其特征是①,单字编码、词组编码均是根据汉字词组输入法字根码元而编制;②,三码一字、四码一词,单字编码与词组编码分别使用不同码长区域。③,设置二级简码216个。④,设置特例码。
3,汉字词组输入法词库的保护。权利要求3所述的词库,其特征是①,词库总条目等于或大于60000条;②,二字词条目等于或大于35000条;③,三字词条目等于或大于8200条;④;四字词条目等于或大于15000条;⑤,五字及五字以上词条目等于或大于2400条;
4,汉字词组输入法说明书的保护。权利要求4所述的说明书,其特征是①,内容含有对汉字词组输入法发展概况的阐述;②,内容含有对汉字词组输入法功能特点的阐述;③,内容含有对汉字词组输入法技术方案的阐述;④,内容含有对汉字词组输入法操作方法的阐述。
全文摘要
汉字词组输入法是一套词组输入为主、单字输入为辅的键盘文字输入方案。三码一字,四码一词,字词输出浑然一体,具有编码短、词组丰富、输入快捷、定位准确等特点,且全兼容五笔字型输入法,比五笔字型输入法提高效率约百分之二十至百分之三十左右,可能是一种最好的中文键盘输入方案。
文档编号G06F3/023GK1234543SQ9810851
公开日1999年11月10日 申请日期1998年5月2日 优先权日1998年5月2日
发明者钟明华 申请人:钟明华
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1