音缀码计算机汉字输入法及键盘的制作方法

文档序号:6607034阅读:292来源:国知局
专利名称:音缀码计算机汉字输入法及键盘的制作方法
技术领域
本发明涉及一种由汉字或其部件的音形代码添加前后缀组合而成的计算机汉字输入编码方法及键盘。
当代流行的各种编码汉字输入法都无法克服易学与高效这对矛盾,即要么易学低效,要么高效难学。如许多音码重码率高,输入速度慢,难以实现盲打。况且说它易学,也仅仅是相对某些形码的极难学而言,因为这些音码仍然要求对汉语拼音的准确掌握,仍然要求强记复合声母、韵母的代码。许多形码则要死记硬背几百个所谓字根,其部件的拆分与代码的转换则更是错综繁杂、牵强附会、拐弯抹角、难学难记,不用即忘。有的甚至不惜破坏汉字结构的内在规律,把字随心所欲拆分得七零八落、面目全非。说它高效,也仅仅是相对某些音码的极低效而言,实际上那些专业录入员采取某种形码之所以高效,是因为长期苦学,死记硬背了大量代码而熟能生巧,并不是这种码有什么优异之处。至于有些音形结合码稍有长进,也仅仅是稍微提高了易学性和高效性,仍然存在诸多不尽如人意之处。
在专利公报中公开了一种“汉字音形序码计算机汉字输入方法”,其编码的特点是利用汉字拼音的首字母、字形和笔序来确定编码,并以汉字的字类部位来定取码位置的汉字编码方法。字形取码即规定了两个必要条件的部首其一、要求每一笔形完全相同;其二,要求每一笔画顺序相连,为此选用了字形达40组96个之多。笔序取码即由横、竖、撇、点、折五种基本笔形成两两排列所确定的25种笔画顺序,分成19组笔序。该发明在取码时要考虑读音、字形和笔画三种要素,不易入门,特别是字形和笔画混合编码难以区分,给使用者带来不少难度。
本发明的目的是为了解决音码虽易学但重码多、形码虽重码少但难学及音形码不易取码的缺陷,提出一种易学高效的汉字编码输入法,既适合专业电脑录入员,更适合广大管理、科技、文字工作者的汉字输入法。
本发明的任务是这样完成的一种音缀码计算机汉字输入法,以汉字的拼音、偏旁部件来确定代码,其特征是首码取其声母首字母,无声母(即所谓零声母)之汉字其首码均取R码,而第二至第四码的取码规则如下首先,音缀码通过优化筛选出数量少、概括性强的规范偏旁部件代码表为 其次,以字为纲、二级拆分一级拆分是先将字一分为二为2个一级部件即B1+B2,此时M2=B1,若部件B1为成字部件的取其拼音首字母为代码、否则按规范偏旁部件表取码;若部件B2即为规范偏旁部件,其中 除外,或笔画不大于3画,不再进行二级拆分,以“I”码结束,此时M3=B1、M4=I码;如放=方+攵=FFWI、相=木+目=XMKI、级=纟+及=JEJI;否则,须进行二级拆分,将部件B2拆分为几个部件,即B2=b1+bn,第三、四码分别取部件B2拆分后的首部件和末部件为码,即M3=b1、M4=bn,如扁=户 户+冂+艹=BHKA、说=讠+兑=讠+丷+兄=SIBX;以上所述两级拆分出的所有成字部件直接取其拼音首字母为代码,既非成字部件也非规范偏旁部件,均以“V”码为代码,如藤=艹+滕=艹+月+ =TAYV、 上述规范偏旁部件表上涉及“☆”部件的说明 P码P连带中/☆连带含有--以丿为首笔的非成字、非规范偏旁部件;U码U连带中☆连带含有 附表的音缀码规范偏旁部件(B)代码表,其中绝大部分偏旁按现代汉语规范配置代码,7个成字部件按其形似配置代码,14个括弧表示与其前面代码同类型的部件,6个“连带”上的“☆”号与DOS中通配符功能相似,表示在主形之外所连带的附属笔画或部件,加上代表一切非成字部件、非规范偏旁部件的“V”代码,仅42个偏旁部件代码就可非常均衡地涵盖所有汉字,而且其转换又是品种单一(指只用26个拼音字母)、直接便捷(无须再经过中间环节,如数字组合、笔画组合或笔顺、字形的辨析等等),且为有理记忆,使音缀码极易记易学。
在以字为纲二级拆分原则下,对个体字型拆分的一般原则一、因其它某一单独笔画的存在或自身某一笔画不是纯粹的横、竖、撇而影响成字部件的构成时,可予以剥离、舍弃或模糊处理,即不予考虑。如项=工+一+贝=XGHB,发=友+、=FYOI。若字为相交结构,但明显是由成字部件及规范偏旁部件衔接或叠加而成的,可予以切分或拆分。如里=田+土=LTTI、熏=千+黑=千+黑+灬=XQUD、必=心+丿=BXPI、申=日+|=SQSI、尹=彐+丿=YKPI。
二、多音字处理除优先考虑高频字或单字词外,参考该字词性,按优先级顺序是介词--形容词--动词--代名词的顺序选取音码。如区=匚+メ=QKXI,而不取RKXI,重=千+里=千+田+土=ZQTT,而不取CQTT,行=XRDI,而不取HRDI。
三、叠码结构凡一级部件首部件B1为相同或基本对称结构的按所谓叠码处理,仅取其一。如垒=厶+土=LGTI、瞿=目+佳=目+亻+圭=QKRG、哭=口+犬=口+大+、=KODO。
四、中坐结构一般先中间后两边,但含首笔画的部件优先,而两边须合起来作为一个整体,或取其代码,或进行二级拆分。如乘=禾+北=禾+丬+匕=CHPL,坐=从+土=ZCTI。
五、“辶”和“廴”结构因其包围结构且特别醒目,音缀码规定其代码“L”永远作为一级部件首部件代码,如远=辶+元=辶+二+儿=YLEE,道=辶+首=辶+ 自=DLUZ,廷=廴+壬=廴+丿+士=TLPS。
六、“刂、阝、鸟、心”结构如果一级部件次部件(B2)为该4个偏旁部首,而一级部件首部件B1又可拆分时,须拆分B1为B1+b11,即B1本身的代码加上对B1进行二级拆分所得第1个二级部件代码b11。如则=贝+刂=贝+门+刂=ZBKD,郑=关+阝=关+丷+阝=ZGBE,鸭=甲+鸟=甲+日+鸟=YJQN。但若部件B1不可拆分时,则按常规取码,如刊=干+刂=KGDI,鸡=又+鸟=又+乌+丶=JWWO。
下面利用直观的数学表达式对各种字、词及各种特殊符号的各级编码做进一步的说明为了更好理解本编码规则,在数学表达式中所涉及的符号其含义所下B代表规范偏旁部件;B1代表一级拆分所得一级部件的首部件;B2代表一级部件的次部件;b1代表二级拆分所得二级部件的首部件;bn代表二级部件的末部件;C代表词;C2代表二字词;Cn代表n字词;Cz代表专有名词;
D代表自定义词;D2代表自定义二字词;Dn代表自定义n字词;M代表码;M2代表第二码;以此类推;S代表声母首字母;Z代表字; Z1代表一级字库中的字;Z2代表二级字库中的字;涉及到的代码的表达方式即是“I码”、“V码”等。1字码(Z)的编码规则1.1一级字库(Z1)编码表达式Z1=S+M2+M3+M4其中首码S为声母首字字母(零声母均以R码为代码),第2码M2=B1,第3码M3=B2或b1,第4码M4=“I码”或bn。1.2二级字库(Z2)编码表达式Z2=“V码”+M2+M3+M4其中“V码”为二级字库前缀码以取代声母S,一方面解决了二级字库绝大部分既为罕见字又不懂读音的瓶颈,另一方面又与一级字库和词库实现彻底分流而大幅度降低了重码率,而其它编码规则与一级字库相同。2词码(C)编码规则词组除2字词是以每字1、2码组合而成全码,2字专有名词以其首字1、2码加上次字首码和后缀1,3字以上专有名词以其前3字首码加后缀1而成外,3字至5字词编码的取码顺序依次是首字、次字及第三字的首码加上字数后缀码为全码,大于5字词的后缀码均取“5”,自定义词的编码方法,除2字词为首字1、2码加上次字首码及后缀2外,其余与固有词相同,其数字后缀分别取“1′、2′、3′、4′、5′”与主键盘上方右边数字键6、7、8、9、0一一对应。其表达式如下2.1专有名词(Cz)编码表达式Cz=S1+B1+S2+1(Cz为二字词时)或Cz=S1+S2+S3+1(Cz为三字以上词时)其中“1”为专有名词后缀码。S1为词中第1字声母首字母,S2、S3为词中第2、3字声母首字母(下同)。2.2 2字词(C2)编码表达式C2=S1+B11+S2+B21其中B11为首字首部件,B21为次字首部件,也即该2个字的前两码组合。2.33字词(C3)编码表达式C3=S1+S2+S3+3其中“3”为3字词后缀码。2.44字词(C4)编码表达式C4=S1+S2+S3+4
其中“4”为4字词后缀码。2.5大于5字词(C5)编码表达式C5=S1+S2+S3+5其中“5”为大于5字词的后缀码。3.自定义词(D)编码规则自定义词的编码方法与固有词同,其数字后缀码分别取“6、7、8、9、0”。音缀码规定,主键盘上方数字键右半部分的“6、7、8、9、0”,在作为自定义词编码后缀时,假定(或标识)为“1′、2′、3′、4′、5′”,分别与固有词后缀码的1、2、3、4、5相对应,其它编码规则与固有词基本一致。其表达式如下3.1自定义专有名词编码表达式Dz=S1+B1+S2+1′(Dz为二字词时)或Dz=S1+S2+S3+1′(Dz为三字以上词时)3.2自定义2字词编码表达式D2=S1+B11+S2+2′3.3自定义3字词编码表达式D3=S1+S2+S3+3′3.4自定义4字词编码表达式D4=S1+S2+S3+4′3.5自定义大于5字词编码表达式D5=S1+S2+S3+5′4简码(J)本发明充分利用主键盘上的V键、数字键和标点符号键,定向安排前后缀,设计出与众不同丰富多彩的各级简码,而且所有后缀键均不影响其原来功能的正常操作。须说明的是,音缀码的各级简码本身是极有规律的有理记忆,并且除5个特级字简码和22个中文数字简码外,其余所有简码因与其基本码兼容而不强求记忆,可随着使用过程逐步熟练掌握,以大幅度提高效率。4.1常用字简码(ZJ)4.1.1特级字简码(独码独键,不加空格键)键盘上设置有特级字简码,一键输入,特级字简码依次是的=E、是=I、不=U、在=A、了=O4.1.2中文数字简码中文数字简码的编码方法是小写中文数字(n)以P码为前缀码,第2码与阿拉伯数字一一对应。特别指出,音缀码为照顾数字从小到大的习惯顺序规定0对应码是“P+、”,而十对应码是“P+0”。大写中文数字(N)以“V”码为前缀码,第2码与阿拉伯数字一一对应,并以空格健结束,零与拾的取码与小写同。中文数字简码表
4.1.3一级字简码(ZJ1)表达式一级高频字简码表达式ZJ1=S+ㄩ,直接输入声母首字母后加空格键即可;一级常用字简码表达式ZJ1=S+0、1……9,其中0~9为音缀码的汉字笔画结构代码,添加在声母首字母S之后作为一级常用字简码的后缀码,音缀码首笔画代码表为
其中表示所有“拐”、“勾”、“折”,十表示所有单交叉,廾代表所有双交叉。4.1.4二级字简码(ZJ2)表达式ZJ2=S+M2+ㄩ(M2=B1)4.1.5三级字简码(ZJ3)表达式ZJ3=S+M2+M3+凵(M3=B2或b1)4.2常用度量衡单位简码(HJ)表达式HJ=V码+x+ㄩ其中V码为常用度量衡单位简码前缀码;x为常用度量衡单位代码,见下表Q W E R T Y UIO P千 万亿日吨 月 升 公斤 元 平方(米)A S D F G H J K L 安时 第 百分之(点) 公(里) 毫(米) 角 克 立方(米) 秒ZXC V B N M,。
瓦 亩 厘米 伏 百年 米 分度该代码还可通过两两组合构成众多复合单位代码。如吨=VTㄩ、平方米=VPㄩ、公里=VGㄩ、度=V。ㄩ、又如吨公里=VTGㄩ、万平方米=VWPㄩ、平方公里=VPGㄩ、公升=VGUㄩ、光年=VGNㄩ、年度=VN。ㄩ。4.3序数词简码表达式第=V码+D+ㄩ如第=VDㄩ
第n=V码+D+a+ㄩ 如第一百二十八=VD128ㄩ第nx=V码+D+a+x 如第一百二十八条=VDD128T其中V码为序数词简码前缀码n为小写中文数字a为阿拉伯数字x为常用量词代码见下表QWERTYUI0P期 位 节 任 条 页 组天 件 排ASDFGHJKL行 首 点 幅个 号 届 款 轮ZXCVBNM章 项 次 场 班 年 名4.4时间简码(SJ)表达式SJ=V码+(P、V)+(x)+(y)+aN+aY+aR+aS+a,+a;其中V码为时间简码前缀码P、V码分别为a-n和a-N转换符x=Q(公元前)、Y(公元)、B(北京时间)、D(当地时间)、G(格林威治时间)、S(世界时)y=L(凌晨)、Q(清晨)、Z(早)、S(上午)、ZW(中午)、X(下午)、WH(午后)、B(傍晚)、W(晚)、Y(夜)、YL(夜里)、WY(午夜)。
N、Y、R、S、,、;分别为年、月、日、时、分、秒。▲特请注意“;”既是“秒”的代码,更是时间简码后缀码,不可或缺,且可取代N、Y、R、S、,作为结束码,如北京时间1999年5月8日凌晨5时46分=VB1999N5Y8RL5S45;当地时间一九九九年五月七日午夜十一时四十五分=VPD1999N5Y7RWY11S45;一九三七年七月七日凌晨=VP1937N7Y7RL;4.5金额简码(JJ)表达式JJ=V码+(P、V)+a(W、E).a+x其中V码为金额简码前缀码P、V分别为a-n和a-N转换符W、E分别为万、亿x为常用货币单位-R=人民币、M=美元、G=港元、O=欧元、T=新台币、A=澳元、H=韩元、L=卢布、Y=英镑、F=法郎、Q=日元。▲特请注意“、”既是“元”的代码,按习惯写法,“.”前的a表示多少元,“.”后的a为2位数,表示几角几分更是金额简码的后缀,不可或缺,即使是整数,也必须以“.00”结束。只有以下2种情况,在“.”之后不加“00”;一是整数元之后习惯加“整”字时,可在“.”之后加Z或ㄩ;二是在整数元之后习惯加某货币名称时,可在“.”之后加该货币名称代码。
如叁佰零伍万贰仟壹佰陆拾捌元捌角捌分=VV3052168.68;六仟伍佰美元=VP6500W.M4.6词简码(CJ)4.6.1特级高频词简码(CJt)表达式CJt=S1+f其中标点符号f为特级高频词简码后缀码,按高频词词性配置。4.6.2一级常用词简码(CJI)表达式CJI=S1+S2+n(n为末字首笔画结构代码)4.6.3二级词简码(CJ2)表达式CJ2=S1+B1+S2+2(2字词)或CJ2=S1+S2+S3+2(多字词)其中前3码取自词码基本码的前3码,“2”是二级词简码后缀码。二级词简码尽管仍为4码,但第4码取代B21或其它后缀,无须辨析、判断,熟练后可提高速度减少重码。4.7自定义词简码DJ4.7.1音缀码为用户开辟想象和创造空间,独创性地专门设计了编码空间达400个的自定义词简码,使用者可根据本专业具体情况,在自定义词中自主精心挑选高频术语加以定义,其表达式为DJ=Sn+Sm+′其中Sn、Sm分别表示自定义词中某两字声母首字母,单引号“′”为自定义词简码后缀码。如铁路技术管理规程=JG′4.7.2临时自定义词简码DL有时需要在文件中多次重复某些主题词或词组、短语、标的名称,甚至公式、符号等,音缀码独创性地专门设计临时自定义词简码20个,其表达式DL=Sn+′+DL+′其中Sn为所要临时自定义词中自选首字或关键字的声母首字母;单引号“′”为临时自定义词简码后缀码。
一经定义,则Sn′=DL(DL≤40个全角字符或80个半角字符)。
一旦关机,则过期作废。
如S′弥漫性毛细血管内增生性肾小球肾炎′=S′(取“肾”字)Q′根据权利要求1所述的音缀码计算机汉字输入法,其特征是′=Q′(取“权”字)
5符号码(F)编码规则在科技文章中经常要用到各种数学符号、单位符号、化学结构式等,传统办法要通过切换、提示甚至翻页、搜索、选择、击序号键、再切换等繁琐步骤,费时费力。音缀码规定国标规定中的字母符号、数学符号及图形符号是以其名称的汉语拼音声母首字母加标点符号后缀码共3键直接出屏,方便快捷。具体编码规则如下5.1数学符号编码规则表达式Fs=S1+S2+“=”码如∫=积分=JF= ≌=全等=QD=5.2图形符号编码规则表达式FT=S1+S2+“-”码如◇=空菱(形)=KL- ◆=实菱(形)=SL- ◎=双圈=SQ-5.3标点符号编码规则表达式FB=S1+S2+“,”如《=左书(名号)=ZS, …=省略(号)=SL,5.4希腊字母编码规则表达式Fx=S1+S2+“]”如Y=伽玛=GM]δ=司格玛=SG]5.5日文假名编码规则表达式FR=S1+S2+“.”如か=KA.だ=MU.5.6俄文字母编码规则表达式FE=S1+S2+“;”如л=DE;Я=YA;5.7拉丁字母编码规则表达式(作为数学符号中的英文字母)FY=S1(R)+S1+“[”如a=RA[r=RR[y=YY[6英文字母输入在学术论文、科技文献、科普读物、各种教科书、产品说明书中,频繁杂带拉丁字母尤其英文字母,各果按照传统输入法,都要进行中西文切换和大小写切换,须多打2至3键。音缀码提供中西合璧兼容功能,无须切换,减少击键。具体编码规则各下一开始进入音缀码中西合璧状态,此时数字功能全由小键盘担当,而主键盘上方数字键则作为英文字母的前缀码“1、2、3、4、5”不变,而“6、7、8、9、0”则与自定义词后缀码一样,假设(标识)为“1′、2′、3′、4′、5′”。其中“1、2、3、4、5”和“1′、2′、3′、4′、5′”分别作为小写和大写英文字母的前缀码与所要输入英文字母的数量相匹配,从而实现无切换、少击键录入中英文。
如1A=a 2AB=ab 5ABCDE=abcde1′A=A2′AB=AB5′ABCDE=ABCDE以上详细说明了音缀码的编码方法及汉字的拆分规则,并对一级字库、二级字库、词和自定义词以及各级简码的取码规则一一列式解释。总结本发明具有以下特点分码道以缀分流降低重码率,编码充分利用“V”键、主键盘上的数字键及标点符号键作为前后缀,彻底分流一级字库与二级字库、字码与词码、多字词与2字词、自定义词与固有词、简码与基本码,最大限度降低了重码率,尤其是动态重码率,缩短了平均码长尤其是动态码长,扩展了编码空间尤其是词编码空间,从而大幅度提高了录入速度和效率。而且,如此高效的实现,并非强求通过对汉语拼音的准确掌握和对数以百计所谓字根的死记硬背,音缀码仅要求掌握一级字库常用字拼音首字母和42个现代汉语所规范、大众所熟知的偏旁部首,其拆分原则又是符合汉字的造字规律和识字规律,所以音缀码很好地解决了本说明书卷首所提出的“当代流行的各种编码汉字输入法都无法克服易学与高效的矛盾”,既适合专业录入员、更适合广大管理干部、科技人员及文字工作者,是一种既易学又高效的理想的汉字输入法。
音缀码计算机汉字输入键盘,利用国标英文键盘26个键中的部分链分别代码特定的偏旁部件和以十个数字键做后缀码,其对应的键位为
权利要求
1.一种音缀码计算机汉字输入法,其以汉字的拼音、偏旁部件来确定代码,其特征是首码取其声母首字母,无声母之汉字其首码均取R码,而第二至第四码的取码规则如下首先,音缀码通过优化筛选出数量少、概括性强的规范偏旁部件代码表为 其次,以字为纲、二级拆分一级拆分是先将字一分为二为2个一级部件即B1+B2,此时M2=B1,若部件B1为成字部件的取其拼音首字母为代码、否则按规范偏旁部件表取码;若部件B2即为规范偏旁部件,其中☆和☆除外,或笔画不大于3画,不再进行二级拆分,以“I”码结束,此时M3=B1、M4=I码;否则,须进行二级拆分,将部件B2拆分为几个部件,即B2=b1+bn,第三、四码分别取部件B2拆分后的首部件和末部件为码,即M3=b1、M4=bn,以上所述两级拆分出的所有成字部件直接取其拼音首字母为代码,既非成字部件也非规范偏旁部件,均以“V”码为代码。
2.根据权利要求1所述的音缀码计算机汉字输入法,其特征是国标二级字库的首码不取其声母首字母,而全部以“V”码作为前缀码,以与一级字库和词彻底分流。
3.根据权利要求1所述的音缀码计算机汉字输入法,其特征词组除2字词是以每字1、2码组合而成全码,2字专有名词以其首字1、2码加上次字首码和后缀1,3字以上专有名词以其前3字首码加后缀1而成外,3字至5字词编码的取码顺序依次是首字、次字及第三字的首码加上字数后缀码为全码,大于5字词的后缀码均取“5”,自定义词的编码方法,除2字词为首字1、2码加上次字首码及后缀2外,其余与固有词相同,其数字后缀分别取“1′、2′、3′、4′、5′”与主键盘上方右边数字键6、7、8、9、0一一对应。
4.根据权利要求1所述的音缀码计算机汉字输入法,其特征是键盘上设置有特级字简码,一键输入,特级字简码依次是的=E、是=I、不=U、在=A、了=O。
5.根据权利要求1所述的音缀码计算机汉字输入法,其特征是中文数字简码的编码方法是小写中文数字(n)以P码为前缀码,第2码与阿拉伯数字一一对应,特别指出,音缀码为照顾数字从小到大的习惯顺序规定0对应码是“P+、”,而十对应码是“P+0”,大写中文数字(N)以“V”码为前缀码,第2码与阿拉伯数字一一对应,并以空格健结束,零与拾的取码与小写同。
6.根据权利要求1所述的音缀码计算机汉字输入法,其特征是国标规定中的字母符号、数学符号及图形符号是以其名称的汉语拼音声母首字母加标点符号后缀码共3键直接出屏。
7.根据权利要求1所述的音缀码计算机汉字输入法,其特征是音缀码中西合璧状态,此时数字功能全由小键盘担当,而主键盘上方数字键则作为英文字母的前缀码“1、2、3、4、5”不变,而“6、7、8、9、0”则与自定义词后缀码一样,假设(标识)为“1′、2′、3′、4′、5′”。其中“1、2、3、4、5”和“1′、2′、3′、4′、5′”分别作为小写和大写英文字母的前缀码与所要输入英文字母的数量相匹配。
8.根据权利要求1所述的音缀码计算机汉字输入键盘,其特征是利用国标英文键盘26个键中的部分键分别代码特定的偏旁部件和以十个数字键做后缀码,其对应的键位为
全文摘要
本发明涉及一种音缀码计算机汉字输入法及其键盘,其以汉字的拼音、偏旁部件来确定代码,其特征是首码取其声母首字母,无声母之汉字其首码均取R码,而第二至第四码的取码规则如下:以字为纲、二级拆分,两级拆分出的所有成字部件直接取其拼音首字母为代码,其它按规范偏旁部件表取码,既非成字部件也非规范偏旁部件,均以“V”码为代码。本发明取码特点是音形结合、以缀分流、取码快、重码率低、编码空间大。
文档编号G06F3/023GK1282905SQ9911659
公开日2001年2月7日 申请日期1999年8月3日 优先权日1999年8月3日
发明者侯广康 申请人:侯广康
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1