音形经纬码计算机汉字输入方法

文档序号:6407986阅读:342来源:国知局
专利名称:音形经纬码计算机汉字输入方法
技术领域
本发明属计算机汉字输入技术领域,是一种以音形经纬码为基础的计算机汉字输入方法。
到目前为止,用于计算机汉字输入系统的汉字编码方案不下数百种。在这些编码方案中,真正能做到“易学、易记、易用”的比较理想的方案极少。有些方案虽然重码少,但编码方法复杂,难学、难记,有些方案虽然编码方法简单,但重码率高,如拼音码,通常要翻好几页才能找到所需的汉字,这些方案都会影响计算机汉字输入速度的提高。
本发明的目的在于提供一种以音形经纬汉字编码为基础的易学、易记而且重码率低的计算机汉字快速输入方法。
本发明提出的用于计算机汉字输入系统的汉字编码方法包括两个部分单字编码和词组编码。单字和词组并不重迭。为了方便起见,称本发明的编码为“阳码”。
本发明设计的阳码采用汉语拼音和汉字字型特征相结合的编码方法,用26个英文字母进行编码,每个单字的码由4个字母码组成,词组的码由4个或5个字母或数字码组成,其中一个字母或数字为词组特征标志码。
关于单字编码。单字编码的4个码中,前2个码由该单字的双拼双音组成,为音码,后2个码分别由表示该单字的笔划和字型特征的经纬码组成,为形码。
所谓汉字的双拼双音,是指汉语拼音中声母和韵母各用一个字母作为这个汉字读音的代码,从而简化输入操作。一般以汉字的声母的字母作为该单字的第一个码,以该汉字的韵母对应的代码字母作为该单字的第二个码。没有声母的字,第一个码一律用字母V代替。本发明的双拼双音以CCDOS的双拼为基础,只是对少数代码作了调整。具体的代码表如下
需要说明的是,当汉字的声母是zh、ch、sh时,根据上述代码表,该字双拼的第一个码相应为A、U、I。阳码对应的键盘上的键位如附图
所示。英文字母键的排列次序与通常的计算机输入键盘的键位相同,各行键从左到右依次为Q、W、E、R、T、Y、U、I、O、P;A、S、D、F、G、H、J、K、L、;、Z、X、C、V、B、N、M、。上述英文字母标于键位上(例如上边),该键上还标有该字母对应的韵母或声母,以及表示阳码的经度和纬度的两个数字。
键盘上的经度和纬度确定方式如下键盘上键位按纵向分为5个经度。键盘中间一行左边5个键位G、F、D、S、A经度为1,右边4个键位H、J、K、L及M的经度为2;上边一行左边键位T、R、E、W、Q经度为3,右边键位Y、U、I、O、P经度为4;下边一行左边键位B、V、C、X、Z的经度为5。纬度按键盘的横向也分为5个,即按键盘的中间位置线向左右两边推移,纬度依次为1、2、3、4、5。例如键位G、F、D、S、A的纬度依次为1、2、3、4、5。各键位对应的经度和纬度,分别标在该键位上英文字母的左下角。例如,字母K对应的键位在键盘中间一行右边自中心起第3个位置,其经度为2,纬度为3,在字母K左下角标出23,字母M的经纬度为25。字母N的键位不给出经纬度,以便在词组编码中使用。
根据上述设计,键盘的键位上的字母与汉字韵母或声母以及经纬度的对应关系如下
键盘上的其它键,如符号键、功能键、数字键等可以与通常计算机的输入键盘相同。
本发明对汉字单字的第3、第4码采用经纬码,其编码现如下
将汉字的笔划和字型归纳出五种基本笔划及五种特征字型,并分别规定其度数为1至5,(其中对点作特殊规定,当点位于首笔和次笔时算捺,当点位于末笔时算撇)。
汉字的五种笔划及其对应的度数如下
汉字的五种特征字型及其对应的度数如下
特征字型优先原则
1)当首笔末笔分别包含在日、月、氵、木、禾口扌讠石不同部首时,以首笔所属字型处理。
2)特征字型优先级1=2>3=4>5(=为等同,>为优于)。
据统计,汉字中第一划和第二划出现以下几种组合的频率最高。这些组合是首笔“一”、次笔“丨”,首笔“丨”、次笔“一”,首笔“丿”、次笔“一”,以及首笔、次笔均为点。从这些组合中选取出现频率最高的带有以上组合笔划特征的几个部首“木扌口日月禾氵讠石”偏旁,将含有以上偏旁的字(只有当第一笔或最后一笔包含在该偏旁内时)单独列为特征字型种类1和2。这样和前述音码结合,可以有效地降低了重码。如双拼相同字中第一笔分别包含在“木”、“扌”、“艹”之中时,就可以根据特征字型将其分开。
汉字阳码的第三码和第四码实际上为形码。第三码的确定方式是汉字书写第一笔笔划的度数为经度,该字第二笔笔划的度数为纬度,取这经纬度所对应的键盘英文字母即为第三码。如化,第一笔“丿”,3度,第二笔为“丨”,2度,其经纬度32对应“R”,故第三码为R。
第四码的确定方式以汉字末笔笔划的度数为经度,以该汉字所属特征字型(见汉字特征字型表)的度数为纬度,取这经纬度的对应的键盘字母,即为第4码。经纬度唯一确定该字的第四码。例化,末笔“丿”,3度,故经度为3,该字特征字型属左右型,纬度为3度,33对应“E”。化的双拼为HB,其音形经纬码是HBRE。
这样每个单字的编码都可以根据读音和字型唯一确定,首先利用双拼将读音不同的字区分开,然后又由经纬码将读音相同的字区分开来,这样几乎完全可以消除重码。例如Qian的双拼为QJ,读音为Qian的字阳码示例
债 QJRI QJFJ 掮 QJFF 黔 QJHC 前 QJOL QJOH
芊 QJFL 茜 QJFS 欠 QJQP 歉 QJOI
作为对上述方法的补充,本发明可作如下约定
1.对拼音无声母的字,其双拼均以“V”作为声母。如阿、鹅、岸、昂等的双拼分别为Va、Ve、Vf、Vg
2.为了便于汉字输入时盲打,如果出现重码时,计算机发出音乐或其它声母揭示使用者,以便选取所需的字。
3.对于笔划不足三画的汉字,取经纬码时其笔划要重复取码。如“八”只有两笔,取经纬码时,其首笔取“丿”,次笔是“丶”,末笔同样取“丶”,故编码为BAWI。又如“乙”,只有一笔,其首、次及末笔均为“乙”折,特征字型为混合型,其编码为YIZZ。
本发明关于词组的编码方法如下
词组可有4码或5码组成,各有两种编法。
因为阳码单字编码的后两码只取25个字母,字母N没有使用,将它放在第三码,作为进入词组的标志。
1.第三码以N为标志,进入词组库,采用4码。
两字词的编码前两码取第一个字的双拼,第三码取N,第4码为第二个字的第一音码。如精神,JLNI。
三字词的编码第三码取N,依次取三个字的双拼的第一码分别作为第一二四码。如计算机,JSNJ。
四字及四字以上词组编码仍然以N作第三码,依次取词组的第一。第二,最后一个汉字双拼的第一码分别作为第一、第二、第四码。例如计算机系的取码为JSNX,中华人民共和国,依次取中华国的双拼第一码作第一、二、四码,AHNG。计算机学报,JSNB。
2.第三码以数字表示,当第三码为数字时进入词组库查找。
两字词的编码,第3码取2代替方法1中的N,其它取码方法不变。如精神,JL21。
三字词和四字词,其第三码分别以3,4来代替方法1中的N,其它码的取码方法与方法1相同。例计算机,JS3J。计算机系,JS4X。
五字词到八字词的编码第三码取数字5,依次取词组的第一、二和最后一个汉字的双拼的第一码分别作为第一、二和四码。如中华人民共和国,AH5G。中国工商联,AG5L
八字以上词组第三码取数字6,其余各码取法同五字词到八字词的取法。如北京国家专利事务局,BJ6J
方法2的词组容量明显大于方法1。
3.第三码取N,共取5个字母编码,增加了词组容量,同时也增加了击键次数。
两字词的编码前两码取第一字的双拼,第三码取N,后两码取第二个字的双拼。如精神,精的双拼是JL,神的双拼为IR,故编码为JLNIR。
三字词前两码依次取前两字的双拼的首码,第三码取N,后两码取第三个字的双拼。如计算机,“计算”双拼的第一码分别为JS,“机”的双拼为JI,故“计算机”的编码为,JSNJI。
四字及四字以上词组依次取该词前两个字和最后两个字双拼的第一码作为1、2和4、5码,第三码为N,例如计算机系,依次取J、S、J、X作为1、2、4、5码,则该词组的编码是JSNJX。又如中华人民共和国,取“中华和国”双拼的音码A、H、H、G作为1、2、4、5码,该词组的编码为AHNHG。“计算机学报”的编码JSNXB
4.第三码以数字表示,共5码,当第三码为数字时进入词组库查找。
二字词,第三码用2取代N,其它编码同方法3。同理,三字词,四字词分别以3、4取代位于第三码的N,其它位置的编码同方法3。例精神JLZIR;计算机,JS3JI;复旦大学,FD4D经。
五字词到八字词,分别取前两字的第一个音码作前两码,第三码取5,后两码取最后两个汉字的第一个音码。如中华人民共和国,AH5HG;中国工商联,AG5IL
八字以上词第三码取6,依次取前两个字和后两个字的第一个音码作为第一二四五码。如中国北京国家专利局,AG6LJ。七块慧星碎片撞击木星,QK6MX
专业词库第三码分别取1、7、8、9时,分别设立几个专业词组库,以供用户使用。例如,第三码取1时,编码的词组全部为经济法律方面的词组,依次类推可以设工程技术、信息科学、生命化学、文学艺术四个分词库,面向不同的用户。专业词库仅适用于方法2,4。
本发明提出的阳码同样可以设置一级和二级简码。
一级简码以出现率频率最高而通常又不组成词组的单字26个(自成口诀、非常便于记忆)按键盘字母顺序
QWERT(民以食为天) YUIOP(不是正经人) ASDFG(的地得了也) HJKLM(你我和他们) ZXCVBN(在中国要有这)
以上一级简码汉字可由对应编码字符加上空格键选出。如民的一级简码为Q,以的一级简码为W。
二级简码二级简码阳码建议以双拼中笔划最少的字中选一个使用频率高的汉字作为二级简码。这样用户可以免去记忆之苦,凭印象即可选出简码字。
阳码还提供了对一些不常用汉字进行单独编码的方法。即取前两码为该字的双拼,第三码为数字“0”,第四码的经度取该字首笔笔划的度数,纬度为该字次笔笔划的度数,这样第四码就唯一确定了。
这些不常用字可以是GB231280基本字集中规定的6763个汉字以外的一些字。这样就有效地降低了重码。
本发明提出的音形经纬码(阳码)及其计算机汉字输入方法与现有汉字编码系统及其汉字输入方法相比,具有明显的优越性。
字词共容,具有庞大的普通词组库和专业词组库,输入时字词之间无需换挡,巧妙地利用了“N”或数字为标志,单字和词组不重码,汉字输入速度完全可以和西文相媲美,解决了中文资料输入慢的矛盾。
采用拼音和字形相结合的编码方法,每个字的编码分别由两个音码和两个形码组成,音码采用了CCDOS的双拼,为了方便用户只对少数键位进行了调整。形码则完全摒弃了以往汉字编码用字根的作法,形象地引进了经度和纬度的概念。只根据笔划和特征字型来与经纬度相对应,而每一对经纬度都与唯一的键盘字母键相对应,这样既便于理解,又可以免去记忆字根之苦。形码的记忆量相当少,因而又容易学。其次,本方法的重码率很低。双拼相同字如果不超过80个的话,基本上不出现重码,而双拼相同的汉字很少多于80个,其中常用汉字就更加不会超过80个,所以重码率非常低。既使出现重码,发明人设置了用声音揭示输入者出现重码的办法,这样可以实现无重码时盲打,出现重码时则提示。极大地方便了用户。使它不仅适合于专业输入人员,更适合于普通的电脑使用者,具有很强的适用型和科学性。既简单易学,输入又快、重码少。较好地解决了汉字编码长期以来存在的易学则重码多,重码少则难学的难题。
综上所述阳码具有以下特点
1.编码规则简易明确,易学易记,便于熟练掌握。
2.编码容量大,单字容量可达单字26×26×25×25个。常用汉字GB231280规定的6763汉字基本很少重码,这6763个汉字以外的字则单独编码,其标志是第三码为数字“0”。词组容量则更大。
3.编码具有唯一性,重码率低,具有简便的重码提示法。字词之间,常用字和不常用字之间无重码。
4.完全采用26个英文字母编码,操作方便。
5.单字击键最多4次,词组则每个字不到2次。
6.词组功能强。
7.二级简码的选取以该双拼双音中笔划最少的字,如果出现笔最少的字有两个以上时,选取出现频率最高的一个,这样使用二级简码时,一般用户只要凭感觉就可以,免去了记忆之苦。
权利要求
1、一种音形经纬码计算机汉字输入方法,包括汉字编码和输入键盘设计两个部分,键盘上的英文字母键的排列次序各行从左到右依次为Q、W、E、R、T、Y、U、I、O、P;A、S、D、F、G、H、J、K、L、;Z、X、C、V、B、N、M,其特征在于,键上还标有该英文字母对应的韵母或声母,以及表示经度和纬度的两个数字,其中键上字母和韵母或声母以及经纬度的对应关系列表如下
2、根据权利要求1所述的计算机汉字输入方法,其特征在于汉字单字用4个英文字母码编码,前2个为由汉字双拼双音组成的音码,后2个为表示该单字笔划和字型特征的经纬码组成的形码,其中
(1)音码是以汉字的声母字母作汉字的第一个码,没有声母的字用V作为第一个码,以汉字的韵母对应的代码字母作为该单字的第2个码,具体代码表如下
(2)形码是以汉字书写的第一笔的度数为经度,第二笔的度为纬度,该经纬度对应的英文字母为第3码,以汉字末笔笔划的度数为经度,该字所属特征字型的度数为纬度,取这经纬度对应的英文字母作为第4码。其中
-汉字笔划归纳为5种横、竖、撇、捺、折,其对应的度数依次为1、2、3、4、5,
-汉字的特征字型也归纳为5种
①凡首笔或末笔包含部首目、月、氵、木的字;
②凡首笔或末笔包含部首禾、口、扌、讠、石的字;
③凡字型由左右分离的几个部分组成的字;
④凡字型由上下分离的几个部分组成的字;
⑤混合型字,即非前4种类型的字;
其度数依次为1、2、3、4、5。
3、根据权利要求1或2所述的计算机汉字输入方法,其特征在于汉字词组采用4个字母编码,以字母N作为标记码,放在第3码
-两字词的偏码前两码取第一个字的双拼,第4码取第二字的第一音码;
-三字及三字以上的编码第一、二、四码依次取第一、第二和最后一个字的双拼第一码
4、根据权利要求1或2所述的计算机汉字输入方法,其特征在于汉字词组采用4个码,其中以数字作为标记码,放在第3码;
-两字词的编码前两码取第一个字的双拼,第三码取数字2,第四码取第二字的第一个音码;
-三字及三字以上的词编码第一、二、四码依次取第一、第二和最后一个字的双拼的第一码,第3码取法如下三字词取3,四字词取4,五到八字词取5,八字以上的词取6。
5、根据权利要求1或2所述的计算机汉字输入方法,其特征在于汉字词组采用5个字母编码,以字母N作为标记码,放在第3码;
-两字词的编码前两码取第一字的双拼,最后两码取第2个字的双拼,第三码取N;
-三字词的编码前两码依次前两个字的双拼的第一码,后两码取第三个字的双拼,第三码取N;
-四字及四字以上的词的编码第一、二、四、五码依次取前两两个字和最后两个字的双拼的第一码,第三码取N。
6、根据权利要求1或2所述的计算机汉字输入方法,其特征在于汉字词组采用5个码,其中以一个数字作为标记码,放在第3码;
-二字词的编码前两码取第一字的双拼,第3码取数字2,最后两码取第2个字的双拼;
-三字词的编码前两码依次取前两个字的双拼的第一码,第3码取数字3,最后两码取第三个字的双拼;
-四字及四字以上词的编码前两码和最后两码依次取前两个字和最后两个字的双拼的第一码,第3码的取法如下四字词取4,五字到八字词取5,八字以上词取6。
全文摘要
本发明是一种以音形经纬码为基础的计算机汉字输入方法。其计算机输入键盘中的26个英文字母键上标有专门设计的与英文字母对应汉字拼音的韵母或声母以及经纬度。其汉字编码采用汉语拼音和字型特征相结合的方法,用26个英文字母编码单字的编码由4个字母组成,第两码为音码,后两码为形码。词组的码由4个或5个字母或数字组成。第3码为字母N或一位数字作为词组的特征码。本发明编码容量大、重码率极低,而且易学、易记,有利于计算机的准确、快速的汉字输入。
文档编号G06F3/023GK1107593SQ9411226
公开日1995年8月30日 申请日期1994年8月16日 优先权日1994年8月16日
发明者杨茂成 申请人:杨茂成
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1