字词句组合汉字输入方法

文档序号:6600512阅读:599来源:国知局
专利名称:字词句组合汉字输入方法
技术领域
本发明专利由声母码、韵母码、部首码、笔画码、字词组合码和句子组合码构成,属于计算机汉字输入技术领域。
现有的汉字输入法可分为三类音码(如,拼音、联想、拼音语句、自然码)、形码(如,五笔字型、郑码)、音形码(如,五分钟码、飞两笔码)。音码有两个难以克服的问题,一是对不认识的字不能输入,二是重码多。形码难以克服的问题是对不会写的字无法输入,对于每个字都要拆分,还要记住每个字的部首用什么字母代替。音形码大都以字的声韵母和字的部首或笔画混合编码,同时存在对不认识的字和不会写的字均难以输入。
本发明的目的是为了避免以上所述的不足之处,现提供一种字词句组合汉字输入方法。本方法对国家标准(GB2321-80)汉字字符集进行混合编码,用户只要记住每个汉字的三种基本编码音码、部首码、和笔画码,在输入汉字时,对这些编码进行组合,就能输入几十万条词汇和国标字。
1.音码将每个汉字的拼音分为两个独立部分,第一部分为声母S,用24个符号表示,第二部分为韵母Y,用17个符号表示。它们分别为S=(b,c,d,f,g,h,j,k,l,m,n,p,q,r,s,t,v,w,x,y,z,],′,/}Y={1,2,3,4,5,6,7,8,9,0,-,=,a,e,i,o,u}其中每个符号与拼音字母之间的关系为编码Sb c d f g h j k l m n p q r s t v w x y z ] ′ /| | | | | | | | | | | | | | | | | | | | | | | |声母 b c d f g h j k l m n p q r s t w x y z zh ch sh其中v对应为不发声的零声母。编码Y1 2 34 56 7 8 90 -= a e i o u| | || || | | || ||| | | | |韵母 ai an uan ei ang ao en in ing ou eng ong a e i o uuai ian ui iang iao er un iou ueng iong ia ieuo uuang üe
2.部首码X对GB2321-80汉字设立40个部首和五种笔画,每个部首、笔画和它们的编码X之间的关系如下金钅木水氵火土,日月山石 方匚冂凵j m / h t r y / / f女 王衣衤礻 食饣 足 ,犬犭 虫马牛牜 羊 n w y s z q ′m n y人亻手扌 □ 耳阝 目,鱼米禾草艹 竹r t k v m y m h c ]心忄病疒 车 门广厂 ,言讠 丝纟 宝宀冖二 两亠冫丷x b ′ m g y j b v l点丶 横一 竖丨 亅撇丿折 乛乙ㄑj h /p ]每个部首、笔画和它们的编码之间的对应关系是部首、笔画和它们的拼音的声母的编码对应。即每个部首、笔画都可以对应到S中的一个符号。
3.笔画码B对每个汉字的最后一笔设立笔画编码B,B和笔画之间的对应关系如下笔画码B。; \ ,[笔画 点丶 横一 竖丨 亅撇丿折 乛乙ㄑ4.字词组合码设F={0,1,2,3,4,5,6,7,8,9,-,=}复韵母码集;D={a,e,i,o,u}单韵母码集;B={。,;,[,\,,}笔画码集;G={a,b,c,d,e,f,g,h,i,j,k,l,m,n,o,p,q,r,s,t,u,v,w,x,y,z,],′,/,}首码集;Y={0,1,2,3,4,5,6,7,8,9,-,=,a,e,i,o,u}韵母码集;S={b,c,d,f,g,h,j,k,l,m,n,p,q,r,s,t,v,w,x,y,z,],′,/}声母码集;X={b,c,d,f,g,h,j,k,l,m,n,p,q,r,s,t,v,w,x,y,z,],′,/}部首码集;K空格;a小写字母a;则有如下16种组合汉字编码
编 第 第 第 第 字一 二 三 四 与号 码 码 码 码 词1 G K 高频字12 D F 高频字23 S Y 二码字4 S Y X K三码字5 S Y X X四码字16 D G 高频二字词17 S S 次高频二字词8 S S S K三字词9 S S S S四字词10 S S S Y多字词11 S Y S Y二字词12 X X B 不认识的字13 X X B S四码字214 G B 高频二字词215 S S S B三字词16 a F 各种符号5.句子组合码句子组合码以`符号打头,后面是以上16种编码的任意组合,回车符是句子组合编码的结束符,句子的编码最长为250个字符。
本发明与已有技术相比的优点如下①易学性好,普及率高,因为我国小学生对拼音已经完全掌握,只要知道字的发音就能输入汉字。
②编码短,速度快,字词句组合输入,80%用词组和高频字输入。
③打字与构思一致,因为人是以词和语句进行思维的,字词句输入是以词句为主导,词组的数量不受限制,一般文章可以达到70%的内容用词组输入,所以打字时能与构思基本一致。
④对不认识的字(用编号12)和不会写的字(用编号3)都能输入,对于不认识的字,可以输入该字的两个部首码和最后的笔画,就可以找到。对于写不出来的字可以用两码拼音和翻页符`即可输入。
⑤词组编码由计算机自动生成,根据6763个字的音码、部首码、笔画码,词组编码生成器是根据词组文件(用逗号把词组隔开的文本文件),自动识别二字词、三字词、四字词和多字词,然后对它们进行编码,最后将词组和编码有序地存入字词句知识库中。
⑥用户可以用自己的专业词组文件,自动建立用户自定义词库。
⑦高频字和和高频词可由用户定义和修改。
本发明的附表表面说明表1.计算机键盘与编码对应表。
表2.输入形式和识别出来的字、词和符号表。
表3.一码+空格输入的高频字与键盘对应表。
表4.二码高频字码表;表5.高频二字词码表本专利的附表结合实施例作如下详述表1
注该键盘为计算机英文标准键盘。
表2
表中的大写字母表示如下内容F={0,1,2,3,4,5,6,7,8,9,-,=}复韵母码集;D={a,e,i,o,u}单韵母码集;B={。,;,[,\,,}笔画码集;G={a,b,c,d,e,f,g,h,i,j,k,l,m,n,o,p,q,r,s,t,u,v,w,x,y,z,],′,/}首码集;Y={0,1,2,3,4,5,6,7,8,9,-,=,a,e,i,o,u}韵母码集;S={b,c,d,f,g,h,j,k,l,m,n,p,q,r,s,t,v,w,x,y,z,],′,/}声母码集;X={b,c,d,f,g,h,j,k,l,m,n,p,q,r,s,t,v,w,x,y,z,],′,/}部首码集;K空格;a小写字母a;表中编号为3、7、12、16的输入形式需要在提示行上选择编号,字词才能到达光标位置。编号为17的输入形式是句子输入,在句子输入中,组合编码可以是表中的16种输入形式的组合,若其中某种输入形式有重码,则取其频度最高的字或词。由此可见,利用2到4位符号对字词混合编码并用这些编码的组合进行汉字输入,就是字词句组合汉字输入方法。利用这种方法,可以进行各种各样的字词句输入。例如,打入rm,提示行显示为“字词句rm人民1任命2人命3认命4人们”,再打入空格,“人民”就到达光标处;若打入的是r7m7,“人们”就直接到位;打入zmy,“怎么样”到位;打入ymdx,“一马当先”到位;打入]hro,“中华人民共和国”到位。若用句子输入,输入编码`]hro/i g wd d oj,“中华人民共和国是一个伟大的国家”立即显示到当前光标位置。
表3
这29个字都与声、韵母有关系,易于记忆。高频字还可以根据用户的要求,由用户自行定义和修改。例如,输入“我是一个工程师”,其编码为o/igg′/。
表4第二码0 1 2 3 4 5 6 7 B 9- =第i零一二三四五六七八九减等一e走爱看年对想老问进请能送码o后来难便最上到分民并生从u头才办还美将好文心行成容这48个高频字输入方便,还可以根据用户的要求,由用户自行定义和修改。例如,输入“一九九五年一月二十三日”,其编码为i1 i9i9 i5 e3 ilye i2 /i i3 ri。
表5第二码a b c d e f g h i j k l m n oa妈妈打败下策发达大学下发那个发挥大力差距罚款大量发明国内假若第e可怕个别决策这点别的设法结果结合可是了解何况可怜科目河南接着一i其它一般自从必定一些十分提高合适一起比较立刻系列什么智能至多码o扩大货币过错活动获得过分若干说话国际国家国库过来琢磨模拟我国u不怕出版不错取得组合部分不过任何不利数据许可出来父母去年祖国第二码p q r s t u v w x y z ] ′ /a打破之前加入加速大体不怕狭隘把握大小大约沙子大致发出下去第e和平的确责任特色课题特殊热爱格外可行科研协作接着列车也是一i支配机器必然比赛集体记录治安之外实现只要实在始终支持及时码o活泼夺取火热火速昨天多余没有错误多谢作用错字多种火车多少u出品富强出入输送物体不如女儿鼓舞出现主要复杂组织输出于是第一码a b c d e f g h i j k l m n第。大会必然错误大致解决复杂过来会议机会将来考虑论文命令难受;发言把握操作答应个体反正工业混合集团介绍空间理由没有那里二\ 他们辨别猜测到底这种仿佛刚刚混合季节渐渐空前流利明确能干,大力补助财物带动竭力辅助改动货物极力景物矿物劳力密切能力码[ 爸爸摆脱措施大地和气发起工艺环境记忆讲究慷慨理论面貌内地第一码o p q r s t u v w x y z ] ′ /第。妥协朋友取得任意损失同意于是安装无数小心因为组织之外长度事实;所有配备恰恰任何思维统一语言安全万一详细引用左右真正出差时期二\ 合乎批判欺骗若干送行疼痛不用案件慰问现行引用作用之中常用上升,脱离迫切确切任务散步特务努力恶劣唯物行动悠扬总务震动出动生动码[ 我们脾气恰巧入党死亡统统如今恶化委托兴起医院总统住宅出色实施这290个二字词在汉字输入中是最快的,每个词只需输入2码,不需加空格,该词就直接到达光标位置。例如,输入“因为我们的论文在理论方面解决了这种复杂问题,所以他们必然要我们在大会发言”,其编码为y.omd l.z l[fm e.l e\f.wt,sy a\b.y omz a.f;。上例中共有36个字,相应编码是44个,除去8个空格,正好36个符号。
对表中编码和词的对应,可以分两种情况来记忆①.第一个字的韵母都是以a,e,i,o,u构成的字,这样我们可以根据二字词的第一个字的韵母记忆第一码,第二码可以根据它的第二个字的声母来记忆。
②.第一码是与第一个字的韵母或声母有关,第二码与第二个字的笔画有关,这样就不难记住所有的高频二字词的代码了。
如果用户认为上述原则和规律还是难以理解和记忆可以根据自己的情况规定几条规定,重新安排这些高频字词,也可以改换其它的高频字词,但是输入编码是不变的。
权利要求
字词句组合汉字输入法,由声母码、韵母码、部首码、笔画码、字词组合码和句子组合码构成,其特征是由①.声母码S和声母的对应关系为编码Sb c d f g h j k l m n p q r s t v w x y z ] ′ /声母 b c d f g h j k l m n p q r s t w x y z zh ch sh其中v对应为不发声的零声母;
②.韵母码Y与韵母的对应关系为编码Y1 2 34 56 7 8 90 -= a e i o u韵母ai an uan ei ang ao en in ing ou eng ong a e i o uuai ian ui iang iao er un iou ueng iong ia ie uo üuang üe
③.部首码X与部首的对应关系为编码Xb c d f g h j k l m n p q r s t v w x y z]′/部首疒艹、方广火金口两木牛丿犬人食土二王心言足竹车水冖  匚厂禾钅 亠马女 犭亻饣士耳 忄讠 虫氵宀冂 一糸 冫目 日 手阝月  山凵纟 丷米 扌 衣  石 门 衤 乛 丨礻 乙 羊 ㄑ 亅鱼
④.笔画码B,它与汉字的最后一个笔画的对应关系为笔画码B。;\,[笔画点(丶,)横(一)竖(丨, ,亅)撇(丿, 折(,,乛,乙,ㄑ);
⑤.字词组合码设F={0,1,2,3,4,5,6,7,8,9,-,=}复韵母码集;D={a,e,i,o,u}单韵母码集;B={。,;,[,\,,}笔画码集;G={a,b,c,d,e,f,g,h,i,j,k,l,m,n,o,p,q,r,s,t,u,v,w,x,y,z,],′,/}首码集;Y={0,1,2,3,4,5,6,7,8,9,-,=,a,e,i,o,u}韵母码集;S={b,c,d,f,g,h,j,k,l,m,n,p,q,r,s,t,v,w,x,y,z,],′,/}声母码集;X={b,c,d,f,g,h,j,k,l,m,n,p,q,r,s,t,v,w,x,y,z,],′,/}部首码集;K空格;a小写字母a;则有如下16种组合汉字编码编 第 第 第 第 字一 二 三 四 与号 码 码 码 码 词1 G K 高频字12 D F 高频字23 S Y 二码字4 S Y X K 三码字5 S Y X X 四码字16 D G 高频二字词17 S S 次高频二字词8 S S S K 三字词9 S S S S 四字词10 S S S Y 多字词11 S Y S Y 二字词12 X X B不认识的三码字13 X X B S 四码字214 G B 高频二字词215 S S S B 三字词16 a F 各种符号
⑥.句子组合码句子组合码以`符号打头,后面是以上16种编码的任意组合,回车符是句子组合编码的结束符,句子的编码最长为250个字符。
全文摘要
本发明是一种字词句组合汉字输入方法,属于计算机汉字输入技术领域。该方法由声母码、韵母码、部首码、笔画码、字词组合码和句子组合码构成,它以拼音为基础,词句为主导,对字和词组进行音、形、笔画混合编码。该方法易学、码短、速度快,对不认识的字和不会写的字都能输入,平均码长为1.6键,词组的编码可以由计算机自动生成,词组量不受限制,可由用户扩充。高频字和高频词可由用户修改。
文档编号G06F3/023GK1143767SQ9510088
公开日1997年2月26日 申请日期1995年2月28日 优先权日1995年2月28日
发明者李先国 申请人:西北工业大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1