音划中文输入法的制作方法

文档序号:6572006阅读:276来源:国知局
专利名称:音划中文输入法的制作方法
技术领域
音划中文输入法涉及一种适用于数字键盘的音形结合的中文输入法。
背景技术
目前,在针对数字键盘的汉字输入领域广泛应用的方法主要有两类1、 以字形定码的输入方法,其重码少,但是难学易忘;2、以音定码的输入方 法,其学习容易,但是重码多,部分音容易混淆,输入速度慢。这些方法都不能兼备简单易学和重码率低的优点,因而需要改进。

发明内容
本发明的目的在于公开一种简单易学而又重码率低的中文输入法,该输 入法适用于手机、收银机等使用数字键盘输入中文的场合。为达到上述目的,本发明提供如下的技术方案利用拼音和少量笔划相 结合输入汉字,在拼音码后面按照笔顺附加笔划码进一步区分同音字。拼 音包括声母和韵母;构成汉字的笔划分成基本笔划、复合笔划和复合部件。基本笔划分为5种,分别是、(点)、 一 (横)、I (竖)、7 (斜) 和折。复合笔划也分成5种,分别是复合点、复合横、复合竖、复合斜、 复合折。(1) 点、,如i和^的第一笔,?的第一、二笔,?的第一、二和 三笔,热的最后四笔"、、等。(2) 横 一,从左到右或从左下到右上的直笔划。如"十"中的第一 笔,"t "中的第一、三笔,纟的第三笔等。横还包括横勾",如一中的第二笔。(3) 竖I ,从上到下的直笔划,如十的第二笔,竖还包括左竖勾和 右竖勾,如J ,U的第一、二笔。(4) 斜包括撇和捺。撇7,从右上到左下的笔划,如〗的第一笔, 《前两笔,乡的三笔。撇还包括j ,如"川"的第一笔。捺,从左上到右 下的笔划。如"人"的第二笔。(5)折如L,卩、厶、7、 [S的第一笔,"弓"的第一笔,门、勺 的第二笔,"包"的第二笔,"红"的第一、二笔等。 例如,下面这些字按照笔顺可以拆分成 中竖,折,横,竖。 下横,竖,点。 山竖,折,竖。复合笔划由两个及两个以上同属一类并且笔顺连续的基本笔划构成,包 括复合点、复合横、复合竖、复合斜和复合折共5种; 下面是几个复合笔划的具体例子V、 7 、 ? 、 、k、,、、、复合点〈〈〈复合折乡复合斜人复合斜三复合横 lj:复合竖 下面是汉字中复合笔划的几个实例"汰"的前三笔都属于同一基本笔划、,且书写次序相连,符合复合笔 划的一致性和连续性条件,所以是复合点。它的最后一笔也是、,但是与 前面三点笔顺不连续,所以不是复合点,而是基本笔划点。按照书写顺序, 它的第五、六两笔符合一致性和连续性条件,构成了复合斜。"汰"的全部 笔划依次是点(复合)、横、斜(复合)、点。复合笔划并不局限于偏旁 部首,下面是非偏旁笔划的例子月斜,折,横(复合)。川斜,竖(复合)。红折(复合)、横(复合)、竖、横。空点(复合)、横、点(复合)、横、竖、横。复合部件是汉字中出现频率非常高的,且由两个及两个以上基本笔划或 复合笔划构成的笔划结构,是一个不可分割的整体,和基本笔划、复合笔划一样,也是构成汉字的基本单元。经过大量的分析研究,提取出下列5个复合部件 (1 )由任意个横和任意个竖交叉且笔顺连续所组成的部件称为横竖交 叉部件。如十,净,丰,*,此部件还包括其它结构,在此不一一列举。(2) 四面包围和缺口向下的三面包围。共有口, 口,门,"月"字外面 的三面包围结构四种。(3) 由任意个点和任意个横按照点先横后的笔顺构成,且笔顺连续的复合部件称为点横复合部件如i, a, ^, A,符合定义的其它形式还 有很多,不一一列举。(4) 由任意个折和任意个横(点)按照折先横(点)后的顺序构成且 笔顺连续的部件称为折横、折点部件。如乡,7,厶,幺,符合定义的 其它形式还有一些,不一一列举。(5) 由任意个斜和任意个横(竖)按照任意笔顺构成,笔顺连续,斜与横(竖)必须相交或相连的部件称为斜横、斜竖部件。如〃,々,4 , ,,符合定义的其它形式还有很多,不一一列举。复合部件、复合笔划、基本笔划是构成汉字的基本元素,也是汉字拆分 的基本单位。拆分汉字时,复合部件优先,复合笔划其次,基本笔划最后。当可以拆成复合部件时,不要拆成复合笔划或基本笔划;可以拆成复合笔 划时,不要拆成基本笔划。例如"王"按笔顺既可以拆成横(复合)、竖、 横,也可以拆成横、横竖交叉、横,正确的拆字方法是后一种。复合部件具有不相交性,即它不能和不属于此复合结构的其它笔划相 交,如果相交,则不能视为复合结构。譬如"西"中的"口"和"儿"相 交,所以不具有不相交性,它就不是包围复合部件,"西"的笔划为横、竖、折、撇、折、横。再比如"牛"不能拆为撇横复合部件,因为其与竖相交,"牛"只能拆为撇、横竖交叉。"中"应该拆为竖、折、横、竖。 而不是拆为包围、竖。复合部件可以与其它笔划相连,如"广"可拆为点 横部件,斜。复合笔划可以与其它笔划交叉,例如,"毛"字可拆为斜,横(复合),折。复合部件首笔的笔顺即为整个复合部件的笔顺。例如,"面"按顺序, 笔划为横撇结构、包围部件、竖(复合)、横(复合)。无论构成拼音的声母和韵母有几个字符,作为整体只指定一个码,声母 码或韵母码作为基本单元, 一次性地输入。汉语拼音中容易混淆的发音有巻舌音和平舌音,前鼻音和后鼻音,为了 减少混淆带来的不便,并减轻记忆负担,对键盘布局作如下设计巻舌音 和平舌音指定同样的键码,前鼻音和后鼻音指定同样的键码,其它声母、 韵母按规律分布。具体安排如下-所有声母码元都安排在数字键盘的2 9共8个键上,它们的键盘布局 如图l所示b,c,ch 2 d,f 3 g,h 4 j,k,l 5m,n,p,q 6 r,s,sh 7 t,w,x 8 y,z,zh 9其规律是易混淆的巻舌音ch, sh, zh分别与平舌音c, S, z指定同样 的按键2, 7和9;大部分声母的键位与英文字母的键位相同,只有p, q, w, x四个声母的位置相对英文字母前进了一位。汉语共有三十多个韵母,将它们都安排在数字键盘的0、 2 9共9个键 上。韵母根据其首字母类型,可以分为五类首字母为a的韵母共5个, 首字母为e的韵母共4个,首字母为i的韵母共10个,首字母为o的韵母 共3个,首字母为u包括U的韵母共13个。它们的键盘布局如图2所示 a,ai,ao 2 an,ang5 e,ei 3 en,eng 9i,ia,ie,iao,iou,iong4 in,ing,ian,iang 7o,ou,ong 6 u,ua,uo,uai,uei 8uan,uang,uen,ueng,ti, lie, iian, tin 0其规律是1,只有o类韵母是全部指定在一个键上;2其它每一类韵 母都指定在两个键上,其中一个键是这类韵母中的前鼻音和后鼻音,另一 个键是同类其它韵母,同类其它韵母的位置都分布在相应的英文字母所在 的键位上,而前鼻音后鼻音键的位置对a类、i类、u类韵母来说,是在正下方相邻的键位上,对e类韵母是下方隔一个的键位上。每个汉字的编码一般为4个,包含两部分,拼音码和笔划码,拼音码也 有两部分,声母码和韵母码,分别代表拼音中的声母和韵母;笔划码的长 度一般为2,分别代表两个笔划。一般情况下,拼音码部分是由声母码和韵母码构成的,有极少数汉字的 拼音没有声母,只有韵母,那么它的拼音码由韵母码加韵母码构成,即韵 母码重复两次,补足两个。常见汉字的笔划虽然可能有很多,但是笔划部 分一般只取其中的两个,少数汉字只由一个笔划构成,将它的唯一笔划码 重复两次,补足两个。常见汉字的笔划码部分的构成有下面几种情况左右结构汉字按笔顺取左边部分的第一笔,按笔顺取剩下右边部分的 第一笔。上下结构汉字按笔顺取上边部分的第一笔,按笔顺取剩下下边部分的第一笔。其它结构汉字按笔顺取前面两笔。本发明的有益效果在于笔划可以有效弥补拼音的不足,对拼音无法区 别的同音字,笔划能容易地区分,同时,由于笔划数较少,不会增加拆字 的难度和错误率。经过充分的分析研究而提取出来的复合部件,具有概括 性高、出现频率高、易于识别的优点,能显著提高编码的效率,降低重码 率。复合部件的数量少,容易记忆。把易混淆的发音安排在同样的按键上, 用户不需要明确地区分它们,即使发音不准也不容易出错,相似的发音安 排在相邻的按键上,具有规律的键盘布局,有效减轻了用户的记忆负担。 所以,它既有音码容易掌握、反应快的优点,又有形码效率高的优点。


附图l为声母的键盘分布图。 附图2为韵母的键盘分布图。 附图3为笔划的键盘分布图。实施方案下面结合附图和实施例对本发明的原理作进一步的说明,但并不因此而 限定本发明的保护范围。 基本编码规则是l汉字编码通常有4部分,分别是拼音声母码、拼音韵母码、第一笔划 码、第二笔划码;对拼音只有韵母,没有声母的汉字,这4部分是拼音韵 母码、拼音韵母码、第一笔划码、第二笔划码,即韵母码重复两次,补足 4个;由一个基本笔划或复合笔划或复合结构构成的汉字,这4部分是拼 音声母码、拼音韵母码、第一笔划码、第一笔划码,即这个笔划码重复两 次,补足4个。2对于左右结构的汉字,先取左边部分的第一笔,再按从左到右的顺序 取右边部分的第一笔;对上下结构的汉字,先取上边部分的第一笔,再按 从上到下的顺序取下边部分的第一笔;对其它汉字,按笔顺取前面两笔。3笔划分成三类基本笔划、复合笔划、复合部件。 下面是一些编码规则的具体例子 只有韵母,没有声母的汉字阿a、 a、折、横。 只有一笔的汉字一y、 i、横、横。 左右结构汉字的d、 e、斜、斜。部b、 u、点横复合部件、折。隔g、 e、折、横。 上下结构汉字音y、 in、点横复合部件、包围复合部件。安an、 an、点横复合部件、折。是sh、 i、包围复合部件、横。 其它类型汉字不b、 U、斜横复合部件、竖。同t、 ong、包围复合部件、横。两1、 iang、横、竖。这zh、 e、点横复合部件、复合斜。声母和韵母的键盘布局分别如图1,图2所示。5个基本笔划、5个复合笔划和5个复合结构安排在数字键盘的10个数 字键上。基本笔划和相应的复合笔划指定相同键位,键盘布局如图3所示, 如下-基本横、复合横1键; 基本竖、复合竖2键; 基本斜、复合斜3键; 基本点、复合点4键; 基本折、复合折5键; 斜横、斜竖部件6键; 点横部件7键; 折横、折点部件8键; 横竖交叉部件9键; 包围部件0键。 下面是以上汉字对应的键盘编码阿2、2、5、lo~9、4、1、1。的3、3、3、3。部2、8、7、5。隔4、3、5、lo音.9、7、7、0o安:5、5、7、5。是7、4、0、lo不:2、8、6、2。同8、 6、 0、 lo 两5、 7、 1、 2。 这9、 3、 7、 3。在输入单个汉字时,先输入拼音,再按照上述笔划拆分方式,找到两个 正确的笔划输入,在同音字中找到目标汉字。每当按键4次后,屏幕上出 现所有对应的汉字,这些字,按在汉语中出现的频率由大到小依次排列, 光标停在频率最大的汉字上,这个字为默认汉字,如果要输入其它位置的 汉字,按箭头键移动光标到目标汉字,再按选取键选取这个字,即可完成 一个汉字的输入。当然,如果不到4键就出现了目标汉字,也可以立即按 选取键选取它。例如,输入"大"的拼音和笔划分别为d,a,斜横部件, 斜。对应的按键顺序为3、 2、 6、 3,再按选择键。如果想输入两字词组,先输入两个字的编码,在屏幕上出现的对应词组 中,移动光标到目标词组,再按左键选取即可。例如输入"中国"这个 词组,"中"字的拼音和笔划分别为zh,ong,竖,折,其对应的键盘编码 为9、 6、 2、 5。"国"的拼音和笔划分别为g,uo,包围部件,横,其对应 的键盘编码为4、 8、 0、 1。"中国"对应的按键顺序为9、 6、 2、 5、 4、 8、 0、 1,再按选择键。三字词组要先输入三个字的编码,再按选择键。更 多字的词组依此类推。利用词组输入技术可以更进一步降低重码率,明显 提高效率。还可以引入学习功能,长按"弁"键后放开,则光标所在汉字的应选取 的笔划就显示在屏幕上。"#"键也是万能键,当不知道汉字某一位的编码 时,也可以长按键代替不清楚的拼音码或笔划码,接着继续输入后 面所有的编码即可。
权利要求
1. 一种适用于数字键盘的中文输入法,利用拼音的声母和韵母以及笔划相结合输入汉字,其特征在于构成汉字的笔划分成基本笔划、复合笔划和复合部件。基本笔划只有一个笔划,包括点、横、竖、斜和折共5种。其中,横指从左到右或从左下到右上的直笔划,横还包括横勾乛;竖指从上到下的直笔划,竖还包括左竖勾和右竖勾;斜包括撇和捺,撇还包括丿。复合笔划由两个及两个以上同属一类并且笔顺连续的基本笔划构成,包括复合点、复合横、复合竖、复合斜和复合折共5种;复合部件是由两个及两个以上基本笔划或复合笔划构成的笔划结构,是一个独立的整体,和基本笔划、复合笔划一样,也是构成汉字的基本单元,复合部件共有5个。复合部件具有不相交性,如果和复合部件之外的笔划相交,则不能视为复合结构。拆分汉字时,复合部件优先,复合笔划其次,基本笔划最后。复合部件首笔的笔顺即为整个复合部件的笔顺。
2. 根据权利要求1所述的数字键盘中文输入法,其特征是每个汉字的编码长度都为4,拼音部分只 有韵母的汉字,包含两个韵母码和两个笔划码;只有一个笔划的汉字,包含一个声母码, 一个韵母码,笔 划码重复两次;其它大多数汉字,包含一个声母码, 一个韵母码,第一笔划码,第二笔划码。对于左右结构的合体字,先取左边部分的第一笔,再按从左到右的顺序取右边部分的第一笔;对上下 结构的合体字,先取上边部分的第一笔,再按从上到下的顺序取下面部分的第一笔;对其它字,按笔顺取 前面的两笔;
3. 根据权利要求1所述的数字键盘中文输入法,其特征是由任意个横和任意个竖交叉组成且笔顺连 续的部件称为横竖交叉复合部件。
4. 根据权利要求1所述的数字键盘中文输入法,其特征是四面包围和缺口向下的三面包围称为包围 复合部件。
5. 根据权利要求1所述的数字键盘中文输入法,其特征是由任意个点和任意个横按照点先横后的笔 顺构成,且笔顺连续的复合部件称为点横复合部件。
6. 根据权利要求1所述的数字键盘中文输入法,其特征是由任意个折和任意个横或点按照折先横或 点后的笔顺构成且笔顺连续的部件称为折横、折点复合部件。
7. 根据权利要求1所述的数字键盘中文输入法,其特征是由任意个斜和任意个横或竖按照任意书写 次序构成,笔顺连续,斜与横或竖必须相交或相连的部件称为斜横、斜竖部件。
8. 根据权利要求1所述的数字键盘中文输入法,其特征是l巻舌音ch, sh, Zh分别与平舌音c, S, z 键位相同,大部分声母的键位与英文字母的键位相同,只有p, q, W, X四个声母的位置相对英文字母前 进了一位;2只有o类韵母是全部指定在一个建上,其它每一类韵母都指定在两个键上,其中一个键是这 类韵母中的前鼻音和后鼻音,另一个键是同类其它韵母,同类其它韵母都分布在相应的首字母所在的键位 上,而前鼻音后鼻音在键盘上的位置对a类、i类、u类韵母来说,是在正下方相邻的键位上,对e类韵母 是下方隔一个的键位上。所有声母都安排在数字键盘的2 9共8个键上,它们的键盘布局如下所示 b,c,ch 2 d,f 3 g,h 4 j,k,l 5m,n,p,q 6 r,s,sh7 t,w,x 8 y,z,zh 9汉语共有三十多个韵母,将它们都安排在数字键盘的0、 2 9共9个键上。韵母根据其首字母类型, 可以分为五类首字母为a的韵母共5个,首字母为e的韵母共4个,首字母为i的韵母共10个,首字母 为o的韵母共3个,首字母为u包括tl的韵母共13个。它们的键盘布局如下所示a,ai,ao 2 an,ang5 e,ei 3 en,eng 9i,ia,ie,iao,iou,ioiig4 in,ing,ian,iang 7o,ou,ong 6 u,叫uo,uai,uei 8uan,uang,uen,ueng,U, Ue, Uan, 加 0
全文摘要
本发明涉及一种汉字输入法,它结合汉字的拼音和笔划输入汉字。汉字的笔划分成基本笔划、复合笔划和复合部件。基本笔划是点、横、竖、斜、折;复合笔划是复合点、复合横、复合竖、复合斜、复合折;复合部件是横竖交叉复合部件、包围复合部件、点横复合部件、斜横斜竖复合部件、折横折点复合部件。汉字的编码长度为4,前面两个是声母码和韵母码。后面两个笔划码对于左右结构的字,是左边部分的第一笔和右边部分的第一笔;对上下结构的字,是上边部分的第一笔和下面部分的第一笔;对其它字,是前面的两笔。容易混淆的声母或韵母安排同样键位,相似的声母或韵母有规律地安排键位。本输入法具有拆字规则简单、容易记忆、重码率低的优点,适用于计算机、手机、收银机、PDA上数字键盘的中文输入。
文档编号G06F3/023GK101236457SQ200710028680
公开日2008年8月6日 申请日期2007年6月15日 优先权日2007年6月15日
发明者胡世曦 申请人:胡世曦
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1