三键二笔输入法的制作方法

文档序号:6388415阅读:171来源:国知局
专利名称:三键二笔输入法的制作方法
技术领域
本发明涉及一种计算机汉字输入法,一种可广泛应用于计算机、个人数字助理PDA、手机以及其它一些含有汉字输入的数字终端的汉字输入方法。
背景技术
本人于1992年发明了汉字阴阳双极编码(后改名为二笔输入法),该专利申请后来应审查员要求分成了声形码、形码、声韵形码等几个分案,都先后获得了专利,专利号分别为ZL92111818.X、ZL96103708.3、ZL96103095.X。
该系列输入法基本解决了汉字输入中的易学与快速的矛盾。达到了10分钟左右可以学会,编码的重码率又低的效果。
以声形码为例该编码单字输入分独体字和合体字独体字=拼音首字母+第一二笔笔画+第三四笔笔画+第五笔笔画合体字=拼音首字母+第I半一二笔笔画+第II半一二笔画+第II半三四笔画每个字的最大码长为4键。
即,单字输入时,如遇独体字——则输入其拼音首字母和前五画,每两笔画取一键;如遇合体字——就一次性地将其一分为二,然后依次输入其拼音首字母、第一半的一二笔画、第二半的一二笔画、第二半的三四笔画。
经过10多年的实践,本人发现,虽然二笔声形码编码很规范,规则也很简单,重码离散也较好、速度较快,但是,许多的输入者对编码的第四键的取码非常地不适应。由于二笔声形码的第四键会取到独体字的第五笔画和合体字阳半的第三四笔画,用户非常地不适应。
比如1、独体字“重”,编码为Z+ 丿一
+ 丨_
+ (拼音首字母)(第一二笔画)(第三四笔画)(第五笔画)第四键需打到其第5笔画,一个字的第5笔画是什么笔画,相当地难找。
2、合体字“拗”,编码为A+
+ __
+ 丶_(拼音首字母)(第I半一二笔画)(第II半一二笔画)(第II半三四笔画)“拗”的第四键丶_让人十分难以理解,因为“拗”一分为二分成“扌”和“幼”,那么第II半的三四笔画就应该是“幺”的最后一笔画和“力”的第一笔画组成一个键,这种做法让人反应起来很慢,也很难形成条件反射,极大地影响了输入速度。
3、合体字“辖”,编码为X+ 一_+ 丶丶
+ _一(拼音首字母)(第I半一二笔画)(第II半一二笔画)(第II半三四笔画)同样,要取该字的右半部“害”的三四笔画组成一键,即“宀”的最后一笔画与“丰”的第一笔画组成一键,让人十分难以接受。
4、合体字“惝”,编码为C+ 丶丶+ 丨丶
+ 丿丨(拼音首字母)(第I半一二笔画)(第II半一二笔画)(第II半三四笔画)第四键需取其第二半的三四笔画来凑成一个键,非常的困难和别扭。
5、再如合体字“翘”,编码为Q+ 一_+ _丶
+ 一_(拼音首字母)(第I半一二笔画)(第II半一二笔画)(第II半三四笔画)第四键需取其第II半的三四笔画为一键,第II半的第三笔画是“习”的最后一笔画,第四笔画又是第二个“习”的第一笔画,这两个笔画要凑成一个键,非常别扭。
这些字由于太难拆了,不但给易学性带来了障碍,也给输入速度带来了一定影响。如何解决这个难题呢?发明内容原二笔声形码(ZL92111818)的输入方法是独体字=拼音首字母+第一二笔笔画+第三四笔笔画+第五笔笔画合体字=拼音首字母+第I半一二笔笔画+第II半一二笔画+第II半三四笔画每个单字输入的最大码长为4键。
独体字第4键要输入一个字的第五笔画,合体字第4键要输入一个字第二半三四笔画。
如何才能解决二笔声形码第四键拆分困难的问题呢?经过统计,二笔声形码的国标GB2312-80一级字库中,只有621个字需要第4键才能输入,并且这些需要4键才能输入的单字仅占总字频的3.5%;进一步分析,这600多字本身都不重码。于是,一个比较大胆的设想浮出水面——将这些编码的第四键用统一的一个键来代替,比如用“a”来代替所有的单字编码的第4键。如“狈”的编码“btgf”,换成“btga”。
结果如何呢?效果非常好,这些4码字中仅仅新产生出了几对重码。
也就是说,实际上所有的4码字的最后一个键都可以随意用一个键来代替。那么,这最后一个键是否可以省去不打呢?显然不行,因为这样会和那些用三键输入的字重码,如“狈”的编码“btgf”换成“btga”尚可,换成“btg”的话,就会和“备”字的“btg”编码相重了。
能否设计出一个方案,既使得这难输的第4键干脆不输入,又能适当地缩短打字的码长呢?技术解决方案经过长期实践和以上的研究,决定采用以下方法来解决这个问题。
1、将单字输入的编码规则改为单字的输入分为独体字和合体字输入,独体字=拼音首字母+第一二笔笔画+第三四笔笔画合体字=拼音首字母+第I半一二笔笔画+第II半一二笔画与原规则相比,不用拆分和输入第4码了。
2、设置一个替代码,用来替代输入原编码中4码字的第4键,称之为补码。
补码为以下几个键中的一键U I V在按照上面规则1输入3键后,如果有几个前3键相重的单字出现,那么,屏幕上会提示这些字应该输入哪些补码。其中,默认字不用输入补码,其它字需要输入补码[U]、[I]或[V]。如有更多的,则视为重码,排在这些字后面,在前面依次显示[1][2][3]……[9],用数字键输入。
如输入编码“zut”,屏幕上出现 这时,默认字是“执”;按补码[u]键,则输入的是“抵”;按补码[i]键,则输入的是“挣”;按补码[v]键,则输入的是“鸷”;码表中补码的生成方法在制作码表时,如果前三键有几个相同的字编码相同,那么,使用频率最高的字作为默认字不加补码,使用频率较高的字分配u键,使用频率第三的字分配i键,使用频率最低的分配v键。
但是在码表已经制作完成后,并不会因为这些字在实际输入过程中的使用软件或使用频率不同而变换成不同的补码。也就是说,每个字的补码实际上是唯一的,不会因为软件系统的不同而变换。比如上述的例子,zut是“执”的固定编码,zutu抵、zuti挣、zutv鸷都是它们各自的固定编码,不会在不同的输入法软件中,打法不同。
需要注意的是,补码并不是重码选择键,因为1、重码选择键通常都是数字键或其它一些不参与编码的按键,而现在的这三个补码键都是参与二笔声形码编码的按键。
2、这些字的补码是固定地写在码表中的,每个字都是以固定形式写在码表中的,而重码选择键如数字键[1][2]等等,是不存在于码表中的。
3、这些字之后的补码键不会因为录入者使用频率的不同而变换。如果是重码选择键就会根据软件在屏幕上的显示顺序不同而用不同的键上屏,比如原先是用数字键[1]上屏,现在变成用数字键[2]上屏,原先是用[u]实现上屏,现在变成用[i]上屏等等。
为什么选这三个键呢?因为,二笔声形编码的第一个键用不到这三个键。这样,如果把输入的最大码长定为3键的话,那么,绝大多数的字就只要3个键就输入了(含空格键在内)。
一、当我们把最大码长定为3键时,输入“zut”,系统默认输入的是“执”字,如果下一个键输入的是除补码“[u][i][v]”外的任何一键,那么,“执”字就直接上屏,不影响下一个字或词的输入;如果下一个键输入的是[u]键,那么,就不是“执”字而是“抵”字上屏。经过这样的处理,除了少数几个字需要4键输入外,其它的字含空格键在内最多3键就可以输入了。(3键输入相当于二级简码输入的用键数!)经过统计,二笔声形码中只有约3%的单字需要四键输入,这样,采取本编码的措施后,就有97%的单字可以用3个键就可以输入了,相当于97%的单字都至少是二级简码!这是其它输入法根本无法做到的。
二、当我们将最大码长定为4键时,输入“zut”+“空格”,就输入的是“执”字;输入“zut”+“[u]”,则是“抵”;输入“zut”+“[i]”,则是“挣”。
4键输入较适合内置有较大词库时的输入。主要输入方式是词组4键输入,单字“3键+空格”输入或“3键+补码[u]、[i]、[v]”输入。
这样,总结输入规则如下一、单字的输入规则单字的输入分为独体字和合体字输入,独体字是指字形上没有明显分界线、不能分上下、左右或全包围半包围结构的字;合体字是指字形上有明显分界线、能分上下、左右或全包围半包围结构的字。对于一些不太好拆分的准独体字,也视为独体字来编码。
独体字直接输入其拼音首字母和前四笔笔画,每两个笔画对应一个按键;合体字首先要从字形上一次性地一分为二,分成两个部份来输入。
所谓一次性地一分为二,是指对于合体字“一分为二”的拆分只作一次,不能“一分为二”后再“一分为二”。如“照”字,只是一次性的分为上下两半“昭”和“灬”,拆分后的上半部“昭”就作为一个整体,不能再对上半部“昭”再进行拆分。)将合体字一分为二之后,先写到的那一部分就叫第I半(原专利说明书中称之为阴部),余下的为第II半(原专利说明书中称之为阳部)。
如上下、左右、上中下、左中右结构字,“上”、“左”为第I半,“下”、“右”、“中下”、“中右”为第II半;半包围、全包围结构字,分成“里”和“外”,通常先写到的为第I半,后写到的为第II半。
对上中下、左中右结构的字,一分为二时,尽量按照汉字本身的构字原理来拆分,使分开的两半都有意义,对于不太容易拆分的,可简单分成“上”、“左”为第I半,“中下”、“中右”为第II半。系统通过容错码来实现多种分法的兼容性。
单字的输入公式如下3键+补码独体字=拼音首字母+第一二笔笔画+第三四笔笔画合体字=拼音首字母+第I半一二笔笔画+第II半一二笔画对于三键输入后会发生重码的,按照屏幕的提示输入补码,作为补码的按键分别是[U][I][V]。
键盘安排本输入法参照笔画的标准分法,将笔画分为横、竖、撇、点、折五大类,每两个笔画对应一个按键,共25键,采用区位法安排到键盘上,其中,首笔画相同的放在同一区,次笔画一律按“横竖撇点折”的规律自左向右排列;另设5个“横竖撇点折”单笔画键,供剩余笔画为单数时使用。
笔画与标准英文键盘的按键对应关系如下表

另外,键盘中还安排了10个常见的偏旁部首,“钅木氵土艹日月人(亻)口扌”,如取笔画时遇到这10个部首,则不要再拆成笔画,直接按对应的按键。
“钅、木、氵、土、艹、日、月、人(亻)、口、扌”安排到“一、丨、丿、丶、_、丨丨、丨丿、丨丶、一丶、丶丨”所对应的按键中。
如虫=C丨_一丨CGJ士=S一丨SJZ婚=H_丿丿_HT警=J丶一JBY二、词组的输入(1)、3键输入方式适用小词库二字词 第一个字的前两键+第二个字的第一键三字词 各取每个字的第一键四字词及四字以上词 前两个字的第一键和最后一个字的第一键如规则=GHZ计算机=JSJ中华人民共和国=ZHG(2)、4键输入方式适用大词库二字词 取每个字的前两键三字词 各取每个字的第一键+最后一个字的第二键四字词及四字以上词 前三个字的第一键和最后一个字的第一键如规则=GHZG计算机=JSJX中华人民共和国=ZHRG3键或4键的方式可以由用户通过软件自行设置,一般来说,如果词库较小,可以采用字词都是三键的输入方式;如果词库较大,可以采用最大码长为四键的输入方式,以防词组重码过多。
在输入系统安排上,如果词组和字重码,可根据其使用频率排列,并在前面标以阿拉伯数字以供选择。另外,如果“u、i、v”三个键空闲,也可以用这三个键作为重码的优先选择键。
总之,单字输入在本方案中,除了以补码“U、I、V”结尾的编码是4键外,所有的单字编码都是3键。
另外,可以考虑将编码首键使用频率较低的“[O]、[E]、[;]、[、]”等键作为重码的备用选择键。
效果和优点这种“三键+补码”的方案,其优点显而易见,采用了本方案之后,有以下几个明显优点1、彻底解决了二笔声形码第四键拆分困难的问题,与原二笔声形码比,独体字不用再输入第五笔画,合体字字不用再输入第II半的三四笔画。
减少了拆分编码的思维负担,更加有利于形成条件反射,加快输入速度。
2、单字的码长由4键减少为3键,大大提高了输入速度。
在本方案中,除了以“U、I、V”结尾的编码是4键外,所有的单字编码都是3键。
在内置1万条左右的小词库时,可以做到97%的单字和词组仅仅需要3键就可以输入。而其它各输入法包括五笔、原二笔声形码,能做到3键就可以输入的仅为600多字(含一级简码、二级简码)!在内置大词库时,词组4键输入,单字“3键+空格或iuv”输入,这样字与词之间绝无重码;除了“U、I、V”结尾的编码是4键外,单字的输入最长也都相当于其它编码的三级简码输入,因此输入速度很快。
3、在软件智能较好的情况下,可以做到装配较大的词库(5-10万)时,最大码长仍设定在3键。本方案设定的三键声形输入,给输入软件的智能功能的运用腾出了空间,在系统配备较大词库时,字、词仍只需要三键来输入,词组发生重码,通过软件的智能化来自动解决。目前输入软件的智能化已经基本上可以做到这一点。
4、另外,从创造性上来说,这种“三键+补码”的方式,是有很强的创造性的。
因为如果仅仅是简单地采用三键输入,势必造成重码很多。而采用现在这种方式,即保证了绝大多数的高频字、词可以三键输入,又可以保证剩下的那些非高频字基本上在不重码的情况下进行输入。
本发明巧妙地利用了[U][I][V]这三个键不参与二笔声形码首键编码的特性,从而达到了可以含断码键在内,三键输入97%的常用字词、四键输入非常用字词的目的,而其它的输入方法含断码键在内可以三键输入的仅仅只有600多字,这一点是其它现有输入法所远远达不到的;本发明也因此把二笔声形码的编码空间发挥到了极致。


具体实施方式


发明内容
权利要求
1.一种计算机汉字输入方法,其特征在于,(1)、单字的编码码长为3键,采用“3个编码键+补码键”的输入方式;(2)、将合体字从字形上一次性地一分为二,分成两个部份来输入;将合体字一分为二之后,先写到的那一部分就叫第I半,余下的为第II半;上下、左右、上中下、左中右结构字,“上”、“左”为第I半,“下”、“右”、“中下”、“中右”为第II半;半包围、全包围结构字,分成“里”和“外”,先写到的为第I半,后写到的为第II半;(3)、将独体字、准独体字视为一个整体,不拆分;(4)、将汉字的笔画按标准分法分成横竖撇点折五大类,每两笔笔画组合成一个双笔画对,对应一个按键,共有25个双笔画键,另设横竖撇点折5个单笔画键,共30个按键;(5)、单字的输入方式采用3键+补码输入输入公式独体字=拼音首字母+第一二笔笔画+第三四笔笔画合体字=拼音首字母+第I半一二笔笔画+第II半一二笔画单字的编码键最多三键,如果三键输入仍有相重的编码,则按照屏幕的提示输入相应的补码;(6)、用作补码的按键是[U]、[I]、[V](7)、另外,设置“钅、木、氵、土、艹、日、月、人(亻)、口、扌”10个偏旁部首,如取笔画时遇到这10个部首,则不要再拆成笔画,直接按对应的按键。
2.如权利要求1所述的汉字输入方法,其特征在于,各个码元在标准英文键盘上的安排如下(1)按照笔画的标准分法,将笔画分为横、竖、撇、点、折五大类,每两个笔画对应一个按键,共25键,采用区位法安排到键盘上,其中,首笔画相同的放在同一区,次笔画一律按“横竖撇点折”的规律自左向右排列;另设5个“横竖撇点折”单笔画键,供剩余笔画为单数时使用;笔画与标准英文键盘的按键对应关系如下表
(2)、“钅、木、氵、土、艹、日、月、人(亻)、口、扌”安排到“一、丨、丿、丶、_、丨丨、丨丿、丨丶、一丶、丶丨”所对应的按键中。
3.如权利要求1所述的汉字输入法,其特征在于,词组的输入方法如下(1)、3键输入方式适用小词库二字词第一个字的前两键+第二个字的第一键三字词各取每个字的第一键四字词及四字以上词前两个字的第一键和最后一个字的第一键(2)、4键输入方式适用大词库二字词取每个字的前两键三字词各取每个字的第一键+最后一个字的第二键四字词及四字以上词前三个字的第一键和最后一个字的第一键3键或4键的方式可以由用户通过软件自行设置。
全文摘要
三键二笔输入法是一种计算机汉字输入法,一种可广泛应用于计算机等含有汉字输入的数字终端的汉字输入方法。本发明对二笔输入法的4键输入方式进行改进,采用“三键+补码”的方式,使得单字输入时97%的汉字在含断码键的情况下,仅需三键就可以输入,而且与原4键二笔输入法相比,并未增加重码率。通过本发明的方案,不但进一步降低了编码拆分的难度,同时也缩短了平均键长,加快了输入速度。
文档编号G06F3/023GK1661528SQ20041001547
公开日2005年8月31日 申请日期2004年2月27日 优先权日2004年2月27日
发明者陈劲松 申请人:陈劲松
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1