二笔全形及形声输入法的制作方法

文档序号:6388414阅读:317来源:国知局
专利名称:二笔全形及形声输入法的制作方法
技术领域
本发明涉及一种计算机汉字输入法,一种可广泛应用于计算机、个人数字助理PDA、手机以及其它一些含有汉字输入的数字终端的汉字输入方法。
背景技术
本人于1992年发明了汉字阴阳双极编码(后改名为二笔输入法),该专利申请后来应审查员要求分成了声形码、全形码、声韵形码等几个分案,都先后获得了专利,专利号分别为ZL92111818.X、ZL96103708.3、ZL96103095.X。
该系列输入法基本解决了汉字输入中的易学与快速的矛盾。达到了10分钟左右可以学会,编码的重码率又低的效果。
其中的全形方案ZL96103708.3规则如下该编码单字输入分独体字和合体字独体字=第一二笔笔画+第三四笔笔画+第五六笔笔画合体字=第I半一二笔笔画+第I半三四笔笔画+第II半一二笔画+第II半三四笔画每个字的最大码长为4键。
即,单字输入时,如遇独体字——则输入其前六画,每两笔画对应一键;如遇合体字——就一次性地将其一分为二,然后依次输入其第一半的一二笔画、第一半的三四笔画、第二半的一二笔画、第二半的三四笔画。
在10多年在推广过程中发现,虽然这样的规则很简单,但是,第二键由于取的是第一半的第三四笔画,编码效率很低,经常起不到离散重码的目的。
比如“蝈、蛆、蜾、蠼”的编码都是丨_+一丨+ 丨_
+ 一一(第I半一二笔画)(第I半三四笔画)(第II半一二笔画)(第II半三四笔画)光一个“虫”部,就用了两个键来输入,影响了编码效率,也容易产生重码。
像“贝、王、白、田、石、礻、衤、女、山、犭、火、亇”等常用部首,都要两个键才能输入,致使其后的部件没有足够的编码空间输入,大大浪费了编码空间。
正因为上述原因,二笔全形码的重码很多。

发明内容
如何才能解决二笔全形码第二键效率差,重码又多的困难呢?看来只有重新修改编码规则才行了。
技术解决方案经过长期实践和通过计算机的反复运算多套方案,决定采用以下方法来解决这个问题。
一、单字的规则1、将单字输入的编码规则改为独体字=前六笔笔画+拼音首字母合体字=第I半前二笔画+第II半一二笔画+第II半三四笔画+拼音首字母具体解释如下单字的输入分为独体字和合体字输入,独体字是指字形上没有明显分界线、不能分上下、左右或全包围半包围结构的字;合体字是指字形上有明显分界线、能分上下、左右或全包围半包围结构的字。对于一些不太好拆分的准独体字,也视为独体字来编码。
独体字直接输入其拼音首字母和前四笔笔画,每两个笔画对应一个按键;合体字首先要从字形上一次性地一分为二,分成两个部份来输入。
所谓一次性地一分为二,是指对于合体字“一分为二”的拆分只作一次,不能“一分为二”后再“一分为二”。如“谓”字,只是一次性的分为左右两半“讠”和“胃”,拆分后的右半部“胃”就作为一个整体,不能再对右半部“胃”再进行拆分。
将合体字一分为二之后,先写到的那一部分就叫第I半(原专利说明书中称之为阴部),余下的为第II半(原专利说明书中称之为阳部)。
上下、左右、上中下、左中右结构字,“上”、“左”为第I半,“下”、“右”、“中下”、“中右”为第II半;半包围、全包围结构字,分成“里”和“外”,通常先写到的为第I半,后写到的为第II半。
对上中下、左中右结构的字,一分为二时,尽量按照汉字本身的构字原理来拆分,使分开的两半都有意义,对于不太容易拆分的,可简单分成“上”、“左”为第I半,“中下”、“中右”为第II半。系统通过容错码来实现多种分法的兼容性。
这样,就可以按照以下公式输入单字了。
单字的形声输入公式独体字=前六笔笔画+拼音首字母合体字=第I半前二笔画+第II半一二笔画+第II半三四笔画+拼音首字母如果取不足规定的笔画数,该字的笔画就已经写结束了,则直接在后面补输拼音首字母。
2、对于不懂拼音,而又想盲打的,本方法专门设置拼音替代键,替代拼音首字母的输入。
该替代键共有三个,[U]、[I]、[V]键。
这样,就组成了一个全形的输入公式,单字的全形输入公式独体字=前六笔笔画+拼音替代键合体字=第I半前二笔画+第II半一二笔画+第II半三四笔画+拼音替代键在码表中,如何确定这三个键的分配呢?在制作码表时,如果前三键有几个相同的字编码相同,那么,使用频率最高的字作为三级简码,不加拼音替代键,使用频率第二的字分配u键,使用频率第三的字分配i键,使用频率最低的分配v键。
在码表已经制作完成后,并不会因为这些字在实际输入过程中的使用软件或使用频率不同而变换成别的替代键。也就是说,每个字的补码实际上是唯一的,不会因为软件系统的不同而变换。比如如果原“甲”的编码是“ghxu”,就一直会是“ghxu”,不会因为调频、屏幕显示顺序的不同变换成“ghxi”或“ghxv”。
如果取不足规定的笔画数,该字的笔画就已经写结束了,则直接在后面补输拼音替代键。
3、另外,输入过程中,屏幕上即时提示符合输入按键的所有字。所以一般情况下,输入三键的形码部分后,屏幕上会列出所有以该三键开头的字,不熟悉拼音的输入者,可以通过屏幕上的提示进行选择输入;而熟悉拼音的人,可以直接输入第四键拼音首字母,进行盲打。
4、键盘安排本输入法参照笔画的标准分法,将笔画分为横、竖、撇、点、折五大类,每两个笔画对应一个按键,共25键,采用区位法安排到键盘上,其中,首笔画相同的放在同一区,次笔画一律按“横竖撇点折”的规律自左向右排列;另设5个“横竖撇点折”单笔画键,供剩余笔画为单数时使用。
笔画与标准英文键盘的按键对应关系如下表

另外,键盘中还安排了10个常见的偏旁部首,“钅木氵土艹日月人(亻)口扌”,如取笔画时遇到这10个部首,则不要再拆成笔画,直接按对应的按键。
“钅、木、氵、土、艹、日、月、人(亻)、口、扌”安排到“一、丨、丿、丶、_、丨丨、丨丿、丨丶、一丶、丶丨”所对应的按键中。
例字形声编码虫=丨_一丨一丶CGJLC士=一丨SJZS婚=_丿丿_一_HTH警=丶一一一JBYHJ全形编码使用拼音替代键的编码虫=丨_一丨一丶UGJLU(虽前三键编码与“眄幬疇”相同,但“眄幬疇”字频低,故“虫”编码定为GJ;U)士=一丨UJZI(与“工”前两码相同,“工”的字频较高,故“工”编码定为JZU,“士”为JZI)婚=_丿丿_一_UTU警=丶一一一UBYHU由于本方法是经过特别的设计,本方法的全形方案中的拼音替代键都是采用的“UIV”等与拼音首字母不相重的方式,所以,形声方案和全形方案可以放在一起而不会产生重码,令使用者可以根据自己对拼音的熟悉情况有多种输入方式。这样既达到了离散重码的目的,又使得那些完全不懂拼音的使用者也可以方便地输入。
当然,以上的形声方式和全形方式也可以通过软件设置成混合或单一输入。
二、另外,还有一种输入方式可以由用户设定,设定一种简易的输入形式,可以将单字的输入码长缩短为3码,最后一键不输入,按空格键即可。即只输入前三键——独体字的前六笔画或合体字的第I半一二笔画和第II半的前四笔画。
这种方式虽然重码较多,但是方便,适合一些对重码率不讲究的用户使用。而且如果输入软件的智能做得比较好的话,可以通过输入软件来消除一些重码。
三、词组的输入二字词 取每个字的前两键三字词 各取每个字的第一键+最后一个字的第二键四字词及四字以上词 前三个字的第一键和最后一个字的第一键如规则=HGGS计算机=PQXT中华人民共和国=GFRG效果和优点经过重新设计的二笔输入方法,其优点显而易见,采用了本方案之后,有以下几个明显优点1、解决了原二笔全形码中第二键编码效率差的问题。
2、重码率明显减少,使用“形码+声母”的规则,一级字库的重码率几乎为零,比原全形码方案大大地减少!3、仍然保留了原全形码的特色,因为完全不懂拼音的人完全可以用拼音替代键来输入,或者依据屏幕上提示的拼音首字母来进行输入。
4、通过本发明的巧妙设计,设计了三个拼音替代键,这三个拼音替代键是特殊选定的按键,它保证了“形码+拼音替代键”的输入,完全不会与“形码+声母”的输入相重码。这样,就既兼顾了无重码输入(形声方式),又兼顾了完全不懂拼音的输入者的输入(全形方式)。



具体实施例方式
见发明内容一节
权利要求
1.一种计算机汉字输入方法,其特征在于,(1)、单字的编码码长为4键,采用“3个形码键+1个拼音首字母键”的输入方式;(2)、将合体字从字形上一次性地一分为二,分成两个部份来输入;将合体字一分为二之后,先写到的那一部分就叫第I半,余下的为第II半;上下、左右、上中下、左中右结构字,“上”、“左”为第I半,“下”、“右”、“中下”、“中右”为第II半;半包围、全包围结构字,分成“里”和“外”,通常先写到的为第I半,后写到的为第II半;(3)、将独体字、准独体字视为一个整体,不拆分;(4)、将汉字的笔画按标准分法分成横竖撇点折五大类,每两笔笔画组合成一个双笔画对,对应一个按键,共有25个双笔画键,另设横竖撇点折5个单笔画键,共30个按键;(5)、单字的输入方式分为独体字和合体字输入输入公式独体字=前六笔笔画+拼音首字母合体字=第I半前二笔画+第II半一二笔画+第II半三四笔画+拼音首字母(6)输入过程中,屏幕上即时提示符合已输入按键的所有字,不熟悉拼音的输入者,可以通过屏幕上的提示进行选择输入;(7)、另外,设置“钅、木、氵、土、艹、日、月、人(亻)、口、扌”10个偏旁部首,如取笔画时遇到这10个部首,则不要再拆成笔画,直接按对应的按键。
2.如权利要求1所述的汉字输入方法,其特征在于,设置[U][I][V]三个拼音替代键,在单字输入中,替代拼音首字母在上述公式中的输入。
3.如权利要求1或权利要求2所述的汉字输入方法,其特征在于,作为单字输入的简易形式,可以将单字的最大码长限定为3键,即不用再输入单字的第4键。
4.如权利要求1所述的汉字输入方法,其特征在于,各个码元在标准英文键盘上的安排如下(1)按照笔画的标准分法,将笔画分为横、竖、撇、点、折五大类,每两个笔画对应一个按键,共25键,采用区位法安排到键盘上,其中,首笔画相同的放在同一区,次笔画一律按“横竖撇点折”的规律自左向右排列;另设5个“横竖撇点折”单笔画键,供剩余笔画为单数时使用;笔画与标准英文键盘的按键对应关系如下表
(2)、“钅、木、氵、土、艹、日、月、人(亻)、口、扌”10个偏旁部首安排到“一、丨、丿、丶、_、丨丨、丨丿、丨丶、一丶、丶丨”所对应的按键中。
5.如权利要求1所述的汉字输入法,其特征在于,词组的输入方法如下二字词取每个字的前两键三字词各取每个字的第一键+最后一个字的第二键四字词及四字以上词前三个字的第一键和最后一个字的第一键
全文摘要
二笔全形及形声输入法是一种计算机汉字输入法,一种可广泛应用于计算机等含有汉字输入的数字终端的汉字输入方法。本发明对原二笔全形码的输入规则进行改进,采用“三键+声码”或“三键+声母替代键”的方式,解决了原二笔全形码第二键编码效率不高的问题,使得重码率大大减少,而且无论输入者会不会拼音,都可以输入。
文档编号G06F3/023GK1661527SQ200410015470
公开日2005年8月31日 申请日期2004年2月27日 优先权日2004年2月27日
发明者陈劲松 申请人:陈劲松
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1