无字型五笔编码计算机中文输入法的制作方法

文档序号:6414502阅读:681来源:国知局
专利名称:无字型五笔编码计算机中文输入法的制作方法
无字型五笔编码计算机中文输入法属于计算机键盘中文形码输入法。
目前国内计算机键盘中文输入法占有率最高的是五笔字型四版编码输入法。这种输入法最大的缺点是为降低汉字同码率采用的,对汉字中众多的二码字、三码字编码后加的末笔字型识别码。末笔字型识别码难学难用,易出错误。汉字的字型、末笔没有统一的标准,造成相当一部分汉字的末笔字型识别码存在两异性,需要使用者依据硬性规定死记硬背,同时由于思维改变,明显影响输入速度。这一严重缺点使很多人放弃了对五笔字型的学习和使用。
本发明的主要目的是不使用末笔字型识别码,而用简单和不用专门学习的方法降低编码同码率。
本发明是这样实现的使用计算机通用西文键盘,选取汉字字根,对字根分组,将字根分组定义在通用键盘的不同键位上,构成中文键盘。任何形码编码输入法都涉及到拆分字根,并依字根编码,本发明也不例外。不过本发明的特征并不在于选取字根,字根分组和字根分组的定位。它可以适用于不同形码选取的字根,字根分组和字根分组的定位。本发明规定它的选取字根,对字根分组,将字根分组定义在通用键盘的不同键位上,可以同于五笔字型四版,也可以不同于五笔字型四版。本发明的实施例的字根等之所以同于五笔字型四版,是为了使几百万五笔字型使用者不用学习就能使用,从而达到使他们更易接受的目的。五笔字型四版的字根有很多不合理之处,本发明今后版本将对字根进行增减,(总字根数将减少二、三十个)字根分组进行少量调位。
本发明的编码标准码长有四码和五码两种。社会上绝大多数编码都是四码码长,本发明人之所以提出五码码长方案是为了多装词。在四码码长情况下,装词超过两万个,同码率就会高得很难使用。改为五码码长后,装词五、六万个以上,同码率仍然很低,可以真正实现词为主,字为辅输入,明显提高输入速度。
本发明的字编码规则对汉字进行字根柝分,标准码长为四码时,一般字编码依次为一、二、三、末字根,字根字编码首码为该字根字所在键位字母,其余编码依次为一、二、末字根;标准码长为五码时,一般字编码依次为一、二、三、四、末字根,字根字编码首码为该字根字所在键位字母,其余编码依次为一、二、三、末字根。对汉字中的原编码少于标准码长的字的编码,要后加补码,使其编码长度达到标准码长,构成全码;补码为重复原编码最后一码。字编码可以定义简码,对定义为简码的汉字,在输入该字时可以只使用简码,不再使用其全码。
本发明的词编码规则二字词编码依次为,词前字为简码时使用该字简码,其余以词后字全码的前几码补齐,词前字为全码时使用该字全码的除最后一码的编码,其余为词后字首码;三字词编码依次为,前二字首码,以第三字全码的前几码补齐;四字词编码依次为,前三字首码,以第四字全码的前几码补齐;五字及五字以上字词编码依次为,少于标准码长一位的字的首码,词末字首码。
以标准码长四码编码为例具体地说明,字根少于四个的字的原码如何后加补码,构成全码。一码字,其编码的第二、三、四码重复第一码。例如“一”字是一码字,原码为G,补码为GGG,全码为GGGG。二码字,其编码的三、四码重复第二码。例如“红”字是二码字,原码为XA,补码为AA,全码为XAAA。三码字,其编码的第四码重复第三码。例如“组”字是三码字,原码为XEG,补码为G,全码为XEGG。
在四码编码中,对于字根字的处理有一个特例为了使广大五笔字型的使用者更易接受,本发明的最初版本中保留了五笔字型对字根字编码的规定首码为该字根字所在键位字母,键名字编码的其余编码为该字所在键位字母重复三次,其它字根字编码依该字的一、二、末笔画次序编码。在后面的四码编码版本和五码版本中对字根字的编码进行了改变;字根字编码,首码为该字根字所在键位字母,其余依字根次序编码。相对于五笔字型对字根字编码规则改变的原因是五笔字型对大量的一般字都要求依字根编码,而对占少数的字根字又要求依笔画编码,很容易使使用者发生错误。
编码规则中规定,字编码可以定义简码,对定义为简码的汉字,在输入该字时使用简码,不再使用全码。它与上面的补码规则相结合可以明显减少字,特别是常用字的同码率。例如“池”、“洱”、“凼”三字原编码均为IB,三字同码,后加补码后,全码同为IBBB,根据使用频率将三字分别定义为二级简码、三级简码和全码,“池”编码为IB,“洱”编码为IBB,“凼”编码为IBBB,三字不再重码。
对于词编码规则,以五码码长词编码为例加以说明二字词编码为词前字是一级简码字的词,编码为前字一级简码,词后字全码前四码。词前字是二级简码字的词,编码为词前字二级简码,词后字全码前三码;词前字是三级简码字的词,编码为词前字三级简码,词后字全码前二码;词前字是四级简码字或五码字的词,编码为词前字四级简码或五码字前四码,词后字首码。(取首码的字,如系一级简码字,用一级简码,下同)三字词编码依次为,首字、次字首码,第三字全码前三码;四字词编码依次为,首字、次字、第三字首码,第四字全码前二码;五字及五字以上字词编码为前、次、三、四、末字首码。除以上词编码规则外,对于四码编码有两个特例一是在四码编码的最初版本保留了五笔字型四版词编码规则前后二字各取前二码;二是四码编码的另一个版本为词前字是一级简码字的词,编码为词前字一级简码,词后字全码前三码,词前字不是一级简码的词,词编码则仍是前后二字各取前二码。
相对于五笔字型对二字词的编码规则进行改变有两个原因1、高等级的简码字多是常用字,又多是组词能力非常强的字,扩大这类二字词词编码中词后字的编码长度,可以减少词编码同码率。而全码字和低等级简码字多组词能力差,词后字编码长度短,一般不会造成同码。2、现五笔字型的部分一级简码字的字码和由其组成的词的词码不统一,造成记忆和使用的困难。例如“我”字,字编码为Q,“我们”一词,编码为TRWU。本发明词编码改后的“我们”一词的编码为QWUU。使记忆和使用变得容易。
本发明的优点是一、不使用难学难用的末笔字型识别码,而使用补码来减少同码率,不但非常易学易用,而且同码率又有较大的减少。五笔字型四版同码字有394个,无字形五笔编码同码字只有250个。
二、提出五码码长编码,在保持低同码率的前提下,使编码装词增加几倍以上,真正实现词为主,字为辅输入,大大提高中文输入效率。
三、本输入法最初版本采用五笔字型四版的字根、字根分组、键位,除末笔字型识别码以外的编码规则,使本输入法很易被使用者接受,从而迅速取代五笔字型。
四、采用新的词编码规则,有利减少组词能力强的字组成的词的同码率。
五、采用新的字根字编码规则,可减少字根字使用时的编码错误。
本发明的典型的具体技术方案由以下实施例及附图
给出实施例一图一为实施例一的中文键盘字根键位示意图。实施例一的字根、字根分组、字根在键盘上的键位与五笔字型四版相同。实施例一的标准码长为四码。字编码规则为一般字编码依次为一、二、三、末字根,一般字中的一码字后加三码,其编码的第二、三、四码重复第一码;二码字后加二码,其编码的第三、四码重复第二码;三码字后加一码,其编码的第四码,重复第三码。字根字编码首码为该字根字所在键位字母,键名字编码的其余编码为该字所在键位字母重复三次,其它字根字编码依该字的一、二、末笔画次序编码;字编码可以定义简码,一、二、三级简码码长分别为一、二、三码。简码字输入时加空格键。对定义为简码的汉字,在输入该字时只使用简码,不再使用全码,以减少字的同码率。词编码规则为二字词编码依次为前后二字前二码;三字词编码依次为,词前字、次字首码,第三字前二码;四字及四字以上字,词编码为前、次、三、末字首码。
实施例二图一为实施例二的中文键盘字根键位示意图。实施例二的字根、字根分组、字根在键盘上的键位与五笔字型四版相同。实施例二的标准码长为五码。字编码规则为一般字编码依次为一、二、三、四、末字根;一般字中的一码字后加四码,其编码的第二、三、四、五码重复第一码;二码字后加三码,其编码的第三、四、五码重复第二码;三码字后加二码,其编码的第四、五码,重复第三码;四码字后加一码,其编码的第五码,重复第四码。字根字编码首码为该字根字所在键位字母,其余编码依次为一、二、四、末字根;字根字中的一码字后加三码,其编码的第三、四、五码重复第二码;二码字后加二码,其编码的第四、五码重复第三码;三码字后加一码,其编码的第五码重复第四码。字编码可以定义简码,一、二、三、四级简码码长分别为一、二、三、四码。简码字输入时加空格键。对定义为简码的汉字,在输入该字时只使用简码,不再使用全码,以减少字的同码率。词编码规则为二字词编码,如词前字是一级简码字的词,编码为词前字一级简码,词后字全码前四码,如词前字是二级简码字的词,编码为词前字二级简码,词后字全码前三码,如词前字是三级简码字的词,编码为词前字三级简码,词后字全码前二码,如词前字是四级简码字或五码字的词,编码为词前字四级简码或五码字前四码,词后字首码。三字词编码依次为,前、次字首码,第三字全码前三码。四字词编码依次为,前、次、三字首码,第四字全码前二码;五字及五字以上字词编码为前、次、三、四、末字首码。
权利要求
1.一种计算机中文键盘输入形码编码输入法,使用计算机通用西文键盘,选取汉字字根,对字根分组,将字根分组定义在西文键盘的不同键位上,构成中文键盘;其字编码规则编码标准码长为四码或五码;对汉字进行字根柝分,标准码长为四码时,一般字编码依次为一、二、三、末字根,字根字编码首码为该字根字所在键位字母,其余编码依次为一、二、末字根;标准码长为五码时,一般字编码依次为一、二、三、四、末字根,字根字编码首码为该字根字所在键位字母,其余编码依次为一、二、三、末字根;其特征在于汉字中的原编码少于标准码长的字的编码,要后加补码,使其编码长度达到标准码长,构成全码;补码为重复原编码最后一码;字编码可以定义简码,对定义为简码的汉字,在输入该字时可以只使用简码,不再使用其全码;词编码规则二字词编码依次为,词前字为简码时使用该字简码,其余以词后字全码的前几码补齐,词前字为全码时使用该字全码的除最后一码的编码,其余为词后字首码;三字词编码依次为,前二字首码,以第三字全码的前几码补齐;四字词编码依次为,前三字首码,以第四字全码的前几码补齐;五字及五字以上字词编码依次为,少于标准码长一位的字的首码,词末字首码。
2.根据权利要求1所述的编码,其特征在于其选取字根,对字根分组,将字根分组定义在标准键盘的不同键位上,可以同于五笔字型四版,也可以不同于五笔字型四版。
3.根据权利要求1、2所述的编码,其特征在于字根字编码规则在标准码长为四码时,也可以同于五笔字型四版的规定字根字编码首码为该字根字所在键位字母,其中键名字编码除首码外,其余编码为该字所在键位字母的重复三次,其它字根字编码除首码外,其余编码为依该字的笔画次序编码。
4.根据权利要求1、2、3所述的编码,其特征在于标准码长为四码时,二字词编码规则可以为词前字是一级简码字的词,编码依次为词前字一级简码,词后字前三码,词前字不是一级简码字的词,编码依次为前后二字前二码;也可以同于五笔字型四版的规定所有二字词编码均为前后二字前二码。
全文摘要
无字型五笔编码输入法属于计算机键盘中文形码输入法。它使用五笔字型的字根、字根分组及键位,不使用难学难用的末笔字型识别码,而使用对少于标准码长的字编码加补码和合理定义字简码的方法降低同码率。补码为重复原编码最后一码,非常容易实现。本输入法会五笔字型的人不用学习就能使用,其同码率比五笔字型还低,字根字和词编码有重大改进。本输入法标准码长为四码和五码。五码码长可以成几倍多装词,真正实现词为主字为辅输入。
文档编号G06F3/023GK1251922SQ9812063
公开日2000年5月3日 申请日期1998年10月19日 优先权日1998年10月19日
发明者王小宁 申请人:王小宁
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1