毕升计算机汉字输入法及其键盘的制作方法

文档序号:6417386阅读:204来源:国知局
专利名称:毕升计算机汉字输入法及其键盘的制作方法
技术领域
本发明涉及计算机键盘汉字输入法,特别是基本笔顺类汉字输入法及其键盘。
现有的输入法方案可分为二大类。第一类是面向广大非专业录入人员的普及型方案,典型的有五笔画、拼音、自然码、表形码、智能ABC等。这类方案的特点是规则比较简单,易学、易记,但输入效率不高。第二类是面向广大专业操作员的快速型方案,典型的有五笔字型和仓颉。这类方法的特点是编码规则比较复杂,重码率低,宜于高速盲打,但难于学习和掌握。“易学的打不快,打得快的不易学”基本上反映了目前我国汉字输入法技术的现状。
本发明的目的是提供一种既易学又打得快的键盘汉字输入方法。
为达到易学的目的,本发明采用的解决方案是提取且只提取汉字的笔顺信息作为编码的依据。为达到打得快的目的,本发明采用的解决方案是在按照“札字五笔”方法将汉字笔画归纳为横竖撇点折五种基本笔画的基础上,定义30个汉字编码元素,包括25个双笔顺和5个末笔顺,然后充分利用键盘上的25个按键(A-Y)来实现汉字及词输入;再充分利用计算机的人机交互功能及键盘上的十个数字键位资源编制一二三级简码,每个简码有十个重码,使用频率越高的字,简码级别越高。
笔画是汉字字形结构的最低层次,这里按“札字五笔”方法将汉字笔画归纳为横(一)竖(丨)撇(丿)点(丶)折(乙)五种基本笔画,并分别编号为横(1)竖(2)撇(3)点(4)折(5)。其中提笔归为横,捺归为点,一切带弯折的笔画都归为折,包括竖钩。(图1)面对一个汉字,如果我们不计组成该汉字的各个笔画的空间位置,而只考虑组成该字的五种基本笔画的书写笔顺,并按笔顺关系将其笔画代码依次排列起来,则可以将二维的方块汉字转换为一维的线性序列了。这个序列只包含了汉字的笔顺信息,而忽略了汉字的字形信息。面对一个汉字的笔顺序列,我们依次提取两个笔画的笔顺信息,然后定义一种汉字编码元素来表达它,我们称这种汉字编码元素为双笔顺。如“爱”字的笔顺序列为(丿丶丶丿丶乙一丿乙丶)(3443451354),则“爱”字的第一个双笔顺为(丿丶)(34),第二个双笔顺为(丶丿)(43),第三个双笔顺为(丶乙)(45)第四个双笔顺为(一丿)(13)第五个双笔顺为(乙丶)(54);如果某个汉字的笔画数为单数,我们再定义五个末笔顺作为汉字编码元素,如“你”字的笔顺序列为(丿丨丿乙乙丿丶)(3235534),则“你”字的末笔顺为(丶0)(40)后面加0以示与单笔画相区别很显然,双笔顺一共有25种,末笔顺有5种,它们一起构成了本发明所使用的30个汉字编码元素,在这里统称为双笔顺元素,归纳如图2、图3、图4。
双笔顺元素的特点包括1它是在遵循笔顺规范的前提下归纳出来的一种编码元素,包含的信息是人们熟悉的规范笔顺知识。
2它是一种没有固定形态的编码元素,同样名称的双笔顺元素,它在不同汉字中的形态可能不一样,比如“士”字和“正”字的第一个双笔顺元素都称为“一丨”(12),但其形态并不一样。
3它们组成了一个完备的编码元素集,所有的汉字,归根结底都可以由这30个双笔顺元素按顺序排列起来描述,即可用它们来设计汉字编码方案,将方块汉字转换为线性排列的代码。
4这个编码元素集包含的双笔顺元素的数量适中(30个),人们易记易学。用它来设计输入法,对键盘资源的利用也很充分。
为了能利用双笔顺元素从键盘输入汉字,我们用英文键盘上的25个键位来代表30个双笔顺元素。在英文键盘上,我们取了从A至Y(Z除外)这25个键位,并依照其键位分布划分为五个区,每个区中又按其排列顺序划分为五个位。区号对应于双笔顺元素的第一笔代码,位号对应于双笔顺元素的第二笔代码,这样,25个双笔顺就可以在键盘上对号入座了。至于5个末笔顺,因为实际使用的机会较少,所以我们让它们分别同15,25,35,45,55五个双笔顺合用一个键位。这样,从双笔顺元素到英文键盘的键位对应如图5、图6。
键位安排的规律是,“一(1)|(2)丿(3)丶(4)乙(5)”五个区按逆时针顺序分布,每个区的五个位也具有从键盘中间第二键向两边发散的分布规律。在打字过程中,除了B和N两键外,正好可以用食指(第一指)打第一位的键,用中指(第二指)打第二位的键,用无名指(第三指)打第三位的键,用小指(第四指)打第四位的键,易于记忆,更适合盲打。之所以把第五位的键位安排在键盘的中间,是因为统计表明,这一类双笔顺元素的使用数量最多,安排到中间的键位以便使用最灵活的食指来敲击它,可以提高输入效率。之所以把竖区的键位安排在键盘的下方,是因为这些键位的使用数量最少,放在较难打的位置不会影响输入效率。
有了汉字编码元素,我们再加上几条输入规则,即可实现键盘汉字输入。
单字输入规则依照书写顺序提取双笔顺元素,最大编码长度为4,即每一个字最多只能输入前4个双笔顺元素的代码,产生重码的话,只需使用重码窗来挑选即可。
词汇输入规则,两字词取首字首码+首字次码+次字首码+次字次码三字词取首字首码+首字次码+次字首码+三字首码三字以上词取首字首码+次字首码+三字首码+末字首码只有一个编码元素的单字,其组词的次码取其首码的重复。比如,“一”字只有一个编码元素“G”,其组词为“一样”时的编码为“GGDM”,第二个“G”即为取第一个“G”的重复。
以上是本发明的初步原理,但在如此简单的原理下,必然产生一些重码。于是在此基础上,本发明根据汉字的使用频率编制了科学的简码输入,提高了常用字的输入效率。为了让更多的高频字能快速上屏,目前流行输入法软件普遍采用了重码提示窗技术及高频字先显示的技术,不必输全编码即可选高频字上屏,即每输入一个代码,提示窗上会显示以该代码开头编码的十个高频字,再利用十个数字键选字输入。但目前这种高频字先显示的技术,其第二次击键显示的汉字可以和第一次击键时显示的汉字相重复(图7、图8),对简码空间的挖掘尚嫌不够。本发明借助十行提示窗的帮助,采用了每个简码对应十个汉字的作法,则一级简码空间为250个,二级简码空间为6250个,三级简码空间为156250个;因为一二三级简码所对应的汉字不互相重叠,可以比目前的高频字先显示技术多提供6500个简码空间,这就是本发明虽基本原理很简单却也能实现高速输入的原因。举例如下GB2312-80中部首为“雨”的字共有31个,如果只按照本发明的初步原理,在未设计简码之前,需要输全四个按键“aeff”才能将这些字显示出来,一次只显示十行,余下的字必须翻页,效率有待提高。(图9、图10、图11、图12)。
但是编制简码之后,同样是这些字,只输入一个代码“a”,已可显示其中的最常用字(图13),再输入“e”,则显示其中的次常用字(图14),再输入“f”显示其中不太常用的字(图15),再输入“f”,显示其中最不常用的字(图16)。
从以上例子可以看出,对每个简码编制十个重码,是充分利用了键盘的十个数字键资源和计算机的人机交互功能,来达到减少击键次数,优先输入高频字的目的,从而提高了输入效率。由于计算机软件具有自动提示功能,这些简码不需用户记忆,而只需按原理输入编码,最常用的字就会自动优先显示,不会增加大脑的负担。这种简码设计的另一附带特点是,可帮助用户养成良好的打字习惯,即打字时必须看着屏幕而不是看着键盘,带有很强规律性的键盘设计及步步看提示的要求可以帮助用户做到这一点。经过统计,在本发明中,采用这种简码方案后,国标6763个汉字中的5693个可实现简码输入,占总数的84%,涵盖了所有的常用字。
在编码的规范和易学方面,本发明一个重大而突出的特点在于,跳出目前形码输入方案拘泥于汉字字形拆分的窠臼,只提取汉字的规范笔顺作为编码依据,只定义了30个双笔画笔顺元素即可表达所有的汉字,符合语文规范,易学易记,同目前流行的形码方案王码五笔相比,其编码规则非常简单,只要书写汉字时的笔顺关系正确,就不存在不懂拆分的问题。在现有技术中,有一种阴阳双极声形码输入系统采用了类似的概念,不过它还包括其他的分部、拼音等汉字信息,并不能做到规则简单,另外,其设计的键盘采用了30个键位,占用了标点符号资源,还不够科学。
在输入效率方面,本发明另一重大而突出的特点在于采用了科学的简码编制技术,比一般的智能高频上屏多提供了6500个简码空间,正好可以抵消由于编码规则简单所带来的重码问题,统计表明,如果从头到尾将国标6763个汉字逐个显示上屏,需敲击键盘的次数为25447次(包括不需记忆的选字上屏键及翻页键),即单字输入速度为3.76键/字,比五笔字型的3.89键/字为快由于定义了词组输入及高频字简码,输入流动文本的速度将更快。
本发明所定义的30个汉字编码元素,由于具备汉字笔顺的动态概念,已经组成一个完备的汉字编码元素集,可以表达所有用汉字笔画书写的字符,在表达比GB2312-80更大的字符集时,虽然可能会遇到重码的问题,但基于以下事实依据,发明人认为,目前汉字输入法需要解决的规范易学问题和快速输入常用字的问题要优先于解决生僻字的重码问题。这里所说的事实依据是指1975年和1985年,我国曾进行过两次规模很大的字频统计,统计范围包括时事政治、社会科学和自然科学的各个领域。统计结果表明,在几千万字文献资料中,实际用到的汉字单字总数为6335个,在这6干多个汉字中,有3千多个字的累计使用频度达到99.9%,另外3千多个字的累计使用频度不足0.1%。


图1按“札字五笔”方法归纳出汉字的五种基本笔画。
图2用笔画代码方式表示的双笔顺元素。
图3用笔画名方式表示的双笔顺元素。
图4用笔画形状方式表示的双笔顺元素。
图5用表格方式表示的双笔顺元素的键位安排。
图6用键盘图方式表示的双笔顺元素的键位安排。
图7流行输入法一键上屏的字。
图8流行输入法二键上屏的字。
图9未编制简码之前输入“雨”字头的字(第一页)图10未编制简码之前输入“雨”字头的字(第二页)图11未编制简码之前输入“雨”字头的字(第三页)图12未编制简码之前输入“雨”字头的字(第四页)图13编制简码之后输入“雨”字头的字(一键)图14编制简码之后输入“雨”字头的字(二键)图15编制简码之后输入“雨”字头的字(三键)图16编制简码之后输入“雨”字头的字(四键)图17分析“中”字的编码元素图18分析“国”字的编码元素图19分析“必”字的编码元素图20分析“胜”字的编码元素图21毕升输入法状态窗。
图22显示“中”字。
图23输入“中”字和显示“国”字。
图24输入“国”字和显示“必胜”两字。
图25完成输入“中国必胜!”四字。
应用本发明,已开发出可运行于WINDOWS95/98/NT系列操作系统的计算机汉字输入法,以下为用本发明实现汉字输入的一个例子输入“中国必胜!”1分析“中国必胜”四字的编码元素(图17、图18、图19、图20)启动毕升输入法软件后,屏幕将显示输入法窗口(图21),表示进入毕升输入法状态键入“中”字的第一个编码元素对应的按键N(图22),“中”字是一级简码,选择“1”或空格,再键入“国”字的第一个编码元素对应的按键N(图23),“国”字也是一级简码,选择“9”,“必胜”是个词组,键入其编码元素按键YOHF(图24),选择“1”或空格,再键入“!”号完成输入(图25)。
权利要求
一种基本笔顺类汉字输入法及其键盘,利用经过重新定义的英文键盘进行汉字输入,其特征包括1.提取且只提取汉字的笔顺信息作为编码的依据。
2.在“札字五笔”的基础上定义了30个双笔顺编码元素,包括25个双笔顺及5个末笔顺,它们只表达按规范笔顺书写汉字时每两个相邻笔画的笔顺信息及单数笔画字末笔画的笔顺信息。
3.定义30个双笔顺编码元素与标准英文键盘的对应关系如下(其中5个末笔顺分别与另外5个双笔顺合用一个键位。)
4.单字输入规则为依照书写顺序提取双笔顺元素,最大编码长度为4,即每一个字最多只能输入前4个双笔顺元素的代码,产生重码的话,只需使用重码窗来挑选即可。
5.词组输入规则为两字词取首字首码+首字次码+次字首码+次字次码三字词取首字首码+首字次码+次字首码+三字首码三字以上词取首字首码+次字首码+三字首码+末字首码只有一个编码元素的单字,其组词的次码取其首码的重复。
6.依照汉字的使用频率的高低编制一二三级简码,使用频率越高,简码级别越高。每个简码对应十个汉字,这十个汉字可以同时在提示窗中显示,输入时只需选数字,不需翻页。
全文摘要
一种基本笔顺类计算机汉字输入法及其键盘,其特征在于依据且只依据《现代汉字通用字笔顺规范》取码,利用所定义的30个双笔顺元素对应到25个英文字母健位进行汉字输入,并参考汉字的使用频率,充分利用计算机的人机交互功能及10个数字键位资源编制简码,每个简码对应10个汉字,GB2313—80字符集中汉字的简码率为84%。本发明能做到不仅易学,而且打得快,还能处理所有的汉字,是具有世界领先水平的计算机汉字输入法。
文档编号G06F3/023GK1251925SQ99124620
公开日2000年5月3日 申请日期1999年11月20日 优先权日1999年11月20日
发明者云惟健 申请人:云惟健
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1