一种简便快速的重码汉字输入方法

文档序号:6600513阅读:684来源:国知局
专利名称:一种简便快速的重码汉字输入方法
技术领域
本发明涉及一种重码汉字输入方法以及与此相关的重码处理方法,利用这种方法可以方便、快速地输入重码汉字。这种方法适用于任何汉字编码输入重码汉字的场合。
汉字输入是计算机汉字信息处理中的一项重要课题,通常采用小键盘汉字编码输入方法。由于汉字数量多,编码中往往遇到重码,即一个代码对应一个以上的汉字,当遇到重码时就不能根据代码唯一地确定汉字,还需要进一步处理重码。绝大多数汉字编码都有重码,有重码就会影响输入速度,重码率越高影响的越大,怎样处理重码就成为汉字输入中的关键问题,重码处理得好坏直接影响汉字输入的效率。
通常采用以下三种方法处理重码。第一种方法就是通过人机对话选择汉字,当遇到重码时,提示全部或部分重码汉字,根据每个汉字的提示序号按键选择。这种方法简单,但是重码多时要反复地选择汉字,影响了汉字输入速度。第二种方法是在词组中确定汉字,输入词组第一个汉字的代码时,如果遇到重码,不必选择,接着输入第二个汉字的代码,即使再遇到重码也不必选择,能够在词组中确定这两个汉字。前一个重码由后一个汉字确定,后一个汉字由前一个汉字确定,不需要人机对话选择。这种方法比较方便,也可以提高输入速度,但是它对不能组词的汉字无能为力,而且有时侯也有重码的情况,还需要通过人机对话再选择。第三种方法通过增加编码规则减少重码。编码规则越多,重码出现的越少,重码少可以提高输入速度,但是这种处理方法由于增加了编码规则,使编码难以掌握,使用起来比较困难。具体操作中一般把三种方法结合使用,在编码中增加一些规则,降低重码率;在输入汉字时采用词组输入,用词组确定部分重码汉字;余下的重码汉字用人机对话方法处理。即使这样,现有的重码汉字处理方法还是不能方便、快速地输入重码汉字。
《汉字读音编码及其集中处理重码法》(专利申请号93117951.3)提出了给重码汉字加标识、通过重码标识处理重码的方法。这种方法分离了汉字输入操作和重码处理操作,在输入中遇到重码不必马上选择,面是先输入一个代表汉字,并且给这个代表汉字加上重码标识(内部码第二字节的最高位为0)。最后再把全部带重码标识的汉字集中到一起统一处理。这种方法的优点在于实现了重码汉字的盲打输入,即使有较多的重码也能象没有重码一样输入,因此加快了输入速度。但是这种方法要改变汉字的内部码,与通常使用的双高位均为1的汉字内部码(国标码)有区别,在处理汉字信息时必须考虑重码标识,不能与现有的汉字处理软件兼容,因此使用起来不太方便。
本发明提供一种不必加重码标识便可以集中处理重码的方法。输入重码汉字不必马上选择,临时输入一个使用频度最高的代表重码字,不必给这个代表字加上重码标识,它的内部码结构与非重码汉字的内部码结构完全一致。输入若干汉字后再集中处理其中的重码汉字,也就是把临时输入的代表重码字经过选择替换成打算输入的汉字。对于重码汉字不是根据重码标识而是根据一张代表重码字表来查找。
以拼音码为例说明重码汉字的输入方法和重码处理方法。首先要有三个相互关联的数据表,这三张表用来输入重码汉字和处理重码,基本结构如下代码 代表重码字对应重码字a阿啊呵吖钶腌嗄ai 爱埃碍哀矮挨哎…an 安按案暗岸氨胺…重码就是对应两个以上汉字的代码,代表重码字就是一组重码字中使用频度最高的汉字,对应重码字是一组重码字中除了代表重码字外的其余重码字。三个表之间有内在的联系,代码与代表重码字一一对应,从代码或代表重码字可以查到对应重码字。例如输入“阿”时,输入代码a并键入空格键结束本次代码输入,由转换程序去代码表中查找a,可以根据这个代码在表中的位置找到代表重码字“阿”和其余对应重码字。这是一个重码汉字,使用集中处理重码方法就不必通过人机对话选择,面是出程序自动先把这个代表重码字“阿”输入,在内部码中不加任何标识,然后继续输入下一个汉字。临时输入的只是这组重码字中的代表重码字,代表重码字可能与所要输入的汉字不同,如输入“啊”字时暂时输入的是代表字“阿”。这样输入的好处在于不必选择重码汉字,即使是重码汉字也可以盲打输入,加快了输入速度。
按照这种方法输入完一段汉字后,用一个专用程序来查找其中的重码汉字。查找重码汉字时不是根据重码标识,面是根据代表重码字表,可以根据代表重码字表区别重码汉字和非重码汉字。专用程序自动测试字符内部码,如果找到一个汉字,就去查代表重码字表,看它是否为代表重码字,如果不是代表重码字就是非重码汉字,没有处理重码的必要;如果是代表重码字,就根据这个代表重码字查到其它对应重码字,用重码处理方法确定所要输入的汉字,把代表重码汉字替换成确定的汉字,这就完成了重码处理。例如查到“阿”字时,去代表重码字表中查找,找到了“阿”字,说明这是一个重码汉字,再根据代表重码字和对应重码字的关联查到其余重码字,利用人机对话等方法选择所要输入的汉字。把不确定的代表重码字替换成选定的汉字,完成了最后的输入。
现有的汉字编码输入方法通常一次性输入重码汉字,遇到重码时马上用人机对话方法选定之后输入。采用集中处理重码方法可以分两步输入一个重码汉字。第一步输入代表重码字时不必看屏选字,有很多重码也可以盲打输入,提高了速度。第二步处理重码时可以借助下面介绍的方法方便、快速地确定所要输入的重码汉字。分两步输入一个重码汉字比一次性输入一个汉字更方便、更快速,在输入大量文字时这个优点表现得更加明显。
在查找重码、确定汉字时可以使用以下几种方法。
(1)连续处理同一个重码。
在汉字文件中,一个重码汉字往往重复出现许多次,一个一个地确定这些重码汉字非常麻烦,许多都是不必要的重复劳动。本发明提供的连续处理同一个重码的方法可以方便、快速地确定重复出现的重码汉字。
查重程序根据代表重码字表(或重码标识)查找重码字,找到重码字后根据代表重码字查到其余对应重码字,用简单的人机对话方法选择确定这个重码汉字。这是集中处理重码的基本方法。连续处理同一个重码的方法就是根据这个基本方法连续处理完一个汉字文件中多次出现的同一个重码。在处理重码过程中,查找并处理完一个重码汉字之后,在文件中继续查找这个重码汉字进行处理,对其他重码汉字暂时不做处理,直到全部处理完文件中出现的这个重码汉字,再去处理其他重码汉字。例如在一段文字中重复出现几次代表重码字“阿”,面且不是连续出现的,中间还隔有其他汉字,在处理重码时,第一次查到代表重码字“阿”,根据代表重码字找到其他对应重码字,选择所要输入的汉字,接下来继续寻找“阿”字并处理,处理完全部“阿”字之后再去处理其他重码汉字。
连续处理同一个重码时,在提示行中出现的重码字及其序号位置完全一样,选择一次或几次之后,可以短时记忆某个汉字的序号。由于连续选择同一组重码汉字,中间不处理其他重码,面且往往选定的是同一个汉字,所以不必看提示行,根据短期记忆可以正确地选择所要输入的汉字。不必反复地看提示行,这就减少了找字的负担,加快了处理重码的速度。在具体的操作中,也可以一次选定多次重复出现的重码汉字,例如在一段文字中有许多“阿”字,当第一次选定“阿”字之后,以下就自动选择“阿”字,不需要操作者的干预。也可以只选定同一词组中出现的重码汉字,例如在“阿姨”这个词中选定“阿”字之后,以下查找“阿”字时,检测后一个汉字是否为“姨”字,如果是“姨”字便自动选定前一个汉字为“阿”字。这样处理更方便,也更快。
处理重码时可以把提示信息移到正在处理的汉字附近,这样选择重码汉字就更方便。在处理重码时也可以只显示包含所处理的汉字在内的一小段文字,例如前后各三个字,根据前后几个字就可以确定所要输入的汉字,其他文字都不显示,面且把这一小段文字显示在固定的位置上,可以避免其他无用信息的干扰。
(2)利用鼠标器、光笔等设备处理重码。
输入重码汉字时暂时输入一个代表重码字,要输入的可能是这个代表汉字,也可能是其他汉字,如果所要输入的是这个作为代表重码字的汉字,那么就不必替换这个汉字。上述方法(1)对全部重码汉字都要选择一次,即使代表重码字就是所要输入的汉字也得选择一下,这也是不必要的重复劳动。因为代表重码汉字是一组重码汉字中使用频度最高的汉字,所以很多时侯暂时输入的代表重码字就是所要输入的汉字,只须处理其他需要替换的代表重码汉字。利用鼠标器、光笔等设备可以做到这一点。
具体方法是把鼠标器或光笔指向要替换的汉字,并且选取这个汉字,程序自动识别这个汉字,根据代表重码字表判断这个汉字是否为重码汉字,如果是重码汉字,就根据这个代表重码字查找其他对应重码字,在这个代表字下面开一个小窗口,把重码汉字和序号显示在内,利用鼠标器、光笔或键盘选择处理。因为减少了选择次数,也提高了处重码的速度这种方法可以借助于任何能够移动光标的设备实现。
(3)智能处理重码。
一个重码汉字可以在词语中确定,智能处理重码的方法就是要在词组和语句中确定重码汉字。具体方法如下专用的查重程序根据代表重码字表或重码标识自动查找重码汉字,找到重码汉字后,再取前一个汉字和后一个汉字,如果前一个汉字或后一个汉字是重码汉字,则根据代表重码字查到其他对应重码字。首先根据一张词组表,检测前一个汉字与正在处理的重码汉字能否构成词组,要对一组重码字中的每一个都检测一次,并记录检测结果。然后用同样的方法检测后一个汉字与正在处理的重码汉字能否构成词组,要对一组重码字中的每一个都检测一次,并记录检测结果。根据检测结果做如下判定如果在检测的全部重码汉字中,只有一个汉字可以与前一个汉字或后一个汉字组成词组,那么这个词组中的汉字就是所选的汉字,程序用这个选定的汉字自动替换代表重码汉字;如果在检测的全部重码汉字中,没有一个汉字可以与前一个汉字或后一个汉字组成词组,那么不自动选择重码字;如果在检测的全部重码汉字中,有一个以上汉字可以与前一个汉字或后一个汉字组成词组,那么不自动选择重码字。由于智能方法能够根据词组和语法自动选定重码汉字,所以大大地提高了重码汉字的处理速度。用来检测构词情况的词组表应该包含所有的常用词组,根据需要还应有相应的专业词组和个人词组,词量在一万至三万之间比较合适。智能处理方法还可以增加语法判断,进一步增进智能处理的可靠性。不能由智能方法确定的重码汉字可以用方法(1)和方法(2)处理。
结合使用这三种方法可以方便、快速地处理重码。
由于不同的汉字编码中的重码不同,相应地代表重码字和对应重码字也不一样,只有根据输入汉字时使用的代表重码字表和相应的对应重码字表才能正确处理重码。
本发明提供的重码汉字输入方法和三种重码处理方法独立于任何汉字编码方案,只要编码有重码都可以利用它方便、快速地输入重码汉字。可以在操作系统中使用,也可以在汉字编辑软件中使用,甚至所有涉及汉字输入的软件都能够使用。
这种方法分两步输入一个重码汉字,也能实现重码汉字的盲打输入,即使有较多重码也不影响输入速度。可以使简单的汉字编码获得较快的输入速度,解决了汉字输入中简单与快速的矛盾。
本发明提供的重码汉字输入方法与《汉字读音编码输入及其集中处理重码法》的根本区别在于不给重码汉字加重码标识。因为不改变汉字内部码,所以与现有的汉字信息处理软件完全兼容,使用起来更方便。在汉字输入中重码汉字和非重码汉字没有区别,在查找重码汉字时不是根据重码标识,面是根据代表重码字表判定是否重码汉字。并且为这种重码汉字输入方法提供了三种重码处理方法,比起《汉字读音编码输入及其集中处理重码法》的人机对话方法更方便、更快速。这三种重码处理方法使得汉字输入真正实现了简单和快速的统一。
权利要求
1.重码汉字输入方法及其重码处理方法,其特征是利用重码与代表重码字的关系以及代表重码字与其对应重码字的关系分两步输入一个重码汉字,首先输入不带重码标识的代表重码字,然后根据代表重码字表判断哪些汉字是重码字,并从代表重码字找到其对应重码字,利用重码处理方法确定所要输入的汉字。
2.根据权利要求1,把汉字编码中的重码、代表重码字、对应重码字制成数据表,这个数据表供汉字输入程序和重码处理程序使用,其中重码和代表重码字一一对应,从重码或代表重码字可以查到与其对应的重码字。
3.根据权利要求1或2,输入重码汉字时,根据重码与代表重码字的一一对应关系暂时输入代表重码字,这个代表重码字不带重码标识,其内码结构与非代表重码字一致。
4.根据权利要求1或2,查找重码汉字时利用重码代表字表判断汉字是否为代表重码字,如果是代表重码字就根据它与对应重码字的联系找到其余对应重码字,利用相应的重码处理方法确定所要输入的汉字。
5.根据权利要求4,用下面的几种方法处理重码(1)处理重码时连续处理同一个重码,全部处理完这个重码之后再去处理其他重码;(2)处理重码时,把查到的对应重码字及其序号显示在代表重码字的下面或上面,以便选择;(3)处理重码时,利用鼠标器、光笔等外部设备把光标移动到代表重码字处,并选取这个汉字,查到其对应重码字并显示出来,选择所要输入的重码汉字;(4)处理重码时利用汉字词组和汉语语法智能确定重码汉字,首先由程序自动寻找代表重码字。并查到其对应重码字,再判断代表重码字和对应重码字是否与前后汉字构成词组,同时判断是否符合汉语语法,能够唯一地与前一字或后一字组成词组,并且符合汉语语法,那么程序自动选择这个重码汉字。
全文摘要
本发明提供一种方便、快速地输入重码汉字的方法。输入重码汉字时首先输入不加重码标识的代表重码字,然后根据代表重码字表判断哪些汉字是重码汉字,哪些汉字不是重码汉字,根据代表重码字与对应重码字的联系,利用方便的重码处理方法确定其中的重码汉字。这种方法适用于任何汉字编码输入重码汉字的场合。
文档编号G06F3/023GK1122468SQ9510108
公开日1996年5月15日 申请日期1995年1月17日 优先权日1995年1月17日
发明者兰久富 申请人:兰久富
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1