汉字键盘输入用自动组词方法

文档序号:6601549阅读:3672来源:国知局
专利名称:汉字键盘输入用自动组词方法
技术领域
本发明涉及一种计算机汉字键盘输入用的自动组词方法。
汉字键盘输入技术中大量地采用词组,是方便使用、提高速度的重要手段,为提高词组的命中率,现有的技术只是简单地增加词组的数量,这样又带来了词组重码多、系统开销大的新弊病,况且既使是很大的系统词库也无法提供全部所需的词组。
本发明的目的在于提供一种新的自动组词方法,使大量使用词组成为可能。
本发明的方法与传统的汉字输入技术不同,该方法用于输入连续的汉字文本时,在选中单字或词组的同时,在软件中专门的缓冲区内保存与选中单字或词组相关的特征信息,作为将来组词的素材,在一个生词或一段连续文本第二次使用时,即可作为一个词组来输入,而直接得到用本发明的方法组成的词组。
该方法具备如下特征1.有一个随输入过程自动更新的缓冲区,它由代码区、属性区和文字区共三部分组成,分别保存选中单字或词组的输入代码、组词属性和实际选中的汉字文本。三者之间是一种简单的对应关系;2.以缓冲区内容为素材组成所需的词汇,而与缓冲区以外内容无关;
3.组词时按以下规则及顺序进行在缓冲区中寻找与输入码匹配的代码串;判定代码串对应的组词属性是否合法;将有效代码串对应的文本取出送提示行显示。
4.组词属性是描述缓冲区内容是否可用于组词的标志。对于一个选中的词组,其第一个字(词头)可用于组成词组的词头,其末一个字(词尾)可用于词组的词尾,词的中间部分只能用于词组的中间部分,反之则属于非法。对于一个被选中的单字,被描述为既可用于词组的词头也可用于词组的词尾。
5.对于一个较长的词组,可以用较少的键数(例如4-5键),按系统规定的输入方法来确定词组的词头、词尾及词的中间部分,进而确定整个词组。
6.标点符号、字母、数字也可以同汉字一样赋予一定的编码,并按照以上的描述成为词组的一部分。
7.最近使用的单字可直接由缓冲区中取出,并使之位于提示行的靠前位置,便于用户查找。
下面举例说明本发明的自动组词方法文本区中华人民共和国专利局位于北京蓟门桥代码区z h r m g h g z l j w y b j j m q属性区h e h e h o e h e he h e h e he he he在上例中,属性区中的h表示该字的属性为词头,e表示该字的属性为词尾,o表示该字的属性为中间。按照上述的方法,在以上句子中,“中华人民”、“人民共和国”、“蓟门桥”、“北京蓟门桥”、“专利局位于”等都是合法的词组,而“华人民”、“利局位于”、“专利局位”等都属于非法的词组,在系统中不会出现。
权利要求
1.一种计算机汉字键盘输入用的自动组词方法,其特征在于,该方法在用于输入连续的汉字文本时,在选中单字或词组的同时,在软件缓冲区内保存与选中单字或词组相关的特征信息,作为将来组词的素材,如果一个生词或一段连续文本第二次使用,即可作为一个词组来输入,用上述素材和本发明的方法自动组成一个词组。
2.根据权利要求1所述的方法,其中的软件缓冲区是一个可随输入过程自动更新的缓冲区,它由代码区、属性区和文本区共三部分组成,分别保存选中单字或词组的输入代码、组词属性和实际选中的汉字文本,三者之间是一种简单的对应关系。
3.根据权利要求1或2所述的方法,其中的素材是指缓冲区三部分的全部内容。
4.根据权利要求1所述的自动组词方法,其特征在于,是以缓冲区内容为素材组成所需的词汇,而与缓冲区以外的内容无关。
5.根据权利要求1所述的组词方法,其特征在于组词时按以下规则及顺序进行a.在缓冲区中寻找与输入代码匹配的代码串;b.判定代码串对应的组词属性是否合法;c.将有效代码串对应的文本取出送提示行显示。
6.根据权利要求2所述的方法,其特征在于其中的组词属性是描述缓冲区内容是否可用于组词的标志,对于一个被选中的词组,其第一个字(词头)被描述为可用于组成词组的词头;其末一个字(词尾)被描述为可用于词组的词尾;词的中间部分被描述为只能用于词组的中间部分;反之则属于非法。
7.根据权利要求2所述的方法,其特征在于对于一个被选中的单字,其组词属性被描述为既可用于词组的词头也可用于词组的词尾。
8.根据权利要求1所述的自动组词方法,其特征在于对于一个较长的词组,可以用较少的键数,按系统规定的方法来确定词组的词头、词尾及词的中间部分,进而确定整个词组。
9.根据权利要求1所述的自动组词方法,其特征在于标点符号、字母、数字也可以同汉字一样赋予一定的代码,并按照以上的描述成为词组的一部分。
10.根据权利要求1所述的自动组词方法,其特征在于组词是完全自动进行的,不需要额外的人工干预即可获得所需的词组。
11.根据权利要求1所述的自动组词方法,其特征在于单字作为最短的词组,可直接由缓冲区中取出,并使之位于提示行的靠前位置,便于用户查找。
全文摘要
本发明公开了一种计算机汉字键盘输入用的自动组词方法。在连续输入汉字文本的同时,将选中文本的相关特征保存在软件的对照缓冲区内,当一个生词或一段连续文本第二次使用时,即可用缓冲区中的内容作为素材自动组成一个词组。同样地,一个或数个短词组也可以组成一个更长的词组。将该方法用于传统上认为重码很多的拼音类输入法,实际使用时可提供大量的系统没有提供的词组,除少数所谓的“高频字”外,很少用到离散的单字,因此可大大加快汉字的输入速度。
文档编号G06F3/023GK1153335SQ95108878
公开日1997年7月2日 申请日期1995年9月1日 优先权日1995年9月1日
发明者侯伟华 申请人:侯伟华
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1