五笔输入组词方法

文档序号:6608215阅读:1493来源:国知局
专利名称:五笔输入组词方法
技术领域
本发明涉及一种五笔输入组词方法,特别是涉及一种按五笔字型输入法规则连续输入 每个汉字的汉字编码后自动生成词组的五笔输入组词方法。
背景技术
20年前,五笔与拼音相比,由于其几乎没有重码,因此在输入速度上存在着明显的 优势。但近几年来,拼音输入法在不断的完善。用户自定义词组、词频调整、简拼等功能 都成为了第二代拼音输入法的基本功能。这些新加入的功能大大提高了拼音的输入效率, 在不少场合下,拼音的输入速度已经超过了五笔。
因此,如果五笔要保留现有的用户群,迫切需要加入一些新功能,来解决现有的一些 缺陷,进一步提高输入效率。当用户输入的编码没有全匹配的词组时,五笔也可以象拼音 一样选择相应的字组成词组。要求能把用户输入的编码前4位对应的所有单字一一列出, 当用户选择字时,编码中相应的编码被替换成汉字,然后重复同一步骤直到所有编码都匹 配完成。
词库的精确度,是输入法提高效率的关键。换句话说,词库虽然大,但缺少用户最关 心的词仍然提升不了输入效率。体现在五笔上,虽然它有着低重码的先天优势,但缺少用 户自定义词组这一功能,导致了词库虽然可以做得很大,但精确度仍达不到另人满意的程 度。

发明内容
本发明的目的是提供一种五笔输入组词方法,特别是提供一种按五笔字型输入法规则 连续输入每个汉字的汉字编码后自动生成词组的五笔输入组词方法。本发明解决了五笔字 型输入法不能主动组词、输入效率无法提高的问题,弥补了现有技术不能体现输入个性化 的不足。
本发明的一种五笔输入组词方法是按五笔字型输入法规则输入每个汉字的汉字编码, 可以连续输入超过四个以上的汉字编码,所有输入的汉字编码按输入顺序选择确定汉字后 组成一个词组,并生成词组编码。
作为优选的技术方案-如上所述的五笔输入组词方法,其中,所述的方法包括以下步骤
1) 用户使用五笔字型输入法连续输入汉字编码,输入法控制模块记录用户输入的汉 字编码到输入缓存,输入缓存由字队列与编码队列组成,编码队列存放末匹配的编码,字 词队列存放匹配后的字词;字词队列的尾部与编码队列的首部连接,组成输入缓存;
2) 分析输入缓存,准确的说,分词模块实际上是分析编码队列,找到其中所有能够 匹配字的编码;所说的编码队列与编码队列是存储编码的数据结构,新输入的编码,按照 输入的先后次序,加入到队列的尾部,匹配的编码从队列的头部被移走,并放入字词队列的 尾部;所说的匹配是指编码能够从词库中找到对应的字或词;
3) 取得分析结果,分词模块返回编码队列中所有能够匹配字的编码;
4) 获得候选字,输入法控制模块根据前一步的分析结果,从词库取到匹配的候选字 词列表;
5) 返回候选字词列表,词库将候选字词列表返回给输入法控制模块;
6) 显示用户输入与候选字或词,输入法窗口模块显示前一步返回的候选字词列表;
7) 用户选择候选字或词,用户从候选字词列表中选择需要的字或词;
8) 找到用户选择的候选字或词,输入法控制模块从候选字列表中找出用户选择的字
或词;
9) 返回候选字或词,词库模块返回找到的字或词给输入法控制模块;
10) 输入法控制模块,将匹配的字或词加入字词队列,同时将匹配的编码从编码队列 中移除。显示更新后的输入缓存,输入法窗口显示最新的输入缓存;
11) 编码队列空了以后,输入法模块把字栈中的词组加入到词库中去;
12) 输入法模块分析加入到词库中的词组,将词组拆分成字,找到字的各种编码,再 按照对应的编码组词规则(Todo),生成新的词组编码;
13) 词组编码加入到词库,与词组对应。
如上所述的五笔输入组词方法,其中,所述的五笔输入法是汉字五笔输入法,包括王 码、万能、陈桥智能、极点、念青、快乐、幸福和极品五笔五笔输入法。
如上所述的五笔输入组词方法,其中,所述的词组编码包括五笔简码、拼音简码、五 笔标准词组编码和拼音完整编码。
如上所述的五笔输入组词方法,其中,所述的候选字或词包括五笔输入法的一级简码、 二级简码、三位输入和四位输入所得到的字或词。
如上所述的五笔输入组词方法,其中,所述的候选字词列表以阿拉伯数字顺序标记排列,用户选择候选字或词时只需输入候选字或词所对应的阿拉伯数字即为选中。
如上所述的五笔输入组词方法,其中,所述的词组在被再次输入时,这个词组将出现 在候选字词列表的第一位,或从候选字词列表的末位开始将这个词组前移若干位,列表中 位于这个字或词之后的字或词都相应按顺序往后移一位,也就是说,假如产生的新词组的 编码与原有编码有重码现象,则新词组作为常用词组前置,如果下次用户再次输入相同编 码,这个词组将出现在候选字词列表的第一位,或从候选字词列表的末位开始将这个词组 前移若干位,列表中位于这个字或词之后的字或词都相应按顺序往后移一位。
本发明的一种五笔输入组词方法,其中所述对应的编码组词规则(Todo)是一般词组编 码产生所遵循的原则,组词规则可分为完整编码规则与非完整编码规则。
非完整编码规则用户无需输入完整的词组编码,只需要按顺序输入词组中全部或部 分汉字编码的一部分,即能打出所需词组的规则。
完整编码规则用户需要输入所有汉字对应的完整编码,才能打出所需要词组。由于 该规则比较简单,不多做描述。
组词规则1:这个规则最具有代表性的例子就是以五笔、二笔为代表的形码。这些形
码的特点都是词组会用一个固定长度的编码去表示。
* 组词规则有若干个等式表示。
參等号左边为词组的汉字个数。其中e表示"等于",a表示"大于等于"(有且只有
这两个设置)。
參等号右边为规则,其中p指正序,n指逆序。如pll指第一个字的第一个编码, nil则是指最后一个字的第一个编码。
* 组词规则的数目应该比码长小1 e2=pll+pl2+p21+p22 e3=pll+p21+p31+p32 a4=pll+p21+p31+nll
组词规则2:这个规则最具有代表性的例子就是本专利中提及的五笔组词方法。
* 组词规则有若干个等式表示。
參等号左边为词组的汉字个数。其中e表示"等于",a表示"大于等于"(有且只有 这两个设置)。
等号右边为规则,其中p指正序,n指逆序。如pll指第一个字的第一个编码, nil则是指最后一个字的第一个编码。
* 组词规则的数目应该比码长小1 e2=pll+p21
e3=pll+p21+p31 e4=pll+p21+p31+p41 e5=p11+p21+p31+p41+p51en=pll+p21+p31+p41+p51+......+pnl(注此公式内的n表示下标,而非逆序)
组词规则3:这个规则最具有代表性的例子就是拼音。 声母简拼或声母的首字母简拼。
例如"王正明"可以通过声母简拼的方式,利用"wzhm"打出;也可以通过首字母 简拼,利用"wzm"打出。
本发明的有益效果是
本发明的一种五笔输入组词方法,解决了长久以来五笔输入法无法在使用中,向词库 加入用户词组的难题。这个新的功能,使得五笔用户能把一些经常使用的词组加入到词库 中去,大大提高了输入的准确率与速度。
多种组词规则的支持,使得一个词组进入词库后会有多种输入编码与之对应。用户可 以选择最简便或最合适的输入编码进行输入。如,虽然用户通过五笔的方式加入了 "斤斤 计较"这个成语,但由于词库中还存在着相应的拼音简码,使得用户可以只输入"jjjj", 就能找到需要的词。
突破4位编码的限制,使得五笔用户也能享受到同拼音一样的整句输入功能。这个功 能能够加快用户输入短语的速度,输入法还可由此通过用户输入的上下文,来智能预测下 一个有可能的输入。
具体实施例方式
下面结合具体实施方式
,进一步阐述本发明。应理解,这些实施例仅用于说明本发明 而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术 人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限 定的范围。
本发明的一种五笔输入组词方法是按五笔字型输入法规则输入每个汉字的汉字编码, 可以连续输入超过四个以上的汉字编码,所有输入的汉字编码按输入顺序选择确定汉字后 组成一个词组,并生成词组编码。其中,所述的方法包括以下步骤-
1) 用户使用五笔字型输入法连续输入汉字编码,输入法控制模块记录用户输入的汉 字编码到输入缓存,输入缓存由字队列与编码队列组成,编码队列存放末匹配的编码,字 词队列存放匹配后的字词;字词队列的尾部与编码队列的首部连接,组成输入缓存;
2) 分析输入缓存,准确的说,分词模块实际上是分析编码队列,找到其中能够匹配 字的编码;3) 取得分析结果,分词模块返回编码队列中所有能够匹配字的编码;
4) 获得候选字或词,输入法控制模块根据前一步的分析结果,从词库取到匹配的候 选字词列表;
5) 返回候选字词列表,词库将候选字词列表返回给输入法控制模块;
6) 显示用户输入与候选字,输入法窗口模块显示前一步返回的候选字词列表;
7) 用户选择候选字或词,用户从候选字词列表中选择需要的字或词;
8) 找到用户选择的候选字或词,输入法控制模块从候选字词列表中找出用户选择的 字或词;
9) 返回候选字或词,词库模块返回找到的字或词给输入法控制模块;
10)输入法控制模块,将匹配的字词加入字词队列,同时将匹配的编码从编码队列中 移除。同时更新输入缓存,输入法窗口显示最新的输入缓存; 显示更新后的输入缓存,输入法窗口显示最新的输入缓存;
11) 编码队列空了以后,输入法模块把字栈中的所有字组成词组加入到词库中去;
12) 输入法模块分析加入到词库中的词组,将词组拆分成字,找到字的各种编码,再 按照对应的编码组词规则,生成新的词组编码;
13) 词组编码加入到词库,与词组对应。
如上所述的五笔输入组词方法,其中,所述的五笔输入法是汉字五笔输入法,包括王 码、万能、陈桥智能、极点、快乐、幸福、极点、念青和极品五笔五笔输入法;所述的词 组编码包括五笔简码、拼音简码、五笔标准词组编码和拼音完整编码;所述的候选字包括 五笔输入法的一级简码、二级简码、三位输入和四位输入所得到的字词;所述的候选字列 表以阿拉伯数字顺序标记排列,用户选择候选字时只需输入候选字所对应的阿拉伯数字即 为选中;所述的词组在被再次输入时,这个词组将出现在候选字词列表的第一位,或从候 选字词列表的末位开始将这个词组前移若干位,原先列表中位于这个字或词之后的字或词 组都相应按顺序往后移一位,也就是说,假如产生的新词组的编码与原有编码有重码现象, 则新词组作为常用词组前置,如果下次用户再次输入相同编码,这个字或词将出现在候选 字词列表的第一位,或从候选字词列表的末位开始将这个词组前移若干位,原先列表中位 于这个字或词之后的字或词都相应按顺序往后移一位。
如用户需要打出"王正明"这个词并在以后经常会用到,此时可以按五笔字型输入法 一次性把"王"、"正"、"明"三个字的汉字编码连续输出,在编码对应汉字选择结束后自 动组成了词组;具体操作如下"王"、"正"、"明"三个字的汉字编码分别是"gggg"、 "ghd"和"je"; 连续输入"王"、"正"、"明"三个字的汉字编码"ggggghdje";
把"g"、 "gg"、 "ggg"所代表的简码字以及"gggg"所代表的字和词全部按次序列出
1、 一 2、五3、王(ggg) 4、王(gggg) 5、五一 6、琵琶7、平平静静; 选择4,编码中相应的"gggg"被替换成"王",编码显示为"王ghdje";
把"g"、 "gh"、 "ghd"所代表的简码字以及"ghdj"所代表的字和词全部按次序列出
1、 一 2、下 3、正
选择3,编码中相应的"ghd"被替换成"正",编码显示为"王正je"; 把"j"、 "je"所代表的简码字全部按次序列出1、是2、明
选择2,编码中相应的"je"被替换成"明",编码显示为"王正明",所有编码都匹配
完成;
文档上显示出"王正明"三个字,并自动组成词组且生成编码。当用户需要再次输入 "王正明"的时候,用户可以使用4种编码ggj (五笔简码)、wzm (拼音简码)、ggje (五 笔标准词组编码)和wangzhengming(拼音完整编码)来输入,当然也可以输入"ggggghdje"。
权利要求
1.一种五笔输入组词方法,是按五笔字型输入法规则输入每个汉字的汉字编码,其特征是可以连续输入超过四个以上的汉字编码,所有输入的汉字编码按输入顺序选择确定汉字后组成一个词组,并生成词组编码。
2. 如权利要求1所述的五笔输入组词方法,其特征在于,所述的方法包括以下步骤:1) 用户使用五笔字型输入法连续输入汉字编码,输入法控制模块记录用户输入的汉 字编码到输入缓存,输入缓存由字队列与编码队列组成,编码队列存放末匹配的编码,字 词队列存放匹配后的字词;字词队列的尾部与编码队列的首部连接,组成输入缓存;2) 分析输入缓存,准确的说,分词模块实际上是分析编码队列,找到其中能够匹配 所有字或词的编码;3) 取得分析结果,分词模块返回编码队列中所有能够匹配的编码;4) 获得候选字词,输入法控制模块根据前一步的分析结果,去词库中査找匹配的候 选字词列表;5) 返回候选字词列表,词库将候选字词列表返回给输入法控制模块;6) 显示用户输入与候选字词,输入法窗口模块显示前一步返回的候选字词列表;7) 用户选择候选字或词,用户从候选字词列表中选择需要的字或词;8) 找到用户选择的候选字或词,输入法控制模块从候选字词列表中找出用户选择的 字或词;9) 返回候选字或词,词库模块返回找到的字或词给输入法控制模块;10) 输入法控制模块,将匹配的字或词加入字词队列,同时将匹配的编码从编码队 列中移除,同时显示更新后的输入缓存,输入法窗口显示最新的输入缓存;11) 编码队列空了以后,输入法模块把字栈中的所有内容做为词组加入到词库中去;12) 输入法模块分析加入到词库中的词组,将词组拆分成字,找到字的各种编码, 再按照对应的编码组词规则,生成新的词组编码;13) 词组编码加入到词库,与词组对应。
3. 如权利要求1或2所述的五笔输入组词方法,其特征在于,所述的五笔字型输入 法是汉字的五笔输入法,包括王码、万能、陈桥智能、极点、快乐、幸福、极点、念青和 极品五笔输入法。
4. 如权利要求1或2所述的五笔输入组词方法,其特征在于,所述的词组编码包括 五笔简码、拼音简码、五笔标准词组编码和拼音完整编码。
5. 如权利要求1或2所述的五笔输入组词方法,其特征在于,所述的候选字或词包 括五笔输入法的一级简码、二级简码、三位输入和四位输入所得到的字词。
6. 如权利要求1或2所述的五笔输入组词方法,其特征在于,所述的候选字列表以 阿拉伯数字顺序标记排列,用户选择候选字时只需输入候选字所对应的阿拉伯数字即为选 中。
7. 如权利要求1或2所述的五笔输入组词方法,其特征在于,所述的词组在被再次 输入时,这个词组将出现在候选字词列表的第一位,或从末位开始将这个词组在候选字词 列表中前移若干位,列表中位于这个字或词之后的字或词组都相应按顺序往后移一位。
全文摘要
本发明提供了一种五笔输入组词方法,特别是提供一种按五笔字型输入法规则连续输入每个汉字的汉字编码后自动生成词组的五笔输入组词方法。本发明的一种五笔输入组词方法是按五笔字型输入法规则输入每个汉字的汉字编码,可以连续输入超过四个以上的汉字编码,所有输入的汉字编码按输入顺序选择确定汉字后组成一个词组,并生成词组编码。本发明解决了五笔字型输入法不能主动组词、输入效率无法提高的问题,弥补了现有技术不能体现输入个性化的不足。
文档编号G06F3/023GK101303625SQ20081004022
公开日2008年11月12日 申请日期2008年7月4日 优先权日2008年7月4日
发明者林国栋, 林正昱, 王正明 申请人:上海埃帕信息科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1