一种输入纠错方法和装置、一种用于输入纠错的装置与流程

文档序号:14194891阅读:203来源:国知局
一种输入纠错方法和装置、一种用于输入纠错的装置与流程

本发明涉及计算机信息输入技术领域,特别是涉及一种输入纠错方法和装置、一种用于输入纠错的装置。



背景技术:

目前,涉及交互的设备,通常需要用户通过输入法系统将自己的操作意图与设备交互识别。例如,用户可以通过键盘键入输入串,然后由输入法系统依据其预置的标准映射规则将该输入串转换为相应语言的候选项并展示,进而将用户选择的候选项上屏。

在实际应用中,用户很有可能因为按错键(pc上)或者点错屏幕位置(智能终端上)等原因而导致键入错误的输入串。输入纠错,正是针对上述错误的一种输入法系统解决方案,它能够主动识别用户的输入错误,并将错误的输入串纠正成正确的输入串,使用户在不需要修改输入串的前提下就能够输入正确的文字。

现有的输入纠错方案具体可以包括:基于编辑距离的纠错方案和基于统计的纠错方案;其中,基于编辑距离的纠错方案可以对输入串的每个位置进行如下纠错尝试:插入一个字符、删除一个字符、替换一个字符等,以产生该输入串对应的纠错候选;基于统计的纠错方案可以通过大数据挖掘生成纠错模型,该纠错模型可用于学习纠错候选被错输为输入串的概率。

发明人在实施例本发明的过程中发现,上述基于编辑距离的纠错方案和基于统计的纠错方案往往针对不同用户提供相同的纠错候选,并没有能力实现个性化的纠错,因此容易影响纠错的准确率。



技术实现要素:

鉴于上述问题,本发明实施例提出了一种克服上述问题或者至少部分地解决上述问题的输入纠错方法、输入纠错装置及用于输入纠错的装置,本发明实施例可以向符合提供符合个性化输入习惯的纠错候选,因此能够提高纠错候选的质量,同时提高纠错的准确率。

为了解决上述问题,本发明公开了一种输入纠错方法,包括:

获取输入过程中的输入串;

对所述输入串进行纠错处理,以得到所述输入串对应的纠错候选;

依据所述输入串对应的纠错候选和上下文,在用户多元词库中进行查找,以得到对应的查找结果;所述用户多元词库用于记录用户输入过的多元词组;

依据所述查找结果,对所述输入串对应的纠错候选进行排序;

向用户展现排序后的纠错候选。

可选地,所述在用户多元词库中查找的查找结果包括:命中的纠错候选、或者未命中的纠错候选,则所述依据所述查找结果,对所述输入串对应的纠错候选进行排序的步骤,包括:

依据所述查找结果,确定所述纠错候选的第二得分;其中,命中的纠错候选的第二得分大于零,未命中的纠错候选的第二得分为零;

将所述纠错候选的第二得分与所述纠错候选的第一得分进行相加处理,以得到第三得分;其中,所述第一得分依据所述纠错候选的属性特征得到;

依据所述第三得分对所述输入串对应的纠错候选进行排序。

可选地,所述在用户多元词库中查找的查找结果包括:命中的纠错候选、或者未命中的纠错候选,则所述依据所述查找结果,对所述输入串对应的纠错候选进行排序的步骤,包括:

依据所述查找结果,确定所述纠错候选的第四得分;其中,命中的纠错候选的第四得分大于1,未命中的纠错候选的第四得分小于1;

将所述纠错候选的第四得分与所述纠错候选的第一得分进行相乘处理,以得到第五得分;其中,所述第一得分依据所述纠错候选的属性特征得到;

依据所述第五得分对所述输入串对应的纠错候选进行排序。

可选地,所述方法还包括:

将预设值分别作为所述纠错候选对应的第二得分和/或第四得分;或者

依据所述用户多元词库中记录的多元词组的属性特征,确定所述纠错候选对应的第二得分和/或第四得分。

可选地,所述用户多元词组的属性特征包括如下特征中的至少一种:输入次数、历史输入时间和历史输入环境信息,则所述依据用户多元词库中记录的多元词组的属性特征,确定所述纠错候选对应的第二得分和/或第四得分的步骤,包括:

依据所述输入次数、所述历史输入时间与当前时间的差值、以及所述历史输入环境信息与当前输入环境信息之间的匹配度中的至少一种,确定所述纠错候选对应的第二得分和/或第四得分。

可选地,所述纠错候选的属性特征包括如下特征中的至少一种:所述纠错候选对应纠错串与所述输入串之间的编辑距离、所述纠错候选所对应词库的类型和所述纠错候选的词频。

可选地,当所述在用户多元词库中查找的查找结果包括:多个命中的纠错候选时,所述方法还包括:

依据所述用户多元词库中记录的多元词组的属性特征,对多个命中的纠错候选进行排序;

依据所述多个命中的纠错候选的排序结果,展现对应的纠错候选。

可选地,在所述对所述输入串进行纠错处理的步骤之前,所述方法还包括:

依据所述输入串对应的普通候选和上下文,在用户多元词库中进行查找;

当所述输入串对应的普通候选和上下文命中所述用户多元词库时,不执行所述对所述输入串进行纠错处理的步骤。

可选地,通过如下步骤建立所述用户多元词库:

记录用户的上屏内容;

从一次上屏内容或者连续的多次上屏内容中选择用户多元词组;

将所述用户多元词组及其对应的属性特征保存至用户多元词库。

可选地,所述从一次上屏内容或者连续的多次上屏内容中选择用户多元词组的步骤,包括:

从一次上屏内容或者连续的多次上屏内容中选择相邻的词组,作为用户多元词组;或者

从一次上屏内容或者连续的多次上屏内容中选择符合预置搭配条件的词组,作为用户多元词组。

另一方面,本发明公开了一种输入纠错装置,包括:

输入串获取模块,用于获取输入过程中的输入串;

输入串纠错模块,用于对所述输入串进行纠错处理,以得到所述输入串对应的纠错候选;

多元词库查找模块,用于依据所述输入串对应的纠错候选和上下文,在用户多元词库中进行查找,以得到对应的查找结果;所述用户多元词库记录有用户输入过的多元词组;

纠错候选排序模块,用于依据所述查找结果,对所述输入串对应的纠错候选进行排序;以及

纠错候选展现模块,用于向用户展现排序后的纠错候选。

可选地,所述在用户多元词库中查找的查找结果包括:命中的纠错候选、或者未命中的纠错候选,则所述纠错候选排序模块包括:

第二得分确定子模块,用于依据所述查找结果,确定所述纠错候选的第二得分;其中,命中的纠错候选的第二得分大于零,未命中的纠错候选的第二得分为零;

相加处理子模块,用于将所述纠错候选的第二得分与所述纠错候选的第一得分进行相加处理,以得到第三得分;其中,所述第一得分依据所述纠错候选的属性特征得到;

第一排序子模块,用于依据所述第三得分对所述输入串对应的纠错候选进行排序。

可选地,所述在用户多元词库中查找的查找结果包括:命中的纠错候选、或者未命中的纠错候选,则所述纠错候选排序模块包括:

第四得分确定子模块,用于依据所述查找结果,确定所述纠错候选的第四得分;其中,命中的纠错候选的第四得分大于1,未命中的纠错候选的第四得分小于1;

相乘处理子模块,用于将所述纠错候选的第四得分与所述纠错候选的第一得分进行相乘处理,以得到第五得分;其中,所述第一得分依据所述纠错候选的属性特征得到;

第一排序子模块,用于依据所述第五得分对所述输入串对应的纠错候选进行排序。

可选地,所述装置还包括:

得分预设模块,用于将预设值分别作为所述纠错候选对应的第二得分和/或第四得分;或者

得分确定模块,用于依据所述用户多元词库中记录的多元词组的属性特征,确定所述纠错候选对应的第二得分和/或第四得分。

可选地,所述多元词组的属性特征包括如下特征中的至少一种:输入次数、历史输入时间和历史输入环境信息,则所述得分确定模块包括:

匹配计算子模块,用于依据所述输入次数、所述历史输入时间与当前时间的差值、以及所述历史输入环境信息与当前输入环境信息之间的匹配度中的至少一种,确定所述纠错候选对应的第二得分和/或第四得分。

可选地,所述纠错候选的属性特征包括如下特征中的至少一种:所述纠错候选对应纠错串与所述输入串之间的编辑距离、所述纠错候选所对应词库的类型和所述纠错候选的词频。

可选地,当所述在用户多元词库中查找的查找结果包括:多个命中的纠错候选时,所述装置还包括:

命中候选排序模块,用于依据所述用户多元词库中记录的多元词组的属性特征,对多个命中的纠错候选进行排序;

展现模块,用于依据所述多个命中的纠错候选的排序结果,展现对应的纠错候选。

可选地,所述装置还包括:

查找模块,用于依据所述输入串对应的普通候选和上下文,在用户多元词库中进行查找;

执行处理模块,用于当所述输入串对应的普通候选和上下文命中所述用户多元词库时,不执行所述对所述输入串进行纠错处理的操作。可选地,当当所述输入串对应的普通候选和上下文未命中所述用户多元词库时,触发输入串纠错模块执行对所述输入串进行纠错处理的操作。

可选地,所述装置还包括:用于建立所述用户多元词库的建立模块;

所述建立模块包括:

记录子模块,用于记录用户的上屏内容;

选择子模块,用于从一次上屏内容或者连续的多次上屏内容中选择多元词组;以及

保存子模块,用于将所述多元词组及其对应的属性特征保存至用户多元词库。

可选地,所述选择子模块包括:

第一选择单元,用于从一次上屏内容或者连续的多次上屏内容中选择相邻的词组,作为多元词组;或者

第二选择单元,用于从一次上屏内容或者连续的多次上屏内容中选择符合预置搭配条件的词组,作为多元词组。

可选地,所述连续的多次上屏内容为通过连续上屏操作得到的内容,则所述装置还包括:用于确定所述连续上屏操作结束的结束确定模块;

所述结束确定模块包括:

第一结束确定子模块,用于在接收到针对预置结束按键的点击操作时,确定所述连续上屏操作结束;其中,所述预置结束按键包括:标点符号按键和/或退格键和/或空格键和/或功能按键;或者

第二结束确定子模块,用于在当前上屏操作与下一次上屏操作之间的时间间隔大于间隔阈值时,确定当前上屏操作为连续上屏操作的结束。

再一方面,本发明公开了一种用于输入纠错的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:

获取输入过程中的输入串;

对所述输入串进行纠错处理,以得到所述输入串对应的纠错候选;

依据所述输入串对应的纠错候选和上下文,在用户多元词库中进行查找,以得到对应的查找结果;所述用户多元词库记录有用户输入过的多元词组;

依据所述查找结果,对所述输入串对应的纠错候选进行排序;

向用户展现排序后的纠错候选。

本发明实施例包括以下优点:

本发明实施例在输入纠错过程中,依据输入串对应的纠错候选和上下文在用户多元词库中的查找结果,对纠错候选进行排序;由于用户多元词库用于记录用户输入过的多元词组,该多元词组能够反映用户的个性化输入习惯,故本发明实施例的排序可以将命中的纠错候选排在不命中的纠错候选的前面,或者,在正常得分的基础上增加命中的纠错候选的得分,换言之,本发明实施例将命中用户多元词库的纠错候选的位置提前,可以向符合提供符合个性化输入习惯的纠错候选,因此能够提高纠错候选的质量,同时提高纠错的准确率。进一步,将命中用户多元词库的纠错候选的位置提前,可以使用户在不翻页或者少翻页的情况下快速将所需的纠错候选上屏,因此能够提高输入效率。

附图说明

图1是本发明的一种输入纠错方法实施例一的步骤流程图;

图2是本发明的一种输入纠错方法实施例二的步骤流程图;

图3是本发明的一种输入纠错方法实施例三的步骤流程图;

图4是本发明的一种输入纠错方法实施例四的步骤流程图;

图5是本发明的一种输入纠错装置实施例的结构框图;

图6是本发明的一种用于输入纠错的装置900的框图;及

图7是本发明的一些实施例中服务器的结构示意图。

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。

方法实施例一

参照图1,示出了本发明的一种输入纠错方法实施例一的步骤流程图,具体可以包括如下步骤:

步骤101、获取输入过程中的输入串;

步骤102、对所述输入串进行纠错处理,以得到所述输入串对应的纠错候选;

步骤103、依据所述输入串对应的纠错候选和上下文,在用户多元词库中进行查找,以得到对应的查找结果;所述用户多元词库用于记录用户输入过的多元词组;

步骤104、依据所述查找结果,对所述输入串对应的纠错候选进行排序;

步骤105、向用户展现排序后的纠错候选。

本发明实施例可以应用于各种输入方式的输入法系统,例如上述输入方式具体可以包括键盘符号、手写信息等输入方式,即用户可以通过编码字符串、手写属性特征等输入上屏内容。下面仅以编码字符串(以下简称输入串)的输入方式为例进行说明,其它输入方式相互参见即可。

在输入法系统领域,无论是中文、日文、韩文还是其它语言的输入法系统,都是把用户输入的编码字符串转换成相应语言的候选项,然后由用户来选择输出至应用程序的内容,这里通过上屏操作输出至应用程序的内容也即上屏内容。在本发明的一种可选实施例中,一次输入过程可以始于输入串的接收,终止于该输入串对应候选项的上屏。以输入串“nihao”和上屏内容“你好”的输入过程为例,在接收到字符“n”时,该次输入过程开始,而在接收到输入串“nihao”对应候选项“你好”的上屏操作后,该次输入过程结束。而本发明实施例中,步骤101的输入过程可以泛指用户使用输入法系统进行输入且对输入内容进行编辑的一系列过程,例如,其具体可以包括:一次输入过程、多次输入过程、甚至相邻输入过程之间的更改上屏内容的过程等,可以理解,本发明实施例对于具体的输入过程不加以限制。

本发明实施例提供的输入纠错方法可应用于输入法系统的客户端与服务器对应的应用环境中,其中,输入法系统的客户端与服务器可以位于有线或无线网络中,通过该有线或无线网络,客户端与服务器进行数据交互。

具体地,输入法系统的的客户端可以运行在智能终端上,该客户端可以捕获用户在输入过程中的键入输入串的操作、对于候选项的上屏操作等一系列操作。上述智能终端具体可以包括但不限:智能手机、平板电脑、电子书阅读器、mp3(动态影像专家压缩标准音频层面3,movingpictureexpertsgroupaudiolayeriii)播放器、mp4(动态影像专家压缩标准音频层面4,movingpictureexpertsgroupaudiolayeriv)播放器、膝上型便携计算机、车载电脑、台式计算机、机顶盒、智能电视机、可穿戴设备等等。

在实际应用中,用户很有可能因为按错键(pc上)、或者点错屏幕位置(智能终端上)、或者操作意图错误等原因而导致输入错误的输入串。现有的基于编辑距离的纠错方案和基于统计的纠错方案虽然能够得到纠错候选,但其往往针对不同用户提供相同的纠错候选,并没有能力实现个性化的纠错。

本发明实施例在输入纠错过程中,依据输入串对应的纠错候选和上下文在用户多元词库中的查找结果,对纠错候选进行排序;由于用户多元词库记录有用户输入过的多元词组,该多元词组能够反映用户的个性化输入习惯,故本发明实施例的排序可以将命中的纠错候选排在不命中的纠错候选的前面,或者,在正常得分的基础上增加命中的纠错候选的得分,换言之,本发明实施例将命中用户多元词库的纠错候选的位置提前,可以向符合提供符合个性化输入习惯的纠错候选,因此能够提高纠错候选的质量,同时提高纠错的准确率。进一步,将命中用户多元词库的纠错候选的位置提前,可以使用户在不翻页或者少翻页的情况下快速将所需的纠错候选上屏,因此能够提高输入效率。

在本发明的一种应用示例1中,用户多元词库中记录有多元词组“非常|给力”,则在用户再次上屏“非常”后,若错输了输入串“gili”,则输入法系统可以对“gili”进行纠错,假设利用基于编辑距离的纠错方案和/或基于统计的纠错方案对“gili”进行纠错,得到了纠错候选“鼓励”和“给力”,按照正常得分“鼓励”排在“给力”前面,而应用本发明实施例,上文“非常”和纠错候选“给力”命中了用户多元词库,则可以将命中的纠错候选“给力”排在不命中的纠错候选“鼓励”的前面,或者,在正常得分的基础上增加命中的纠错候选“给力”的得分,以使纠错候选更加符合用户的个性化习惯。

在实际应用中,步骤102可以利用任意的纠错方案对输入串进行纠错处理,以得到所述输入串对应的纠错串,并依据该纠错串在词库中查找得到对应的纠错候选。其中,本发明实施例的词库具体可以包括:系统词库、用户词库、细胞词库、云词库、热词词库等,本发明实施例对于具体的词库不加以限制。可选地,上述纠错方案具体可以包括:基于编辑距离的纠错方案和基于统计的纠错方案。

其中,基于编辑距离的纠错方案的纠错过程具体可以包括:对输入串的每个位置进行如下四种纠错尝试:插入一个字符、删除一个字符、替换一个字符和替换前后两个字符位置,以产生该输入串对应的纠错串序列。

基于统计的纠错方案可以通过大数据挖掘生成纠错模型,该纠错模型可用于学习纠错串被错输为输入串的概率(以下简称纠错模型概率),则可以向该纠错模型输入输入串,并由该纠错模型输出各纠错串被错输为输入串的概率。例如,输入串为“gili”,纠错串为“geili”,则上述纠错模型概率可用于表示“gili”被错输成“gili”的概率,在实际应用中,可以对用户的输入行为进行统计分析,以得到上述纠错模型概率。

可选地,还可以从该纠错串序列中选择最佳的纠错串。在选择过程中,可以基于纠错模型概率的得分和/或各纠错串对应候选的词频得分。纠错串对应候选的词频得分通常为纠错串对应首选的词频得分。其中,在依据纠错模型概率的得分和各纠错串对应候选的词频得分,从所述纠错串序列中选择最佳的纠错串的过程中,可以对纠错模型概率的得分和各纠错串对应候选的词频得分进行加权运算,依据加权运算结果对所有的纠错串进行排序,并依据排序结果选择最佳的纠错串。

本发明实施例中,可以从用户输入过的内容中获取多元词组,并将所获取的用户多元词库及其对应的属性特征保存至用户多元词库。

在本发明的一种可选实施例中,可以通过如下步骤建立上述用户多元词库:

记录用户的上屏内容;在用户的连续输入过程中,一旦通过上屏动作输出上屏内容,这些上屏内容都可被记录。例如:我|喜欢|你(“|”表示用户上屏动作),三次上屏内容都会被依次被记录;又如,星期五|早上|的|天空|很蓝,五次上屏内容都会依次被记录。

从一次上屏内容或者连续的多次上屏内容中选择多元词组;

将所述多元词组及其对应的属性特征保存至用户多元词库。

可选地,上述选择多元词组的过程可以包括:从一次上屏内容或者连续的多次上屏内容中选择相邻的词组,作为多元词组;或者,从一次上屏内容或者连续的多次上屏内容中选择符合预置搭配条件的多个词组,作为多元词组。在实际应用中,有的用户习惯一次输入一个词组,有的用户习惯一次性输入包括多个词组的长句,即使对于同一用户,在大多数情况下一边思考一边一次性输入一个词组、而少数情况下一次性输入包括多个词组的长句,因此,本发明实施例中,可以从包括多个词组的一次上屏内容中挖掘多元词组,也可以在包括多个词组的多次上屏内容中挖掘多元词组。其中,多元词组的元数可以大于等于2,也即,2元词组、3元词组、4元词组、5元词组等均在本发明实施例的多元词组的保护范围之内。

本发明实施例中,多元词组所包括的多个词组可以相邻。这样,可以从用户的上屏内容中提取出一系列的多元词组。例如,用户3元词组“我|喜欢|你”所包括的3个词组在上屏内容中是相邻的。

或者,选择的多元词组可以不相邻,只需符合预置搭配条件即可,例如,上屏内容为“我使出了洪荒之力”,但从中选择的用户2元词组“使出|洪荒之力”包括的词组在上屏内容中可以不相邻;又如,上屏内容为“我的内心几乎是崩溃的”,但从中选择的多元词组“我|的|内心|崩溃”、“我|的|内心|是|崩溃|的”、“内心|崩溃”等包括的词组在上屏内容中可以不相邻。其中,上述预置搭配条件可以表示多元词组符合对应语言的搭配规则或者习惯用法,多元词组对应的语言可以为一种或者多种,例如,“使出|洪荒之力”即符合中文的搭配规则,又如,“按住|ctrl|键”符合中英文的搭配规则,“we|are|伐木|累”、“然而|并|没有|什么|luan|用”符合中文的习惯用法。

可以看出,本发明实施例的多元词组不一定符合语言的搭配规则,符合当前用户或者大多数用户的习惯用法,或者,只要用户输入过该多元词组,即可认为其是合理的。

在本发明的一种可选实施例中,上述连续的多次上屏内容可以为通过连续上屏操作得到的内容,也即可以将连续的多次上屏内容作为一个整体,并从该整体中挖掘多元词组,则可以通过如下步骤确定所述连续上屏操作结束:

在接收到针对预置结束按键的点击操作时,确定所述连续上屏操作结束;其中,所述预置结束按键具体可以包括:标点符号按键和/或退格键和/或空格键和/或功能按键;或者

在当前上屏操作与下一次上屏操作之间的时间间隔大于间隔阈值时,确定当前上屏操作为连续上屏操作的结束。

在实际应用中,用户通常在一个完整的句子或者长词输入结束时,按下标点符号等预置结束按键,或者会停隔一段时间再输入下一个句子或者长词。因此,本发明实施例将接收到用户输入逗号、句号、问号、退格键、回车键等各种预置结束按键的操作,或者在间隔阈值对应的时间内没有接收到上屏词作为连接上屏操作结束的标志,由此使得获取的连续的多次上屏内容为依据用户的输入行为自然划分所得到的。当然,所述预置结束按键并不局限于上述列举的各种按键,例如,还可以将即时通讯程序(如qq、微信等)中的发送功能键(如回车键或者ctrl+回车键)等作为预置结束按键。可以理解,本发明实施例对于所述预置结束按键的具体形式不加以限制,例如,可以采用上述列举的各种按键中的任意一种按键作为预置结束按键,或者,还可以采用上述按键中任意几种按键的按键组合作为预置结束按键。

其中,所述间隔阈值可以为预先设置的时间值,例如2秒。可选地,可以通过如下步骤确定所述间隔阈值:记录上屏内容对应的上屏时间,根据每两个上屏内容对应的上屏时间之间的间隔,计算得到平均上屏间隔,将所述平均上屏间隔作为间隔阈值。可选地,还可以将所述平均上屏间隔乘以加权系数后得到的值作为间隔阈值,其中所述加权系数值可以大于1,大于0小于1,或者是基于该用户的输入行为学习调整。总之,本发明实施例对于所述间隔阈值的具体确定方式不加以限制。

可选地,用户多元词库中可以记录多元词组及属性特征之间的映射关系,上述属性特征具体可以包括如下信息中的至少一种:输入次数、历史输入时间和历史输入环境信息。输入次数可用于表示该多元词组被输入的次数,输入时间可用于表示该多元词组被输入的时间,如201609190724等。该历史输入环境信息可用于在输入该多元词组时智能终端所处的输入环境信息,该输入环境信息可以包括:外界环境信息,如时间信息、位置信息等,该输入环境信息也可以包括:内部环境信息,如输入法系统所寄宿的应用程序环境信息,例如用户在即时通讯程序的环境下输入了多元词组“我|使出|了|洪荒之力”,又如用户在办公文档程序的环境下输入了多元词组“在|本发明|的|一种|可选|实施例|中”等。可以理解,本领域技术人员可以根据实际应用需求采用所需的输入环境信息,本发明实施例对于具体的输入环境信息不加以限制。

在实际应用中,可以针对多元词组在用户多元词库中设置词组这一字段,如“非常给力”为一个词组,这样,步骤103可以对输入串对应的纠错候选和上下文进行组合,以得到对应的组合词,并将该组合词与用户多元词库中记录的词组字段进行匹配,若匹配成功,则查找结果为命中,否则查找结果为未命中。

或者,可以针对多元词组的各个基础词组在用户多元词库中分别设置对应的基础词组字段,例如,“非常给力”对应“非常”和“给力”两个基础词组字段,“星期五早上的天空很蓝”对应“星期五”、“早上”、“的”、“天空”、“很”和“蓝”等基础词组字段,则步骤103可以分别将输入串对应的纠错候选和上下文与各基础词组字段进行匹配,若均匹配成功,则查找结果为命中,否则,若存在匹配不成功的情形,则查找结果为未命中。其中,基础词组可以表示最小单位的词语,通常该词语不可再分解为其它词语,例如“一起”可以作为一个基础词组,其不可再分解为其它词语,而“非常给力”可以进一步分解为词语“非常”和“给力”,因此,“非常给力”不是基础词组。可以理解,本领域技术人员可以根据实际应用需求,将多元词组分解为对应的多个基础词组,本发明实施例对于具体的分解过程不加以限制。

需要说明的是,本发明实施例的上下文具体可以包括:上文和/或下文,其中,在大多数场景下,均可以捕获到输入串对应的上文,例如上述应用示例1为依据输入串对应的纠错候选和上文查找用户多元词库的场景。

在用户编辑已输入内容的场景下,可以捕获到输入串对应的下文。在本发明的一种应用示例2中,用户首先输入了“星期五的早上很蓝”,然后将光标移动至“早上”后,输入“tiany”,则可以捕获到“tiany”对应的下文“很蓝”,假设用户多元词库中记录有多元词组“天空|很蓝”和“早上|的|天空|很蓝”,假设“tiany”对应的纠错候选包括:“天后”、“添加”、“天空”等,则由于“天空”和“很蓝”、以及“早上”、“天空”和“很蓝”均命中用户多元词库,而其他纠错候选及其对应的上下文未命中用户多元词库,故可以将“天空”排在较为靠前的位置,方便用户选择。

在本发明的一种可选实施例中,上述查找结果具体可以包括:命中的纠错候选、或者未命中的纠错候选,则步骤104可以将命中的纠错候选排在未命中的纠错候选的前面,或者在正常得分的基础上增加命中的纠错候选的得分,进而将命中用户多元词库的纠错候选的位置提前。

在本发明的一种可选实施例中,当所述在用户多元词库中查找的查找结果包括:多个命中的纠错候选时,所述方法还可以包括:依据所述用户多元词库中记录的多元词组的属性特征,对多个命中的纠错候选进行排序;依据所述多个命中的纠错候选的排序结果,展现对应的纠错候选。在实际应用中,通常需要展现的纠错候选的数目是有限的,假设需要展现的纠错候选的数目为n(通常n为1,2等数值),而命中的纠错候选的数量为m,且m大于n,则可以依据所述用户多元词库中记录的多元词组的属性特征,对m个命中的纠错候选进行排序,以将最优的n个命中的纠错候选进行展现。当然,还可以将上述多元词组的属性特征与其他排序因子(如纠错候选本身的属性特征等)进行组合使用,本发明实施例对于对多个命中的纠错候选进行排序的具体过程不加以限制。

在实际应用中,步骤105可以通过输入法系统的候选窗口向用户展现排序后的纠错候选。可选地,可以依据排序结果选择全部或者部分纠错候选进行展现,本发明实施例对于具体的展现方式不加以限制。

在本发明的一种可选实施例中,还可以将该纠错候选与该输入串对应的普通候选展现给用户。其中,可以在词库中查询得到该输入串对应的普通候选,本发明实施例对于获取普通候选的具体过程不加以限制。

可选地,可以分别确定纠错候选和普通候选的得分,然后按照纠错候选和普通候选的得分进行纠错候选和普通候选的排序,并按照该排序结果向用户提供候选项。可选地,所述普通候选的得分可以为所述输入串对应首选的得分,其中,上述首选的得分可以为依据首选的词频、分类信息、级别和权重信息中至少一种特征计算得到的得分,其可用于衡量首选的质量。在排序的过程中,可以首先将纠错候选的得分减去惩罚值,然后将相减结果与普通得分进行比较。在实际应用中,可以通过模拟用户输入过程的试验,确定惩罚值,以尽可能地保证输入纠错的准确率。可以理解,本发明实施例对于纠错候选和普通候选的具体排序过程不加以限制。

综上,本发明实施例在输入纠错过程中,依据输入串对应的纠错候选和上下文在用户多元词库中的查找结果,对纠错候选进行排序;由于用户多元词库记录有用户输入过的多元词组,该多元词组能够反映用户的个性化输入习惯,故本发明实施例的排序可以将命中的纠错候选排在不命中的纠错候选的前面,或者,在正常得分的基础上增加命中的纠错候选的得分,换言之,本发明实施例将命中用户多元词库的纠错候选的位置提前,可以向符合提供符合个性化输入习惯的纠错候选,因此能够提高纠错候选的质量,同时提高纠错的准确率。进一步,将命中用户多元词库的纠错候选的位置提前,可以使用户在不翻页或者少翻页的情况下快速将所需的纠错候选上屏,因此能够提高输入效率。

本发明实施例中,依据所述查找结果对所述输入串对应的纠错候选进行排序的过程具体可以包括:将命中的纠错候选排在未命中的纠错候选的前面,或者在正常得分的基础上增加命中的纠错候选的得分,进而将命中用户多元词库的纠错候选的位置提前。在此通过方法实施例二和方法实施例三说明在正常得分的基础上增加命中的纠错候选的得分的过程。

方法实施例二

参照图2,示出了本发明的一种输入纠错方法实施例二的步骤流程图,具体可以包括如下步骤:

步骤201、获取输入过程中的输入串;

步骤202、对所述输入串进行纠错处理,以得到所述输入串对应的纠错候选;

步骤203、依据所述输入串对应的纠错候选和上下文,在用户多元词库中进行查找,以得到对应的查找结果;所述用户多元词库用于记录用户输入过的多元词组;上述在用户多元词库中查找的查找结果可以包括:命中的纠错候选、或者未命中的纠错候选;

步骤204、依据所述查找结果,确定所述纠错候选的第二得分;其中,命中的纠错候选的第二得分大于零,未命中的纠错候选的第二得分为零;

步骤205、将所述纠错候选的第二得分与所述纠错候选的第一得分进行相加处理,以得到第三得分;其中,所述第一得分依据所述纠错候选的属性特征得到;

步骤206、依据所述第三得分对所述输入串对应的纠错候选进行排序;

步骤207、向用户展现排序后的纠错候选。

相对于图1所示方法实施例一,本实施例通过步骤204-步骤206对依据查找结果对所述输入串对应的纠错候选进行排序的过程进行了描述,其中,步骤204为确定纠错候选对应第二得分的过程,步骤205为对第二得分和第一得分进行相加处理的过程,上述第一得分可用于表示依据所述纠错候选的属性特征得到的正常得分,上述相加处理能够在正常得分的基础上增加命中的纠错候选的得分,进而将命中用户多元词库的纠错候选的位置提前。

本发明实施例中,可以将纠错候选的第二得分与纠错候选的第一得分进行相加处理,以得到第三得分;由于命中的纠错候选的第二得分大于零,而未命中的纠错候选的第二得分为零,也即,命中的纠错候选的第二得分大于未命中的纠错候选的第二得分,因此可以在第一得分的基础上增加命中的纠错候选的得分,进而将命中用户多元词库的纠错候选的位置提前。

可选地,当所述第二得分不为零时,所述方法还可以包括:

将第一预设值作为所述纠错候选对应的第二得分;或者

依据所述用户多元词库中记录的多元词组的属性特征,确定所述纠错候选对应的第二得分。

可以理解,本领域技术人员可以根据实际应用需求,确定上述第一预设值,例如,可以将命中的纠错候选的第二得分设置为大于0的第一预设值,如0.5,1等数值,本发明实施例对于具体的第一预设值不加以限制。

可选地,上述多元词组的属性特征具体可以包括如下特征中的至少一种:输入次数、历史输入时间和历史输入环境信息,则上述依据用户多元词库中记录的多元词组的属性特征,确定所述纠错候选对应的第二得分的步骤,具体可以包括:依据所述输入次数、所述历史输入时间与当前时间的差值、以及所述历史输入环境信息与当前输入环境信息之间的匹配度中的至少一种,确定所述纠错候选对应的第二得分。可选地,第二得分可以与输入次数成正比,第二得分可以与历史输入时间与当前时间的差值的绝对值成反比,第二得分可以与历史输入环境信息与当前输入环境信息之间的匹配度成正比。在输入环境信息为输入法系统所寄宿的应用程序环境信息时,可以依据应用程序的名称或者应用程序的类别确定上述匹配度,例如,历史输入环境信息为第一即时通讯应用程序,当前输入环境信息为第二即时通讯应用程序,则由于二者的类别相同,可以得到较高的匹配度;又如,历史输入环境信息为第一电商应用程序,当前输入环境信息为第二电商应用程序,由于二者的类别相同,则可以得到较高的匹配度。可以理解,本发明实施例对于历史输入环境信息与当前输入环境信息之间的匹配度的具体确定方式不加以限制。

在本发明的再一种可选实施例中,可以依据纠错候选的属性特征确定纠错候选的第一得分,本发明实施例对于第一得分的具体确定方式不加以限制。上述纠错候选的属性特征具体可以包括如下特征中的至少一种:所述纠错候选对应纠错串与所述输入串之间的编辑距离、所述纠错候选所对应词库的类型和所述纠错候选的词频。可以理解,本领域技术人员还可以根据实际应用需求,采用其他的属性特征,如纠错候选的上屏时间等。

通常,第一得分可以与编辑距离成反比,编辑距离越小,第一得分越高,例如,输入串“gili”与纠错串“guli”、输入串“gili”与纠错串“geili”之间的编辑距离都是1,则依据编辑距离可以得到相同的第一得分。

纠错候选所对应词库的类型具体可以包括:用户类型和系统类型,通常,用户类型对应的第一得分可以高于系统类型对应的第一得分。

通常,第一得分可以与词频和上屏时间成正比,也即,词频越高则第一得分越高,上屏时间越大(与当前时间越接近),则第一得分越高等。

在本发明的又一种可选实施例中,步骤205将所述纠错候选的第二得分与所述纠错候选的第一得分进行相加处理的方式可以有多种,例如,上述相加处理可以为普通的相加处理,也可以为加权平均处理等。由于命中的纠错候选对应的第二得分大于所述未命中的纠错候选对应的第二得分,故上述组合可以增加命中的纠错候选对应纠错候选的第三得分,进而将命中的纠错候选的位置提前。

方法实施例三

参照图3,示出了本发明的一种输入纠错方法实施例三的步骤流程图,具体可以包括如下步骤:

步骤301、获取输入过程中的输入串;

步骤302、对所述输入串进行纠错处理,以得到所述输入串对应的纠错候选;

步骤303、依据所述输入串对应的纠错候选和上下文,在用户多元词库中进行查找,以得到对应的查找结果;所述用户多元词库用于记录用户输入过的多元词组;上述在用户多元词库中查找的查找结果可以包括:命中的纠错候选、或者未命中的纠错候选;

步骤304、依据所述查找结果,确定所述纠错候选的第四得分;其中,命中的纠错候选的第四得分大于1,未命中的纠错候选的第四得分小于1;

步骤305、将所述纠错候选的第四得分与所述纠错候选的第一得分进行相乘处理,以得到第五得分;其中,所述第一得分依据所述纠错候选的属性特征得到;

步骤306、依据所述第五得分对所述输入串对应的纠错候选进行排序;

步骤307、向用户展现排序后的纠错候选。

相对于图1所示方法实施例一,本实施例通过步骤304-步骤306对依据查找结果对所述输入串对应的纠错候选进行排序的过程进行了描述,其中,步骤304为确定纠错候选对应第四得分的过程,步骤305为对第四得分和第一得分进行相乘处理的过程,上述第一得分可用于表示依据所述纠错候选的属性特征得到的正常得分,上述相乘处理能够在正常得分的基础上增加命中的纠错候选的得分,进而将命中用户多元词库的纠错候选的位置提前。

本发明实施例中,可以将纠错候选的第四得分与纠错候选的第一得分进行相乘处理,以得到第五得分;由于命中的纠错候选的第四得分大于1,而未命中的纠错候选的第四得分小于1,因此可以在第一得分的基础上增加命中的纠错候选的得分,进而将命中用户多元词库的纠错候选的位置提前。

可选地,所述方法还可以包括:

将第二预设值作为所述纠错候选对应的第四得分;或者

依据所述用户多元词库中记录的多元词组的属性特征,确定所述纠错候选对应的第四得分。

可以理解,本领域技术人员可以根据实际应用需求,确定上述第二预设值,例如,可以将命中的纠错候选的第四得分设置为大于1的第二预设值,1.5、2等数值,又如,可以将未命中的纠错候选的第四得分设置为小于1的第二预设值,如0.5、0.8等,本发明实施例对于具体的第二预设值不加以限制。

方法实施例四

参照图4,示出了本发明的一种输入纠错方法实施例四的步骤流程图,具体可以包括如下步骤:

步骤401、获取输入过程中的输入串;

步骤402、依据所述输入串对应的普通候选和上下文,在用户多元词库中进行查找;

步骤403、当所述输入串对应的普通候选和上下文命中所述用户多元词库时,不执行所述对所述输入串进行纠错处理的操作;

步骤404、当所述输入串对应的普通候选和上下文未命中所述用户多元词库时,对所述输入串进行纠错处理,以得到所述输入串对应的纠错候选;

步骤405、依据所述输入串对应的纠错候选和上下文,在用户多元词库中进行查找,以得到对应的查找结果;所述用户多元词库记录有用户输入过的多元词组;

步骤406、依据所述查找结果,对所述输入串对应的纠错候选进行排序;

步骤407、向用户展现排序后的纠错候选。

现有方案中,通常会对每个输入串进行纠错处理,以尝试通过纠错候选提高候选质量。然而,纠错处理需要花费一定的时间成本,且还需要花费智能终端的内存等一系列终端资源成本。

相对于图1所示方法实施例一或者图2所示方法实施例二或者图3所示方法实施例三,本实施例可以依据用户多元词库,对对所述输入串进行纠错处理的执行条件进行判断,若输入串对应的普通候选和上下文命中所述用户多元词库,则说明普通候选已经能够符合用户的个性化输入习惯了,也即普通候选的质量已经很多了,故可以不执行所述对所述输入串进行纠错处理的步骤,因此可以在一定程度上节省纠错处理所花费的时间和终端资源成本,进而可以提高智能终端的待机时间等性能。

而在输入串对应的普通候选和上下文未命中所述用户多元词库时,则说明普通候选尚未符合用户的个性化输入习惯,故本发明实施例可以在此种情况下尝试通过纠错候选提高候选质量。

需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的运动动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的运动动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的运动动作并不一定是本发明实施例所必须的。

装置实施例

参照图5,示出了本发明的一种输入装置实施例的结构框图,具体可以包括:输入串获取模块501、输入串纠错模块502、多元词库查找模块503、纠错候选排序模块504和纠错候选展现模块505。

其中,输入串获取模块501,用于获取输入过程中的输入串;

输入串纠错模块502,用于对所述输入串进行纠错处理,以得到所述输入串对应的纠错候选;

多元词库查找模块503,用于依据所述输入串对应的纠错候选和上下文,在用户多元词库中进行查找,以得到对应的查找结果;所述用户多元词库可以记录有用户输入过的多元词组;

纠错候选排序模块504,用于依据所述查找结果,对所述输入串对应的纠错候选进行排序;以及

纠错候选展现模块505,用于向用户展现排序后的纠错候选。

可选地,上述在用户多元词库中查找的查找结果可以包括:命中的纠错候选、或者未命中的纠错候选,则所述纠错候选排序模块504可以包括:

第二得分确定子模块,用于依据所述查找结果,确定所述纠错候选的第二得分;其中,命中的纠错候选的第二得分大于零,未命中的纠错候选的第二得分为零;

相加处理子模块,用于将所述纠错候选的第二得分与所述纠错候选的第一得分进行相加处理,以得到第三得分;其中,所述第一得分依据所述纠错候选的属性特征得到;

第一排序子模块,用于依据所述第三得分对所述输入串对应的纠错候选进行排序。

可选地,上述在用户多元词库中查找的查找结果可以包括:命中的纠错候选、或者未命中的纠错候选,则所述纠错候选排序模块504可以包括:

第四得分确定子模块,用于依据所述查找结果,确定所述纠错候选的第四得分;其中,命中的纠错候选的第四得分大于1,未命中的纠错候选的第四得分小于1;

相乘处理子模块,用于将所述纠错候选的第四得分与所述纠错候选的第一得分进行相乘处理,以得到第五得分;其中,所述第一得分依据所述纠错候选的属性特征得到;

第一排序子模块,用于依据所述第五得分对所述输入串对应的纠错候选进行排序。

可选地,上述装置还可以包括:

得分预设模块,用于将预设值分别作为所述纠错候选对应的第二得分和/或第四得分;或者

得分确定模块,用于依据所述用户多元词库中记录的多元词组的属性特征,确定所述纠错候选对应的第二得分和/或第四得分。

可选地,上述多元词组的属性特征可以包括如下特征中的至少一种:输入次数、历史输入时间和历史输入环境信息,则上述得分确定模块可以包括:

匹配计算子模块,用于依据所述输入次数、所述历史输入时间与当前时间的差值、以及所述历史输入环境信息与当前输入环境信息之间的匹配度中的至少一种,确定所述纠错候选对应的第二得分和/或第四得分。

可选地,上述纠错候选的属性特征可以包括如下特征中的至少一种:所述纠错候选对应纠错串与所述输入串之间的编辑距离、所述纠错候选所对应词库的类型和所述纠错候选的词频。

可选地,当所述在用户多元词库中查找的查找结果包括:多个命中的纠错候选时,所述装置还可以包括:

命中候选排序模块,用于依据所述用户多元词库中记录的多元词组的属性特征,对多个命中的纠错候选进行排序;

展现模块,用于依据所述多个命中的纠错候选的排序结果,展现对应的纠错候选。

可选地,上述装置还可以包括:

查找模块,用于依据所述输入串对应的普通候选和上下文,在用户多元词库中进行查找;

执行处理模块,用于当所述输入串对应的普通候选和上下文命中所述用户多元词库时,不执行所述对所述输入串进行纠错处理的操作。可选地,当当所述输入串对应的普通候选和上下文未命中所述用户多元词库时,可以触发输入串纠错模块502执行对所述输入串进行纠错处理的操作。

可选地,上述装置还可以包括:用于建立所述用户多元词库的建立模块;

上述建立模块可以包括:

记录子模块,用于记录用户的上屏内容;

选择子模块,用于从一次上屏内容或者连续的多次上屏内容中选择多元词组;以及

保存子模块,用于将所述多元词组及其对应的属性特征保存至用户多元词库。

可选地,上述选择子模块可以包括:

第一选择单元,用于从一次上屏内容或者连续的多次上屏内容中选择相邻的词组,作为多元词组;或者

第二选择单元,用于从一次上屏内容或者连续的多次上屏内容中选择符合预置搭配条件的词组,作为多元词组。

可选地,所述连续的多次上屏内容可以为通过连续上屏操作得到的内容,则上述装置还可以包括:用于确定所述连续上屏操作结束的结束确定模块;

上述结束确定模块可以包括:

第一结束确定子模块,用于在接收到针对预置结束按键的点击操作时,确定所述连续上屏操作结束;其中,所述预置结束按键包括:标点符号按键和/或退格键和/或空格键和/或功能按键;或者

第二结束确定子模块,用于在当前上屏操作与下一次上屏操作之间的时间间隔大于间隔阈值时,确定当前上屏操作为连续上屏操作的结束。

对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。

关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。

图6是根据一示例性实施例示出的一种用于输入纠错的装置900的框图。例如,装置900可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。

参照图6,装置900可以包括以下一个或多个组件:处理组件902,存储器904,电源组件906,多媒体组件908,音频组件910,输入/输出(i/o)的接口912,传感器组件914,以及通信组件916。

处理组件902通常控制装置900的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件902可以包括一个或多个处理器920来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件902可以包括一个或多个模块,便于处理组件902和其他组件之间的交互。例如,处理组件902可以包括多媒体模块,以方便多媒体组件908和处理组件902之间的交互。

存储器904被配置为存储各种类型的数据以支持在设备900的操作。这些数据的示例包括用于在装置900上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器904可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(sram),电可擦除可编程只读存储器(eeprom),可擦除可编程只读存储器(eprom),可编程只读存储器(prom),只读存储器(rom),磁存储器,快闪存储器,磁盘或光盘。

电源组件906为装置900的各种组件提供电力。电源组件906可以包括电源管理系统,一个或多个电源,及其他与为装置900生成、管理和分配电力相关联的组件。

多媒体组件908包括在所述装置900和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(lcd)和触摸面板(tp)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动运动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件908包括一个前置摄像头和/或后置摄像头。当设备900处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件910被配置为输出和/或输入音频信号。例如,音频组件910包括一个麦克风(mic),当装置900处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器904或经由通信组件916发送。在一些实施例中,音频组件910还包括一个扬声器,用于输出音频信号。

i/o接口912为处理组件902和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件914包括一个或多个传感器,用于为装置900提供各个方面的状态评估。例如,传感器组件914可以检测到设备900的打开/关闭状态,组件的相对定位,例如所述组件为装置900的显示器和小键盘,传感器组件914还可以检测装置900或装置900一个组件的位置改变,用户与装置900接触的存在或不存在,装置900方位或加速/减速和装置900的温度变化。传感器组件914可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件914还可以包括光传感器,如cmos或ccd图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件914还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。

通信组件916被配置为便于装置900和其他设备之间有线或无线方式的通信。装置900可以接入基于通信标准的无线网络,如wifi,2g或3g,或它们的组合。在一个示例性实施例中,通信部件916经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信部件916还包括近场通信(nfc)模块,以促进短程通信。例如,在nfc模块可基于射频识别(rfid)技术,红外数据协会(irda)技术,超宽带(uwb)技术,蓝牙(bt)技术和其他技术来实现。

在示例性实施例中,装置900可以被一个或多个应用专用集成电路(asic)、数字信号处理器(dsp)、数字信号处理设备(dspd)、可编程逻辑器件(pld)、现场可编程门阵列(fpga)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。

在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器904,上述指令可由装置900的处理器920执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是rom、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等。

一种非临时性计算机可读存储介质,当所述存储介质中的指令由智能终端的处理器执行时,使得智能终端能够执行一种输入纠错方法,所述方法包括:获取输入过程中的输入串;对所述输入串进行纠错处理,以得到所述输入串对应的纠错候选;依据所述输入串对应的纠错候选和上下文,在用户多元词库中进行查找,以得到对应的查找结果;所述用户多元词库记录有用户输入过的多元词组;依据所述查找结果,对所述输入串对应的纠错候选进行排序;向用户展现排序后的纠错候选。

图7是本发明的一些实施例中服务器的结构示意图。该服务器1900可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(centralprocessingunits,cpu)1922(例如,一个或一个以上处理器)和存储器1932,一个或一个以上存储应用程序1942或数据1944的存储介质1930(例如一个或一个以上海量存储设备)。其中,存储器1932和存储介质1930可以是短暂存储或持久存储。存储在存储介质1930的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1922可以设置为与存储介质1930通信,在服务器1900上执行存储介质1930中的一系列指令操作。

服务器1900还可以包括一个或一个以上电源1926,一个或一个以上有线或无线网络接口1950,一个或一个以上输入输出接口1958,一个或一个以上键盘1956,和/或,一个或一个以上操作系统1941,例如windowsservertm,macosxtm,unixtm,linuxtm,freebsdtm等等。

本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。

应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制

以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

以上对本发明所提供的一种输入纠错方法、一种输入纠错装置和一种用于输入纠错的装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1