一种输入纠错方法和输入法装置与流程

文档序号:12175893阅读:335来源:国知局
一种输入纠错方法和输入法装置与流程

本发明涉及输入法技术领域,特别是涉及一种输入纠错方法和一种输入法装置。



背景技术:

拼音输入是一种最简单的汉字输入方法,它的发展非常快,从第一代的以字输入为主,即用户只能一次输入一个汉字,发展到第二代以词输入为主并具有智能调频功能,这个时候主要依赖的是输入法的词典,发展到第三代,用户可以进行语句的输入,输入法词典中没有的句子也可以进行输入,组词功能对输入的体验有着很大的影响。

但是,用户在使用输入法的过程中经常会因为种种原因发生一些输入错误,此时往往需要删除错输的字符并重新输入,操作比较繁琐影响输入效率。



技术实现要素:

本发明实施例所要解决的技术问题是提供一种输入纠错方法,以提高输入效率。

相应的,本发明实施例还提供了一种输入法装置,用以保证上述方法的实现及应用。

为了解决上述问题,本发明公开了一种输入纠错方法,包括:接收输入字符串并记录输入间隔信息;按照音节切分过程确定的切分信息对所述输入间隔信息进行分析,确定纠错位置;依据所述纠错位置对所述输入字符串进行纠错处理。

可选的,所述按照音节切分过程确定的切分信息对所述输入间隔信息进行分析,确定纠错位置,包括:在通过内核对所述输入字符串进行音节切分过程中记录切分信息;采用所述切分信息对所述输入间隔信息进行匹配分析,确定纠错位置。

可选的,所述在通过内核对所述输入字符串进行音节切分的过程中记录切分信息,包括:采用内核对所述输入字符串进行切分时,将全拼音节切分的位置记录为音节边界,将所述音节边界作为切分信息。

可选的,在采用所述切分信息对所述输入间隔信息进行匹配分析之前,还包括:从所述输入间隔信息中获取各字符的输入时间间隔;按照间隔阈值对所述输入时间间隔进行检测,将超过所述间隔阈值的输入时间间隔对应位置作为目标位置。

可选的,采用所述切分信息对所述输入间隔信息进行匹配分析,确定纠错位置,包括:将所述音节边界与所述目标位置进行匹配;删除与所述音节边界匹配的目标位置,将剩余的目标位置作为纠错位置。

可选的,所述间隔阈值包括第一间隔阈值和第二间隔阈值,其中,第二间隔阈值大于第一间隔阈值;采用所述切分信息对所述输入间隔信息进行匹配分析,确定纠错位置,包括:将所述音节边界与所述目标位置进行匹配,确定与所述音节边界匹配的目标位置;检测与所述音节边界匹配的目标位置是否是超过第二间隔阈值的目标位置;当匹配的目标位置是不超过第二间隔阈值的目标位置时,删除与所述音节边界匹配的目标位置,将剩余的目标位置作为纠错位置。

可选的,依据所述纠错位置对所述输入字符串进行纠错处理,包括:从所述输入字符串中查询与所述纠错位置相邻的至少一个字符生成待修正字符串;按照纠错模型对所述待修正字符串进行纠错处理,得到修正字符串;依据所述修正字符串构成纠错提示信息,和/或,按照所述修正字符串进行转换确定修正的候选项。

可选的,还包括:将所述输入字符串对应转换得到的候选项和所述修正的候选项进行合并;生成本次输入的综合候选项并进行展示;或展示所述纠错提示信息,依据对纠错提示信息中修正字符串的选择,显示所述修正字符串对应的候选项。

本发明实施例还公开了一种输入法装置,包括:接收模块,用于接收输入字符串并记录输入间隔信息;纠错位置确定模块,用于按照音节切分过程 确定的切分信息对所述输入间隔信息进行分析,确定纠错位置;纠错模块,用于依据所述纠错位置对所述输入字符串进行纠错处理。

可选的,所述纠错位置确定模块,包括:切分记录子模块,用于在通过内核对所述输入字符串进行音节切分过程中记录切分信息;分析纠错子模块,用于采用所述切分信息对所述输入间隔信息进行匹配分析,确定纠错位置。

可选的,所述切分记录子模块,用于采用内核对所述输入字符串进行切分时,将全拼音节切分的位置记录为音节边界,将所述音节边界作为切分信息。

可选的,所述纠错位置确定模块,还包括:间隔分析子模块,用于从所述输入间隔信息中获取各字符的输入时间间隔;按照间隔阈值对所述输入时间间隔进行检测,将超过所述间隔阈值的输入时间间隔对应位置作为目标位置。

可选的,所述分析纠错子模块,用于将所述音节边界与所述目标位置进行匹配;删除与所述音节边界匹配的目标位置,将剩余的目标位置作为纠错位置。

可选的,所述间隔阈值包括第一间隔阈值和第二间隔阈值,其中,第二间隔阈值大于第一间隔阈值;所述分析纠错子模块,用于将所述音节边界与所述目标位置进行匹配,确定与所述音节边界匹配的目标位置;检测与所述音节边界匹配的目标位置是否是超过第二间隔阈值的目标位置;当匹配的目标位置是不超过第二间隔阈值的目标位置时,删除与所述音节边界匹配的目标位置,将剩余的目标位置作为纠错位置。

可选的,所述纠错模块,用于从所述输入字符串中查询与所述纠错位置相邻的至少一个字符生成待修正字符串;按照纠错模型对所述待修正字符串进行纠错处理,得到修正字符串;依据所述修正字符串构成纠错提示信息,和/或,按照所述修正字符串进行转换确定修正的候选项。

可选的,所述纠错模块,还用于将所述输入字符串对应转换得到的候选项和所述修正的候选项进行合并;生成本次输入的综合候选项;还包括:展 示模块,用于对所述综合候选项进行展示,或,展示所述纠错提示信息,依据对纠错提示信息中修正字符串的选择,显示所述修正字符串对应的候选项。

与现有技术相比,本发明实施例包括以下优点:

接收输入字符串并记录输入间隔信息,从而采用切分过程中确定的切分信息对该输入间隔信息进行分析,确定纠错位置,然后依据所述纠错位置对所述输入字符串进行纠错处理,得到修正的候选项。按照切分信息和输入间隔来确定纠错位置,提供纠错信息,从而避免用户的退格重输行为,进而提高了输入效率。

附图说明

图1是本发明的一种输入纠错方法实施例的步骤流程图;

图2是本发明的另一个实施例中第一种输入纠错方法实施例的步骤流程图;

图3是本发明的另一个实施例中第二种输入纠错方法实施例的步骤流程图

图4A是现有的一种输入纠错方法的示意图;

图4B是本发明实施例的一种输入纠错示意图;

图5A是现有的另一种输入纠错示意图;

图5B是本发明实施例的另一种输入纠错方法的第一种示意图;

图5C是本发明实施例的另一种输入纠错方法的第二种示意图;

图6是本发明一种输入法装置实施例的结构框图;

图7是本发明另一种输入法装置实施例的结构框图。

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。

本发明实施例的核心构思之一在于,提供一种输入纠错方法,以提高输入效率。接收输入字符串并记录输入间隔信息,从而采用切分过程中确定的切分信息对该输入间隔信息进行分析,确定纠错位置,然后依据所述纠错位置对所述输入字符串进行纠错处理,得到修正的候选项。按照切分信息和输入间隔来确定纠错位置,提供纠错信息,从而避免用户的退格重输行为,进而提高了输入效率。

实施例一

参照图1,示出了本发明的一种输入纠错方法实施例的步骤流程图,具体可以包括如下步骤:

步骤102,接收输入字符串并记录输入间隔信息。

用户在使用如计算机、手机、平板电脑等终端设备时,可以采用输入法进行输入。用户通过实体键盘、虚拟键盘进行字符的输入,依次获取输入的字符构成输入字符串,由于输入字符串中各字符是按照顺序依次输入的,因此在输入两个相邻字符时会存在一定的停顿时间,记录各输入字符时还可以记录相邻两个字符输入的停顿时间,从而在用户输入的过程中接收字符构成输入字符串,并记录停顿时间构成输入间隔信息。该时间间隔信息用于表征当前输入字符串中字符之间的输入时间间隔,即当前输入字符串在输入过程中的停顿时间。

步骤104,按照音节切分过程确定的切分信息对所述输入间隔信息进行分析,确定纠错位置。

输入法获取到输入字符串后会采用内核对输入字符串进行处理,其中,输入法内核指的是输入法装置的核心算法,根据输入内容合理展现候选项。内核会对输入字符串进行切分、转换等处理得到相应的候选项。内核需要对输入字符串按照音节进行切分以实现分词,为了快速定位纠错,因此可以在音节切分过程中记录切分信息,切分信息是内核对输入字符串音节切分相关的信息,例如切分位置、切分结果等。

然后按照切分信息对输入间隔信息进行分析,即输入间隔信息表征了各 字符间输入时间间隔的长短,通过切分信息可以分析出两个字符间输入时间间隔较长的位置是否是音节切分的分词位置,从而通过切分信息确定输入时间间隔是否存在问题,例如由于某些原因导致一个字符未输入成功使得输入时间间隔较长等问题,从而定位出时间间隔存在问题的间隔位置作为纠错位置。

步骤106,依据所述纠错位置对所述输入字符串进行纠错处理。

然后按照纠错位置对输入字符串进行纠错,例如可以通过纠错确定出修正后的字符串,依据该修正的字符串生成纠错提示信息,或者,依据该修正的字符串确定修正后的候选项等纠错处理操作,提供纠错信息,提高了输入效率。

综上所述,接收输入字符串并记录输入间隔信息,从而采用切分过程中确定的切分信息对该输入间隔信息进行分析,确定纠错位置,然后依据所述纠错位置对所述输入字符串进行纠错处理,得到修正的候选项。按照切分信息和输入间隔来确定纠错位置,提供纠错信息,从而避免用户的退格重输行为,进而提高了输入效率。

实施例二

在上述实施例的基础上,本实施例继续论述通过切分和时间间隔分析的输入纠错步骤。

本发明实施例从所述输入间隔信息中获取各字符的输入时间间隔,即用户输入两个相邻字符之间的停顿时间,依据输入时间间隔的长短通常能够确定是输入完成单个字符,还是输入完成一个字或词对应的完整字符串。即通常在连续输入一个字或词的各字符时,各字符间会存在一个较短的停顿,即此时输入时间间隔较短;而在一个字或词对应的完整字符串在输入完成后,通常在字符串后会存在一个较长的停顿,即此时输入时间间隔较长。

通过统计可以得到一个用户在输入字符的过程中的停顿习惯时长,但是,有时用户输入过快等问题导致漏键即某些字符未输入成功,因此本发明实施例中,通过统计确定出用户在连续输入时各字符之间的间隔阈值,通过 间隔阈值查找输入过程中两个字符之间出现漏输的问题。其中,用户输入一个字中各字符的输入时间间隔可以按照该用户的历史输入装置统计的方式得出,或者计算当前输入时间间隔的众数的方式确定,或者综合上述方式确定。基于用户输入一个字中各字符间输入时间间隔可以确定该用户的间隔阈值。

本实施例中,间隔阈值包括第一间隔阈值和第二间隔阈值,其中第一间隔阈值用于确定用户在输入一个字(音节)中各字符时漏输的时间间隔,第二间隔阈值用于确定用户在输入不同字(音节)时漏输的时间间隔,因此第二间隔阈值大于第一间隔阈值。依据用户在输入一个字的两个相邻字符的输入时间间隔和不同字之间的输入时间间隔可以确定出第一间隔阈值和第二间隔阈值。

例如将字符间输入时间间隔的二倍减去输入误差作为第一间隔阈值,将字符间输入时间间隔和不同字间输入停顿的时间间隔相加后减去误差作为第二间隔阈值,例如字符间输入时间间隔为100ms,不同字间输入停顿的时间间隔为300ms,字符间输入误差为20ms,不同字间停顿误差为40,则第一间隔阈值为100*2-20=180ms;第二间隔阈值为100+300-40=360ms。

从而依据间隔阈值分析输入字符串中的纠错位置。即按照间隔阈值对所述输入时间间隔进行检测,若输入时间间隔超过该间隔阈值,则说明该输入时间间隔可能是正常的音节切分的位置,或者可能是由于漏键导致的输入时间间隔较长,将该输入时间间隔对应位置作为目标位置进行记录。因此可以确定出至少一个目标位置。

其中,可以仅根据第一间隔阈值分析目标位置,也可以结合第一间隔阈值和第二间隔阈值综合分析目标位置,通过下面的实施例详细论述。

参照图2,示出了本发明另一个实施例中第一种输入纠错方法的步骤流程图,具体可以包括如下步骤:

步骤202,接收输入字符串并记录输入间隔信息。

依次接收用户输入的字符构成输入字符串,同时记录相邻两个字符的输入时间间隔生成输入间隔信息。

而后可以在通过内核对所述输入字符串进行切分过程中,按照切分规则将输入字符串按照转换所需的音节进行音节切分,记录切分的位置即切分信息,然后采用所述切分信息对所述输入间隔信息进行匹配分析,确定纠错位置。具体如下述步骤204-214。

步骤204,采用内核对所述输入字符串进行音节切分时,将全拼音节切分的位置记录为音节边界,将所述音节边界作为切分信息。

输入法的音字转换过程由内核部分完成,即将接收的用户输入的字符串如拼音序列,经过拼音音节切分、拼音网络构建、查询词典、智能组词和候选排序等过程给用户展现出候选结果列表,以供用户进行选择。其中在音节切分的过程中通过有多种切分方法如切分成一个字或词,又如按照简拼音节进行切分和按照全拼音节进行切分等,可以分别记录切分位置为音节边界。其中,以拼音为例,音节切分是对各种形式的拼音串(即字符串)进行分割,使其成为音节组合的形式,如按照全拼音节进行切分将mngtian切分成mng’tian,又如按照简拼音节进行切分将glcf切分成g’l’c’f。

为了能够准确确定纠错字符,以切分得到一个字为例,可以按照全拼音节进行切分,将全拼音节切分的位置记录为音节边界,则上例按照全拼音节切分时切分音节为3,即字符g和t之间的位置,将所述音节边界作为切分信息。

步骤206,从所述输入间隔信息中获取各字符的输入时间间隔。

步骤208,按照第一间隔阈值对所述输入时间间隔进行检测,将超过所述第一间隔阈值的输入时间间隔对应位置作为目标位置。

本实施例以根据第一间隔阈值分析目标位置为例,从所述输入间隔信息中获取各字符的输入时间间隔后,按照第一间隔阈值对所述输入时间间隔进行检测,即采用每两个相邻字符的输入时间间隔依次与第一时间间隔进行比较,若输入时间间隔超过该第一间隔阈值,则说明该输入时间间隔较长,其可能是正常的音节切分的位置,也可能是由于漏键导致的,将该输入时间间隔对应位置作为目标位置进行记录。因此可以确定出至少一个目标位置。

例如,通过上述方式确定第一间隔阈值为180,输入字符串mngtian对 应各输入时间间隔为200、100、300、99、100、98,,则目标位置为第1、3个输入时间间隔对应位置。其中,本实施例各实施例的时间间隔、间隔阈值以毫秒ms为单位,后文不再赘述。

步骤210,将所述音节边界与目标位置进行匹配。

基于上述内容可知,超过间隔阈值的输入时间间隔可能是由一个字的全部字符输入完毕导致的,也可能是由漏输等问题导致的,漏输等问题会导致字符串出现输入错误即需要纠错。

上述切分过程得到的音节边界是两个字的全拼切分音节之间的位置,其对应输入间隔是从一个字的最后一个字符输入完毕到开始输入下一个字的第一个字符之间的较长的输入时间间隔,即通过音节边界可以查找到由于一个字的字符输入完毕而导致的输入时间间隔超过间隔阈值的情况。

因此可以按照所述音节边界对记录的各目标位置进行筛选,即将所述音节边界与每个目标位置依次进行匹配,确定该目标位置是否是音节边界。若是,即目标位置与音节边界匹配,则表征此时是由于一个字输入完毕而导致的输入时间间隔比较长。

步骤212,删除与所述音节边界匹配的目标位置,将剩余的目标位置作为纠错位置。

若目标位置与音节边界匹配,表征此时是由于一个字输入完毕而导致的输入时间间隔比较长,即非漏输导致的问题,此时可以删除该目标位置。

目标位置与音节边界不匹配所确定的剩余的目标位置,表征此处可能是由于漏输等问题导致的输入时间间隔过长,即为可能存在纠错字符的位置,不能将其删除,这类目标位置即为筛选得到的纠错位置。

步骤214,从所述输入字符串中查询与所述纠错位置相邻的至少一个字符生成待修正字符串。

通过输入时间间隔和切分信息筛选得到纠错位置后,表征该纠错位置可能存在需要纠错的内容,在输入字符串中查询与纠错位置相邻的字符,例如在纠错位置前的至少一个字符和/或在纠错位置后的至少一个字符,生成相应的待修正字符串。

上例中输入字符串mngtian的间隔分析结果中目标位置为1、3,音节边界为3,则通过音节边界从间隔分析结果中过滤掉目标位置3,则目标位置1即为纠错位置,选取该纠错位置对应前后各一个字符生成待修正字符串即为“mn”,或者依据需求确定前后获取的字符生成待修正字符串即为“mng”。

步骤216,按照纠错模型和/或语言模型对所述待修正字符串进行纠错处理,得到修正字符串。

按照纠错模型和/或语言模型对所述待修正字符串进行纠错处理,纠错方法可以有多种,例如结合输入字符串确定该待修正字符所属的输入音节,然后按照语言模型确定该音节切分对应的原始音节进行匹配,确定修正字符串。又如按照纠错模型确定一些可能的修正字符串然后进行打分等计算概率,从而确定出修正字符串,再按照所述修正字符串进行转换,得到修正的候选项。

本实施例中,还可以依据输入时间间隔确定纠错处理中对待修正字符串中修正添加的字符数量,例如间隔阈值是100,若纠错位置对应输入时间间隔是200,则确认少输入一个字符,若纠错位置对应输入时间间隔是300,则确认少输入两个字符。

实际处理中还可以在输入纠错过程中通过音节边界以及输入时间间隔确定各修正字符串的分值从而实现纠错。即在输入纠错过程中按照输入时间间隔以及切分音节进行分析的方式中,开始进行纠错尝试后,每一次尝试都根据纠错模型和语言模型进行打分,产生一系列的纠错备选。其中,可以使用键位的分布情况及大众的用户错输统计进行纠错模型训练,在尝试了各种纠错备选之后选择得分较高者给出提示,或者进行音字转换,给出纠错候选。

针对该修正字符串进行纠错时,可以确定出待修正字符串中需要补入的字符,在纠错的过程中往往也需要结合原始的输入字符串确定补入的字符,且为了后续快速确定修正候选项,可以将补入的字符和输入字符串合并构成修正字符串。

步骤218,依据所述修正字符串构成纠错提示信息。

可以将匹配出的至少一个修正字符串作为纠错提示信息,该纠错提示信 息显示在输入法的显示区域内,如虚拟键盘的扩展区,又如在该输入字符串上显示修正字符串提示用户是否纠错,从而用户可以基于该纠错提示信息选择修正字符串,后续可以依据下述步骤220对选择的修正字符串进行转换,显示修正的候选项供用户选择。

步骤220,按照所述修正字符串进行转换,得到修正的候选项。

如上述待修正字符串ng或mng纠错处理后将补入的字符和输入字符串合并确定修正字符串为“mingtian”,转换得到修正的候选项为“明天”。

步骤222,将所述输入字符串对应转换得到的候选项和所述修正的候选项进行合并,生成本次输入的综合候选项。

步骤224,信息展示。

上述修正可以是内核切分、转换等缝隙过程中执行的,因此在纠错并修正后可以将输入字符串对应转换得到的候选项,和所述修正的候选项进行合并,例如按照概率等确定生成本次输入的综合候选项,包括首屏候选项,然后对候选项进行展示,供用户选择。

如上述输入字符串mngtian正常转换后得到候选项“摩纳哥天、吗、没、买”,与修正候选项为“明天”合并后得到候选项“摩纳哥天、明天、吗、没、买”进行展示。

也可以显示纠错提示信息,然后依据用户对纠错提示信息中修正字符串的选择,显示该修正字符串对应的候选项。

上述论述了根据第一间隔阈值分析纠错的步骤,进一步论述采用第一间隔阈值和第二间隔阈值综合分析纠错的步骤。

参照图3,示出了本发明另一个实施例中第二种输入纠错方法的步骤流程图,具体可以包括如下步骤:

步骤302,接收输入字符串并记录输入间隔信息。

步骤304,采用内核对所述输入字符串进行音节切分时,将全拼音节切分的位置记录为音节边界,将所述音节边界作为切分信息。

步骤306,从所述输入间隔信息中获取各字符的输入时间间隔。

步骤308,按照第一间隔阈值对所述输入时间间隔进行检测。

本实施例以根据第一间隔阈值和第二间隔阈值综合分析目标位置为例,首先判断输入时间间隔是否超过第一间隔阈值,若输入时间间隔未超过第一间隔阈值,表征该输入时间间隔是正常输入一个字中各字符的间隔。若输入时间间隔超过了第一间隔阈值,则该间隔可能时由于漏输或不同字间停顿导致的。

步骤310,按照第二间隔阈值对超过第一间隔阈值的输入时间间隔进行检测。

对于超过第一间隔阈值的输入时间间隔,可以进一步判断该超过第一间隔阈值的输入时间间隔是否同样超过第二间隔阈值。若该输入时间间隔超过第二间隔阈值,表征该输入时间间隔是输入不同字时漏输导致的,反之,若该输入时间间隔不超过第二间隔阈值,表征该输入时间间隔不是输入不同字时漏输导致的。

例如,通过上述方式确定第一间隔阈值为180,第二间隔阈值为360,用户想要输入字符串“women”,由于漏键等原因导致实际输入字符串为“wmen”,且对应各输入时间间隔为450、100、99,则可以得到目标位置为第1个输入时间间隔对应位置。

步骤312,确定目标位置。

目标位置包括输入时间间隔超过第一间隔阈值但未超过第二间隔阈值对应位置,还包括括输入时间间隔超过第二间隔阈值对应位置,即目标位置满足至少输入时间间隔超过第一间隔阈值。

步骤314,将所述音节边界与目标位置进行匹配,确定与音节边界匹配的目标位置。

基于上述内容可知,超过间隔阈值的输入时间间隔可能是由一个字的全部字符输入完毕导致的,也可能是由漏输等问题导致的,漏输等问题会导致字符串出现输入错误即需要纠错。

可以按照所述音节边界对记录的各目标位置进行筛选,即将所述音节边界与每个目标位置依次进行匹配,确定该目标位置是否是音节边界。若是,即目标位置与音节边界匹配,则表征此时是由于一个字输入完毕而导致的输 入时间间隔比较长

步骤316,是否是超过第二间隔阈值的目标位置。

可以检测与所述音节边界匹配的目标位置,是否是超过第二间隔阈值的目标位置。

若是,即与所述音节边界匹配的目标位置是超过第二间隔阈值的目标位置,则可能是在音节边界处存在字符漏输导致的,应该保留该位置作为目标位置,后续执行步骤320。

若否,即与所述音节边界匹配的目标位置是不超过第二间隔阈值的目标位置,执行步骤318。

步骤318,删除与所述音节边界匹配的目标位置。

当目标位置为输入时间间隔超过第一间隔阈值,且未超过第二间隔阈值对应位置时,若匹配其为音节边界,可以删除该目标位置,即不再保留该目标位置。

步骤320,将保留的目标位置作为纠错位置。

保留的目标位置表征此处可能是由于漏输等问题导致的输入时间间隔过长,即为可能存在纠错字符的位置,不能将其删除,这类目标位置即为筛选得到的纠错位置。

步骤322,从所述输入字符串中查询与所述纠错位置相邻的至少一个字符生成待修正字符串。

可以得到目标位置为第1个输入时间间隔对应位置。

上例中输入字符串“wmen”的目标位置为1,音节边界为1,但该与音节边界匹配的目标位置对应输入时间间隔超过了第二间隔阈值,因此将目标位置1作为纠错位置,选取该纠错位置对应前后各一个字符生成待修正字符串即为“wm”,或者依据需求确定前后获取的字符生成待修正字符串,如将整个输入字符串确定为待修正字符串“wmen”。

步骤324,按照纠错模型和/或语言模型对所述待修正字符串进行纠错处理,得到修正字符串。

步骤326,依据所述修正字符串构成纠错提示信息。

可以将匹配出的至少一个修正字符串作为纠错提示信息,该纠错提示信息显示在输入法的显示区域内,如虚拟键盘的扩展区,又如在该输入字符串上显示修正字符串提示用户是否纠错,从而用户可以基于该纠错提示信息选择修正字符串,后续可以依据下述步骤220对选择的修正字符串进行转换,显示修正的候选项供用户选择。

步骤328,按照所述修正字符串进行转换,得到修正的候选项。

步骤330,将所述输入字符串对应转换得到的候选项和所述修正的候选项进行合并,生成本次输入的综合候选项。

步骤332,信息展示。

上述修正可以是内核切分、转换等缝隙过程中执行的,因此在纠错并修正后可以将输入字符串对应转换得到的候选项,和所述修正的候选项进行合并,例如按照概率等确定生成本次输入的综合候选项,包括首屏候选项,然后对候选项进行展示,供用户选择。

也可以显示纠错提示信息,然后依据用户对纠错提示信息中修正字符串的选择,显示该修正字符串对应的候选项。

从而在字符串转换过程中可以直接对漏输等问题导致的输入错误进行修正,并将得到的修正候选项与输入字符串对应转换得到的候选项一同展示,避免用户的退格重输行为,提高输入效率。

本实施例中,为了避免纠错误操作,还可以在纠错处理确定修正字符串后,生成纠错提示信息显示给用户,从而在用户确定修正字符串后再转换候选项,在避免误纠错操作的同时避免用户的退格重输行为,提高输入效率。

实施例三

在上述实施例的基础上,本实施例举例论述输入纠错的步骤。

如图4A所示,现有技术中用户想要输入“shichuan”,但由于漏键导致实际的输入字符串为“sichuan”时,内核转换得到候选项“四川、死、四、司、思”,因此需要删除该输入字符串重新输入或者将光标放在漏输位置后插入漏输的字符“h”,得到候选项“失传、试穿、石川、市川、史传”。在该过程中用户若删掉已经键入的字母ichuan,补全漏掉的字母h,然后继续 键入后续字母ihuan,把每一次删除一个字母也算作一次按键的话,前前后后用户总共多按了13次按键,输入效率较低。

如图4B所示,本实施例中输入法对于上述漏键导致实际的输入字符串为“sichuan”的情况会在接收的过程中会记录输入时间间隔,如输入时间间隔分别为220、300、100、99、101、100,该用户的第一间隔阈值为180,第二间隔阈值为360,则确定第1、2间隔位置为目标位置,此后获取切分音节为位置2,通过分析能够确定在第1个间隔位置为纠错位置,即字符“s”“i”之间出现漏输,确定待修正字符串为“si”,纠错修正后确定字符串为“shichuan”,确定修正的候选项为“试穿、石川、失传、市川、史传”,与内核对输入字符串分析得到的候选项“四川、死、四、司、思”进行组合,得到最终的纠错候选项“四川、失传、试穿、石川、死”,直接展示包含输入字符串和修正字符串的分别转换的候选项,用户可以直接点选“失传”进行上屏,输入字符串后可以直接选择所需的候选项,大大的提高了输入效率。

上例中,本实施例的纠错方法中用户输入字符串需要的击键次数为8次,由于漏键,现有方法中用户多进行了13次击键行为,即总共会有21次击键行为,是原来的2.625倍,另外,将用户首次输入完毕会去查看候选,以及进行错误的发现,这些时间成本都计入的话,上述图4A的现有输入方式的输入以及纠错时间成本,是本实施例所述输入方式的输入以及纠错时间成本的3倍左右,大大提高了输入效率。

本实施例依据输入时间间隔和音节切分信息确定纠错位置,用户在输入字符串时实质上通过输入时间间隔反馈了输入过程,记录用户输入时间并依此来进行纠错,从而在纠错时实现与用户输入过程的互动,更加准确、快速的定位纠错位置。

本实施例中,输入法能够抓住用户输入时的时间信息,而仅仅利用输入串这种一成不变的东西是很难做出很智能的决策的,针对每一次输入事件,用户也会有不同的需求,而在给定了上文,输入法客户端记录信息一致的情况下,不同的人、同一个人的两次相同的输入,现有输入法通常会给出相同的结果,从而可能出现没有用户所需候选的问题。如图5A所示,采用9键 式键盘进行输入时,现有技术中用户想要输入“94664486”,但由于漏键导致实际的输入字符串为“9464486”,内核转换得到候选项“英国、赢过、星火、萤火”,但用户在输入过程中出现漏输情况,因此需要删除该输入字符串重新输入,得到候选项“中国、重活、中过、种过”。

如图5B所示,某一次用户A在输入字符串“9464486”时记录输入时间间隔为100、100、220、300、99、100,该用户的第一间隔阈值为180,第二间隔阈值为360,则确定第3、4间隔位置为目标位置,依据切分音节确定第3个间隔位置为纠错位置,经过纠错处理后确定修正的候选项与输入字符串的候选项结合后,显示给用户的候选项为“英国、中国、赢过、星火”。又如图5C所示,另一次该用户A获取输入字符串“9464486”时若记录输入时间间隔为100、100、99、300、99、100,则确定第4间隔位置为目标位置,依据切分音节确定整个字符串无需纠错,即显示给用户的候选项为“中国、重活、中过、种过””。可见,本实施例在用户输入时记录输入的时间间隔信息,即使同一用户两次输入的字符串相同,也会根据该用户每次输入时的不同击键行为,灵活地进行候选调整,获取更匹配用户需求的候选项。

需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。

实施例四

在上述实施例的基础上,本实施例还公开了一种输入法装置。

参照图6,示出了本发明一种输入法装置实施例的结构框图,具体可以包括如下模块:

接收并记录模块602,用于接收输入字符串并记录输入间隔信息。

纠错模块604,用于按照音节切分过程确定的切分信息对所述输入间隔信息进行分析,确定纠错位置。

修正模块606,用于依据所述纠错位置对所述输入字符串进行纠错处理。

综上所述,接收输入字符串并记录输入间隔信息,从而采用切分过程中确定的切分信息对该输入间隔信息进行分析,快速定位纠错位置确定纠错位置,然后依据所述纠错位置对所述输入字符串进行纠错处理,得到修正的候选项,按照切分信息和输入间隔可以快速定位纠错位置,从而提高了纠错效率,快速纠错修正,进而提高了输入效率。

参照图7示出了本发明另一种输入法装置实施例的结构框图,具体如下:

接收并记录模块702,用于接收输入字符串并记录输入间隔信息。

纠错模块704,用于按照音节切分过程确定的切分信息对所述输入间隔信息进行分析,确定纠错位置。

修正模块706,用于依据所述纠错位置对所述输入字符串进行纠错处理,得到修正的候选项。

所述纠错模块704,包括:切分记录子模块70402,用于在通过内核对所述输入字符串进行音节切分过程中记录切分信息;分析纠错子模块70404,用于采用所述切分信息对所述输入间隔信息进行匹配分析,确定纠错位置。

所述切分记录子模块70404,用于采用内核对所述输入字符串进行切分时,将全拼音节切分的位置记录为音节边界,将所述音节边界作为切分信息。

所述纠错模块,还包括:间隔分析子模块70406,用于从所述输入间隔信息中获取各字符的输入时间间隔;按照间隔阈值对所述输入时间间隔进行检测,将超过所述间隔阈值的输入时间间隔对应位置作为目标位置。

本发明一个可选实施例中,所述分析纠错子模块70404,用于将所述音节边界与所述目标位置进行匹配;删除与所述音节边界匹配的目标位置,将剩余的目标位置作为纠错位置。

本发明另一个可选实施例中,所述间隔阈值包括第一间隔阈值和第二间隔阈值,其中,第二间隔阈值大于第一间隔阈值;所述分析纠错子模块70404,用于将所述音节边界与所述目标位置进行匹配,确定与所述音节边界匹配的目标位置;检测与所述音节边界匹配的目标位置是否是超过第二间隔阈值的目标位置;当匹配的目标位置是不超过第二间隔阈值的目标位置时,删除与所述音节边界匹配的目标位置,将剩余的目标位置作为纠错位置。

所述修正模块706,用于从所述输入字符串中查询与所述纠错位置相邻的至少一个字符生成待修正字符串;按照纠错模型对所述待修正字符串进行纠错处理,得到修正字符串;依据所述修正字符串构成纠错提示信息,和/或,按照所述修正字符串进行转换确定修正的候选项。

所述修正模块706,还用于将所述输入字符串对应转换得到的候选项和所述修正的候选项进行合并,生成本次输入的综合候选项;还包括:展示模块708,用于对所述综合候选项进行展示,或,展示所述纠错提示信息,依据对纠错提示信息中修正字符串的选择,显示所述修正字符串对应的候选项。

本实施例依据输入时间间隔和切分的音节边界确定纠错位置,即依据用户输入的反馈信息来进行纠错,从而在纠错时实现与用户的互动,更加准确、快速的定位纠错位置。

对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。

本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、 专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。

最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。

以上对本发明所提供的一种输入纠错方法和一种输入法装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以 上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1