一种基于用户输入速度的输入法纠错方法和装置与流程

文档序号:11475430阅读:216来源:国知局
一种基于用户输入速度的输入法纠错方法和装置与流程

本发明涉及输入法领域,尤其涉及一种基于用户输入速度的输入法纠错技术。



背景技术:

用户在用户设备中输入文本时主要通过现有的两种方案进行纠错:1)通过文本纠错的模型来进行纠错;2)通过输入时的落点信息,以落点距离各个按键的位置关系来决定如何对输入码进行纠错。其中,所述文本纠错模型比较僵硬,只能通过较严格的筛选策略来保证出词质量,并且会忽略很多用户输入时的环境、场景信息,而只根据落点信息进行判断,由于屏幕尺寸、分辨率、使用用户的年龄、手的尺寸、单双手的使用习惯等因素的不同,容易引起误判,从而导致纠错出词的质量不高。

因此,如何提供一种更高效、更准确、更灵活的输入法纠错方案,成为本领域技术人员亟需解决的技术问题之一。



技术实现要素:

本发明的目的是提供一种基于用户输入速度的输入法纠错方法和装置。

根据本发明的一个方面,提供一种基于用户输入速度的输入法纠错方法,其中,该纠错方法包括以下步骤:

a.获取被触发的当前单独按键的输入速度;

b.根据所述输入速度调整所述当前单独按键对应的输入码纠正为其他按键对应的输入码时的权重;

c.基于调整后的所述权重对所述当前单独按键对应的输入码进行纠错,获得纠错后的至少一个输入码;

d根据一次整体输入中各个按键所对应的纠错后的至少一个输入码,确定所述整体输入所对应的至少一个候选词。

优选地,所述纠错方法还包括:

e.根据所述一次整体输入对应的整体输入码的输入时间,得出所述整体输入码中每个输入码对应的按键的平均输入速度,调整与所述整体输入对应的所述至少一个候选词的排序。

优选地,所述步骤e包括:

e1.根据所述整体输入码的所述输入时间计算得出所述整体输入码中每个输入码对应的按键的所述平均输入速度;

e2.基于所述平均输入速度确定对应的纠错模型;

e3.根据所述纠错模型调整与所述整体输入对应的所述至少一个候选词的排序。

优选地,根据所述输入速度调整将所述当前单独按键对应的输入码纠正为其他按键对应的输入码时的权重包括以下至少任一项:

增加易误触按键对应的输入码纠正成其他按键对应的输入码时的权重;

降低易误触按键对应的输入码纠正成其他按键对应的输入码时本身的权重;

增加难误触按键对应的输入码纠正成其他按键对应的输入码时本身的权重;

降低难误触按键对应的输入码纠正成其他按键对应的输入码时的权重。

优选地,按键误触难易程度的判断包括以下至少任一项:

根据单独按键输入速度的档位分级判断;

根据单独按键输入速度的打分权重判断;

根据单独按键输入速度及当前输入环境的拟合函数映射的分级判断;

根据单独按键输入速度及当前输入环境的拟合函数映射的打分权重判断。

优选地,基于所述平均输入速度确定对应的纠错模型包括以下至少任一项:

单独基于所述平均输入速度的纠错档位模型;

单独基于所述平均输入速度的纠错打分模型;

基于所述平均输入速度及其余环境参数拟合的纠错档位模型;

基于所述平均输入速度及其余环境参数拟合的纠错打分模型。

优选地,所述步骤e还包括:

对由所述整体输入码中的每个输入码键入的时序所构成的序列进行去噪处理,获得去噪时序序列;

根据所述去噪时序序列,确定所述整体输入码的输入时间;

根据所述整体输入码的输入时间得出所述整体输入码的所述平均输入速度,调整与所述整体输入对应的所述至少一个候选词的排序。

优选地,所述去噪处理包括以下至少任一项:

当一输入码键入的时序大于预定时序上限阈值或者小于预定时序下限阈值时,去除所述时序;

当一输入码键入的时序与本次输入平均时序值的比例大于预定比例上限阈值或者小于预定比例下限阈值时,去除所述时序;

当一输入码键入的与本次输入环境的拟合函数的映射值大于预定映射上限阈值或者小于预定映射下限阈值时,去除所述时序。

优选地,所述纠错方法还包括:

根据触发按键的用户的特征确定所述用户所在的用户组;

根据所述用户组信息优化所述纠错方法。

优选地,所述纠错方法还包括:

获取用户历史输入习惯信息;

根据所述历史输入习惯信息优化所述纠错方法。

根据本发明的另一个方面,还提供了一种基于用户输入速度的输入法纠错装置,其中,该纠错装置包括:

一种基于用户输入速度的输入法纠装置,其中,该纠错装置包括:

获取装置,用于获取被触发的当前单独按键的输入速度;

调整装置,用于根据所述输入速度调整所述当前单独按键对应的输入码纠正为其他按键对应的输入码时的权重;

获得装置,用于基于调整后的所述权重对所述当前单独按键对应的输入码进行纠错,获得纠错后的至少一个输入码;

确定装置,用于根据一次整体输入中各个按键所对应的纠错后的至少一个输入码,确定所述整体输入所对应的至少一个候选词。

优选地,所述纠错装置还包括:

排序装置,用于根据所述一次整体输入对应的整体输入码的输入时间,得出所述整体输入码中每个输入码对应的按键的平均输入速度,调整与所述整体输入对应的所述至少一个候选词的排序。

优选地,所述排序装置包括:

计算单元,用于根据所述整体输入码的所述输入时间计算得出所述整体输入码中每个输入码对应的按键的所述平均输入速度;

第一确定单元,用于基于所述平均输入速度确定对应的纠错模型;

第一调整单元,用于根据所述纠错模型调整与所述整体输入对应的所述至少一个候选词的排序。

优选地,根据所述输入速度调整将所述当前单独按键对应的输入码纠正为其他按键对应的输入码时的权重包括以下至少任一项:

增加易误触按键对应的输入码纠正成其他按键对应的输入码时的权重;

降低易误触按键对应的输入码纠正成其他按键对应的输入码时本身的权重;

增加难误触按键对应的输入码纠正成其他按键对应的输入码时本身的权重;

降低难误触按键对应的输入码纠正成其他按键对应的输入码时的权重。

优选地,按键误触难易程度的判断包括以下至少任一项:

根据单独按键输入速度的档位分级判断;

根据单独按键输入速度的打分权重判断;

根据单独按键输入速度及当前输入环境的拟合函数映射的分级判断;

根据单独按键输入速度及当前输入环境的拟合函数映射的打分权重判断。

优选地,基于所述平均输入速度确定对应的纠错模型包括以下至少任一项:

单独基于所述平均输入速度的纠错档位模型;

单独基于所述平均输入速度的纠错打分模型;

基于所述平均输入速度及其余环境参数拟合的纠错档位模型;

基于所述平均输入速度及其余环境参数拟合的纠错打分模型。

优选地,所述排序装置还包括:

去噪单元,用于对由所述整体输入码中的每个输入码键入的时序所构成的序列进行去噪处理,获得去噪时序序列;

第二确定单元,用于根据所述去噪时序序列,确定所述整体输入码的输入时间;

第二调整单元,用于根据所述整体输入码的输入时间得出所述整体输入码的所述整体输入速度,调整与所述整体输入对应的所述至少一个候选词的排序。

优选地,所述去噪处理包括以下至少任一项:

当一输入码键入的时序大于预定时序上限阈值或者小于预定时序下限阈值时,去除所述时序;

当一输入码键入的时序与本次输入平均时序值的比例大于预定比例上限阈值或者小于预定比例下限阈值时,去除所述时序;

当一输入码键入的与本次输入环境的拟合函数的映射值大于预定映射上限阈值或者小于预定映射下限阈值时,去除所述时序。

优选地,所述纠错装置还用于:

根据触发按键的用户的特征确定所述用户所在的用户组;

根据所述用户组信息优化所述纠错装置。

优选地,所述纠错装置还用于:

获取用户历史输入习惯信息;

根据所述历史输入习惯信息优化所述纠错装置。

优选地,本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机代码,当所述计算机代码被执行时,如上述任一项所述的方法被执行。

优选地,本发明还提供了一种计算机程序产品,当所述计算机程序产品被计算机设备执行时,如上述任一项所述的方法被执行。

优选地,本发明还提供了一种计算机设备,所述计算机设备包括:

一个或多个处理器;

存储器,用于存储一个或多个计算机程序;

当所述一个或多个计算机程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上述任一项所述的方法。

与现有技术相比,本发明具有以下优点:

本发明通过对大数据进行分析,从时间维度挖掘用户输入速度与纠错之间的关系,以辅助纠错模型进行精确纠错,本发明通过持续获取用户输入每一单独按键时的输入速度,并根据所述输入速度对应的误触率对应转换为调整所述当前单独按键对应的输入码纠正为其他按键对应的输入码时的权重,从而将输入速度作为通过纠错模型纠正输入码的一个因素,从时间的维度对输入法进行评估,将通过用户触发的键盘的落点这一空间维度确定的输入码进行进一步纠正,从而提升了纠错模型进行纠错的准确率,提高了用户输入的质量。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:

图1示出根据本发明一个方面的一种基于用户输入速度的输入法纠错装置结构示意图;

图2-a示出所述误触率与单独按键输入时间的关系;

图2-b为输入显示的示例;

图3示出根据本发明一个方面的一种基于用户输入速度的输入法纠错方法的流程示意图。

附图中相同或相似的附图标记代表相同或相似的部件。

具体实施方式

在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。

在上下文中所称“计算机设备”,也称为“电脑”,是指可以通过运行预定程序或指令来执行数值计算和/或逻辑计算等预定处理过程的智能电子设备,其可以包括处理器与存储器,由处理器执行在存储器中预存的存续指令来执行预定处理过程,或是由asic、fpga、dsp等硬件执行预定处理过程,或是由上述二者组合来实现。计算机设备包括但不限于服务器、个人电脑、笔记本电脑、平板电脑、智能手机等。

所述计算机设备包括用户设备与网络设备。其中,所述用户设备包括但不限于电脑、智能手机、pda等;所述网络设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(cloudcomputing)的由大量计算机或网络服务器构成的云,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。其中,所述计算机设备可单独运行来实现本发明,也可接入网络并通过与网络中的其他计算机设备的交互操作来实现本发明。其中,所述计算机设备所处的网络包括但不限于互联网、广域网、城域网、局域网、vpn网络等。

需要说明的是,所述用户设备、网络设备和网络等仅为举例,其他现有的或今后可能出现的计算机设备或网络如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。

后面所讨论的方法(其中一些通过流程图示出)可以通过硬件、软件、固件、中间件、微代码、硬件描述语言或者其任意组合来实施。当用软件、固件、中间件或微代码来实施时,用以实施必要任务的程序代码或代码段可以被存储在机器或计算机可读介质(比如存储介质)中。(一个或多个)处理器可以实施必要的任务。

这里所公开的具体结构和功能细节仅仅是代表性的,并且是用于描述本发明的示例性实施例的目的。但是本发明可以通过许多替换形式来具体实现,并且不应当被解释成仅仅受限于这里所阐述的实施例。

应当理解的是,虽然在这里可能使用了术语“第一”、“第二”等等来描述各个单元,但是这些单元不应当受这些术语限制。使用这些术语仅仅是为了将一个单元与另一个单元进行区分。举例来说,在不背离示例性实施例的范围的情况下,第一单元可以被称为第二单元,并且类似地第二单元可以被称为第一单元。这里所使用的术语“和/或”包括其中一个或更多所列出的相关联项目的任意和所有组合。

应当理解的是,当一个单元被称为“连接”或“耦合”到另一单元时,其可以直接连接或耦合到所述另一单元,或者可以存在中间单元。与此相对,当一个单元被称为“直接连接”或“直接耦合”到另一单元时,则不存在中间单元。应当按照类似的方式来解释被用于描述单元之间的关系的其他词语(例如“处于...之间”相比于“直接处于...之间”,“与...邻近”相比于“与...直接邻近”等等)。

这里所使用的术语仅仅是为了描述具体实施例而不意图限制示例性实施例。除非上下文明确地另有所指,否则这里所使用的单数形式“一个”、“一项”还意图包括复数。还应当理解的是,这里所使用的术语“包括”和/或“包含”规定所陈述的特征、整数、步骤、操作、单元和/或组件的存在,而不排除存在或添加一个或更多其他特征、整数、步骤、操作、单元、组件和/或其组合。

还应当提到的是,在一些替换实现方式中,所提到的功能/动作可以按照不同于附图中标示的顺序发生。举例来说,取决于所涉及的功能/动作,相继示出的两幅图实际上可以基本上同时执行或者有时可以按照相反的顺序来执行。

图1示出根据本发明一个方面的一种基于用户输入速度的输入法纠错装置结构示意图。纠错装置1包括:获取装置101、调整装置102、获得装置103和确定装置104。

在此,纠错装置1例如位于用户设备中,所述用户设备包括但不限于个人电脑、便携式电脑、平板电脑、智能手机、pda等。

本领域技术人员应能理解上述用户设备仅为举例,现有的或者今后可能出现的用户设备如可适用于本发明也应包含在本发明保护范围内,并以引用的方式包含于此。本领域技术人员还应能理解,此处所述用户设备,指可以通过运行预定程序或指令来执行数值计算和/或逻辑计算等预定处理过程的智能电子设备,其可以包括处理器与存储器,由处理器执行在存储器中预存的存续指令来执行预定处理过程,或是由asic、fpga、dsp等硬件执行预定处理过程,或是由上述二者组合来实现。

其中,获取装置101获取被触发的当前单独按键的输入速度。具体地,用户在进行输入操作,按下或者触摸用户设备的键盘中某一按键时,其中所述键盘包括但不限于:实物键盘或者用户设备屏幕上的虚拟键盘,获取装置101通过与该用户设备的交互,如一次或多次调用输入应用提供的应用程序接口(api),获取用户设备传感器采集的该用户触发的当前单独按键的输入速度,获取装置101根据该输入速度,

本领域技术人员应能理解,上述输入速度对应的误触率仅为举例,实际输入速度与误触率对应的映射关系为通过对大数据进行分析,统计的误触数值。

调整装置102根据所述输入速度调整所述当前单独按键对应的输入码纠正为其他按键对应的输入码时的权重。具体地,经过调研实验,将每一个按键单独输入的时间作为分组的容器,并统计单独按键输入时间对应的误触率,其中,所述单独按键输入时间为相邻两个单独按键被触发的时间间隔,图2-a示出所述误触率与单独按键输入时间的关系,根据单独按键的输入时间可以计算出单独按键的输入速度,输入速度=1/输入时间,根据图2-a所示,随着单独按键输入速度越慢,即单独按键输入时间越长,误触率是逐步降低的,即,用户输入速度越快,越容易按错,因此,调整装置102根据所述输入速度调整所述当前单独按键对应的输入码纠正为其他按键对应的输入码时的权重,并将所述权重应用于现有的纠错模型中,辅助现有纠错模型进行纠错,提高用户输入的准确率。例如,若某一单独按键的输入速度比较快,调整装置102根据该输入速度增加当前单独按键对应的输入码纠正成其他按键对应的输入码的权重w;或者若某一单独按键的输入速度比较慢,调整装置102根据该输入速度减小了当前单独按键对应的输入码纠正成其他按键对应的输入码的权重w。其中所述权重w的具体数值可以通过预定的规则进行设置,例如,总权重值tw设置为1,w为0-1之间任意数值,w的具体数值根据预定的规则确定。

其中,根据所述输入速度调整将所述当前单独按键对应的输入码纠正为其他按键对应的输入码时的权重包括但不限于:1)增加易误触按键对应的输入码纠正成其他按键对应的输入码时的权重;2)降低易误触按键对应的输入码纠正成其他按键对应的输入码时本身的权重;3)增加难误触按键对应的输入码纠正成其他按键对应的输入码时本身的权重;4)降低难误触按键对应的输入码纠正成其他按键对应的输入码时的权重。具体地,当所述输入速度比较快时,例如当前单独按键的所述输入速度超过预定速度阈值vf时,所述当前单独按键为易误触按键,将易误触按键纠正成其他按键的权重增加,降低当前单独按键本身的权重,其中所述权重记为第一权重,所述第一权重指将当前单独按键本身的权重以及将当前单独按键纠正成其他按键的权重。例如,以qwerty全键盘为例,获取到的用户当前单独按键为“r”,当此时所述当前单独按键“r”为易误触按键时,即,当前单独按键的输入速度偏大时,则将用户希望触发的按键为“r”本身的第一权重减小,将用户希望触发的按键为“r”周围按键“e”、“f”、“t”的第一权重分别增加。其中,所述用户希望触发的按键为用户的目的按键,所述当前单独按键为用户设备获取到的触发按键,所述当前单独按键不一定为用户的目的按键,因此,所述当前单独按键本身也有对应的第一权重,以便纠错模型根据各个按键的第一权重,结合其他参数,判断出用户的目的按键。相对的,当前单独按键的所述输入速度低于预定速度阈值vs时,即当前单独按键的输入速度偏小时,所述当前单独按键为难误触按键,将难误触按键本身的第一权重增加,降低难误触按键对应的输入码纠正成其他按键对应的输入码时的第一权重。例如,获取到的用户当前单独按键为“i”,当此时所述当前单独按键“i”为难误触按键时,则将用户希望触发的按键为“i”本身的第一权重增加,将用户希望触发的按键为“r”周围按键“u”、“k”、“o”的第一权重分别减小。

优选地,按键误触难易程度的判断过程包括但不限于:

1)根据单独按键输入速度的档位分级判断,例如,按照输入速度大小范围将单独按键输入速度的档位分为:高档和低档,当所述单独按键输入速度位于高档位时,该单独按键获得对应于高档位的第二权重,基于该第二权重可以确定所述单独按键为难误触按键还是易误触按键,当所述单独按键输入速度位于低档位时,该单独按键获得对应于低档位的第二权重,基于该第二权重可以确定所述单独按键为难误触按键还是易误触按键。其中,按照输入速度大小范围对单独按键输入速度进行分档的档位还可以有其他多种方式。

2)根据单独按键输入速度的打分权重判断,具体地,用户触发一单独按键时,获取装置101获取被触发的当前单独按键的输入速度,根据该单独按键输入速度进行为该单独按键进行打分,例如,通过设置以输入速度为变量的函数,计算不同的输入速度分别对应的分数,根据所述分数获得所述单独按键输入速度对应的第二权重,基于所述第二权重判断所述单独按键为易误触还是难误触按键。

3)根据单独按键输入速度及当前输入环境的拟合函数映射的分级判断,具体地,根据所述单独按键输入速度和当前输入环境这两类参数生成拟合函数,综合判断所述当前单独按键处于哪个档位,并根据所处档位判断当前单独按键为易误触按键还是难误触按键。其中,所述当前输入环境例如为光线是否充足,当前输入设备为电脑、平板还是手机,用户设备处于静止状态还是移动状态,移动速度为多少。

4)根据单独按键输入速度及当前输入环境的拟合函数映射的打分权重判断,具体地,根据该单独按键输入速度和当前输入环境为该单独按键进行打分,例如,通过设置以输入速度和当前输入环境为变量的拟合函数,计算不同的输入度和不同的输入环境下,所述单独按键分别对应的分数,根据所述分数获得所述单独按键输入速度对应的第二权重,基于所述第二权重判断所述单独按键为易误触还是难误触按键。

本领域技术人员应能理解,根据所述输入速度调整将所述当前单独按键对应的输入码纠正为其他按键对应的输入码时的权重的方式仅为举例,现有的或者今后可能出现的根据所述输入速度调整将所述当前单独按键对应的输入码纠正为其他按键对应的输入码时的权重的方式,如可适用于本发明,都应包含在本发明的保护范围内,并在此以引用的方式包含于此。

获得装置103基于调整后的所述权重对所述当前单独按键对应的输入码进行纠错,获得纠错后的至少一个输入码。具体地,获得装置103基于所述权重修正与纠错装置1对应的输入法相应的纠错模型,此处的权重为第一权重,将被触发的当前单独按键的输入速度作为所述纠错模型的一个参数,从而使所述纠错模型在进行纠错时从时间维度进行评估、计算,并结合与所述当前单独按键属于一次整体输入的至少一个未被上屏输入已触发历史按键,将所述当前单独按键对应的输入码进行纠错,获得纠错后的至少一个输入码,其中,所述一次整体输入由当前单独按键加上所述未被上屏输入的已触发历史按键组成,即未被上屏输入的所有输入码,每多输入一个单独按键之后,未被上屏输入的已触发历史按键所对应的候选词都会发生变化。例如,如图2-b所示的输入过程,图2-b为输入显示的示例,一次整体输入指“shoifashi”,如果用户未进行上屏输入,继续输入“zainali”,则此时的一次整体输入为“shoifashizainali”。

例如,当调整装置102调整后的当前单独按键对应的输入码纠正为其他按键对应的输入码时的权重偏大时,纠错装置1将当前单独按键对应的输入码纠正成其他输入码的比重便偏大,所述输入法对应的纠错模型将所述当前单独按键纠正成其他按键的概率便会提高,根据所述调整后的权重选择合适的现有纠错模型,并将所述调整后的权重用于现有的纠错模型中,与现有纠错模型中的其他参数共同进行纠错,即,从时间的维度进行纠错,将当前单独按键输入速度引入现有纠错模型中,作为现有纠错模型的重要考虑因素,准确的对输入码进行纠错,获得装置103获得经过所述纠错模型纠错后的至少一个输入码。其中,所述纠错后的至少一个输入码可以仍为当前单独按键对应的输入码,也可以为将所述当前单独按键对应的输入码纠成其他按键对应的输入码。例如,当所述输入界面为触摸的虚拟qwerty全键盘界面时,根据用户进行输入时的触发的键盘的落点位置l,纠错装置1计算键盘上所有按键中心点至该落点位置l的距离s1,s2……sn,并根据所述距离计算出用户触发的当前单独按键分别为各个按键的概率,然后根据所述概率或者结合其他参数,得出用户触发的所述当前单独按键对应的输入码为“s”,并且“s”的输入速度为9字母/秒,获取装置101获取输入码“s”的输入速度为9字母/秒,如果设置一输入速度阈值未5字母/秒,当输入码的输入速度大于该输入速度阈值时,即,所述输入速度位于高档时,增加所述当前单独按键对应的输入码纠正为其他按键对应的输入码时的权重,减小述当前单独按键对应的输入码纠正成自身“s”的权重,即用户的目的按键仍为“s”本身的权重,则,调整装置102根据所述输入速度,判断所述输入速度大于输入速度阈值,则将“s”纠正为“w”的权重增加为w1,将“s”纠正为“a”的权重增加为w2,纠正为“d”的权重增加为w3,纠正为“x”的增加为w4,用户的目的按键仍为“s”本身的权重减小为w5,获得装置103基于权重w1,w2,w3,w4,w5,以及当前单独按键之前的历史按键综合判断将当前单独按键纠正为其他按键的概率,例如,基于计算将“s”分别纠正为“w”、“a”、“d”、“x”的概率分别为p1、p2、p3、p4,以及用户的目的按键认为“s”的概率为p5,根据p1、p2、p3、p4和p5确定用户的目的按键为“a”。基于当前单独按键之前的未上屏输入的历史按键综合判断将当前单独按键纠正为其他按键的概率,结合现有纠错模型的纠错方法共同对当前单独按键对应的输入码进行纠错,例如,若“s”之前纠错后的输入的字母为声母“p”,由于“p”和“s”都是声母,将字母“s”纠正成键盘上与“s”相邻的韵母“a”的权重增大。

本领域技术人员应能理解,上述根据输入速度阈值确定如何调整所述当前单独按键对应的输入码纠正为其他按键对应的输入码时的权重的方式仅为举例,现有的或者今后可能出现的确定如何调整所述当前单独按键对应的输入码纠正为其他按键对应的输入码时的权重的方式,如可适用于本发明都应包含在本发明的保护范围内,并在此以引用的方式包含于此。在此,获得装置103获得纠错后的至少一个输入码,将不在输入界面进行显示,只在系统后台进行登记,即,输入界面显示的仍然是用户触发的按键对应的输入码。

在此,通过对大数据进行分析,从时间维度挖掘用户输入速度与纠错之间的关系,以辅助纠错模型进行精确纠错,其中,纠错装置1通过持续获取用户输入每一单独按键时的输入速度,并根据所述输入速度调整所述当前单独按键对应的输入码纠正为其他按键对应的输入码时的权重,从而将输入速度作为通过纠错模型纠正输入码的一个因素,从时间的维度对输入法进行评估,将通过用户触发的键盘的落点这一空间维度确定的输入码进行进一步纠正,从而提升了纠错模型进行纠错的准确率,提高了用户输入的质量。

确定装置104根据一次整体输入中各个按键所对应的纠错后的至少一个输入码,确定所述整体输入所对应的至少一个候选词。具体地,获得装置103依次获得纠错后的至少一个输入码,获得装置103获得一次整体输入的各个按键对应的纠错后的输入码后,确定装置确定所述整体输入所对应的至少一个候选词。例如,接上例,将字母“s”纠正成键盘上与“s”相邻的韵母“a”后,字母“a”与之前的字母“p”组成了“pa”,确定装置104确定与“pa”对应的至少一个候选词:怕,爬,趴,帕……。进一步地,确定装置104仍根据纠错前的至少一个输入码,确定对应的至少一个候选词,并且纠错前的至少一个输入码对应的至少一个候选词的优先级要低于纠错后的至少一个输入码对应的至少一个候选词。例如,纠错之前的输入码“ps”对应的至少一个候选词“评述”、“平时”、“拍摄”等优先级低于“怕,爬,趴,帕……”。

其中,所述输入过程是连续不断的,用户不停的输入,只要在输入输入码的过程中没有进行上屏输入,则当前一次整体输入中包括的输入码不断的增加,新增加的输入码经过纠错之后,不断结合未被上屏输入的历史输入码,使所述整体输入所对应的至少一个候选词发生动态变化。

优选地,所述纠错装置1还包括:排序装置(未示出)。

排序装置根据所述一次整体输入对应的整体输入码的输入时间,得出所述整体输入码中每个输入码对应的按键的平均输入速度,调整与所述整体输入对应的所述至少一个候选词的排序。具体地,当用户一次整体输入完成后,排序装置根据获取到的该次整体输入对应的整体输入码的输入时间,以及该次整体输入过程中的输入码的个数,计算得出该次整体输入码中每个输入码对应的按键的平均输入速度,然后按照所述平均输入速度调整与所述整体输入对应的所述至少一个候选词的排序。

优选地,所述排序装置包括:计算单元(未示出)、第一确定单元(未示出)和第一调整单元(未示出)。

其中,计算单元根据所述整体输入码的所述输入时间计算得出所述整体输入码中每个输入码对应的按键的所述平均输入速度。具体地,计算单元根据所述整体输入码的所述输入时间,以及所述整体输入码中包括的输入码的个数,计算得出所述整体输入码中每个输入码对应的按键的所述平均输入速度。

第一确定单元基于所述平均输入速度确定对应的纠错模型,其中,所述纠错模型包括但不限于:1)单独基于所述平均输入速度的纠错档位模型;2)单独基于所述平均输入速度的纠错打分模型;3)基于所述平均输入速度及其余环境参数拟合的纠错档位模型;4)基于所述平均输入速度及其余环境参数拟合的纠错打分模型。第一调整单元,用于根据所述纠错模型调整与所述整体输入对应的所述至少一个候选词的排序。具体地,当所述纠错模型采用单独基于所述平均输入速度的纠错档位模型时,例如,单独基于将所述平均输入速度的档位分为高档、中档和低档,当所述平均输入速度位于低档时,增加所述整体输入中每一个输入码为获取装置101一开始获取的输入码的权重,减小所述整体输入中的每个输入码分别为纠错之后的输入码的权重,以便将所述整体输入中每一个输入码为获取装置1一开始获取的的输入码对应的候选词排在前面,同样的,当所述平均输入速度位于高档时,增加所述整体输入中的每个输入码分别为纠错之后的输入码的权重,减小所述整体输入中每一个输入码为获取装置1一开始获取的输入码的权重,以便将所述整体输入中的每个输入码分别为纠错之后的输入码对应的候选词排在后面。例如,用户输入“shoifashi”,如果所述平均输入速度位于低档时,说明此次整体输入中输错的概率较低,则将纠错后的输入码“shoufashi”对应的候选词:收发室、首发式、手法是……等与“shoufashi”相关度高的一类候选词的排在候选词列表的前面,将与未经过纠错处理的初始整体输入码“shoifashi”对应的候选词:时候if啊是、时候哦if啊是……等排在候选词列表的后面。同样地,如果所述平均输入速度位于高档时,排序调换。当所述纠错模型采用单独基于所述平均输入速度的纠错打分模型时,所述纠错打分的分数是关于所述平均输入速度的连续线性函数或者非线性函数,随着所述平均输入速度的变化而不同,第一调整单元根据所述输入速度的大小得出对应的纠错分数,然后根据所述分数调整所述整体输入中每一个输入码为获取装置1一开始获取的输入码的权重以及所述整体输入中的每个输入码分别为纠错之后的输入码的权重,确定两者分别对应的候选词在候选词列表中的排序。。当所述纠错模型采用基于所述平均输入速度及其余环境参数拟合的纠错档位模型时,所述纠错档位是根据平均输入速度及其余环境参数拟合以确定对应的纠错档位,根据所述纠错档位调整所述整体输入中每一个输入码为获取装置1一开始获取的输入码的权重以及所述整体输入中的每个输入码分别为纠错之后的输入码的权重,确定两者分别对应的候选词在候选词列表中的排序。。当所述纠错模型采用基于所述平均输入速度及其余环境参数拟合的纠错打分模型时,所述纠错打分的分数是关于所述平均输入速度与其余环境参数拟合的连续线性函数或者非线性函数,随着所述平均输入速度的变化或者其余环境参数的变化而不同,然后根据所述分数调整所述整体输入中每一个输入码为获取装置1一开始获取的输入码的权重以及所述整体输入中的每个输入码分别为纠错之后的输入码的权重,确定两者分别对应的候选词在候选词列表中的排序。。

优选地,所述排序装置还包括去噪单元(未示出)、第二确定单元(未示出)和第二调整单元(未示出)。

去噪单元对由所述整体输入码中的每个输入码键入的时序所构成的序列进行去噪处理,获得去噪时序序列。具体地,在用户一次整体输入中,将每个输入码键入的时序构成的一个序列,对所述序列进行去噪处理,例如用户在键入一个输入码后,临时有事,中断键入过程,则与该输入码对应的时序远远超过正常输入时的预定时序上限阈值,在所述序列中去掉该输入码对应的时序。优选地,所述去噪处理包括以下至少任一项:1)当一输入码键入的时序大于预定时序上限阈值或者小于预定时序下限阈值时,去除所述时序;2)当一输入码键入的时序与本次输入平均时序值的比例大于预定比例上限阈值或者小于预定比例下限阈值时,去除所述时序;3)当一输入码键入的与本次输入环境的拟合函数的映射值大于预定映射上限阈值或者小于预定映射下限阈值时,去除所述时序。

第二确定单元根据所述去噪时序序列,确定所述整体输入码的输入时间。具体地,所述整体输入码的输入时间等于所述去噪时序序列中所有时序的和,而且整体输入码的个数要减去通过去噪处理去掉的时序的个数。

第二调整单元根据所述整体输入码的输入时间得出所述整体输入码的所述整体输入速度,与所述整体输入对应的所述至少一个候选词的排序。具体地,第二调整单元根据所述整体输入码的输入时间,以及对应减去去噪输入码个数之后的输入码的个数得出所述整体输入码的所述平均输入速度,调整与所述整体输入对应的所述至少一个候选词的排序。

优选地,所述纠错装置1还包括第一优化装置(未示出)。该第一优化装置根据触发按键的用户的特征确定所述用户所在的用户组;根据所述用户组信息优化所述纠错装置1。具体地,纠错装置1通过一段时间的学习,根据使用者的各个特征,包括但不限于,使用者的整体输入速度、使用者每个特定按键的输入速度、使用者的自造词、使用者的高频输入等,对其进行画像,并通过大数据挖掘出该画像对应的用户组,比如:喜欢快速输入的年轻男性、喜欢认真输入的中年女性等等。第一优化装置通过反馈机制,对纠错装置1进行各项阈值调整,优化纠错装置1。

所述纠错装置1还包括第二优化装置(未示出)。该第二优化装置获取用户历史输入习惯信息;根据所述历史输入习惯信息优化所述纠错装置。具体地,纠错装置1通过一段时间的学习,根据使用者的输入落点情况,包括但不限于,使用者输入落点的离散程度、输入特定按键对的速度、输入特定按键的误触率等,来判断用户的输入习惯及方式,比如:习惯单手还是双手输入、习惯横屏还是竖屏输入等。第二优化装置获取用户的这些历史输入习惯信息,并根据其输入习惯及方式对纠错装置1中各项阈值进行调整,优化纠错装置1。

图3示出根据本发明一个方面的一种基于用户输入速度的输入法纠错方法的流程示意图。

其中,在步骤s301中,纠错装置1获取被触发的当前单独按键的输入速度。具体地,用户在进行输入操作,按下或者触摸用户设备的键盘中某一按键时,其中所述键盘包括但不限于:实物键盘或者用户设备屏幕上的虚拟键盘,在步骤s301中,纠错装置1通过与该用户设备的交互,如一次或多次调用输入应用提供的应用程序接口(api),获取用户设备传感器采集的该用户触发的当前单独按键的输入速度,在步骤s301中,纠错装置1根据该输入速度,

本领域技术人员应能理解,上述输入速度对应的误触率仅为举例,实际输入速度与误触率对应的映射关系为通过对大数据进行分析,统计的误触数值。

在步骤s302中,纠错装置1根据所述输入速度调整所述当前单独按键对应的输入码纠正为其他按键对应的输入码时的权重。具体地,经过调研实验,将每一个按键单独输入的时间作为分组的容器,并统计单独按键输入时间对应的误触率,其中,所述单独按键输入时间为相邻两个单独按键被触发的时间间隔,图2-a示出所述误触率与单独按键输入时间的关系,根据单独按键的输入时间可以计算出单独按键的输入速度,输入速度=1/输入时间,根据图2-a所示,随着单独按键输入速度越慢,即单独按键输入时间越长,误触率是逐步降低的,即,用户输入速度越快,越容易按错,因此,在步骤s302中,纠错装置1根据所述输入速度调整所述当前单独按键对应的输入码纠正为其他按键对应的输入码时的权重,并将所述权重应用于现有的纠错模型中,辅助现有纠错模型进行纠错,提高用户输入的准确率。例如,若某一单独按键的输入速度比较快,在步骤s302中,纠错装置1根据该输入速度增加当前单独按键对应的输入码纠正成其他按键对应的输入码的权重w;或者若某一单独按键的输入速度比较慢,在步骤s302中,纠错装置1根据该输入速度减小了当前单独按键对应的输入码纠正成其他按键对应的输入码的权重w。其中所述权重w的具体数值可以通过预定的规则进行设置,例如,总权重值tw设置为1,w为0-1之间任意数值,w的具体数值根据预定的规则确定。

其中,根据所述输入速度调整将所述当前单独按键对应的输入码纠正为其他按键对应的输入码时的权重包括但不限于:1)增加易误触按键对应的输入码纠正成其他按键对应的输入码时的权重;2)降低易误触按键对应的输入码纠正成其他按键对应的输入码时本身的权重;3)增加难误触按键对应的输入码纠正成其他按键对应的输入码时本身的权重;4)降低难误触按键对应的输入码纠正成其他按键对应的输入码时的权重。具体地,当所述输入速度比较快时,例如当前单独按键的所述输入速度超过预定速度阈值vf时,所述当前单独按键为易误触按键,将易误触按键纠正成其他按键的权重增加,降低当前单独按键本身的权重,其中所述权重记为第一权重,所述第一权重指将当前单独按键本身的权重以及将当前单独按键纠正成其他按键的权重。例如,以qwerty全键盘为例,获取到的用户当前单独按键为“r”,当此时所述当前单独按键“r”为易误触按键时,即,当前单独按键的输入速度偏大时,则将用户希望触发的按键为“r”本身的第一权重减小,将用户希望触发的按键为“r”周围按键“e”、“f”、“t”的第一权重分别增加。其中,所述用户希望触发的按键为用户的目的按键,所述当前单独按键为用户设备获取到的触发按键,所述当前单独按键不一定为用户的目的按键,因此,所述当前单独按键本身也有对应的第一权重,以便纠错模型根据各个按键的第一权重,结合其他参数,判断出用户的目的按键。相对的,当前单独按键的所述输入速度低于预定速度阈值vs时,即当前单独按键的输入速度偏小时,所述当前单独按键为难误触按键,将难误触按键本身的第一权重增加,降低难误触按键对应的输入码纠正成其他按键对应的输入码时的第一权重。例如,获取到的用户当前单独按键为“i”,当此时所述当前单独按键“i”为难误触按键时,则将用户希望触发的按键为“i”本身的第一权重增加,将用户希望触发的按键为“r”周围按键“u”、“k”、“o”的第一权重分别减小。

优选地,按键误触难易程度的判断过程包括但不限于:

1)根据单独按键输入速度的档位分级判断,例如,按照输入速度大小范围将单独按键输入速度的档位分为:高档和低档,当所述单独按键输入速度位于高档位时,该单独按键获得对应于高档位的第二权重,基于该第二权重可以确定所述单独按键为难误触按键还是易误触按键,当所述单独按键输入速度位于低档位时,该单独按键获得对应于低档位的第二权重,基于该第二权重可以确定所述单独按键为难误触按键还是易误触按键。其中,按照输入速度大小范围对单独按键输入速度进行分档的档位还可以有其他多种方式。

2)根据单独按键输入速度的打分权重判断,具体地,用户触发一单独按键时,在步骤s301中,纠错装置1获取被触发的当前单独按键的输入速度,根据该单独按键输入速度进行为该单独按键进行打分,例如,通过设置以输入速度为变量的函数,计算不同的输入速度分别对应的分数,根据所述分数获得所述单独按键输入速度对应的第二权重,基于所述第二权重判断所述单独按键为易误触还是难误触按键。

3)根据单独按键输入速度及当前输入环境的拟合函数映射的分级判断,具体地,根据所述单独按键输入速度和当前输入环境这两类参数生成拟合函数,综合判断所述当前单独按键处于哪个档位,并根据所处档位判断当前单独按键为易误触按键还是难误触按键。其中,所述当前输入环境例如为光线是否充足,当前输入设备为电脑、平板还是手机,用户设备处于静止状态还是移动状态,移动速度为多少。

4)根据单独按键输入速度及当前输入环境的拟合函数映射的打分权重判断,具体地,根据该单独按键输入速度和当前输入环境为该单独按键进行打分,例如,通过设置以输入速度和当前输入环境为变量的拟合函数,计算不同的输入度和不同的输入环境下,所述单独按键分别对应的分数,根据所述分数获得所述单独按键输入速度对应的第二权重,基于所述第二权重判断所述单独按键为易误触还是难误触按键。

本领域技术人员应能理解,根据所述输入速度调整将所述当前单独按键对应的输入码纠正为其他按键对应的输入码时的权重的方式仅为举例,现有的或者今后可能出现的根据所述输入速度调整将所述当前单独按键对应的输入码纠正为其他按键对应的输入码时的权重的方式,如可适用于本发明,都应包含在本发明的保护范围内,并在此以引用的方式包含于此。

在步骤s303中,纠错装置1基于调整后的所述权重对所述当前单独按键对应的输入码进行纠错,获得纠错后的至少一个输入码。具体地,在步骤s303中,纠错装置1基于所述权重修正与纠错装置1对应的输入法相应的纠错模型,此处的权重为第一权重,将被触发的当前单独按键的输入速度作为所述纠错模型的一个参数,从而使所述纠错模型在进行纠错时从时间维度进行评估、计算,并结合与所述当前单独按键属于一次整体输入的至少一个未被上屏输入已触发历史按键,将所述当前单独按键对应的输入码进行纠错,获得纠错后的至少一个输入码,其中,所述一次整体输入由当前单独按键加上所述未被上屏输入的已触发历史按键组成,即未被上屏输入的所有输入码,每多输入一个单独按键之后,未被上屏输入的已触发历史按键所对应的候选词都会发生变化。例如,如图2-b所示的输入过程,一次整体输入指“shoifashi”,如果用户未进行上屏输入,继续输入“zainali”,则此时的一次整体输入为“shoifashizainali”。

例如,当在步骤s302中,纠错装置1调整后的当前单独按键对应的输入码纠正为其他按键对应的输入码时的权重偏大时,纠错装置1将当前单独按键对应的输入码纠正成其他输入码的比重便偏大,所述输入法对应的纠错模型将所述当前单独按键纠正成其他按键的概率便会提高,根据所述调整后的权重选择合适的现有纠错模型,并将所述调整后的权重用于现有的纠错模型中,与现有纠错模型中的其他参数共同进行纠错,即,从时间的维度进行纠错,将当前单独按键输入速度引入现有纠错模型中,作为现有纠错模型的重要考虑因素,准确的对输入码进行纠错,在步骤s303中,纠错装置1获得经过所述纠错模型纠错后的至少一个输入码。其中,所述纠错后的至少一个输入码可以仍为当前单独按键对应的输入码,也可以为将所述当前单独按键对应的输入码纠成其他按键对应的输入码。例如,当所述输入界面为触摸的虚拟qwerty全键盘界面时,根据用户进行输入时的触发的键盘的落点位置l,纠错装置1计算键盘上所有按键中心点至该落点位置l的距离s1,s2……sn,并根据所述距离计算出用户触发的当前单独按键分别为各个按键的概率,然后根据所述概率或者结合其他参数,得出用户触发的所述当前单独按键对应的输入码为“s”,并且“s”的输入速度为9字母/秒,在步骤s301中,纠错装置1获取输入码“s”的输入速度为9字母/秒,如果设置一输入速度阈值未5字母/秒,当输入码的输入速度大于该输入速度阈值时,即,所述输入速度位于高档时,增加所述当前单独按键对应的输入码纠正为其他按键对应的输入码时的权重,减小述当前单独按键对应的输入码纠正成自身“s”的权重,即用户的目的按键仍为“s”本身的权重,则,在步骤s302中,纠错装置1根据所述输入速度,判断所述输入速度大于输入速度阈值,则将“s”纠正为“w”的权重增加为w1,将“s”纠正为“a”的权重增加为w2,纠正为“d”的权重增加为w3,纠正为“x”的增加为w4,用户的目的按键仍为“s”本身的权重减小为w5,在步骤s303中,纠错装置1基于权重w1,w2,w3,w4,w5,以及当前单独按键之前的历史按键综合判断将当前单独按键纠正为其他按键的概率,例如,基于计算将“s”分别纠正为“w”、“a”、“d”、“x”的概率分别为p1、p2、p3、p4,以及用户的目的按键认为“s”的概率为p5,根据p1、p2、p3、p4和p5确定用户的目的按键为“a”。基于当前单独按键之前的未上屏输入的历史按键综合判断将当前单独按键纠正为其他按键的概率,结合现有纠错模型的纠错方法共同对当前单独按键对应的输入码进行纠错,例如,若“s”之前纠错后的输入的字母为声母“p”,由于“p”和“s”都是声母,将字母“s”纠正成键盘上与“s”相邻的韵母“a”的权重增大。

本领域技术人员应能理解,上述根据输入速度阈值确定如何调整所述当前单独按键对应的输入码纠正为其他按键对应的输入码时的权重的方式仅为举例,现有的或者今后可能出现的确定如何调整所述当前单独按键对应的输入码纠正为其他按键对应的输入码时的权重的方式,如可适用于本发明都应包含在本发明的保护范围内,并在此以引用的方式包含于此。在此,在步骤s303中,纠错装置1获得纠错后的至少一个输入码,将不在输入界面进行显示,只在系统后台进行登记,即,输入界面显示的仍然是用户触发的按键对应的输入码。

在此,通过对大数据进行分析,从时间维度挖掘用户输入速度与纠错之间的关系,以辅助纠错模型进行精确纠错,其中,纠错装置1通过持续获取用户输入每一单独按键时的输入速度,并根据所述输入速度调整所述当前单独按键对应的输入码纠正为其他按键对应的输入码时的权重,从而将输入速度作为通过纠错模型纠正输入码的一个因素,从时间的维度对输入法进行评估,将通过用户触发的键盘的落点这一空间维度确定的输入码进行进一步纠正,从而提升了纠错模型进行纠错的准确率,提高了用户输入的质量。

在步骤s304中,纠错装置1根据一次整体输入中各个按键所对应的纠错后的至少一个输入码,确定所述整体输入所对应的至少一个候选词。具体地,在步骤s303中,纠错装置1依次获得纠错后的至少一个输入码,在步骤s303中,纠错装置1获得一次整体输入的各个按键对应的纠错后的输入码后,在步骤s304中,纠错装置1确定所述整体输入所对应的至少一个候选词。例如,接上例,将字母“s”纠正成键盘上与“s”相邻的韵母“a”后,字母“a”与之前的字母“p”组成了“pa”,在步骤s304中,纠错装置1确定与“pa”对应的至少一个候选词:怕,爬,趴,帕……。进一步地,在步骤s304中,纠错装置1仍根据纠错前的至少一个输入码,确定对应的至少一个候选词,并且纠错前的至少一个输入码对应的至少一个候选词的优先级要低于纠错后的至少一个输入码对应的至少一个候选词。例如,纠错之前的输入码“ps”对应的至少一个候选词“评述”、“平时”、“拍摄”等优先级低于“怕,爬,趴,帕……”。

其中,所述输入过程是连续不断的,用户不停的输入,只要在输入输入码的过程中没有进行上屏输入,则当前一次整体输入中包括的输入码不断的增加,新增加的输入码经过纠错之后,不断结合未被上屏输入的历史输入码,使所述整体输入所对应的至少一个候选词发生动态变化。

优选地,所述纠错方法还包括:步骤s305(未示出)。

在步骤s305中,纠错装置1根据所述一次整体输入对应的整体输入码的输入时间,得出所述整体输入码中每个输入码对应的按键的平均输入速度,调整与所述整体输入对应的所述至少一个候选词的排序。具体地,当用户一次整体输入完成后,在步骤s305中,纠错装置1根据获取到的该次整体输入对应的整体输入码的输入时间,以及该次整体输入过程中的输入码的个数,计算得出该次整体输入码中每个输入码对应的按键的平均输入速度,然后按照所述平均输入速度调整与所述整体输入对应的所述至少一个候选词的排序。

优选地,所述步骤s305还包括:子步骤s3051(未示出)、子步骤s3052(未示出)和子步骤s3053(未示出)。

其中,在子步骤s3051中,纠错装置1根据所述整体输入码的所述输入时间计算得出所述整体输入码中每个输入码对应的按键的所述平均输入速度。具体地,在子步骤s3051中,纠错装置1根据所述整体输入码的所述输入时间,以及所述整体输入码中包括的输入码的个数,计算得出所述整体输入码中每个输入码对应的按键的所述平均输入速度。

在子步骤s3052中,纠错装置1基于所述平均输入速度确定对应的纠错模型,其中,所述纠错模型包括但不限于:1)单独基于所述平均输入速度的纠错档位模型;2)单独基于所述平均输入速度的纠错打分模型;3)基于所述平均输入速度及其余环境参数拟合的纠错档位模型;4)基于所述平均输入速度及其余环境参数拟合的纠错打分模型。

在子步骤s3053中,纠错装置1,根据所述纠错模型调整与所述整体输入对应的所述至少一个候选词的排序。具体地,当所述纠错模型采用单独基于所述平均输入速度的纠错档位模型时,例如,单独基于将所述平均输入速度的档位分为高档、中档和低档,当所述平均输入速度位于低档时,增加所述整体输入中每一个输入码为纠错装置1在步骤s301中一开始获取的输入码的权重,减小所述整体输入中的每个输入码分别为纠错之后的输入码的权重,以便将所述整体输入中每一个输入码为纠错装置1一开始获取的的输入码对应的候选词排在前面,同样的,当所述平均输入速度位于高档时,增加所述整体输入中的每个输入码分别为纠错之后的输入码的权重,减小所述整体输入中每一个输入码为纠错装置1一开始获取的输入码的权重,以便将所述整体输入中的每个输入码分别为纠错之后的输入码对应的候选词排在后面。例如,用户输入“shoifashi”,如果所述平均输入速度位于低档时,说明此次整体输入中输错的概率较低,则将纠错后的输入码“shoufashi”对应的候选词:收发室、首发式、手法是……等与“shoufashi”相关度高的一类候选词的排在候选词列表的前面,将与未经过纠错处理的初始整体输入码“shoifashi”对应的候选词:时候if啊是、时候哦if啊是排在候选词列表的后面。同样地,如果所述平均输入速度位于高档时,排序调换。当所述纠错模型采用单独基于所述平均输入速度的纠错打分模型时,所述纠错打分的分数是关于所述平均输入速度的连续线性函数或者非线性函数,随着所述平均输入速度的变化而不同,在子步骤s3053中,纠错装置1根据所述输入速度的大小得出对应的纠错分数,然后根据所述分数调整所述整体输入中每一个输入码为纠错装置1一开始获取的输入码的权重以及所述整体输入中的每个输入码分别为纠错之后的输入码的权重,确定两者分别对应的候选词在候选词列表中的排序。。当所述纠错模型采用基于所述平均输入速度及其余环境参数拟合的纠错档位模型时,所述纠错档位是根据平均输入速度及其余环境参数拟合以确定对应的纠错档位,根据所述纠错档位调整所述整体输入中每一个输入码为纠错装置1一开始获取的输入码的权重以及所述整体输入中的每个输入码分别为纠错之后的输入码的权重,确定两者分别对应的候选词在候选词列表中的排序。当所述纠错模型采用基于所述平均输入速度及其余环境参数拟合的纠错打分模型时,所述纠错打分的分数是关于所述平均输入速度与其余环境参数拟合的连续线性函数或者非线性函数,随着所述平均输入速度的变化或者其余环境参数的变化而不同,然后根据所述分数调整所述整体输入中每一个输入码为纠错装置1一开始获取的输入码的权重以及所述整体输入中的每个输入码分别为纠错之后的输入码的权重,确定两者分别对应的候选词在候选词列表中的排序。

优选地,所述步骤s305还包括子步骤s3054(未示出)、子步骤s3055(未示出)和子步骤s3056(未示出)。

在子步骤s3054中,纠错装置1对由所述整体输入码中的每个输入码键入的时序所构成的序列进行去噪处理,获得去噪时序序列。具体地,在用户一次整体输入中,将每个输入码键入的时序构成的一个序列,对所述序列进行去噪处理,例如用户在键入一个输入码后,临时有事,中断键入过程,则与该输入码对应的时序远远超过正常输入时的预定时序上限阈值,在所述序列中去掉该输入码对应的时序。优选地,所述去噪处理包括以下至少任一项:1)当一输入码键入的时序大于预定时序上限阈值或者小于预定时序下限阈值时,去除所述时序;2)当一输入码键入的时序与本次输入平均时序值的比例大于预定比例上限阈值或者小于预定比例下限阈值时,去除所述时序;3)当一输入码键入的与本次输入环境的拟合函数的映射值大于预定映射上限阈值或者小于预定映射下限阈值时,去除所述时序。

在子步骤s3055中,纠错装置1根据所述去噪时序序列,确定所述整体输入码的输入时间。具体地,所述整体输入码的输入时间等于所述去噪时序序列中所有时序的和,而且整体输入码的个数要减去通过去噪处理去掉的时序的个数。

在子步骤s3056中,纠错装置1根据所述整体输入码的输入时间得出所述整体输入码的所述整体输入速度,与所述整体输入对应的所述至少一个候选词的排序。具体地,在子步骤s3056中,纠错装置1根据所述整体输入码的输入时间,以及对应减去去噪输入码个数之后的输入码的个数得出所述整体输入码的所述平均输入速度,调整与所述整体输入对应的所述至少一个候选词的排序。

优选地,所述方法还包括步骤s306(未示出)。在步骤s306中,纠错装置1根据触发按键的用户的特征确定所述用户所在的用户组;根据所述用户组信息优化所述纠错装置1。具体地,纠错装置1通过一段时间的学习,根据使用者的各个特征,包括但不限于,使用者的整体输入速度、使用者每个特定按键的输入速度、使用者的自造词、使用者的高频输入等,对其进行画像,并通过大数据挖掘出该画像对应的用户组,比如:喜欢快速输入的年轻男性、喜欢认真输入的中年女性等等。在步骤s306中,纠错装置1通过反馈机制,对纠错装置1进行各项阈值调整,优化纠错装置1。

所述方法还包括步骤s307(未示出)。在步骤s307中,纠错装置1获取用户历史输入习惯信息;根据所述历史输入习惯信息优化所述纠错装置1。具体地,纠错装置1通过一段时间的学习,根据使用者的输入落点情况,包括但不限于,使用者输入落点的离散程度、输入特定按键对的速度、输入特定按键的误触率等,来判断用户的输入习惯及方式,比如:习惯单手还是双手输入、习惯横屏还是竖屏输入等。在步骤s307中,纠错装置1获取用户的这些历史输入习惯信息,并根据其输入习惯及方式对纠错装置1中各项阈值进行调整,优化纠错装置1。

本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机代码,当所述计算机代码被执行时,如前任一项所述的方法被执行。

本发明还提供了一种计算机程序产品,当所述计算机程序产品被计算机设备执行时,如前任一项所述的方法被执行。

本发明还提供了一种计算机设备,所述计算机设备包括:

一个或多个处理器;

存储器,用于存储一个或多个计算机程序;

当所述一个或多个计算机程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如前任一项所述的方法。

需要注意的是,本发明可在软件和/或软件与硬件的组合体中被实施,例如,本发明的各个装置可采用专用集成电路(asic)或任何其他类似硬件设备来实现。在一个实施例中,本发明的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地,本发明的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,ram存储器,磁或光驱动器或软磁盘及类似设备。另外,本发明的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个步骤或功能的电路。

对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1