用户输入预测系统的制作方法与工艺

文档序号:12294234阅读:174来源:国知局
本发明主要涉及一种包括用户界面的数据输入系统。特别是该用户界面包括多个目标且用于接收用户输入。本发明提供了一种模型化系统用户界面目标的方法以及一种将数据输入至用户界面目标已模型化的系统的方法。

背景技术:
以前,致力于提高使用有限尺寸键盘的用户交互的工作已提出了一些基于因减小了尺寸而无法覆盖给定语言文字所有字符的键盘的方法。这是公开号为US6307549的美国专利文献的主题,该专利文献提供了一种消除简化键盘(每个键上一般包括3个字符)输出歧义的方法。通过使用允许用户重复循环当前输入的可能匹配的选择按钮,提供单词级别的歧义消除。公开号为US7083342的美国专利文献公开了一种作为“半个标准键盘”(halfqwerty)布局的基于普通QWERTY(标准键盘)布局的可选简化键盘布局,该布局同样使用了输入之后的额外歧义消除。尽管简化键盘可以降低出错率,但其同样只是粗略地量化了输入,这意味着电脑从简化键盘中接收到的信息量要少于从标准键盘中接收到的信息量。理论上,对于自适应纠错系统而言,带有纠错功能的标准键盘要求少于简化键盘的消除歧义的击键。在硬式键盘上,输入事件与用户在键盘按键上作出的按下动作相关。对于这样的键盘而言,用户可以按压按键范围内的任何位置,在该范围内所有位置上的相应输入事件都是相同的。但对于触摸式的“软键盘”而言,可使用软键盘上触摸的几乎连续的坐标。一些已知的虚拟键盘系统,例如公开号为2009/0284471的美国专利申请及其他在先申请提到了在系统接收到非用户有意输入的字符的一些实例中包含自动纠正用户输入的机制。此类系统以将预设位置集合指定为带有可由用户输入的字符笛卡尔坐标的观点为基础。给定一组表示某一输入事件的坐标,该事件与自动纠错区域内的周围特定位置之间的距离用于构造分配给该事件加权字符集合。自动纠错区域包括多个字母表字母。在输入过程中,显示给用户一组被认为有可能是预期字符序列的“对象”。一旦用户选择其意欲输入的字符序列,则计算输入事件坐标与字符坐标之间的(可能被加权的)水平、垂直偏差,而用于调整输入事件的相关移动平均数协调反映用户的键入风格。该移动平均数(movingaverage)可以为运动平均数(runningaverage),在该运动平均数中各键坐标被设置成各键所有在先输入事件的平均数。上述已知虚拟键盘将各字符建模为一组坐标所指定的位置。与之相反,本发明的系统和方法将用户实际输入建模为该用户在虚拟键盘上指定字符。因此,对于一给定字符,本发明的系统和方法对该字符的用户历史输入进行建模。

技术实现要素:
本发明涉及的系统和方法提供一种适应用户且学习用户输入文本风格的系统。通过模型化用户与该系统的历史交互,就给定的输入事件,该系统可以更准确地预测用户意欲输入的字符。因此,本发明提供了一种可以给出更准确、可靠的文本预测并由此可将更准确的稳步输入至电子设备的系统。准确性的提高降低了修正次数,由此使系统能够给出更有效的文本输入及较低的处理要求。在一实施例中,本发明提供了一种数据输入系统,包括:用户界面,其包括多个目标且用于接收用户输入。该系统包括:多个模型,其用于将对应于某一目标的用户的在先输入事件与该目标进行关联。该系统还包括:输入概率生成器,其与所述模型联合,用于生成用户输入事件相应于特定目标的概率。上述目标可代表一个或多个字符、按键、符号或其他供用户选择的任意信息项。优选地,所述用户界面为虚拟键盘。输入事件相应于所述虚拟键盘上的位置,而所述模型为一种分布,所述分布对相应于特定目标的所述用户的在先输入事件的位置进行建模。所述分布为二维高斯分布。优选地,根据对应于所述目标的所述输入事件,使用最大后验估计学习所述二维高斯分布的参数。优选地,就模型参数而言,先验分布形式为共轭先验分布。其中,所述目标为所述虚拟键盘上的按键;所述目标的先验模型是根据键盘布局,凭借经验设置出的。所述虚拟键盘包括多组为不同用户或使用场景定制的目标模型。与所述多个模型关联的所述输入概率生成器为用户输入事件输出n个最可能目标以及这n个最可能目标的相关概率。上述系统还包括:映射图表,其将所述n个最可能目标映射于一个或多个带有关联概率的词片。优选地,在映射图表中,所述词片由与其对应的目标进行标记。上述系统还包括:预测器,其用于接收n个最可能的目标以及该目标的关联概率,并生成具有概率值的文本预测。该预测器可用于接收所述词片以及所述词片的关联概率,并生成具有概率值的文本预测。基于预测选择,匹配所述预测的目标与对应的输入事件。通过以预测词片的对应目标标记所述预测词片的方式,由所述预测器匹配所述预测的目标与对应的输入事件。作为一种选择,所述预测的目标通过使所述词片同其对应的目标反向映射并使所述目标与所述输入配对,实现与其对应的事件之间的匹配。所述预测选择包括用户的预测选择或自动选择的最可能预测。选中的预测优选作为文本被输入至所述数据输入系统。上述系统还包括:模型更新器,其用于更新模型,以反映对应于该模型的输入事件与目标之间的映射。一种电子设备,其包括前述的数据输入系统。所述电子设备为电脑、PDA或移动电话。在第二实施例中,本发明提供了一种具有多个目标且用于接收输入的用户界面的目标模型化方法,包括:对每一目标的相应于该目标的用户的在先输入事件进行建模。其中,所述用户界面为虚拟键盘,而输入事件相应于所述虚拟键盘上的位置,所述方法还包括:将每一个目标作为分布进行建模,所述分布描述了对应于该目标的用户的在先输入事件的位置。所述分布为二维高斯分布。所述模型必须还包括与所述分布共轭的先验模型。优选地,根据对应于所述目标的所述输入事件,使用最大后验估计学习所述二维高斯分布的参数。所述目标为所述虚拟键盘上的按键,而所述目标的先验模型是根据键盘布局,凭借经验设置出的。在第三实施例中,提供了一种将数据输入至系统的方法,该系统包括:具有多个目标且用于接收输入的用户界面,所述方法包括:使用关联于多个模型的输入概率生成器,生成用户输入事件相应于特定目标的概率,其中,所述模型将对应于目标的在先输入事件与该目标进行关联。优选地,上述方法还包括:由所述输入概率生成器为用户输入事件输出n个最可能的目标以及这n个最可能的目标的相关概率。上述方法还包括:通过映射图表,将n个最可能的目标分别映射于一个或多个带有关联概率值的词片。优选地,上述方法还包括:利用上述映射图表,以作为一个或多个所述词片的出处的目标标记一个或多个所述词片。上述方法还包括:使用接收所述n个最可能的目标以及该目标的关联概率的预测器生成具有概率值的文本预测。优选地,上述方法还包括:使用接收所述词片及所述词片的关联概率的预测器生成具有概率值的文本预测。所述方法还包括:选择一文本预测;并由预测器将所述文本预测的目标与相应的输入事件进行匹配。将所述文本预测的目标与相应的输入事件进行匹配的步骤包括:将被标记到所述词片的目标与所述输入事件进行配对。作为一种选择,将所述文本预测的目标与相应的输入事件进行匹配的步骤包括:将所述词片反向映射回对应于所述词片的目标,并将所述目标与所述输入事件进行配对。上述方法还包括:在将输入事件与目标进行匹配时,使用模型更新器更新模型。下面参照附图,详细介绍本发明。附图说明图1为本发明系统结构的示意图。具体实施方式本发明提供了一种利用机器学习模型化虚拟键盘上的用户交互的系统和方法。结合预测器使用的本系统的三个主要活动为估计、推断和学习,而本系统被构造成这些活动的迭代应用。本发明的系统可作为诸如PDA、移动电话或电脑等电子装置的一部分使用。下面参照图1,对本系统的原理进行介绍。本发明的系统提供了一种包括多个目标且用于接收用户输入的用户界面。在如图1所示的实例中,该用户界面包括虚拟键盘1,例如软屏上的键盘。该系统用于解释作为输入事件10或选择事件20的用户输入。输入事件10是一种用户在虚拟键盘的二维空间中选择(如通过触摸或点击)定位的事件,该事件由虚拟键盘1检测并被表示为笛卡尔坐标。选择事件20是由用户在一组对其显示的预测中作出的预测18进行选择。虚拟键盘1包括输入事件区域和选择事件区域,以区分输入事件10和选择事件20。但是,还有其他的方法来解释作为选择或输入事件的用户输入。举例来说,不同于输入事件10(例如屏幕触摸),选择事件20可对应于键盘上的不同手势(例如在屏幕上滑过)。对于输入事件10的表示,不限于使用笛卡尔坐标,还可使用诸如距最后一次按键的时间、按键压力、手势信息(在软屏幕键盘上的触摸轨迹)、加速表读数等其他参数进行表示。对于软键盘而言,选择事件20涉及:用户通过触摸或点击键盘上某一显示其意欲输入的预测的区域来选择该预测,由此将该预测输入至上述系统。选择事件20还涉及:当用户通过“敲击”、“空格键”完成某一单词时,由系统自动选择最可能的预测。此外,还有供用户选择预测的其他机制,举例来说,诸如在屏幕上滑过的软键盘上的手势可以是用于插入最可能预测的机制。选中的预测20对应于用户意欲通过输入事件10输入的字符序列。因此,通过输入选择事件20,可将用户输入的输入事件10与其预定目标相匹配。对于这一匹配将在下文中进行详细介绍。对于虚拟键盘1的要求仅在于:对用户而言存在明显的对应于预期输入的目标点(targetpoint)。该目标点可以是但不限于:字符键(即:一般标准键盘上的虚拟或物理按键栅格);字母字形排列,例如无可见按键边界的栅格、或线性字母排列A-Z。因此,虚拟键盘1的各目标可以表示单独或多个字符、或用户选择的其他信息项。对于以下实例来说,主要关注于如何将文本输入至系统。然而,本发明的系统及方法不限于文本输入,还可应用于非文本数据的输入,其中,数据量由目标点表示在用户界面上。为了生成表示给用户的预测,本发明的系统包括多个模型6,该模型6对分别对应于多个目标的用户的在先输入事件进行建模;以给定的输入事件10查询所述模型6并生成一个或多个可能目标及可能目标概率的输入概率生成器2;以及根据可能目标及其概率生成文本预测18的预测器4。在一优选实例中,本发明的系统还包括词片映射表3,该词片映射表3将可能目标映射至由预测器4用来生成文本预测的词片。输入概率生成器2接收输入事件10,并生成或更新目标序列意向结构12。目标序列意向结构12包括一个或多个目标以及用户意欲通过输入事件10选择上述目标的目标概率。目标序列意向结构12包括输入事件10与对应于该输入事件10的目标之间的相关性,例如,以输入事件10标记目标。目标序列意向结构12可以包含系统内的所有目标,或仅包含那些相关概率高于一定概率阈值的目标。该阈值为凭经验被设置成预设级(例如,10-4)的系统参数。作为一种选择,该阈值可凭用户的经验确定。如下文中的具体说明,为了生成某一目标的观察到输入事件10的概率,输入概率生成器2以输入事件10查询模型集合6,并求出各目标的可被表示为基于事件(per-event)的概率向量的概率值。为了减少运算,从基于事件的概率向量中过滤掉小值。这些基于事件的概率向量被连接起来,形成了构成下阶段-目标映射3输入的目标序列意向结构12。模型集合6包含多个表示系统目标(可以为字符)的经过训练的模型。如果用户曾″触摸″一个目标,则该目标作为分布被建模,该分布将用户实际输入模型化。该分布被构建为p(x|c),其中x为输入事件位置向量,而c为标识单一目标(标识一组可能的意向字符的目标)的标签。在一优选实例中,该分布被构建为多元高斯分布(multivariateGaussian)p(x|c,M)=G(x;μc,Σc),其中,M为假设的模型(包含所有的假设和参数),而G(x;μ,Σc)为高斯概率密度分布函数的简化形式,平均值μ、协方差Σc为位置x上的值。模型参数为各目标c的μc和Σc。通过使用基于键盘历史交互的最大后验(最大后验概率,maximuma-posterioriprobability,MAP)估计,学习模型参数。然而,也可使用其他学习机制。在下文中将讨论一些其他的学习机制。除了使用二维高斯分布之外,还可通过使用拉普拉斯分布(Laplacedistribution)对用户输入事件的x、y坐标分别进行分布来模型化用户输入。作为一种选择,可使用伽马分布(Gammadistribution)模型化用户输入。拉普拉斯分布和伽马分布要比高斯分布更加合适,这是因为在输入事件(例如,触摸位置)离开目标时概率密度衰退速度比高斯分布更慢的这些分布具有更佳的重尾性(heavy-tailed)。具有这种重尾性的分布能够更佳准确地反映出用户的实际书写风格,由此可能提供出较佳的纠错性能。此外,其他合适的模型技术也可被拿来使用。为了获得的μc和Σc的最大后验概率估计,必须指定这些参数的先验分布。其中,目标与虚拟键盘上的按键相关,基于键盘布局可凭经验设置先验分布(均值和协方差),该先验分布的适当选择为正态逆维舍特分布(normalinverseWishartdistribution,NIWD),因为正态逆维舍特分布是带有未知均值和协方差的高斯分布的共轭先验分布。此外,还可使用其他先验分布。在下文中将讨论一些其他的先验分布。共轭先验分布的定义为:如果先验分布与似然函数共轭,则后验分布与(可能带有不同参数的)该先验分布具有相同的分布形式。共轭分布(先验及后验分布)的参数则被称为超参数(因为这些参数使模型实际参数的分布参数化),而最大后验概率的学习可被制定成较为简单的超参数重算。因此,在一实例中,学习仅需要重算四个正态逆维舍特分布参数,即简易的增量算法。先验分布由此如下:而后验分布为:其中,αc和βc分别为均值和协方差的自由度超参数(大自由度值意味着先验强势,而学习较慢),分别为均值和协方差的模态值。为超参数αc的后验值。经过t次观察,{xi}i=1...t,因此通过使用已知的超参数修正正态逆维舍特分布的关系,对于这一参数化的一般修正为:其中,其中,包括n次观察,{xi}i=1...n,均值当将所有观察应用于先验分布时,便给出了一批量学习算法。通过设置n=1并再次将上述修正方程应用于后验分布,可构建一增量学习算法,即:因为正态逆维舍特分布的众数为在t次观察后,对于参数的最大后验概率估计可简化为:正态逆维舍特分布是适合使用的,因为其与能够提供简单且递增的学习规则的多元高斯分布共轭。作为一种选择,可以使用均匀的(共轭的)先验分布。可这样规定先验分布:保持位置及协方差独立,例如,位置的先验分布可以是高斯分布或均匀的,而协方差的先验分布可以是矩阵正态分布。本实例使用了批处理模式和增量学习算法,这些算法通过分别在某一时刻添加一次观察的方式,在来自先验模型的单一修正值中计算后验分布。在用户通过匹配输入事件位置与构成选中预测的字符位置的方式选择预测时,执行这些学习算法之一。如果选择拉普拉斯分布/伽马分布替代高斯分布,则其后的过程与高斯分布之后的过程相同:选择一先验分布(例如共轭先验分布),并为最大后验概率学习目标推导出学习规则。作为可替代最大后验概率的一种选择,最大似然率(MaximumLikelihood,ML)估计是学习机制的另一选择,其中,不引入先验分布,并选择能够使观察到在模型下训练的数据的可能性最大化的那些参数。至于其他概率,将使用贝叶斯估计(BayesianEstimator)(最大似然率和最大后验概率方法均不是真正意义上的贝叶斯估计,因为它们均采用点估计)。在贝叶斯估计中,对后验分布的所有可能值以及用于推理决策的均值或中间值计算积分。不利地是这些估计需要大量的计算,因此目前对于有限的资源环境而言其缺少吸引力。贝叶斯估计的实例为变分贝叶斯和吉布斯采样。上述学习算法是一种各数据点所占比例相同的学习算法。无论是最近的或是过去的这些数据点均带有某一先验分布。当观察到一定数量的数据点时,该先验分布便被(特意地)覆盖掉。为了将由持续增补先验分布而得到的新近数据点的基本形式添加至模型及异常值容限中,可使用两种修改方式:第一种方式是简单地限制自由度参数αc,βc。该方式具有“忘掉”过去观察以及限制模型严格度的作用(“严格”的模型具有较高的自由度值,这会使新的数据点很难发挥作用)。如果这些参数超出了限制(不影响其他超参数更新动作的行为),则不通过修改这些参数来施加这一限制。第二种方式是将其他先验分布超参数反馈给修正方程式,从而在观察到数据点后也能够使这些超参数连续发挥作用。因为修正方程式为几个简单的加权平均数,因此这种方式的实现相对简单,从而可以添加一定数量的先验分布如下:根据需要,可凭经验设置额外的参数αcmax,βcmax,δ和ε。这些参数控制着先验分布的“渐进强度”(asymptoticstrength)以及过往观察的遗忘率。举例来说,如果单一系统可由不同用户使用,或者如果虚拟键盘的构成因素为变量,则单一的虚拟键盘1需要维持多个单独的目标模型集合6。在某些情况下(例如,构成因素变化),该系统具有充分的信息来凭借经验选择不同的输入模型,但在多用户情况下,合适模型的选择并非显而易见。在这种情况下,选型元素可作为辅助。进行模型选择的强健方式在于:对一些样本估计数据的可能性(似然)进行评估。该方式可按如下说明实现,其中数据的可能性表示为:其中,L(D|M)为在模型M下观察到数据D的可能性,具体可表示如下:其中,如果我们假设目标的先验分布p(c|M)是均匀的,则可将其提取到恒量中。对于这一对数概度统计的计算可按如下所述执行:在输入概率生成器阶段即刻查询多个模型,对所有目标的输出求和,以及选择计算出的“种子输入”对数概度最高的模型。到目前为止所提出的模型包括一种假设:顺序按键彼此互不依赖。这种假设显然是不准确的(某一键的输入分布很可能十分依赖于输入的最后一个字符)。第一阶马尔科夫假设可能更合适:假设刚刚输入了最后一个字符,当前字符输入有条件地不依赖于之前的所有字符。完整输入序列的概率则将是:其中的所有参数已在上文中有所介绍。之后,关键的模型化判定假设形成一触摸位置的条件概率p(xi|ci,xi-1,M)。分布的选择之一将首先以各目标的独立高斯分布和前一输入位置的类别对上一触摸位置x进行分类。其他可能的选择将使用行进的距离d=‖xi-xi-1‖控制每一目标输入分布的变化。这一分布的形式应被选择用来模型化由自虚拟键盘用户收集的典型数据。模型集合6可由i)输入概率生成器2查询,以便返回模型参数的当前最大后验概率估计,并ii)可由输入模型更新器5训练,以便更新模型从而响应选择事件。模型参数可存储在每个键的基础上(per-keybasis),或(在协变的情况下)于多键之间共享。在上述实例中,每个键/目标包括一位置及协方差值。作为一种选择,可为每个键提供定位,但要强制键共享协方差—当任一键受训时,同一协方差也要受训。参数准确表示的灵活性很强,例如,可更方便地存储精度矩阵而非协方差,因为除了在模型训练的不频繁情况下需要反演之外,在生成概率过程中无需矩阵反演。这样,给定一输入事件10,输入概率生成器2生成目标c的概率p(x|c,M),表示用户打算根据输入事件10选择该目标的概率。为了生成给定目标的概率值,输入概率生成器2查询该目标模型以返回模型参数μc和Σc的当前最大后验估计。之后,输入概率生成器2使用模型参数计算于输入位置x上估计的高斯概率密度分布函数值G(x;μ,Σ)。计算出的概率值表示为基于事件的概率向量,该向量可被关联,以形成部分目标序列意向结构12。在一优选实施例中,上述系统还包括目标映射台3。目标映射台3包括词片映射图表,该词片映射图表用于实现将目标输入映射到被用来构建预测的词片(一般为一个或两个字符)。该映射可独立应用于目标序列意向结构12中的各个元素,以便将目标序列意向结构转换为输入序列意向结构16。词片映射图表维持目标(键盘上的键位,即抽象化的按键)与一个或多个词片(用户想要输入的词的某些部分)之间的映射。在最简单的情况下,各目标指向单个词片(例如,当在按键完整的标准键盘上输入英文时)。在这一键盘上具有与各键相关的可选字符(例如,法语音韵的字符,或者说每个键表示多个字符),这些字符可作为额外词片添加。此外,对于每个可供选择的词片,与各目标对应的概率通过某种系数(somefactor)被降低。在某一序列中的各事件的可能词片和概率的集合则被收进输入序列意向结构16中。目标映射台3还将选中预测20的词片映射回其对应的输入事件。在一优选实施例中,当选择事件发生时,各词片以作为该词片出处的目标来标识,由此,允许由预测器4进行从该目标至目标的触摸位置的配对。这一过程可通过将各词片以其对应的目标及输入事件进行标识来实现。这样,反向映射为触摸位置和目标的简单配对(trivialparing)。然而,作为标识词片的替代,上述系统可以使用其他机构将选中预测20的词片映射回该词片对应的输入事件。举例来说,在一可选实施例中,目标映射台3包括将选中预测的词片映射回该词片对应的目标的反向映射。为了实现这一反向映射,将选中预测20以及对应的输入事件字符串送至分割机构。该分割机构可通过估计选中预测20的具有最高概率的词片组合将预测20分割成词片。之后,在目标映射台3上将词片反向映射至该词片对应的目标,并将该词片与输入事件的字符串进行配对。在这种机构的最简单实施过程中,词片包括单个字符,而分割机构将预测分割成将被映射回目标的单个字符。此时,可由预测器4实施分割。为了生成文本预测18(或类似预测),上述系统包括预测器4。预测器4是一种装置,该装置在设定有某一输入的情况下具有包含词片集合序列和概率的输入序列意向结构16,并生成一组预测18。各预测18包括文本字符串,例如,词片或短语(由s_i表示),以及概率值(由p_i表示)。由此,预测集合具有的{(s_1,p_1),(s_2,p_2)…(s_n,p_n)}的形式,其中,n表示集合中的预测数量。正如本领域一般技术人员能够理解的那样,在文本预测系统中可使用任意一种预测器4以及任意数量的预测器4。优选地,预测器4基于用户输入文本的语境生成文本预测18,也就是说,预测器4根据语境中的第n-1个词片生成第n个词片的文本预测。此外,“语境”一词指的是先前出现在序列中的词片,以及本系统所包含的关于当前词片的所有认知(例如,对词片有贡献的可能词片)。给定一特殊语境,上述系统通过使用概率估计预测出最有可能的下一个词。预测18可由多语言模型预测器和单语言模型预测器生成。在一公开号为WO2010/112841的国际专利申请—“电子设备文本输入的系统及方法”中,记载了一种使用(单一及多语言模型)预测器生成文本预测的具体说明。在本文中引用这一文献作为参考。此外,在申请号为PCT/GB2010/001898的国际专利申请—“电子设备文本输入的系统及方法”中,记载了一种使用(单一及多语言模型)自适应预测器生成分类加权文本预测的具体说明。在本文中引用这一文献作为参考。上述系统的预测器4接收包含词片集合及概率的序列的输入序列意向结构16作为其输入,并生成一组显示给用户的预测18。预测器4可用于返回输入序列意向结构16完成整个词的匹配,或返回由输入序列意向结构16作为前缀的可能词,例如,在输入序列意向结构16包含词片t和o的情况下,可预测出词“to”(完成的整个词)或“together”(词片为词前缀)。输入序列意向结构16仅需被用作向导,例如,输入序列意向结构16可以添加额外的字符,就像用户错过或忽略了某些字符,就像用户输入了额外字符。穿过输入序列意向结构16的单独路径必须由各预测18识别,从而可在输入事件和目标之间建立关联。各目标已由目标映射台3上的词片映射图表建立了其与一个或多个取决于语言的(单一)词片之间的映射。此外,在上述优选实施例中,输入序列意向结构存储有对应于目标以及输入事件的词片标识。由此,因为预测器4通过以对应于其目标的词片标识追踪到用于构成预测的目标,故预测的选择在输入事件10与目标之间提供了匹配。在一反向映射的实施例中,反向映射包括反向映射表,分割机构,该分割机构将选中的预测20分割成词片组合,而词片图表被用来构建词片与词片对应目标之间的反向映射表。之后,将各目标与其各自的输入事件10进行配对。上述系统还包括输入模型更新器5。该输入模型更新器5接收输入—目标相关度14,以响应选择事件20。选择事件20识别出用户意欲输入的目标,由此使预测器4将该目标与输入事件10进行匹配。输入模型更新器5优选(考虑到内存使用及效率)使用学习算法的递增变体来更新合适的模型。输入模型更新器5将递增学习更新规则应用于多个模型,以响应虚拟键盘1上的各选择事件20。输入是指一组与目标{(xi,ci)}i=1...k配对的输入位置,各输入位置可被用作单独目标ci的单独训练点xi。先验分布超参数和学习参数均被设置为固定值,这些固定值设置初始目标位置以及预期精度,并控制学习的执行速度。各模型可被孤立地考虑。一般来说,需要标注训练数据,也就是说,输入事件需要与目标标签关联。在作为输入事件10和目标流的数据中并未提供标签,因此必须从选择事件20中推断出标签。如上文所述,将输入事件10与目标进行关联的一种方式在于,在输入序列意向结构16中以目标及输入事件10标记词片。一旦选中了预测,构成预测的词片便为已知。因此,被标记到词片的目标可与输入事件配对,进而提供出经标注的训练数据。作为一种选择,在目标映射台3上,通过将词片反向映射到其相应的目标来确定选中预测的目标。之后,可将由此确定出的目标与输入事件10进行配对。因此,本发明提供了一种模型化多个目标的用户输入事件且以用户输入更新这些模型的系统,并且,假定输入事件,使该系统可以更准确地预测出用户意欲输入的字符,由此可提供更准确的文本预测。下面根据不具有限定意义的实例,详细介绍上述系统的使用。用户通过键入输入,例如触摸触敏键盘1上的某一位置,与虚拟键盘1的连续坐标系交互。用户触摸键盘1上的某一位置,意图输入显示在键盘1上的某一目标。键盘1构建起将被送至输入概率生成器2的输入事件10流(在本实例中为表示出键盘触摸位置的笛卡尔坐标)。输入概率生成器2生成或更新一目标序列意向结构12。在键盘目标表示字符的实例中,目标序列意向结构12包含一个或多个与触摸屏幕时用户意欲输入的最可能字符相对应的字符。与每一个字符的关联度即为用户在触摸屏幕的该位置时意欲输入该字符的概率,以及对输入事件10的标记。为了生成目标序列意向结构12,输入概率生成器2通过查询与输入事件10有关的各字符模型,计算用户意欲输入一个或多个字符的概率。如上所述,各模型使用户与键盘上该字符的历史交互记录模型化,也就是说,该模型使用户对于该字符的在先输入事件模型化。之后,输入概率生成器2优选地使该字符保持着概率阈值之上的关联概率,其中,可凭经验将概率阈值设置为预定级(例如,10-4),或凭借用户的经验确定概率阈值。目标序列意向结构12被送至词片映射图表,该词片映射图表将目标序列意向结构12的字符映射到一个或多个带有关联概率的词片上,由此生成输入序列意向结构16。一个或多个字符中的字符独立映射于一个或多个词片,其中,以作为词片出处的字符标记词片。与词片关联的概率无需同与字符关联的概率保持一致。举例来说,在映射时,与字符关联的概率可乘以取决于词片的附加系数。词片映射图表可以是存储在系统存储器中的固定映射图表。该映射图表随使用语言变化,例如,标点符号会随着选择语言而变化,并且,取决于系统选择语言,重读字符、元音变音等在词片中发挥不同作用。优选地,词片映射图表包括映射于词片的目标,其中,以作为词片出处的目标对词片进行标记。输入序列意向结构16包含词片,优选包含被标记到作为词片出处的字符及输入事件上的词片,以及对应于输入事件10序列的概率。从输入序列意向结构16中,预测器4通过识别用于每个预测18的穿过输入序列意向结构16的单独路径,也就是说,穿过词片并生成包含用于每一输入事件10的单独词片的预测序列,生成若干预测18。通过识别穿过输入序列意向结构16的单独路径,可在输入事件10与目标之间建立关联14。预测器考虑一些穿过输入序列意向结构16的最可能路径,作为一种选择,同样考虑由路径作为前缀的所有词。之后,预测器所考虑的路径被送至n-元语言模型,以给出有序的预测候选。公开号为WO2010/112841的国际专利申请已描述了这一过程的实施。在本文中引用这一文献作为参考。虚拟键盘1用于显示由预测器生成的预测。对于正确预测的选择20可由用户在显示给用户的给定预测中挑选或由系统自动接受最可能的预测来实现。预测器4用于通过输入序列意向结构16来追踪哪个词片用来构成预测,从而基于用户的选择20,将输入事件10与输入事件的目标进行配对。如果输入序列意向结构16包括以其目标进行标记的词片,则预测器用于追踪目标标记,从而使输入事件10与输入事件10的目标之间的匹配包括输入事件10与其目标之间的配对。作为一种选择,在目标与输入事件10配对之前,首先通过在目标映射台3上的反向映射,使词片与其对应的目标进行匹配。之后,与其目标配对的输入事件10被送至更新了模型集合6中相关模型的输入模型更新器5。下面通过讨论一个实例来解释说明本系统的功能。在这一实例中,用户试图在虚拟键盘1(标准布局)上输入词“it’s”。用户触摸键盘上的非常接近于第一个字符‘i’的区域。虚拟键盘1生成表示位置的输入事件10(例如,笛卡尔坐标),并将该输入事件发送给输入概率生成器2。输入概率生成器2估计所有的目标模型6,计算这些模型与该输入事件相对应的可能性。输入概率生成器通过仅保留概率值在(凭借经验或用户经验设置的)预设阈值之上的目标,过滤掉低概率目标。在本实例中,计算出的目标序列意向结构12为[(@I,1.0),(@O,0.2),(@U,0.2),(@K,0.15),(@J,0.1)],其中,@I为对应于字符‘i’的目标。目标映射台3将各个目标转换成若干可选词片,例如,@I→i,’i。目标映射台3将目标与这些词片映射,并以作为这些词片出处的目标标记各词片。计算出的输入序列意向结构16为[(i,1.0;@I),(1.0;@I),(’i,1.0;@I),(o,0.2;@O),(’o,0.2;@O),(0.2;@O),(ó,0.2;@O),...]。之后,预测器4使用该输入序列意向结构以及任意可用的词语境生成将被反馈给用户的预测18。例如,预测器4可能预测出[“I”,“I’m”,“in”]。用户于是作出远离第二字符‘t’且实际更接近于字符‘r’的第二触摸事件。虚拟键盘1将这两个触摸事件10(‘i’和‘t’)发送至输入概率生成器2。输入概率生成器2立即生成概率向量序列{[(@I,1.0),(@O,0.2),...],[(@R,0.8),(@T,0.6),(@E,0.1),...]}。以词片目标标记词片的目标映射台3被独立应用于序列中的各事件:{[(i,1.0;@I),(1.0;@I),...],[(r,0.8;@R),(’r,0.8;@R),(t,0.6;@T),...]}。预测器4作出显示给用户的预测18:[“it”,“it’s”,“or”]。这些预测可由虚拟键盘显示。用户选择预测“it’s”。虚拟键盘1建立一选择事件20,并由预测器对两个触摸事件10与预测18的目标进行匹配。反向映射是对触摸位置与目标之间的简单配对,这是因为上述系统通过以与词片相应的目标和输入事件对词片进行标识来保持追踪构成预测的目标和输入事件清单。预测器4将用户触摸屏幕的位置与该位置的目标配对(touch-1→@I),(touch-2→@T)。之后,输入模型更新器5更新很可能被收紧处理的@I的模型(当touch-1(第一触摸)很精确),以及更新很可能被放松处理的@T的模型(当touch-2(第二触摸)不很精确)。上述实例涉及代表单独字符的目标。然而,目标也可代表多个字符。如果目标代表多个字符,例如A/B/C,则该目标的模型会使对应于目标A/B/C的用户输入事件模型化。其中,选中的预测18包括A、B或C,目标A/B/C被映射回输入事件。通过模型化用户与虚拟键盘的历史交互,本发明可以准确地预测出在用户触摸屏幕时意欲输入的字符。以上所述仅为本发明的较佳实施例而已,凡在本发明的精神和原则之内,所作的任何修改、改进等,均应包含在本发明的保护范围之内。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1