提供相关文本自动完成的制作方法

文档序号:6477229阅读:196来源:国知局
专利名称:提供相关文本自动完成的制作方法
提供相关文本自动完成
些旦 冃豕
用于诸如例如图形输入板个人计算机(PC)或其它处理设备等处理设备
的许多输入系统提供文本预测能力以流线化文本输入过程。例如,在现有文本 预测实现中,随着单词被一次一个字符地输入,仅有是当前正被输入单词的延 b的单词可作为文本预测来呈现给用户。如果用户看到正确的单词,则用户可 以选择该单词来完成该单词的输入。
概述
提供本概述是为了以简化的形式介绍将在以下详细描述中进一步描述的 一些概念。本概述并不旨在标识出所要求保护的主题的关键特征或必要特征, 也不旨在用于限定所要求保护的主题的范围。
在根据本发明主题的各实施例中, 一种处理设备可接收语言输入。该语言 输入可以是诸如例如数字墨水输入、语音输入、或其它输入等非文本输入。该 处理设备可以识别该语言输入并可以产生一个或多个文本字符。该处理设备可 以随后基于所产生的一个或多个文本字符来生成一个或多个前缀的列表。对于 数字墨水输入,可在一个或多个前缀的列表中包括备选识别。可基于所生成的 一个或多个前缀的列表来从多个预测数据源生成多个文本自动完成预测。可生 成描述每个文本自动完成预测的多个特征的特征向量。可基于相应的特征向量 来排序并存储文本自动完成预测。该处理设备可以呈现预定数量的最佳文本自 动完成预测。对所呈现的预定数量的最佳文本自动完成预测中的一个的选择可 导致当前正在被输入的单词被替换为所呈现的预定数量的最佳文本自动完成 预测中所选的那一个。
在某些实施例中, 一个或多个预测数据源可基于用户数据来生成。在此类 实施例中,文本自动完成预测可至少部分基于用户数据来生成。附图 u
为了描述能够获得上述和其它优点和特征的方式,以下将描述并通过参考附图中示出的各具体实施例来呈现更为具体的描述。可以理解,这些附图仅描述各典型实施例,从而不被认为是对其范围的限制,将通过使用附图用附加特征和细节来描述和说明各个实现。


图1是示出可用于实现根据本发明主题的各实施例的示例性处理设备的功能框图。
图2A-2B示出根据本发明主题的一个实施例中的处理设备的示例性显示
的一部分。
图3是示出可在训练处理设备时执行以生成相关可能文本自动完成预测
的示例性处理的流程图。
图4是示出用于识别非文本输入、生成文本自动完成预测、以及呈现预定数量的文本自动完成预测的示例性过程的流程图。
图5是示出可包括可由应用程序调用的例程或过程的所展示的识别预测应用程序接口和所展示的识别预测结果应用程序接口的框图。
详细描述
以下详细描述各实施例。尽管讨论各个具体实现,但应当理解,这仅是出于说明的目的。相关领域技术人员将认识到,可以使用其它组件和配置而不背离本发明的主题的精神和范围。
概览
在根据本发明主题的各实施例中,可提供一种处理设备。该处理设备可接收来自用户的语言输入。该语言输入可以是文本、数字墨水、语音、或其它语言输入。在一个实施例中,可识别诸如例如数字墨水、语音、或其它非文本语言输入等非文本语言输入以产生一个或多个文本字符。该处理设备可基于该输
入文本或所产生的一个或多个文本字符来生成一个或多个前缀的列表。对于数字墨水输入,可在一个或多个前缀的列表中包括备选识别。处理设备可基于所生成的一个或多个前缀的列表来从多个预测数据源生成多个文本自动完成预测。该处理设备可基于与每个自动完成预测相关联的特征来对多个文本自动完成预测进行排序。该处理设备可将预定数量的最佳文本自动完成预测呈现为可能文本自动完成预测。对所呈现的预定数量的最佳文本自动完成预测中的一个的选择可导致当前正在被输入的单词被替换为所呈现的预定数量的最佳文本自动完成预测中所选的那一个。
在根据本发明主题的一个实施例中,多个预测数据源可包括基于词典的预测数据源、输入历史预测数据源、个性化词典预测数据源、以及n元语法语言模型预测数据源。基于词典的预测数据源可以是使用诸如例如英语、中文、或另一语言等特定语言的通用语言数据源。输入历史预测数据源可基于包括在诸如电子邮件、文本文档、或其它文档等新创建或新修改的用户文档中,以及包括但不限于数字墨水、语音输入、或其它输入的其它输入中的文本。对于输入历史预测数据源,处理设备可以跟踪最近被输入的单词、这些单词被输入了有多久、哪些单词在其它单词之后被输入、以及这些单词多久被输入一次。个性化词典预测数据源可以是基于用户数据的用户词典,用户数据诸如例如,包括在诸如电子邮件、文本文档、或其它文档等用户文档中的文本。对于个性化词典预测数据源,处理设备可以跟踪大多数或全部已经被输入的单词、以及哪些单词在其它单词之后被输入。在某些实施例中,可以维护诸如例如单词频率
或其它信息等语言模型信息。n元语法语言模型预测数据源可以是通用语言数
据源,或可以通过分析用户数据(例如,用户文档、电子邮件、文本文档)并
产生包括与来自预测数据源的单词和字母的组相关的信息的n元语法语言模型来构建(或修改/更新)。
示例性处理设备
图1是示出可用于实现根据本发明的主题的各实施例的示例性处理设备100的功能框图。处理设备100可以包括总线110、处理器120、存储器130、只读存储器(ROM) 140、存储设备150、输入设备160、和输出设备170。总线110可以准许处理设备100的各组件之间的通信。
处理器120可以包括解释和执行指令的至少一个常规处理器或微处理器。存储器130可以是随机存取存储器(RAM)或存储供处理器120执行的信息和
9指令的另一种类型的动态存储设备。在一个实施例中,存储器130可包括闪速RAM设备。存储器130还可以存储在处理器120执行指令期间使用的临时变量或其它中间信息。ROM 140可以包括常规ROM设备或为处理器120存储静态信息和指令的另一种类型的静态存储设备。存储设备150可以包括用于存储数据和/或指令的任何类型的介质。
输入设备160可包括显示器或触摸屏,该显示器或触摸屏可进一步包括用于从诸如例如,电子或非电子笔、指示笔、用户的手指或其他书写设备等书写设备接收输入的数字化仪。在一个实施例中,书写设备可包插定点设备,诸如例如,计算机鼠标或其他定点设备。输出设备170可包括向用户输出信息的一个或多个常规机制,包括一个或多个显示器或其它输出设备。
处理设备100可响应于处理器120执行诸如例如存储器130或其它介质等有形机器可读介质中所包含的指令序列来执行这些功能。这些指令可从诸如存储设备150等另一机器可读介质或经由通信接口 (未示出)从单独的设备读入存储器130中。
示例
图2A示出根据本发明主题的一个实施例中的处理设备的示例性显示的一部分。用户可以使用书写设备来输入诸如例如数字墨水202的笔画等语言输入。数字墨水的笔画可以形成字母,字母可以形成一个或多个单词。在此示例中,数字墨水202可以形成字母"uni"。诸如例如数字墨水识别器等识别器可以识别数字墨水202并可以呈现识别结果204。识别器可经由多个识别路径来产生多个可能识别结果,但仅将来自最有可能的识别路径的最佳识别结果作为识别结果204来呈现或显示。
处理设备可基于多个可能识别结果来生成包括至少一个前缀的列表。例如,处理设备可生成包括前缀"uni"的列表。处理设备可对多个预测数据源进行参考以寻找以该前缀开始的单词。处理设备可从多个预测数据源产生许多可能文本自动完成预测。在某些实施例中,可以生成数百或数千个可能文本自动完成预测。
处理设备可以为每个可能文本自动完成预测生成特征向量。每个特征向量可以描述每个可能文本自动完成预测的多个特征。示例性特征向量在下面将更详细地描述。可能文本自动完成预测可以被彼此比较以对可能文本自动完成预测进行排列或排序。处理设备可以呈现预定数量的最相关的可能文本自动完成
预测206。在一个实施例中,如图2A和2B所示,可以呈现三个最相关的可能文本自动完成预测。在其它实施例中,处理设备可以呈现不同数量的最相关的可能文本自动完成预测。在图2A中,最相关的可能文本自动完成预测206包括"united states of america" 、 "united"、以及"uniform"。因此,每个可能文本自动完成预测可包括一个或多个单词。
用户可以使用定点设备或书写设备来选择预定数量的最相关的可能文本自动完成预测206中的一个。例如,用户可以使用计算机鼠标通过点击可能文本自动完成预测206中的一个来选择预定数量的最相关的可能文本自动完成预测206中的一个,或者用户可以使用书写设备来简单地触摸显示屏上显示可能文本自动完成预测206中所需的一个的一部分。在其它实施例中,用户可以经由不同方法来选择预定数量的最相关的可能文本自动完成预测206中的一个。在此示例中,用户选择单词"united"。如图2B所示,处理设备可以突出显示所选可能文本自动完成预测。在选择了预定数量的最相关的可能文本自动完成预测206中的一个之后,所呈现的识别结果204可被所选文本自动完成预测替代,该文本自动完成预测还可进一步作为对诸如例如文本处理应用程序或其它应用程序等应用程序的输入来提供。
训练
图3示出可在训练处理设备时执行以生成相关可能文本自动完成预测的示例性处理。在一个实施例中,处理设备可以收获诸如例如发送和/或接收到的电子邮件消息、存储的文本文档、或其它文本输入等用户的文本输入(动作300)。处理设备可以随后生成多个个性化自动完成预测数据源(动作304)。
例如,处理设备可以生成输入历史预测数据源(动作304a)。在一个实施例中,仅将来自最近用户文本输入的单词和单词的组包括在输入历史预测数据源中。处理设备可以生成个性化词典预测数据源(动作304b)。在一个实施例中,个性化词典预测数据源可包括来自所收获的用户文本输入的单词和单词
11的组,而无论该文本输入被输入了多久。处理设备还可生成n元语法语言模型
预测数据源(动作304c),该n元语法语言模型预测数据源可包括来自上述预测数据源、以及来自任何其它预测数据源的字母或单词的组。在某些实施例中,处理设备可包括通用的基于词典的预测数据源307,该预测数据源307可以是关于诸如例如英语、中文、或另一种语言等特定语言的通用预测数据源。在其它实施例中,可以包括特定语言的领域词典预测数据源。例如,可以包括医学领域预测数据源、法律领域预测数据源、基于搜索查询日志构建的领域词典预测数据源、或另一预测数据源。在某些实施例中,可以提供领域词典预测数据源而非通用的基于词典的预测数据源。在其它实施例中,除了通用的基于词典的预测数据源之外还可提供领域词典预测数据源。
处理设备还可以接收或处理其它输入,诸如文本输入或非文本输入(动作302)。可识别非文本输入以产生文本的一个或多个字符(动作303)。
在生成个性化自动完成预测数据源之后,处理设备可以一次一个字符或一次一个单词地处理其它输入,如同该输入当前正被用户输入那样。随着该输入
被一次一个字符或一次一个单词地处理,处理设备可以基于该输入来生成一个或多个前缀的列表(动作306)。这些前缀可包括一个或多个字母、 一个或多个单词、或一个或多个之后是部分单词的单词。如果输入是非文本输入,则处理设备可至少部分基于来自预定数量的具有最高可能性为正确的识别路径的识别结果来生成前缀的列表。在一个实施例中,处理设备可至少部分基于来自具有最高可能性为正确的识别路径中的三个的识别结果来生成前缀的列表。在其它实施例中,处理设备可至少部分基于来自不同数量的具有最高可能性为正确的识别路径的识别结果来生成前缀的列表。
处理设备可随后基于相应的前缀和诸如例如通用的基于词典的预测数据源、输入历史预测数据源、个性化词典预测数据源、以及n元语法语言模型预测数据源等多个预测数据源来生成多个文本自动完成预测(动作308)。在其它实施例中,处理设备可基于附加的、不同的或其它的数据源来生成文本自动完成。在某些实施例中,为了将预测的数量保持在可管理的数量,所有基于来自具有最高可能性为正确的优秀识别路径的前缀的预测可被保留且基于其它前缀的文本自动完成预测中最常见的那些可被保留。
12处理设备随后可为所保留的文本自动完成预测生成相应的特征向量(动作310)。在一个实施例中,每个特征向量可包括描述以下内容的信息 用于生成文本自动完成预测的前缀的长度;
在生成文本自动完成预测的前缀中的每个字符的放置(S卩,前缀中的每个字符从哪个识别路径中获得);
前缀中的每个字符的识别分数; 文本自动完成预测的长度; 前缀是否是单词;
由前缀和文本自动完成预测形成的单元语法; 由前缀和文本自动完成预测与前导单词形成的双元语法; 文本自动完成预测中的首字符的字符单元语法;以及 前缀中的最后字符和文本自动完成预测中的首字符的字符双元语法。在其它实施例中,特征向量可包括附加的信息、或不同的信息。接着,可训练预测排序器(动作312)。预测排序器可包括比较神经网络或可被训练来确定哪个文本自动完成预测比另一文本自动完成预测更相关的其它组件。在训练期间,实际输入是已知的。因此,特定文本自动完成预测正确与否是已知的。可将文本自动完成预测的对添加到训练集。例如,如果第一文本自动完成预测匹配实际输入而第二文本自动完成预测不匹配实际输入,则可将一数据点与指示匹配文本自动完成预测的排序应该高于非匹配文本自动完成预测的标签一起添加到训练集中。不可将包括两个匹配实际输入的文本自动完成预测或两个不匹配实际输入的文本自动完成预测的文本自动完成预测的对添加到训练集中。预测排序器可基于添加到训练集中的文本自动完成预测的对和对应标签来训练。在某些实施例中,可将预测排序器训练成偏爱较长的预测。
操作期间的示例性处理
图4是示出可由根据本发明主题的处理设备来执行的示例性过程的流程图。该过程可从处理设备接收输入来开始(动作402)。该输入可以是诸如例如数字墨水输入、语音输入、或其它输入等非文本输入。参考图4的示例性过程,假设该输入是数字墨水输入。
处理设备随后可识别该输入以产生至少一个文本字符(动作404)。在识别期间,可以参考多个识别路径来产生一个或多个文本字符。每个识别路径可以具有对应的产生正确识别结果的可能性。处理设备可基于来自预定数量的具有最高的产生正确的识别结果的可能性的识别路径的信息来生成前缀的列表
(动作406)。在一个实施例中,处理设备可至少部分基于来自具有最高可能
性为正确的识别路径中的三个的识别结果来生成前缀的列表。在其它实施例中,处理设备可至少部分基于来自不同数量的具有最高可能性为正确的识别路径的识别结果来生成前缀。
处理设备随后可基于相应的前缀和一个或多个预测数据源来生成多个文
本自动完成预测(动作408)。处理设备可通过在多个预测数据源中寻找匹配相应前缀中的一个的相应字符组来生成文本自动完成预测。在一个实施例中,如参考训练和图3所述,多个预测数据源可包括通用的基于词典的预测数据源、输入历史预测数据源、个性化词典预测数据源、以及n元语法语言模型预测数据源。在其它实施例中,处理设备可基于附加的、不同的或其它的数据源来生成文本自动完成预测。在某些实施例中,为了将文本自动完成预测的数量保持在可管理的数量,所有基于来自具有最高可能性为正确的优秀识别路径的前缀的预测可被保留且基于其它前缀的文本自动完成预测中最常见的那些可被保留。
处理设备随后可为所保留的文本自动完成预测生成相应的特征向量(动作410)。在一个实施例中,每个特征向量可包括如之前参考动作310所述的信息。在其它实施例中,每个特征向量可包括附加的信息、或不同的信息。接着,经训练的预测排序器可基于特征向量中对应的一个来对所保留的文本自动完成预测进行排列和排序(动作412)。在一个实施例中,经训练的预测排序器可通过使用比较特征向量的比较神经网络和合并排序技术来对所保留的自动完成预测进行排列和排序。在另一实施例中,经训练的预测排序器可通过使用比较特征向量的比较神经网络和气泡排序技术来对所保留的自动完成预测进行排列和排序。在其它实施例中,可使用其它排序技术来对所保留的自动完成预测进行排列和排序。在预测排序器对文本自动完成预测进行排列和排序之后,处理设备可呈现 或显示预定数量的最佳文本自动完成预测(动作414)。在某些实施例中,这 些预定数量的最佳文本自动完成预测可以是经排列和排序的文本自动完成预 测的顶部位置中的预定数量的文本自动完成预测。在一个实施例中,这些预定 数量的最佳文本自动完成预测可以是经排列和分类的文本自动完成预测中的 最佳文本自动完成预测中的三个。
处理设备随后可确定用户是否选择了预定数量的最佳文本自动完成预测
中的任一个(动作416)。在一个实施例中,用户可使用参考图2A和2B所述 的方式来选择预定数量的最佳文本自动完成预测中的一个。如果用户继续提供 诸如例如数字墨水输入、语音输入、或其它要被转换为文本的输入等输入,则 处理设备可以确定用户并未选择预定数量的最佳文本自动完成预测中的一个。
如果用户选择了所呈现的预定数量的最佳文本自动完成预测中的一个,则 处理设备可以通过用所呈现的预定数量的最佳文本自动完成预测中所选的那 一个来替换当前所输入的单词或部分单词来完成正由用户输入的输入(动作 418)。处理设备随后可更新预测数据源(动作419)。例如,处理设备可更新 输入历史预测数据源、个性化词典预测数据源、n元语法语言模型预测数据源、 或其它的或不同的预测数据源。
接着,处理设备可以保存关于前缀、文本自动完成预测、所选择的文本自 动完成预测的信息、和/或用于预测排序器的进一步训练的其它信息以提高所呈 现的预定数量的最佳文本自动完成预测的准确度(动作420)。例如,前缀、 所呈现的最佳文本自动完成预测中所选的一个、以及所呈现的最佳文本自动完 成预测中未被选择的一个、相应特征向量、以及指示文本自动完成预测是正确 文本自动完成预测的标签可被保存在训练集中以用于预测排序器的进一步训 练。
处理设备随后可确定该过程是否完成(动作422)。在某些实施例中,处 理设备可在用户通过退出输入应用程序或通过提供另一指示来提供输入过程 完成的指示时确定该过程完成。
应用程序接口在根据本发明主题的某些实施例中可展示用于提供文本自动完成预测的 应用程序接口 (API),以便应用程序可以设置识别参数且可以接收文本自动
完成预测。图5是示出使用所展示的识别预测API 502和所展示的识别预测结 果API 504的应用程序500的框图。
在根据本发明主题的一个实施例中,识别预测API 502可包括所展示的例 程,诸如例如初始化(Init)、取得识别预测结果(GetRecoPredictionResults)、 设置识别上下文(SetRecoContext)、以及设置文本上下文(SetTextContext)。 初始化可由应用程序500调用来为数字墨水识别器、语音识别器、或其它识别 器初始化各种识别器设置,并初始化诸如例如相关于特征向量的设置或其它设 置等各种预测设置。设置文本上下文可由应用程序500调用来指示输入将作为 文本来提供。设置识别上下文可由应用程序500调用来指示输入将作为数字墨 水输入、语音输入、或其它非文本输入来提供。作为设置识别上下文被调用的 结果,处理设备可基于非文本输入从诸如例如数字墨水识别器、语音识别器、 或其它识别器等识别器获得备选识别。该备选识别可被用作用于生成文本自动 完成预测的前缀。取得识别预测结果可由应用程序500调用来获得文本自动完 成预测并将该文本自动完成预测存储在由在调用取得识别预测结果时提供的 参数所指示的区域中。
识别预测结果API 504可包括所展示的例程、诸如例如,取得计数 (GetCount)、取得预测(GetPrediction)、以及取得前缀(GetPrefix)。应 用程序500可以调用取得计数来获得作为之前对取得识别预测结果的调用的结 果被存储在所指示的区域中的文本自动完成预测的计数。应用程序500可调用 取得预测来一次获得一个作为对取得识别预测结果的调用的结果被存储在所 指示的区域中的文本自动完成预测。应用程序500可调用取得前缀来获得用于 生成通过调用取得预测来获得的文本自动完成预测的前缀。
上述API是示例性API。在其它实施例中,API的所展示的的例程可包括 附加例程、或其它例程。
结论
尽管用对结构特征和/或方法动作专用的语言描述了本主题,但可以理解,所附权利要求书中的主题不必限于上述具体特征或动作。相反,上述具体特征 和动作是作为实现权利要求的示例形式公开的。
虽然以上描述可能包含具体细节,但决不应将其解释为是对权利要求的限 制。所述各实施例的其它配置也是本发明的范围的一部分。此外,根据本发明 主题的各个实现可以具有比所描述的更多或更少动作,或可以按与所示出的顺 序不同的顺序来实现各个动作。因此,只有所附权利要求书及其合法的等效技 术方案才应定义本发明,而非任何给出的具体示例。
权利要求
1.一种用于对于语言输入提供文本自动完成预测的机器实现的方法,所述机器实现的方法包括识别所述语言输入并产生至少一个文本字符(404);基于所述至少一个文本字符来生成包括至少一个前缀的列表(406);基于所生成的列表来从多个预测源生成多个文本自动完成预测(408);基于与所述多个文本自动完成预测中的每一个相关联的多个特征来对所述多个文本自动完成预测进行排序(410,412);以及呈现预定数量的最佳文本自动完成预测作为对于所述语言输入的可能文本自动完成预测(414)。
2. 如权利要求1所述的机器实现的方法,其特征在于 所述语言输入是手写数字墨水或语音中的一个。
3. 如权利要求1所述的机器实现的方法,其特征在于基于所生成的列表来从所述多个预测源生成多个文本自动完成预测还包括为所述多个文本自动完成预测中的每一个生成相应特征向量,每个 所述特征向量描述所述多个文本自动完成预测中对应的一个的多个特征;以及基于与所述多个文本自动完成预测中的每一个相关联的多个特征来 对所述多个文本自动完成预测进行排序还包括.-基于比较所述相应特征向量来执行所述多个文本自动完成预测 的合并排序。
4. 如权利要求1所述的机器实现的方法,其特征在于 基于所述至少一个文本字符来生成包括至少一个前缀的列表还包括基于来自通过所述语言输入的识别来生成的预定数量的最佳识别路 径的文本数据来生成所述列表。
5. 如权利要求1所述的机器实现的方法,其特征在于,所述多个预测数据 源包括从最近输入的用户数据中构建的输入历史预测数据源、基于输入用户数 据的个性化词典预测数据源、领域词典预测数据源、以及至少部分基于所述用 户数据的n元语法语言模型预测数据源。
6. 如权利要求1所述的机器实现的方法,其特征在于,与所述多个文本自 动完成预测中的每一个相关联的所述多个特征包括用于生成相应文本自动完成预测的前缀的长度, 所述相应文本自动完成预测的长度, 所述前缀是否是单词,所述前缀和所述相应文本自动完成预测的n元语法,所述前缀、所述相应文本自动完成预测、以及所述相应文本自动完成预测 之前的单词的双元语法,所述相应文本自动完成预测的首字符的字符单元语法,以及所述前缀中的最后字符和所述相应文本自动完成预测中的首字符的字符 双元语法。
7. 如权利要求l所述的机器实现的方法,其特征在于,还包括 展示供应用程序请求并接收文本自动完成预测相关数据的应用程序接口。
8. —种其上记录了用于处理设备的至少一个处理器的指令的有形机器可读介质,所述指令包括用于至少部分基于用户数据来构建并更新多个预测数据源的指令(304, 419),用于基于预定数量的最佳识别路径来识别用户语言输入并产生包括多个 前缀的列表的指令(406),用于基于所述多个前缀来从所述多个预测数据源中生成多个文本自动完 成预测的指令(408),用于为所述多个文本自动完成预测中的每一个生成相应特征向量的指令, 所述相应特征向量中的每一个描述关于所述多个文本自动完成预测中对应的 一个的多个特征(410),用于基于所述相应特征向量来对所述多个文本自动完成预测进行排序的指令(412),以及用于呈现所述多个文本自动完成预测中的预定数量的最佳文本自动完成 预测作为对所述用户语言输入的可能文本自动完成的指令(414)。
9. 如权利要求8所述的有形机器可读介质,其特征在于,还包括 用于通过保留所述多个文本自动完成预测中基于来自最佳识别路径的多个前缀中的一个的各个文本自动完成预测,并保留所述多个文本自动完成预测 中基于所述多个前缀中除来自所述最佳识别路径的多个前缀中的一个以外的 各前缀的最常被预测的各个前缀,从而限制要考虑的多个预测的数量的指令。
10. 如权利要求8所述的有形机器可读介质,其特征在于,所述用户语 言输入是手写数字墨水。
11. 如权利要求8所述的有形机器可读介质,其特征在于,所述用于至 少部分基于用户数据来构建并更新多个预测数据源的指令包括用于基于最近的用户数据输入来构建输入历史预测数据源的指令, 用于基于存储的用户数据来构建个性化词典预测数据源的指令,以及 用于至少部分基于所述存储的用户数据来构建n元语法语言模型的指令。
12. 如权利要求8所述的有形机器可读介质,其特征在于,所述用于基 于所述多个前缀来从所述多个预测数据源中生成多个文本自动完成预测的指 令还包括用于在所述多个预测数据源中寻找匹配所述多个前缀中的各个前缀的相 应字符组并基于与所述相应字符组相关联的一个或多个字符来生成相应文本 自动完成预测的指令。
13. 如权利要求8所述的有形机器可读介质,其特征在于,所述多个文 本自动完成预测中的至少某一些包括正被输入的用户语言输入中的当前单词 之后的至少一个单词。
14. 如权利要求8所述的有形机器可读介质,其特征在于,所述用于基于所述相应特征向量来对所述多个文本自动完成预测进行排序的指令包括用于相对于较短的预测偏爱较长的预测的指令。
15. 如权利要求8所述的有形机器可读介质,其特征在于,所述指令还包括用于展示提供对于识别用户输入语言的结果的至少一个文本自动完成预 测的应用程序接口的指令。
16. —种处理设备,包括 至少一个处理器(120);存储器(130);将所述至少一个所述处理器与所述存储器相连接的总线(110),所述存储器包括用于识别数字墨水输入、表示语言输入以产生识别结果的指令(404),用于基于所述识别结果来生成多个文本自动完成预测的指令,所述多个文本自动完成预测中的至少某一些预测正被输入的当前单词之后的单词(408, 206),用于呈现所述多个文本自动完成预测中等于预定数量的最佳文本自动完 成预测的指令(414),用于接收对所述多个文本自动完成预测中所呈现的预定数量的最佳文本 自动完成预测中的一个的选择的指令(416),以及用于提供所述多个文本自动完成预测中所呈现的预定数量的最佳文本自 动完成预测中所选的一个作为输入的指令(418)。
17. 如权利要求16所述的处理设备,其特征在于,所述用于基于所述识别结果来生成多个文本自动完成预测的指令还包括用于从多个预测数据源生成所述多个文本自动完成预测的指令,所述多个 数据源中的至少某一些从存储的用户数据导出。
18. 如权利要求16所述的处理设备,其特征在于,所述用于基于所述 识别结果来生成多个文本自动完成预测的指令还包括 ^.用于从多个预测数据源生成所述多个预测的指令,所述多个预测数据源中 的至少某一些从存储的用户数据导出,且所述多个预测数据源中的一个是用于 特定语言的通用的基于词典的预测数据源或领域词典预测数据源。
19. 如权利要求16所述的处理设备,其特征在于,所述存储器还包括 用于根据与所述多个文本自动完成预测中的每一个相关联的多个特征和基于 所述识别结果的前缀来对所述多个文本自动完成预测进行排序的指令,所述多 个特征中的每一个的相关性之前基于先前提供的文本输入来训练。
20. 如权利要求16所述的处理设备,其特征在于,所述存储器还包括 用于使用比较神经网络来根据与所述多个文本自动完成预测中的每一个相关联的多个特征和基于所述识别结果的前缀来对所述多个文本自动完成预 测进行排序的指令。
全文摘要
例如图形输入板PC或其它处理设备等处理设备可接收非文本语言输入。可识别该非文本语言输入以产生一个或多个文本字符。处理设备可基于所产生的一个或多个文本字符来生成包括一个或多个前缀的列表。可基于多个预测数据源和一个或多个前缀来生成多个文本自动完成预测。可基于与每个文本自动完成预测相关联的特征来对多个文本自动完成预测进行排列和排序。处理设备可以呈现预定数量的最佳文本自动完成预测。对所呈现的预定数量的最佳文本自动完成预测中的一个的选择可导致当前正在被输入的单词被替换为预定数量的最佳文本自动完成预测中所选的那一个。
文档编号G06F3/023GK101681198SQ200880017043
公开日2010年3月24日 申请日期2008年5月7日 优先权日2007年5月21日
发明者B·利昂, Q·张 申请人:微软公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1