基于多个语言模型的文本预测的制作方法

文档序号:9476176阅读:373来源:国知局
基于多个语言模型的文本预测的制作方法
【专利说明】基于多个语言模型的文本预测
【背景技术】
[0001] 诸如移动电话、便携式和平板计算机、娱乐设备、手持式导航设备等等之类的计算 设备通常实现有屏上键盘(例如软键盘),其可W被用于文本输入和/或与计算设备的其它 交互。当用户使用屏上键盘或类似输入设备将文本字符输入到文本框中或W其它方式输入 文本时,计算设备可W应用自动校正W自动地校正拼写错误和/或应用文本预测W基于输 入字符来预测和提供候选词语/短语。
[0002] 在传统方案中,使用可W在测试模拟中开发并且硬编码在设备上的静态语言模型 来产生自动校正和文本预测。用户可能能够明确地将词语添加到模型或者省略词语,但是 否则静态语言模型可能不适配于特定用户和交互场景。因此,使用传统技术提供的文本预 测候选者通常对于用户和/或场景而言是不恰当的或者不相关的,运可能引起预测中的挫 败和f胃任缺失。

【发明内容】

[0003]本文描述用于文本预测的自适应语言模型。在一个或多个实现中,在与设备的交 互期间检测文本字符的录入。根据自适应语言模型生成对应于所检测到的文本字符的文本 预测候选者。自适应语言模型可W被配置成包括多个单独的语言模型字典,其具有组合在 一起W在不同交互场景中对预测候选者进行排名和选择的相应评分数据。除预定义的普通 人群字典之外,字典可W包括个性化字典和/或交互特定字典,其通过监视用户的打字活 动W将预测适配于用户的风格而学习到。用于预测的组合概率被计算为来自自适应语言模 型的多个字典的各个概率的加权组合。在实现中,对应于多个不同语言的字典可W组合W 产生多语种预测。
[0004] 提供本
【发明内容】
来W简化的形式引入W下在【具体实施方式】中进一步描述的概念 的选择。本
【发明内容】
不旨在标识所要求保护的主题的关键特征或本质特征,也不旨在用作 帮助确定所要求保护的主题的范围。
【附图说明】
[0005] 参照附图描述【具体实施方式】。在图中,参考标号的最左侧的(多个)数字标识参考 标号第一次出现在的图。相同参考标号在描述和图中的不同实例中的使用可W指示类似或 等同的项目。
[0006] 图1图示了其中可W实现用于文本预测的自适应语言模型的各方面的示例操作 环境。
[0007] 图2图示了依照一个或多个实现的示例用户接口。
[000引图3图示了依照一个或多个实现的示例文本预测场景。
[0009] 图4A图示了依照一个或多个实现的自适应语言模型的示例表示。
[0010] 图4B图示了依照一个或多个实现的语言模型字典之间的示例关系的表示。
[0011] 图5描绘了依照一个或多个实现的其中提供文本预测的示例过程。
[0012] 图6描绘了依照一个或多个实现的其中交互特定字典被用于文本预测的示例过 程。
[0013] 图7描绘了依照一个或多个实现的其中使用来自多个字典的评分数据的加权组 合来选择文本预测候选者的示例过程。
[0014] 图8描绘了依照一个或多个实现的其中生成多语种文本预测候选者的示例过程。
[0015] 图9描绘了可W在用于文本预测的自适应语言模型的一个或多个实现中采用的 示例系统和设备。
【具体实施方式】[001引概沐 在传统方案中,文本预测可W依赖于在测试模拟中开发并且硬编码在设备上的静态语 言模型。由于静态语言模型可能不适配于用户的个人风格,因此使用传统技术所生成的文 本预测候选者通常是不恰当的或不相关的,运可能引起预测中的挫败和信屯、缺失。
[0017] 本文描述用于文本预测的自适应语言模型。在一个或多个实现中,在与设备的交 互期间检测文本字符的录入。根据自适应语言模型来生成对应于所检测到的文本字符的文 本预测候选者。自适应语言模型可W被配置成包括多个单独的语言模型字典,其具有组合 在一起W针对不同交互场景对预测候选者进行排名和选择的相应评分数据。除预定义的普 通人群字典之外,字典可W包括个性化字典和/或通过监视用户的打字活动W将预测适配 于用户的风格所学习到的交互特定字典。用于预测的组合概率被计算为来自自适应语言模 型的多个字典的各个概率的加权组合。在实现中,对应于多个不同语言的字典可W组合W 产生多语种预测。
[0018] 在接下来的讨论中,题为"操作环境"的章节描述依照用于文本预测的自适应语言 模型的一个或多个实现可W采用的示例环境和示例用户接口。紧随其后,题为"自适应语言 模型细节"的章节描述依照一个或多个实现的示例自适应语言模型细节和过程。最后,提供 题为"示例系统"的章节,其描述可W针对用于文本预测的自适应语言模型的一个或多个实 现而采用的示例系统和设备。
[001引操作环培 图1图示了其中可W实现用于文本预测的自适应语言模型的实施例的示例系统100。 示例系统100包括计算设备102,其可W是W消费品、计算机、便携式设备、通信、导航、媒 体回放、娱乐、游戏、平板和/或电子设备的任何形式的固定或移动设备中的任何一个或组 合。例如,计算设备102可W实现为电视客户端设备104、计算机106和/或连接到显示设 备110W显示媒体内容的游戏系统108。可替换地,计算设备可W是任何类型的便携式计算 机、移动电话或者包括集成显示器114的便携式设备112。任何计算设备可W实现有诸如一 个或多个处理器和存储器设备之类的各种组件,W及实现有如参照图9中所示的示例设备 进一步描述的不同组件的任何组合。
[0020]计算设备102的集成显示器114或者显示设备110可W是触摸屏显示器,其被实 现W感测触摸和手势输入,诸如显示于触摸屏显示器上的用户接口中的用户发起的字符、 按键、键入或选择器输入。可替换地或此外,计算设备的示例可W包括其它各种输入机制和 设备,诸如键盘、鼠标、屏上键盘、远程控制设备、游戏控制器、或者任何其它类型的用户发 起的和/或用户可选择的输入设备。
[0021] 在实现中,计算设备102可W包括输入模块116,其检测和/或识别与诸如屏上键 盘字符输入、触摸输入和手势、基于相机的手势、控制器输入和其它用户选择的输入之类的 各种不同种类的输入有关的输入传感器数据118。输入模块116代表标识触摸输入和/或 手势并且导致执行对应于触摸输入和/或手势的操作的功能性。输入模块116例如可W被 配置成识别通过用户的手部与触摸屏显示器(例如使用触摸屏功能性)的交互而检测到的 手势。此外或可替换地,输入模块116可W被配置成识别由相机检测到的手势,诸如用户手 部的摆动、抓取手势、手臂位置或其它经定义的手势。因此,还可W通过输入传感器数据118 将触摸输入、手势和其它输入识别为包括可用于在输入模块116所识别的不同输入之间进 行区分的属性(例如移动、选择点、位置、速度、取向等等)。该区分然后可W充当标识来自输 入的手势的基础W及因此基于手势的标识而执行的操作。
[0022] 计算设备包括键盘输入模块120,其可W被实现为计算机可执行指令,诸如由一个 或多个处理器执行W实现本文所描述的各种实施例的软件应用或模块。键盘输入模块120 表示提供并且管理屏上键盘W用于与计算设备102的键盘交互的功能性。键盘输入模块 120可W被配置成使屏上键盘的表示在不同时间处被选择性地呈现,诸如在激活文本输入 框、捜索控制或者其它文本输入控制时。屏上键盘可W提供用于在诸如显示设备110之类 的外部显示器上或在诸如集成显示器114之类的集成显示器上显示。此外,要指出的是, 硬件键盘/输入设备也可W实现具有适合用于本文描述的技术的至少一些软按键的可适 配的"屏上"键盘。例如,被提供为外部设备或与计算设备102集成的硬件键盘可W并入显 示设备、触摸按键、和/或可W用于显示如本文所描述的文本预测按键的触摸屏。在该情况 下,键盘输入模块120可W提供为用于硬件键盘/输入设备的设备驱动器的组件。
[0023] 键盘输入模块120可W包括或W其它方式利用文本预测引擎122,其表示处理和 解释字符条目124 W形成和提供对应于字符条目124的候选词语的预测的功能性。例如,屏 上键盘可W在不同交互场景中选择性地暴露W用于在文本录入框、口令录入框、捜索控制、 数据表、消息线程、或者诸如表、HTML页面、应用UI或文档之类的用户接口126的其它文本 输入控制中输入文本W促进字符条目124(例如字母、数字和/或其它字母数字字符)的用 户输入。
[0024] -般而言,文本预测引擎122探明最接近地匹配所输入的字符条目124的一个或 多个可能的候选者。W此方式,文本预测引擎122可W通过提供响应于用户所输入的字符 条目124而探明的一个或多个预测词语来促进文本录入。例如,由文本预测引擎122预测 的词语可W被用于执行输入文本的自动校正,呈现作为供用户选择的候选者的一个或多个 词语W完成、修改或校正输入文本,自动改变用于对应于所预测的词语的屏上键盘的按键 的触摸命中区域等等。
[0025] 依照本文所描述的技术,文本预测引擎122可W被配置成包括或利用如上文和下 文所描述的自适应语言模型128。一般地,自适应语言模型128代表在单独的基础上对文本 预测引擎122所做出的预测进行适配W符合不同用户打字的不同方式的功能性。因此,自 适应语言模型128可W监视和收集关于设备的用户所做出的文本录入的数据。监视和数据 收集可W在可能设及不同应用、人员(例如联系人或目标)、文本输入机制和用于交互的其 它上下文因素的不同交互场景中跨设备而发生。在一个方案中,自适应语言模型128被设 计成利用多个语言模型字典作为可w用于基于文本录入来预测下个词语或预期词语的词 语源和对应评分数据(例如条件概率、词语计数、n元语法模型等等)。来自多个字典的词语 概率和/或其它评分数据可各种方式组合W对可能的候选词语逐个地排名并且将至 少一些候选者选择为针对给定文本录入的最可能的预测。如下文更加详细地描述的,针对 给定交互场景所应用的多个字典可W从普通人群字典、个性化字典和/或通过自适应语言 模型128使其可得到的一个或多个交互特定字典来选择。关于用于文本预测的自适应语言 模型的运些和其它方面的细节可W与W下各图有关地找到。
[0026] 图2 -般地在200处图示了依照一个或多个实施例的文本预测示例。所描绘的示 例可W通过参照图1所描述的计算设备102和各种组件来实现。具体地,图2描绘了可W 输出W促进与计算设备102的交互的示例用户接口 126。用户接口 126代表可W针对计算 设备诸如由操作系统或其它应用程序提供的任何合适的接口。如所描绘的,用户接口 126 可W包括或W其它方式被配置成利用键盘202。在该示例中,键盘202是可W被再现和/或 输出W用于显示在合适的显示设备上的屏上键盘。在一些情况下,键盘202可W作为应用 的部分而并入并且出现在对应用户接口 126内W促进文本录入、导航W
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1