基于多个语言模型的文本预测的制作方法_2

文档序号:9476176阅读:来源:国知局
及与应用的其它交 互。此外或者可替换地,当文本录入恰当时,键盘202的表示可W由用户接口 126内的键盘 输入模块选择性地暴露。例如,当用户激活诸如捜索控制、数据表或文本输入框之类的文本 输入控制时,键盘202可W选择性地出现。如所提及的,适当配置的硬件键盘也可W被用来 提供导致确定和使用文本预测W促进另外的文本输入的输入。
[0027] 在至少一些实施例中,键盘输入模块120可W导致从文本预测引擎122可得到的 一个或多个合适的文本预测候选者的表示经由用户接口呈现。例如,文本预测条204或其 它合适的用户接口控制或工具可W被配置成呈现一个或多个合适的文本预测候选者的表 示。例如,可W使用适当的用户接口工具来显示所预测的文本、词语或短语的表示,所述用 户接口工具诸如是所图示的预测条204、下拉框、滑出元件、弹出框、祝词(toast)消息窗 口、或者列表框,举几个例子。文本预测候选者可W被提供为可选择元件(例如按键、按钮、 命中区域),其在被选择时导致对应文本的输入。用户可W与可选择元件交互W通过来自用 户手部206的触摸输入的方式或者W其它方式选择所显示的候选者之一。此外或者可替换 地,由文本预测引擎122得到的文本预测候选者可W用于自动校正输入文本、扩大用于键 盘202的一个或多个按键的底层命中区域、或者W其它方式使用所预测的文本来促进文本 录入。
[002引图3 -般地在300处图示了依照示例交互场景的文本预测的表示。具体地,将被配 置用于与捜索提供者交互的用户接口 126描绘成具有用于移动电话设备的屏上键盘302。 接口包括W捜索输入框的形式的文本输入控制304。在所描绘的示例中,用户已经与文本输 入控制交互W输入对应于部分短语的文本字符"GoH"。响应于该文本的输入,文本预测引 擎122可W操作W确定一个或多个预测候选者。当该文本预测306发生时,键盘输入模块 120可W检测到一个或多个预测候选者可用并且经由用户接口 126呈现候选者或者W其它 方式利用预测候选者。
[0029] 作为示例而非限制,图3描绘了针对如出现在键盘顶部的文本预测条308中所输 出的输入文本"GoH"的各种文本预测选项。具体地,选项"化me(家)"、"化kies"、"化tel (旅馆)"、"Hawaii(夏威夷)"和"化skies"被示出为输入文本的可能完成形式。在该场景 中,选项可W被配置为用户接口的可选择元件,其可操作W导致经由文本预测条308所呈 现的对应预测候选者的插入。因而,如果用户通过触摸或W其它方式选择"化kies"选项, 则捜索输入框中的输入文本"GoH"可W依照所选选项而自动完成为"Go化kies"。
[0030] 已经考虑了示例环境,现在考虑一些自适应语言模型示例的讨论W进一步说明各 个方面。
[0031] 自活麻语言横巧细节 本章节参照图4A和4B的示例表示W及图5-8的示例过程来讨论采用用于文本预测的 自适应语言模型的技术的细节。在W下讨论的部分中,可W对其中可W实现各个方面的图1 的示例操作环境做出参考。W下描述的每一个过程的各方面可W在硬件、固件或软件或其 组合中实现。过程被示出为一组块,其指定由一个或多个设备执行的操作并且未必受限于 用于相应块执行操作的所示顺序。在至少一些实现中,过程可W由适当配置的计算设备执 行,所述计算设备诸如是包括或利用文本预测引擎122或相当功能性的图1的示例计算设 备 102。
[0032] 图4A-般地在400处描绘了依照一个或多个实现的自适应语言模型的表示。如 所示出的,自适应语言模型128可W包括或利用依赖于其做出文本预测的多个单独的语言 模型字典。具体地,图4A中的自适应语言模型128被图示为并入普通人群字典402、个性化 字典404和交互特定字典406。自适应语言模型128可W由文本预测引擎122实现W将文 本预测适配于各个用户和交互。为此,自适应语言模型128可W被配置成监视用户如何打 字,在用户动态地"飞速"打字时学习用户打字的特性,使用多个字典基于输入文本字符生 成条件概率等等。
[0033] 具体地,自适应语言模型可W被配置成基于与用户所执行的文本录入结合地检 测到的一个或多个类型的用户反馈来学习用户特定打字风格。用户反馈可W是指确定处 理什么文本录入并且将其添加到用户的个性化字典的被动或明确动作。例如,当文本输 入框、编辑控制或其它UI元件上的聚焦(focus)丢失时,系统可W处理和解析文本录入W 用于适配。换言之,系统可W在学习术语之前等待文本录入的完成或用户对文本的定型 (commitment)。用户还可W通过明确选择来对文本定型,所述明确选择诸如是发送消息的 发送动作、发布状态更新或图片的发布动作、切换应用、手势、保存动作、或者对所录入的文 本的某种其它形式的定型。添加到用户词典的词语或选择的明确校正也可W被解释为用于 确定何时W及如何适配用户的个性化字典的用户反馈。类似地,如果用户已经通过针对词 语的预测条或"按需"提供而选择了预测候选者,则所选词语可W被添加和/或词语概率可 W部分地基于词语被选择的次数而进行加权。再进一步地,除了学习词汇之外,可W学习对 于字型、大写、表情符号、文本效果W及文本输入的其它特性的用户偏好。自然地,包括但不 限于前述示例的不同类型的用户反馈的组合也可W用于驱动系统学习用户的风格和习惯 的方式。
[0034] 语言模型字典一般被配置成将词语与可W用于对可能的候选词语逐个进行排名 并且将至少一些候选者选择为针对给定文本录入的最可能的预测的概率和/或其它合适 的评分数据(例如条件概率、分数、词语计数、n元语法模型数据、频率数据等等)相关联。自 适应语言模型128可W在用户和/或交互特定的基础上追踪打字活动W创建和维护对应字 典。字典中所包含的词语和短语也可W与指示在其中使用系统所收集的词语和短语的特定 交互场景(例如上下文)的各种使用参数相关联。使用参数可w用于限定不同的交互场景, 并且筛选或W其它方式组织数据W产生各种对应的语言模型字典。一个或多个单独的字典 的不同组合然后可W相应地应用于不同的交互场景。
[0035] 图4B-般地在408处描绘了依照一个或多个实现的语言模型字典之间的示例关 系的表示。在该示例中,普通人群字典402表示适用于普通人群的字典,其可W被预定义并 且加载在计算设备102上。普通人群字典402基于许多用户的集体打字活动来反映针对词 语使用的概率和/或评分数据。在实现中,普通人群字典402由开发者使用关于用户打字 的大量历史训练数据来构建并且可W预加载到设备上。普通人群字典402被配置成用作用 于跨用户和设备的预测的词语源。换言之,普通人群字典402可W表示针对作为整体的用 户人群或群体的共同使用并且不针对特定个体进行定制。普通人群字典402可W表示针对 所选语言的"已知"词语的整个集合,例如针对英语语言用户的共同使用。
[0036] 基于个体的实际使用来得到个性化字典404。个性化字典404反映用户通过与设 备的交互所键入的词语,自适应语言模型128被配置成学习和追踪所述词语。普通人群字 典中的现有词语可W作为用户词典的部分而被分配给个性化字典。尚未包含在普通人群字 典中的词语可W作为新词语自动添加在个性化字典404中。个性化字典因此可W涵盖如图 4B中所表示的普通人群字典402的子集。个性化字典404可W表示基于个体实际使用(例 如用户特定使用)的词语和短语而针对每一个个体所定制的条件使用概率。
[0037] 交互特定字典406表示用于对应交互场景的词语的交互特定使用。例如,人所使 用的词语W及他们打字的方式在不同环境下改变。如所提及的,使用参数可W用于限定不 同的交互场景并且在不同交互场景之间进行分辨。而且,自适应语言模型128可W被配置 成维护和管理用于多个交互场景的对应交互特定语言模型字典。交互特定字典406每一个 可W表示如图4B中所表示的个性化字典404的子集,其具有对应于用于与计算设备的交互 的相应上下文的词语、短语和评分数据。
[0038] 具体地,可W使用可W与用户打字活动相关联的对应使用参数来限定各种交互场 景。例如,与交互期间所录入的词语和/或短语相关联的使用参数可W指示交互的一个或 多个特性,包括但不限于应用身份、应用类型、人员(例如联系人姓名或目标接收方ID)、一 天中的时间、日期、地理位置或地点、一年或一个季节中的时间、设置、人员年龄、最喜欢的 项目、购买历史、与输入文本相关联的相关话题、和/或所使用的特定语言,举几个例子。可 W形成交互特定字典408,其对应于运些示例使用参数W及描述交互的上下文的其它使用 参数中的一个或多个。
[0039] 作为示例而非限制,图4B表示对应于特定应用(消息、生产力和运动应用)、特定位 置(家庭、工作)W及特定人(母亲、配偶)的示例交互特定字典。用户进行通信的方式可能 针对运些不同场景中的每一个而改变,并且自适应语言模型128保持追踪针对不同交互的 差异W相应地适配预测。还表示了图4B中的示例字典之间的某种重叠,因为用户可能跨不 同设置而采用一些相同的词语和短语。关于W下示例过程来讨论关于自适应语言模型技术 的运些和其它方面的附加细节。
[0040] 图5描绘了依照一个或多个实现的其中提供文本预测的过程500。在与设备的交 互期间检测文本字符的录入(块502)。例如,文本可W通过屏上键盘、硬件键盘、语音命令、 或者其它输入机制的方式而输入。移动电话或其它计算设备102可W被配置成检测和处理 输入w经由设备在用户接口输出内表示所录入的文本。
[0041] 根据自适应语言模型生成对应于所检测到的文本字符的一个或多个文本预测候 选者(块504),并且采用一个或多个文本预测候选者来促进用于与设备的交互的另外的文 本录入(块506)。可任何合适的方式使用上文和下文描述的各种不同技术来生成预测。 例如,计算设备可W包括被配置成实现如本文描述的自适应语言模型128的文本预测引擎 122。
[0042] 在操作中,自适应语言模型128可W应用于特定文本字符W通过使用和/或组合 一个或多个单独的字典来确定对应预测。自适应语言模型128W可W在不同时间和不同场 景中应用的不同水平的特异性(例如普通人群、用户、交互)来建立语言模型字典的层级,诸 如关于图4B所表示和描述的示例字典。
[0043] 如图4B中所示出的语言模型字典的层级可W通过监视和分析用户键入的词语W 及其中用户采用不同词语和风格的上下文来随时间针对每一个单独的用户进行建立。最 初,设备可W被供给有在收集到关于用户的个人风格的充足数据之前依赖于其进行文本预 测的普通人群字典402。当用户开始W各种方式与设备交互时,文本预测引擎122开始学习 用户的个人风格。因此,可W构建反映用户的实际使用和风格的个性化字典404。另外,与 关于用户的个人风格的数据相关联的使用参数可W用于产生设及由使用参数所限定的特 定交互场景的一个或多个交互
当前第2页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1