用于文本预测的绘文字的制作方法_3

文档序号:9916514阅读:来源:国知局
例词典之间的一些重叠,因为用户可能跨不同的设置采用相同的单词、短语、以及绘文字中的一些。
[0054]在一个实现中,不同语言(例如,英语、德语、西班牙语、法语等)的词典可被维护并且语言模型128可在每一种语言的基础上被应用来生成和提供包括绘文字的候选。不同语言的词典可被布置成包含每一种语言的基础上的单词和绘文字两者的概率/评分数据。绘文字使用可因此针对每一种语言来追踪并且绘文字预测可基于当前活动的语言而改变。不同语言的词典可被配置成基于所收集的使用数据(例如,针对每一种语言的全体人群词典)以及因用户而异的适配和因交互而异的使用(例如,针对各个用户的因语言而异的使用)逐语言地反映绘文字到单词和短语的映射。
[0055]在其中用户可在不同语言之间切换和/或可在单条消息中使用多种语言的多语言输入场景中,包括绘文字的预测可通过组合由针对不同语言的两个或更多个词典所反映的概率/评分数据来生成。在多语言场景中,包括针对输入的文本字符所预测的单词和绘文字的预测候选的列表可通过应用此处所描述的内插技术分别针对每一种语言生成。随后,可采用第二内插来将来自每一个因语言而异的列表的单个概率组合成公共列表。以此方式,被呈现给用户或以其它方式用于促进文本输入的单词和绘文字的预测可通过内插来自用户所使用的不同语言的多个词典的概率(或以其它方式组合评分数据)来反映多种语言。
[0056]如所提到的,绘文字可在语言模型128内被作为单词来对待。词典可因此反映绘文字使用的条件概率和/或其它评分数据,这些条件概率和/或其它评分数据可被用于将绘文字与单词一起逐一排名。对于给定输入场景,语言模型128推导根据相关性排序的最高排名的绘文字和单词。最高排名的绘文字和单词可经由如此处所描述的适合的用户界面一起呈现。所采用的条件概率和评分数据可通过收集、分析、以及审阅一群用户的共同的键入活动的单词和绘文字使用数据(包括指示与单词或消息混合的绘文字使用的使用数据)来生成和调整。随着越来越多的指示实际使用的数据被收集,条件概率和评分数据可被相应调整以反映实际使用和产生更准确的预测。模型可通过考虑如此处所描述的因用户而异和因交互而异的使用来进一步调整。对于语言模型128模型的调整可跨不同词典和/或在单个语言的基础上进行。
[0057]关于这些和其它方面的更多细节结合以下示例过程和细节来讨论。
[0058]用于文本预测的绘文字的细节
[0059]这一章节结合图5、6、和11的示例过程以及图7 —10的中所解说的示例用户界面和场景描述了用于包括绘文字的预测的技术。在以下讨论的各部分中,可对结合图1一4描述的示例操作环境、组件、语言模型、以及示例做出参考。可以使用硬件、固件或软件或其组合来实现以下描述的每一个过程的各方面。过程被示为一组框,它们指定由一个或多个设备执行的操作,不一定仅限于所示出的用于由相应的框执行操作的顺序。在至少一些实现中,各过程可由经适当配置的计算设备执行,诸如图1的示例计算设备102,它包括或利用文本预测引擎122或类似功能。
[0060]图5描绘了根据一个或多个实现的其中提供预测的过程500。在与设备交互期间检测字符输入(框502)。例如,字符可通过屏幕上键盘、硬件键盘、语音命令、或其它输入机制来输入。移动电话或其它计算设备102可被配置成检测和处理用于表示在经由设备输出的用户界面内输入的字符。
[0061]根据自适应语言模型生成对应于检测到的字符的包括一个或多个预测的绘文字的一个或多个预测候选(框504)并且采用一个或多个预测候选来促进进一步字符输入以供与设备的交互(框506)。可使用此处以上和以下描述的各种不同技术以任何适合的方式生成预测。例如,计算设备可包括被配置成实现如此处所描述的支持绘文字的语言模型128的文本预测引擎122。
[0062]在操作中,语言模型128可被应用于包括单词和绘文字的特定的输入字符以通过使用和/或组合一个或多个单个词典来确定对应的预测。语言模型128可建立不同详细程度的分层次的语言模型词典(例如,普通人群、用户、交互),这些分层次的语言模型词典可被应用于不同时间和不同场景,诸如结合图4B呈现和描述的示例词典。替代地,单个词典可被用于多个不同场景。
[0063]如图4B中所示的分层次的语言模型词典可随时间通过监视和分析用户键入的单词和绘文字以及不同单词、绘文字、以及风格被用户使用于的上下文来针对每一个个体用户创建。最初,设备可被提供普通人群词典402,在关于用户的个人风格的足够数据被收集之前,依赖于该普通人群词典402来进行文本预测。当用户开始以各种方式与设备交互时,文本预测引擎122开始学习用户的个人风格。因此,反映用户的实际使用和风格的因用户而异的词典404可被构建。进一步,与关于用户的个人风格的数据相关联的使用参数可被用于产生一个或多个因交互而异的词典406,因交互而异的词典406与由使用参数所定义的特定交互场景有关。随着越来越多的关于用户的个人风格的数据变得可用,分层次的语言模型词典可变得越来越针对和定制于该户的风格。分层次的语言模型词典中的一个或多个词典可被应用以产生针对与设备的后续交互的文本预测。
[0064]为了推导预测,语言模型128被配置成针对不同交互场景选择性地使用层次中的各词典的不同组合以标识基于输入文本的候选并且对各个候选逐一排名。一般来说,用于对候选进行排名的评分或值可以指定方式通过数学地组合来自与给定交互场景相关联的各个词典的贡献来计算。来自多个词典的贡献可以各种方式来组合。在一个或多个实施例中,语言模型128被配置成使用计算与包含在多个词典中的单词相关联的评分数据的加权组合的排名或评分算法。
[0065]相应地,绘文字可以各种方式与文本预测和自动纠正合并在一起。在一个示例中,绘文字可经由映射表或其它合适的数据结构直接与单词相关。因此,当用户键入单词并且(基于映射表)与单词/短语直接相关的对应的绘文字可用时,该绘文字可被提供作为预测。例如,如果用户键入“love”,则可提供爱心绘文字作为用于替代love或插入在love后的候选。也可在每次对应单词被作为预测提供时显示绘文字。如以下提到的,如果单词仍然被形成并且绘文字预测被敲击,则被选择的绘文字可替换该单词。
[0066]另外,对于部分键入的单词和/或下一“单词”的预测的绘文字可基于在前输入来确定并作为候选提供。在这种情况下,用户可输入单词、部分单词、短语、或部分短语,而一个或多个绘文字可基于该输入根据此处所描述的语言模型来预测。例如,在键入“Meet mefor a”之后,文本输入模型可确定单词“beer”或“coffee”作为该短语的预测。在这种情况下,预测条或其它用户界面元素可被配置成展示文本“beer”和“coffee”以及对应于beer(啤酒)和coffee(咖啡)的绘文字。用户可随后选择文本或绘文字以插入该选择。在一种方法中,对应于预测的单词的绘文字可被紧跟该预测的单词显示在预测候选列表中。
[0067]如所提到的,绘文字的因用户而异的使用还可随时间被学习并可以与可被添加到用户的个人词汇的单词相同的方式被添加到因用户而异的词典。例如,如果用户频繁地使用特定短语和绘文字的组合,诸如“Crazy,Crazy”后面是惊吓的脸的绘文字,则这一组合可被添加到该用户的因用户而异的词典。随后,如果用户键入或部分键入“Crazy,Crazy”,则系统可自动提供该受惊吓的脸作为下一单词预测。
[0068]另外,可响应于与绘文字相关的被选择的单词或短语进行的用户交互来根据需要将绘文字展示为候选。这可发生在预测场景以及整个用户体验中。例如,当用户敲击映射到绘文字的单词(或以其它方式以用于选择该单词的制定方式与该单词交互)时,对应的绘文字可被展示作为该单词的替代候选。在一种方法中,用户可通过重复敲击在单词和绘文字之间来回切换。此外,如果用户敲击绘文字,他们可被提供等同的单词。如果不止一个绘文字被映射到一个单词并且用户敲击该绘文字,则其它绘文字可在基于排名的有序列表中被提供作为替代候选。多个绘文字可被同时展示或响应于连续敲击逐一展示。以下描述用于生成和使用包括绘文字的预测候选的各技术的进一步示例和细节。
[0069]图6描绘了根据一个或多个实现的其中包括绘文字的预测被生成并经由用户界面呈现的过程600。为文本输入场景生成包括单词候选和绘文字候选的预测候选(框602)。这可用任何适当的方式来发生。在一种方法中,如之前描述的,根据使用参数来定义交互场景。文本预测引擎122可被配置成基于使用参数将当前交互识别为与定义的交互场景匹配。为此,文本预测引擎122可通过查询应用、与操作系统交互、解析消息内容或文档内容、检查元数据等来收集或以其它方式获得关于当前交互的上下文信息。文本预测引擎122可基于收集的信息创建针对交互的一个或多个使用参数。随后,文本预测引擎122可采用语言模型128来标识要用于与所创建的使用参数相匹配的交互场景的一个或多个词典。
[0070]具体来说,使用来自语言模型128的概率来计算该交互场景的一个或多个预测。例如,语言模型词典可包含指示单词和绘文字使用的条件概率的评分数据。条件概率可基于η元单词模型,该η元单词模型为可被用于为预测的序列中的“η”个单词计算概率。例如,可实现三元(η = 3)或二元(η = 2)单词模型,当然还设想了具有更高阶数(η = 4,5,...,χ)的模型。如所提到的,绘文字可在模型内被作为单词对待,并且相应地,可被构建到η元单词模型的条件概率中。排名分数可反映来自语言模型128所提供的各个词典中的任意两个或更多个的概率和/或其它适当的评分数据的组合。包括单词和绘文字的候选可基于从语言模型128推导的评分来逐一排名。
[0071]如所提到的,构想了各个不同和对应的因交互而异的词典。每个交互场景可与指示交互的上下文特征的一个或多个使用参数有关。交互场景一般根据用户的键入风格和行为可能发生变化的上下文特征来定义。此处所描述的语言模型技术底层的一个概念是用户键入不同单词并且键入风格在不同场景中发生变化。因此,不同词典可与不同交互场景相关联并且可连同不同交互场景来使用。
[0072]作为示例而非限制。不同交互场景可与以下相关:正被使用的应用或应用类型(例如,应用类别)、用户与其交互的个人或联系人、设备的地理位置(例如,城市、州、国家)和/或设置(例如,办公室、家、或学校)、根据主题关键词创建的主题(例如,超级碗、夏威夷、疯狂三月等)、基于时间的参数(例如,一天中的时间(日间/夜间)、一年中的时间(春、夏、秋、冬)、月份、假期)、不同语言(例如,英语、西班牙语、日语等)和/或以上描述的示
当前第3页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1