用户输入的预测转换的制作方法

文档序号:6567894阅读:175来源:国知局
专利名称:用户输入的预测转换的制作方法
技术领域
本发明一般涉及一种语言或字符集的用户文本输入到另一种语言或字符 集的转换。更特别地,本发明公开了一种系统和方法,用于一种语言或字符 集的用户文本输入到另 一种语言或字符集的预测转换。
背景技术
对于用户来说,使用非目标语言输入装置,例如键盘,把文本直接输入 到计算机系统可能是困难的或者不可能的。例如,使用传统的罗马字符或字
母字符键盘直接输入基于非罗马字的语言(例如中文、日语和韩语(CJK)) 的文本,对于用户来说可能是困难的。取而代之,通常需要独立的转换步骤, 在该步骤中,转换引擎把用户的字母串输入转换成目标语言。作为一个示例, 一种用于输入中文语言文本的普通方法使用表示语音的输入,例如拼音。拼 音使用字母字符并且具有以多音节词的形式列出的词汇表。然后拼音转换器 把以拼音书写的文本转换成中文。例如,用户可以使用键盘上的罗马字母, 输入期望的中文文本输入的拼音语音表示。然后拼音转换引擎可以把拼音输 入转换成中文文本。然后适当的中文文本可以输入到应用中,例如,文字处 理应用和/或搜索引擎。
作为另一个示例,日语文本可以使用各种不同的字符集表达,包括平假 名、片假名和日本汉字,其中没有一个可以使用典型的基于罗马字母的ASCII 键盘容易地输入。输入日语语言文本的一种方法使用罗马字(romaji),日语 的语音罗马字母表示。例如,用户可以使用词处理器,例如来自日本德岛市 JustSystem公司的Ichitaro,把罗马字文本输入转换成片假名、平假名和/或日 本汉字。然后日语文本可以输入到应用中,例如文字处理应用和/或搜索引擎。 商用转换引擎或程序的另一个示例是徵软的用于各种语言的输入法编辑器。
然而,转换程序一般要求用户输入文本输入的完全表示。另外,这样的 转换程序对于用户来说是冗长的,因为一方面的语音罗马表示和另一方面的 本国语或目标语言表示的文本之间常常没有一对一的转换。取而代之,用户输入的大多数罗马表示输入是不明确的。换句话说,对于大多数罗马表示用 户输入来说,存在转换程序可以进行的多于一个的本国语言转换。因而,转 换程序可以在独立的窗口或者下拉列表中例如按照概率的顺序列出多个可能 的转换。然后转换引擎和/或用户可以选择最佳的或正确的转换。显然,这样 的输入法对于用户来说可能常常是冗长和耗费时间的,这至少部分由于不明 确的罗马表示用户输入。
所需要的是一种更有效的和用户友好的方法,以用于使用非目标输入语 言或字符集输入输入文本并且用于把用户输入转换成目标语言或字符集。

发明内容
公开了用于一种语言或字符集的用户文本输入到另 一种语言或字符集的 预测转换的系统和方法。应该理解,本发明可以以许多方式实现,包括过程、 设备、系统、装置、方法或诸如计算机可读存储介质或计算机网络的计算机 可读介质,在所述计算机网络中,程序指令通过光或电通信线路发送。下面 描述本发明的若干发明实施方式。
该方法一般可以包括把以非目标语言或字符集表示的部分用户输入转
换成转换后的以目标预言或字符集表示的部分用户输入;基于有希望的完成 模块(likely completions module)计算转换后的部分用户输入的可能的转换完 成(possible converted completion), 该有希望的完成以目标语言或字符集表 示;以及输出一个或多个可能有希望的可能转换完成。所述转换可以基于非 目标语言或字符集到目标语言或字符集映射的字典。所述有希望的完成模块 可以是用户输入的数据库或其子集,或者可以是通过对用户输入的数据库或 其子集执行统计分析而训练的模型。用户输入的子集可以从那些来自预定地 理位置或时间段的和/或从用户或当前会话的用户输入的子集中选择。该方法 也可以包括从多个有希望的完成模块中选择有希望的完成模块。
在另一种实施方式中,预测转换系统一般包括预测转换引擎,其被配 置成从以非目标语言或字符集表示的部分用户输入生成转换后的以目标语言 或字符集表示的部分用户输入,并且被配置成基于有希望的完成模块和非目 标语言或字符集到目标语言或字符集映射的字典,计算转换后的以目标语言 或字符集表示的部分用户输入的有希望的可能完成。所述字典帮助预测转换 引擎把以非目标语言或字符集表示的部分用户输入转换成转换后的以目标语
言或字符集表示的部分用户输入。
在另 一种实施方式中,用于结合计算机系统使用的计算机程序产品包括 计算机可读存储介质,在该计算机可读存储介质上保存了计算机处理器上可 执行的指令,该指令一般包括接收部分用户输入,该部分用户输入以非目
标语言或字符集表示;把部分用户输入转换成目标语言或字符集,以生成转 换后的部分用户输入;基于有希望的完成模块计算转换后的部分用户输入的 至少一个有希望的可能完成,该可能的完成以目标语言或字符集表示;输出 至少一种可能有希望的可能转换完成。
本发明的这些以及其它特征和优势将在下面通过本发明示例原理的方式 阐明的详细i兌明和附图中更详细地呈现。


通过下面结合附图的详细说明,本发明将易于理解,附图中相似的参考
数字指示相似的结构元件。
图1为说明性的信息检索系统的框图,在该信息检索系统中可以实现预
测用户输入转换系统。
图2为用于实现示例的预测用户输入转换系统的说明性的计算系统或装
置(例如图1所示的客户端或服务器)的框图。
图3为框图,更详细阐明了示例的预测用户输入转换系统。
图4为流程图,阐明了执行预测用户输入转换的示例过程。
图5为流程图,阐明了为预测用户输入转换器训练有希望的完成模块的
示例过程。
具体实施例方式
公开了用于一种语言或字符集的用户文本输入到另一种语言或字符集的 预测转换的系统和方法。预测转换一般指用户文本输入的预测完成和从输入 非目标语言或字符集到目标语言或字符集的转换。例如,以输入非目标语言 或字符集表示的用户输入A可以被转换成以目标语言或字符集表示的X并被 预测完成为XYZ。可替换地,以输入非目标语言或字符集表示的用户输入A 可以被预测完成为ABC并被转换成以目标语言或字符集表示的XYZ。下面 的说明使得任何本领域技术人员都能够实施和使用本发明。特定实施方式和
应用的说明仅作为示例提供,各种修改对于本领域技术人员来说将很显然。 这里定义的 一般原理可以应用到其它实施方式和应用,而不背离本发明的精 神和范围。因而,本发明将具有最宽的范围,包含与这里公开的原理和特4正 一致的许多替换、修改和等效。为了清晰的目的,与本发明相关技术领域中 已知技术资料相关的细节没有详细描述,以避免不必要地模糊本发明。
用于一种语言或形式的用户输入到另 一种语言或形式的预测转换的系统 和方法使得用户易于使用非目标语言输入方法或诸如键盘的装置把文本输入 到计算机系统中。例如,可以采用预测用户输入转换系统和方法使得用户易 于使用传统的罗马字符或字母字符键盘输入以诸如中文、日语和韩语(CJK) 的基于非罗马字的语言表示的文本。用户可以以第一语言或字符集(例如, 诸如拼音或罗马字的语音输入)输入部分输入(例如词或字符的部分表示), 预测用户输入转换系统可以将其预测转换成目标语言或字符集(例如中文字 符或片假名、平假名和/或日本汉字),并向用户呈现一个或更多预测的建议 转换。如这里提供的说明性示例中所描迷的,预测转换系统和方法可以在信 息检索系统或搜索引擎中实现,以把用户的字母串搜索输入预测转换成目标 语言。例如,然后可以使用预测转换的用户输入来执行相关文档的搜索。然 而,应该理解,预测转换系统和方法可以在各种其它合适的应用中实现,例 如文字处理应用或要求文本输入的其它应用。
图1为说明性信息检索系统IOO的框图,在该信息检索系统100中,可 以实现预测用户输入转换系统。系统100可以包括经由网络106连接到多个 服务器104、 105的多个客户端装置102。客户端装置102可以包括浏览器110, 用于接受用户输入,以及用于显示通过网络106从其它系统102、 104、 105 接收到的信息。服务器104、 105可以包括搜索引擎112,用于接受通过网络 106传送的用户查询,搜索文档数据库和返回结果给用户。网络106可以包 括局域网(LAN)、广域网(WAN)、虛拟专用网(VPN)、电话网,例如公 共交换电话网(PSTN)、内联网、互联网或网络组合。仅为了说明,图1所 示的信息检索系统100包括经由网络106连接的三台客户端装置102和两台 服务器104、 105。然而,应该理解,实际上可以有更多或更少的客户端装置、 服务器和/或网络,并且一些客户端装置也可以至少执行服务器的一些功能, 一些服务器也可以至少执行客户端的一些功能。
图2为用于实现预测用户输入转换系统的说明性的计算系统或装置200的框图,例如图1所示的客户端102或服务器104、 105。在一种实施方式中, 系统200包括计算装置,例如个人计算机、便携式计算机、大型机、个人数 字助理、蜂窝式电话等。系统200可以典型地包括处理器202、存储器204、 用户接口 206、用于接受移动存储介质208的输入/输出端口 207、网络接口 210和用于连接上述元件的总线212。
系统200的操作可以典型地由在保存在存储器204中的程序指导下工作 的处理器202控制。存储器204 —般包括计算机可读介质的某种组合,所述 计算机可读介质例如高速随机访问存储器(RAM)和诸如只读存储器(ROM)、 磁盘、磁盘阵列和/或磁带阵列的非易失性存储器。输入/输出端口 207可以包 括磁盘驱动器或存储器槽,用于接受计算机可读介质,例如软盘、CD-ROM、 DVD、存储卡、磁带等。例如,用户接口 206可以包括键盘、鼠标、笔、或 用于输入信息的语音识别机构、以及一种或更多用于向用户呈现信息的诸如 显示器、打印机、扬声器等的机构。网络接口 210典型地可提供系统200和 其它系统(和/或网络220)之间经由有线、无线、光的连接,和/或其它连接。
如下面更详细描述的,系统200可以配置成执行用户文本输入从一种语 言或字符集到另 一种语言或字符集的预测转换。这些操作可以典型地响应于 处理器202执行包含在计算机可读介质(例如存储器204)上的软件指令来 执行。软件指令可以经由通信接口 210或I/O端口 207从诸如数据存储装置 208的另外的计算机可读介质、或者从另外的装置读入到存储器204中。如 图2所示,存储器204可以包括各种程序或模块,以用于控制系统200的操 作和执行预测转换以及下面更详细描述的可选的搜索和检索技术。例如,存 储器204可以包括预测用户输入转换应用229、用户输入数据库230和源(非 目标输入)i吾言到目标语言映射的字典231。源语言到目标语言映射的字典 231使得预测转换应用229易于把以非目标语言或字符集表示的部分用户输 入转换成目标语言或字符集。
例如,如果系统200为用于搜索引擎的服务器,诸如图l所示的服务器 105,则存储器204可以进一步包括文档数据库和相应的索引232。文档数据 库232可以是网页文集,用户输入数据库230可以是查询日志。存储器204 也可以包括查询搜索引擎233,用于基于经由用户接口 206接收到的查询和/ 或通过网络220从用户远程接收到的查询^t臾索文档数据库232。如图2所示, 存储器204也可以包括 一种或更多程序,用于使用下面更详细描述的技术
预测转换用户查询输入;以及用户接口应用234,用于操作用户接口 206和/ 或用于通过网络220向远程用户提供网页。尽管图2阐明了一种主要基于软 件的系统,但应该理解,在其它实施方式中,专用电路可以取代或结合软件 指令来实现与本发明一致的过程。因而,本发明不局限于硬件和软件的任何 特定组合。
应该理解,本发明的系统和方法可以利用缺少图l和2所示的某些元件 和/或具有其它未显示的元件的装置和/或体系结构来实践。因而,应该理解, 图1和2为了说明目的而提供的,不会限制本发明的范围。例如,应该理解, 为了说明的目的,系统200被描述为单个的通用计算装置,例如个人计算机 或网络服务器,而在其它实施方式中,系统200可以包括使用分布式计算技 术一起工作的一个或更多这样的系统。在这样的实施方式中,图2中描述的 一些或所有组件功能可以散布在位于多个位置的多个系统中,和/或通过多个 参与者来操作。例如,预测用户输入转换应用229及其相关元件,包括用户 输入数据库230和源(输入)语言到目标语言映射的字典231,可以在独立 于文档数据库232所在系统的系统上实现。在 一 些实施方式中,预测查询转 换应用231可以在客户端而不是服务器上执行。显然,可以对图1和2所示 的说明做许多类似的变更,而不背离本发明的原理。
如先前指出的,图1和2所示的系统可以用来便利部分用户输入的预测 转换。图3为阐明预测用户输入转换系统250的框图。如所示,预测用户输 入转换系统250包括预测用户输入转换引擎229,其与源(非目标)语言到 目标语言映射的字典231和用户输入数据库230通信。预测用户输入转换引 擎229可以包括用于有希望的完成的模块235。在一些实现中,用于有希望 的完成的模块235可以是用户输入的数据库或其子集。作为另一个示例,该 模块可以是使用例如用户输入数据库230 (例如,查询日志)或其子集训练 的模型。有希望的完成模块235才是供以目标语言或字符集表示的有希望的完 成的输入串及其相应的扭克率。
图4为流程图,阐明用于执行预测用户输入转换的过程260。过程260 可以为给定会话中的系列用户输入重复,例如,为以目标语言或字符集表示 中的各字符、词或短语。在块262,接收以非目标语言或字符集表示的至少 部分用户输入,例如前缀。如4是到过的,部分用户输入以第一非目标语言或 字符集表示,例如罗马字符或字母字符,它不同于目标语言或字符集,例如中文字符。然后,在块264和266,预测转换引擎可以尝试使用部分用户输 入执行预测换。特别地,在块264,以第一非目标语言或字符集表示的部分 用户输入被用来生成以目标语言或字符集表示的可能的转换。例如,第一非 目标语言或字符集到目标语言或字符集映射的字典可以在执行块264时使 用。在块266,生成部分用户输入的可能转换的可能完成。注意,在块266, 预测转换引擎一般还基于预测转换的概率对完成的预测进行排序。该概率可 以基于用户输入的数据库(例如查询日志)来确定,如下面将更详细描迷的 那样。特别地,有希望的完成模块可以在执行块266时使用。
在所示的示例中,过程首先在块264生成部分用户输入到目标语言或字 符集的可能转换,然后在块266生成转换后的部分用户输入的可能完成。应 该理解,块266可以在块264之前执行。具〗本来i兌,过程260可以在块266 生成以非目标语言或字符集表示的部分用户输入的可能完成,并且在块264 把可能完成转换成目标语言或字符集。作为另一个示例,块264和266可以 结合为单个集成的预测转换过程。具体来说,过程260可以利用集成的预测 转换数据结构或数据库,该数据库包含以非目标语言或字符集表示的部分用 户输入到以目标语言或字符集表示的预测转换的映射。该数据库也可以包含 映射的频率或者其它统计或概率信息。在这样的配置中,非目标语言或字符 集到目标语言或字符集映射的字典应当被集成到预测转换数据库中。
可以利用一个或更多参数来影响块264和266 (或上文所述的它们的变 更)的操作。例如, 一个参数可以指示优选较长或较短的预测完成。各参数 可以通过系统或过程来自动设置,设置成默认值,和/或由用户来设置。
注意,在一些实施方式中,随着用户输入输入,预测转换引擎可以交互 地监控块262中部分用户输入的长度,以便当用户已输入足以生成一个或更 多预测转换的部分输入时,预测转换引擎可以执行预测转换。例如,当用户 输入为拼音时,在预测转换引擎生成预测转换之前用户可以输入至少一 个中 文字符的拼音。例如,用户输入何时足以生成有意义和/或有用的预测转换的 确定可以基于具体的用户输入以及部分用户输入的可能转换的概率和/或可 能转换的可能完成的概率。
接下来,在块268,将以目标语言或字符集表示的一个或更多预测转换 输出给用户。在一种实施方式中,基于预测转换概率的一组最高N个(例如, 5个)预测转换被输出给用户。在另一种实施方式中,仅将具有最高概率的预测转换输出给用户。输出给用户的预测转换的个数可以基于预测转换的概 率动态地确定。例如,预测转换引擎可以被配置成,例如如果最有希望的的 预测转换的概率大于预定的阈值和/或大于预定的多个其次有希望的的预测 转换,则只输出最有希望的的预测转换。在决定块270,如果用户选择了输 出给用户的预测转换中的 一个,则可以采用被选择的预测转换作为用户想要 的转换,并且用于预测用户输入转换的过程260完成。然而,如果用户没有从块268中输出的预测转换中做出选择,如在决定块270所确定的那样,则 过程260在块272继续接收进一步的用户输入,以便预测用户输入转换引擎 可以使用额外的用户输入来执行预测转换。然后过程260返回到块264,以 使用额外的用户输入来执行预测转换。
如上文提到的,预测转换的概率可以由预测转换引擎使用有希望的完成 模块来计算。在一些实施方式中,用于有希望的完成的模块可以手动生成或 以其它方式预先确定。更典型地,有希望的完成模块可以是使用用户输入和 相应完成转换的数据库训练的有希望的完成模型。用于有希望的完成的数据 库可以被定制,以适合于应用和/或用户。例如,对于输入文本到搜索引擎的 用户,预测转换的概率可以4吏用所有用户的查询日志、或者在相同或相似地 理位置和/或相同或相似时间段的用户的查询日志来计算。作为另 一个示例, 预测转换引擎可以通过只使用用户自己的输入或搜索(例如,用户的当前搜 索会话或用户过去的搜索会话)来个人化。
图5为流程图,阐明了生成用于预测用户输入转换器的有希望的完成的 模块的示例过程280。在块282,可以维护以目标语言或字符集表示的用户输 入的日志,以建立用户输入数据库。如提到过的,用户输入数据库可以是与 搜索引擎相关联的查询或搜索日志。数据库帮助确定预测完成转换的可能性。 在块284,用户数据库或其子集可以用来生成有希望的完成模块。具体来说, 可以选择用户数据库的子集,以生成具有特定特性的模块,例如,定制适合 于应用和/或用户的模块。例如,可以基于从特定时间段、从特定地理位置的 用户、从相同用户、从特定会话中的相同用户和/或各种其它适合的标准收集 的输入来选择用户数据库的子集。在块286,通过对在块284中选择的数据 库或其子集执行统计分析来生成有希望的输入串和有希望的完成(例如,搜 索)的模块。用于训练有希望的完成模块的过程可以随着数据库的更新而周 期性地执行,和/或可以被重复以生成各种模块,从而定制适合于应用和/或用户的每个模型。
如提到过的,预测转换引擎可以被集成到搜索引擎中。该集成可以以各 种方式实现。例如,预测转换引擎可以实现为搜索引擎服务器的一部分,以 便用户仅仅输入例如以罗马字表示的前缀或其它部分查询,然后服务器将部 分查询转换成目标语言或字符集,并生成转换的一个或更多有希望的完成(或 者,如上文提到过的,生成部分查询的有希望的完成并把有希望的完成转换 成目标语言或字符集)。然后服务器可以返回最有希望的完成转换的列表,例 如,5或10个最有希望的的完成转换的列表,用户可以从中进行选择,以执 行搜索。可替换地或额外地,服务器可以基于最有希望的完成转换来执行搜 索并返回搜索结果给用户。
除了在服务器侧才是供预测转换51擎之外,预测转换引擎可以类似地在客 户端侧实现,诸如在用户的客户端程序中,例如,在诸如网页浏览器的接口 应用的工具栏中实现。在这样的配置中,用户可以开始输入部分输入(例如 以罗马字母表示的查询),客户端侧预测转换引擎可以监控用户的输入,并且 在用户提供了足够的信息量时,预测性地计算一个或更多可能的完成转换。 可替换地,用户可以输入输入,或手动地或以其它方式使得预测转换引擎预 测性地计算一个或更多可能的完成转换。例如,输出可以以弹出窗口或下拉 列表来提供,用户可以从中选择一个可能的完成转换。
显然,不管是安装在服务器侧还是客户端侧,预测转换引擎或系统都通 过允许用户只输入以非目标语言表示的期望输入的部分表示来便利用户输 入。换句话说,用户只需要输入以非目标语言表示的起始序列、前缀或期望 输入的其它部分表示,预测转换系统就执行到目标语言的转换以及对转换后
的部分输入的预测完成。
尽管这里描述和阐明了本发明的示例实施方式,但是应该理解,它们只 是说明性的,可以对这些实施方式进行修改而不背离本发明的精神和范围。 因而,本发明的范围仅根据下列可以修正的权利要求来定义,各权利要求作 为本发明的实施方式被明确地并入到了本说明书中。
权利要求
1、一种方法,用于预测地转换部分用户输入,包括从用户接收部分用户输入,该部分用户输入以非目标语言或字符集表示;基于有希望的完成模块执行部分用户输入的预测转换,以生成部分用户输入的至少一个可能的转换完成,该至少一个可能的转换完成以目标语言或字符集表示;和输出所述至少一个可能的转换完成中的一个或多个。
2、 权利要求l中的方法,其中所述执行的步骤包括 把所述部分用户输入转换成目标语言或字符集,以生成转换后的部分用户输入;和基于所述有希望的完成模块,计算转换后的部分用户输入的至少一个可 能的转换完成。
3、 权利要求l中的方法,其中所述执行包括基于所述有希望的完成模块,计算以非目标语言或字符集表示的至少一 个可能的部分用户输入完成,该有希望的完成模块以非目标语言或字符集表 示;和把所述至少一个可能的部分用户输入完成转换成目标语言或字符集,以 生成至少一个可能的转换完成。
4、 权利要求l中的方法,其中,所述执行还基于非目标语言或字符集到 目标语言或字符集映射的字典。
5、 权利要求l中的方法,还包括基于用户输入的数据库训练所述有希望的完成模块。
6、 权利要求5中的方法,其中,所述数据库中的用户输入以目标语言或 字符集和非目标语言或字符集之一表示。
7、 权利要求5中的方法,其中,所述训练包括对所述数据库中的至少一部分用户输入执行统计分析,以确定部分用户输入的有希望的完成。
8、 权利要求5中的方法,其中,所述训练基于所述数据库中用户输入的 子集,该用户输入子集与至少下列之一相关联地理位置、时间段和从其接 收部分输入的用户。
9、 权利要求l中的方法,还包括从多个有希望的完成模块中选择有希望的完成模块。
10、 权利要求l中的方法,其中,所述部分用户输入为对搜索引擎的部 分用户查询。
11、 权利要求l中的方法,还包括基于可能的转换完成的概率,选择可能的转换完成的子集,所述输出为 输出该可能的转换完成的子集。
12、 一种预测转换系统,包括预测转换引擎,其被配置成基于有希望的完成模块执行以非目标语言或 字符集表示的部分用户输入的预测转换,以生成部分用户输入的至少一个可 能的转换完成,该至少一个可能的转换完成以目标语言或字符集表示;和非目标语言或字符集到目标语言或字符集映射的字典,以帮助预测转换 引擎从非目标语言或字符集到目标语言或字符集的转换。
13、 权利要求12中的系统,其中,所述预测转换引擎还被配置成基于所 述字典生成从以非目标语言或字符集表示的部分用户输入转换来的以目标语 言或字符集表示的部分用户输入。
14、 权利要求12中的系统,其中,所述预测转换引擎还被配置成基于所述有希望的完成模块,计算以非目标语言或字符集表示的至少一个可能的部 分用户输入完成,该有希望的完成模块以非目标语言或字符集表示,并且所 述预测转换引擎被配置成基于字典将该至少一个可能的部分用户输入完成转 换成目标语言或字符集,以生成至少一个可能的转换完成。
15、 权利要求12中的系统,还包括训练引擎,其被配置成基于用户输入的数据库训练所述有希望的完成模块。
16、 权利要求15中的系统,其中,所述数据库中的用户输入以目标语言或字符集和非目标语言或字符集之一表示。
17、 权利要求15中的系统,其中,所述训练引擎还被配置成对所述数据 库中的 一部分用户输入执行统计分析,以确定该部分用户输入的有希望的完成。
18、 权利要求15中的系统,其中,所述训练引擎还被配置成基于所述数 据库中的用户输入的子集训练所述有希望的完成模块,该用户输入的子集与地理位置、时间段和用户中的一个或多个相关联。
19、 权利要求12中的系统,其中,所迷预测转换引擎还被配置成从多个有希望的完成模块中选择有希望的完成模块。
20、 权利要求12中的系统,其中,所述部分用户输入为对搜索引擎的部 分用户查询。
21、 权利要求12中的系统,其中,所述预测转换引擎还被配置成基于可 能的转换完成的概率选择可能的转换完成的子集作为输出。
22、 一种计算机程序产品,用于与计算机系统结合使用,该计算机程序 产品包括在其上保存了在计算机处理器上可执行的指令的计算机可读存储介 质,所述指令包括-接收部分用户输入,该部分用户输入以非目标i吾言或字符集表示; 基于有希望的完成模块执行所述部分用户输入的预测转换,以生成部分 用户输入的至少一个可能的转换完成,该至少一个可能的转换完成以目标语言或字符集表示;和输出所述至少一个可能的转换完成中的一个或多个。
23、 权利要求22中的计算机程序产品,其中,所述执行包括将所述部分 用户输入转换成目标语言或字符集,以生成转换后的部分用户输入,以及基 于所述有希望的完成模块计算转换后的部分用户输入的至少一个可能的转换 完成。
24、 权利要求22中的计算机程序产品,其中所迷执行包括基于所述有 希望的完成模块计算以非目标语言或字符集表示的至少一个可能的部分用户 输入完成,该有希望的完成模块以非目标语言或字符集表示;和把所述至少 一个可能的部分用户收入完成转换成目标语言或字符集,以生成至少一个可 能的转换完成。
25、 权利要求22中的计算机程序产品,其中所迷执行还基于非目标语言或字符集到目标语言或字符集映射的字典。
26、 权利要求22中的计算机程序产品,所述指令还包括 基于用户输入的数据库训练所述有希望的完成模块。
27、 权利要求26中的计算机程序产品,其中,所述数据库中的用户输入 以目标语言或字符集和非目标语言或字符集之一表示。
28、 权利要求26中的计算机程序产品,其中,所述训练包括对所述数据 库中的至少 一部分用户输入执行统计分析,以确定转换后的部分用户输入的有希望的完成。
29、 权利要求26中的计算机程序产品,其中,所述训练基于所述数据库 中的用户输入的子集,该用户输入的子集与至少下列之一相关联地理位置、 时间段和从其接收所述部分用户输入的用户。
30、 权利要求22中的计算机程序产品,所述指令还包括 从多个有希望的完成模块种选择所述有希望的选择模块。
31、 权利要求22中的计算机程序产品,其中,所述部分用户输入是对搜 索引擎的部分用户查询。
32、 权利要求22中的计算机程序产品,所述指令还包括 基于可能的转换完成的概率选择可能的转换完成的子集,所迷输出为输出该可能的转换完成的子集。
全文摘要
公开了用于一种语言或字符集的用户文本输入到另一种语言或字符集的预测转换的系统和方法。该方法一般可以包括把以非目标语言或字符集表示的部分用户输入转换成以目标语言或字符集表示的转换后的部分用户输入,以及基于有希望的完成模块计算转换后的部分用户输入的有希望的可能转换完成。该转换可以基于非目标语言或字符集到目标语言或字符集映射的字典。所述有希望的完成模块可以是数据库或通过对用户输入的数据库或其子集执行统计分析而训练的模型。用户输入的子集可以从那些来自特定地理位置或时间段的和/或从用户或用户的当前会话的用户输入的子集中选择。
文档编号G06F17/22GK101203849SQ200680022567
公开日2008年6月18日 申请日期2006年3月22日 优先权日2005年4月21日
发明者亚历山大·M·弗朗兹 申请人:谷歌股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1