用于自动预测性选择网络浏览器的输入法的方法和装置的制作方法

文档序号:7914009阅读:239来源:国知局
专利名称:用于自动预测性选择网络浏览器的输入法的方法和装置的制作方法
用于自动预测性选择网络浏览器的输入法的方法和装置
背景技术
输入法是一种允许用户输入不在他们的其它输入设备(例如键盘)上直接表示的字符、符号或词的机制。输入法通常用于从标准QWERTY键盘输入非拉丁字符,例如中文、日文、韩文或者印度语文字。输入法还用于在较小的输入设备(例如移动电话小键盘)上输入拉丁字母字符。当较小的输入设备或键盘用于移动电话和数字助理时,输入法也同样用于基于拉丁语的语言。通过操作系统部件或程序来启用输入法。当在多语言环境下操作时,网络浏览器应该支持多种输入法。这允许输入来自不同书写文字的字符。当在多于一种语言的环境中可能使用单一文字(例如拉丁字母)时, 这可能是困难的。对于浏览器而言将用户的本国输入法或者可能最近使用的输入法设置为默认值, 是当前通常的做法。然后用户可以手动选择另外的输入法。选择新的输入法可能要求选择任意组合的文字、语言和/或地区。虽然手动选择对于以一种文字或语言使用网络应用的用户而言是足够的,但是这对于真正的多语言用户和应用而言就变得不方便。这对于移动设备而言特别如此,其中这些移动设备的小键盘倾向于要求需要多次按键来改变输入法。这些额外的按键大大地影响了可用性。预测性打字选择作为文本输入的加速手段已经变得广为流行,特别是在手机业内。通过检查前几次按键或者输入的字符、可能以及包括最近输入的词和先前选择的记忆的上下文,预测性打字选择可以向用户提供可能的完成的列表,以从中进行选择。然而,为了应用适当的预测性文本算法,输入的文字和语言必须是已知的。除了上面指出的不足以夕卜,手动选择输入法的改变所需要的额外输入消耗掉了预测性打字加速的益处。

发明内容
下面给出对一个或多个方面的简要概述,以提供对这些方面的基本理解。该概述不是对全部预期方面的泛泛概括,也不旨在标识全部方面的关键或重要元素或者描述任意或全部方面的范围。其目的仅在于作为后文所提供的更详细描述的序言,以简化形式提供一个或多个方面的一些构思。各个方面包括通过自动地、预测性地选择正确的输入法而不要求用户进行另外的选择,针对多语言应用来增强网络浏览器输入法的可用性。各个方面包括一种用于在网络浏览器处预测性地选择输入法的方法,所述方法包括分析网页的至少一个上下文因素;基于对所述网页的所述至少一个上下文因素的分析来自动地、预测性地选择多种输入法中的一种输入法;接收用户输入;以及根据所选择的输入法来显示所述用户输入。对所述至少一个因素的分析可以包括检查用于所述网页的文本编码方法,检查所述网页上的词以根据所述词来确定语言,检查嵌入在所述网页中的元信息,检查所述网页的统一资源定位符(URL)或统一资源标识符(URI)。所述网页可以包括通用字符编码,并且对所述至少一个因素的分析可以包括检查所述网页的代码点的数值分布以确定所述代码点所聚集的范围。如果所述分析包括检查网页上的词以确定所述词的语言,则所述分析可以包括 确定所述网页上表示的语言的频率分布以及将权重应用到所表示的语言。检查嵌入在所述网页中的元信息还可以包括确定所述元信息是否包括语言标记。URI或URL可以包括国际化域名,并且所述分析还可以包括检查所述URI或URL中的代码点的分布以确定所述代码点所聚集的范围。各种分析可以相互任意组合进行使用,并且可以给不同因素的分析结果赋予权重。各个方面还可以包括基于所选择的输入法来应用预测性打字。其它方面包括一种计算机程序产品,包括计算机可读介质,其具有用于使计算机接收网页的第一输入的代码;用于使所述计算机分析所述网页的至少一个上下文因素的代码;用于使所述计算机基于对所述网页的所述至少一个上下文因素的分析来自动地、预测性地选择多种输入法中的一种输入法的代码;用于使所述计算机接收第二用户输入的代码;以及用于使所述计算机根据所选择的输入法来显示所述第二用户输入的代码。其它方面包括一种装置,包括用于检查网页的至少一个上下文因素的模块;用于基于对所述网页的所述至少一个上下文因素的分析来自动地、预测性地选择多种输入法中的一种输入法的模块;用于接收用户输入的模块;以及用于传输所述用户输入以根据所选择的输入法进行显示的模块。其它方面包括一种装置,包括检查部件,用于分析网页的至少一个上下文因素; 输入法选择部件,用于基于对所述网页的所述至少一个上下文因素的分析来自动地、预测性地选择多种输入法中的一种输入法;显示装置;以及用户接口,用于接收用户输入并根据所选择的输入法将所述用户输入呈现给所述显示装置。所述检查部件可以被配置为检查用于所述网页的文本编码方法。所述网页可以包括通用字符编码,并且所述检查部件可以被配置为检查所述网页的代码点的数值分布以确定所述代码点所聚集的范围。所述检查部件被配置为检查所述网页上的词以根据所述词来确定语言。所述检查部件还可以被配置为确定所述网页上表示的语言的频率分布。所述输入法选择部件可以被配置为将权重应用到所表示的语言。所述检查部件可以被配置为检查嵌入在所述网页中的元信息并确定所述元信息是否包括语言标记。所述检查部件可以被配置为检查所述网页的 URI或URL。当所述URI或URL包括国际化域名时,所述检查部件还可以被配置为检查所述 URI或URL中的代码点的分布以确定所述代码点所聚集的范围。所述装置可以包括预测性打字方法选择部件,被配置为基于所选择的输入法来应用预测性打字算法。为了实现上述及相关目的,一个或多个方面包括下文详细描述的并在权利要求中特别指出的特征。下面的描述和附图将详细给出所述一个或多个方面的某些示例性的特征。但是,这些特征只是表示可以利用各方面的原理的多种方式中的几种方式,并且所述描述旨在包括所有这些方面及其等同形式。


在下文中将结合附图来描述所公开的方面,附图用于对所公开的方面进行举例说明而不是进行限制,在附图中相同的标号表示相同的元素,并且其中图1示出了用于预测性地选择输入法的示例性方法。图2示出了用于预测性地选择输入法的另一示例性方法。图3示出了用于预测性地选择输入法的计算机设备。图4示出了用于预测性地选择输入法的计算机设备。
具体实施例方式现在参考附图描述了各个方面。在下面的描述中,为了解释的目的,给出了大量的具体细节,以便提供对一个或多个方面的全面理解。然而,很明显的是,可以在不具有这些具体细节的情况下实现这些方面。如前面所指出的,用户需要进行手动选择以便在输入法之间进行改变。用户访问的每个网页包括大量的上下文信息,其反而可以由浏览器用来进行输入方法的自动、预测性选择。当用户与不同的网页交互时,这会消除需要多语言用户对输入法进行手动改变的不便。因此,各个方面包括使用来自网页的上下文信息来进行输入法的自动预测性选择。然后将所选择的输入法应用到从用户接收到的任何输入,例如打字。一旦已经选择了输入法,还可以应用用于预测性打字的适当算法。图1示出了自动地预测性地选择输入法的示例性方法。在101处,从用户接收网页的第一输入。该网页包含多个上下文因素,其中可以分析这些上下文因素以便预测性地选择最适合于该网页的输入法。在102处,针对该网页对至少一个上下文因素进行分析。 下文更详细地描述了示例性因素。在103处,基于102中的分析自动地、预测性地选择输入法。多种输入法可以对应于单一的语言。针对共同语言的输入法至少可以基于文字、 语言和/或地区的任意组合而不同。对输入法的自动、预测性选择不要求用户对文字、语言或地区进行任何手动选择。除了识别网页的信息以外,不要求用户输入任何信息。一旦用户已经选择了网页,就基于与该网页相关的上下文信息自动地选择输入法。将网页显示给用户。在104处,一旦已经预测性地选择了输入法,就从用户接收第二输入。该第二输入可以是网页处的打字或其它输入。在105处,根据预测性地选择的输入法在网页处显示第二输入。例如,如果预测性地选择了日语输入法,则将根据特定的输入法以日语显示从用户接收到的任何打字输入。如果用户然后请求第二网页,则对第二网页的上下文信息进行分析以便基于第二网页来预测性地选择输入法。例如,对第二网页上下文因素的分析可能指示应该选择英语输入法。一旦确定并选择了适当的输入法,就根据所选择的输入法以英语显示用户接收到的任何打字。因此,当多语言用户在网页之间移动时,自动地、预测性地选择针对每个网页的适当的输入法,从而减少了多语言用户对输入法进行手动改变的需要。虽然自动地、预测性地选择了输入法,但是用户仍然可以在任何时间手动地改变输入法。在106处,一旦已经选择了适当的输入法,就可以选择相应的预测性打字算法并将其应用到来自用户的第二输入。该预测性打字算法减少了用户需要的打字量。在分析网页来预测性地选择输入法的过程中可以考虑各种因素。可以对多于一个的因素进行分析,并给结果赋予权重或顺序,以针对网页选择最可能的输入法。一个示例性实现可以包括检查用于特定网页上的文本的文本编码方法,以便网络浏览器进行适当输入法的自动、预测性选择。例如,用于网页的文本编码方法可以是Siift JIS文本编码。这是对日语字符进行编码的日本国家标准,其在TIS X 0208 :1997中定义,该标准的全部内容通过引用的方式并入本文。一旦确定了网页是使用Siift JIS文本编码进行编码的,就可以选择日语输入法。在选择了输入法之后,可以选择相应的预测性打字程序。在此情形下,可以将日语预测性打字程序应用到用户在网页上输入的任何文本。虽然描述了 Siift JIS和日语输入法,但是还有与各种语言(例如中文、俄语、韩语、泰语、希腊语、希伯来语等等)相关的各种类型的文本编码。第二示例性实现可以包括检查网页中的代码点的数值分布。网页中使用的一种类型的文本编码是通用字符编码(UCS),例如IS0/IEC 10646 :2003 Universal Multiple-Octet Coded Character Set中定义的UCS-4,通过引用的方式将其全部内容并入本文。由于UCS是一种通用类型的文本编码,所以不能仅仅基于对使用UCS的识别来自动选择输入法。相反,可以对代码点(字符码)的数值分布进行检查来识别相应的输入法。 检查可以包括启发式地使用代码点所聚集的数值范围来确定输入法。例如,在网页上可以包括处于特定代码范围内的多个字符。例如,使用UCS-4,范围 OxACOO 0xD7AF(韩语部分)中的聚类将暗示网页包括韩语字符。因此,检查代码点的分布将暗示选择韩语输入法。类似地,0x3040 0x309F(平假名部分)中的聚类对应于日语字符,并暗示选择日语输入法。在特定网页中可能识别出多于一种类型的聚类。例如,包含大部分日语字符的网页还可以包括一部分英语。为了正确地选择输入法,可以给来自检查的结果在组合起来识别最适合的输入法以前赋予权重或顺序。例如,可以基于网页处使用的代码范围的数量对结果进行加权。对于前面的例子,大部分日语代码范围将超过英语代码范围,从而意味着应该选择日语输入法而不是英语输入法。在第三示例性实现中,可以检查网页处实际的词来确定输入法。检查词可以包括将词与字典进行比较以确定它们属于哪种语言。要注意的是,给定的词可能出现在多于一种语言中。该词将表示其出现的语言中的每种语言。所表示的语言的频率分布可以用于表示所识别的语言中的每种语言在网页上出现的数量。该频率分布可以启发式地用于选择输入法。例如,可以选择最具代表性的语言作为输入法。可以将另外级别的权重和顺序应用到各种词或识别的语言以便更准确地选择输入法。例如,包含大部分法语单词的页面强烈暗示应该选择法语作为输入法。然而,包含大部分古典拉丁语单词和少部分英语单词的页面将暗示以英语作为输入法,这是因为使用古典拉丁语输入法是非常罕见的。因此,可以给古典拉丁语赋予降低的权重以减少其对输入法选择的影响。可以根据语言或与语言对应的输入法的当前使用级别来给各种类型的语言或输入法赋予权重和顺序。
9
在第四示例性实现中,可以针对语言标记来检查嵌入在网页中的元信息。例如,语言标记可以包括在 HTML 片段中。在 W3C HTML 4. 01 http://www.w3.org/TR/html401/ 中描述了定义HTML和元数据元素的国际标准,其全部内容通过引用的方式并入本文。例如,HTML片段可以包括暗示选择日语输入法的〈html lang = “jp” >。可以由其它类似的语言标记来暗示其它语言的输入法。在第五示例性实现中,可以检查页面的统一资源定位符(URL)或统一资源标识符 (URI)。可以对页面的顶级域(TLD)进行启发式地检查,以确定隐含的地理位置。在MMiZZ data, iana. org/TLD/tlds-alpha-by-domain. txt 处的 IANA 列表中给出了互联网上顶级域的正式列表,其全部内容通过引用的方式并入本文。可以基于在隐含的地理位置处所使用的相应的语言来选择输入法。如果在该地理位置使用多于一种的语言,则可以将权重或顺序应用到这些语言中的每种语言。与所有示例性实现一样,该方法可以与任何其它方法组合起来使用,以在用于该地理位置的语言中进行选择。例如,网页的 URI 可以具有以下形式 http://someserver. cn/page. html。“cn”表示服务的地理位置为中国。因此,应该选择中文输入法。第六示例性实现可以包括检查网页的URL或URI中的代码点的数值分布。 URI或URL的主机部分可以是国际化域名(IDN)。通过引用的方式将IETF RFC 3940 Internationalizing Domain Names的全部内容并入本文,其定义了用于定义国际域名的国际标准。当URL或URI包括国际化域名时,域名将不直接对应于具体的地理位置。在此情形下,可以检查域名中的代码点的数值分布(其类似于第二示例性实现中描述的检查), 以便识别可能的语言并从中选择输入法。可以以任意组合的方式使用这些示例性实现,并且可以与网页的其它上下文因素的分析组合起来使用这些示例性实现。当组合起来使用时,可以给各种检查的结果赋予权重或顺序,以针对网页生成适当输入法的更准确的组合选择。图2示出了示例性方法,其包括给多个上下文因素的分析赋予权重或顺序。与图1类似,在201处,从用户接收访问网页的请求。在202处,检查关于网页的第一因素。在203处,检查关于网页的第二因素。在204处,将权重或顺序应用到第一因素和第二因素的检查结果。在205处,在赋予权重或顺序之后对结果进行组合。在 206处,基于组合的结果来选择输入法。一旦选择了输入法,还可以基于所选择的输入法来选择用于预测性打字的算法。图3示出了计算机设备300的各个方面,其根据网页上的上下文信息自动地、预测性地选择输入法。计算机设备300包括处理器301,用于执行与本文描述的部件和功能中的一个或多个相关联的处理功能。处理器301可以包括单组或多组处理器或者多内核处理器。进一步,可以将处理器301实现为集成处理系统和/或分布式处理系统。计算机设备300还包括存储器302,例如用于存储处理器301执行的应用的本地版本。存储器302可以包括计算机可用的任何类型的存储器,例如随机存取存储器(RAM)、只读存储器(ROM)、磁带、磁盘、光盘、易失性存储器、非易失性存储器及其任意组合。存储器可以存储计算机程序,其包括计算机软件和/或数据,其中当执行计算机程序时,计算机程序使计算机设备能够检查网页上的至少一个因素,以基于检查来选择输入法,以及基于输入法的选择来选择预测性打字方法。具体而言,计算机软件和/或数据使处理器301、检查部件306、输入法选择部件307和预测性打字选择部件308能够执行本文描述的过程。进一步,计算机设备300包括通信部件303,其提供利用本文描述的硬件,软件和服务来建立和维护与一个或多个部分的通信。通信部件303可以执行计算机设备300上的部件之间的通信,以及计算机设备300和外部设备(例如位于通信网络上的设备和/或串行或本地连接到计算机设备300的设备)之间的通信。例如,通信部件300可以包括一个或多个总线,并且还可以包括分别与发射机和接收机相关联的发射链部件和接收链部件, 用于与外部设备进行交互。例如,通信部件300可以允许从计算机设备转发图形、文本和其它数据用以在显示单元上进行显示。计算机设备300可以包括显示接口 310,用于显示这种图形、文本和其它数据。例如,一旦选择了输入法,就可以转发计算机设备300接收到的任何用户输入,用以根据所选择的输入法进行显示或被显示。另外,计算机设备300还可以包括数据存储装置304,其可以是硬件和/或软件的任何适当的组合,其提供结合本文描述的方面而采用的信息、数据库和程序的大容量存储。 例如,数据存储装置304可以是处理器301当前不执行的应用的数据仓库。计算机设备300还可以包括用户接口部件305,用于从计算机设备300的用户接收输入,并且还用于生成呈现给用户的输出。用户接口部件305可以包括一个或多个输入设备,包括但不限于键盘、数字键盘、鼠标、触摸感应显示装置、导航键、功能键、麦克风、语音识别部件、能够从用户接收输入的任何其它机制或者上述的任意组合。进一步,用户接口部件305可以包括一个或多个输出设备,包括但不限于显示装置、扬声器、触觉反馈装置、打印机、能够向用户呈现输出的任何其它机制或者上述的任意组合。计算机设备300还可以包括检查部件306,其检查网页的上下文因素。例如,如前面所述的,该部件可以检查网页上使用的文本编码方法、网页上使用的代码点的数值分布、 网页上实际的词、网页中嵌入的元信息、网页的URL/IRU以及网页的URL/URI中使用的文本编码方法中的任何一种。检查部件306可以分析网页上的至少一个上下文因素以根据该因素确定指示的语言和输入法。计算机设备300还可以包括输入法选择部件307。该部件自动地、预测性地选择输入法,以将该输入法应用到用户选择的网页上的用户输入。该部件可以基于检查部件指示的输入法来进行选择。可替换地,该部件可以给在检查部件处检查的多个因素的结果赋予权重和顺序,并将结果进行组合以选择适当的输入法。计算机设备300还可以包括预测性打字选择部件308。该部件选择用于预测性打字的算法,以将该算法应用到用户选择的网页上的用户输入。基于相应的所选择的输入法来选择适当的算法。计算机设备300还可以包括软件驱动程序309,用于执行存储在计算机设备300处的计算机程序。在本申请中使用的术语“部件”、“模块”、“系统”等旨在包括与计算机相关的实体, 例如但不限于硬件、固件、硬件和软件的组合、软件或执行中的软件。例如,部件可以是但并不仅限于处理器上运行的进程、处理器、对象、可执行文件、执行的线程、程序和/或计算机。举例来说,运行在计算设备上的应用程序和计算设备二者都可以是部件。一个或多个部件可以位于执行的进程和/或线程内,并且部件可以位于一台计算机上和/或分布于两台或更多台计算机之间。另外,可以通过其上存储了各种数据结构的各种计算机可读介质执行这些部件。这些部件可以通过本地和/或远程进程,例如根据具有一个或多个数据分组的信号(例如,来自于一个部件的数据,其中该部件通过所述信号与本地系统、分布式系统中的另一个部件进行交互,和/或在网络(如互联网)上与其它系统进行交互)来进行
通f曰ο ο此外,本文结合终端(其可以是有线终端或无线终端)描述了各个方面。终端还可以被称为系统、设备、用户单元、用户站、移动站、移动台、移动设备、远程站、远程终端、接入终端、用户终端、终端、通信设备、用户代理、用户装置或用户设备(UE)。无线终端可以是蜂窝电话、卫星电话、无绳电话、会话发起协议(SIP)电话、无线本地环路(WLL)站、个人数字助理(PDA)、具有无线连接能力的手持设备、计算设备或连接到无线调制解调器的其它处理设备。基站可以用于与无线终端进行通信,还可以被称为接入点、节点B或某种其它术语。参考图4,示出了系统400,其基于对与网站相关联的因素的分析来预测性地选择输入法。例如,系统400可以至少部分地位于计算机设备、移动设备等等内。应当清楚的是, 将系统400表示为包括功能方框,其中这些功能方框可以是表示由处理器、软件或其组合 (例如,固件)所实现的功能的功能方框。系统400包括可以结合操作的电子部件的逻辑组合402。例如,逻辑组合402可以包括用于检查网页的至少一个上下文因素的模块404。例如,检查可以包括检查用于网页的文本编码方法、检查网页上使用的代码点的数值分布、 检查网页上使用的实际的词、检查网页中嵌入的元数据、检查网页的URI/URL以及检查网页的URL/URI的代码点的分布。进一步,逻辑组合402可以包括用于基于对网页的至少一个上下文因素的分析来自动地预测性地选择多种输入法中的一种输入法的模块406。进一步,逻辑组合402可以包括用于接收用户输入的模块408以及用于传输用户输入以根据所选择的输入法进行显示的模块410。从而,将根据自动地、预测性地选择的输入法来显示任何的用户输入(例如打字)。因此,可以自动地选择适当的输入法,而不需要用户进行手动选择。另外,系统400可以包括存储器412,其保存用于执行与电子部件404、406、408和 410相关联的功能的指令。虽然将电子部件404、406、408和410示出为位于存储器412的外部,但是应当理解的是,电子部件404、406、408和410中的一个或多个可以存在于存储器 412内部。此外,术语“或者”旨在表示包括性的“或者”而不是排他性的“或者”。也就是说, 除非另外说明,或者从上下文能清楚得知,否则短语“X使用A或者B”旨在表示任何自然的包括性排列。也就是说,下列例子中的任何一种都满足短语“X使用A或者B” =X使用A ;X 使用B ;或者X使用A和B 二者。另外,除非另外说明或从上下文能清楚得知是针对单数形式,否则本申请和所附的权利要求书中使用的冠词“一”和“一个”一般应解释为表示“一个或多个”。本申请描述的技术可以用于各种无线通信系统,例如⑶MA、TDMA, FDMA, OFDMA, SC-FDMA和其它系统。术语“系统”和“网络”通常可以替换使用。CDMA系统可以实现诸如通用陆地无线电接入(UTRA)、cdma2000等的无线电技术。UTRA包括宽带CDMA(W-CDMA) 和CDMA的其它变型。进一步,cdma2000涵盖IS-2000、IS-95和IS-856标准。TDMA系统可以实现诸如全球移动通信系统(GSM)的无线电技术。OFDMA系统可以实现诸如演进 UTRA(E-UTRA)、超移动宽带(UMB)、IEEE 802. 11 (Wi-Fi)、IEEE 802. 16 (WiMAX)、IEEE 802. 20、Flash-OFDM 等的无线电技术。UTRA和E-UTRA是通用移动电信系统(UMTS)的一部分。3GPP长期演进(LTE)是UMTS的一个版本,其利用了 E-UTRA,其中E-UTRA在下行链路上使用0FDMA,在上行链路上使用SC-FDMA。在名为“第三代合作伙伴计划”(3GPP)的组织的文档中描述了 UTRA、E-UTRA、UMTS、LTE和GSM。另外,在名为“第三代合作伙伴计划 2”(3GPP2)的组织的文档中描述了 cdma2000和UMB。进一步,这种无线通信系统还可以包括对等(例如,移动设备对移动设备的)自组织网络系统,其通常使用非成对未授权的频谱、802. XX无线LAN、蓝牙和任何其它短程或长程无线通信技术。将根据系统给出各个方面或特征,其中该系统可以包括多个设备、部件、模块等等。应当理解和清楚的是,各种系统可以包括另外的设备、部件、模块等和/或可以不包括结合附图讨论的设备、部件、模块等的全部。也可以使用这些方法的组合。可以采用被设计用于执行本文所述功能的通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件或其任意组合来实现或执行结合本文所公开的实施例而描述的各种示例性的逻辑、逻辑方框、模块和电路。通用处理器可以是微处理器,但是可替换地,该处理器也可以是任何常规的处理器、控制器、微控制器或者状态机。也可以将处理器实现为计算设备的组合,例如,DSP和微处理器的组合、多个微处理器、一个或多个微处理器与DSP内核的结合,或者任何其它此种结构。另外,至少一个处理器可包括一个或多个用于执行上述步骤和/或操作中的一个或多个的模块。进一步,结合本文公开的方面描述的方法或者算法的步骤和/或操作可直接体现在硬件、由处理器执行的软件模块或两者的组合中。软件模块可以位于RAM存储器、闪存、 ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、移动磁盘、⑶-ROM或者本领域熟知的任何其它形式的存储介质中。示例性的存储介质可以耦合至处理器,使得处理器能够从该存储介质读取信息,并向该存储介质写入信息。可替换地,存储介质也可以是处理器的组成部分。进一步,在一些方面中,处理器和存储介质可以位于ASIC中。另外,ASIC可以位于用户终端中。可替换地,处理器和存储介质也可以作为分立组件存在于用户终端中。另夕卜,在一些方面中,方法或算法的步骤和/或操作可以作为一个代码和/或指令或者代码和 /或指令的任意组合或者代码和/或指令的集合而存在于机器可读介质和/或计算机可读介质上,其中机器可读介质和/或计算机可读介质可以并入到计算机程序产品中。在一个或多个方面中,所描述的功能可以实现在硬件、软件、固件、或其任意适合的组合中。如果在软件中实现,则功能可以作为一个或多个指令或代码在计算机可读介质上存储或传输。计算机可读介质包括计算机存储介质和通信介质两者,包括有助于将计算机程序从一个位置转移到另一位置的任何介质。存储介质可以是可由计算机存取的任何可用的介质。举例来说,而非限制性地,这种计算机可读介质可以包括RAM、ROM、EEPROM、 CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁存储设备或可以用于以指令或数据结构的形式携带或存储想要的程序代码并可由计算机存取的任何其它介质。另外,可以将任何连接称为计算机可读介质。例如,如果使用同轴电缆、光纤光缆、双绞线、数字用户线 (DSL)或例如红外、无线电和微波的无线技术从网站、服务器或其它远程来源来传输软件,那么同轴电缆、光纤光缆、双绞线、DSL或例如红外、无线电和微波的无线技术包括在介质的定义中。本文所使用的磁盘和光盘包括压缩光盘(CD)、激光光盘、光盘、数字通用光盘 (DVD)、软盘和蓝光光盘,其中磁盘通常以磁的方式再现数据,而光盘采用激光以光学的方式再现数据。上述的组合也应当包括在计算机可读介质的范围内。
虽然上述公开内容讨论了示例性方面和/或实施例,但是应当注意,在不脱离所描述方面和/或实施例的范围的前提下,可以在本文中进行各种改变和修改,其中所描述方面和/或实施例的范围由所附权利要求定义。此外,虽然可以以单数形式描述或要求保护所述方面和/或实施例的元素,但是,除非明确说明限于单数形式,否则可以预料到复数形式。另外,除非另外说明了,否则任何方面和/或实施例的全部或部分可以与任何其它方面和/或实施例的全部或部分一起来利用。
权利要求
1.一种用于在网络浏览器处预测性地选择输入法的方法,所述方法包括 分析网页的至少一个上下文因素;基于对所述网页的所述至少一个上下文因素的所述分析来自动地、预测性地选择多种输入法中的一种输入法; 接收用户输入;以及根据所选择的输入法来显示所述用户输入。
2.根据权利要求1所述的方法,其中,对所述至少一个因素的所述分析包括检查用于所述网页的文本编码方法。
3.根据权利要求1所述的方法,其中,所述网页包括通用字符编码,并且其中,对所述至少一个因素的所述分析包括检查所述网页的代码点的数值分布以确定所述代码点所聚集的范围。
4.根据权利要求1所述的方法,其中,对所述至少一个因素的所述分析包括检查所述网页上的词以根据所述词来确定语言。
5.根据权利要求4所述的方法,还包括 确定所述网页上表示的语言的频率分布。
6.根据权利要求5所述的方法,还包括 将权重应用到所表示的语言。
7.根据权利要求1所述的方法,其中,对所述至少一个因素的所述分析包括检查嵌入在所述网页中的元信息。
8.根据权利要求7所述的方法,其中,所述检查嵌入在所述网页中的元信息进一步包括确定所述元信息是否包括语言标记。
9.根据权利要求1所述的方法,其中,对所述至少一个因素的所述分析包括检查所述网页的统一资源定位符(URL)或统一资源标识符(URI)。
10.根据权利要求9所述的方法,其中,所述URI或URL包括国际化域名,所述方法还包括检查所述URI或URL中的代码点的分布以确定所述代码点所聚集的范围。
11.根据权利要求1所述的方法,其中,对所述至少一个因素的所述分析包括下述中的至少两项检查用于所述网页的文本编码方法;检查所述网页的代码点的数值分布以确定所述代码点所聚集的范围;检查所述网页上的词以根据所述词来确定语言;检查嵌入在所述网页中的元信息;以及检查所述网页的URI或URL。
12.根据权利要求11所述的方法,还包括 给不同因素的分析结果赋予权重。
13.根据权利要求1所述的方法,还包括 基于所选择的输入法来应用预测性打字。
14.一种计算机程序产品,包括 计算机可读介质,包括用于使计算机接收网页的第一输入的代码; 用于使所述计算机分析所述网页的至少一个上下文因素的代码; 用于使所述计算机基于对所述网页的所述至少一个上下文因素的所述分析来自动地、预测性地选择多种输入法中的一种输入法的代码; 用于使所述计算机接收第二用户输入的代码;以及用于使所述计算机根据所选择的输入法来显示所述第二用户输入的代码。
15.根据权利要求14所述的计算机程序产品,其中,对所述至少一个因素的所述分析包括检查用于所述网页的文本编码方法。
16.根据权利要求14所述的计算机程序产品,其中,所述网页包括通用字符编码,并且其中,对所述至少一个因素的所述分析包括检查所述网页的代码点的数值分布以确定所述代码点所聚集的范围。
17.根据权利要求14所述的计算机程序产品,其中,对所述至少一个因素的所述分析包括检查所述网页上的词以根据所述词来确定语言。
18.根据权利要求17所述的计算机程序产品,还包括 用于使计算机确定所述网页上表示的语言的频率分布的代码。
19.根据权利要求18所述的计算机程序产品,还包括 用于使计算机将权重应用到所表示的语言的代码。
20.根据权利要求14所述的计算机程序产品,其中,对所述至少一个因素的所述分析包括检查嵌入在所述网页中的元信息。
21.根据权利要求20所述的计算机程序产品,其中,所述检查嵌入在所述网页中的元信息进一步包括确定所述元信息是否包括语言标记。
22.根据权利要求14所述的计算机程序产品,其中,对所述至少一个因素的所述分析包括检查所述网页的统一资源定位符(URL)或统一资源标识符(URI)。
23.根据权利要求22所述的计算机程序产品,其中,所述URI或URL包括国际化域名, 所述方法还包括用于使计算机检查所述URI或URL中的代码点的分布以确定所述代码点所聚集的范围的代码。
24.根据权利要求14所述的计算机程序产品,其中,对所述至少一个因素的所述分析包括下述中的至少两项检查用于所述网页的文本编码方法;检查所述网页的代码点的数值分布以确定所述代码点所聚集的范围;检查所述网页上的词以根据所述词来确定语言; 检查嵌入在所述网页中的元信息;以及检查所述网页的URI或URL。
25.根据权利要求M所述的计算机程序产品,还包括 用于使计算机给不同因素的分析结果赋予权重的代码。
26.根据权利要求14所述的计算机程序产品,还包括 用于使计算机基于所选择的输入法来应用预测性打字的代码。
27.一种装置,包括用于检查网页的至少一个上下文因素的模块;用于基于对所述网页的所述至少一个上下文因素的分析来自动地、预测性地选择多种输入法中的一种输入法的模块; 用于接收用户输入的模块;以及用于传输所述用户输入以根据所选择的输入法进行显示的模块。
28.根据权利要求27所述的装置,其中,所述检查所述至少一个因素包括检查用于所述网页的文本编码方法。
29.根据权利要求27所述的装置,其中,所述网页包括通用字符编码,并且其中,所述检查所述至少一个因素包括检查所述网页的代码点的数值分布以确定所述代码点所聚集的范围。
30.根据权利要求27所述的装置,其中,所述检查所述至少一个因素包括检查所述网页上的词以根据所述词来确定语言。
31.根据权利要求30所述的装置,还包括用于确定所述网页上表示的语言的频率分布的模块。
32.根据权利要求31所述的装置,还包括用于将权重应用到所表示的语言的模块。
33.根据权利要求27所述的装置,其中,所述检查所述至少一个因素包括检查嵌入在所述网页中的元信息。
34.根据权利要求33所述的装置,其中,所述检查嵌入在所述网页中的元信息进一步包括确定所述元信息是否包括语言标记。
35.根据权利要求27所述的装置,其中,所述检查所述至少一个因素包括检查所述网页的统一资源定位符(URL)或统一资源标识符(URI)。
36.根据权利要求35所述的装置,其中,所述URI或URL包括国际化域名,所述方法还包括用于检查所述URI或URL中的代码点的分布以确定所述代码点所聚集的范围的模块。
37.根据权利要求27所述的装置,其中,所述检查所述至少一个因素包括下述中的至少两项检查用于所述网页的文本编码方法;检查所述网页的代码点的数值分布以确定所述代码点所聚集的范围;检查所述网页上的词以根据所述词来确定语言;检查嵌入在所述网页中的元信息;以及检查所述网页的URI或URL。
38.根据权利要求37所述的装置,还包括用于给不同因素的分析结果赋予权重的模块。
39.根据权利要求27所述的装置,还包括用于基于所选择的输入法来应用预测性打字的模块。
40.一种装置,包括检查部件,用于分析网页的至少一个上下文因素;输入法选择部件,用于基于对所述网页的所述至少一个上下文因素的所述分析来自动地、预测性地选择多种输入法中的一种输入法;显示装置;以及用户接口,用于接收用户输入并根据所选择的输入法将所述用户输入呈现给所述显示直ο
41.根据权利要求40所述的装置,其中,所述检查部件被配置为检查用于所述网页的文本编码方法。
42.根据权利要求40所述的装置,其中,所述网页包括通用字符编码,并且其中,所述检查部件被配置为检查所述网页的代码点的数值分布以确定所述代码点所聚集的范围。
43.根据权利要求40所述的装置,其中,所述检查部件被配置为检查所述网页上的词以根据所述词来确定语言。
44.根据权利要求43所述的装置,其中,所述检查部件还被配置为确定所述网页上表示的语言的频率分布。
45.根据权利要求44所述的装置,其中,所述输入法选择部件被配置为将权重应用到所表示的语言。
46.根据权利要求40所述的装置,其中,所述检查部件被配置为检查嵌入在所述网页中的元信息。
47.根据权利要求46所述的装置,其中,所述检查部件还被配置为确定所述元信息是否包括语言标记。
48.根据权利要求40所述的装置,其中,所述检查部件被配置为检查所述网页的URI或URL。
49.根据权利要求48所述的装置,其中,所述URI或URL包括国际化域名,并且,所述检查部件还被配置为检查所述URI或URL中的代码点的分布以确定所述代码点所聚集的范围。
50.根据权利要求40所述的装置,还包括预测性打字方法选择部件,被配置为基于所选择的输入法来应用预测性打字算法。
全文摘要
一种用于在网络浏览器处预测性地选择输入法的方法和装置。一旦用户输入了识别网页的信息,就对网页的上下文信息进行检查以针对网页自动地、预测性地选择适当的输入法。一旦选择了输入法,就可以应用相应的预测性打字程序。
文档编号H04M1/725GK102577334SQ201080046048
公开日2012年7月11日 申请日期2010年10月13日 优先权日2009年10月14日
发明者M·W·帕登 申请人:高通股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1