用于供用户进行文字输入的方法、设备、服务器和系统的制作方法

文档序号:7750109阅读:594来源:国知局
专利名称:用于供用户进行文字输入的方法、设备、服务器和系统的制作方法
技术领域
本发明涉及文字输入领域,尤其涉及一种通过网络辅助用户进行文字输入的方 法、设备和系统。
背景技术
从输入法面世伊始,提高输入速度和提高备选词项命中率就是输入法设计者不断 追求的目标。传统上,为了提高用户进行文字输入的效率和可靠性,针对输入所使用键盘的 布局、键区上各按键的定义、反馈词条的排列方式、对输入序列的语义联想分析等等很多方 面进行了各种改进。而在因特网技术日益发达的今天,利用网络通信来促进用户在与网络 服务器连接的用户设备上的文字输入正在成为进一步提高输入法效率的新兴技术。这类技 术的基本思想是利用服务器与客户端之间的通信,使远程客户端上的用户能够访问服务器 上与输入法有关的资源,从而改进用户的文字输入。现有技术中已经存在各种利用网络来促进用户在客户端上进行文字输入的方法。 例如,中国专利申请2007101513 . 3中描述了一种用户词库管理系统和方法,其中词库服 务器和输入法客户端通过网络连接,可以实现词库服务器与输入法客户端之间以及多个输 入法客户端之间同步或共享用户词库。可以看到,这种同步或共享是一种自发式的、无明确 目的的共享,其仅能够扩大其他用户可选择的词项的范围,但对于提高用户输入速度以及 备选词项命中率来说没有直接的效果。作为另一个例子,中国专利申请200710098199. 6中描述了一种利用网络进行用 户词库更新的方法,其主要利用加盖时间戳的技术来对多台计算机上的用户词库版本进行 准确同步。该技术严格地说仅仅是一种同步技术,其涉及的是单个用户词库的比较严格的 自我复制,用于同一用户词库的随时间推移的单向更新。该技术并不涉及多用户之间的共 享,不支持输入法资源利用从单一用户到多个用户的扩展。在实际生活中,不同的用户之间常常具有某种共性,例如从事相关的工作、完成同 一项任务、具有相似的爱好或者居住于同一个城市。合乎逻辑地,在进行文字输入时,具有 共性的用户对输出结果的选择也会呈现一种趋同。例如,假设多个用户同为“正华花园”小 区的居民,当该多个用户在利用基于拼音的输入法输入“zhenghuahuayuan”时,本意很有可 能是选择该小区的名字,即他们会选择相同的词条作为输出结果。如果利用这种共性对用 户进行分组,通过网络在同一群组中的用户之间实现相关词条或输入习惯的共享,将大大 提高用户的输入效率和首选词命中率。遗憾的是,目前尚不存在这样的输入法相关技术,如 上所述的若干基于网络的输入法技术均没有将具有共性的用户分类化,或者通过对用户共 性的利用来改进或增强用户进行文字的方法和设备。

发明内容
本发明的目的是提出一种解决上述问题的文字输入方法和设备。具体地,本发明 设计了能够改进文字输入,尤其是提高输入速度和首选词命中率的输入方法,以及利用该输入方法的用户设备、网络服务器和系统。根据本发明的一个方面,提供一种在与网络服务器进行通信的用户设备上进行文 字输入的方法,该方法包括以下步骤检测群组中的用户在该客户端上的输入序列;基于该输入序列在该用户设备上的本地语料库中进行匹配查询,以获得一个或多 个匹配的本地词条选项;将该输入序列发送至该网络服务器;接收来自该网络服务器的基于该输入序列在用户群组对应的群组语料库中进行 匹配查询所获得的一个或多个匹配的群组词条选项;将该本地词条选项和/或该群组词条选项汇总并显示给该用户,供其选择。根据本发明的另一个方面,提供一种在网络服务器上辅助用户进行文字输入的方 法,该方法包括以下步骤经由网络接收用户在用户设备上的输入序列;基于该输入序列和用户所加入的群组在对应的群组语料库中进行匹配查询获得 一个或多个匹配的群组词条选项;将所获得的该群组词条选项反馈回该用户设备,供用户选择。根据本发明的又一个方面,提供一种与网络服务器进行通信的供用户进行文字输 入的用户设备,该用户设备包括以下装置用于检测群组中的用户的输入序列的装置;用于基于该输入序列在该用户设备上的本地语料库中进行匹配查询,以获得一个 或多个匹配的本地词条选项的装置;用于将该输入序列发送至该网络服务器的装置;用于接收来自该网络服务器的基于该输入序列在用户群组对应的群组语料库中 进行匹配查询所获得的一个或多个匹配的群组词条选项的装置;用于将该本地词条选项和/或该群组词条选项汇总并显示给该用户供其选择的
直ο根据本发明的又一个方面,提供一种辅助用户进行文字输入的网络服务器,该网 络服务器包括以下装置用于经由网络接收用户在用户设备上的输入序列的装置;用于基于该输入序列和用户所加入的群组在群组语料库中进行匹配查询获得一 个或多个匹配的群组词条选项的装置;用于将所获得的该群组词条选项反馈回该用户设备供用户选择的装置。根据本发明的又一个方面,提供一种辅助用户进行文字输入的系统,包括上述本 发明的用户设备以及网络服务器。本发明的文字输入方法不但可以用于输入中文,还可以用于输入例如日语、韩语 等非拉丁字母的语言。与现有技术相比,本发明具有以下优点1)利用不同用户之间可能具有的某种共性,实现多用户协同输入。同一群组中的 用户成员可以利用其他成员对输入法的贡献,例如新的词条、累进的输入习惯,相当于减少了用户自身对输入法的训练次数,由此提高了输入速度和首选词命中率。2)基于各种标准定义用户群组,同一用户可以参加一个或多个群组,从而在有目 的地共享一类词语的同时,赋予用户选择词语的丰富度和灵活度,更符合人类用户具有多 重属性的基本事实。3)根据需要为不同用户赋予不同权限或级别,实现分层次的词条共享,进一步提 高了该输入法的共享效率。4)对群组用户可能共同占有的某种材料进行学习和训练,以形成用于该群组的初 始共享语料库。通过集中获取与用户共性有关的词条资源,减少系统构建分类词库的开销, 从而可以以较低成本实现该高效的输入法。


通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它 特征、目的和优点将会变得更明显图1为根据本发明一个实施例在与网络服务器通信的用户设备端输入文字的方 法的流程图;图2为根据本发明一个实施例在网络服务器上辅助用户进行文字输入的方法的 流程图;图3为根据本发明一个实施例的辅助用户进行文字输入的系统的框图;图4为根据本发明一个实施例与网络服务器进行通信的供用户进行文字输入的 用户设备的方框图;图5为根据本发明一个实施例用于辅助用户进行文字输入的网络服务器的方框 图;图6为根据本发明一个实施例在网络服务器上注册的用户群组的示意图;以及图7为根据本发明一个实施例在网络服务器上维护的群组语料库中群组词条的 属性列表的示意图。附图中相同或相似的附图标记代表相同或相似的部件。
具体实施例方式下面结合附图对本发明作进一步详细描述。以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述 特定实施方式,本领域技术人员可以在所附权利要求的范围内做出各种变形或修改。目前比较流行的中文输入法包括拼音加加、Google输入法以及搜狗输入法。这些 输入法将词典数据库(简称词库)和基于词库的转化方法或称算法模型实现保存在本地, 也即存储在用户设备的存储设备如硬盘、闪存等之中。本说明书中将词库和算法模型的总 和称为语料库。这些输入法都是基于用户在例如台式机、笔记本电脑、手机、PDA等用户设备上输 入的按键序列在用户设备的本地语料库中搜索候选词条的然后显示给用户进行选择。这些 输入法根据用户对候选词条的选择动态地更新本地语料库以及语料库中各个候选词条的 出现次序或优先级。随着用户长时间地使用该输入法,不断磨合,本地语料库中所包含的词
7条以及各个词条的优先级被调整为越来越符合该特定用户的输入习惯,因此文字输入速度 也会越来越快。内部网或局域网的多用户,如企业客户、网吧、翻译服务等类型的用户通常具有较 明显的共性。这种共性可能是相同或相似的工作内容、相同或相似的兴趣爱好、相同或相似 的年龄阶段、相同或相似的地理区域等。由于这种共性,多个用户之间在进行文字输入时对 于备选词项的选择体现出一种趋同或相似。例如,同样是键入“shzh”这样的缩略输入,对于 深圳市的居民,命中率最高的首选词项是“深圳”;对于河北省深州市的居民,命中率最高的 首选词项则“深州”;对于航天产业的从业人员,命中率最高的首选词项则很有可能是“神舟 (N号)”;而对于以上共性皆不具备的普通用户来说,命中率最高的首选词项有可能是“神 州(大地)”。尽管现在大多数输入法都提供词频调整功能,即根据输入选择的最新历史记 录调整备选词项的显示顺序,然而这种调整必须进行学习或训练,当目标是一个并不常用 甚至较为生僻的词时,这种繁琐是不言而喻的。并且这种现有的词频调整也是不稳定的,例 如当用户换了另一台计算机,将需要重新进行学习和训练。因此,如果能够通过网络对具有 较大共性的其他用户的先前输入进行利用,辅助用户在用户终端上进行文字录入,无疑将 大大地提高文字录入的准确度和效率。从这一思想出发,本发明提出一种利用网络服务器 辅助进行文字录入的方法、用户设备、网络服务器和系统。下面参照图1和图4详细描述根据本发明一个实施例的文字录入方法和设备。图4为根据本发明一个实施例与网络服务器进行通信的供用户进行文字输入的 用户设备40的方框图。在本发明的用户设备40上存储有本地语料库403,该本地语料库 403中存储有基础词汇集、基础语言模型、用户使用输入法过程中生成的词汇集。除此之外,该本地语料库403还可以存储一些辅助信息例如,用户对输入法的各 种设置属性,包括但不限于模糊音、繁简体、双拼、全拼、简拼等等;以及用户的属性信息,包 括但不限于职业、爱好、专业领域、简历、年龄等等。这些辅助的信息有助于对候选词条进行 优化排序。用户设备40还具有键盘401,用于由用户输入文字的拼音字母或者笔画序列(在 后文中统称为输入序列)。该键盘可以是如电话键区那样的纯数字键盘或全字母键盘 (QWERTY键盘),也可以是实体键盘或虚拟键盘。用户设备40中的匹配装置402基于所输入的拼音字母或笔画序列在本地语料库 403中查找匹配的本地词条选项,并通过显示装置406显示出来,供用户选择。为了在输入过程中通过互联网获得来自网络服务器50的协助,用户设备40中还 包括网络通信装置404。网络通信装置404通过互联网或局域网与网络服务器50进行通 信,将用户身份信息和通过键盘401输入的输入序列发送到网络服务器50。网络服务器50 首先确定用户属于的用户群组,然后根据输入序列从所确定用户群组对应的群组语料库中 查找适合的词条选项。由网络服务器50获得的群组词条选项被返回到网络通信装置404, 并且由网络通信装置404将接收到的群组词条选项传输给汇总装置405。此外,网络通信装 置404还适用于将用户注册到网络服务器50上的一个或多个用户群组,这些用户群组与群 组语料库相关联。为了将从网络服务器50接收到的群组词条与本地检索所获得的本地词条合并, 用户设备40还包括汇总装置405。汇总装置405接收来自匹配装置402的本地词条选项和来自网络通信装置404的群组词条选项,经过汇总后在显示装置406上显示出来,供用户选 择。网络服务器50可以是分布在互联网上的多个网络服务器SO1......50n。这些网络
服务器SO1......50n协同工作,构成一个服务器云,为大量用户提供服务。网络服务器50
也可以是位于企业局域网上的一个或多个服务器。图1为根据本发明一个实施例在与网络服务器通信的用户设备端输入文字的 方法的流程图。如图所示,在步骤SlOl中,检测用户在用户设备的键盘401上的按键 输入序列。该按键序列可以是一个或多个词组甚至一句话的简拼或全拼,例如用户要 输入“我喜欢用百度搜索引擎”,可以输入每个字声母的简拼“wxhybdssyq”,可以输入每 个字的全拼“ woxihuanyongbaidusousuoyinqing”,还可以输入简拼和全拼的混合输入 “woxhuanybaidssyinq”。一般来说,全部输入全拼的话,候选词更加精确,减少翻页查找的 次数,但是需要输入较多字符。如果全部输入简拼,则重码较多,导致翻页查找时间较长,效 率不高。因此通常全拼和简拼混合输入比较有效。特别是,如果用户输入一个新词条,本地 语料库403会根据用户的选词同步地把新词条加入到本地语料库403,下次用户再次输入 该词条时可以仅仅用简拼即可快速输入该词条。利用根据本发明的文字输入方法,用户可 以更进一步地简化输入,甚至在只用每个字的首字母的情况下,也能很快得到想要的结果, 因为可利用的群组词条,是已经由与之具有共性的其他用户训练过的。接着,在步骤S102中,获得用户的按键输入序列后,将所述输入序列在用户设备 40的本地语料库403中进行匹配查询,以获得一个或多个匹配的本地词条选项。在步骤S103中,将所述按键输入序列发送至网络服务器50。上述步骤S102和S103可以先后执行,也可以同时执行。为了快速地显示所获得的词条选项,在步骤S102中获得本地词条选项之后,可以 立即转到步骤S105,将所获得的本地词条选项汇总并显示给用户,供其选择。与此同时,网 络服务器50收到来自用户设备40的按键输入序列,并在与之所属群组相关联的群组语料 库中查找匹配的群组词条选项。在步骤S104,用户设备40接收到来自网络服务器50的群组词条选项并发送到汇 总装置405。然后转到步骤S105,在汇总装置405中将来自匹配装置402的本地词条选项 和来自网络服务器50的群组词条选项进行汇总后提供给显示装置406显示,由用户进行选 择。由于网络传输和服务器处理的滞后,汇总装置405 —般会先收到本地词条选项然后才 收到群组词条选项,当网络服务器还没有反馈回群组词条选项时,可以立即将本地词条选 项提供给显示装置406供用户选择,不必与群组词条选项一同显示。当然,经过与群组词条 选项汇总后的词条选项更加精确。由于输入的过程是动态连续的过程,词条选项也是随着用户按键输入而不断变化 的,因此步骤S105之后又转回步骤SlOl检测用户设备的按键输入。上述步骤之间的次序是可以调换的,而不影响本发明的实现。例如为了更快地获 得群组词条选项,可以调换步骤S102和S103的次序,先把检测到的按键输入序列发送到所 述网络服务器。在本发明的一个优选实施例中,上述方法还可以包括用户设备侧的注册步骤 S106,即在进行文字输入之前,可以通过网络通信装置404将所述用户注册到网络服务器50上的一个或多个用户群组,所述用户群组与所述群组语料库相关联。这种注册过程例如 可以采用本领域公知的群组注册功能。但是,也可能不需要这样的注册步骤即可将用户与 某个群组相关联。例如,由于用户属于某个业务部门,针对该业务部门的群组在(例如由部 门主管)创建时,部门成员包括该用户即被自动添加到了该群组。这样,当用户在进行文字 输入时,网络服务器基于其身份可以立即确定其属于该业务部门群组,并从所对应的群组 语料库中为其搜索相关群组词条。在本发明又一个优选实施例中,上述方法还可以包括所述用户向所述网络服务器 发送用户身份信息的步骤S107,以便所述网络服务器确定与之关联的用户群组,进而确定 与之关联的群组语料库。然而该步骤也并非网络服务器用于确定用户群组所必不可少的步 骤。例如,当网络服务器本身是仅适用于某个或某些用户群组的内部网服务器,则用户无需 任何认证程序即可被认为可以利用该网络服务器上的群组语料库。在本发明又一个优选实施例中,上述方法还可以包括如下步骤S108 所述用户将 自己选定的词条发送到所述网络服务器,以便所述网络服务器更新至与所述用户所属用户 群组相关联的群组语料库。根据这一功能,用户群组中的每个成员可以向群组语料库提供 自己的贡献,例如新的词条、自身累进的输入习惯等,这些资源可以以适当形式被收集在群 组语料库的词条或词条属性中,供群组中其他成员参考或直接利用。优选地,对于用户群组 中具有较高权限或占主导地位的成员的贡献,赋予较大的权重。例如,部门主管所提供的新 词条,在反馈时具有较高优先级。在图1中,以虚线方框以及虚线连接线来表示上述可选步骤S106-S108。下面参照图2、图5描述网络服务器50的结构和其操作流程。图5为根据本发明一个实施例用于辅助用户进行文字输入的网络服务器的方框 图。如图5中所示,本发明一个实施例的网络服务器50包括一个或多个群组语料库 501 (为简化示图只示出了其中一个)、匹配装置502、网络通信装置503、群组管理装置504 以及群组语料库管理和更新装置505。如图5中所示,网络通信装置503通过网络连接到一个或多个用户设备40,用于经 由网络接收用户在用户设备上的按键输入序列,并将基于该按键输入序列所获得的群组词 条选项反馈回所述用户设备,供用户选择。如上所述,网络通信装置503还包括身份信息接 收装置,用于接收可选的用户身份信息,并将其转发给群组管理装置504以便其确定与之 管理的用户群组。网络通信装置503还包括词条接收装置,用于接收所述用户在输入时最 终选定的词条,以便将其转发给群组语料库管理和更新装置505,使其利用这些词条来更新 与所述用户所属用户群组相关联的群组语料库。优选地,该词条接收装置还用于接收与用 户群组有关的材料,以便将其转发给群组语料库管理和更新装置505,使其利用这些材料来 初始地构建所述用户所属用户群组相关联的群组语料库。匹配装置502连接到用户群组语料库501、匹配装置502和群组管理装置504,用 于基于所述按键输入序列在用户群组语料库501中进行匹配查询获得一个或多个匹配的 群组词条选项,然后将该群组词条选项发送至网络通信装置503,以返回给用户设备40。其 中匹配装置502根据群组管理装置503所确定的用户群组信息从多个群组语料库501中选 择输入用户所对应的一个或多个群组语料库来进行匹配查询。另外,该匹配装置502还包括优先级确定装置(未示出),用于根据词条来源用户的优先级、词条先前是否被选择过、 词条先前被选择的时间先后、词条先前被选择的次数、用户预置的输入偏好选项和/或词 条在网络上的被搜索的次数来确定所匹配的词条选项中各个词条的优先级。群组管理装置504连接到匹配装置502、网络通信装置503以及群组语料库管理和 更新装置505。群组管理装置504负责管理用户群组,包括从网络通信装置503接收用户注 册信息,并将用户注册到一个或多个用户群组;维护用户群组信息,例如群组名称、群组成 员ID、群组所对应的群组语料库编号等;根据用户身份确定其所属群组,并将确定结果发 送至匹配装置502帮助其选择进行匹配查询的群组语料库501。另外,群组管理装置还辅助 群组语料库管理和更新装置505管理和更新词库,例如将某个用户在用户群组中的优先级 别信息发送至群组语料库管理和更新装置505,后者根据该信息调整相关词条的优先级属 性等。群组语料库管理和更新装置505连接到网络通信装置503,用于接收用户所发送 的词条,将其更新到群组语料库501的词条或其属性中。优选地,群组语料库管理和更新装 置505还可以从网络通信装置503接收与用户群组有关的材料,通过对其进行学习或训练, 来对群组语料库501进行初始化或更新。该功能对于进一步简化用户输入,减少系统构建 分类词库的开销来说是非常有用的。例如,对于一个从事半导体领域专利文件翻译的群组, 用户可以上传一份包含常用半导体领域词汇如“蚀刻”、“汽相沉积”、“涂覆”等的资料。群 组语料库管理和更新装置505利用该资料为该群组初始化一个群组语料库501,从而不再 需要其中成员在首次输入相关词条时要付出的训练劳动。群组语料库501是本发明所引入的重要概念,其直接对应于用户群组,通常每个 用户群组对应于一个群组语料库。群组语料库501包含其所对应的用户群组中的群组成员 最常用的词条,将该语料库在群组成员中共享可以使这些成员用户节省很多耗时费力的输 入法训练步骤,在其他成员的输入基础上直接获得自己想要的输入结果。在下文中将结合 图7对群组语料库501的构成以及群组词条的属性进行详细说明。图2为根据本发明一个实施例在网络服务器上辅助用户进行文字输入的方法的 流程图。如图2中所示,在步骤S201中,网络服务器50的网络通信装置503经由网络接收 用户在用户设备40上的按键输入序列;在步骤S202中,基于所述按键输入序列和用户所加入的群组在对应的群组语料 库中进行匹配查询获得一个或多个匹配的群组词条选项;在步骤S203中,将所获得的群组词条选项反馈回所述用户设备40,供用户选择。在本发明的一个优选实施例中,上述方法还可以包括网络服务器侧的注册步骤 S204,即在文字输入之前,可以通过网络通信装置503接收用户的注册信息,并将用户注册 到一个或多个用户群组,所述用户群组与所述群组语料库相关联。这种注册过程例如可以 采用本领域公知的群组注册功能。优选地,可以根据各种标准即用户所具有的任何共性来 建立用户群组,例如从事相关的工作、完成同一项任务、具有相似的爱好或者居住于同一个 城市。下文中结合图6详述了用户群组的例子。但是,也可能不需要这样的注册步骤即可将用户与某个群组相关联。例如,由于用 户属于某个业务部门,针对该业务部门的群组在(例如由部门主管)创建时,部门成员包括该用户即被自动添加到了该群组。这样,当用户在进行文字输入时,网络服务器基于其身 份可以立即确定其属于该业务部门群组,并从所对应的群组语料库中为其搜索相关群组词
^^ ο在本发明又一个优选实施例中,上述方法还可以包括接收所述用户发送的用户身 份信息的步骤S205,以便确定与之关联的用户群组,进而确定与之关联的群组语料库。然 而该步骤也并非网络服务器50用于确定用户群组所必不可少的步骤。例如,当网络服务器 50本身是仅适用于某个或某些用户群组的内部网服务器,则用户无需任何认证程序即可被 认为可以利用该网络服务器50上的群组语料库501。在本发明又一个优选实施例中,上述方法还可以包括接收用户返回词条以更新群 组语料库501的步骤S206。根据这一功能,用户群组中的每个成员可以向群组语料库提供 自己的贡献,例如新的词条、自身累进的输入习惯等,这些资源可以以适当形式被收集在群 组语料库的词条或词条属性中,供群组中其他成员参考或直接利用。优选地,对于用户群组 中具有较高权限或占主导地位的成员的贡献,赋予较大的权重。例如,部门主管所提供的新 词条,在反馈时具有较高优先级。在图2中,以虚线方框以及虚线连接线来表示上述可选步骤S204-S206。。图3为根据本发明一个实施例的辅助用户进行文字输入的系统30的框图。如图 3所示,系统30包括网络服务器50和用户设备40,网络服务器50和用户设备40通过网络 连接。网络代表使用例如TCP/IP协议集来彼此通信的全球范围内的网络和网关集合,其可 以是以主要节点或主机计算机之间的高速数据通信线路的骨干网为核心的因特网,其由成 千上万的商业、政府、教育和对数据和消息进行路由的其他计算机系统组成。网络还可以实 现为大量不同类型的网络,诸如,例如,内联网、局域网(LAN)或广域网(WAN)。图3意在作 为一个示例,而不是对不同示范性实施方式的结构性限制。图6示出了根据本发明一个实施例在网络服务器上注册的用户群组的示意图。图 中示出了 4个用户群组,分别为“篮球同盟”群组601、“正华花园小区”群组602、“半导体领 域翻译”群组603以及“世博旅游”群组604。这些群组分别代表了根据用户共同的兴趣爱 好、居住区域、从事工作、短期关注来划分的用户群组。实际上,还可以有更多的分组标准, 例如同一个网络游戏的玩家、同一个大学的学生等等。在现实生活中,用户之间可能具有千 丝万缕的联系,导致多个用户之间能够具有某种共性,任何共性都可以用来作为本发明输 入方法中分类用户群组的基础,区别仅仅在于该分类对于群组成员的输入法效率的促进效 果。对于共同拥有很多为群组之外的人所不了解的资源的群组来说,这种群组之间的共享 是最有效果的。例如,上面例子中专业性较强的半导体群组以及同玩网络游戏的玩家群组, 这些群组中的群组成员之间的共同语言对于一般输入法来说常常是比较生僻的词条,诸如 “无卤素树脂”(半导体术语)、“虫族、神族”(网络游戏用语)等。如图所示,用户群组601-604各自包括其群组成员,群组成员可以利用自己的真 实名字或网络ID等来注册到群组。不同的群组所包括的成员可以有重复或交叉。例如,“半 导体领域翻译”群组603和“世博旅游”群组604均包括成员“李梦”,“篮球同盟”群组601 中的成员全部是“正华花园”群组602的成员,因为该篮球同盟就是该小区业主之间的一个 组织。如上所述,各用户群组中被突出显示(图中利用加粗字体表示)的成员(例如,群组601中的张小亮)具有较高优先级,其他成员具有较低优先级。如果需要,还可以设置更 细化的优先级级别。这种优先级区别主要用于群组成员向群组语料库贡献词条时帮助确定 词条的优先级。网络服务器在接收到群组成员反馈或贡献的词条时,将根据其来源用户的 优先级、该词条的当前优先级、最近被选择时间或次数来分配或更新该词条的优先级。词 条优先级是词条属性中重要的一项,用于确定向用户提供的群组词条在备选框中出现的顺 序。例如,“篮球同盟”群组的队长最近拟向群组成员推广腰旗橄榄球运动来提高成员身体 素质,其作为来源用户提供的词条“yq_腰旗”将被赋予比某一成员提供的词条“yq_延庆” 具有更高的优先级。在图6中的下半部分中,还给出了这些用户群组所针对的群组语料库所包含的部 分词条,以补充说明这种用户分组对于输入法的促进意义。例如,其中“正华花园”群组所对 应的群组语料库所包含词条有“xfxch-双福洗车行”、“syj_三友居饭店”、“lj_丽家宝贝” 这些小区周边商户的名称,以及“psy-潘山屹(物业经理名字)”、“rjq_任坚强(业务会主 任)”这样的小区业主熟知常用的词条。图7中示出了根据本发明一个实施例的在网络服务器上维护的群组语料库中群 组词条的属性列表700的示意图。该列表700中列出了用于某个篮球同盟群组的群组语料 库的多个词条。第一列701为该词条的内容,如“zb-走步(篮球技术术语)”、“lb-篮板 (篮球技术术语)”、“bkl-巴克利(篮球明星名字)”以及“huren-湖人(美国NBA篮球队 名字”。除了这些常用的篮球相关词汇,该群组语料库还包括“zhhb-正华杯(小区赛事名 称)”、“yq_腰旗(群组成员活动),,这样的特定群组用语。列表700中第二列至第第七列702-707列出了词条的各个属性,分别为群组标识、 优先级别、被选次数、最近被选择时间、来源用户和/或目标用户。其中需要重点说明的是, 优先级别、来源用户和/或目标用户三个属性。其中优先级别确定了当匹配到多个词条后 以何种顺序向用户提供词条,优先级别较高的词条被排在靠前的位置,并且可选地可以设 定群组词条均优于本地词条的优先级。如前所述,来源用户是指向语料库管理和更新装置 提供该词条的成员用户,该属性将影响该词条的优先级设定。至于目标用户,则是指可以向 其提供该词条的用户范围。例如,可以设定,仅将“xincheng-新成广场”提供给每周参加活 动的篮球队成员,而同样喜欢篮球的外围成员则可以不共享该词条以免不必要地打扰这些 用户。又例如,对于一个以工作内容为基础形成的群组,某些词条的目标用户可以是全体成 员,而另一些词条的目标用户可以仅仅是一部分职员,而排除了与该词条无关联的普通职 员对于该词条的选择。例如,在针对“百度”公司群组的群组语料库中,词条“bdtb-百度贴 吧”、“ssyq-搜索引擎”的目标用户可以是全体成员,而词条“zx-撰写”、“qq_侵权”的目标 用户则可以仅限定为该公司知识产权管理职能部门成员,以进一步提高群组词条反馈的准 确性和用户的输入效率。前面提到,词条优先级属性可以根据被选时间、次数、来源用户等来进行动态调 整,以使得所返回的词条的顺序更符合该群组成员的输入习惯,将最准确的词条选项返回 给用户。众所周知,很多输入法为第一顺位的备选词分配了最方便使用的空格键,而下面顺 序的备选词则需要通过数字键、“ + ”和“_”或者其他快捷键来选择,而在重码很多的情况下 更后面的词条甚至需要用到翻页键。如果能够将最准确的词条排在靠前位置甚至第一位, 无疑将大大节省用户的劳动,提高用户的输入效率。
13
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述 特定实施方式,本领域技术人员可以在所附权利要求的范围内做出各种变形或修改。
权利要求
1.一种在与网络服务器进行通信的用户设备上进行文字输入的方法,该方法包括以下 步骤检测群组中的用户在所述客户端上的输入序列;基于所述输入序列在所述用户设备上的本地语料库中进行匹配查询,以获得一个或多 个匹配的本地词条选项;将所述输入序列发送至所述网络服务器;接收来自所述网络服务器的基于所述输入序列在用户群组对应的群组语料库中进行 匹配查询所获得的一个或多个匹配的群组词条选项;将所述本地词条选项和/或所述群组词条选项汇总并显示给所述用户,供其选择。
2.根据权利要求1所述的方法,其中还包括步骤在进行文字输入之前将所述用户注 册到一个或多个用户群组,所述用户群组与所述群组语料库相关联。
3.根据权利要求1所述的方法,其中还包括步骤所述用户向所述网络服务器发送用 户身份信息,以便所述网络服务器确定与之关联的用户群组,进而确定与之关联的群组语 料库。
4.根据权利要求1所述的方法,其中所述用户将自己选定的词条发送到所述网络服务 器,以便所述网络服务器更新至与所述用户所属用户群组相关联的群组语料库。
5.根据权利要求1所述的方法,其中所述群组语料库中的群组词条具有一个或多个属 性,所述属性包括群组标识、优先级别、被选次数、最近被选择时间、来源用户和/或目标用户。
6.根据权利要求5所述的方法,其中所述用户所获得词条选项范围和顺序基于所述群 组词条的属性。
7.根据权利要求5所述的方法,其中所述用户在所述用户群组中具有不同优先级,所 述网络服务器根据某个词条来源用户的优先级、该词条的当前优先级、最近被选择时间和/ 或被选择次数向该词条分配不同的优先级或更新该词条的优先级。
8.根据权利要求1所述的方法,其中在获得所述本地词条选项之后,在接收到所述群 组词条选项之前,将所获得的本地词条选项显示给用户以供其选择。
9.一种在网络服务器上辅助用户进行文字输入的方法,所述方法包括以下步骤经由网络接收用户在用户设备上的输入序列;基于所述输入序列和用户所加入的群组在对应的群组语料库中进行匹配查询获得一 个或多个匹配的群组词条选项;将所获得的所述群组词条选项反馈回所述用户设备,供用户选择。
10.根据权利要求9所述的方法,其中还包括步骤将所述用户注册到一个或多个用户 群组,所述用户群组与所述群组语料库相关联。
11.根据权利要求9所述的方法,其中还包括步骤接收所述用户的用户身份信息,确 定与之关联的用户群组,进而确定与之关联的群组语料库。
12.根据权利要求9所述的方法,其中接收所述用户在输入时最终选定的词条,更新与 所述用户所属用户群组相关联的群组语料库。
13.根据权利要求9所述的方法,其中所述群组语料库中的群组词条具有一个或多个 属性,所述属性包括群组标识、优先级别、被选次数、最近被选择时间、来源用户和/或目标用户。
14.根据权利要求10所述的方法,其中根据所述群组词条的属性向正在进行输入的用 户提供所述群组词条。
15.根据权利要求9所述的方法,其中所述用户在所述用户群组中具有不同优先级,所 述网络服务器根据某个词条来源用户的优先级、该词条的当前优先级、最近被选择时间和/ 或被选择次数向该词条分配不同的优先级或更新该词条的优先级。
16.根据权利要求9所述的方法,其中通过对与所述用户有关的材料进行学习或训练 来对所述群组语料库进行初始化。
17.—种与网络服务器进行通信的供用户进行文字输入的用户设备,所述用户设备包 括以下装置用于检测群组中的用户的输入序列的装置;用于基于所述输入序列在所述用户设备上的本地语料库中进行匹配查询,以获得一个 或多个匹配的本地词条选项的装置;用于将所述输入序列发送至所述网络服务器的装置;用于接收来自所述网络服务器的基于所述输入序列在用户群组对应的群组语料库中 进行匹配查询所获得的一个或多个匹配的群组词条选项的装置;用于将所述本地词条选项和/或所述群组词条选项汇总并显示给所述用户供其选择 的装置。
18.根据权利要求17所述的用户设备,其中还包括用户侧注册装置,用于在进行文字 输入之前将所述用户注册到一个或多个用户群组,所述用户群组与所述群组语料库相关 联。
19.根据权利要求17所述的用户设备,其中还包括身份信息发送装置,用于向所述网 络服务器发送用户身份信息,用于由所述网络服务器确定与之关联的用户群组,进而确定 与之关联的群组语料库。
20.根据权利要求17所述的用户设备,其中还包括词条发送装置,用于将所述用户选 定的词条发送到所述网络服务器,所述词条由所述网络服务器用于更新与所述用户所属用 户群组相关联的群组语料库。
21.根据权利要求17所述的用户设备,其中所述群组语料库中的群组词条具有一个或 多个属性,所述属性包括群组标识、优先级别、被选次数、最近被选择时间、来源用户和/或 目标用户。
22.根据权利要求21所述的用户设备,其中所述用户所获得词条选项范围和顺序基于 所述群组词条的属性。
23.根据权利要求21所述的用户设备,其中所述用户在所述用户群组中具有不同优先 级,所述网络服务器根据某个词条来源用户的优先级、该词条的当前优先级、最近被选择时 间和/或被选择次数向该词条分配不同的优先级或更新该词条的优先级。
24.根据权利要求17所述的用户设备,其中还包括用于在获得所述本地词条选项之 后,在接收到所述群组词条选项之前,将所获得的本地词条选项显示给用户以供其选择的装置。
25.一种辅助用户进行文字输入的网络服务器,所述网络服务器包括以下装置用于经由网络接收用户在用户设备上的输入序列的装置;用于基于所述输入序列和用户所加入的群组在对应的群组语料库中进行匹配查询获 得一个或多个匹配的群组词条选项的装置;用于将所获得的所述群组词条选项反馈回所述用户设备供用户选择的装置。
26.根据权利要求25所述的网络服务器,其中还包括服务器侧注册装置,用于将所述 用户注册到一个或多个用户群组,所述用户群组与所述群组语料库相关联。
27.根据权利要求25所述的网络服务器,其中还包括身份信息接收装置,用于接收所 述用户的用户身份信息,以便确定与之关联的用户群组,进而确定与之关联的群组语料库。
28.根据权利要求25所述的网络服务器,其中还包括词条接收装置,用于接收所述用 户在输入时最终选定的词条,以便更新与所述用户所属用户群组相关联的群组语料库。
29.根据权利要求25所述的网络服务器,其中所述群组语料库中的群组词条具有一个 或多个属性,所述属性包括群组标识、优先级别、被选次数、最近被选择时间、来源用户和/ 或目标用户。
30.根据权利要求25所述的网络服务器,其中根据所述群组词条的属性向正在进行输 入的用户提供所述群组词条。
31.根据权利要求25所述的网络服务器,其中还包括用于为所述用户赋予在所述用户 群组中的不同优先级,以便根据某个词条来源用户的优先级、该词条的当前优先级、最近被 选择时间和/或被选择次数向该词条分配不同的优先级或更新该词条的优先级的装置。
32.根据权利要求25所述的网络服务器,其中还包括用于通过对与所述用户有关的材 料进行学习或训练来对所述群组语料库进行初始化的装置。
33.一种辅助用户进行文字输入的系统,包括根据权利要求17-24的用户设备和根据 权利要求25-32所述的网络服务器。
全文摘要
本发明提供一种在与网络服务器通信的用户设备端输入文字的方法,该方法包括以下步骤检测按键输入序列;将所述输入序列在用户设备的本地语料库中进行匹配查询,以获得一个或多个匹配的本地词条选项;将所述按键输入序列发送至所述网络服务器;接收来自所述网络服务器的基于所述按键输入序列在网络语料库中进行匹配查询所获得的一个或多个匹配的群组词条选项;将所述本地词条选项和/或所述群组词条选项汇总并显示给用户。本发明还提供一种采用上述方法的设备、网络服务器和系统。本发明的优点用户可以在任何联接互联网的设备上在线使用自己的语料库进行录入,而不需要频繁地同步操作,并且录入时得到强大的网络语料库的支持,提高录入的准确性。
文档编号H04L29/06GK102063452SQ20101018708
公开日2011年5月18日 申请日期2010年5月31日 优先权日2010年5月31日
发明者戴帅湘 申请人:百度在线网络技术(北京)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1