用于在云输入法中更新语言模型的云端服务器及其终端的制作方法

文档序号:6500521阅读:132来源:国知局
用于在云输入法中更新语言模型的云端服务器及其终端的制作方法
【专利摘要】一种用于在云输入法中更新语言模型的云端服务器及其终端。所述云端服务器包括:输入行为收集装置,从多个终端实时收集用户的输入行为,其中,所述输入行为包括用户在输入字符时执行的字符输入操作和控制操作以及相应的输出字符;解析装置,从收集的输入行为解析出最终输出字符以及用于直接生成最终输出字符的有效字符输入;语言模型更新装置,利用包括最终输出字符和有效字符输入的输入配对来更新设置于云端服务器的语言模型。可基于用户的完整输入行为来相对准确地更新语言模型。
【专利说明】用于在云输入法中更新语言模型的云端服务器及其终端

【技术领域】
[0001]本申请涉及云输入技术,更具体地说,涉及一种基于终端用户的输入行为来实时更新语言模型的云端服务器以及相应的终端。

【背景技术】
[0002]随着互联网技术和信息处理技术发展到云计算的时代,基于云计算的各种服务不断增加,其中,云输入是指应用了云计算技术的输入法,利用云输入技术,终端无需下载和安装全部客户端软件,主要通过与云端服务器的在线连接即可完成字符的输入。
[0003]图I示出根据现有技术的云输入系统。如图I所示,各种终端(例如,笔记本电脑、个人计算机和移动终端等)通过互联网与云端服务器连接,通过在终端执行用户输入即能够以在线的方式从云端服务器获取相应的候选字符,相应地,用户可通过从候选字符中选取期望输入的字符来完成输入。
[0004]由于云端服务器的处理能力比终端设备强大很多倍,所以字库容量远远大于客户端软件,相应的输入准确率也得以提高。
[0005]然而,目前的输入法中,通常仅关注于热门词条的更新,即,通过对用户输入相应词语的频率的统计或者通过对互联网中频繁出现的词语的统计来产生热门词条。这种方式仅改变了词语的候选次序,但无法有效全面地反映用户的输入行为。而且,更新的热门词语每次都通过推送的方式传达到终端用户,难以有效地应对海量用户。


【发明内容】

[0006]本发明的目的在于提供一种能够基于终端用户的输入行为来实时更新语言模型的云端服务器以及相应的终端。
[0007]根据本发明的一方面,提供一种用于在云输入法中更新语言模型的云端服务器,包括:输入行为收集装置,用于从多个终端实时收集用户的输入行为,其中,所述输入行为包括用户在输入字符时执行的字符输入操作和控制操作以及相应的输出字符;解析装置,用于从收集的输入行为解析出最终输出字符以及用于直接生成最终输出字符的有效字符输入;语言模型更新装置,用于利用包括最终输出字符和有效字符输入的输入配对来更新设置于云端服务器的语言模型。
[0008]所述云端服务器可还包括:输入行为预处理装置,用于从收集的输入行为中排除误操作输入行为,其中,误操作输入行为是指并非为了产生输出字符而进行的输入行为,其中,解析装置从排除了误操作输入行为以外的输入行为解析出最终输出字符以及用于直接生成最终输出字符的有效字符输入。
[0009]在所述云端服务器中,控制操作可包括以下项中的至少一个:用于确认当前字符的确认操作、用于选择候选字符的选择操作、用于删除输出字符的操作。
[0010]在所述云端服务器中,输入配对以语句为单位,并且,语言模型更新装置可通过以下处理来更新语言模型:将输入配对添加到训练语料,在对作为语句的最终输出字符执行词语切割和词性标注之后,基于获取的词语和相应的有效字符输入来更新语言模型。
[0011]在所述云端服务器中,对于无法进行词语切割的词语,语言模型更新装置可将其中被审核为新词的词语添加到语言模型中。
[0012]根据本发明的另一方面,提供一种用于在云输入法中更新语言模型的方法,包括:从多个终端实时收集用户的输入行为,其中,所述输入行为包括用户在输入字符时执行的字符输入操作和控制操作以及相应的输出字符;从收集的输入行为解析出最终输出字符以及用于直接生成最终输出字符的有效字符输入;利用包括最终输出字符和有效字符输入的输入配对来更新设置于云端服务器的语言模型。
[0013]所述方法可还包括:从收集的输入行为中排除误操作输入行为,其中,误操作输入行为是指并非为了产生输出字符而进行的输入行为,其中,从排除了误操作输入行为以外的输入行为解析出最终输出字符以及用于直接生成最终输出字符的有效字符输入。
[0014]在所述方法中,控制操作包括以下项中的至少一个:用于确认当前字符的确认操作、用于选择候选字符的选择操作、用于删除输出字符的操作。
[0015]在所述方法中,输入配对以语句为单位,并且,更新语言模型的步骤可包括:将输入配对添加到训练语料,在对作为语句的最终输出字符执行词语切割和词性标注之后,基于获取的词语和相应的有效字符输入来更新语言模型。
[0016]所述方法还包括:对于无法进行词语切割的词语,将其中被审核为新词的词语添加到语言模型中。
[0017]根据本发明的另一方面,提供一种用于云输入法的终端,包括:输入单元,用于接收用户在输入字符时执行的字符输入操作和控制操作;收发单元,用于从云端服务器接收与用户的字符输入操作相应的字符;输出单元,用于输出从云端服务器接收的字符,其中,收发单元将用户的输入行为实时地发送到云端服务器,其中,所述输入行为包括用户在输入字符时执行的字符输入操作和控制操作以及相应的输出字符,并且,设置于云端服务器的语言模型基于从各个终端实时发送的用户的输入行为而更新。
[0018]在所述终端中,控制操作包括以下项中的至少一个:用于确认当前字符的确认操作、用于选择候选字符的选择操作、用于删除输出字符的操作。
[0019]根据本发明的示例性实施例,可基于用户的完整输入行为来相对准确地更新语言模型,并通过这种方式直接影响终端用户的输入候选,而无需针对各个用户进行热词或新词的推送。

【专利附图】

【附图说明】
[0020]通过下面结合附图对本发明示例性实施例的描述,本发明的上述和其它目的和特点将会变得更加清楚,其中:
[0021]图I不出根据现有技术的z?输入系统;
[0022]图2示出根据本发明示例性实施例的云端服务器的框图;
[0023]图3示出根据本发明示例性实施例的终端的框图;
[0024]图4示出根据本发明示例性实施例的用于在云输入法中更新语言模型的方法的流程图。

【具体实施方式】
[0025]现将详细参照本发明的实施例,所述实施例的示例在附图中示出,其中,相同的标号始终指的是相同的部件。以下将通过参照附图来说明所述实施例,以便解释本发明。
[0026]图2示出根据本发明示例性实施例的云端服务器的框图。参照图2,根据本发明示例性实施例的云端服务器包括:输入行为收集装置10、解析装置20和语言模型更新装置30。
[0027]在上述云端服务器中,输入行为收集装置10用于从多个终端实时收集用户的输入行为,其中,所述输入行为包括用户在输入字符时执行的字符输入操作和控制操作以及相应的输出字符。这里,为了更准确地反映用户期望输入的内容,输入行为收集装置10所收集的输入行为不限于用户的输入字符,而是包括用户在输入字符时执行的全部操作(包括字符输入操作和控制操作)以及相应的输出字符,从而能更为准确地反映用户的输入意图。
[0028]相应地,解析装置20用于从收集的输入行为解析出最终输出字符以及用于直接生成最终输出字符的有效字符输入。通过解析单元20的上述处理,云端服务器可以从繁杂的用户输入操作中提取出对语言模型更新而言必要且准确的信息。
[0029]此外,语言模型更新装置30用于利用包括最终输出字符和有效字符输入的输入配对来更新设置于云端服务器的语言模型。
[0030]在实际的输入中,有时候会发生一些误操作的情况,例如,儿童胡乱敲击键盘产生一连串无意义的字符,打字时不小心按下某个按键导致错误字符的输入等等。
[0031]为了应对上述问题,所述云端服务器还可额外包括输入行为预处理装置(未示出),用于从收集的输入行为中排除误操作输入行为,其中,误操作输入行为是指并非为了产生输出字符而进行的输入行为,在这种情况下,解析装置20从排除了误操作输入行为以外的输入行为解析出最终输出字符以及用于直接生成最终输出字符的有效字符输入。
[0032]以下参照图3来描述与上述云端服务器连接以实现云输入的终端。如图3所示,根据本发明示例性实施例的终端包括:输入单元100、收发单元200和输出单元300。
[0033]在上述终端中,输入单元100用于接收用户在输入字符时执行的字符输入操作。具体说来,不论用户采用何种输入法(如,拼音输入法或五笔字型输入法),每个字符的输入均对应于一系列字符输入操作。例如,在拼音输入法中,要想输入汉字“我”,则需连续按下与拼音字符“w”和“O”对应的“W”键和“O”键。
[0034]相应地,收发单元200用于从云端服务器接收与用户的字符输入操作相应的字符。例如,当用户的字符输入操作为连续按下“W”键和“O”键时,收发单元200从云端服务器接收相应的字符“I.我”、“2.握”、“3.喔”、“4.窝”等。
[0035]此时,输出单兀300用于输出从云端服务器接收的字符。例如,输出单兀300可输出字符“I.我”、“2.握”、“3.喔”、“4.窝”。
[0036]除了字符输入操作之外,输入单元100还用于接收用户在输入字符时执行的控制操作。作为示例,这里的控制操作可包括以下项中的至少一个:用于确认当前字符的确认操作、用于选择候选字符的选择操作、用于删除输出字符的操作。
[0037]例如,仍旧以用户要想输入汉字“我”为例,在输出单元300输出了字符“I.我”、“2.握”、“3.喔”、“4.窝”的情况下,输入单元100可从用户接收用于确认首选项“我”的“空格”键或用于选择与候选项“我”的序号“ I ”对应的数字键“ I ”。此外,当用户想要删除已经确认的汉字“我”时,输入单元100可从用户接收用于删除输出字符“我”的回退键。
[0038]相应地,收发单元200将用户的输入行为实时地发送到云端服务器,其中,所述输入行为包括用户在输入字符时执行的字符输入操作和控制操作以及相应的输出字符,并且,设置于云端服务器的语言模型基于从各个终端实时发送的用户的输入行为而更新。
[0039]以上述情况为例,在用户想要输入汉字“我”的情况下,收发单元200将用户在输入字符时执行的连续按下“W”键和“O”键的字符输入操作和按下“空格键”或“ I”键的控制操作以及相应的输出字符“我”发送到云端服务器。
[0040]此外,在用户在输入“我”字之后又进行删除的示例中,收发单元200还需要额外地将用于删除“我”字的按下回退键的操作发送到云端服务器。
[0041]由此可见,根据本发明示例性实施例的终端由于向云端服务器发送了用户的全部输入行为,从而能够客观准确地反映用户的输入意图,以便云端服务器更有效地更新语言模型。此外,发送的输入行为中以实际输出的字符为准,进一步提高了反馈信息的准确性。
[0042]以下将参照图4来描述由根据本发明示例性实施例的云端服务器更新语言模型的方法。
[0043]参照图4,在步骤S10,由输入行为收集装置10从多个终端实时收集用户的输入行为,其中,所述输入行为包括用户在输入字符时执行的字符输入操作和控制操作以及相应的输出字符。
[0044]如以上参照图3所述,由于云端服务器从多个终端实时地收集用户的完整输入行为(包括字符输入操作和控制操作),并且,相应的输出字符也从终端反馈给云端服务器,因此,云端服务器能够准确获取用户的输入意图。
[0045]作为附加处理,在收集到用户的输入行为之后,可额外地由输入行为预处理装置从收集的输入行为中排除误操作输入行为,这里,误操作输入行为是指并非为了产生输出字符而进行的输入行为。通过上述处理,能够对用户输入行为的有效性进行进一步的筛选,从而有助于对语言模型进行更为有效的更新。
[0046]接下来,在步骤S20,由解析装置20从用户的输入行为解析出最终输出字符以及用于直接生成最终输出字符的有效字符输入。
[0047]具体说来,当收集的用户输入行为包括:字符输入操作“T”、“U”、“I”、“S”、“E”、指示确认操作的“空格”键输入和指示删除前一字符操作的“回退”键输入、以及相应的输出字符“褪色”时,解析装置20能够从用户的整体输入行为解析出最终输出字符为“褪”,以及用于直接生成最终输出字符“褪”的有效字符输入一字符输入操作“TUI”。
[0048]接下来,在步骤S30,由语言模型更新装置30利用包括最终输出字符和有效字符输入的输入配对来更新设置于云端服务器的语言模型。
[0049]根据上述示例,语言模型更新装置30可利用由最终输出字符“褪”和相应的有效字符输入“TUI”组成的输入配对来更新设置于云端服务器的语言模型。
[0050]此外,作为优选方式,语言模型更新装置30可利用以“语句”为单位的输入配对来更新语言模型。具体说来,假设由解析装置20解析出的输入配对中,最终输出字符为“龚琳娜扮悟空雷人”,相应的有效字符输入为“GONGLINNABANWUKONGLEIREN”,那么,语言模型更新装置30可将上述配对加入训练预料中,通过对语句“龚琳娜扮悟空雷人”执行词语切割和词性标注而得到名词“龚琳娜”、动词“扮”、名词“悟空”、形容词“雷人”,在此基础上,可基于获取的上述词语以及相应的有效字符输入“GONGLINNA”、“BAN”、“WUKONG”和“LEIREN”来更新语言模型。
[0051]可以看出,根据上述优选方式,语言模型更新装置30可基于“语句”为单位来对语言模型进行更新,从而体现了比“热词”统计更为复杂的逻辑关系,有利于建立完备可靠的语言模型,同时还能够完成对“热词”和“新词”的有效处理。
[0052]通过上述更新方式,多次反复输入的“龚丽娜”会得以加强,在语言模型中成为相应的“热词”,从而作为候选项的排序提前。另外,如果遇到无法进行词语切割的词语,语言模型更新装置30可将其中被审核为新词的词语添加到语言模型(例如,用于执行词语切割的词典或系统词库)中,也就是说,通过上述方式,还能够有效地发现新词。
[0053]应注意,以上尽管以拼音输入法作为示例进行了描述,但本发明并不受限于拼音输入法,任何其他的字符输入法均可应用于本发明的云输入系统。
[0054]根据本发明的云端服务器以及相应的终端,可基于用户的完整输入行为来相对准确地更新语言模型,并通过这种方式直接影响终端用户的输入候选,而无需针对各个用户进行热词或新词的推送。此外,通过以语句为单位进行解析和更新,能够更为完整地体现词语在句子中的含义,有助于形成有效的语言模型。由于云端服务器具有强大的处理能力,因此,可针对海量用户进行输入行为的收集,并基于解析出来的有效信息来不断更新(例如,以I小时为单位来进行更新)语言模型,从而使得所述海量用户能够及时使用到与其输入意愿相一致的语言模型。
[0055]本发明的以上各个实施例仅仅是示例性的,而本发明并不受限于此。本领域技术人员应该理解:在不脱离本发明的原理和精神的情况下,可对这些实施例进行改变,其中,本发明的范围在权利要求及其等同物中限定。
【权利要求】
1.一种用于在云输入法中更新语言模型的云端服务器,包括: 输入行为收集装置,用于从多个终端实时收集用户的输入行为,其中,所述输入行为包括用户在输入字符时执行的字符输入操作和控制操作以及相应的输出字符; 解析装置,用于从收集的输入行为解析出最终输出字符以及用于直接生成最终输出字符的有效字符输入; 语言模型更新装置,用于利用包括最终输出字符和有效字符输入的输入配对来更新设置于云端服务器的语言模型。
2.如权利要求1所述的云端服务器,还包括: 输入行为预处理装置,用于从收集的输入行为中排除误操作输入行为,其中,误操作输入行为是指并非为了产生输出字符而进行的输入行为, 其中,解析装置从排除了误操作输入行为以外的输入行为解析出最终输出字符以及用于直接生成最终输出字符的有效字符输入。
3.如权利要求1所述的云端服务器,其中,控制操作包括以下项中的至少一个:用于确认当前字符的确认操作、用于选择候选字符的选择操作、用于删除输出字符的操作。
4.如权利要求1所述的云端服务器,其中,输入配对以语句为单位,并且,语言模型更新装置通过以下处理来更新语言模型:将输入配对添加到训练语料,在对作为语句的最终输出字符执行词语切割和词性标注之后,基于获取的词语和相应的有效字符输入来更新语目模型。
5.如权利要求4所述的云端服务器,其中,对于无法进行词语切割的词语,语言模型更新装置将其中被审核为新词的词语添加到语言模型中。
6.一种用于在云输入法中更新语言模型的方法,包括: 从多个终端实时收集用户的输入行为,其中,所述输入行为包括用户在输入字符时执行的字符输入操作和控制操作以及相应的输出字符; 从收集的输入行为解析出最终输出字符以及用于直接生成最终输出字符的有效字符输入; 利用包括最终输出字符和有效字符输入的输入配对来更新设置于云端服务器的语言模型。
7.如权利要求1所述的方法,还包括: 从收集的输入行为中排除误操作输入行为,其中,误操作输入行为是指并非为了产生输出字符而进行的输入行为, 其中,从排除了误操作输入行为以外的输入行为解析出最终输出字符以及用于直接生成最终输出字符的有效字符输入。
8.如权利要求6所述的方法,其中,控制操作包括以下项中的至少一个:用于确认当前字符的确认操作、用于选择候选字符的选择操作、用于删除输出字符的操作。
9.如权利要求6所述的方法,其中,输入配对以语句为单位,并且,更新语言模型的步骤包括:将输入配对添加到训练语料,在对作为语句的最终输出字符执行词语切割和词性标注之后,基于获取的词语和相应的有效字符输入来更新语言模型。
10.如权利要求9所述的方法,还包括:对于无法进行词语切割的词语,将其中被审核为新词的词语添加到语言模型中。
11.一种用于云输入法的终端,包括: 输入单元,用于接收用户在输入字符时执行的字符输入操作和控制操作; 收发单元,用于从云端服务器接收与用户的字符输入操作相应的字符; 输出单元,用于输出从云端服务器接收的字符, 其中,收发单元将用户的输入行为实时地发送到云端服务器,其中,所述输入行为包括用户在输入字符时执行的字符输入操作和控制操作以及相应的输出字符,并且,设置于云端服务器的语言模型基于从各个终端实时发送的用户的输入行为而更新。
12.如权利要求11所述的终端,其中,控制操作包括以下项中的至少一个:用于确认当前字符的确认操作、 用于选择候选字符的选择操作、用于删除输出字符的操作。
【文档编号】G06F3/023GK104049766SQ201310076668
【公开日】2014年9月17日 申请日期:2013年3月11日 优先权日:2013年3月11日
【发明者】肖日新, 陈龙, 何明哲 申请人:百度国际科技(深圳)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1