一种词条学习的方法、装置和设备与流程

文档序号：16670053发布日期：2019-01-18 23:31阅读：156来源：国知局

本发明涉及输入法技术领域，特别是涉及一种词条学习的方法、装置和设备。

背景技术：

目前，为了使得用户输入更为便捷，许多输入法系统都提供了词条学习的功能。通过词条学习的功能，对于输入法系统中原本没有记录的词条，如果用户输入过该词条，则输入法系统能够记录下来，以便在后续用户再次输入该词条时该词条能够作为候选项提供给用户。例如，假设用户想要输入词条“刘能”但输入法系统原本没有记录词条“刘能”，在用户输入了字符串“liuneng”之后输入法系统还不能给出候选项“刘能”，用户可以依次选择候选项“刘”、“能”，从而将“刘能”上屏，则输入法系统可以将词条“刘能”记录下来，此后，用户再次输入字符串“liuneng”时，输入法系统可以给出候选项“刘能”供用户选择。

发明人经过研究发现，许多情况下，当用户需要输入一个输入法系统中原本没有记录的词条时，由于许多用户习惯输入短字符串而并不习惯长字符串，因此，用户往往会通过多次输入多个字符串输入该词条。例如，假设用户想要输入“刘能”，许多情况下，用户会先输入“liu”并选择候选词“刘”上屏，再输入“neng”并选择候选词“能”上屏，从而输入词条“刘能”。但是，对于用户分多个字符串输入的词条，现有的输入法系统不能记录，这样就导致用户后续再想要输入该词条时输入法系统依然不能给出该词条作为候选项，从而造成用户输入的不便。

技术实现要素：

本发明所要解决的技术问题是，提供一种词条学习的方法、装置和设备，以使得输入法系统能够记录用户分多个字符串输入的词条,从而能够将这种词条作为候选项提供给用户选择，以简化用户输入的复杂程度，提高用户输入的效率。

第一方面，本发明实施例提供了一种词条学习方法，包括：

获取用户通过多个字符串输入的多个初始词条，其中，每一个字符串对应于一个初始词条，所述多个初始词条是相邻连续的多个输入结果；

分析所述多个初始词条组成的目标词条是否具有实际词义；

若所述目标词条具有实际词义，对所述目标词条进行记录。

可选的，所述分析所述多个初始词条组成的目标词条是否具有实际词义，包括：

通过语义理解技术，从语义上分析所述多个初始词条组成的目标词条是否具有实际词义。

可选的，还包括：

基于用户的历史输入数据分析所述用户是否具有短字符串的输入习惯；

若所述用户不具有短字符串的输入习惯，拒绝对所述目标词条进行记录。

可选的，所述若所述目标词条具有实际词义，对所述目标词条进行记录，包括：

若所述目标词条具有强相关性的实际词义，将所述目标词条记录到词库中；

若所述目标词条具有弱相关性的实际词义，将所述目标词条记录到缓存中。

可选的，

若所述目标词条是可查询到的信息，所述目标词条具有强相关性的实际词义；

若所述目标词条是不可查询到的信息，所述目标词条具有弱相关性的实际词义。

可选的，还包括：

在所述目标词条记录在所述缓存中的情况下，响应于用户对所述目标词条的输入操作，将所述目标词条记录到所述词库中。

可选的，还包括：

在所述目标词条记录在所述词库中的情况下，若所述目标词条没有被使用过的时间超过第一时间阈值，将所述目标词条从所述词库中删除并记录到所述缓存中；

在所述目标词条记录在所述缓存中的情况下，若所述目标词条没有被使用过的时间超过第二时间阈值，将所述目标词条从所述缓存中删除。

可选的，还包括：

在所述目标词条已被记录的情况下，记录所述目标词条被用户输入的频度；

其中，所述频度用于确定所述目标词条作为候选项的排序。

可选的，还包括：

在所述目标词条已被记录的情况下，记录所述目标词条的最后输入时间；

其中，所述最后输入时间用于确定所述目标词条作为候选项的排序。

可选的，还包括：

在所述目标词条已被记录的情况下，记录所述目标词条的属性；

其中，所述目标词条的属性用于确定所述目标词条与用户已输入文本的关联性，以确定所述目标词条作为候选项的排序。

可选的，所述多个初始词条包括单字词条和/或多字词条。

第二方面，本发明实施例提供了一种词条学习的装置，包括：

获取单元，用于获取用户通过多个字符串输入的多个初始词条，其中，每一个字符串对应于一个初始词条，所述多个初始词条是连续的多个输入结果；

第一分析单元，用于分析所述多个初始词条组成的目标词条是否具有实际词义；

第一记录单元，用于若所述目标词条具有实际词义，对所述目标词条进行记录。

可选的，所述第一分析单元，具体用于：

通过语义理解技术，从语义上分析所述多个初始词条组成的目标词条是否具有实际词义。

可选的，所述装置还包括：

第二分析单元，用于基于用户的历史输入数据分析所述用户是否具有短字符串的输入习惯；

拒绝单元，用于若所述用户不具有短字符串的输入习惯，拒绝对所述目标词条进行记录。

可选的，所述第一记录单元，具体用于：

若所述目标词条具有强相关性的实际词义，将所述目标词条记录到词库中；

若所述目标词条具有弱相关性的实际词义，将所述目标词条记录到缓存中。

可选的，

若所述目标词条是可查询到的信息，所述目标词条具有强相关性的实际词义；

若所述目标词条是不可查询到的信息，所述目标词条具有弱相关性的实际词义。

可选的，所述装置还包括：

第二记录单元，用于在所述目标词条记录在所述缓存中的情况下，响应于用户对所述目标词条的输入操作，将所述目标词条记录到所述词库中。

可选的，所述装置还包括：

第三记录单元，用于在所述目标词条记录在所述词库中的情况下，若所述目标词条没有被使用过的时间超过第一时间阈值，将所述目标词条从所述词库中删除并记录到所述缓存中；

删除单元，用于在所述目标词条记录在所述缓存中的情况下，若所述目标词条没有被使用过的时间超过第二时间阈值，将所述目标词条从所述缓存中删除。

可选的，所述装置还包括：

第四记录单元，用于在所述目标词条已被记录的情况下，记录所述目标词条被用户输入的频度；

其中，所述频度用于确定所述目标词条作为候选项的排序。

可选的，所述装置还包括：

第五记录单元，用于在所述目标词条已被记录的情况下，记录所述目标词条的最后输入时间；

其中，所述最后输入时间用于确定所述目标词条作为候选项的排序。

可选的，所述装置还包括：

第六记录单元，用于在所述目标词条已被记录的情况下，记录所述目标词条的属性；

其中，所述目标词条的属性用于确定所述目标词条与用户已输入文本的关联性，以确定所述目标词条作为候选项的排序。

可选的，所述多个初始词条包括单字词条和/或多字词条。

第三方面，本发明实施例提供了一种词条学习的设备，包括有存储器，以及一个或者一个以上的程序，其中一个或者一个以上程序存储于存储器中，且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令：

获取用户通过多个字符串输入的多个初始词条，其中，每一个字符串对应于一个初始词条，所述多个初始词条是相邻连续的多个输入结果；

分析所述多个初始词条组成的目标词条是否具有实际词义；

若所述目标词条具有实际词义，对所述目标词条进行记录。

可选的，为了分析所述多个初始词条组成的目标词条是否具有实际词义，所述处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令：

通过语义理解技术，从语义上分析所述多个初始词条组成的目标词条是否具有实际词义。

可选的，所述处理器执行所述一个或者一个以上程序还包含用于进行以下操作的指令：

基于用户的历史输入数据分析所述用户是否具有短字符串的输入习惯；

若所述用户不具有短字符串的输入习惯，拒绝对所述目标词条进行记录。

可选的，为了实现在所述目标词条具有实际词义的情况下对所述目标词条进行记录，所述处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令：

若所述目标词条具有强相关性的实际词义，将所述目标词条记录到词库中；

若所述目标词条具有弱相关性的实际词义，将所述目标词条记录到缓存中。

可选的，

若所述目标词条是可查询到的信息，所述目标词条具有强相关性的实际词义；

若所述目标词条是不可查询到的信息，所述目标词条具有弱相关性的实际词义。

可选的，所述处理器执行所述一个或者一个以上程序还包含用于进行以下操作的指令：

在所述目标词条记录在所述缓存中的情况下，响应于用户对所述目标词条的输入操作，将所述目标词条记录到所述词库中。

可选的，所述处理器执行所述一个或者一个以上程序还包含用于进行以下操作的指令：

在所述目标词条记录在所述缓存中的情况下，若所述目标词条没有被使用过的时间超过第二时间阈值，将所述目标词条从所述缓存中删除。

可选的，所述处理器执行所述一个或者一个以上程序还包含用于进行以下操作的指令：

在所述目标词条已被记录的情况下，记录所述目标词条被用户输入的频度；

其中，所述频度用于确定所述目标词条作为候选项的排序。

可选的，所述处理器执行所述一个或者一个以上程序还包含用于进行以下操作的指令：

在所述目标词条已被记录的情况下，记录所述目标词条的最后输入时间；

其中，所述最后输入时间用于确定所述目标词条作为候选项的排序。

可选的，所述处理器执行所述一个或者一个以上程序还包含用于进行以下操作的指令：

在所述目标词条已被记录的情况下，记录所述目标词条的属性；

其中，所述目标词条的属性用于确定所述目标词条与用户已输入文本的关联性，以确定所述目标词条作为候选项的排序。

可选的，所述多个初始词条包括单字词条和/或多字词条。

第四方面，本发明实施例提供了一种非临时性计算机可读存储介质，当所述存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行一种通信信息的提示方法，所述方法包括：

获取用户通过多个字符串输入的多个初始词条，其中，每一个字符串对应于一个初始词条，所述多个初始词条是相邻连续的多个输入结果；

分析所述多个初始词条组成的目标词条是否具有实际词义；

若所述目标词条具有实际词义，对所述目标词条进行记录。

可选的，所述分析所述多个初始词条组成的目标词条是否具有实际词义，包括：

通过语义理解技术，从语义上分析所述多个初始词条组成的目标词条是否具有实际词义。

可选的，还包括：

基于用户的历史输入数据分析所述用户是否具有短字符串的输入习惯；

若所述用户不具有短字符串的输入习惯，拒绝对所述目标词条进行记录。

可选的，所述若所述目标词条具有实际词义，对所述目标词条进行记录，包括：

若所述目标词条具有强相关性的实际词义，将所述目标词条记录到词库中；

若所述目标词条具有弱相关性的实际词义，将所述目标词条记录到缓存中。

可选的，

若所述目标词条是可查询到的信息，所述目标词条具有强相关性的实际词义；

若所述目标词条是不可查询到的信息，所述目标词条具有弱相关性的实际词义。

可选的，还包括：

在所述目标词条记录在所述缓存中的情况下，响应于用户对所述目标词条的输入操作，将所述目标词条记录到所述词库中。

可选的，还包括：

在所述目标词条记录在所述缓存中的情况下，若所述目标词条没有被使用过的时间超过第二时间阈值，将所述目标词条从所述缓存中删除。

可选的，还包括：

在所述目标词条已被记录的情况下，记录所述目标词条被用户输入的频度；

其中，所述频度用于确定所述目标词条作为候选项的排序。

可选的，还包括：

在所述目标词条已被记录的情况下，记录所述目标词条的最后输入时间；

其中，所述最后输入时间用于确定所述目标词条作为候选项的排序。

可选的，还包括：

在所述目标词条已被记录的情况下，记录所述目标词条的属性；

其中，所述目标词条的属性用于确定所述目标词条与用户已输入文本的关联性，以确定所述目标词条作为候选项的排序。

可选的，所述多个初始词条包括单字词条和/或多字词条。

与现有技术相比，本发明实施例具有以下优点：

在本发明实施例中，当用户通过连续的多个字符串输入连续的多个初始词条时，可以通过分析这多个初始词条组成的目标词条是否具有实际词义，确定是否对目标词条进行记录。因此，对于输入法系统原本没有记录的词条，若用户通过多个字符串才完整输入了该词条，则输入法系统也能够对该词条进行记录，这样，用户后续再想要输入该词条时输入法系统就能够给出该词条作为候选项，从而使得用户输入更加便捷。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例中一个示例性应用场景的框架示意图；

图2为本发明实施例中一种词条学习的方法的流程示意图；

图3为本发明实施例中一种词条学习的装置的结构示意图；

图4为本发明实施例中一种词条学习的设备的结构示意图；

图5为本发明实施例中服务器的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

发明人经过研究发现，对于用户分多个字符串输入的词条，现有的输入法系统不能记录，这样就导致用户后续再想要输入该词条时输入法系统依然不能给出该词条作为候选项，从而造成用户输入的不便。为了解决上述问题，在本发明实施例中，对于用户通过连续的多个字符串输入的多个初始词条，可以通过分析这多个初始词条组成的目标词条是否具有实际词义，确定用户是否通过多个字符串输入了一个完整的词条。若目标词条具有实际词义，则表明用户想要通过多个字符串输入一个完整的词条，则输入法系统可以对目标词条进行记录。这样，用户后续再想要输入该词条时输入法系统就能够给出该词条作为候选项，从而使得用户输入更加便捷。

举例说明，本发明实施例可以应用到如图1所示的场景。在该场景中，终端101可以为用户102提供输入法系统，用户102可以通过与终端101进行交互来使用输入法系统。在用户102使用终端101上的输入法系统的过程中，输入法系统可以获取用户102通过多个字符串输入的多个初始词条，其中，每一个字符串对应于一个初始词条，所述多个初始词条是相邻的输入结果。然后，输入法系统可以分析所述多个初始词条组成的目标词条是否具有实际词义。若所述目标词条具有实际词义，则输入法系统可以对所述目标词条进行记录。

可以理解的是，在上述应用场景中，虽然将本发明实施方式的动作描述为由终端101执行，但是，由于输入法系统可以是终端101和服务器共同提供的，因此，这些动作也可以部分由终端101执行、部分由服务器执行，或者完全由服务器执行。本发明在执行主体方面不受限制，只要执行了本发明实施方式所公开的动作即可。

需要注意的是，上述应用场景仅是为了便于理解本发明而示出，本发明的实施方式在此方面不受任何限制。相反，本发明的实施方式可以应用于适用的任何场景。

下面结合附图，详细说明本发明的各种非限制性实施方式。

示例性方法

参见图2，示出了本发明实施例中一种词条学习的方法的流程示意图。在本实施例中，所述方法例如具体可以包括如下步骤：

201、获取用户通过多个字符串输入的多个初始词条，其中，每一个字符串对应于一个初始词条，所述多个初始词条是相邻连续的多个输入结果。

具体实现时，在用户使用输入法系统进行输入的过程中，用户可以输入连续的多个字符串并为每个字符串确定一个转换出的输入结果，这样就输入了相邻的、连续的多个输入结果。对于连续的多个输入结果，输入法系统可以将每一个输入结果作为一个初始词条进行获取，这样输入法系统就获取了多个初始词条。

作为一种示例，用户先输入字符串“aiyue”并选择“爱乐”作为输入结果，然后输入字符串“zhi”并选择“之”作为输入结果，再输入字符串“城”并选择“城”作为输入结果。其中，用户输入的多个字符串包括“aiyue”、“zhi”和“cheng”，相应的，相邻连续的多个输入结果包括“爱乐”、“之”和“城”，即用户输入的多个初始词条“爱乐”、“之”和“城”，整体上用户输入的文本为“爱乐之城”。

可以理解的是，所述初始词条可以是单字词条和/或多字词条。例如，所述多个初始词条可以都是单字词条。如，对于整体上用户输入的文本“爱乐之城”来说，用户输入的多个字符串可以依次是“ai”、“yue”、“zhi”和“cheng”，多个初始词条可以是“爱”、“乐”、“之”和“城”。又如，所述多个初始词条可以都是多字词条。如，对于整体上用户输入的文本“爱乐之城”来说，用户输入的多个字符串可以是“aiyue”和“zhicheng”，多个初始词条可以是“爱乐”和“之城”。再如，所述多个初始词条可以既包括单字词条又包括多字词条。如，对于整体上用户输入的文本“爱乐之城”来说，用户输入的多个字符串可以是“ai”、“yue”和“zhicheng”，多个初始词条可以是“爱”、“乐”和“之城”。

202、分析所述多个初始词条组成的目标词条是否具有实际词义。

对于201中获取到的多个初始词条，由于所述多个初始词条是连续输入的、相邻在一起的，故所述初始词条可以组成一个目标词条。可以理解的是，在用户使用输入法系统进行输入的过程中这种目标词条通常会大量出现。其中，有些目标词条是具有实际词义的，而有些目标词条并不具有实际词义。在本实施例中，可以通过分析目标词条是否具有实际词义，确定是否对目标词条进行记录。

作为一种示例，实际词义的分析可以通过语义理解技术来实现，也即，202可以具体包括：通过语义理解技术，从语义上分析所述多个初始词条组成的目标词条是否具有实际词义。例如，假设用户输入“我最近看了一部电影，名叫海边的曼彻斯特”这样一段内容，其中，“海边”、“的”和“曼彻斯特”是用户连续输入的三个初始词条，这三个初始词条组成一个目标词条“海边的曼彻斯特”。输入法系统通过语义理解技术对上述用户输入的内容进行分析，可以确定“海边的曼城斯特”是一部电影的名称，从而分析出“海边的曼彻斯特”具有实际词义。又如，假设用户输入“刘能去上班了”这样一段内容，其中，“刘”和“能”是用户连续输入的二个初始词条，这二个初始词条组成一个目标词条“刘能”。输入法系统通过语义理解技术对上述用户输入的内容进行分析，可以确定“刘能”是一个人物的名称，从而分析出“刘能”具有实际词义。203、若所述目标词条具有实际词义，对所述目标词条进行记录。

可以理解的是，输入法系统在目标词条具有实际词义的情况下对目标词条进行记录，这样，用户分多个字符串输入的一个具有实际词义的完整词条能够被输入法系统记录，以用于用户后续对该完整词条的输入。

此外，若目标词条不具有实际词义，输入法系统可以拒绝对目标词条进行记录，这样，若用户分多个字符串输入多个不同的词条而并非一个具有实际词义的完整词条，则输入法系统并不会记录，这样也有助于节省输入法系统占用的存储空间并提高输入法系统查找候选词的效率。

在本实施例的一些实施方式中，考虑到目标词条中可能包含一些具有实际词义的子词条，除了记录目标词条之外，还可以对目标词条中具有实际词义的子词条进行记录。具体地，本实施例的方法还可以包括：对所述目标词条进行分词处理，得到分词结果；分析所述分词结果是否具有实际词义；若所述分词结果具有实际词义，对所述分词结果进行记录。例如，假设用户输入“我最近看了一部电影，名叫爱乐之城”这样一段内容，其中，“爱”、“乐之”和“城”是用户连续输入的三个初始词条，这三个初始词条组成一个目标词条“爱乐之城”。输入法系统通过对目标词条“爱乐之城”进行分词，得到分词结果“爱乐”。输入法系统通过语义理解技术，可以分析出分词结果“爱乐”具有实际词义，即“喜欢音乐”的意思。从而，输入法系统可以对分词结果“爱乐”进行记录。需要说明的是，对于具有实际词义的目标词条，输入法系统可以采用多种不同的实施方式对目标词条进行记录。例如，对于具有实际词义的目标词条，输入法系统可以将该目标词条记录到词库中。又如，对于具有实际词义的目标词条，输入法系统可以将该目标词条记录到缓存中。

在本实施例的一些实施方式中，考虑到词库记录方式的系统资源消耗问题与缓存记录方式的断电数据丢失问题，对于具有实际词义的目标词条，输入法系统可以采用词库与缓存相结合的方式对目标词条进行记录。具体地，203具体可以包括：若所述目标词条具有强相关性的实际词义，将所述目标词条记录到词库中；若所述目标词条具有弱相关性的实际词义，将所述目标词条记录到缓存中。可以理解的是，对于具有实际词义的目标词条来说，有些目标词条所包含的多个初始词条之间存在强相关性，即这些目标词条具有强相关性的实际词义。对于具有强相关性的目标词条来说，用户后续对该目标词条具有输入需求的可能性较高，故输入法系统可以将该目标词条记录到词库中，以保证该目标词条不会丢失。对于具有实际词语的目标词条来说，有些目标词条所包含的多个初始词条之间存在弱相关性，即这些目标词条具有强相关性的实际词义。对于具有弱相关性的目标词条来说，用户后续对该目标词条具有输入需求的可能性较低，故输入法系统可以将该目标词条记录到缓存，以避免该目标词条直接记录到词库时导致词库的存储结构做相应调整，从而避免由此产生的系统资源消耗。由此可见，采用词库与缓存相结合的方式对目标词条进行记录，不仅使得用户后续输入可能性较高的目标词条不会丢失，而且使得用户后续输入可能性较低的目标词条不必存储到词库，从而减少了由词库中增加新词条而产生的系统资源消耗。

可以理解的是，对于具有实际词义的目标词条来说，多种实施方式可以用于区分该目标词条具有强相关性的实际词义还是弱相关性的实际词义。作为一种示例，输入法系统可以根据该目标词条是否属于可查询到的信息来区分该目标词条具有强相关性的实际词义还是弱相关性的实际词义。具体地，若所述目标词条是可查询到的信息，所述目标词条具有强相关性的实际词义；若所述目标词条是不可查询到的信息，所述目标词条具有弱相关性的实际词义。其中，目标词条的查询方式，可以是使用系统时常更新的信息库来查找信息库中是否存在该目标词条。对于具有实际词义的目标词条来说，若输入法系统在信息库中能够查找到该目标词条，则可以确定该目标词条具有强相关性的实际词义，若输入法系统在信息库中查找不到该目标词条，则可以确定该目标词条具有弱相关性的实际词义。或者，目标词条的查询方式，也可以是使用网络搜索的方式查找互联网中是否存在该目标词条。对于具有实际词义的目标词条来说，若输入法系统在互联网中能够查找到该目标词条，则可以确定该目标词条具有强相关性的实际词义，若输入法系统在互联网中查找不到该目标词条，则可以确定该目标词条具有弱相关性的实际词义。

在词库与缓存相结合用于记录目标词条的下，目标词条的记录位置可以根据用户后续输入该目标词条的情况进行调整。

作为一种示例，对记录在缓存中的目标词条来说，若用户后续再次输入了该目标词条，该目标词条可以被认为是用户后续输入可能性较高的词条，则输入法系统可以使用词库对目标词条进行记录。具体地，本实施例例如还可以包括：在所述目标词条记录在所述缓存中的情况下，响应于用户对所述目标词条的输入操作，将所述目标词条记录到所述词库中。

作为另一种示例，对记录在词库中的目标词条来说，若用户后续一定时间内没有输入过该目标词条，该目标词条可以被认为是用户后续输入可能性性较高的词条，则输入法系统可以使用缓存对目标词条进行记录。具体地，本实施例例如还可以包括：在所述目标词条记录在所述词库中的情况下，若所述目标词条没有被使用过的时间超过第一时间阈值，将所述目标词条从所述词库中删除并记录到所述缓存中。其中，所述第一时间阈值例如可以是一个预设的阈值。

作为又一种示例，对记录在缓存中的目标词条来说，若用户后续一定时间内没有输入过该目标词条，该目标词条可以被认为是用户后续几乎不可能再输入的词条，则输入法系统可以不再对该目标词条进行记录。具体地，本实施例例如还可以包括：在所述目标词条记录在所述缓存中的情况下，若所述目标词条没有被使用过的时间超过第二时间阈值，将所述目标词条从所述缓存中删除。其中，所述第二时间阈值例如可以是一个预设的阈值。

可以理解的是，上述第一时间阈值和上述第二时间阈值都可以是预设的阈值，两者可以相同或者也可以不同。例如，第一时间阈值可以是一个相对较大的阈值，第二时间阈值可以是一个相对较小的阈值，也即，第一时间阈值可以大于第二时间阈值。

需要说明的是，输入法系统对目标词条进行记录，是为了适应用户使用短字符串的输入习惯，以便将用户通过多个短字符串输入的一个完整词条记录下来。为此，在一些实施方式中，输入法系统可以根据用户是否具有短字符串的输入习惯来确定是否对用户通过多个字符串输入的目标词条进行记录。具体地，本实施例例如还可以包括：基于用户的历史输入数据，分析所述用户是否具有短字符串的输入习惯；若所述用户不具有短字符串的输入习惯，拒绝对所述目标词条进行记录。其中，对于用户输入习惯的分析，可以采用深度学习技术来实现。可以理解的是，对于那些不具有短字符串输入习惯的用户来说，该用户通常会使用一个字符串输入一个具有实际词义的词条，其输入的多个字符串通常分别对应多个独立的初始词条，这些独立的初始词条组成的目标词条往往不是一个词、不具有实际词义，因此，输入法系统可以不必记录该用户输入过程中产生的目标词条。

可以理解的是，输入法系统对目标词条进行记录，是为了在用户后续输入的过程中已记录的目标词条可以作为候选项向用户提供。而在将目标词条作为候选项向用户提供时，通常要确定目标词条在候选项中的排序。为此，在一些实施方式中，在目标词条已被记录的情况下，输入法系统还可以记录目标词条的相关信息，所述相关信息可以用于确定目标词条作为候选项的排序。

作为一种示例，所述相关信息可以是目标词条被用户输入的频度。也即，本实施例例如还可以包括：在所述目标词条已被记录的情况下，记录所述目标词条被用户输入的频度，其中，所述频度用于确定所述目标词条作为候选项的排序。具体实现时，输入法系统在记录目标词条的时候可以为目标词条记录相应的频度。在目标词条已记录的情况下，输入法系统可以根据用户输入该目标词条的情况不断更新目标词条的频度，其中，用户越频繁地输入该目标词条，则该目标词条的频度越高。若在用户输入时该目标词条可以作为候选项，输入法系统可以根据当前该目标词条的频度确定该目标词条在候选项中的排序位置，其中，当前该目标词条的频度越高，则该目标词条在候选项中的排序位置越靠前。可以理解的是，目标词条被用户输入的频度，可以是用户输入该目标词条的次数，或者也可以是用户输入该目标词条的频率。

作为另一种示例，所述相关信息可以是目标词条最后一次被用户输入的时间。也即，本实施例例如还可以包括：在所述目标词条已被记录的情况下，记录所述目标词条的最后输入时间；其中，所述最后输入时间用于确定所述目标词条作为候选项的排序。具体实现时，输入法系统在记录目标词条的时候可以为目标词条记录相应的最后输入时间。在目标词条已记录的情况下，输入法系统可以在用户每一次输入该目标词条时更新该目标词条的最后输入时间。若在用户输入时该目标词条可以作为候选项，输入法系统可以根据当前该目标词条的最后输入时间确定该目标词条在候选项中的排序位置，其中，当前该目标词条的最后输入时间越晚，则该目标词条在候选项中的排序位置越靠前。

作为又一种示例，所述相关信息可以是目标词条的属性，该属性能够用于确定目标词条与用户已输入的上下文之间的关联性。也即，在所述目标词条已被记录的情况下，记录所述目标词条的属性；其中，所述目标词条的属性用于确定所述目标词条与用户已输入文本的关联性，以确定所述目标词条作为候选项的排序。具体实现时，输入法系统在记录目标词条的时候可以为目标词条记录相应的属性。若在用户输入时该目标词条可以作为候选项，输入法系统可以根据用户已输入的文本与该目标词条的属性来确定用户已输入的文本与该目标词条之间的关联性，再根据关联性确定目标词条在候选项中的位置，其中，关联性越高则目标词条在候选项中的位置越靠前。例如，假设目标词条为“月光男孩”，目标词条的属性为“电影名称”。若用户在已输入“奥斯卡的最佳影片是”的情况下输入了字符串“yueguang”，输入法系统分析出“奥斯卡的最佳影片是”与“电影名称”之间具有较高的关联性，从而可以将“月光男孩”作为比较靠前的候选项提供给用户。

在本实施例中，当用户通过连续的多个字符串输入连续的多个初始词条时，可以通过分析这多个初始词条组成的目标词条是否具有实际词义，确定是否对目标词条进行记录。因此，对于输入法系统原本没有记录的词条，若用户通过多个字符串才完整输入了该词条，则输入法系统也能够对该词条进行记录，这样，用户后续再想要输入该词条时输入法系统就能够给出该词条作为候选项，从而使得用户输入更加便捷。

示例性设备

参见图3，示出了本发明实施例中一种词条学习的装置的结构示意图。在本实施例中，所述装置例如可以包括：

获取单元301，用于获取用户通过多个字符串输入的多个初始词条，其中，每一个字符串对应于一个初始词条，所述多个初始词条是相邻连续的多个输入结果；

第一分析单元302，用于分析所述多个初始词条组成的目标词条是否具有实际词义；

第一记录单元303，用于若所述目标词条具有实际词义，对所述目标词条进行记录。

可选的，所述第一分析单元302，具体用于：

通过语义理解技术，从语义上分析所述多个初始词条组成的目标词条是否具有实际词义。

可选的，所述装置还包括：

第二分析单元，用于基于用户的历史输入数据分析所述用户是否具有短字符串的输入习惯；

拒绝单元，用于若所述用户不具有短字符串的输入习惯，拒绝对所述目标词条进行记录。

可选的，所述第一记录单元303，具体用于：

若所述目标词条具有强相关性的实际词义，将所述目标词条记录到词库中；

若所述目标词条具有弱相关性的实际词义，将所述目标词条记录到缓存中。

可选的，

若所述目标词条是可查询到的信息，所述目标词条具有强相关性的实际词义；

若所述目标词条是不可查询到的信息，所述目标词条具有弱相关性的实际词义。

可选的，所述装置还包括：

第二记录单元，用于在所述目标词条记录在所述缓存中的情况下，响应于用户对所述目标词条的输入操作，将所述目标词条记录到所述词库中。

可选的，所述装置还包括：

第四记录单元，用于在所述目标词条已被记录的情况下，记录所述目标词条被用户输入的频度；

其中，所述频度用于确定所述目标词条作为候选项的排序。

可选的，所述装置还包括：

第五记录单元，用于在所述目标词条已被记录的情况下，记录所述目标词条的最后输入时间；

其中，所述最后输入时间用于确定所述目标词条作为候选项的排序。

可选的，所述装置还包括：

第六记录单元，用于在所述目标词条已被记录的情况下，记录所述目标词条的属性；

其中，所述目标词条的属性用于确定所述目标词条与用户已输入文本的关联性，以确定所述目标词条作为候选项的排序。

可选的，所述多个初始词条包括单字词条和/或多字词条。

参照图4，装置600可以包括以下一个或多个组件：处理组件602，存储器604，电源组件606，多媒体组件606，音频组件610，输入/输出(i/o)的接口612，传感器组件614，以及通信组件616。

处理组件602通常控制装置600的整体操作，诸如与显示，电话呼叫，数据通信，相机操作和记录操作相关联的操作。处理组件602可以包括一个或多个处理器620来执行指令，以完成上述的方法的全部或部分步骤。此外，处理组件602可以包括一个或多个模块，便于处理组件602和其他组件之间的交互。例如，处理部件602可以包括多媒体模块，以方便多媒体组件606和处理组件602之间的交互。

存储器604被配置为存储各种类型的数据以支持在设备600的操作。这些数据的示例包括用于在装置600上操作的任何应用程序或方法的指令，联系人数据，电话簿数据，消息，图片，视频等。存储器604可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(sram)，电可擦除可编程只读存储器(eeprom)，可擦除可编程只读存储器(eprom)，可编程只读存储器(prom)，只读存储器(rom)，磁存储器，快闪存储器，磁盘或光盘。

电源组件606为装置600的各种组件提供电力。电源组件606可以包括电源管理系统，一个或多个电源，及其他与为装置600生成、管理和分配电力相关联的组件。

多媒体组件606包括在所述装置600和用户之间的提供一个输出接口的屏幕。在一些实施例中，屏幕可以包括液晶显示器(lcd)和触摸面板(tp)。如果屏幕包括触摸面板，屏幕可以被实现为触摸屏，以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界，而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中，多媒体组件606包括一个前置摄像头和/或后置摄像头。当设备600处于操作模式，如拍摄模式或视频模式时，前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件610被配置为输出和/或输入音频信号。例如，音频组件610包括一个麦克风(mic)，当装置600处于操作模式，如呼叫模式、记录模式和语音识别模式时，麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器604或经由通信组件616发送。在一些实施例中，音频组件610还包括一个扬声器，用于输出音频信号。

i/o接口612为处理组件602和外围接口模块之间提供接口，上述外围接口模块可以是键盘，点击轮，按钮等。这些按钮可包括但不限于：主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件614包括一个或多个传感器，用于为装置600提供各个方面的状态评估。例如传感器组件614可以检测到设备600的打开/关闭状态，组件的相对定位，例如所述组件为装置600的显示器和小键盘，传感器组件614还可以检测装置600或装置600一个组件的位置改变，用户与装置600接触的存在或不存在，装置600方位或加速/减速和装置600的温度变化。传感器组件614可以包括接近传感器，被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件614还可以包括光传感器，如cmos或ccd图像传感器，用于在成像应用中使用。在一些实施例中，该传感器组件614还可以包括加速度传感器，陀螺仪传感器，磁传感器，压力传感器或温度传感器。

通信组件616被配置为便于装置600和其他设备之间有线或无线方式的通信。装置600可以接入基于通信标准的无线网络，如wifi，2g或3g，或它们的组合。在一个示例性实施例中，通信部件616经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中，所述通信部件616还包括近场通信(nfc)模块，以促进短程通信。例如，在nfc模块可基于射频识别(rfid)技术，红外数据协会(irda)技术，超宽带(uwb)技术，蓝牙(bt)技术和其他技术来实现。

在示例性实施例中，装置600可以被一个或多个应用专用集成电路(asic)、数字信号处理器(dsp)、数字信号处理设备(dspd)、可编程逻辑器件(pld)、现场可编程门阵列(fpga)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述方法。

具体地，本发明实施例提供了一种词条学习的设备，该设备可以具体为装置600，包括有存储器604，以及一个或者一个以上的程序，其中一个或者一个以上程序存储于存储器604中，且经配置以由一个或者一个以上处理器620执行所述一个或者一个以上程序包含用于进行以下操作的指令：

获取用户通过多个字符串输入的多个初始词条，其中，每一个字符串对应于一个初始词条，所述多个初始词条是相邻连续的多个输入结果；

分析所述多个初始词条组成的目标词条是否具有实际词义；

若所述目标词条具有实际词义，对所述目标词条进行记录。

可选的，为了分析所述多个初始词条组成的目标词条是否具有实际词义，所述处理器620执行所述一个或者一个以上程序包含用于进行以下操作的指令：

通过语义理解技术，从语义上分析所述多个初始词条组成的目标词条是否具有实际词义。

可选的，所述处理器620执行所述一个或者一个以上程序还包含用于进行以下操作的指令：

基于用户的历史输入数据分析所述用户是否具有短字符串的输入习惯；

若所述用户不具有短字符串的输入习惯，拒绝对所述目标词条进行记录。

可选的，为了实现在所述目标词条具有实际词义的情况下对所述目标词条进行记录，所述处理器620执行所述一个或者一个以上程序包含用于进行以下操作的指令：

若所述目标词条具有强相关性的实际词义，将所述目标词条记录到词库中；

若所述目标词条具有弱相关性的实际词义，将所述目标词条记录到缓存中。

可选的，

若所述目标词条是可查询到的信息，所述目标词条具有强相关性的实际词义；

若所述目标词条是不可查询到的信息，所述目标词条具有弱相关性的实际词义。

可选的，所述处理器620执行所述一个或者一个以上程序还包含用于进行以下操作的指令：

在所述目标词条记录在所述缓存中的情况下，响应于用户对所述目标词条的输入操作，将所述目标词条记录到所述词库中。

可选的，所述处理器620执行所述一个或者一个以上程序还包含用于进行以下操作的指令：

在所述目标词条记录在所述缓存中的情况下，若所述目标词条没有被使用过的时间超过第二时间阈值，将所述目标词条从所述缓存中删除。

可选的，所述处理器620执行所述一个或者一个以上程序还包含用于进行以下操作的指令：

在所述目标词条已被记录的情况下，记录所述目标词条被用户输入的频度；

其中，所述频度用于确定所述目标词条作为候选项的排序。

可选的，所述处理器620执行所述一个或者一个以上程序还包含用于进行以下操作的指令：

在所述目标词条已被记录的情况下，记录所述目标词条的最后输入时间；

其中，所述最后输入时间用于确定所述目标词条作为候选项的排序。

可选的，所述处理器620执行所述一个或者一个以上程序还包含用于进行以下操作的指令：

在所述目标词条已被记录的情况下，记录所述目标词条的属性；

其中，所述目标词条的属性用于确定所述目标词条与用户已输入文本的关联性，以确定所述目标词条作为候选项的排序。

可选的，所述多个初始词条包括单字词条和/或多字词条。

本发明实施例还提供了一种包括指令的非临时性计算机可读存储介质，例如包括指令的存储器604，上述指令可由装置600的处理器620执行以完成上述方法。例如，所述非临时性计算机可读存储介质可以是rom、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等。

一种非临时性计算机可读存储介质，当所述存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行一种通信信息的提示方法，所述方法包括：

获取用户通过多个字符串输入的多个初始词条，其中，每一个字符串对应于一个初始词条，所述多个初始词条是相邻连续的多个输入结果；

分析所述多个初始词条组成的目标词条是否具有实际词义；

若所述目标词条具有实际词义，对所述目标词条进行记录。

图5是本发明实施例中服务器的结构示意图。该服务器1900可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上中央处理器(centralprocessingunits，cpu)1922(例如，一个或一个以上处理器)和存储器1932，一个或一个以上存储应用程序1942或数据1944的存储介质1930(例如一个或一个以上海量存储设备)。其中，存储器1932和存储介质1930可以是短暂存储或持久存储。存储在存储介质1930的程序可以包括一个或一个以上模块(图示没标出)，每个模块可以包括对服务器中的一系列指令操作。更进一步地，中央处理器1922可以设置为与存储介质1930通信，在服务器1900上执行存储介质1930中的一系列指令操作。

服务器1900还可以包括一个或一个以上电源1926，一个或一个以上有线或无线网络接口1950，一个或一个以上输入输出接口1958，一个或一个以上键盘1956，和/或，一个或一个以上操作系统1941，例如windowsservertm，macosxtm，unixtm,linuxtm，freebsdtm等等。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本发明的真正范围和精神由下面的权利要求指出。

应当理解的是，本发明并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：侯柏岑
技术所有人：北京搜狗科技发展有限公司
我是此专利的发明人

上一篇：一种叠层结构制孔时叠层界面的自动识别方法与流程
上一篇：一种土家构树保健布鞋及其制备方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。