更新输入法词库的方法及装置与流程

文档序号:12824116阅读:516来源:国知局
更新输入法词库的方法及装置与流程

本公开涉及输入法技术领域,特别涉及一种更新输入法词库的方法及装置。



背景技术:

输入法应用(简称“输入法”)是用于将各种符号(包括数字、字母、文字等)输入计算机或其它设备(如手机)的应用程序。输入法词库中的词汇量决定了输入法应用所能提供的候选词的数量。在实际应用中,需要对输入法词库进行更新,以增加其词汇量。

当用户需要输入一个在输入法词库中已有的字词序列时,输入法应用能够根据用户输入的编码序列在候选词中直接显示上述字词序列;当用户需要输入一个在输入法词库中没有的字词序列时,输入法应用需要用户逐字进行选择,进而得到完整的字词序列。例如,假设输入法词库中已经存储字词序列“聚会”但并未存储字词序列“聚绚”。当用户需要输入“聚会”时,输入编码序列“juhui”,输入法应用从输入法词库中查找得到的候选词中包括“聚会”。当用户需要输入“聚绚”时,输入编码序列“juxuan”,由于输入法词库中并没有“聚绚”一词,用户需要分两次从候选词中分别选择“聚”和“绚”。

在相关技术中,输入法应用在检测到用户通过逐字选择的方式输入某一词之后,如果该词并未存储在输入法词库中,则输入法应用将该词添加至输入法词库中,以增加输入法词库中的词汇量,以使得后续用户再次输入该词时不必再逐字选择。例如,用户第一次输入“聚绚”时需要逐字选择,当输入法应用将“聚绚”添加至输入法词库之后,用户再次输入“聚绚”时可直接输入。



技术实现要素:

本公开实施例提供了一种更新输入法词库的方法及装置。所述技术方案如下:

根据本公开实施例的第一方面,提供了一种更新输入法词库的方法,所述方法包括:

根据对应于已输入的目标词语的删除操作信号,删除所述目标词语中的至少一个汉字,得到保留字段;其中,所述目标词语包括至少两个汉字,所述保留字段包括至少一个汉字;

将所述保留字段和目标字段拼接,形成合成词;其中,所述目标字段包括:位于所述保留字段之前且与所述保留字段相邻的第一字段,和/或,位于所述保留字段之后且与所述保留字段相邻的第二字段;所述第一字段包括至少一个汉字,且所述第一字段为一个汉字或一个词语或一个词语删除至少一个汉字后的剩余汉字;所述第二字段包括至少一个汉字,且所述第二字段为一个汉字或一个词语或一个词语删除至少一个汉字后的剩余汉字;

将所述合成词添加至输入法词库中。

可选地,所述目标字段包括所述第一字段,所述合成词为第一合成词;

所述将所述保留字段和目标字段拼接,形成合成词,包括:

将所述第一字段和所述保留字段拼接,形成所述第一合成词;其中,所述第一合成词中所述第一字段的最后一个汉字与所述保留字段的第一个汉字相连。

可选地,所述目标字段包括所述第二字段,所述合成词为第二合成词;

所述将所述保留字段和目标字段拼接,形成合成词,包括:

将所述保留字段和所述第二字段拼接,形成所述第二合成词;其中,所述第二合成词中所述保留字段的最后一个汉字与所述第二字段的第一个汉字相连。

可选地,所述目标字段包括所述第一字段和所述第二字段,所述合成词为第三合成词;

所述将所述保留字段和目标字段拼接,形成合成词,包括:

将所述第一字段、所述保留字段和所述第二字段顺次拼接,形成所述第三合成词;其中,所述第三合成词中所述第一字段的最后一个汉字与所述保留字段的第一个汉字相连,所述保留字段的最后一个汉字与所述第二字段的第一个汉字相连。

可选地,所述方法还包括:

输入第一词语,所述第一词语为所述第一字段;

或者,

输入第一词语;根据对应于所述第一词语的删除操作信号,删除所述第一词语中的至少一个汉字,得到所述第一字段;

或者,

输入第一汉字,所述第一汉字为所述第一字段。

可选地,所述方法还包括:

输入第二词语,所述第二词语为所述第二字段;

或者,

输入第二词语;根据对应于所述第二词语的删除操作信号,删除所述第二词语中的至少一个汉字,得到所述第二字段;

或者,

输入第二汉字,所述第二汉字为所述第二字段。

可选地,所述方法还包括:

更新所述合成词对应的输入次数;

当所述合成词对应的输入次数达到预设次数时,执行所述将所述合成词添加至输入法词库中的步骤。

可选地,所述方法还包括:

在所述合成词对应的输入次数大于等于1且不足所述预设次数的情况下,检测输入的字词序列中是否包括所述合成词;

若所述字词序列中包括所述合成词,则更新所述合成词对应的输入次数。

根据本公开实施例的第二方面,提供了一种更新输入法词库的装置,所述装置包括:

汉字删除模块,被配置为根据对应于已输入的目标词语的删除操作信号,删除所述目标词语中的至少一个汉字,得到保留字段;其中,所述目标词语包括至少两个汉字,所述保留字段包括至少一个汉字;

合成词形成模块,被配置为将所述保留字段和目标字段拼接,形成合成词;其中,所述目标字段包括:位于所述保留字段之前且与所述保留字段相邻的第一字段,和/或,位于所述保留字段之后且与所述保留字段相邻的第二字段;所述第一字段包括至少一个汉字,且所述第一字段为一个汉字或一个词语或一个词语删除至少一个汉字后的剩余汉字;所述第二字段包括至少一个汉字,且所述第二字段为一个汉字或一个词语或一个词语删除至少一个汉字后的剩余汉字;

词库更新模块,被配置为将所述合成词添加至输入法词库中。

可选地,所述目标字段包括所述第一字段,所述合成词为第一合成词;

所述合成词形成模块,被配置为将所述第一字段和所述保留字段拼接,形成所述第一合成词;其中,所述第一合成词中所述第一字段的最后一个汉字与所述保留字段的第一个汉字相连。

可选地,所述目标字段包括所述第二字段,所述合成词为第二合成词;

所述合成词形成模块,被配置为将所述保留字段和所述第二字段拼接,形成所述第二合成词;其中,所述第二合成词中所述保留字段的最后一个汉字与所述第二字段的第一个汉字相连。

可选地,所述目标字段包括所述第一字段和所述第二字段,所述合成词为第三合成词;

所述合成词形成模块,被配置为将所述第一字段、所述保留字段和所述第二字段顺次拼接,形成所述第三合成词;其中,所述第三合成词中所述第一字段的最后一个汉字与所述保留字段的第一个汉字相连,所述保留字段的最后一个汉字与所述第二字段的第一个汉字相连。

可选地,所述装置还包括:

第一获取模块,被配置为:输入第一词语,所述第一词语为所述第一字段;或者,输入第一词语;根据对应于所述第一词语的删除操作信号,删除所述第一词语中的至少一个汉字,得到所述第一字段;或者,输入第一汉字,所述第一汉字为所述第一字段。

可选地,所述装置还包括:

第二获取模块,被配置为:输入第二词语,所述第二词语为所述第二字段;或者,输入第二词语;根据对应于所述第二词语的删除操作信号,删除所述第二词语中的至少一个汉字,得到所述第二字段;或者,输入第二汉字,所述第二汉字为所述第二字段。

可选地,所述装置还包括:

次数更新模块,被配置为更新所述合成词对应的输入次数;

所述词库更新模块,还被配置为当所述合成词对应的输入次数达到预设次数时,执行所述将所述合成词添加至输入法词库中的步骤。

可选地,所述装置还包括:

合成词检测模块,被配置为在所述合成词对应的输入次数大于等于1且不足所述预设次数的情况下,检测输入的字词序列中是否包括所述合成词;

所述次数更新模块,还被配置为在所述字词序列中包括所述合成词的情况下,更新所述合成词对应的输入次数。

根据本公开实施例的第三方面,提供了一种更新输入法词库的装置,所述装置包括:

处理器;

用于存储所述处理器的可执行指令的存储器;

其中,所述处理器被配置为:

根据对应于已输入的目标词语的删除操作信号,删除所述目标词语中的至少一个汉字,得到保留字段;其中,所述目标词语包括至少两个汉字,所述保留字段包括至少一个汉字;

将所述保留字段和目标字段拼接,形成合成词;其中,所述目标字段包括:位于所述保留字段之前且与所述保留字段相邻的第一字段,和/或,位于所述保留字段之后且与所述保留字段相邻的第二字段;所述第一字段包括至少一个汉字,且所述第一字段为一个汉字或一个词语或一个词语删除至少一个汉字后的剩余汉字;所述第二字段包括至少一个汉字,且所述第二字段为一个汉字或一个词语或一个词语删除至少一个汉字后的剩余汉字;

将所述合成词添加至输入法词库中。

本公开实施例提供的技术方案可以包括以下有益效果:

通过将删除目标词语中的部分汉字后得到的保留字段与目标字段拼接形成合成词,并将合成词添加至输入法词库中;解决了相关技术中输入法应用所提供的自动学词功能不够完善,导致输入法词库的词汇量不够全面,影响用户输入效率的技术问题;实现了对采用组词后删除汉字的方式输入的字词序列进行自动学词,以使得自动学词功能更加完善,输入法词库的词汇量更加丰富,提升输入效率。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。

图1是根据一示例性实施例示出的一种更新输入法词库的方法的流程图;

图2是根据另一示例性实施例示出的一种更新输入法词库的方法的流程图;

图3是根据一示例性实施例示出的一种更新输入法词库的装置的框图;

图4是根据另一示例性实施例示出的一种更新输入法词库的装置的框图;

图5是根据一示例性实施例示出的一种装置的框图。

具体实施方式

这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

在相关技术中,输入法应用虽然提供了针对用户通过逐字选择的方式输入的字词序列进行自动学词的功能,但其自动学词功能仍然不够完善。当用户需要输入人名、自造词、新兴词汇等输入法词库中并不存在的字词序列时,为了输入方便,减少逐字选择的麻烦,对于所需输入的字词序列中的每一个汉字,用户通常先输入一个包含有该汉字的常用词语(该常用词语已经在输入法词库中存在),而后将该常用词语中的其它汉字删除,留下所需输入的那个汉字。例如,当用户需要输入“聚绚”时,可以先输入“聚会”,删除“会”字,然后输入“绚丽”,删除“丽”字,最终剩下“聚绚”二字。针对上述情况,由于用户并未逐字选择输入,因此输入法应用的自动学词功能并不会将“聚绚”添加至输入法词库中,导致用户后续再次输入“聚绚”时仍然需要采用逐字选择的方式或者采用组词后删除汉字的方式,操作较为复杂,输入效率较低。

基于此,本公开实施例提供了一种更新输入法词库的方法,和基于这个方法的装置,以解决相关技术中存在的问题。本公开实施例提供的技术方案,能够实现对上述采用组词后删除汉字的方式输入的字词序列进行自动学词,以使得自动学词功能更加完善,输入法词库的词汇量更加丰富,提升输入效率。

本公开实施例提供的方法,各步骤的执行主体可以是终端。例如,手机、平板电脑、电子书阅读器、多媒体播放设备、pda(personaldigitalassistant,个人数字助理)、可穿戴设备、计算机等终端。可选地,终端中安装运行有输入法应用,各步骤的执行主体可以是输入法应用,该输入法应用具备中文输入功能。为了简化说明,在下述各方法实施例中,除特别说明之外,仅以各步骤的执行主体为输入法应用进行举例说明,但对此不构成限定。

图1是根据一示例性实施例示出的一种更新输入法词库的方法的流程图。该方法可以包括如下几个步骤:

在步骤101中,根据对应于已输入的目标词语的删除操作信号,删除目标词语中的至少一个汉字,得到保留字段。

目标词语包括至少两个汉字,保留字段包括至少一个汉字。

目标词语是输入法词库中已经存储的词语。输入法词库用于保存输入法应用所能提供的各个候选字词。其中,输入法词库中保存的词语可以是使用频次较高的词语,也可以是符合用户的输入习惯的词语,还可以是符合汉语使用规则的词语,等等。

用户在输入目标词语时,输入法应用获取到用户输入的目标词语对应的编码序列之后,直接将目标词语作为候选词提供给用户,用户可以从输入法应用提供的候选词中直接选择到目标词语。以目标词语为“聚会”为例,用户输入编码序列“juhui”之后,输入法应用提供的候选词包括“聚会”、“钜惠”、“聚汇”等。

可选地,删除操作信号由终端设备在接收到对应于实现删除功能的控件的触发信号后生成,上述控件可以是实体控件,也可以是虚拟控件。示例性地,实现删除功能的控件是键盘中的回车键或者删除键。

删除操作信号的数量可以是一个,可以是多个。

当删除操作信号的数量为一个时,输入法应用先获取对应于目标词语中的汉字的选择信号,然后获取删除操作信号对上述汉字进行删除。示例性地,目标词语为“顺口溜”,输入法应用获取对应于“顺口”的选择信号,然后通过获取一个删除操作信号,同时对“顺口”两个汉字进行删除。

当删除操作信号的数量为多个时,输入法应用根据多个删除操作信号对目标词语中的汉字进行依次删除。示例性地,目标词语为“顺口溜”,输入法应用先根据第一个删除操作信号对“口”进行删除,再根据第二个删除操作信号对“顺”进行删除。

保留字段是指对目标词语中的部分汉字进行删除后的剩余汉字。示例性地,目标词语为“结合”,输入法应用对目标词语中的部分汉字进行删除后得到的保留字段为“结”,目标词语为“顺口溜”,输入法应用对目标词语中的部分汉字进行删除后得到的保留字段为“溜”。

可选地,输入法应用检测保留字段中是否仅有一个汉字;如果是,则执行下述步骤102;如果否,则不执行下述步骤102,结束流程。通过上述方式,输入法应用仅针对用户将某一词语删除剩余一个汉字的情况触发本实施例提供的自动学词功能,而对于用户将某一词语删除剩余多个汉字的情况不触发本实施例提供的自动学词功能。

在步骤102中,将保留字段和目标字段拼接,形成合成词。

目标字段包括:位于保留字段之前且与保留字段相邻的第一字段,和/或,位于保留字段之后且与保留字段相邻的第二字段。第一字段包括至少一个汉字,且第一字段为一个汉字或一个词语或一个词语删除至少一个汉字后的剩余汉字。第二字段包括至少一个汉字,且第二字段为一个汉字或一个词语或一个词语删除至少一个汉字后的剩余汉字。

下面,结合目标字段的几种可能实现方式,对形成合成词的方式进行介绍说明。

在第一种可能的实现方式中,目标字段包括第一字段,合成词为第一合成词。输入法应用将第一字段和保留字段拼接,形成第一合成词。其中,第一合成词中第一字段的最后一个汉字与保留字段的第一个汉字相连。

例如,用户依次输入“木村”和“开拓”两个词语,输入法应用根据删除操作信号对目标词语“开拓”中的“开”进行删除,得到保留字段“拓”。位于保留字段之前且与保留字段相邻的词语“木村”为第一字段。输入法应用将第一字段“木村”与保留字段“拓”拼接,形成第一合成词“木村拓”。

可选地,第一字段的形成包括如下的几种方式。

1、输入法应用输入第一词语,上述第一词语为第一字段。其中,第一词语在保留字段之前且与保留字段相邻。示例性地,用户依次输入“聚会”与“绚丽”两个词语,其中,对目标词语“绚丽”中的“丽”字进行删除得到保留字段“绚”,保留字段之前且与保留字段相邻的第一词语“聚会”被确定为第一字段,输入法应用将第一字段“聚会”与保留字段“绚”拼接,形成第一合成词“聚会绚”。

2、输入法应用输入第一词语;根据对应于第一词语的删除操作信号,删除第一词语中的至少一个汉字,得到第一字段。也即,输入法应用对第一词语中的部分汉字进行删除后得到的剩余汉字被确定为第一字段,其中,第一词语在保留字段之前且与保留字段相邻。示例性地,用户依次输入“聚会”与“绚丽”两个词语,其中,对目标词语“绚丽”中的“丽”字进行删除得到保留字段“绚”,对第一词语“聚会”中的“会”字进行删除得到的剩余汉字“聚”被确定为第一字段,输入法应用将第一字段“聚”与保留字段“绚”拼接,形成第一合成词“聚绚”。

可选地,输入法应用检测删除后剩余的第一字段中是否仅有一个汉字;如果是,则将保留字段和第一字段拼接,形成合成词;如果否,则不执行拼接形成合成词的步骤,结束流程。

3、输入法应用输入第一汉字,上述第一汉字为第一字段。其中,第一汉字在保留字段之前且与保留字段相邻。示例性地,用户依次输入“聚”与“绚丽”,其中,对目标词语“绚丽”中的“丽”字进行删除得到保留字段“绚”,在保留字段之前且与保留字段相邻的第一汉字“聚”被确定为第一字段,输入法应用将第一字段“聚”与保留字段“绚”拼接,形成第一合成词“聚绚”。

在第二种可能的实现方式中,目标字段包括第二字段,合成词为第二合成词。输入法应用将保留字段和第二字段拼接,形成第二合成词。其中,第二合成词中保留字段的最后一个汉字与第二字段的第一个汉字相连。

例如,用户依次输入“池水”和“田野”两个词语,输入法应用根据删除操作信号对目标词语“池水”中的“水”进行删除,得到保留字段“池”,位于保留字段之后且与保留字段相邻的词语“田野”为第二字段。输入法应用将保留字段“池”与第二字段“田野”拼接,形成第二合成词“池田野”。

可选地,第二字段的形成包括如下的几种方式。

1、输入法应用输入第二词语,上述第二词语为第二字段。其中,第二词语在保留字段之后且与保留字段相邻。示例性地,用户依次输入“聚会”与“绚丽”两个词语,其中,对目标词语“聚会”中的“会”字进行删除得到保留字段“聚”,在保留字段之后且与保留字段相邻的第二词语“绚丽”被确定为第二字段,输入法应用将保留字段“聚”与第二字段“绚丽”拼接,形成第二合成词“聚绚丽”。

2、输入法应用输入第二词语,根据对应于第二词语的删除操作信号,删除第二词语中的至少一个汉字,得到第二字段。也即,输入法应用对第二词语中的部分汉字进行删除后得到的剩余汉字被确定为第二字段,其中,第二词语在保留字段之后且与保留字段相邻。示例性地,用户依次输入“聚会”与“绚丽”两个词语,其中,对目标词语“聚会”中的“会”字进行删除得到保留字段“聚”,对第二词语“绚丽”中的“丽”字进行删除得到的剩余汉字“绚”被确定为第二字段,输入法应用将保留字段“聚”与第二字段“绚”拼接,形成第二合成词“聚绚”。

可选地,输入法应用检测删除后剩余的第二字段中是否仅有一个汉字;如果是,则将保留字段和第二字段拼接,形成合成词;如果否,则不执行拼接形成合成词的步骤,结束流程。

3、输入法应用输入第二汉字,上述第二汉字为第二字段。其中,第二汉字在保留字段之前且与保留字段相邻。示例性地,用户依次输入“聚会”与“绚”,其中,对目标词语“聚会”中的“会”字进行删除得到保留字段“聚”,在保留字段之后且与保留字段相邻的第二汉字“绚”被确定为第二字段,输入法应用将保留字段“聚”与第二字段“绚”拼接,形成第二合成词“聚绚”。

在第三种可能的实现方式中,目标字段包括第一字段和第二字段,合成词为第三合成词。输入法应用将第一字段、保留字段和第二字段顺次拼接,形成第三合成词。其中,第三合成词中第一字段的最后一个汉字与保留字段的第一个汉字相连,保留字段的最后一个汉字与第二字段的第一个汉字相连。

例如,用户依次输入“清水”、“美丽”与“贵”,输入法应用根据删除操作信号对目标词语“美丽”中的“丽”进行删除,得到保留字段“美”,与保留字段相邻且在保留字段之前的“清水”被确定为第一字段,与保留字段相邻且在保留字段之后的“贵”被确定为第二字段。输入法应用将第一字段“清水”、保留字段“美”和第二字段“贵”顺次拼接,形成第三合成词“清水美贵”。

有关第一字段和第二字段的形成方式参见上文介绍说明,此处不再赘述。

在实际应用中,输入法应用可以形成上述第一合成词、第二合成词、第三合成词中的至少一种。

在步骤103中,将合成词添加至输入法词库中。

输入法应用将合成词添加至输入法词库中,以实现对输入法词库的更新。

可选地,输入法应用将合成词添加至本地的输入法词库和服务器的输入法词库中的前一种或全部两种。其中,上述服务器是输入法应用对应的后台服务器。

输入法应用将合成词添加至服务器的输入法词库时,其他用户在输入合成词时,输入法词库也能将合成词作为候选词提供给上述用户,进而提高其他用户的输入效率。

可选地,在步骤103之后,还包括如下步骤:获取合成词对应的编码序列;从输入法词库中查找获取与上述编码序列对应的至少一个候选词,上述至少一个候选词中包括合成词;显示获取的候选词。

以拼音输入法为例,编码序列可以是合成词对应的完整拼音,可以是合成词中第一个汉字的完整拼音以及合成词中其它汉字的拼音首字母,还可以是合成词中每个汉字的拼音首字母,等等。示例性地,对于合成词“聚芳”,其对应的编码序列可以是“jufang”,可以是“juf”,还可以是“jf”,等等。

综上所述,本公开实施例提供的方法,通过将删除目标词语中的部分汉字后得到的保留字段与目标字段拼接形成合成词,并将合成词添加至输入法词库中;解决了相关技术中输入法应用所提供的自动学词功能不够完善,导致输入法词库的词汇量不够全面,影响用户输入效率的技术问题;实现了对采用组词后删除汉字的方式输入的字词序列进行自动学词,以使得自动学词功能更加完善,输入法词库的词汇量更加丰富,提升输入效率。

在基于图1所示实施例提供的一个可选的实施例中,请参考图2,步骤103之前,还可以包括如下步骤。

在步骤104中,更新合成词对应的输入次数。

对于任意一个合成词来说,输入法应用在每一次形成该合成词之后,将该合成词对应的输入次数增加1。以合成词“聚绚”为例,输入法应用在第一次形成该合成词“聚绚”之后,将该合成词“聚绚”对应的输入次数由0更新为1;输入法应用在第二次形成该合成词“聚绚”之后,将该合成词“聚绚”对应的输入次数由1更新为2,以此类推。其中,对于某一个合成词来说,各次形成该合成词的方式可以相同,也可以不同。

在步骤105中,检测合成词对应的输入次数是否超过预设次数。若是,则执行步骤103;若否,则结束流程。

预设次数是根据输入法词库对词语的使用频次的要求设定的。其中,输入法词库可以是终端本地的输入法词库,也可以是服务器的输入法词库。

终端本地的输入法词库仅为一台终端提供候选词,因此其对词语的使用频次要求可以较低。例如,对于终端本地的输入法词库的更新条件,其预设次数设定为3次。服务器的输入法词库为所有终端提供候选词,因此其对词语的使用频次要求可以较高。例如,对于服务器的输入法词库的更新条件,其预设次数设定为100次。

可选地,对于任意一个合成词来说,在合成词对应的输入次数大于等于1且不足预设次数的情况下,输入法应用检测输入的字词序列中是否包括该合成词;若字词序列中包括该合成词,则更新该合成词对应的输入次数。

在合成词对应的输入次数大于等于1且不足预设次数的情况下,不论合成词采用何种方式输入或形成,只要当输入法应用在用户输入的字词序列中检测到包括该合成词时,均对该合成词对应的输入次数进行更新。例如,输入法应用根据图1所示实施例提供的方法形成合成词,或者输入法应用获取采用逐字输入方式输入的合成词,或者输入法应用获取采用复制方式输入对合成词,等等。

综上所述,本公开实施例提供的方法,还通过对合成词对应的输入次数进行检测,在合成词对应的输入次数超过预设次数的情况下,将合成词添加至输入法词库中,实现对使用频次较低的合成词进行筛选,避免将使用频次较低的合成词添加至输入法词库中。

下面,通过几个示例对本公开提供的技术方案进行介绍说明。

第一方面,在目标字段包括第一字段的情况下,输入法应用生成合成词包括如下几个示例。

在第一个示例中,包括如下步骤:

1、输入第一词语;

2、根据对应于第一词语的删除操作信号,删除第一词语中的至少一个汉字,得到第一字段;

3、输入目标词语;

4、根据对应于目标词语的删除操作信号,删除目标词语中的至少一个汉字,得到保留字段;

5、将第一字段和保留字段拼接,形成合成词;

6、将合成词添加至输入法词库中。

上述第一词语位于目标词语之前,且与目标词语相邻。

例如,用户输入第一词语“建国”后删除“国”字得到第一字段“建”,用户输入目标词语“芬芳”后删除“芳”字得到保留字段“芬”,输入法应用将第一字段“建”和保留字段“芬”拼接形成合成词“建芬”,并将合成词“建芬”添加至输入法词库中。

另外,对于上述步骤1至4的执行先后顺序,本实施例不作限定。例如,上述步骤1至4的执行先后顺序可以依次为:1、2、3、4,或者1、3、2、4,或者1、3、4、2,或者3、4、1、2,或者3、1、2、4,或者3、1、4、2。

在第二个示例中,包括如下步骤:

1、输入第一汉字;

2、输入目标词语;

3、根据对应于目标词语的删除操作信号,删除目标词语中的至少一个汉字,得到保留字段;

4、将第一汉字和保留字段拼接,形成合成词;

5、将合成词添加至输入法词库中。

上述第一汉字位于目标词语之前,且与目标词语相邻。

例如,用户输入第一汉字“建”,用户输入目标词语“芬芳”后删除“芳”字得到保留字段“芬”,输入法应用将第一汉字“建”和保留字段“芬”拼接形成合成词“建芬”,并将合成词“建芬”添加至输入法词库中。

另外,对于上述步骤1至3的执行先后顺序,本实施例不作限定。例如,上述步骤1至3的执行先后顺序可以依次为:1、2、3,或者2、1、3,或者2、3、1。

在第三个示例中,包括如下步骤:

1、输入第一词语;

2、输入目标词语;

3、根据对应于目标词语的删除操作信号,删除目标词语中的至少一个汉字,得到保留字段;

4、将第一词语和保留字段拼接,形成合成词;

5、将合成词添加至输入法词库中。

上述第一词语位于目标词语之前,且与目标词语相邻。

例如,用户输入第一词语“本田”,用户输入目标词语“最佳”后删除“最”字得到保留字段“佳”,输入法应用将第一词语“本田”和保留字段“佳”拼接形成合成词“本田佳”,并将合成词“本田佳”添加至输入法词库中。

另外,对于上述步骤1至3的执行先后顺序,本实施例不作限定。例如,上述步骤1至3的执行先后顺序可以依次为:1、2、3,或者2、1、3,或者2、3、1。

可选地,在上述示例中,对于前后两次输入操作,输入法应用可以对该前后两次输入操作对应的操作时间的时间间隔进行检测,若该时间间隔小于预设时长,则执行拼接形成合成词的步骤,若该时间间隔大于预设时长,则不执行拼接形成合成词的步骤。其中,每一次输入操作对应的操作时间可以是该输入操作的起始时间,也可以是该输入操作的结束时间。通过上述方式,对于间隔较久的前后两次输入操作,即使有删字操作,也不进行组词,有助于减少误组词的情况发生。

第二方面,在目标字段包括第二字段的情况下,输入法应用生成合成词包括如下几个示例。

在第一个示例中,包括如下步骤:

1、输入目标词语;

2、根据对应于目标词语的删除操作信号,删除目标词语中的至少一个汉字,得到保留字段;

3、输入第二词语;

4、根据对应于第二词语的删除操作信号,删除第二词语中的至少一个汉字,得到第二字段;

5、将保留字段和第二字段拼接,形成合成词;

6、将合成词添加至输入法词库中。

上述第二词语位于目标词语之后,且与目标词语相邻。

例如,用户输入目标词语“丹阳”后删除“阳”字得到保留字段“丹”,用户输入第二词语“亭亭玉立”后删除“亭玉立”得到第二字段“亭”,输入法应用将保留字段“丹”和第二字段“亭”拼接形成合成词“丹亭”,并将合成词“丹亭”添加至输入法词库中。

另外,对于上述步骤1至4的执行先后顺序,本实施例不作限定。例如,上述步骤1至4的执行先后顺序可以依次为:1、2、3、4,或者1、3、2、4,或者1、3、4、2,或者3、4、1、2,或者3、1、2、4,或者3、1、4、2。

在第二个示例中,包括如下步骤:

1、输入目标词语;

2、根据对应于目标词语的删除操作信号,删除目标词语中的至少一个汉字,得到保留字段;

3、输入第二汉字;

4、将保留字段和第二汉字拼接,形成合成词;

5、将合成词添加至输入法词库中。

上述第二汉字位于目标词语之后,且与目标词语相邻。

例如,用户输入目标词语“昌平”后删除“平”字得到保留字段“昌”,用户输入第二汉字“建”,输入法应用将保留字段“昌”和第二汉字“建”拼接形成合成词“昌建”,并将合成词“昌建”添加至输入法词库中。

另外,对于上述步骤1至3的执行先后顺序,本实施例不作限定。例如,上述步骤1至3的执行先后顺序可以依次为:1、2、3,或者3、1、2,或者1、3、2。

在第三个示例中,包括如下步骤:

1、输入目标词语;

2、根据对应于目标词语的删除操作信号,删除目标词语中的至少一个汉字,得到保留字段;

3、输入第二词语;

4、将保留字段和第二词语拼接,形成合成词;

5、将合成词添加至输入法词库中。

上述第二词语位于目标词语之后,且与目标词语相邻。

例如,用户输入目标词语“手帕”后删除“手”字得到保留字段“帕”,用户输入第二词语“斯坦”,输入法应用将保留字段“帕”和第二词语“斯坦”拼接形成合成词“帕斯坦”,并将合成词“帕斯坦”添加至输入法词库中。

另外,对于上述步骤1至3的执行先后顺序,本实施例不作限定。例如,上述步骤1至3的执行先后顺序可以依次为:1、2、3,或者1、3、2,或者3、1、2。

可选地,在上述示例中,对于前后两次输入操作,输入法应用可以对该前后两次输入操作对应的操作时间的时间间隔进行检测,若该时间间隔小于预设时长,则执行拼接形成合成词的步骤,若该时间间隔大于预设时长,则不执行拼接形成合成词的步骤。其中,每一次输入操作对应的操作时间可以是该输入操作的起始时间,也可以是该输入操作的结束时间。通过上述方式,对于间隔较久的前后两次输入操作,即使有删字操作,也不进行组词,有助于减少误组词的情况发生。

第三方面,在目标字段包括第一字段和第二字段的情况下,输入法应用生成合成词包括上述第一方面所提供的任一示例与第二方面所提供的任一示例的组合。以下仅以第一方面所提供的第一个示例与第二方面所提供的第二个示例的组合为例,进行示例性说明,其它组合情况不再赘述。包括如下步骤:

1、输入第一词语;

2、根据对应于第一词语的删除操作信号,删除第一词语中的至少一个汉字,得到第一字段;

3、输入目标词语;

4、根据对应于目标词语的删除操作信号,删除目标词语中的至少一个汉字,得到保留字段;

5、输入第二词语;

6、根据对应于第二词语的删除操作信号,删除第二词语中的至少一个汉字,得到第二字段;

7、将第一字段、保留字段和第二字段顺次拼接,形成合成词;

8、将合成词添加至输入法词库中。

上述第一词语位于目标词语之前,且与目标词语相邻;上述第二词语位于目标词语之后,且与目标词语相邻。

例如,用户输入第一词语“山峰”后删除“峰”字得到第一字段“山”,用户输入目标词语“本来”后删除“来”字得到保留字段“本”,用户输入第二词语“新郎”后删除“新”字得到第二字段“郎”,输入法应用将第一字段“山”、保留字段“本”和第二字段“郎”顺次拼接形成合成词“山本郎”,并将合成词“山本郎”添加至输入法词库中。

另外,对于上述步骤1至6的执行先后顺序,本实施例不作限定。

下述为本公开装置实施例,可以用于执行本公开方法实施例。对于本公开装置实施例中未披露的细节,请参照本公开方法实施例。

图3是根据一示例性实施例示出的一种更新输入法词库的装置的框图。该装置具有实现上述方法示例的功能,所述功能可以由硬件实现,也可以由硬件执行相应的软件实现。该装置可以包括:汉字删除模块301、合成词形成模块302和词库更新模块303。

汉字删除模块301,被配置为根据对应于已输入的目标词语的删除操作信号,删除所述目标词语中的至少一个汉字,得到保留字段。其中,所述目标词语包括至少两个汉字,所述保留字段包括至少一个汉字。

合成词形成模块302,被配置为将所述保留字段和目标字段拼接,形成合成词。其中,所述目标字段包括:位于所述保留字段之前且与所述保留字段相邻的第一字段,和/或,位于所述保留字段之后且与所述保留字段相邻的第二字段。所述第一字段包括至少一个汉字,且所述第一字段为一个汉字或一个词语或一个词语删除至少一个汉字后的剩余汉字。所述第二字段包括至少一个汉字,且所述第二字段为一个汉字或一个词语或一个词语删除至少一个汉字后的剩余汉字。

词库更新模块303,被配置为将所述合成词添加至输入法词库中。

综上所述,本公开实施例提供的装置,通过将删除目标词语中的部分汉字后得到的保留字段与目标字段拼接形成合成词,并将合成词添加至输入法词库中;解决了相关技术中输入法应用所提供的自动学词功能不够完善,导致输入法词库的词汇量不够全面,影响用户输入效率的技术问题;实现了对采用组词后删除汉字的方式输入的字词序列进行自动学词,以使得自动学词功能更加完善,输入法词库的词汇量更加丰富,提升输入效率。

在基于图3实施例提供的一个可选的实施例中,所述目标字段包括所述第一字段,所述合成词为第一合成词。所述合成词形成模块302,被配置为将所述第一字段和所述保留字段拼接,形成所述第一合成词。其中,所述第一合成词中所述第一字段的最后一个汉字与所述保留字段的第一个汉字相连。

在基于图3实施例提供的另一个可选的实施例中,所述目标字段包括所述第二字段,所述合成词为第二合成词。所述合成词形成模块302,被配置为将所述保留字段和所述第二字段拼接,形成所述第二合成词。其中,所述第二合成词中所述保留字段的最后一个汉字与所述第二字段的第一个汉字相连。

在基于图3实施例提供的另一个可选的实施例中,所述目标字段包括所述第一字段和所述第二字段,所述合成词为第三合成词。所述合成词形成模块302,被配置为将所述第一字段、所述保留字段和所述第二字段顺次拼接,形成所述第三合成词。其中,所述第三合成词中所述第一字段的最后一个汉字与所述保留字段的第一个汉字相连,所述保留字段的最后一个汉字与所述第二字段的第一个汉字相连。

在基于图3实施例提供的另一个可选的实施例中,请参考图4,所述装置还包括:第一获取模块304。

第一获取模块304,被配置为:输入第一词语,所述第一词语为所述第一字段;或者,输入第一词语;根据对应于所述第一词语的删除操作信号,删除所述第一词语中的至少一个汉字,得到所述第一字段;或者,输入第一汉字,所述第一汉字为所述第一字段。

在基于图3实施例提供的另一个可选的实施例中,请参考图4,所述装置还包括:第二获取模块305。

第二获取模块305,被配置为输入第二词语,所述第二词语为所述第二字段;或者,输入第二词语;根据对应于所述第二词语的删除操作信号,删除所述第二词语中的至少一个汉字,得到所述第二字段;或者,输入第二汉字,所述第二汉字为所述第二字段。

在基于图3实施例提供的另一个可选的实施例中,请参考图4,所述装置还包括:次数更新模块306。

次数更新模块306,被配置为更新所述合成词对应的输入次数。

所述词库更新模块303,还被配置为当所述合成词对应的输入次数达到预设次数时,执行所述将所述合成词添加至输入法词库中的步骤。

在基于图3实施例提供的另一个可选的实施例中,请参考图4,所述装置还包括:合成词检测模块307。

合成词检测模块307,被配置为在所述合成词对应的输入次数大于等于1且不足所述预设次数的情况下,检测输入的字词序列中是否包括所述合成词。

所述次数更新模块306,还被配置为在所述字词序列中包括所述合成词的情况下,更新所述合成词对应的输入次数。

需要说明的一点是,上述实施例提供的装置在实现其功能时,仅以上述各个功能模块的划分进行举例说明,实际应用中,可以根据实际需要而将上述功能分配由不同的功能模块完成,即将设备的内容结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。

关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。

本公开一示例性实施例还提供了一种更新输入法词库的装置,能够实现本公开实施例提供的方法。该装置包括:处理器,以及用于存储处理器的可执行指令的存储器。其中,所述处理器被配置为:

根据对应于已输入的目标词语的删除操作信号,删除所述目标词语中的至少一个汉字,得到保留字段;其中,所述目标词语包括至少两个汉字,所述保留字段包括至少一个汉字;

将所述保留字段和目标字段拼接,形成合成词;其中,所述目标字段包括:位于所述保留字段之前且与所述保留字段相邻的第一字段,和/或,位于所述保留字段之后且与所述保留字段相邻的第二字段;所述第一字段包括至少一个汉字,且所述第一字段为一个汉字或一个词语或一个词语删除至少一个汉字后的剩余汉字;所述第二字段包括至少一个汉字,且所述第二字段为一个汉字或一个词语或一个词语删除至少一个汉字后的剩余汉字;

将所述合成词添加至输入法词库中。

可选地,所述目标字段包括所述第一字段,所述合成词为第一合成词;所述处理器,被配置为:

将所述第一字段和所述保留字段拼接,形成所述第一合成词;其中,所述第一合成词中所述第一字段的最后一个汉字与所述保留字段的第一个汉字相连。

可选地,所述目标字段包括所述第二字段,所述合成词为第二合成词;所述处理器,被配置为:

将所述保留字段和所述第二字段拼接,形成所述第二合成词;其中,所述第二合成词中所述保留字段的最后一个汉字与所述第二字段的第一个汉字相连。

可选地,所述目标字段包括所述第一字段和所述第二字段,所述合成词为第三合成词;所述处理器,被配置为:

将所述第一字段、所述保留字段和所述第二字段顺次拼接,形成所述第三合成词;其中,所述第三合成词中所述第一字段的最后一个汉字与所述保留字段的第一个汉字相连,所述保留字段的最后一个汉字与所述第二字段的第一个汉字相连。

可选地,所述处理器还被配置为:

输入第一词语,所述第一词语为所述第一字段;

或者,

输入第一词语;根据对应于所述第一词语的删除操作信号,删除所述第一词语中的至少一个汉字,得到所述第一字段;

或者,

输入第一汉字,所述第一汉字为所述第一字段。

可选地,所述处理器还被配置为:

输入第二词语,所述第二词语为所述第二字段;

或者,

输入第二词语;根据对应于所述第二词语的删除操作信号,删除所述第二词语中的至少一个汉字,得到所述第二字段;

或者,

输入第二汉字,所述第二汉字为所述第二字段。

可选地,所述处理器还被配置为:

更新所述合成词对应的输入次数;

当所述合成词对应的输入次数达到预设次数时,执行所述将所述合成词添加至输入法词库中的步骤。

可选地,所述处理器还被配置为:

在所述合成词对应的输入次数大于等于1且不足所述预设次数的情况下,检测输入的字词序列中是否包括所述合成词;

在所述字词序列中包括所述合成词的情况下,更新所述合成词对应的输入次数。

图5是根据一示例性实施例示出的一种装置500的框图。例如,装置500可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理,计算机等。

参照图5,装置500可以包括以下一个或多个组件:处理组件502,存储器504,电源组件506,多媒体组件508,音频组件510,输入/输出(i/o)接口512,传感器组件514,以及通信组件516。

处理组件502通常控制装置500的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件502可以包括一个或多个处理器520来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件502可以包括一个或多个模块,便于处理组件502和其他组件之间的交互。例如,处理组件502可以包括多媒体模块,以方便多媒体组件508和处理组件502之间的交互。

存储器504被配置为存储各种类型的数据以支持在装置500的操作。这些数据的示例包括用于在装置500上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器504可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(sram),电可擦除可编程只读存储器(eeprom),可擦除可编程只读存储器(eprom),可编程只读存储器(prom),只读存储器(rom),磁存储器,快闪存储器,磁盘或光盘。

电源组件506为装置500的各种组件提供电力。电源组件506可以包括电源管理系统,一个或多个电源,及其他与为装置500生成、管理和分配电力相关联的组件。

多媒体组件508包括在所述装置500和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(lcd)和触摸面板(tp)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件508包括一个前置摄像头和/或后置摄像头。当装置500处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件510被配置为输出和/或输入音频信号。例如,音频组件510包括一个麦克风(mic),当装置500处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器504或经由通信组件516发送。在一些实施例中,音频组件510还包括一个扬声器,用于输出音频信号。

i/o接口512为处理组件502和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件514包括一个或多个传感器,用于为装置500提供各个方面的状态评估。例如,传感器组件514可以检测到装置500的打开/关闭状态,组件的相对定位,例如所述组件为装置500的显示器和小键盘,传感器组件514还可以检测装置500或装置500一个组件的位置改变,用户与装置500接触的存在或不存在,装置500方位或加速/减速和装置500的温度变化。传感器组件514可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件514还可以包括光传感器,如cmos或ccd图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件514还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。

通信组件516被配置为便于装置500和其他设备之间有线或无线方式的通信。装置500可以接入基于通信标准的无线网络,如wi-fi,2g或3g,或它们的组合。在一个示例性实施例中,通信组件516经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件516还包括近场通信(nfc)模块,以促进短程通信。例如,在nfc模块可基于射频识别(rfid)技术,红外数据协会(irda)技术,超宽带(uwb)技术,蓝牙(bt)技术和其他技术来实现。

在示例性实施例中,装置500可以被一个或多个应用专用集成电路(asic)、数字信号处理器(dsp)、数字信号处理设备(dspd)、可编程逻辑器件(pld)、现场可编程门阵列(fpga)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。

在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器504,上述指令可由装置500的处理器520执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是rom、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等。

一种非临时性计算机可读存储介质,当所述存储介质中的指令由装置500的处理器执行时,使得装置500能够执行上述方法。

应当理解的是,在本文中提及的“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。

本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。

应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1