一种候选词展示方法和装置与流程

文档序号:16810836发布日期:2019-02-10 13:37阅读:180来源:国知局
一种候选词展示方法和装置与流程

本申请涉及输入法领域,特别是涉及一种候选词展示方法和装置。



背景技术:

输入法是指为将各种符号输入计算机或其他设备(如手机)而采用的编码方法,用户可以使用输入法便利的将需要的字符输入电子设备。

输入法可以根据用户输入的字符串展示对应的候选词,并将用户所选择的候选词进行上屏,例如录入到电子设备的文档中,这是一种常见的使用输入法的方式。但是,不同的输入习惯或输入速度可能会导致用户在输入字符串时输入错误,导致对应的候选词或者优先展示的候选词并不是自己想要的,这种情况下用户需要多次翻页才能找到所需的候选词,或者重新输入字符串。

显然这种输入错误的字符串会影响用户的输入速度,降低用户的输入体验。



技术实现要素:

为了解决上述技术问题,本申请提供了一种候选词展示方法和装置,用户可以优先看到该正确候选词,在用户确实输错字符串的情况下提高了用户的输入体验。

第一方面,本申请提供了一种候选词展示方法,该方法包括:

获取用户输入的第一字符串;

判断所述第一字符串的部分或全部是否处于易错词库中,所述易错词库包括第二字符串与正确候选词的对应关系,所述正确候选词为从所述第二字符串所展示候选词中选择上屏的、但是与所述第二字符串不完全对应的候选词;

若判定所述第二字符串为所述第一字符串的部分或全部,将所述正确候选词展示在所述第二字符串对应候选词的优先展示位置中。

可选的,所述第一字符串中包括用于标识音节音调的字符。

可选的,所述易错词库是根据历史数据中输错字符串情况所建立的,所述输错字符串情况为根据所输字符串选择上屏的候选词为与所输字符串不完全对应的候选词的情况。

可选的,所述易错词库中第二字符串与正确候选词出现在所述输错字符串情况中的次数满足预设条件。

可选的,所述历史数据包括所述用户的历史数据和/或多个其他用户的历史数据;

当所述历史数据中包括所述用户的历史数据时,所述方法还包括:

根据所述用户的所述输错字符串情况更新所述易错词库。

可选的,所述第二字符串中包括用于标识音节音调的字符。

可选的,在所述将所述正确候选词展示在所述第一字符串对应候选词的优先展示位置中之前,还包括:

根据所述第二字符串查询所述用户对应的输入行为数据,

若所述用户对应的输入行为数据中包括从所述第二字符串所展示候选词中选择候选词上屏的输入行为数据,根据从所述第二字符串所展示候选词中选择上屏的候选词的热度,调整所述第二字符串对应候选词的优先展示位置中所展示的候选词。

第二方面,本申请提供了一种候选词展示装置,所述装置包括获取单元、判断单元和展示单元:

所述获取单元,用于获取用户输入的第一字符串;

所述判断单元,用于判断所述第一字符串的部分或全部是否处于易错词库中,所述易错词库包括第二字符串与正确候选词的对应关系,所述正确候选词为从所述第二字符串所展示候选词中选择上屏的、但是与所述第二字符串不完全对应的候选词;若判定所述第二字符串为所述第一字符串的部分或全部,则执行所述展示单元;

所述展示单元,用于将所述正确候选词展示在所述第二字符串对应候选词的优先展示位置中。

可选的,所述第一字符串中包括用于标识音节音调的字符。

可选的,所述易错词库是根据历史数据中输错字符串情况所建立的,所述输错字符串情况为根据所输字符串选择上屏的候选词为与所输字符串不完全对应的候选词的情况。

可选的,所述易错词库中第二字符串与正确候选词出现在所述输错字符串情况中的次数满足预设条件。

可选的,所述历史数据包括所述用户的历史数据和/或多个其他用户的历史数据;

当所述历史数据中包括所述用户的历史数据时,所述装置还包括更新单元:

所述更新单元,用于根据所述用户的所述输错字符串情况更新所述易错词库。

可选的,所述第二字符串中包括用于标识音节音调的字符。

可选的,所述装置还包括查询单元和调整单元:

所述查询单元,用于根据所述第二字符串查询所述用户对应的输入行为数据,

所述调整单元,用于若所述用户对应的输入行为数据中包括从所述第二字符串所展示候选词中选择候选词上屏的输入行为数据,根据从所述第二字符串所展示候选词中选择上屏的候选词的热度,调整所述第二字符串对应候选词的优先展示位置中所展示的候选词。

第三方面,本申请提供了一种候选词展示装置,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:

获取用户输入的第一字符串;

判断所述第一字符串的部分或全部是否处于易错词库中,所述易错词库包括第二字符串与正确候选词的对应关系,所述正确候选词为从所述第二字符串所展示候选词中选择上屏的、但是与所述第二字符串不完全对应的候选词;

若判定所述第二字符串为所述第一字符串的部分或全部,将所述正确候选词展示在所述第二字符串对应候选词的优先展示位置中。

第四方面,本申请提供了一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行第一方面中所述的方法。

由上述技术方案可以看出,当获取用户输入的第一字符串时,可以在展示对应该第一字符串的候选词之前,判断该待定字符的部分或全部是否处于易错词库中,该易错词库中包括了容易输错的字符串和根据这些容易输错的字符串所实际选择的候选词之间的对应关系,故如果发现易错词库中的第二字符串为该第一字符串的部分或全部时,可以确认该第一字符串的部分或全部属于容易输错的字符串,那么该用户输入的第二字符串很有可能与该用户实际想要输入的字符串并不一致,该用户实际想要输入的字符串所对应的候选词有可能是正确候选词,即易错词库中与第二字符串对应的候选词,故在该用户有可能确实是输错字符串的情况下,可以将正确候选词展示在第二字符串对应候选词的优先展示位置中,从而用户可以优先看到该正确候选词,在用户确实输错字符串的情况下提高了用户的输入体验。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的用户输入字符串时的一种示意图;

图2为本申请实施例提供的用户输入字符串时的第二种示意图;

图3为本申请实施例提供的一种候选词展示方法的方法流程图;

图4为本申请实施例提供的用户输入字符串时的第三种示意图;

图5为本申请实施例提供的用户输入字符串时的第四种示意图;

图6为本申请实施例提供的用户输入字符串时的第五种示意图;

图7a为本申请实施例提供的用户输入字符串时的第六种示意图之一;

图7b为本申请实施例提供的用户输入字符串时的第六种示意图之二;

图7c为本申请实施例提供的用户输入字符串时的第六种示意图之三;

图8为本申请实施例提供的一种候选词展示装置的组成示意图;

图9为本申请实施例提供的一种候选词展示装置作为终端时的结构框图;

图10为本申请实施例提供的一些实施例中服务器的结构示意图。

具体实施方式

下面结合附图,对本申请的实施例进行描述。

在使用传统输入法输入的过程中,可能出现输入的字符串并不是实际想要输入文字所对应的字符串,从而导致要么用户需要将候选词展示页面多次翻页后才能找到实际需要输入的文字,要么用户直接取消当前输入的字符串再重新进行输入,不论哪种情况都会降低用户的输入效率。

发明人发现,有些可能的输错场景是由于用户的发音、打字速度等个人习惯造成的,用户在输入字符串时,所输入的字符串并不是该用户实际想要输入的字符串,也就是说,用户输入的字符串可能是用户输入错误的字符串,从而可能导致实际想要选择的候选词处在较后的展示位置,用户不能快速地从根据该错误的字符串所展示候选词中得到自己想要的候选词。

例如,某些用户会由于词汇的发音音调的错误,经常将“徇私”发音成“xún’sī”而不是“xùn’sī”,当该用户想通过输入法输入“徇私”两字时,在注音输入法中,通常会在输入框中输入“xun2si1”,其中,在字符串中可以使用数字2来表示数字之前拼音串的第二声、数字1表示第一声,由于字符串中的音节音调输入错误,从而导致了优先展示的候选词中并没有出现“徇私”,而是二声的xun和一声的si所对应的候选词,用户需要对候选词展示界面多次翻页才能找到四声的xun和一声的si所对应的候选词“徇私”。

另外,如图1所示,在某些情况下,某些用户由于前后鼻音不分,再加上打字速度过快,容易习惯性地在输入框101中,将“欣欣”对应的字符串“xin1xin1”错误的输入为字符串102“xing1xing1”,则输入法会根据用户输入的字符串102优先展示对应的候选词,在第一页候选词展示页面103中展示的五个候选词分别为:“1.星星2.猩猩3.醒醒4.行星5.行行”,可见,输入法优先展示的第一页候选词中并没有用户需要的候选词“欣欣”,用户需要经过多次翻页,才能够在第23页候选词中找到候选词“欣欣”,并选择该候选词进行上屏。

显然,在用户输错字符串的情况下,传统的输入法优先展示的候选词可能并不是用户想要的,而用户需要多次翻页才能找到自己实际想要输入的字符串所对应的候选词,因此,传统的输入法会影响用户的输入速度,降低用户的输入体验。

故此,本申请实施例提供了一种针对上述输入情况的解决方式,以希望达到在出现上述情况时,用户可以优先看到正确候选词,在用户确实输错字符串的情况下,不会过于影响输入效率,提高用户的输入体验。

本申请实施例中所提到的输入法可以是一种为了将各种符号输入到如计算机、手机等电子设备而采用的编码方法,用户可以使用输入法便利的将用户需要的字符或者字符串输入电子设备。需要注意的是,在本申请实施例中输入法除了可以包括常见的中文输入法(比如拼音输入法、五笔输入法、注音输入法等)以外,也可以包括其他语种的输入法(比如日文平假名输入法、韩文输入法等)。

字符串可以是用户想要输入到电子设备中的内容对应的一串字符,字符串中可以包括字母、数字、符号等。其中,一个字符串的组成形式可以是想要输入内容对应的音节或音节组合,也可以是想要输入内容对应的笔画顺序,也可以是想要输入内容对应的特定标识等等。例如,当用户想要采用拼音输入法来输入一个字时,比如“吃”字,用户输入的字符串为“吃”对应的音节“chi”,当然,为了能够更加优先、准确的展示正确候选词,该字符串还可以包括“吃”字对应的特定标识,比如,该字符串还可以带有用于标识音节音调的字符,可以在字符串中使用数字来表示数字之前拼音串的声调,即“吃”字对应的输入字符串还可以为“chi1”;当用户想要采用拼音输入法输入一个词时,比如“吃饭”这个词,用户输入的字符串可以为“吃饭”对应的音节组合“chi1fan4”;当用户想要采用五笔输入法来输入一个字时,比如“欣”字时,用户输入的字符串为“欣”对应的笔画顺序“rqw”。

这里需要说明的是,一个字符串的组成形式除了上述几种可能的方式以外,还可以根据实际情况具有其它不同的组成形式,这里不再一一赘述。

候选词可以是输入法根据用户输入的字符串所展示的对应的字词,比如,当输入法为拼音输入法时,候选词是汉字;当输入法为平假名输入法,候选词是日文汉字;当输入法为韩文输入法,候选词是韩语文字。这里需要注意的是,候选词的语言种类除了上述几种可能的方式以外,还可以为其它不同的语言种类,在此不对候选词的语言种类做任何限定。

为了便于描述,在之后的实施例中,将主要以中文输入法,字符串中的字符组合为想输入内容对应的音节或音节组合为例进行说明。

对于某个用户或者大多数用户而言,在输入字符串的过程中,很可能会存在以下情况:用户输入一字符串,输入法根据用户输入的字符串在候选词展示页面中展示对应的候选词,用户从展示的候选词中选择一个输入到电子设备中,即该候选词为用户选择上屏的候选词,而该候选词与用户输入的字符串不完全对应,而是与另一字符串完全对应。在这种情况下,可以认为用户输入了错误的字符串,也就是说,被用户选择上屏的候选词所完全对应的字符串才是用户实际想要输入的字符串,而用户输入的字符串与自己实际想要输入的字符串不一致。为了便于描述,可以将上述情况作为输错字符串情况,可以将上述情况中被用户选择上屏的候选词作为正确候选词。

为了实现确定出可能是错误输入的字符串以及将可能希望输入的候选词提供给用户,本申请实施例中引入了一种易错词库,该易错词库中包括了容易输错的字符串以及正确候选词之间的对应关系。其中,易错词库中的容易输错的字符串以及正确候选词之间的对应关系可以是通过常见输错情况预先设置的,也可以是根据历史数据得到的。其中,历史数据可以是通过输入法输入文字所形成的数据,这里提到的输入法可以包括本申请实施例所应用的输入法,还可以包括其他输入法。根据不同的应用场景或使用需求,可以选择不同区域的数据作为该历史数据,例如历史数据可以是一小段时间内的数据,如最近一周内采集的数据,也可以是较长时间内的数据。

在易错词库是根据历史数据所建立的情况下,若易错词库是针对某个用户的个人情况而建立的,则历史数据可以是包括了某用户的个人输错字符串情况的个人历史数据,并且易错词库是通过根据该用户的个人历史数据所建立的;若易错词库是针对多个或大量用户的普遍输错字符串情况而建立的,则历史数据可以是包括了多个或大量用户的输错字符串情况的大数据,并且易错词库是通过该大数据所建立的。其中,该大数据可以是通过收集多个或大量用户使用输入法的数据得到的,这里提及的输入法可以包括本申请实施例所应用的输入法,还可以包括其他输入法。

故此,在本申请实施例中,历史数据可以包括某用户的个人历史数据和/或多个其他用户的历史数据。需要说明的是,历史数据除了上述几种可能的数据类型以外,还可以为其它不同的数据类型,在此不对历史数据的数据类型做任何限定。

此外,在易错词库中,容易输错的字符串可以有一个与其有对应关系的正确候选词,也可以有多个与其有对应关系的正确候选词。比如,用户误以为“莘莘”的拼音为“xin1xin1”,因此,用户经常地输入“xin1xin1”,而选择候选词“莘莘”上屏,在这种情况下,容易输错的字符串“xin1xin1”只有一个与其有对应关系的正确候选词“莘莘”;用户由于前后鼻音不分,经常地将“xing1xing1”错误地输入为“xin1xin1”,因此,经常出现用户输入的字符串为“xin1xin1”,而选择候选词“星星”、“猩猩”和“兴兴”上屏,在这种情况下,容易输错的字符串“xin1xin1”有三个与其有对应关系的正确候选词“星星”、“猩猩”和“兴兴”。

为了便于理解容易输错的字符串以及正确候选词之间的对应关系,下面以一个容易输错的字符串为例来说明,其中,该容易输错的字符串仅有一个与其有对应关系的正确候选词。如图2所示,用户在输入框201中,输入的字符串202为“ying4jie4”,输入法根据用户输入的字符串202优先展示对应的候选词,在第一页候选词展示页面203中展示的五个候选词分别为:“1.硬解2.硬结3.影姐4.迎接5.英姐”,而用户多次向后翻候选词展示页面才能看到候选词“应届”,并选择候选词“应届”上屏。由于“应届”对应的正确字符串为“ying1jie4”而不是“ying4jie4”,因此,针对用户输入的字符串为“ying4jie4”,而选择上屏的候选词为该用户实际想要输入的“ying1jie4”所对应的“应届”的情况,可以将“ying4jie4”作为容易输错的字符串,“应届”作为与其对应的正确候选词保存到易错词库中。

需要说明的是,有些输错字符串的情况可能只是某个用户的个人习惯性输错字符串情况,比如某个用户习惯将字符串“ing”错误地输入为“ign”,而有些输错字符的情况很可能是绝大多数用户都存在的输错字符串情况,比如,将“应届”正确对应的字符串“ying1jie4”输错为“ying4jie4”。因此,为了能够充分体现每个用户的个人习惯,可以更加具有针对性地帮助每个用户对自己可能输错的字符串进行纠正,易错词库可以是针对个人情况而建立的,即可以通过单个用户的历史输入数据建立针对该单个用户的易错词库。当然,为了能够更加全面地帮助用户了解输错概率较高的字符串,易错词库也可以是针对多个或大量用户的普遍情况而建立的,即可以通过多个或大量用户的历史输入数据建立通用的易错词库,本申请实施例对此不做限定。

通过易错词库中的对应关系,可以帮助用户对可能输错的字符串进行纠错,在判断用户可能输错了字符串时,将用户可能实际想要输入的候选词展示在输错字符串对应的候选词展示位置。

接下来,结合图3来说明本申请实施例如何利用易错词库进行候选词的展示。

如图3所示,为本申请实施例提供的一种候选词展示方法的方法流程图,该方法包括:

s301:获取用户输入的第一字符串。

该第一字符串可以是用户通过输入法输入的一个字符串,以希望通过针对该字符串展示的候选词中选择需要向电子设备中输入的汉字。根据输入法的模式或输入规则的不同,第一字符串中可以包括用于标识音节音调的字符,也可以不包括用于标识音节音调的字符。

当用户想要将第一字符串输入电子设备中时,可以通过使用实体键盘或者携有虚拟键盘的移动设备等输入装置,将该用户想要输入的字符串输入到电子设备中。

s302:判断所述第一字符串的部分或全部是否处于易错词库中,所述易错词库包括第二字符串与正确候选词的对应关系,所述正确候选词为从所述第二字符串所展示候选词中选择上屏的、但是与所述第二字符串不完全对应的候选词。

本申请实施例中,易错词库中至少存在一个容易输错的字符串以及正确候选词之间的对应关系,为了便于描述,将其中一个容易输错的字符串称为第二字符串,希望通过判断用户输入的第一字符串中是否存在全部字符或者某一部分字符和易错词库中的第二字符串是相同的,以得到该第一字符串的部分字符或全部字符是否处于易错词库中的判断结果。也就是说,判断第一字符串的部分或全部是否处于易错词库中,可以理解为,判断用户输入的第一字符串中是否存在全部字符或者某一部分字符和易错词库中的第二字符串是相同的。

其中,第二字符串与第一字符串一样,根据输入法的模式或输入规则的不同,第二字符串中同样可以包括用于标识音节音调的字符,也可以不包括用于标识音节音调的字符。

需要强调的是,第二字符串可以与第一字符串的某一部分字符相同,或者与第一字符串的全部字符相同,当然也可以与第一字符串是全部不同的。

例如,当用户输入的第一字符串为“wo3shi4ying4jie4xue2sheng2”,而易错词库中存在一第二字符串为“ying4jie4”,由于该第二字符串只与该第一字符串中的一部分字符串“ying4jie4”是相同的,而与该第一字符串的其他分别为“wo3shi4”、“xue2sheng2”的部分字符串并不相同,则可以认为第二字符串为该第一字符串的部分字符“ying4jie4”,即可以认为该第一字符串的部分字符处于易错词库中。

或者,当用户输入的第一字符串为“ying4jie4”,易错词库中存在一第二字符串为“ying4jie4”,由于该第一字符串的全部字符和该第二字符串的全部字符完全相同,则可以该第二字符串为该第一字符串的全部,即可以认为该第一字符串的全部字符处于易错词库中。同样以图2为例,具体地,当历史数据中存在用户输入的第一字符串202为“ying4jie4”,输入法根据用户输入的字符串202优先展示对应的候选词,该候选词在第一页候选词展示页面203中的展示结果为:“1.硬解2.硬结3.影姐4.迎接5.英姐”,而用户多次向后翻候选词展示页面才能看到候选词“应届”,并选择候选词“应届”上屏;由于“应届”对应的正确字符串为“ying1jie4”而不是“ying4jie4”,则可以认为用户实际想要输入的字符串为“ying1jie4”,而并非输入的“ying4jie4”,显然,“ying4jie4”为用户输入错误的字符串。因此,可以将用户选择上屏的候选词“应届”与输入的字符串“ying4jie4”不完全对应的情况,作为历史数据中的输错字符串情况。也就是说,可以认为“ying4jie4”为第二字符串,候选词“应届”为正确候选词。当第二字符串“ying4jie4”与正确候选词“应届”出现在输错字符串情况中的次数满足了预设条件,才可以将第二字符串“ying4jie4”与正确候选词“应届”的对应关系保存到易错词库中。

如果用户只是偶尔出现输错字符串情况,就将该情况中所对应的第二字符串与正确候选词存入易错词库中,当用户再次输入该字符串时,由于与其有对应关系的正确候选词会展示在优先展示位置,因此,用户需要多次向后翻候选词展示页面才能看到自己实际想要的候选词,从而不利于用户快速找到自己想要的候选词。

为了避免上述情况的发生,可选的,易错词库中第二字符串与正确候选词出现在输错字符串情况中的次数需要满足预设条件。以希望易错词库中不会涵盖这种偶尔出现输错字符串的情况,以避免在使用易错词库时对用户带来干扰。该预设条件可以是出现的次数等。

s303:若判定所述第二字符串为所述第一字符串的部分或全部,将所述正确候选词展示在所述第二字符串对应候选词的优先展示位置中。

在本申请实施例中,优先展示位置可以是用户能够优先看到的候选词的展示位置,具体地,可以是候选词展示页面的第一页,比如,图2中的五个候选词所在的页面为候选词展示页面;可以将正确候选词展示在该候选词展示页面中的第一个位置,比如,图2中的候选词“硬解”的展示位置,或者该页面中的其他位置。当然,优先展示位置除了上述几种可能的展示位置以外,还可以根据具体需求为其它不同的展示位置,在此不再一一进行赘述。

为了便于理解s303,同样以图2为例,用户输入的第一字符串202为“ying4jie4”,输入法根据用户输入的字符串202优先展示对应的候选词,该候选词在第一页候选词展示页面203中的展示结果为:“1.硬解2.硬结3.影姐4.迎接5.应届”;由于易错词库中存在第二字符串“ying4jie4”,并且该第二字符串与该第一字符串的全部字符是一样的,因此,可以判定该第二字符串为该第一字符串的全部字符。另外,由于在易错词库中与该第二字符串“ying4jie4”具有对应关系的正确候选词为“应届”,因此,当输入法在展示第一字符串中对应“ying4jie4”的候选词时,可以将“应届”展示在“ying4jie4”候选词的优先展示位置中,例如候选词展示页第一页的第一位,调整后的展示页第一页参见图4,调整后的优先展示位置的展示结果403为“1.应届2.硬解3.硬结4.影姐5.迎接”。

在判定了第二字符串为第一字符串的部分或全部之后,可以根据第二字符串与正确候选词的对应关系,得到正确候选词,并将该正确候选词展示在该第二字符串对应候选词的优先展示位置中。需要注意的是,当第二字符串为第一字符串的全部时,第一字符串对应候选词的展示位置可以是第二字符串对应候选词的展示位置,当第二字符串为第一字符串的部分时,可以分为两种情况说明。

第一种情况:当第二字符串为第一字符串最开始输入的一部分时,第一字符串中针对这一部分所对应候选词的展示位置可以是第二字符串对应候选词的展示位置。例如,参见图5,在易错词库中,第二字符串“ying4jie4”有一个与其有对应关系的正确候选词“应届”,用户在输入框501输入的第一字符串502为“ying4jie4sheng1”,由于第二字符串“ying4jie4”为第一字符串502“ying4jie4sheng1”最开始输入的一部分,则第一字符串502中针对“ying4jie4”这一部分所对应候选词的展示位置是第二字符串“ying4jie4”对应候选词的展示位置,因此,在第一页候选词展示页面503中的展示结果为:“1.应届生2.硬解生3.硬结生4.影姐生5.迎接生”。

第二种情况:当第二字符串为第一字符串非最开始输入的一部分例如处于第一字符串的中间或结尾时,当用户通过选择候选词等操作使得开始展示第一字符串中第二字符串这一部分的候选词时,这些候选词所展示的位置可以是第二字符串对应候选词的展示位置。例如,参见图6,在易错词库中,第二字符串“ying4jie4”有一个与其有对应关系的正确候选词“应届”,用户在输入框601输入的第一字符串为“wo3shi4ying4jie4sheng1”,由于第二字符串“ying4jie4”处于第一字符串602“wo3shi4ying4jie4sheng1”的中间部分,则第一字符串602中针对“ying4jie4”这一部分所对应候选词的展示位置是第二字符串“ying4jie4”对应候选词的展示位置,因此,在该用户根据字符串“wo3shi4”选择了候选词“我是”之后,在输入框601中的字符串602为“我是ying4jie4sheng1”,并且,在第一页候选词展示页面603中的展示结果为:“1.应届生2.硬解生3.硬结生4.影姐生5.迎接生”。

需要说明的是,若判定第二字符串与第一字符串完全不同,可以认为用户输入的第一字符串正是用户实际想要输入的字符串,则不执行s303。

显然,本申请实施例中,通过判断易错词库中是否存在第二字符串为用户输入的第一字符串的部分或者全部,若是,则将与该第二字符串具有对应关系的正确候选词,在第二字符串对应候选词的优先展示位置中,从而在该用户有可能确实是输错字符串的情况下,可以将正确候选词展示在第二字符串对应候选词的优先展示位置中,从而用户可以优先看到该正确候选词,在用户确实输错字符串的情况下提高了用户的输入体验。

当易错词库是针对多个或大量用户普遍输错字符串而建立时,易错词库主要体现的是大部分用户都容易输入错误字符串的情况,也就是说,有可能会存在大多数用户都会输错同一字符串,而个别用户则不会输错该字符串的情况。但由于易错词库是针对多个或大量用户普遍输错字符串而建立的,因此,对于单个用户来说,这个用户根据自身输入习惯所容易输错的字符串可能与易错词库中的输错字符串并不相同。也就是说,易错词库对于用户个人而言,可能不够个性化,不够更有针对性。

故此,为使得易错词库中容易输错的字符串以及正确候选词之间的对应关系能够符合某个用户的个人输入习惯,可选的,在本申请实施例中,当历史数据中包括该用户的历史数据时,还可以根据该用户的历史数据中的输错字符串情况来更新易错词库。

更新后的易错词库中包含了针对某一用户的个人输错字符串情况。这样,当该用户由于自身输入习惯输错了一字符串,而该字符串通常不会被其它用户输错时,可以根据更新后的易错词库为该用户展示正确候选词,从而可以更有针对性地帮助该用户对可能输错的字符串进行纠错。

进一步地,为了能够更加个性化、更加具有针对性地为用户展示候选词,可选的,本申请实施例中,在s303之前,还可以包括以下步骤:

根据所述第二字符串查询所述用户对应的输入行为数据。

若所述用户对应的输入行为数据中包括从所述第二字符串所展示候选词中选择候选词上屏的输入行为数据,根据从所述第二字符串所展示候选词中选择上屏的候选词的热度,调整所述第二字符串对应候选词的优先展示位置中所展示的候选词。

由于可能会存在大多数用户都会输错同一字符串,而个别用户则不会输错该字符串的情况。因此,为了能够更加体现用户的个人输入习惯,本申请实施例中进一步引入输入行为数据,输入行为数据可以包括用户输错字符串情况时,所输错的字符串与正确候选词之间的对应关系,也可以包括用户输入正确字符串时的,所输入的字符串与被选用户选择上屏的候选词之间的对应关系,每一个输入行为数据对应着一个相应的候选词。一个用户的输入行为数据是由这个用户的历史输入行为生成的,故不同的用户可以具有不同的输入行为数据,在针对一个用户进行候选词的调整时,所依据的输入行为数据可以为这个用户具有的输入行为数据。以希望第二字符串对应候选词的优先展示位置中所展示的候选词对于用户个人而言,符合用户的个人输入习惯,更加具有个性化和针对性。

一个用户对于一个第二字符串可能有至少两个不同的对应的输入行为数据的情况,比如,用户由于前后鼻音不分,经常地将“xing1xing1”错误地输入为“xin1xin1”,因此,经常出现用户输入的字符串为“xin1xin1”,而分别多次选择候选词“星星”、“猩猩”和“兴兴”上屏,在这种情况下,第二字符串“xin1xin1”有三个与其有对应关系的正确候选词“星星”、“猩猩”和“兴兴”,即第二字符串有三不同的对应的输入行为数据。在这种情况下,可以根据第二字符串对应的这些候选词的上屏的热度,来调整该第二字符串对应候选词的优先展示位置中所展示的候选词的排序。

其中,候选词的上屏的热度可以是根据用户个人的输入行为数据统计得到,也可以是通过别的方法来获得候选词的上屏的热度,在此不做任何限定。

为了便于理解,举例来说明本申请实施例:

为了能够起到较好的比较效果,首先明确在不考虑用户个人的输入行为数据的情况下,当用户输错字符串时,如何根据易错词库进行候选词的调整。

当一用户输入第一字符串“xin1xin1”后,判断第一字符串“xin1xin1”的部分或全部是否处于易错词库中。

若在将正确候选词展示在所述第一字符串对应候选词的优先展示位置中之前,不包括根据所述第二字符串查询所述用户对应的输入行为数据,则当判定易错词库中存在一第二字符串“xin1xin1”与第一字符串“xin1xin1”是全部相同的之后,则将与第二字符串“xin1xin1”具有对应关系的正确候选词“莘莘”展示在第二字符串“xin1xin1”对应候选词的优先展示位置中,第一页候选词展示页面的展示结果可以如图7a所示的那样,第一页候选词展示页面701中的展示结果为:“1.莘莘2.欣欣3.心心4.鑫鑫5.馨馨”。

而当参考这个用户的输入行为数据时,可以存在不同的候选词调整情况:

第一种情况,这个用户的输入行为数据包括了输错字符串情况时,所输错的字符串与正确候选词之间的对应关系,例如包括了这个用户错误地将“xing1xing1”输入为“xin1xin1”的情况时,所输错的第二字符串“xin1xin1”与正确候选词“星星”之间的对应关系。并且易错词库中,包括了第二字符串“xin1xin1”与正确候选词“莘莘”的对应关系,则需要根据输入行为数据中从第二字符串“xin1xin1”所展示候选词中选择上屏的候选词“星星”的热度,来调整第二字符串“xin1xin1”对应候选词的优先展示位置中所展示的候选词。具体地,如果候选词“星星”的热度较高,则可以将候选词“星星”的展示位置向前调整,具体如何向前调整本申请并不限定,例如可以调整到优先展示页面的某个展示位置中,可选的,最终的调整结果可以如图7b所示,在第一页候选词展示页面702中,将候选词“星星”的展示位置放在候选词“莘莘”之前,即第一页候选词展示页面702中的展示结果为:“1.星星2.莘莘3.欣欣4.心心5.鑫鑫”。

第二种情况,这个用户的输入行为数据包括了用户输入正确字符串时的,所输入的字符串与被选用户选择上屏的候选词之间的对应关系,例如包括用户正确地输入字符串为“xin1xin1”的情况时,所输入的字符串“xin1xin1”与被用户选择上屏的候选词“心心”之间的对应关系。则需要根据从第二字符串“xin1xin1”所展示候选词中选择上屏的候选词“心心”的热度,来调整第二字符串对应候选词的优先展示位置中所展示的候选词。具体地,如果候选词“心心”的热度较高,则可以将候选词“心心”的展示位置向前调整,具体如何向前调整本申请并不限定,例如可以调整到优先展示页面的某个展示位置中,可选的,最终的调整结果可以如图7c所示,在第一页候选词展示页面703中,将候选词“心心”的展示位置放在候选词“莘莘”的后面一位,即第一页候选词展示页面703中的展示结果为:“1.莘莘2.心心3.欣欣4.鑫鑫5.馨馨”。

第三种情况,这个用户的输入行为数据既包括输错字符串情况时,所输错的字符串与正确候选词之间的对应关系,也包括了用户输入正确字符串时的,所输入的字符串与被选用户选择上屏的候选词之间的对应关系。例如包括了这个用户错误地将“xing1xing1”输入为“xin1xin1”的情况时,所输错的第二字符串“xin1xin1”与正确候选词“星星”之间的对应关系,以及用户正确地输入字符串为“xin1xin1”的情况时,所输入的字符串“xin1xin1”与被用户选择上屏的候选词“心心”之间的对应关系。这种情况下,可以根据输入行为数据中从第二字符串“xin1xin1”所展示候选词中选择上屏的候选词“星星”和“心心”的热度,来调整第二字符串对应候选词的优先展示位置中所展示的候选词。一般情况下可以将热度较高候选词的展示位置放在热度较低候选词之前,这里不再赘述。

可见,在本申请实施例中,根据从第二字符串所展示候选词中选择上屏的候选词的热度,调整第二字符串对应候选词的优先展示位置中所展示的候选词,以希望能够根据用户个人输入习惯将被选择上屏的热度最高的候选词展示在第二字符串对应候选词的优先展示位置中,以便用户可以优先看到选择上屏热度最高的候选词,符合用户的个人输入习惯,从而用户可以快速找到自己想要的候选词。

参见图8,为本申请实施例提供的一种候选词展示装置的组成示意图,所述装置包括获取单元801、判断单元802和展示单元803:

所述获取单元801,用于获取用户输入的第一字符串;

所述判断单元802,用于判断所述第一字符串的部分或全部是否处于易错词库中,所述易错词库包括第二字符串与正确候选词的对应关系,所述正确候选词为从所述第二字符串所展示候选词中选择上屏的、但是与所述第二字符串不完全对应的候选词;若判定所述第二字符串为所述第一字符串的部分或全部,则执行所述展示单元803;

所述展示单元803,用于将所述正确候选词展示在所述第二字符串对应候选词的优先展示位置中。

在本申请的一种实施方式中,所述第一字符串中包括用于标识音节音调的字符。

在本申请的一种实施方式中,所述易错词库是根据历史数据中输错字符串情况所建立的,所述输错字符串情况为根据所输字符串选择上屏的候选词为与所输字符串不完全对应的候选词的情况。

在本申请的一种实施方式中,所述易错词库中第二字符串与正确候选词出现在所述输错字符串情况中的次数满足预设条件。

在本申请的一种实施方式中,所述历史数据包括所述用户的历史数据和/或多个其他用户的历史数据;

当所述历史数据中包括所述用户的历史数据时,所述装置还包括更新单元:

所述更新单元,用于根据所述用户的所述输错字符串情况更新所述易错词库。

在本申请的一种实施方式中,所述第二字符串中包括用于标识音节音调的字符。

在本申请的一种实施方式中,所述装置还包括查询单元和调整单元:

所述查询单元,用于根据所述第二字符串查询所述用户对应的输入行为数据,

所述调整单元,用于若所述用户对应的输入行为数据中包括从所述第二字符串所展示候选词中选择候选词上屏的输入行为数据,根据从所述第二字符串所展示候选词中选择上屏的候选词的热度,调整所述第二字符串对应候选词的优先展示位置中所展示的候选词。

本申请实施例所提供的候选词展示装置,当获取用户输入的第一字符串时,可以在展示对应该第一字符串的候选词之前,判断该待定字符的部分或全部是否处于易错词库中,该易错词库中包括了容易输错的字符串和根据这些容易输错的字符串所实际选择的候选词之间的对应关系,故如果发现易错词库中的第二字符串为该第一字符串的部分或全部时,可以确认该第一字符串的部分或全部属于容易输错的字符串,那么该用户输入的第二字符串很有可能与该用户实际想要输入的字符串并不一致,该用户实际想要输入的字符串所对应的候选词有可能是正确候选词,即易错词库中与第二字符串对应的候选词,故在该用户有可能确实是输错字符串的情况下,可以将正确候选词展示在第二字符串对应候选词的优先展示位置中,从而用户可以优先看到该正确候选词,在用户确实输错字符串的情况下提高了用户的输入体验。

本申请还提供了一种候选词展示装置,所述装置包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:

获取用户输入的第一字符串;

判断所述第一字符串的部分或全部是否处于易错词库中,所述易错词库包括第二字符串与正确候选词的对应关系,所述正确候选词为从所述第二字符串所展示候选词中选择上屏的、但是与所述第二字符串不完全对应的候选词;

若判定所述第二字符串为所述第一字符串的部分或全部,将所述正确候选词展示在所述第二字符串对应候选词的优先展示位置中。

在本申请的一种实施方式中,所述第一字符串中包括用于标识音节音调的字符。

在本申请的一种实施方式中,所述易错词库是根据历史数据中输错字符串情况所建立的,所述输错字符串情况为根据所输字符串选择上屏的候选词为与所输字符串不完全对应的候选词的情况。

在本申请的一种实施方式中,所述易错词库中第二字符串与正确候选词出现在所述输错字符串情况中的次数满足预设条件。

在本申请的一种实施方式中,所述历史数据包括所述用户的历史数据和/或多个其他用户的历史数据;

当所述历史数据中包括所述用户的历史数据时,所述方法还包括:

根据所述用户的所述输错字符串情况更新所述易错词库。

在本申请的一种实施方式中,所述第二字符串中包括用于标识音节音调的字符。

在本申请的一种实施方式中,在所述将所述正确候选词展示在所述第一字符串对应候选词的优先展示位置中之前,还包括:

根据所述第二字符串查询所述用户对应的输入行为数据,

若所述用户对应的输入行为数据中包括从所述第二字符串所展示候选词中选择候选词上屏的输入行为数据,根据从所述第二字符串所展示候选词中选择上屏的候选词的热度,调整所述第二字符串对应候选词的优先展示位置中所展示的候选词。

图9是根据一示例性实施例示出的一种候选词展示装置900作为终端时的框图。例如,装置900可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。

参照图9,装置900可以包括以下一个或多个组件:处理组件902,存储器904,电源组件906,多媒体组件908,音频组件910,输入/输出(i/o)的接口912,传感器组件914,以及通信组件916。

处理组件902通常控制装置900的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件902可以包括一个或多个处理器920来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件902可以包括一个或多个模块,便于处理组件902和其他组件之间的交互。例如,处理组件902可以包括多媒体模块,以方便多媒体组件908和处理组件902之间的交互。

存储器904被配置为存储各种类型的数据以支持在设备900的操作。这些数据的示例包括用于在装置900上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器904可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(sram),电可擦除可编程只读存储器(eeprom),可擦除可编程只读存储器(eprom),可编程只读存储器(prom),只读存储器(rom),磁存储器,快闪存储器,磁盘或光盘。

电源组件906为装置900的各种组件提供电力。电源组件906可以包括电源管理系统,一个或多个电源,及其他与为装置900生成、管理和分配电力相关联的组件。

多媒体组件908包括在所述装置900和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(lcd)和触摸面板(tp)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动运动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件908包括一个前置摄像头和/或后置摄像头。当设备900处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件910被配置为输出和/或输入音频信号。例如,音频组件910包括一个麦克风(mic),当装置900处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器904或经由通信组件916发送。在一些实施例中,音频组件910还包括一个扬声器,用于输出音频信号。

i/o接口912为处理组件902和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件914包括一个或多个传感器,用于为装置900提供各个方面的状态评估。例如,传感器组件914可以检测到设备900的打开/关闭状态,组件的相对定位,例如所述组件为装置900的显示器和小键盘,传感器组件914还可以检测装置900或装置900一个组件的位置改变,用户与装置900接触的存在或不存在,装置900方位或加速/减速和装置900的温度变化。传感器组件914可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物品的存在。传感器组件914还可以包括光传感器,如cmos或ccd图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件914还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。

通信组件916被配置为便于装置900和其他设备之间有线或无线方式的通信。装置900可以接入基于通信标准的无线网络,如wifi,2g或3g,或它们的组合。在一个示例性实施例中,通信组件916经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件916还包括近场通信(nfc)模块,以促进短程通信。例如,在nfc模块可基于射频识别(rfid)技术,红外数据协会(irda)技术,超宽带(uwb)技术,蓝牙(bt)技术和其他技术来实现。

在示例性实施例中,装置900可以被一个或多个应用专用集成电路(asic)、数字信号处理器(dsp)、数字信号处理设备(dspd)、可编程逻辑器件(pld)、现场可编程门阵列(fpga)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。

在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器904,上述指令可由装置900的处理器920执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是rom、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等。

图10是本申请的一些实施例中服务器的结构示意图。该服务器1000可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(centralprocessingunits,cpu)1022(例如,一个或一个以上处理器)和存储器1032,一个或一个以上存储应用程序1042或数据1044的存储介质1030(例如一个或一个以上海量存储设备)。其中,存储器1032和存储介质1030可以是短暂存储或持久存储。存储在存储介质1030的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1022可以设置为与存储介质1030通信,在服务器1000上执行存储介质1030中的一系列指令操作。

服务器1000还可以包括一个或一个以上电源1026,一个或一个以上有线或无线网络接口1050,一个或一个以上输入输出接口1058,一个或一个以上键盘1056,和/或,一个或一个以上操作系统1041,例如windowsservertm,macosxtm,unixtm,linuxtm,freebsdtm等等。

一种非临时性计算机可读存储介质,当所述存储介质中的指令由装置(终端或者服务器)的处理器执行时,使得装置能够执行一种纠错词库的建立方法,所述方法包括:

获取用户输入的第一字符串;

判断所述第一字符串的部分或全部是否处于易错词库中,所述易错词库包括第二字符串与正确候选词的对应关系,所述正确候选词为从所述第二字符串所展示候选词中选择上屏的、但是与所述第二字符串不完全对应的候选词;

若判定所述第二字符串为所述第一字符串的部分或全部,将所述正确候选词展示在所述第二字符串对应候选词的优先展示位置中。

本领域技术人员在考虑说明书及实践这里公开的申请后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求指出。

应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制

以上所述仅为本申请的较佳实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

以上对本申请所提供的一种候选词展示装置,进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1