一种单字输入方法及装置与流程

文档序号:13913245阅读:478来源:国知局

本发明涉及输入法技术领域,特别是涉及一种单字输入方法和一种单字输入装置。



背景技术:

随着信息技术的发展,人们日常生活中很多工作与娱乐都在各种电子装置上进行,用户越来越频繁地需要通过输入法应用程序输入信息来完成人机交互。

在现有的输入法应用程序中,在输入中文时,拼音输入法是常用的一种输入方法,用户输入多个字母组合生成拼音,并根据拼音得到对应的一个或多个候选词供用户选择。当有多个候选词时,现有输入法都会预先根据计算好的词频、词的一元、二元关系等规则,对候选词生成一个排序序列,并且按照排序序列进行显示。

当用户输入的拼音得到的是单字时,候选词一般按照单字的词频由高到低进行排布。因此,当用户需要上屏的单字较为生僻时,往往需要多次翻页后才能查找到自己需要的目标候选字,这种单字获取方法的成本较高。例如,某人姓名为徐骜(xu’ao),若直接输入拼音串,“徐”在候选第一页,“骜”在候选第四页,用户筛选翻页的成本高。

为降低筛选成本,用户在需要生僻单字时,一般会首先对单字进行组词,将组词词语上屏后再删除不需要的字,保留需要的单字。例如,当用户需要输入“徐骜”时,用户首先输入“徐”,“骜”字采用如下方式输入:用户输入“jieaobuxun”,选择“桀骜不驯”上屏,然后依次删除“驯”、“不”、“桀”,从而完成“骜”字的正确输入。

发明人在实施上述方法的过程中发现,采用上述方法需要对多余的字进行删除操作和光标调整操作,影响用户输入的流畅性,编辑成本较高,影响了输入速度。



技术实现要素:

鉴于上述问题,为了解决上述在输入法输入生僻单字时导致的输入流畅性差、输入速度慢的问题,本发明实施例提出了一种单字输入方法和相应的一种单字输入装置。

为了解决上述问题,本发明实施例公开了一种单字输入方法,所述方法包括:

获取与用户输入的词组序列匹配的候选词列表;

从所述候选词列表中检测出一个或以上的非单字候选词;

当检测到触发指令时,对所述非单字候选词进行拆分,获得多个拆分单元;

若检测到用户输入的特征字符串,从所述拆分单元中确定与所述特征字符串匹配的拆分单元,其中,所述特征字符串与所述词组序列存在匹配项。

优选地,所述触发指令采用如下方式检测:

若检测到用户在输入所述词组序列后的第一预设时间段内按压指定按键,则判定检测到触发指令。

优选地,所述特征字符串为用户在按压所述指定按键的第二预设时间段内输入的字符串。

优选地,所述词组序列为用户输入的字符串序列的部分,在所述字符串序列中包括顺次排列的词组序列、指定字符信息以及特征字符串;

在所述获取与用户输入的词组序列匹配的候选词列表的步骤之前,还包括:

接收用户输入的字符串序列;

检测所述字符串序列中是否包括指定字符信息;

若所述字符串序列中包括指定字符信息,则将所述指定字符信息之前的字符序列作为词组序列,将所述指定字符信息之后的字符序列作为特征字符串,并判定为检测到触发指令。

优选地,所述方法还包括:

若所述与所述特征字符串匹配的拆分单元为一个,则将所述匹配的拆分单元上屏。

优选地,所述方法还包括:

若所述与所述特征字符串匹配的拆分单元为一个以上,则将所述匹配的拆分单元显示在预设区域中;

当检测到用户选定所述预设区域中的某一匹配的拆分单元时,将选定的所述拆分单元上屏。

优选地,所述方法还包括:

分别生成所述匹配的拆分单元与预设的快捷键信息的对应关系;

在所述预设区域中,显示所述快捷键信息以及对应的拆分单元。

优选地,所述当检测到用户选定所述预设区域中的某一匹配的拆分单元时,将选定的所述拆分单元上屏的步骤包括:

当用户在键入所述快捷键信息时,将所述快捷键信息对应的拆分单元上屏。

本发明实施例还公开了一种单字输入装置,所述装置包括:

候选词获取模块,用于获取与用户输入的词组序列匹配的候选词列表;

非单字候选词检测模块,用于从所述候选词列表中检测出一个或以上的非单字候选词;

候选词拆分模块,用于在检测到触发指令时,对所述非单字候选词进行拆分,获得多个拆分单元;

匹配模块,用于若检测到用户输入的特征字符串,从所述拆分单元中确定与所述特征字符串匹配的拆分单元,其中,所述特征字符串与所述词组序列存在匹配项。

所述装置还包括:

字符串序列输入模块,用于接收用户输入的字符串序列;

指定字符检测模块,用于检测所述字符串序列中是否包括指定字符信息;

检测模块,用于若所述字符串序列中包括指定字符信息,则将所述指定字符信息之前的字符序列作为词组序列,将所述指定字符信息之后的字符序列作为特征字符串,并判定为检测到触发指令。

所述装置还包括:

第一上屏模块,用于在所述与所述特征字符串匹配的拆分单元为一个时,直接将所述匹配的拆分单元上屏。

在本发明实施例的一种优选实施例中,所述装置还包括:

拆分单元显示模块,用于在所述与所述特征字符串匹配的拆分单元为一个以上时,将所述匹配的拆分单元显示在预设区域中;

第二上屏模块,用于当检测到用户选定所述预设区域中的某一匹配的拆分单元时,将选定的所述拆分单元上屏。

所述装置还包括:

对应对生成模块,用于分别生成所述匹配的拆分单元与预设的快捷键信息的对应关系;

对应对显示模块,用于在所述预设区域中,显示所述快捷键信息以及对应的拆分单元。

所述第二上屏模块还用于:

当用户在键入所述快捷键信息时,将所述快捷键信息对应的拆分单元上屏。

本发明实施例还公开了一种单字输入装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:

获取与用户输入的词组序列匹配的候选词列表;

从所述候选词列表中检测出一个或以上的非单字候选词;

当检测到触发指令时,对所述非单字候选词进行拆分,获得多个拆分单元;

若检测到用户输入的特征字符串,从所述拆分单元中确定与所述特征字符串匹配的拆分单元,其中,所述特征字符串与所述词组序列存在匹配项。

本发明实施例包括以下优点:

在本发明实施例中,用户在输入词组序列以后,获取与该词组序列对应的非单字候选词,通过触发指定按键将非单字候选词拆分成多个拆分单元,当用户输入特征字符串以后,在多个拆分单元中匹配该特征字符串,从而获得与特征字符串匹配的拆分单元,特别适用于用户需要输入生僻单字的场景,无需通过多次翻页或者删除多余的字词进行生僻字的输入,提高了用户的输入速度,降低输入成本。

附图说明

图1是本发明的一种单字输入方法实施例一的步骤流程图;

图2是本发明的一种单字输入方法实施例二的步骤流程图;

图3a至图3c是本发明实施例的一种虚拟键盘的示例图;

图4是本发明的一种单字输入方法实施例三的步骤流程图;

图5是本发明的一种单字输入装置实施例的结构框图;

图6是根据一示例性实施例示出的一种单字输入装置框图;

图7是根据一示例性实施例示出的一种服务器的结构示意图。

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。

参照图1,示出了本发明的一种单字输入方法实施例一的步骤流程图,可以包括如下步骤:

步骤101,获取与用户输入的词组序列匹配的候选词列表;

步骤102,从所述候选词列表中检测出一个或以上的非单字候选词;

步骤103,当检测到触发指令时,对所述非单字候选词进行拆分,获得多个拆分单元;

步骤104,若检测到用户输入的特征字符串,从所述拆分单元中确定与所述特征字符串匹配的拆分单元,其中,所述特征字符串与所述词组序列存在匹配项。

在本发明实施例中,用户在输入词组序列以后,获取与该词组序列对应的非单字候选词,通过触发指定按键将非单字候选词拆分成多个拆分单元,当用户输入特征字符串以后,在多个拆分单元中匹配该特征字符串,从而获得与特征字符串匹配的拆分单元,特别适用于用户需要输入生僻单字的情况,无需通过多次翻页或者删除多余的字词进行生僻字的输入,提高了用户的输入速度,降低输入成本。

参照图2,示出了本发明的一种单字输入方法实施例二的步骤流程图,本发明实施例可以应用于具有信息输入功能的终端设备中,该信息输入功能可以由内嵌于终端的程序(例如,虚拟键盘)实现,或者,由与终端设备相连的物理键盘、手写板、声音采集设备等实现。

该终端设备可以包括手机、pda(personaldigitalassistant,个人数字助理)、膝上型计算机、掌上电脑、台式电脑、提供用户进行电子签名的签名终端等等,本发明实施例对此不加以限制。

该终端可以支持windows、android(安卓)、ios、windowsphone等操作系统。

本发明实施例具体可以包括如下步骤:

步骤201,获取与用户输入的词组序列匹配的候选词列表;

在具体实现中,当用户启动终端设备中安装的输入法应用程序以后,用户可以通过物理键盘、虚拟键盘、手写板、声音采集设备等方式将词组序列输入到终端设备中。相应的,该用户的输入可以包括按键输入、手写输入、语音输入等。

其中,虚拟键盘可以包括九宫格键盘、全键盘(如qwert键盘)等等。该虚拟键盘通常可以具有一个或多个虚拟按键,该虚拟按键经常被复用,映射有一个或多个字符,可以用于输入字符,对于不同的语种,如中文、英文、日文等等,该虚拟键盘的虚拟按键所映射的字符会有所不同。

为使本领域技术人员更好地理解本发明实施例,在本发明实施例中,将中文汉字作为语种的一种示例进行说明。

在具体实现中,该虚拟按键映射的字符具体可以包括但不限于输入数字字符、英文字符、中文字符(如拼音字符、笔画字符等)和符号字符中的至少一个。

例如,参照图3a和3b,示出了本发明实施例的一种虚拟键盘的示例图,该虚拟键盘300可以称为九宫格键盘或9键键盘。

对于虚拟按键301,如图3a所示,在拼音输入模式下,该虚拟按键301映射拼音字符,声母“d”、韵母“e”和声母“f”;在数字输入模式下,该虚拟按键301可以映射数字字符“3”,在英文输入模式下,该虚拟按键301可以映射英文字符“d”、“e”、“f”;在拼音输入模式、数字输入模式和英文输入模式下,该虚拟按键302可以映射符号字符,逗号“,”;如图3b所示,在笔画输入模式下,该虚拟按键301映射笔画字符“丿”。

又例如,参照图3c,示出了本发明实施例的另一种虚拟键盘的示例图,该虚拟键盘310可以称为全键盘或26键键盘,一个典型的全键盘或26键键盘可以为qwert键盘。

对于虚拟按键311,在拼音输入模式下,该虚拟按键311可以映射拼音字符,半元音“w”;在英文输入模式下,该虚拟按键311可以映射英文字符“w”;在数字输入模式下,该虚拟按键311可以数字字符“2”;对于虚拟按键312,在拼音输入模式下,该虚拟按键312可以映射拼音字符“g”;在英文输入模式下,该虚拟按键311可以映射英文字符“g”,在符号输入模式下可以映射符号字符,百分号“%”。

当然,上述虚拟键盘及虚拟按键只是作为示例,在实施本发明实施例时,可以根据实际情况设置其他虚拟键盘及虚拟按键,本发明实施例对此不加以限制。另外,除了上述虚拟键盘及虚拟按键外,本领域技术人员还可以根据实际需要采用其它虚拟键盘及虚拟按键,本发明实施例对此也不加以限制。

该词组序列可以包括但不限于:数字字符串、英文字符串、中文字符串(如拼音字符串、笔画字符串等)、符号字符串、混合字符串(至少包括两种不同的字符串)中的至少一个。

在一种优选实施方式中,该词组序列可以为多个单字的拼音字符串组合成的字符串。例如,该词组序列可以为“jieaobuxun”等形式。

在具体实现中,若检测到用户在输入区域执行按压操作时,可以通过检测用户在输入区域的按压类型来识别用户是否具有正常输入意图。具体的,按压操作可以指在电子设备的触摸屏上或物理键盘上进行按压时所产生的操作。若检测到用户的按压操作,则可以首先获取该按压操作对应的按压位置,若该按压位置为输入区的位置,则进一步确定该按压操作的按压类型,若在输入区域的按压类型为轻按peek类型,则可以判定用户具有正常的输入意图,从而可以接收用户分别输入的词组序列。

在用户输入词组序列的过程中,可能存在错输的情形。针对错输的情形,可以进行纠错处理。

在实际中,词组序列在输入时可能涉及如下错输场景的一种或多种:

(1)南方模糊音:受到地域的限制,中国有许多方言,不同地方的人的发音存在一定的差异,例如南方人对卷舌-平舌、前鼻音-后鼻音的区分不同于北方人。

(2)操作不协调:常见于左右手键位互换或同手位连续两个按键互换的情况,如将音节“le”输成“el”,或者将左手输入序列“er”错输入成了“re”。当然,前一种情况需要区分筒拼“恶劣”和真正的“le-el”错误(错误形式—正确形式,下同)。

(3)频繁出现的按键错误:比如用户由于手指灵活程度、键盘特性等原因造成的将“y”键错按成了“u”键;或者按在“u”键和“y”键中间造成两个键均被识别为按下,这些错误输入往往伴随以用户的退格修正。

(4)键盘按钮相对狭小:比如在虚拟键盘尺寸受限的输入环境下,键盘按钮相对狭小而操作都要由面积较大的拇指完成,这样容易造成误按、多按等错误输入,受关联的键位往往与目标键位在键盘上相邻。

(5)按钮响应滞后:如因键盘质量原因造成按键响应滞后,容易造成用户的重复输入。比如系统问题造成按键反应不灵敏,在用户首次击键后未看到输入上屏,可能会导致用户后续的多次击键。

基于上述纠错场景出现的错误,输入法应用程序可以通过语言模拟、输入历史行为统计等方式判断词组序列是否出现输入错误。

具体的,可以采用如下一种或多种方式判断词组序列是否出现输入错误,但应当理解的是,本发明实施例并不限于此:

(1)设置合法拼音数据库,该合法拼音数据库中包括多条合法拼音串,合法拼音串是通过合法拼音音节组成的,合法拼音音节包括a,ai…,zuo等413个。若用户输入的字符串中相邻k(如3)个字符不是合法拼音串的一部分,如:chiafn中afn不是合法拼音的一部分,则可判定此处存在错误。

(2)设置纠错数据库,该纠错数据库中包括多个错输字符串。若用户输入的词组序列命中纠错数据库中的某条字符串,则判定该词组序列存在错误。

(3)用户输入的词组序列不能命中系统词库、用户词库等词库中的任一词条时,判定该词组序列存在错误;

(4)在手机等移动客户端,还能通过判断用户输入词组序列时的按压力度是否在正常按压力度范围内,和/或,按压点到按键中心点的偏移大小来判定词组序列是否输入有误。

(5)语言模型(n-gram)统计:n-gram是大词汇连续语音识别中常用的一种语言模型,对中文而言,通常称之为汉语语言模型(chineselanguagemodel,clm)。

汉语语言模型利用上下文中相邻词间的搭配信息,在需要把连续无空格的拼音、笔划,或代表字母或笔划的数字,转换成汉字串(即句子)时,可以计算出具有最大概率的句子,从而实现到汉字的自动转换。

本发明实施例可以对此进行分析,考虑上下文,判断一个输入片段是否合理。例如,在不支持简拼、英文输入的情况下,根据正常用户输入统计,“tre”是一个非法序列。

(6)连续两按键的输入时间间隔及两按键布局:如果两相邻键位连续输入且时间间隔极短,则存在用户误多敲一个键的可能性。

若输入法内核判定词组序列输入有误,则可以对该词组序列进行纠错处理,在实现时,可以采用通用的纠错方式对词组序列进行纠错,例如,基于用户习惯进行纠错、基于纠错数据库进行纠错等,本发明实施例对此不作限制。

对词组序列进行纠错后,可以进一步获得词组序列对应的候选词。

在中文、日语等语种里,作为基本语言单位的汉字、日文等文字一般不直接与虚拟键盘上的按键进行映射,因此,在输入时一般需要进行字符串与字词的转换。

具体而言,通过编码规则将汉字、单词等文字与能够直接输入的字符串建立映射关系,如在中文中通常用的编码是拼音(如简拼、双拼、全拼、模糊音等)、五笔等。

以汉字输入为例,用户将汉字的字符串通过虚拟键盘或物理键盘输入至输入法应用程序中,由输入法应用程序进行解码,切换成字词候选项。具体可以包括如下步骤:

a、拼音解析:将字符串切分为拼音。

例如,将字符串“zhuanli”切分为“zhuan”、“li”,将字符串“fangan”切分为“fang”、“an”和“fan”、“gan”。

b、汉字解码:在词库中查找拼音对应的字、词、句。

在具体实现中,可以预先设置一个或多个词库,可以包括记载基础字词的系统词库,也可以包括记载扩展字词的细胞词库(细胞词库中的字词至少具有一个共同属性),如记载某个游戏专用字词的细胞词库、记载生物专用字词的细胞词库等,也可以包括用户个性化字词(如自造词)的用户词库,等等,本发明实施例对此不加以限制。

在词库中存放了输入法所需的语言信息,由于不同的文字可能对应相同的编码,对于特定的字符串,输入法可以通过词库可以完成词组序列与字、词、句的转换,得到一个或多个候选词,该一个或多个候选词组成候选词列表,候选词列表用于猜测用户真实的输入意图。

词库可以包含各种语言信息,例如:

(1)词条;

虽然可以在字的基础上构建输入法,但是,由于词是中文中常用的最小表义单位,因此,输入法大量使用了词条。

例如,用户基于拼音规范输入字符串“zhuan”时,存在多个同音字,较难确定用户想输入“转、专、赚、砖……”中的哪一个字。

同样,用户基于拼音规范输入字符串“li”时,也存在多个同音字,也较难确定用户想输入的是“里、李、力、利……”中的哪一个字。

但是,如果用户基于拼音规范连续输入字符串“zhuanli”这个,输入法可以依据现有的词条规则确定用户较大几率输入的就是“专利”这个词。

(2)词频。

同音字大量存在,同音词也仍然是存在的,因此,输入法一般把所有选项列出来供用户选择。

但是,候选项的位置对输入法的易用性有很大影响,把较常用的候选项放到靠前的位置通常会对用户更有利,即词频(即词条的使用频率,包括当前用户的使用频率,群体用户的使用频率)是候选项排序的依据之一。

另外,在输入法中经常集成了自构词、句的功能,此时,词频也是词、句构造的依据之一。

当然,除此之外,词库还可以包括其他信息,如语言连接关系,即词和词之间的连接关系,如“的”常出现在形容词、名词、代词等后面,而“地”则常出现在副词后面,等等,本发明实施例对此不加以限制。

c、将查找到的字、词、句作为字词候选项。

由于显示的位置有限,为有限显示较大概率为用户所需的候选项,输入法一般会对查找到的候选项计算评分。

在评分时,通常考虑如下因素:

(1)用户属性;

不同的用户可能需要用到相同的词,但其重要性却随用户的不同而不同。

例如,同音词“研究”和“烟酒”,前者在学术领域使用较多,而后者则在日常生活中使用较多,但两者都是可能用到的。

因此,当用户输入拼音字符串“yanjiu”时,两者均可能出现在候选项中。但是,若明确当前的用户为学生时,“研究”较大可能是当前用户所需的,则可以提高其权重。

(2)输入环境;

通过输入法的使用环境可以动态调整词库和/或词条的权重。

例如,若输入法中具有“办公用语”和“网络用语”两个细胞词库,分别记载有办公常用的词条、网络聊天常用的词条。

一般情况下这两个词库的优先级是相同的,但当输入法识别在word中进行输入时,可以给“办公用语”这个词库增加权重,而当用户在即时通讯工具的会话窗口进行输入时,则可以给“网络用语”这个词库增加权重。

(3)词频;

一般而言,词频越高,其权重越高,反之,词频越低,其权重越低。

(4)位置。

若词库中的词库按照权重进行排序,如权重高的词条排序在前,则词条在词库中的相对位置可以表达词条的权重。

步骤202,从所述候选词列表中检测出一个或以上的非单字候选词;

非单字候选词可以为包含两个或两个以上单字的候选词。例如,若用户输入的词组序列为“jieaobuxun”,其候选词列表中可以包括“桀骜不驯”、“桀骜”、“杰奥”、“街”、“接”、“借”等候选词,则非单字候选词为“桀骜不驯”、“桀骜”、“杰奥”等。

当确定与词组序列对应的候选词列表以后,对候选词列表中的候选词进行检测,若检测到候选词为非单字候选词,则将该非单字候选词记录下来。

通常情况下,用户输入词组的时候通常存在两种考虑:一种是用户希望输入该词语,另一种是用户希望借助该词语输入该词语中的某个单字。针对于后面一种考虑,用户在输入词组的时候,往往会选择使用频率较高的词语。因此,可以对记录下来的非单字候选词按照词频进行由高到低的排序。

在一个优选实施例中,可以从排序后的非单字候选词中选择排序在前n位的非单字候选词,其中,n可以根据实际情况确定,例如,可以为1、2等。

步骤203,若检测到用户在输入所述词组序列后的第一预设时间段内按压指定按键,则对所述非单字候选词进行拆分,获得多个拆分单元;

在具体实现中,指定按键可以为开发人员预先设置的按键,也可以是用户预先设置的按键。例如,指定按键可以为物理键盘上的tab按键、ctrl按键、alt按键、f1按键、f2按键,等等。当然,除了上述按键类型以后,还可以是其他按键类型,本发明实施例对此不作限定。

需要说明的是,指定按键还可以首先由开发人员预先设置,后期用户可以根据实际情况(例如,实际使用习惯)对该指定按键进行修改。

如果用户在键入词组序列后的第一预设时间段内(例如,10毫秒内)按压指定按键,则可以视为用户发出了触发指令,以触发对上述一个或以上的非单字候选词进行拆分,形成多个拆分单元,其中,每个拆分单元包括一个或以上的单字,即每一个拆分单元包含非单字候选词中的一个或多个字符。

在一个优选实施例中,可以以单字为单位将分别将检测出的非单字候选词拆分成多个单字,每个单字作为一个拆分单元,例如,针对上述检测出的非单字候选词“桀骜不驯”、“桀骜”、“杰奥”,拆分后得到的拆分单元分别为“桀”、“骜”、“不”、“驯”、“桀”、“骜”、“杰”、“奥”。

进一步的,当用户输入包含三个或三个以上单字的候选词时,可能出于以下两种考虑:一是希望输入该非单字候选词中的某个单字,二是希望输入该非单字候选词中连续的多个单字(通常该连续的多个单字可以构成一个词,具有一定的意义)。基于上述考虑,在另一个优选实施例中,除了将获取到的非单字候选词拆分成多个单字之外,还会对非单字候选词进行分析,从中拆分出具有一定意义的词。例如,针对“桀骜不驯”,除了拆分成单字,还可以拆分成“桀骜”、“不驯”。

在实际中,若非单字候选词有多个,则拆分后得到的拆分单元可能存在重复出现的情况,因此,在对非单字候选词进行拆分形成多个拆分单元之后,可以对多个拆分单元进行去重操作,即去除拆分单元中重复出现的拆分单元。例如,上述拆分后得到的拆分单元分别为“桀”、“骜”、“不”、“驯”、“桀”、“骜”、“杰”、“奥”,其中,“桀”、“骜”两个拆分单元出现了重复,去除重复出现的拆分单元后,获得“桀”、“骜”、“不”、“驯”、“杰”、“奥”的拆分结果。

步骤204,若检测到用户在按压所述指定按键的第二预设时间段内输入特征字符串,从所述拆分单元中确定与所述特征字符串匹配的拆分单元;

在本发明实施例中,在用户按压指定按键的第二预设时间段内,可以进一步检测用户是否键入特征字符串,其中,该特征字符串与词组序列存在匹配项,即特征字符串为词组序列的部分字符串。例如,若用户输入的词组序列为“jieaobuxun”,则特征字符串可以为“jie”或为“ao”等。

第二预设时间段可以为与第一预设时间段相同的时间段,该值可以由开发人员预先设定,也可以由用户设定,本发明实施例对此不作限定。

如果在用户按压指定按键的第二预设时间段内检测到用户输入特征字符串,则可以从上述的拆分结果中匹配与特征字符串对应的拆分单元。

步骤205,判断所述与所述特征字符串匹配的拆分单元是否为一个以上,若否,则执行步骤206,若是,则执行步骤207;

在具体实现中,与特征字符串匹配的拆分单元可以为一个或一个以上。

例如,用户输入的词组序列为“jieaobuxun”,检测得到的非单字候选词为“桀骜不驯”,随后用户点击“tab”按键,触发对“桀骜不驯”的拆分,得到的拆分单元为“桀”、“骜”、“不”、“驯”,随后用户输入的特征字符串为“ao”,则在“桀”、“骜”、“不”、“驯”这四个拆分单元中匹配“ao”,得到的匹配的单字为“骜”。

又如,用户输入的词组序列为“jieaobuxun”,检测得到的非单字候选词为“桀骜不驯”、“桀骜”、“杰奥”,随后用户点击“tab”按键,触发对“桀骜不驯”、“桀骜”、“杰奥”的拆分,去重后得到的拆分单元为“桀”、“骜”、“不”、“驯”、“杰”、“奥”,随后用户输入的特征字符串为“ao”,则在“桀”、“骜”、“不”、“驯”、“杰”、“奥”这六个拆分单元中匹配“ao”,得到的匹配的单字为“骜”以及“奥”。

步骤206,直接将所述匹配的拆分单元上屏;

在本发明实施例中,当获取的与特征字符串匹配的拆分单元为一个时,则可以直接将该特征字符串上屏。

例如,在上例中,当用户输入特征字符串“ao”得到的匹配的拆分单元为“骜”,则可以直接将“骜”字上屏。

步骤207,将所述匹配的拆分单元显示在预设区域中,当检测到用户选定所述预设区域中的某一匹配的拆分单元时,将选定的所述拆分单元上屏。

在本发明实施例中,当获取的与特征字符串匹配的拆分单元为两个或以上时,则可以将该两个或以上的匹配的拆分单元展示给用户,由用户选择最终要上屏的匹配的单字。

在具体实现中,展现匹配的拆分单元的区域可以为异于候选词区域的预设区域,该预设区域可以位于候选词区域下方或两侧、且靠近候选词区域的空白处,或者,预设区域也可以在对应单字候选词的后面。应当理解的是,本发明实施例对预设区域的显示位置不作限定,只要其不影响用户的正常输入即可。

在预设区域展现匹配的拆分单元以后,用户可以用户鼠标或手指点触等方式选择需要上屏的拆分单元。

在一种实施方式中,还可以分别生成匹配的拆分单元与预设的快捷键信息的对应关系;则在所述预设区域中,显示所述快捷键信息以及对应的拆分单元。

在实际应用中,由于在显示候选词的候选词区域中通常针对每个候选词设置快捷键,例如,将数字键设定为快捷键进行候选词的输入,即当用户希望输入某个候选词的时候,只需使用相应数字键进行输入即可。为了不影响候选词的输入,本发明实施例中的拆分单元对应的快捷键信息可以为异于候选词的快捷键信息,并且,为了避免与上述指定按键混淆,该拆分单元对应的快捷键信息也可以为异于指定按键的按键。例如,拆分单元对应的快捷键信息可以为f1-f12之间的任意按键。

若为匹配的拆分单元设置了对应的快捷键,则在预设区域中,可以显示快捷键与拆分单元的关系对,当用户在键入某一个快捷键信息时,则将该快捷键信息对应的拆分单元上屏。

例如,依据上例,匹配的拆分单元为“骜”以及“奥”,若“骜”对应的快捷键信息为f1,“奥”对应的快捷键信息为f2,当用户键入f1时,则将“骜”字上屏。

在本发明实施例中,用户在输入词组序列以后,获取与该词组序列对应的非单字候选词,通过触发指定按键将非单字候选词拆分成多个拆分单元,当用户输入特征字符串以后,在多个拆分单元中匹配该特征字符串,从而获得与特征字符串匹配的拆分单元上屏,特别适用于用户需要输入生僻单字的情况,无需通过多次翻页或者删除多余的字词进行生僻字的输入,提高了用户的输入速度,降低输入成本。

参照图4,示出了本发明的一种单字输入方法实施例三的步骤流程图,可以包括如下步骤:

步骤401,接收用户输入的字符串序列;

在本发明实施例中,用户输入的字符串序列可以包括顺次排列的词组序列、指定字符信息以及特征字符串。其中,词组序列可以包括多个单字拼音组成的序列,特征字符串与词组序列存在匹配项。

指定字符信息可以为开发人员或用户预先设置的触发字符,本发明实施例可以建立一个指定字符数据库用来存储一个或多个预设的指定字符信息,指定字符信息可以为助词、连接词等,例如,指定字符信息包括“de”、“le”、“zhi”等。

例如,用户输入的字符串序列为“jieaobuxundeao”,则词组序列为“jieaobuxun”、指定字符信息为“de”以及特征字符串为“ao”。

步骤402,检测所述字符串序列中是否包括指定字符信息;

在具体实现中,当检测到用户输入字符串序列以后,在指定字符数据库中匹配该字符串序列,查找该字符串序列中是否存在指定字符数据库中包含的指定字符信息。

例如,用户输入的字符串序列为“jieaobuxundeao”,若指定字符数据库中包含的指定字符信息包括“de”、“le”、“zhi”等,则在指定字符数据库中匹配该字符串序列,获得匹配的指定字符信息为“de”。

步骤403,若所述字符串序列中包括指定字符信息,则将所述指定字符信息之前的字符序列作为词组序列,将所述指定字符信息之后的字符序列作为特征字符串,并判定为检测到触发指令。

在本发明实施例中,若字符串序列中包括指定字符信息,按照词组序列、指定字符信息以及特征字符串顺次排列的规则,可以将指定字符信息之前的字符序列作为词组序列,将所述指定字符信息之后的字符序列作为特征字符串。

例如,若用户输入的字符串序列为“jieaobuxundeao”,检测到指定字符信息“de”,则可以将“jieaobuxun”作为词组序列,将“ao”作为特征字符串。

进一步的,当字符串序列中包括指定字符信息,还可以判定为检测到用户发出了触发指令,该触发指令用于触发后续对非单字候选词的拆分。

步骤404,获取与用户输入的词组序列匹配的候选词列表;

当确定词组序列后,可以获得与该词组序列对应的一个或多个候选词,该一个或多个候选词组织成候选词列表。

步骤405,从所述候选词列表中检测出一个或以上的非单字候选词;

非单字候选词可以为包含两个或两个以上单字的候选词。例如,若用户输入的词组序列为“jieaobuxun”,其候选词列表中可以包括“桀骜不驯”、“桀骜”、“杰奥”、“街”、“接”、“借”等候选词,则非单字候选词为“桀骜不驯”、“桀骜”、“杰奥”等。

步骤406,对所述非单字候选词进行拆分,获得多个拆分单元;

在上述步骤403中,检测到字符串序列中包括指定字符信息,则视为检测到用户发出的触发指令,此时,可以对该一个或多个非单字候选词进行拆分,获得多个拆分单元。

其中,每个拆分单元包括一个或以上的单字,即每一个拆分单元包含非单字候选词中的一个或多个字符。

在实际中,若非单字候选词有多个,则拆分后得到的拆分单元可能存在重复出现的情况,因此,在对非单字候选词进行拆分形成多个拆分单元之后,可以对多个拆分单元进行去重操作。

步骤407,从所述拆分单元中确定与所述特征字符串匹配的拆分单元;

在上述步骤403中,若检测到字符串序列中包括指定字符信息并且指定字符信息之后存在字符串,则将位于该指定字符信息之后的字符串作为特征字符串,并从拆分单元中确定与特征字符串匹配的拆分单元。

步骤408,判断所述与所述特征字符串匹配的拆分单元是否为一个以上;若否,则执行步骤409,若是,则执行步骤410;

在具体实现中,与特征字符串匹配的拆分单元可以为一个或一个以上。

步骤409,直接将所述匹配的拆分单元上屏;

在本发明实施例中,当获取的与特征字符串匹配的拆分单元为一个时,则可以直接将该特征字符串上屏。

步骤410,将所述匹配的拆分单元显示在预设区域中,当检测到用户选定所述预设区域中的某一匹配的拆分单元时,将选定的所述拆分单元上屏。

在本发明实施例中,当获取的与特征字符串匹配的拆分单元为两个或以上时,则可以将该两个或以上的匹配的拆分单元展示给用户,由用户选择最终要上屏的匹配的单字。

在预设区域展现匹配的拆分单元以后,用户可以用户鼠标或手指点触等方式选择需要上屏的拆分单元。

在一种实施方式中,还可以分别生成匹配的拆分单元与预设的快捷键信息的对应关系;则在所述预设区域中,显示所述快捷键信息以及对应的拆分单元,当用户在键入某一个快捷键信息时,则将该快捷键信息对应的拆分单元上屏。

在本发明实施例中,用户在输入字符串序列以后,若能够从该字符串序列中检测出词组序列、指定字符信息以及特征字符串,则获取与该词组序列对应的非单字候选词,将该非单字候选词拆分成多个拆分单元,以及从多个拆分单元中匹配该特征字符串,从而获得与特征字符串匹配的拆分单元上屏,特别适用于用户需要输入生僻单字的情况,用户只需要一次输入即可获得生僻单字,无需通过多次翻页或者删除多余的字词进行生僻字的输入,提高了用户输入的流畅性以及输入速度,降低输入成本。

需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。

参照图5,示出了本发明的一种单字输入装置实施例的结构框图,具体可以包括如下模块:

候选词获取模块501,用于获取与用户输入的词组序列匹配的候选词列表;

非单字候选词检测模块502,用于从所述候选词列表中检测出一个或以上的非单字候选词;

候选词拆分模块503,用于在检测到触发指令时,对所述非单字候选词进行拆分,获得多个拆分单元;

匹配模块504,用于若检测到用户输入的特征字符串,从所述拆分单元中确定与所述特征字符串匹配的拆分单元,其中,所述特征字符串与所述词组序列存在匹配项。

在本发明实施例的一种优选实施例中,所述触发指令采用如下方式检测:

若检测到用户在输入所述词组序列后的第一预设时间段内按压指定按键,则判定检测到触发指令。

在本发明实施例的一种优选实施例中,所述特征字符串为用户在按压所述指定按键的第二预设时间段内输入的字符串。

在本发明实施例的一种优选实施例中,所述词组序列为用户输入的字符串序列的部分,在所述字符串序列中包括顺次排列的词组序列、指定字符信息以及特征字符串;

所述装置还包括:

字符串序列输入模块,用于接收用户输入的字符串序列;

指定字符检测模块,用于检测所述字符串序列中是否包括指定字符信息;

检测模块,用于若所述字符串序列中包括指定字符信息,则将所述指定字符信息之前的字符序列作为词组序列,将所述指定字符信息之后的字符序列作为特征字符串,并判定为检测到触发指令。

在本发明实施例的一种优选实施例中,所述装置还包括:

第一上屏模块,用于在所述与所述特征字符串匹配的拆分单元为一个时,直接将所述匹配的拆分单元上屏。

在本发明实施例的一种优选实施例中,所述装置还包括:

拆分单元显示模块,用于在所述与所述特征字符串匹配的拆分单元为一个以上时,将所述匹配的拆分单元显示在预设区域中;

第二上屏模块,用于当检测到用户选定所述预设区域中的某一匹配的拆分单元时,将选定的所述拆分单元上屏。

在本发明实施例的一种优选实施例中,所述装置还包括:

对应对生成模块,用于分别生成所述匹配的拆分单元与预设的快捷键信息的对应关系;

对应对显示模块,用于在所述预设区域中,显示所述快捷键信息以及对应的拆分单元。

在本发明实施例的一种优选实施例中,所述第二上屏模块还用于:

当用户在键入所述快捷键信息时,将所述快捷键信息对应的拆分单元上屏。

关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。

图6是根据一示例性实施例示出的一种单字输入装置600的框图。例如,装置600可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。

参照图6,装置600可以包括以下一个或多个组件:处理组件602,存储器604,电源组件606,多媒体组件608,音频组件610,输入/输出(i/o)的接口612,传感器组件614,以及通信组件616。

处理组件602通常控制装置600的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件602可以包括一个或多个处理器620来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件602可以包括一个或多个模块,便于处理组件602和其他组件之间的交互。例如,处理部件602可以包括多媒体模块,以方便多媒体组件608和处理组件602之间的交互。

存储器604被配置为存储各种类型的数据以支持在装置600的操作。这些数据的示例包括用于在装置600上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器604可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(sram),电可擦除可编程只读存储器(eeprom),可擦除可编程只读存储器(eprom),可编程只读存储器(prom),只读存储器(rom),磁存储器,快闪存储器,磁盘或光盘。

电源组件606为装置600的各种组件提供电力。电源组件606可以包括电源管理系统,一个或多个电源,及其他与为装置600生成、管理和分配电力相关联的组件。

多媒体组件608包括在所述装置600和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(lcd)和触摸面板(tp)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件608包括一个前置摄像头和/或后置摄像头。当设备600处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件610被配置为输出和/或输入音频信号。例如,音频组件610包括一个麦克风(mic),当装置600处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器604或经由通信组件616发送。在一些实施例中,音频组件610还包括一个扬声器,用于输出音频信号。

i/o接口612为处理组件602和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件614包括一个或多个传感器,用于为装置600提供各个方面的状态评估。例如,传感器组件614可以检测到设备600的打开/关闭状态,组件的相对定位,例如所述组件为装置600的显示器和小键盘,传感器组件614还可以检测装置600或装置600一个组件的位置改变,用户与装置600接触的存在或不存在,装置600方位或加速/减速和装置600的温度变化。传感器组件614可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件614还可以包括光传感器,如cmos或ccd图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件614还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。

通信组件616被配置为便于装置600和其他设备之间有线或无线方式的通信。装置600可以接入基于通信标准的无线网络,如wifi,2g或3g,或它们的组合。在一个示例性实施例中,通信部件616经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信部件616还包括近场通信(nfc)模块,以促进短程通信。例如,在nfc模块可基于射频识别(rfid)技术,红外数据协会(irda)技术,超宽带(uwb)技术,蓝牙(bt)技术和其他技术来实现。

在示例性实施例中,装置600可以被一个或多个应用专用集成电路(asic)、数字信号处理器(dsp)、数字信号处理设备(dspd)、可编程逻辑器件(pld)、现场可编程门阵列(fpga)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。

在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器604,上述指令可由装置600的处理器620执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是rom、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等。

一种非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行一种基于输入法的候选词显示方法,所述方法包括:获取与用户输入的词组序列匹配的候选词列表;从所述候选词列表中检测出一个或以上的非单字候选词;当检测到触发指令时,对所述非单字候选词进行拆分,获得多个拆分单元;若检测到用户输入的特征字符串,从所述拆分单元中确定与所述特征字符串匹配的拆分单元,其中,所述特征字符串与所述词组序列存在匹配项。

优选地,所述触发指令采用如下方式检测:

若检测到用户在输入所述词组序列后的第一预设时间段内按压指定按键,则判定检测到触发指令。

优选地,所述特征字符串为用户在按压所述指定按键的第二预设时间段内输入的字符串。

优选地,所述词组序列为用户输入的字符串序列的部分,在所述字符串序列中包括顺次排列的词组序列、指定字符信息以及特征字符串;

在所述获取与用户输入的词组序列匹配的候选词列表的步骤之前,还包括:

接收用户输入的字符串序列;

检测所述字符串序列中是否包括指定字符信息;

若所述字符串序列中包括指定字符信息,则将所述指定字符信息之前的字符序列作为词组序列,将所述指定字符信息之后的字符序列作为特征字符串,并判定为检测到触发指令。

优选地,所述方法还包括:

若所述与所述特征字符串匹配的拆分单元为一个,则将所述匹配的拆分单元上屏。

优选地,所述方法还包括:

若所述与所述特征字符串匹配的拆分单元为一个以上,则将所述匹配的拆分单元显示在预设区域中;

当检测到用户选定所述预设区域中的某一匹配的拆分单元时,将选定的所述拆分单元上屏。

优选地,所述方法还包括:

分别生成所述匹配的拆分单元与预设的快捷键信息的对应关系;

在所述预设区域中,显示所述快捷键信息以及对应的拆分单元。

优选地,所述当检测到用户选定所述预设区域中的某一匹配的拆分单元时,将选定的所述拆分单元上屏的步骤包括:

当用户在键入所述快捷键信息时,将所述快捷键信息对应的拆分单元上屏。

图7是本发明实施例中服务器的结构示意图。该服务器700可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(centralprocessingunits,cpu)722(例如,一个或一个以上处理器)和存储器732,一个或一个以上存储应用程序742或数据744的存储介质730(例如一个或一个以上海量存储设备)。其中,存储器732和存储介质730可以是短暂存储或持久存储。存储在存储介质730的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器722可以设置为与存储介质730通信,在服务器700上执行存储介质730中的一系列指令操作。

服务器700还可以包括一个或一个以上电源726,一个或一个以上有线或无线网络接口750,一个或一个以上输入输出接口758,一个或一个以上键盘756,和/或,一个或一个以上操作系统741,例如windowsservertm,macosxtm,unixtm,linuxtm,freebsdtm等等。

本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。

应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1