一种自造词的识别方法和装置的制作方法

文档序号:6597776阅读:131来源:国知局
专利名称:一种自造词的识别方法和装置的制作方法
技术领域
本发明涉及计算机技术领域,特别涉及一种自造词的识别方法和装置。
背景技术
现有的数字键盘输入法系统中,均有其预置的语料库,从预置的语料库中可以获 得与用户输入的内容相匹配的单词,当从预置的语料库中无法获得匹配的单词时,用户可 以通过将输入法手动切换至自造词模式,识别用户输入的自造词。各种输入法系统对于自造词的识别方法大致可以分为两类,其中一类按照输入顺 序,依次在候选单字中选择每个按键信号对应的字符;另一类通过MultiTap (连续按键)的 方式从左到右依次输入字符。以通过典型的数字键盘上输入“staycation”(09年新词,宅 度假)为例,假设各个输入法系统中均不包含“staycation” 一词,S卩“staycation”属于自 造词,则用户选择进入自造词模式。在某种输入法的自造词模式下,“staycation”的识别 过程可以如图Ia至图Im所示;在另一种输入法的自造词模式下,“staycation”的识别过 程可以如图加至图an所示;在第三种输入法的自造词模式下,“staycation”的识别过程 可以如图3a至3k所示。在实现本发明的过程中,发明人发现现有技术至少存在以下缺点用户需要手动进入自造词模式,用户体验不佳;进入自造词模式后,自造词的识别 速度低下。

发明内容
为了提高自造词的识别速度,本发明实施例提供了一种自造词的识别方法和装 置。所述技术方案如下—种自造词的识别方法,所述方法包括步骤1 接收用户输入的按键信号,并将已接收的按键信号作为待匹配按键序列;步骤2 在预置的语料库中查询与待匹配按键序列相匹配的内容,并将查询到的 内容提供给用户;步骤3 接收用户的选择信号,将所述选择信号选择的内容替换所述待匹配按键 序列中的相应内容;步骤4:将所述待匹配按键序列中未被替换的内容作为新的待匹配按键序列,返 回执行步骤2,直至完成所述自造词的识别为止。所述与待匹配按键序列相匹配的内容分为完全匹配的内容和部分匹配的内容;相应的,所述将查询到的内容提供给用户,具体包括当在预置的语料库中存在与所述待匹配按键序列完全匹配的内容时,将包括所述 完全匹配的内容在内的查询到的内容提供给用户;当在预置的语料库中不存在与所述待匹配按键序列完全匹配的内容时,将查询到 的部分匹配的内容提供给用户。
4
所述在预置的语料库中查询与待匹配按键序列相匹配的内容之后,所述方法还包 括对所述查询到的内容进行保存;相应的,将查询到的内容提供给用户,具体包括当在预置的语料库中不存在与所述待匹配按键序列相匹配的内容时,将已保存的 全部或部分内容提供给用户。所述完成所述自造词的识别之后,所述方法还包括将所述保存的内容删除。所述完成所述自造词的识别,具体包括接收到所述用户的确认完成信号;或所述待匹配按键序列中不存在未被替换的内容。所述完成所述自造词的识别之后,所述方法还包括将已完成识别的自造词存储 到所述预置的语料库中。一种自造词的识别装置,所述方法包括接收模块,用于接收用户输入的按键信号,并将已接收的按键信号作为待匹配按 键序列;匹配提供模块,用于在预置的语料库中查询与待匹配按键序列相匹配的内容,并 将查询到的内容提供给用户;选择替换模块,用于接收用户的选择信号,并将所述选择信号选择的内容替换所 述待匹配按键序列中的相应内容,并将所述待匹配按键序列中未被替换的内容作为新的待 匹配按键序列,提供给所述匹配提供模块,直至完成所述自造词的识别为止。所述与待匹配按键序列相匹配的内容分为完全匹配的内容和部分匹配的内容;相应的,所述匹配提供模块用于在预置的语料库中查询与所述待匹配按键序列 相匹配的内容;当在预置的语料库中存在与所述待匹配按键序列完全匹配的内容时,将包括所述 完全匹配的内容在内的查询到的内容提供给用户;当在预置的语料库中不存在与所述待匹配按键序列完全匹配的内容时,将查询到 的部分匹配的内容提供给用户。所述装置还包括保存模块,用于对所述匹配提供模块查询到的内容进行保存;相应的,所述匹配提供模块还用于当在预置的语料库中不存在与所述待匹配按键序列相匹配的内容时,将所述保存 模块中已保存的全部或部分内容提供给用户。所述保存模块还用于在所述选择替换模块完成所述自造词的识别之后,将所述保存的内容删除。所述选择替换模块还用于在接收到所述用户的确认完成信号后,或者,当所述待匹配按键序列中不存在未 被替换的内容时,不再将所述待匹配按键序列中未被替换的内容作为新的待匹配按键序列,提供给 所述匹配提供模块。
所述装置还包括更新模块,用于将所述选择替换模块识别出的自造词保存到所 述预置的语料库中。本发明实施例提供的技术方案带来的有益效果是通过在用户输入过程中为用户提供可能用到的单词,加快了自造词的识别速度; 不需要用户手动将输入法切换至自造词模式,用户可以在输入过程中随时随地进行词语的 构造,方便用户使用,用户体验好。


图Ia至图Im是现有技术中在某种输入法的自造词模式下自造词“staycation” 的识别过程示意图;图加至图an是现有技术中在另一种输入法的自造词模式下自造词“staycation” 的识别过程示意图;图3a至图3k是现有技术中在第三种输入法的自造词模式下自造词“staycation” 的识别过程示意图;图4是本发明实施例1中提供的自造词的识别方法流程图;图5是本发明实施例2中提供的自造词的识别方法流程图;图6是本发明实施例2中提供的典型的数字键盘布局示意图;图7是本发明实施例2中提供的自造词“staycation”的识别过程示意图;图8是本发明实施例2中提供的自造词“staycation”的识别过程的另一示意图;图9是本发明实施例3中提供的自选词的识别装置结构示意图。
具体实施例方式为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方 式作进一步地详细描述。实施例1为了提高自造词的识别速度,本实施例提供了一种自造词的识别方法,参见图4, 该方法包括401 接收用户输入的按键信号,并将已接收的按键信号作为待匹配按键序列;402 在预置的语料库中查询与待匹配按键序列相匹配的内容,并将查询到的内容 提供给用户;其中,与待匹配按键序列相匹配的内容分为完全匹配的内容和部分匹配的内 容;当在预置的语料库中存在与所述待匹配按键序列完全匹配的内容时,将包括所述 完全匹配的内容在内的查询到的内容提供给用户;当在预置的语料库中不存在与所述待匹配按键序列完全匹配的内容时,将查询到 的部分匹配的内容提供给用户。其中,完全匹配的内容可以指与待匹配按键序列长度相等的内容;部分匹配的 内容可以指长度大于待匹配按键序列、但以待匹配按键序列所匹配的内容为开头的内容, 用于预测用户可能会输入的自造词。
6
403:接收用户的选择信号,并将该选择信号选择的内容替换待匹配按键序列中的 相应内容;404:将所述待匹配按键序列中未被替换的内容作为新的待匹配按键序列,返回执 行步骤402,直至完成所述自造词的识别为止。其中,完成自造词的识别具体包括接收到所述用户的确认完成信号;或者待匹配按键序列中不存在未被替换的内容。本发明实施例提供了一种自造词的识别方法,通过在用户输入过程中为用户提供 可能用到的单词,加快了自造词的识别速度;不需要用户手动将输入法切换至自造词模式, 用户可以在输入过程中随时随地进行词语的构造,方便用户使用,用户体验好。实施例2为了提高自造词的识别速度,本实施例提供了一种自造词的识别方法,以执行主 体为常见的手机为例,但并不用以限制本方法的执行主体,执行主体可以是支持数字键盘 输入法系统的多种硬件,如电脑、手机等。参见图5,该方法包括501 接收用户通过数字键盘输入的按键信号,并以数字的形式显示给用户;其中,典型的数字键盘上的字符分布可以如图6所示。从图6所示的典型的数字 键盘的字符分布可以知道,在数字键盘中,每一个数字按键不仅可以代表数字本身,还可以 代表字母或者符号,当用户希望输入英文字母或符号时,可以通过敲击数字键盘进行输入。 例如,当用户希望输入“staycation”时,会敲击数字键盘上的7拟9228466,用户每敲击一 次按键,手机均会接收到该按键所触发的信号。其中,每接收到一个按键信号,手机便将已 接收的全部按键信号所组成的按键序列作为待匹配按键序列。502 从预置的语料库中查询与待匹配按键序列相匹配的内容,并对查询到的内容 进行保存;S卩,当已接收的按键信号为一个时,查询该第一个按键信号在语料库中相匹配的 内容,如字母、数字、标点符号等;当已接收的按键信号逐个增加时,每增加一个按键信号, 将第一个按键信号到当前接收的按键信号的全部作为待匹配按键序列,在语料库中查询与 待匹配按键序列相匹配的内容,包括单一的字母、数字、标点符号及其组合等。同时,将已查 询得到的每一个按键序列的匹配内容进行保存。在这里需要强调的是,与待匹配按键序列相匹配的内容可以包括与待匹配按键 序列长度相等的内容,即与待匹配按键序列完全匹配的内容;还可以包括长度大于待匹配 按键序列、但以待匹配按键序列所匹配的内容为开头的内容,即与待匹配按键序列部分匹 配的内容,用于预测用户可能会输入的自造词。具体的,以“staycation”为例,当用户敲击数字键盘上的7时,手机接收到该按键 信号,将其作为待匹配按键序列,在预置的语料库中查询得到与该按键序列相匹配的内容, 如P、q、r、s、7、she、sad、so、quay等;当用户继续敲击数字键盘上的8时,手机接收到该按 键信号,将7对应的按键信号与8对应的按键信号作为待匹配按键序列,在语料库中进行匹 配,得到与此待匹配按键序列相匹配的内容,如st、qu、ru、pu、78、stay、qua、sub、pub等; 依此类推。503 将查询到的内容提供给用户;
其中,可以将查询到的与待匹配按键序列相匹配的内容显示出来给用户。当在预置的语料库中存在与所述待匹配按键序列完全匹配的内容时,将包括完全 匹配的内容在内的查询到的内容提供给用户;可以是仅有完全匹配的内容,也可以是完全 匹配的内容加上一些或者全部部分匹配的内容。当在预置的语料库中不存在与所述待匹配按键序列完全匹配的内容时,将查询到 的部分匹配的内容提供给用户;可以是全部的部分匹配内容,也可以是部分的部分匹配内容。匹配的内容还可以按照一定的规则提供给用户,例如可以是根据词频的排列顺 序,使用率越高的词排在靠前的位置、使用率较低的词排在靠后的位置;也可以按照匹配程 度进行排列,与待匹配按键序列长度相同的匹配内容排在靠前的位置、与待匹配按键序列 长度不同的匹配内容排在靠后的位置等。504 接收用户的选择信号,根据选择信号所选择的内容替换待匹配按键序列中的 相应内容;其中,用户可以根据手机在输入法的候选区中提供的内容,选择与其期望输入的 自造词全部或部分匹配的内容。需要说明的是,由于是自造词,因此用户选择的内容可以是 一个新单词,例如实施例中举出的staycation (宅度假),也可以是字母与数字的组合,例 如P2P(点对点),还可以是字符的组合,例如*(~_~)*,还可以是各种字母、字符、数字等的 组合,在此不做赘述。这就使得本发明实施例所提供的自造词的识别非常灵活多样,给用户 以更方便、更快捷、更好的使用体验,增强用户对于输入法的信心。505 判断是否收到完成自造词的识别信号;如果否,则执行步骤506 ;如果是,则执行步骤507。其中,完成自造词的识别信号可以但不限于包括判断替换的字符串长度是否与 输入区中的相应内容长度相同,如果长度相同,则说明自造词的识别过程已经完成;如果长 度不相同,则可以认为自造词的识别过程尚未完成。或者,当用户确认输入法系统中输入区 的相应内容已经是其希望输入的内容,则发送确认信号给执行主体,执行主体接收到用户 发送的上述确认信号,则将确认信号作为完成自造词的识别信号,认为自造词的识别过程 完成。或者,判断待匹配的按键序列中是否包括未被替换的内容,如果有,则可以认为自造 词的识别过程未完成,如果没有,则可以认为自造词的识别过程已完成。识别完成后,可以 将保存的匹配内容进行删除。506:将输入法系统的输入区中未被替换的内容作为待匹配按键序列并执行步骤 502 ;当方法执行到步骤506时,执行主体可以将当前使用的输入法切换至自造词模式。507 将识别完成的自造词更新至预置的语料库中。使用上述方法进行自造词的识别过程可以如图7a至图7c所示,用户通过数字键 盘输入7拟9228466,手机将上述按键信号作为待匹配的按键序列,在预置的语料库中进行 查询,只查询到前4位的匹配内容,在候选区中提供给用户;用户选择stay,手机接收到该 选择信号,并使用stay替换78 ;然后将228466作为新的待匹配的按键序列,在预置的语料库中进行查询,查询到匹配内容,在候选区中提供给用户;用户选择cation,手机接收到 该选择信号,并使用cation替换228466。用户发送确认完成识别自造词的信号,如按下ok 键或者确认键等,手机将staycation保存在预置的语料库中。其中,手机可以通过多种方式将匹配内容提供给用户,一个候选区如图7a至图7c 所示,或者两个候选区如图8a至图8c所示等等。本发明实施例提供了一种自造词的识别方法,通过在用户输入过程中为用户提供 可能用到的单词,加快了自造词的识别速度;不需要用户手动将输入法切换至自造词模式, 用户可以在输入过程中随时随地进行词语的构造,方便用户使用,用户体验好。实施例3为了提高自造词的识别速度,本实施例提供了一种自造词的识别装置,该装置的 具体工作方法可以参见实施例1、2中的具体描述,在此不做赘述。参见图9,该装置包括接收模块901,用于接收用户输入的按键信号,并将已接收的按键信号作为待匹配 按键序列;匹配提供模块902,用于在预置的语料库中查询与待匹配按键序列相匹配的内容, 并将查询到的内容提供给用户;选择替换模块903,用于接收用户的选择信号,并将该选择信号选择的内容替换待 匹配按键序列中的相应内容,完成所述自造词的识别。其中,与待匹配按键序列相匹配的内容分为完全匹配的内容和部分匹配的内 容;相应的,匹配提供模块902用于在预置的语料库中查询与待匹配按键序列相匹 配的内容;当在预置的语料库中存在与待匹配按键序列完全匹配的内容时,将包括完全匹配 的内容在内的查询到的内容提供给用户;当在预置的语料库中不存在与待匹配按键序列完全匹配的内容时,将查询到的部 分匹配的内容提供给用户。进一步的,该装置还包括保存模块,用于对匹配提供模块902匹配到的内容进行保存;相应的,该匹配提供模块902还用于当在预置的语料库中不存在与待匹配按键序列相匹配的内容时,将保存的全部或 部分匹配内容提供给用户。进一步的,该保存模块还用于在选择替换模块完成自造词的识别之后,将所述保 存的内容删除。进一步的,该装置还包括保存模块,用于将选择替换模块识别出的自造词保存到预置的语料库中。本发明实施例提供了一种自造词的识别装置,通过在用户输入过程中为用户提供 可能用到的单词,加快了自造词的识别速度;不需要用户手动将输入法切换至自造词模式, 用户可以在输入过程中随时随地进行词语的构造,方便用户使用,用户体验好。以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和 原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
9
权利要求
1.一种自造词的识别方法,其特征在于,所述方法包括步骤1 接收用户输入的按键信号,并将已接收的按键信号作为待匹配按键序列;步骤2 在预置的语料库中查询与待匹配按键序列相匹配的内容,并将查询到的内容 提供给用户;步骤3 接收用户的选择信号,将所述选择信号选择的内容替换所述待匹配按键序列 中的相应内容;步骤4:将所述待匹配按键序列中未被替换的内容作为新的待匹配按键序列,返回执 行步骤2,直至完成所述自造词的识别为止。
2.如权利要求1所述的自造词的识别方法,其特征在于,所述与待匹配按键序列相匹 配的内容分为完全匹配的内容和部分匹配的内容;相应的,所述将查询到的内容提供给用户,具体包括当在预置的语料库中存在与所述待匹配按键序列完全匹配的内容时,将包括所述完全 匹配的内容在内的查询到的内容提供给用户;当在预置的语料库中不存在与所述待匹配按键序列完全匹配的内容时,将查询到的部 分匹配的内容提供给用户。
3.如权利要求1所述的自造词的识别方法,其特征在于,所述在预置的语料库中查询 与待匹配按键序列相匹配的内容之后,所述方法还包括对所述查询到的内容进行保存;相应的,将查询到的内容提供给用户,具体包括当在预置的语料库中不存在与所述待匹配按键序列相匹配的内容时,将已保存的全部 或部分内容提供给用户。
4.如权利要求3所述的自造词的识别方法,其特征在于,所述完成所述自造词的识别 之后,所述方法还包括将所述保存的内容删除。
5.如权利要求1所述的自造词的识别方法,其特征在于,所述完成所述自造词的识别, 具体包括接收到所述用户的确认完成信号;或所述待匹配按键序列中不存在未被替换的内容。
6.如权利要求1所述的自造词的识别方法,其特征在于,所述完成所述自造词的识别 之后,所述方法还包括将已完成识别的自造词存储到所述预置的语料库中。
7.一种自造词的识别装置,其特征在于,所述方法包括接收模块,用于接收用户输入的按键信号,并将已接收的按键信号作为待匹配按键序列;匹配提供模块,用于在预置的语料库中查询与待匹配按键序列相匹配的内容,并将查 询到的内容提供给用户;选择替换模块,用于接收用户的选择信号,并将所述选择信号选择的内容替换所述待 匹配按键序列中的相应内容,并将所述待匹配按键序列中未被替换的内容作为新的待匹配 按键序列,提供给所述匹配提供模块,直至完成所述自造词的识别为止。
8.如权利要求7所述的自造词的识别装置,其特征在于,所述与待匹配按键序列相匹 配的内容分为完全匹配的内容和部分匹配的内容;相应的,所述匹配提供模块用于在预置的语料库中查询与待匹配按键序列相匹配的 内容;当在预置的语料库中存在与所述待匹配按键序列完全匹配的内容时,将包括所述完全 匹配的内容在内的查询到的内容提供给用户;当在预置的语料库中不存在与所述待匹配按键序列完全匹配的内容时,将查询到的部 分匹配的内容提供给用户。
9.如权利要求8所述的自造词的识别装置,其特征在于,所述装置还包括 保存模块,用于对所述匹配提供模块查询到的内容进行保存;相应的,所述匹配提供模块还用于当在预置的语料库中不存在与所述待匹配按键序列相匹配的内容时,将所述保存模块 中已保存的全部或部分内容提供给用户。
10.如权利要求9所述的自造词的识别装置,其特征在于,所述保存模块还用于 在所述选择替换模块完成所述自造词的识别之后,将所述保存的内容删除。
11.如权利要求7所述的自造词的识别装置,其特征在于,所述选择替换模块还用于 在接收到所述用户的确认完成信号后,或者,当所述待匹配按键序列中不存在未被替换的内容时,不再将所述待匹配按键序列中未被替换的内容作为新的待匹配按键序列,提供给所述 匹配提供模块。
12.如权利要求7所述的自造词的识别装置,其特征在于,所述装置还包括更新模块, 用于将所述选择替换模块识别出的自造词保存到所述预置的语料库中。
全文摘要
本发明公开了一种自造词的识别方法和装置,属于计算机技术领域。所述方法包括步骤1接收用户输入的按键信号,并将已接收的按键信号作为待匹配按键序列;步骤2在预置的语料库中查询与待匹配按键序列相匹配的内容,并将查询到的内容提供给用户;步骤3接收用户的选择信号,并将所述选择信号选择的内容替换所述待匹配按键序列中的相应内容;步骤4将所述待匹配按键序列中未被替换的内容作为新的待匹配按键序列,返回执行步骤2,直至完成所述自造词的识别为止。所述装置包括接收模块、匹配提供模块和选择替换模块。通过在用户输入过程中为用户提供可能用到的单词,加快了自造词的识别速度。
文档编号G06F17/30GK102135968SQ20101010351
公开日2011年7月27日 申请日期2010年1月26日 优先权日2010年1月26日
发明者刘廷超, 司天歌, 路依莎 申请人:腾讯科技(深圳)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1