输入方法和装置与流程

文档序号:12461729阅读:来源:国知局

技术特征:

1.一种输入方法,其特征在于,所述方法包括:

获取用户输入的字符串,并对所述字符串进行处理,得到音节序列;

根据预先建立的词库中音节与词条的对应关系,确定所述音节序列中各个音节的对应词条;

根据所述音节序列中相邻音节的对应词条两两之间的转移权重,为相邻音节中的在前音节确定候选词条;

选取所述音节序列的最后一个音节的预定数目个对应词条作为所述最后一个音节的候选词条;

根据各个音节的候选词条之间的转移权重,从各个音节的候选词条中选取词条生成所述音节序列对应的句子。

2.根据权利要求1所述的方法,其特征在于,所述选取所述音节序列的最后一个音节的预定数目个对应词条作为所述最后一个音节的候选词条,包括:

从所述最后一个音节的对应词条中,按照词频由大到小的顺序选取预定数目个词条,作为所述最后一个音节的候选词条;或者,

根据所述最后一个音节的对应词条和所述最后一个音节的前一音节的对应词条之间的转移权重,确定所述最后一个音节的候选词条。

3.根据权利要求2所述的方法,其特征在于,所述根据所述最后一个音节的对应词条和所述最后一个音节的前一音节的对应词条之间的转移权重,确定所述最后一个音节的候选词条,包括:

遍历最后一个音节的对应词条和最后一个音节的前一音节的对应词条,生成由所述最后一个音节的对应词条和所述最后一个音节的前一音节的对应词条两两组成的词条对;

确定生成的词条对中最后一个音节的对应词条和最后一个音节的前一音节的对应词条之间的转移概率;

按照转移概率由大到小的顺序选取预定数目个词条对;

将选取出的词条对中所述最后一个音节的对应词条确定为所述最后一个音节的候选词条。

4.根据权利要求3所述的方法,其特征在于,所述根据所述音节序列中相邻音节的对应词条两两之间的转移权重,为相邻音节中的在前音节确定候选词条,包括:

将所述最后一个音节确定为当前音节;

执行确定在前音节的候选词的步骤:根据当前音节的候选词条和所述当前音节的前一音节的对应词条之间的转移概率,确定所述前一音节的候选词条;确定所述前一音节是否是所述音节序列的第一个音节;响应于所述前一音节是所述第一个音节,输出确定的与音节对应的候选词条;

响应于所述前一音节不是所述第一个音节,将所述前一音节作为当前音节,继续执行确定在前音节的候选词条的步骤。

5.根据权利要求4所述的方法,其特征在于,所述:根据当前音节的候选词条和所述当前音节的前一音节的对应词条之间的转移概率,确定所述前一音节的候选词条,包括:

遍历所述当前音节的候选词条和所述当前音节的前一音节的对应词条,生成由所述当前音节的候选词条与所述前一音节的对应词条两两组成的词条对;

确定生成的词条对中当前音节的候选词条与前一音节的对应词条之间的转移概率;

按照转移概率由大到小的顺序,选取预定数目个词条对;

将选取出的词条对中的所述前一音节的对应词条确定为所述前一音节的候选词条。

6.根据权利要求1所述的方法,其特征在于,所述根据所述音节序列中相邻音节的对应词条两两之间的转移权重,为相邻音节中的在前音节确定候选词条,包括:

将所述音节序列的第一个音节确定为当前音节;

执行确定当前音节的候选词条的步骤:根据当前音节的对应词条和所述当前音节的后一音节的对应词条之间的转移概率,确定所述当前音节的候选词条;确定所述后一音节是否是所述音节序列的最后一个音节;响应于所述后一音节是所述最后一个音节,输出确定的与音节对应的候选词条;

响应于所述后一音节不是所述最后一个音节,将所述后一音节作为当前音节,继续执行确定在前音节的候选词的步骤。

7.根据权利要求6所述的方法,其特征在于,所述根据当前音节的对应词条和所述当前音节的后一音节的对应词条之间的转移概率,确定所述当前音节的候选词条,包括:

遍历所述当前音节的对应词条和所述当前音节的后一音节的对应词条,生成由所述当前音节的对应词条和所述后一音节的对应词条两两组成的词条对;

确定词条对中所述当前音节的对应词条和所述后一音节的对应词条之间的转移概率;

按照转移概率由大到小的顺序选取预定数目个词条对;

将选取出的词条对中的所述当前音节的对应词条作为所述当前音节的候选词条。

8.根据权利要求7所述的方法,其特征在于,所述从所述音节序列的最后一个音节的对应词条中为所述最后一个音节确定候选词条,包括:

响应于所述后一音节是所述最后一个音节,从由所述最后一个音节的对应词条和所述最后一个音节的前一音节的对应词条组成的词条对中,按照转移概率由大到小的顺序选取预定数目个词条对;

将选取出的词条对中所述最后一个音节的对应词条作为所述最后一个音节的候选词条。

9.根据权利要求1-8中任一项所述的方法,其特征在于,所述根据预先建立的词库中音节与词条的对应关系,确定所述音节序列中各个音节的对应词条,包括:

对于所述音节序列中的单个音节,从在所述词库中与所述音节的有对应关系的词条中,按照词频由大到小的顺序,选取预定数目个与所述音节由对应关系的词条作为所述音节的对应词条。

10.根据权利要求9所述的方法,其特征在于,所述对所述字符串进行处理,得到音节序列,包括:

基于正向最大匹配方式,对上述字符串进行切分;

补全切分后的字符串的音节信息,得到音节序列。

11.根据权利要求10所述的方法,其特征在于,所述补全切分后的字符串的音节信息,得到音节序列,包括:

对于音节序列中的最后一个音节的韵母,在预先建立的韵母关系表中获取与该韵母对应的对应韵母,其中,所述对应韵母中的字母数量大于该韵母的字母数量;

将最后一个音节的声母和所述对应韵母组成一个扩展音节,将扩展音节和上述最后一个音节共同作为所述音节序列新的最后一个音节。

12.根据权利要求11所述的方法,其特征在于,所述根据各个音节的候选词条之间的转移权重,从各个音节的候选词条选取词条生成所述音节序列对应的句子,包括:

遍历所述音节序列中各个音节的候选词条;

生成以各个音节的候选词条为节点的路径,其中,生成的路径的各个节点均属于不同的音节;

确定各个路径的长句权重,其中,所述长句权重根据路径中节点之间的转移权重确定;

选取长句权重最大的路径中的候选词条生成上述音节序列对应的句子。

13.一种输入装置,其特征在于,所述装置包括:

处理单元,用于获取用户输入的字符串,并对所述字符串进行处理,得到音节序列;

对应词条确定单元,用于根据预先建立的词库中音节与词条的对应关系,确定所述音节序列中各个音节的对应词条,其中,所述词库包括词条、音节与词条的对应关系、词条之间的转移权重,其中,所述转移权重用于表征由两个词条组成的词条对中的在前词条出现的情况下在后词条出现的概率;

候选词确定单元,用于根据所述音节序列中相邻音节的对应词条两两之间的转移权重,为相邻音节中的在前音节确定候选词条;

选取单元,用于选取所述音节序列的最后一个音节的预定数目个对应词条作为所述最后一个音节的候选词条;

生成单元,用于根据各个音节的候选词条之间的转移权重,从各个音节的候选词条中选取词条生成所述音节序列对应的句子。

14.根据权利要求13所述的装置,其特征在于,所述词库还包括词条的词频,其中,所述词频用于表征词条在词库中的出现频率;以及

所述选取单元,进一步用于:

从所述最后一个音节的对应词条中,按照词频由大到小的顺序选取预定数目个词条,作为所述最后一个音节的候选词条;或者,

根据所述最后一个音节的对应词条和所述最后一个音节的前一音节的对应词条之间的转移权重,确定所述最后一个音节的候选词条。

15.根据权利要求14所述的装置,其特征在于,所述选取单元,进一步用于:

遍历最后一个音节的对应词条和最后一个音节的前一音节的对应词条,生成由所述最后一个音节的对应词条和所述最后一个音节的前一音节的对应词条两两组成的词条对;

确定生成的词条对中最后一个音节的对应词条和最后一个音节的前一音节的对应词条之间的转移概率;

按照转移概率由大到小的顺序选取预定数目个词条对;

将选取出的词条对中所述最后一个音节的对应词条确定为所述最后一个音节的候选词条。

16.根据权利要求15所述的装置,其特征在于,所述候选词确定单元包括逆向确定子单元,用于:

将所述最后一个音节确定为当前音节;

执行确定在前音节的候选词的步骤:根据当前音节的候选词条和所述当前音节的前一音节的对应词条之间的转移概率,确定所述前一音节的候选词条;确定所述前一音节是否是所述音节序列的第一个音节;响应于所述前一音节是所述第一个音节,输出确定的与音节对应的候选词条;

响应于所述前一音节不是所述第一个音节,将所述前一音节作为当前音节,继续执行确定在前音节的候选词条的步骤。

17.根据权利要求13所述的装置,其特征在于,所述候选词确定单元包括正向确定子单元,用于:

将所述音节序列的第一个音节确定为当前音节;

执行确定当前音节的候选词条的步骤:根据当前音节的对应词条和所述当前音节的后一音节的对应词条之间的转移概率,确定所述当前音节的候选词条;确定所述后一音节是否是所述音节序列的最后一个音节;响应于所述后一音节是所述最后一个音节,输出确定的与音节对应的候选词条;

响应于所述后一音节不是所述最后一个音节,将所述后一音节作为当前音节,继续执行确定在前音节的候选词的步骤。

18.根据权利要求13-17任一项所述的装置,其特征在于,所述处理单元,进一步用于:

对于音节序列中的最后一个音节的韵母,在预先建立的韵母关系表中获取与该韵母对应的对应韵母,其中,所述对应韵母中的字母数量大于该韵母的字母数量;

将最后一个音节的声母和所述对应韵母组成一个扩展音节,将扩展音节和上述最后一个音节共同作为所述音节序列新的最后一个音节。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1