用于使用搜索查询信息的言语识别处理的方法和系统与流程

文档序号:12678439阅读:来源:国知局

技术特征:

1.一种用于言语识别处理的方法,包括:

在计算装置处接收指示包括词序列的搜索查询的流行度的信息;

基于所述信息确定词的一个或多个子序列,每个子序列包括基于顺序的所述搜索查询的一个或多个词,所述一个或多个词以所述顺序出现于所述搜索查询的所述词序列中;以及

提供指示词的所述一个或多个子序列的信息以更新言语识别系统,所述言语识别系统被配置为将给定说出话语转换为给定词序列。

2.根据权利要求1所述的方法,其中,所述搜索查询包括以下中的一个或多个:文本串和语音搜索查询。

3.根据权利要求1所述的方法,其中,所述言语识别系统被配置为包括给定词序列的出现概率,并且其中,提供指示词的所述一个或多个子序列的所述信息以更新所述言语识别系统包括:

基于所述一个或多个子序列和指示所述搜索查询的所述流行度的所述信息来更新所述出现概率。

4.根据权利要求3所述的方法,其中,提供指示词的所述一个或多个子序列的所述信息来更新所述言语识别系统包括:

更新所述言语识别系统以包括所述一个或多个子序列;以及

向所述一个或多个子序列指派相应的出现概率,所述出现概率高于其它词序列的给定出现概率。

5.根据权利要求1所述的方法,进一步包括:

将所述言语识别系统中的给定词序列的搜索空间约束至至少所述一个或多个子序列,以供所述言语识别系统将所述给定说出话语转换成所述给定词序列。

6.根据权利要求1所述的方法,进一步包括:

使得所述言语识别系统在尝试将所述给定说出话语与其它词序列匹配之前,尝试将所述给定说出话语与所述一个或多个子序列中的一个子序列匹配。

7.根据权利要求1所述的方法,进一步包括:

基于指示所述搜索查询的所述流行度的所述信息为所述一个或多个子序列指派相应的出现概率,其中,所述相应的出现概率随时间变化。

8.根据权利要求1所述的方法,进一步包括:

基于指示所述搜索查询的所述流行度的所述信息向所述一个或多个子序列指派相应的出现概率;

不断接收所述搜索查询的所述流行度的已更新的信息;以及

基于已更新的信息来修改所述相应的出现概率。

9.根据权利要求8所述的方法,其中,所述相应的出现概率基于已更新的信息而随时间推移衰减。

10.根据权利要求1所述的方法,其中,所述计算装置包括所述言语识别系统。

11.根据权利要求1所述的方法,其中,指示所述搜索查询的所述流行度的所述信息是基于所述搜索查询向搜索引擎的提交频率。

12.根据权利要求11所述的方法,其中,确定词的所述一个或多个子序列包括:

基于所述搜索查询向所述搜索引擎的所述提交频率超过阈值,来确定词的一个或多个子序列。

13.一种其上存储有指令的计算机可读存储器,所述指令在由计算装置执行时,使得所述计算装置执行功能,所述功能包括:

接收指示包括词序列的搜索查询的流行度的信息;

基于所述信息,确定词的一个或多个子序列,每个子序列包括基于顺序的所述搜索查询的一个或多个词,所述一个或多个词以所述顺序出现于所述搜索查询的所述词序列中;以及

提供指示词的所述一个或多个子序列的信息以更新言语识别系统,所述言语识别系统被配置为将给定说出话语转换为给定词序列。

14.根据权利要求13所述的计算机可读介质,其中,确定所述一个或多个子序列的功能包括:

生成因子图,所述因子图包括自动机状态和自动机弧,所述自动机弧中的每一个自动机弧与来自所述搜索查询的所述词序列的词相对应。

15.根据权利要求14所述的计算机可读介质,其中,确定所述一个或多个子序列中的子序列的功能进一步包括:

选择由连接到第一自动机状态的第一自动机弧表示的第一词;

继续至与所述第一自动机状态相邻的第二自动机状态;以及

选择由连接到所述第二自动机状态的第二弧表示的第二词,其中,在所述搜索查询的所述词序列中所述第二词与所述第一词相邻。

16.根据权利要求14所述的计算机可读介质,其中,所述一个或多个子序列中的词的子序列被允许在所述因子图中的任何给定自动机状态处开始。

17.一种装置,所述装置包括:

至少一个处理器;

数据存储装置;以及

所述数据存储装置中的程序指令,所述程序指令在由所述至少一个处理器执行时,使得所述装置执行功能,所述功能包括:

接收指示包括词序列的搜索查询的流行度的信息;

基于所述信息,确定词的一个或多个子序列,每个子序列包括基于顺序的所述搜索查询的一个或多个词,所述一个或多个词以所述顺序出现于所述搜索查询的所述词序列中;以及

提供指示词的所述一个或多个子序列的信息以更新言语识别系统,所述言语识别系统被配置为将给定说出话语转换为给定词序列。

18.根据权利要求17所述的装置,其中,所述功能进一步包括:

基于在给定时间段内所述搜索查询向搜索引擎的提交频率来确定度量,其中,确定所述一个或多个子序列的所述功能是基于所述度量与阈值的比较。

19.根据权利要求17所述的装置,其中,确定所述一个或多个子序列的所述功能包括:

生成因子图,所述因子图包括自动机状态和自动机弧,所述自动机弧中的每一个自动机弧与来自所述搜索查询的所述词序列的词相对应。

20.根据权利要求19所述的装置,其中,确定所述一个或多个子序列中的子序列的所述功能包括:

选择由连接到第一自动机状态的第一自动机弧表示的第一词;

继续至与所述第一自动机状态相邻的第二自动机状态;以及

选择由连接到所述第二自动机状态的第二弧表示的第二词,其中,在所述搜索查询的所述词序列中所述第二词与所述第一词相邻,并且其中,所述子序列被允许在所述因子图中的任何给定自动机状态处开始。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1