一种语音识别的方法、装置与流程

文档序号:24292786发布日期:2021-03-17 00:41阅读:125来源:国知局
技术特征:

1.一种语音识别的方法,其特征在于,包括以下步骤:

步骤100,获取用户的第一语音命令;

步骤200,确定是否向用户提供场景词表;若是,则向用户提供场景词表,否则不提供场景词表,直接与用户进行语音交互。

2.根据权利要求1所述的方法,其特征在于,

步骤300,获取用户的第二语音命令;判断用户的第二语音命令是否与场景词表关联,若是,基于场景词表识别用户的第二语音命令;若否,直接识别用户的语音命令。

3.根据权利要求2所述的方法,其特征在于,步骤300具体包括以下步骤

步骤310,获取第二语音命令中与场景词表关联的关键语音;

步骤320,执行关键语音识别步骤;

步骤330,基于识别的关键语音确定用户的第二语音命令。

4.根据权利要求3所述的方法,其特征在于,步骤320具体包括以下步骤:

将关键语音与场景词库中的词进行匹配,判断是否可以基于关键语音中的一个或多个字精确定位至场景词表中的词,若是,则将该定位的词作为关键语音识别结果;若否,则语音控制逻辑进一步与用户进行语音交互,以明确用户的语音命令。

5.根据权利要求4所述的方法,其特征在于,所述方法还包括

确定关键语音为选项词还是场景词表的词,若包括场景词表的词,则确定关键语音的字数,从场景词表中筛选出与关键语音字数相同的词,然后基于可以准确识别的关键语音的字的发音以及该字在关键语音的各个字中的位置,判断是否可以精确定位筛选出的场景词中的词,若是则确定关键语音;

若关键语音还包括选项词,则在可以准确识别选项词时,基于选项词定位场景词表中的词,不对其他关键语音进行识别;若无法准确识别选项词时,结合其他关键语音进行识别;

或者,对关键语音中的选项词和场景词表的词均进行识别,在二者识别结果一致时,将识别结果作为对关键语音的识别结果,若二者识别结果不一致时,则进一步执行以下步骤:

将根据选项词和场景词表的词识别的结果作为候选结果,判断该候选结果的两个选项词是否为发音相似的词,若是,则判断候选结果的两个场景词是否为发音相似的词,若不是,则将关键语音中包括的场景词表的词分别与两个候选词进行匹配,将匹配度最高的词作为识别结果。

6.一种语音识别的装置,其特征在于,包括:

获取模块,获取用户的第一语音命令;

交互模块,确定是否向用户提供场景词表;若是,则向用户提供场景词表,否则不提供场景词表,直接与用户进行语音交互。

7.根据权利要求6所述的装置,其特征在于,

获取模块,还用于获取用户的第二语音命令;

交互模块判断用户的第二语音命令是否与场景词表关联,若是,基于场景词表识别用户的第二语音命令;若否,直接识别用户的语音命令。

8.根据权利要求7所述的装置,其特征在于,交互模块基于场景词表识别用户的第二语音命令,具体包括以下步骤:

步骤310,获取第二语音命令中与场景词表关联的关键语音;

步骤320,执行关键语音识别步骤;

步骤330,基于识别的关键语音确定用户的第二语音命令。

9.根据权利要求8所述的装置,其特征在于,步骤320具体包括以下步骤:

将关键语音与场景词库中的词进行匹配,判断是否可以基于关键语音中的一个或多个字精确定位至场景词表中的词,若是,则将该定位的词作为关键语音识别结果;若否,则与用户进行语音交互,以明确用户的语音命令。

10.根据权利要求9所述的装置,其特征在于,交互模块还用于

确定关键语音为选项词还是场景词表的词,若包括场景词表的词,则确定关键语音的字数,从场景词表中筛选出与关键语音字数相同的词,然后基于可以准确识别的关键语音的字的发音以及该字在关键语音的各个字中的位置,判断是否可以精确定位筛选出的场景词中的词,若是则确定关键语音;

若关键语音还包括选项词,则在可以准确识别选项词时,基于选项词定位场景词表中的词,不对其他关键语音进行识别;若无法准确识别选项词时,结合其他关键语音进行识别;

或者,对关键语音中的选项词和场景词表的词均进行识别,在二者识别结果一致时,将识别结果作为对关键语音的识别结果,若二者识别结果不一致时,则进一步执行以下步骤:

将根据选项词和场景词表的词识别的结果作为候选结果,判断该候选结果的两个选项词是否为发音相似的词,若是,则判断候选结果的两个场景词是否为发音相似的词,若不是,则将关键语音中包括的场景词表的词分别与两个候选词进行匹配,将匹配度最高的词作为识别结果。

11.一种语音控制逻辑,其特征在于,该语音控制逻辑包括权利要求6-10中任一项所述的装置。

12.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器存储可被处理器执行的计算机指令,当处理器执行上述计算机指令时,实现如权利要求1-5任一项所述的方法。

13.一种计算机可读存储介质,其特征在于,存储计算机指令,所述计算机指令用于实现如权利要求1-5任一项所述的方法。


技术总结
本发明提供一种语音识别的方法,包括以下步骤:步骤100,获取用户的第一语音命令;步骤200,确定是否向用户提供场景词表;若是,则向用户提供场景词表,否则不提供场景词表,直接与用户进行语音交互。通过该方法,可以提高语音识别的准确率与速度。

技术研发人员:赵晓朝;袁志伟
受保护的技术使用者:北京蓦然认知科技有限公司
技术研发日:2020.11.19
技术公布日:2021.03.16
当前第2页1 2 
网友询问留言 留言:0条
  • 还没有人留言评论。精彩留言会获得点赞!
1