用于同时的关键字发现、转录和实时通信的音频管线的制作方法

文档序号:26009679发布日期:2021-07-23 21:29阅读:来源:国知局

技术特征:

1.一种用于验证用户激活设备的语音命令处理的意图的方法,所述方法包括:

使用计算设备的一个或多个处理器:

将第一音频信号提交给关键字检测器,所述关键字检测器产生关于在所述第一音频信号中是否存在被设计用于激活所述语音命令处理的一个或多个词语的第一指示;

将从被通信地耦合到所述计算设备的音频捕获设备接收到的第二音频信号提交给所述关键字检测器,所述关键字检测器产生关于在所述第二音频信号中是否存在被设计用于激活所述语音命令处理的所述一个或多个词语的第二指示;

基于关于是否存在所述一个或多个词语的所述第一指示和所述第二指示两者来确定是否激活所述语音命令处理;以及

基于所述确定来选择性地激活所述设备的所述语音命令处理。

2.根据权利要求1所述的方法,其中,所述第一音频信号是来自通信应用的、源自一个或多个远程参与者的音频。

3.根据权利要求1所述的方法,其中,所述第一音频信号被复制,并且其中,第一副本被提交给所述关键字检测器,并且第二副本被使得通过被通信地耦合到所述计算设备的输出设备来播放。

4.根据权利要求1所述的方法,其中,基于所述第一指示和所述第二指示两者来确定是否激活所述语音命令处理包括:

当所述第一指示指示不存在所述一个或多个词语并且所述第二指示指示存在所述一个或多个词语时激活所述语音命令处理。

5.根据权利要求1所述的方法,其中,基于所述第一指示和所述第二指示两者来确定是否激活所述语音命令处理包括:

当所述第一指示和所述第二指示两者都指示存在所述一个或多个词语时避免激活所述语音命令处理。

6.根据权利要求1所述的方法,其中,基于所述第一指示和所述第二指示两者来确定是否激活所述语音命令处理包括:

当所述第一指示指示存在所述一个或多个词语并且所述第二指示指示不存在所述一个或多个词语时避免激活所述语音命令处理。

7.根据权利要求6所述的方法,还包括:

基于所述第一指示指示存在所述一个或多个词语并且所述第二指示指示不存在所述一个或多个词语来确定回声消除器是活动的;以及

响应于确定所述回声消除器是活动的而调整通信应用的数字信号处理设置以补偿所述回声消除器。

8.根据权利要求1所述的方法,其中,所述第一音频信号被发送到被通信地耦合到所述一个或多个处理器的输出设备,并且所述第二音频信号是从被通信地耦合到所述一个或多个处理器的输入设备接收到的。

9.一种验证用户激活计算设备的语音命令处理的意图的计算设备,所述计算设备包括:

处理器;

包括指令的存储器,所述指令当由所述处理器运行时使所述处理器执行包括以下的操作:

将第一音频信号提交给关键字检测器,所述关键字检测器产生关于在所述第一音频信号中是否存在被设计用于激活所述语音命令处理的一个或多个词语的第一指示;

将从被通信地耦合到所述计算设备的音频捕获设备接收到的第二音频信号提交给所述关键字检测器,所述关键字检测器产生关于在所述第二音频信号中是否存在被设计用于激活所述语音命令处理的所述一个或多个词语的第二指示;

基于关于是否存在所述一个或多个词语的所述第一指示和所述第二指示两者来确定是否激活所述语音命令处理;以及

基于所述确定来选择性地激活所述计算设备的所述语音命令处理。

10.根据权利要求9所述的计算设备,其中,所述第一音频信号是来自通信应用的、源自一个或多个远程参与者的音频。

11.根据权利要求9所述的计算设备,其中,所述操作还包括:复制所述第一音频信号,并且将第一副本提交给所述关键字检测器,并且第二副本被使得通过被通信地耦合到所述计算设备的输出设备来播放。

12.根据权利要求9所述的计算设备,其中,基于所述第一指示和所述第二指示两者来确定是否激活所述语音命令处理的操作包括:

当所述第一指示指示不存在所述一个或多个词语并且所述第二指示指示存在所述一个或多个词语时激活所述计算设备。

13.根据权利要求9所述的计算设备,其中,基于所述第一指示和所述第二指示两者来确定是否激活所述语音命令处理的操作包括:

当所述第一指示和所述第二指示两者都指示存在所述一个或多个词语时避免激活所述语音命令处理。

14.根据权利要求9所述的计算设备,其中,基于所述第一指示和所述第二指示两者来确定是否激活所述语音命令处理的操作包括:

当所述第一指示指示存在所述一个或多个词语并且所述第二指示指示不存在所述一个或多个词语时避免激活所述语音命令处理。

15.根据权利要求14所述的计算设备,其中,所述操作还包括:

基于所述第一指示指示存在所述一个或多个词语并且所述第二指示指示不存在所述一个或多个词语来确定回声消除器是活动的;以及

响应于确定所述回声消除器是活动的而调整通信应用的数字信号处理设置以补偿所述回声消除器。


技术总结
在一些示例中公开了用于防止无意激活语音激活设备的语音命令处理的方法、系统和机器可读介质。第一音频信号可以是将被输出到被通信地耦合到计算设备的扬声器的音频信号。第二音频信号可以从麦克风或其他音频捕获设备输入。这两种音频信号都输入到关键字检测器,以检查是否存在激活关键字。如果在第二音频信号中检测到(一个或多个)激活关键字但是在第一音频信号中没有检测到,则激活所述设备的语音命令处理,因为这很可能是来自用户的命令,而不是来自所述扬声器的反馈。

技术研发人员:S·维拉于萨姆;S·斯里尼瓦桑
受保护的技术使用者:微软技术许可有限责任公司
技术研发日:2019.11.14
技术公布日:2021.07.23
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1