用于调用自动助理的动态的和/或特定于场境的热词的制作方法

文档序号：23725821发布日期：2021-01-26 16:05阅读：来源：国知局

技术特征：
1.一种使用一个或多个处理器实现的方法，包括：至少部分地在计算设备上操作自动助理；对由麦克风捕获的音频数据监视一个或多个默认热词，其中，检测到一个或多个所述默认热词触发所述自动助理从有限的热词收听状态转换为语音识别状态；检测所述计算设备向给定状态的转变；以及响应于所述检测，除了所述一个或多个默认热词之外，对由所述麦克风捕获的所述音频数据监视一个或多个特定于场境的热词，其中，检测到一个或多个所述特定于场境的热词触发所述自动助理执行与所述给定状态相关联的响应动作，而无需检测到一个或多个所述默认热词或将所述自动助理转换为所述语音识别状态。2.根据权利要求1所述的方法，其中，所述给定状态包括由所述自动助理设置的计时器到期，并且其中，检测到所述一个或多个特定于场境的热词触发所述自动助理取消所述计时器。3.根据权利要求1所述的方法，其中，所述给定状态包括经由所述自动助理触发的媒体回放，并且其中，检测到所述一个或多个特定于场境的热词使所述自动助理改变所述媒体回放。4.根据权利要求3所述的方法，其中，更改所述媒体回放包括暂停、播放、快进、倒带或改变音量中的一项或多项。5.根据前述权利要求中的任一项所述的方法，其中，所述检测包括：确定内容已经被渲染在所述计算设备的显示器上。6.根据权利要求5所述的方法，还包括基于在所述显示器上渲染的所述内容来识别所述一个或多个特定于场境的热词。7.根据权利要求6所述的方法，其中，基于在所述显示器上渲染的所述内容来识别所述一个或多个特定于场境的热词包括：基于在所述显示器上渲染的内容来识别一个或多个音素，其中，所识别的一个或多个音素用于调整经训练的机器学习模型以接受一个或多个音素并拒绝一个或多个其他音素。8.一种辅助计算设备，包括：一个或多个处理器；麦克风，可操作地与所述一个或多个处理器耦合；以及非暂时性存储器，可操作地与所述一个或多个处理器耦合，其中，所述存储器存储指令，所述指令响应于所述一个或多个处理器对所述指令的执行而使所述一个或多个处理器操作自动助理；其中，所述自动助理能够在有限的热词收听状态和一个或多个特定于场境的收听状态之间转换；其中，在所述有限的热词收听状态下，所述自动助理对由所述麦克风采样的音频输入监视一个或多个默认热词，其中，对一个或多个所述默认热词的检测触发所述自动助理从所述有限的热词收听状态转换到语音识别状态；以及其中，在至少一个所述特定于场境的收听状态中，补充或代替所述一个或多个默认热词，所述自动助理对由所述麦克风采样的所述音频输入监视一个或多个特定于场境的热词，其中，对一个或多个所述特定于场境的热词的检测触发所述自动助理执行与所述助理
计算设备的当前场境相关联的响应动作，而无需检测一个或多个所述默认热词或将所述自动助理转换到所述语音识别状态。9.一种包括指令的至少一个非暂时性计算机可读介质，所述指令响应于一个或多个处理器执行所述指令而使所述一个或多个处理器执行以下操作：至少部分地在计算设备上操作自动助理；对由麦克风捕获的音频数据监视一个或多个默认热词，其中，检测到一个或多个所述默认热词触发所述自动助理从有限的热词收听状态转换为语音识别状态；检测所述计算设备向给定状态的转变；以及响应于所述检测，除了所述一个或多个默认热词之外，对由所述麦克风捕获的所述音频数据监视一个或多个特定于场境的热词，其中，检测到一个或多个特定于场境的热词触发所述自动助理执行与所述给定状态相关联的响应动作，而无需检测到一个或多个所述默认热词或将所述自动助理转换为所述语音识别状态。10.根据权利要求9所述的至少一个非暂时性计算机可读介质，其中，所述给定状态包括由所述自动助理设置的计时器到期，并且其中，检测到所述一个或多个特定于场境的热词触发所述自动助理取消所述计时器。11.根据权利要求9所述的至少一个非暂时性计算机可读介质，其中，所述给定状态包括经由所述自动助理触发的媒体回放，并且其中，检测到所述一个或多个特定于场境的热词使所述自动助理改变所述媒体回放。12.根据权利要求11所述的至少一个非暂时性计算机可读介质，其中，所述媒体回放的改变包括暂停、播放、快进、倒带或改变音量中的一项或多项。13.根据权利要求9至12中的任一项所述的至少一个非暂时性计算机可读介质，其中，所述检测包括：确定内容已经被渲染在所述计算设备的显示器上。14.如权利要求13所述的至少一个非暂时性计算机可读介质，还包括：基于在所述显示器上渲染的所述内容来识别所述一个或多个特定于场境的热词。15.根据权利要求14所述的至少一个非暂时性计算机可读介质，其中，基于在所述显示器上渲染的所述内容来识别所述一个或多个特定于场境的热词包括：基于在所述显示器上渲染的内容来识别一个或多个音素，其中，所识别的一个或多个音素用于调整经训练的机器学习模型以接受一个或多个音素并拒绝一个或多个其他音素。16.一种系统，包括一个或多个处理器和与所述一个或多个处理器可操作地耦合的存储器，其中，所述存储器存储指令，所述指令响应于一个或多个处理器执行所述指令而使所述一个或多个处理器执行以下操作：至少部分地在计算设备上操作自动助理；对由麦克风捕获的音频数据监视一个或多个默认热词，其中，检测到一个或多个所述默认热词触发所述自动助理从有限的热词收听状态转换为语音识别状态；检测所述计算设备向给定状态的转变；以及响应于所述检测，除了所述一个或多个默认热词之外，对由所述麦克风捕获的所述音频数据监视一个或多个特定于场境的热词，其中，检测到一个或多个特定于场境的热词触发所述自动助理执行与所述给定状态相关联的响应动作，而无需检测到一个或多个所述默认热词或将所述自动助理转换为所述语音识别状态。
17.根据权利要求16所述的系统，其中，所述给定状态包括由所述自动助理设置的计时器到期，并且其中，检测到所述一个或多个特定于场境的热词触发所述自动助理取消所述计时器。18.根据权利要求16所述的系统，其中，所述给定状态包括经由所述自动助理触发的媒体回放，并且其中，检测到所述一个或多个特定于场境的热词使所述自动助理改变所述媒体回放。19.根据权利要求18所述的系统，其中，所述媒体回放的改变包括暂停、播放、快进、倒带或改变音量中的一项或多项。20.根据权利要求16至19中的任一项所述的系统，其中，所述检测包括：确定内容已经被渲染在所述计算设备的显示器上。

完整全部详细技术资料下载

当前第2页1 2 3