技术总结
实施方式涉及确定用于经由自动助理界面接收的、用于与自动助理交互的口头话语的语音识别的语言。在各种实施方式中,指示话音输入的音频数据包括来自用户的自然语言请求,该音频数据可以作为跨多个语音到文本(“STT”)机器学习模型的输入被应用,以生成多个候选语音识别输出。每个STT机器学习模型都可以以特定语言被训练。对于所述多个STT模型中的每个相应的STT机器学习模型,可以分析所述多个候选语音识别输出以确定针对所述相应的STT机器学习模型的熵得分。基于所述熵得分,可以选择与所述多个STT机器学习模型中的至少一个STT机器学习模型相关联的目标语言。自动助理可以使用所述目标语言来响应所述请求。所述目标语言来响应所述请求。所述目标语言来响应所述请求。
技术研发人员:伊格纳西奥
受保护的技术使用者:谷歌有限责任公司
技术研发日:2019.01.08
技术公布日:2021/1/23