分为两部分的语音识别的制作方法_4

文档序号：9291750阅读：来源：国知局

00上，一个位于和 /或指向用户的嘴处，而另一个一般性地位于/指向远离用户的嘴，并通过第二麦克风检测实质上的背景噪音。该背景噪音同样可以是在第一麦克风处检测到的信号的分量，所以来自第二麦克风的信号可以从来自第一麦克风的信号中被减去以增强音频信号的语音分量的质量。
[0075] 图7示出了示例性非限制无线免手持视频计算头戴装置，HSC100,其配置为在语音命令下操作，并示出了示意性模块。在该实施例中，头戴式装置包含微型显示器9010、扬声器9006和麦克风9020。麦克风9020被绘述为在臂9013的端部。在备选方案中，麦克风 9012可被安装到连接到微型显示器9010的臂。
[0076] 在HSC 100的操作中，用户可被呈现以微显示器9010上的图像，例如，如上文提到的作为由主机计算机200应用的输出。用户也可经由扬声器9006接收音频输出并经由麦克风9012提供语音输入9090。对于语音输入，当用户对麦克风9012讲话时，麦克风在模块 9021a将模拟音频（声音）信号转换为数字信号。随后数字化的音频信号被语音识别引擎 9035a处理以将数字化音频信号翻译为单词或其它符号。翻译后的信号随后可被用作处理器（诸如运行应用92的处理器84)的输入，其确定语音输入是否对应于命令，如果是，则触发适当的动作。特别地，处理器84确定与命令相关联的动作，评估相关联动作的关键性，并且对于超过阈值的被评估的关键性，将动作表现保持或条件化直到成功完成分级的（一个或多个）确认。例如，关键性阈值水平可以是在存储器9120中储存的、预设（预定义）参数（常量）。
[0077] 对于语音驱动的应用中两级确认的情况，控制器9100访问两级确认模块9036,其可以本地地位于每个HSC 100或HMD或远程地位于主机200处。两级确认软件模块9036 包含指令，以对用户显示相关信息框等的图像，诸如下文示例中提供的和在图4至图6中详细描述的。图形转换模块9040转换经由总线9103从两级确认模块9036接收到的图像指令并将指令转换为图形以显示在单眼显示器9010上。
[0078] 同时，文本到语音模块9035b转换从两级确认软件模块9036接收到的指令以创建表示将被图像的内容的声音。指令被转换为数字声音，其表示对应的文本到语音模块9035b 馈送到数模转换器9021b的图像内容，其进而被馈送给扬声器9006以将音频呈现给用户。
[0079] 两级确认软件模块9036可被本地存储在存储器9120或远程储存在主机200处。用户可以说出/表达来自图像的命令选择并且用户的语音9090在麦克风9020处被接收。接收到的语音随后在模数转换器9021a处从模拟信号转换为数字信号。一旦语音从模拟转换为数字信号，语音识别模块9035a将语音处理为识别语音。识别出的语音与已知语音和根据指令9036的两级确认模块进行比较。
[0080] HSC 100或HMD的用户可以使用两级确认软件模块9036,其位于本地或来自远程主机200,其中用户被呈现有信息框、文本框或对话框的图像（例如图4至图6的420、520、 620)，要求在微型显示器9010上的用户确认和通过头戴式计算机100的扬声器9006传递的相同用户确认的音频。因为头戴式计算机100同样装配有麦克风9020,用户可表达确认单词或短语（命令选择）。或者头戴式计算机可以如上文图4至图6的示例所描述的在确定性操作上自动超时。超时设置可以被储存在例如存储器9120中。
[0081] 虽然参照其实施例具体示出并描述了本发明，但本领域技术人员应理解，在不背离随附权利要求覆盖的本发明的范围的情况下，可以在其中在形式上和细节上进行多种改变。
【主权项】
1. 一种计算机应用中语音控制的方法，包括：在被提供有具有麦克风和显示器的头戴式计算机时，经由所述麦克风接收声音输入；使用耦合到所述头戴式计算机的语音识别引擎处理所述声音输入，所述处理包括所述语音识别引擎将所述声音输入解译为针对具有关键性水平的动作的命令，所述关键性水平满足或超过阈值关键性水平；以及响应于经处理的所述声音输入： (i) 在所述显示器上显示第一对话框，以及 (ii) 使所述动作的头戴式计算机表现取决于用户做出对应于所述第一对话框中的提示的第一确定性表述。2. 根据权利要求1所述的方法，其中所述第一对话框的显示能够自动超时。3. 根据权利要求1所述的方法，其中所述命令是令所述头戴式计算机从低功耗睡眠模式中解除的命令。4. 根据权利要求1所述的方法，其中所述命令是令所述头戴式计算机从受限语音识别模式中解除的命令。5. 根据权利要求1所述的方法，进一步包括步骤：经由所述麦克风接收所述第一确定性表述，所述第一确定性表述对应于所述第一对话框中的所述提示；以及响应于对所述第一确定性表述的接收，在所述显示器上显示第二对话框，所述头戴式计算机使所述动作的表现取决于所述用户做出对应于所述第二对话框中的提示的第二确定性表述。6. 根据权利要求5所述的方法，其中所述第二对话框的显示能够自动超时。7. 根据权利要求5所述的方法，其中所述命令是令所述头戴式计算机从低功耗睡眠模式中解除的命令。8. 根据权利要求5所述的方法，其中所述命令是令所述头戴式计算机从受限语音识别模式中解除的命令。9. 根据权利要求5所述的方法，其中所述第一确定性表述和所述第二确定性表述彼此不同。10. -种语音控制设备，包括：提供的具有显示器和麦克风的头戴式计算机，所述麦克风被配置为接收声音输入；语音识别引擎，被配置为解译所述声音输入，并作为所述解译的部分来确定所述声音输入是否为针对具有关键性水平的动作的命令，所述关键性水平满足或超过阈值关键性水平，所述命令是关键命令；以及处理器，通信地耦合到所述语音识别引擎，并响应于所述语音识别引擎对声音输入是关键命令的确定，而被配置为： (i) 在所述显示器上显示器第一对话框，以及 (ii) 使所述动作的头戴式计算机取决于用户做出对应于所述第一对话框中的提示的第一确定性表述。11. 根据权利要求10所述的设备，其中所述第一对话框能够自动超时。12. 根据权利要求10所述的设备，其中所述命令是所述头戴式计算机从低功耗睡眠模式中解除的命令。13. 根据权利要求10所述的设备，其中所述命令是令所述头戴式计算机从受限语音识别模式中解除的命令。14. 根据权利要求10所述的设备，所述处理器进一步被配置为：经由所述麦克风接收所述第一确定性表述，所述第一确定性表述对应于所述第一对话框中的所述提示；以及响应于对所述第一确定性表述的接收，在所述显示器上显示第二对话框，所述头戴式计算机使所述动作的表现取决于所述用户做出对应于所述第二对话框中的提示的第二确定性表述。15. 根据权利要求14所述的设备，其中所述第二对话框能够自动超时。16. 根据权利要求14所述的设备，其中所述命令是所述头戴式计算机从低功耗睡眠模式中解除的命令。17. 根据权利要求14所述的设备，其中所述命令是所述头戴式计算机从受限语音识别模式中解除的命令。18. 根据权利要求14所述的设备，其中所述第一确定性表述和所述第二确定性表述彼此不同。19. 一种头戴式计算机，包括：显示器；麦克风，所述麦克风接收声音输入；语音识别引擎，被配置为解译所述声音输入，并作为所述解译的部分来确定所述声音输入是否为具有关键性水平的动作的命令，所述关键性水平满足或超过阈值关键性水平，所述命令是关键命令；以及处理器，通信地耦合到所述语音识别引擎，并响应于所述语音识别引擎对声音输入是关键命令的确定，而被配置为： (i) 在所述显示器上显示器第一对话框，以及 (ii) 使所述动作的头戴式计算机表现取决于用户做出对应于所述第一对话框中的提示的第一确定性表述。20. 根据权利要求19所述的头戴式计算机，所述处理器进一步被配置为：经由所述麦克风接收所述第一确定性表述，所述第一确定性表述对应于所述第一对话框中的所述提示；以及响应于对所述第一确定性表述的接收，在所述显示器上显示第二对话框，所述头戴式计算机使所述动作的表现取决于所述用户做出对应于所述第二对话框中的提示的第二确定性表述。
【专利摘要】呈现了针对用于控制装置的语音识别系统的改进。特征包括两级确认，两级受限语音识别模式以及用于语音驱动的应用和系统的两级唤醒。一种头戴式计算机装置包括这种分级的确认操作。
【IPC分类】G02B27/01, G10L15/22
【公开号】CN105009202
【申请号】CN201380074058
【发明人】C·帕金森, J·J·雅各布森, S·A·庞伯, D·B·弗格森
【申请人】寇平公司
【公开日】2015年10月28日
【申请日】2013年12月27日
【公告号】EP2941769A1, US20140195247, WO2014107413A1

完整全部详细技术资料下载

当前第4页1 2 3 4