分为两部分的语音识别的制作方法

文档序号:9291750阅读:758来源:国知局
分为两部分的语音识别的制作方法
【专利说明】分为两部分的语音识别
[0001] 相关申请
[0002] 本申请要求2013年1月4日提交的美国临时申请号61/749, 243的权益。下文具 有与2008年1月8日提交的美国申请号12/008, 114、2008年1月8日提交的美国申请号 12/008, 104,和2012年5月10日提交的美国申请号13/468, 207相关的主题。上述申请以 其全部内容并入本文。
【背景技术】
[0003] 语音识别(ASR)系统用于控制装置。对于多数情况,ASR系统工作良好并允许用 户以高精确度操纵并控制系统。
[0004] 然而,存在高精确度不足的且只有100%的精度是可接受的一些情景,或者存在这 样一些情景,即,我们完全不能让ASR由于噪音而意外地触发,或将说出的对话误解译为真 实的命令。

【发明内容】

[0005] 本发明解决现有技术中的上述问题和缺点。为应对上述情况,申请人设计了两级 确认处理。
[0006] 具体地,本发明的ASR实施例提供如下特征:
[0007] 两级确认;
[0008] 两级受限语音识别模式,和/或
[0009] 针对语音驱动系统的两级唤醒。
[0010] 在一个优选实施例中,本发明涉及计算机应用中语音控制的方法,其中,提供了具 有麦克风和显示器的头戴式计算机,其经由麦克风接收声音输入,使用耦合到头戴式计算 机的语音识别引擎来处理声音输入。作为该处理的部分,语音识别引擎用于解译声音输入, 以确定其是否为针对具有关键性水平的动作的命令,该关键性水平满足或超过阈值关键性 水平,即,所谓的关键性命令。如果确定命令是关键性命令,则第一对话框被显示在显示器 上并且在用户处,并使与命令相关联的动作表现取决于用户做出对应于所述第一对话框中 的提示的第一确定性表述。在另一个实施例中,在本段上文中描述的方法进一步涉及具有 自动超时能力的第一对话框,或关键性命令是头戴式计算机从低功耗睡眠模式或受限语音 识别模式中解除的命令。
[0011] 在另一个优选实施例中,方法进一步涉及经由麦克风接收对应于第一对话框中的 提示的第一确定性表述;以及响应于对第一确定性表述的接收,在显示器上显示第二对话 框,头戴式计算机使所述动作的表现取决于所述用户做出对应于所述第二对话框中的提示 的第二确定性表述。在其他实施例中,本段上文中描述的方法发进一步涉及具有自动超时 能力的第二对话框,或关键性命令是令头戴式计算机从低功耗睡眠模式或受限语音识别模 式中解除的命令。在又另一个实施例中,第一确定性表述和第二确定性表述彼此不同。
[0012] 计算机系统、头戴式计算机、装置和设备可以实施上述方法。实现上述方法的另外 其它实施例包括计算机程序产品。
[0013] 在一个优选实施例中,本发明涉及语音控制装置,其提供了具有显示器和麦克风 头戴式计算机,麦克风配置为接收声音输入;包括语音识别引擎,配置为解译声音输入,并 作为解译的部分,确定声音输入是否为具有关键性水平的动作的命令,该关键性水平满足 或超过阈值关键性水平,所述命令为关键性命令;以及处理器,其通信地耦合到语音识别引 擎。响应于语音识别引擎对声音输入是关键性命令的确定,处理器配置为在显示器上显示 第一对话框,使动作的头戴式计算机表现取决于用户做出对应于所述第一对话框中的提示 的第一确定性表述。在另一实施例中,本段上文描述的语音控制装置进一步涉及具有自动 超时能力的第一对话框或关键性命令是令头戴式计算机从低功耗睡眠模式或受限语音识 别模式中解除的命令。
[0014] 在另一个优选实施例中,装置进一步涉及经由麦克风接收第一确定性表述,其对 应于第一对话框中的提示;并响应于对第一确定性表述的接收,在显示器上显示第二对话 框,头戴式计算机使所述动作的表现取决于所述用户做出对应于所述第二对话框中的提示 的第二确定性表述。在又另一个实施例中,本段上文描述的装置进一步包括具有自动超时 能力的第二对话框或关键性命令是令头戴式计算机从低功耗睡眠模式或受限语音识别模 式中解除的命令。在又另一个实施例中,第一确定性表述和第二确定性表述彼此不同。
[0015] 在又另一个优选实施例中,本发明涉及头戴式计算机,其包括显示器;接收声音输 入的麦克风;语音识别引擎,其被配置为解译声音输入,并作为解译的部分,确定声音输入 是否为具有关键性水平的动作的命令,该关键性水平满足或超过阈值关键性水平,所述命 令为关键性命令;以及处理器,其通信地耦合到语音识别引擎。响应于语音识别引擎对声音 输入是关键性命令的确定,处理器被配置为在显示器上显示第一对话框,并使所述动作的 头戴式计算机表现取决于用户做出对应于所述第一对话框中的提示的第一确定性表述。
【附图说明】
[0016] 通过下面对如附图中所描述的本发明的示例实施例的更为具体描述,上述内容将 更清楚,其中贯穿不同视图的相同参考标记指代相同部件。附图不一定按比例,而是为了说 明本发明的实施例而进行了强调。
[0017] 图1是体现本发明的计算机网络的示意图。
[0018] 图2是图1的实施例中的计算机节点的框图。
[0019] 图3是实施根据本发明的ASR中两级确认的头戴式计算机的示意图。
[0020] 图4是具有两级受限语音识别的语音驱动系统用户界面的示意性图示。
[0021] 图5是根据本发明的具有两级确认的用户界面的不意图性图不。
[0022] 图6是语音驱动系统中两级唤醒的示意性图示。
[0023] 图7是实施根据本发明的ASR中两级确认的头戴式计算机的框图。
【具体实施方式】
[0024] 下文是对本发明示例实施例的描述。
[0025] 图1图示了本发明可被实施的多种计算机网络或类似的数字处理环境中的一种。 图1描绘了客户端计算机/装置50和服务器计算机60,其可提供与执行应用程序等相关联 的处理、存储和输入/输出装置。这些装置经由链路(例如,链路107)被连接到网络70。 网络70可以是远程访问网络、全球网络(例如,互联网)、全球范围的计算机集合、局域网或 广域网、或网关,或者其一部分,其当前采用各自的协议(TCP/IP、蓝牙等)相互通信。其它 电子装置/计算机网络架构是适合的。网络70可相应地经由链路111连接到一个或多个 额外的网络,诸如互联网210。链路107和111可采用多种物理形式,例如,有线的和无线 的,并可采用多种信号和协议执行通信。
[0026] 在实施例中,客户端计算机/装置50被佩戴在头上并使用运动和语音命令来控 制信息的显示,以及远程装置等,如由申请人申请的申请号为12/008, 114、12/008, 104和 13/468,207的美国专利申请中所详细说明的,并且将其作为参考并入本文。这些头戴计算 装置可采用多种形式,如头部配戴计算机、头部固定显示器装置和头戴式计算机。这些头 部配戴计算装置在此被称为"头戴式计算装置"或HSC 100,并且将在下文进一步描述HSC 100的实施例。
[0027] HSC 100可以多种方式被配置并使用。在一些实施例中,HSC 100可直接连接到计 算机网络70。在其它实施例中,如图1中描绘的,HSC 100经由远程主机计算装置200连 接到计算机网络70, HSC 100经由链路150与远程主机计算装置200通信。在操作中,HSC 100可以被用作例如从远程主机计算装置200接收的流视频信号的远程显示器。
[0028] 多种装置可用作远程主机计算装置200,包括例如笔记本PC、智能电话、平板装置 或具有比无线计算头戴式装置100更小和更大计算复杂性的其它计算装置,如基于云的网 络资源。主机200可进一步直接或由网络70连接到额外网络,诸如互联网210、有线电视网 络、第三方数据网络等。
[0029] 多种链路150可被用于使能头戴式HSC 100和主机200之间的通信。在实施例中, 链路150是无线链路,并且通信经由一个或多个无线协议,诸如Bluetooth?、WiFi、WiMAX 或 4G LTE (Bluetooth 是 5209Lake Washington Boulevard,Kirkland,Washington 98033 的Bluetooth Sig, Inc.的注册商标)。在示例实施例中,如图1中描述,主机200经由连接 109连接到网络70,连接109可以是无线连接,且网络70也可以连接到互联网210或其它 基于云的网络资源,以使得主机200可以作为无线中继。在其它实施例中,主机200被直接 连接到互联网210或其它基于云的资源。此外,HSC 100的一些示例实施例可以无线连接 到互联网和基于云的网络资源而不使用主机无线中继。
[0030] 客户端计算机/装置50、HSC 100和主机200可以通过通信网络70链接到其它计 算装置,包括其它客户
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1