用于虚拟个人助理系统的自然人-计算机交互的制作方法_4

文档序号：9402041阅读：来源：国知局

置100停止监视用户参与级别。类似地，当从块650循环回到块602时，计算装置100可终止任务执行块640，使计算装置100停止执行语音识另O。另外，尽管图示为并行执行，但在其它实施例中，可顺序地或以交织方式执行语音识别和监视用户参与级别的任务。
[0059]在块652，计算装置100在工作状态显示化身。工作状态向用户指示虚拟个人助理208当前正在执行任务。在一些实施例中，工作状态包含正在执行的任务的表示，例如，执行任务的化身的应用图标或表示。在一些实施例中，在工作状态显示的化身可类似于或等同于在不参与状态显示的化身；也就是，在工作状态显示的化身可以是不引人注目的，并且可不干扰用户在计算装置100上执行其它工作。在一些实施例中，在块654，计算装置100可增大化身在显示器128上的透明度。在一些实施例中，在块656，计算装置100可调整化身的大小和/或位置。例如，计算装置100可减小化身的大小，或在显示器128上将化身从当前活动的应用移开。
[0060]在块658，当在工作状态显示化身时，计算装置100执行从用户接收的命令。该命令可由虚拟个人助理208或者由受虚拟个人助理208控制的计算装置100的各种其它应用执行。另外，在一些实施例中，虽然在工作状态显示化身，但计算装置100可监视用户激活该助理，类似于上面结合图4所描述的。监视激活可允许用户中断当前执行的命令，或发起新命令。
[0061]在完成命令之后，在块660，计算装置100确定是否通知用户完成。例如，如果执行产生可显示结果或错误消息的命令，则计算装置100可确定通知用户。如果计算装置100确定通知用户，则方法600循环回到图6A的块616，以在准备状态再现化身。为了概况那个交互，化身不引人注目地在后台对任务工作某一时间，并且然后通知用户以自然方式完成。用户然后可与化身交互，如上所述，以接收通知。如果在块660，计算装置100确定不通知用户，则方法600循环回到图6A的块602，以在不参与状态显示化身，并等待进一步激活。为了概况那个交互，化身不引人注目地在后台对任务工作某一时间，并且然后返回到不参与状态，以自然方式向用户指示虚拟个人助理208是自由的，以便进一步交互。
[0062]在前面的说明性图示中，用户参与已经被描述为二元值一一参与或者不参与。然而，在其它实施例中，可在连续体上测量用户参与级别。在那些实施例中，化身可被显示有反映用户参与级别值的属性。例如，化身的透明度可在值范围上平滑调整，以指示用户参与级别。类似地，化身的大小或位置也可在值范围上平滑调整，以指示用户参与级别。
[0063]示例
下面提供了本文公开的装置、系统和方法的说明性示例。装置、系统和方法的实施例可包含下面描述的示例中的任一个或多个以及它们的组合。
[0064]示例I包含一种用于语音识别的计算装置，所述计算装置包括:音频传感器；音频输入模块，用于:使用所述音频传感器捕获音频输入，以及使所述音频输入失真以产生多个失真的音频变化；以及语音识别模块，用于:对所述音频输入和每一个所述失真的音频变化执行语音识别以产生多个语音识别结果；以及基于上下文信息从所述语音识别结果中选择结果。
[0065]示例2包含示例I的主题，并且其中使所述音频输入失真包括移除所述音频输入的内部片段。
[0066]示例3包含示例I和示例2中任一个的主题，并且其中音频输入的内部片段包括具有与幅度阈值具有预定义关系的幅度的片段。
[0067]示例4包含示例1-3中任一个的主题，其中使音频输入失真包括扩大具有与幅度阈值具有预定义关系的幅度的音频输入的片段的长度。
[0068]示例5包含示例1-4中任一个的主题，其中具有与幅度阈值具有预定义关系的幅度的片段包括具有在幅度阈值以下的幅度的片段。
[0069]示例6包含示例1-5中任一个的主题，并且其中使音频输入失真包括在通过对音频输入执行语音识别所标识的音频输入的语音分割点插入暂停。
[0070]示例7包含示例1-6中任一个的主题，并且其中使音频输入失真包括如下至少一项:(i)加速所述音频输入；(ii)减慢所述音频输入；(iii)调整所述音频输入的音调；或者(iv)向所述音频输入引入噪声。
[0071]示例8包含示例1-7中任一个的主题，并且其中所述多个语音识别结果包括至少一百个语音识别结果。
[0072]示例9包含示例1-8中任一个的主题，并且还包括具有语音识别语法的一个或多个应用；其中所述语音识别模块还基于所述一个或多个应用的所述语音识别语法确定所述语音识别结果的语义相关结果；并且其中从所述语音识别结果中选择所述结果包括从所述语义相关结果中选择结果。
[0073]示例10包含示例1-9中任一个的主题，并且其中所述一个或多个应用包括虚拟个人助理。
[0074]示例11包含一种用于语音识别的计算装置，所述计算装置包括:音频传感器；音频输入模块，用于:使用音频传感器捕获音频输入，以及使所述音频输入失真以产生多个失真的音频变化；以及语音分析模块，用于:将所述音频输入和所述失真的音频变化从所述计算装置传送到语音识别模块；基于所述音频输入和所述失真的音频变化从所述语音识别模块接收多个语音识别结果；以及基于上下文信息从所述语音识别结果中选择结果。
[0075]示例12包含示例11的主题，并且其中语音识别模块位于远离所述计算装置的服务器上。
[0076]示例13包含示例11和示例12中任一个的主题，并且其中使所述音频输入失真包括移除所述音频输入的内部片段。
[0077]示例14包含示例11-13中任一个的主题，并且其中音频输入的内部片段包括具有与幅度阈值具有预定义关系的幅度的片段。
[0078]示例15包含示例11-14中任一个的主题，其中使音频输入失真包括扩大具有与幅度阈值具有预定义关系的幅度的音频输入的片段的长度。
[0079]示例16包含示例11-15中任一个的主题，并且其中具有与幅度阈值具有预定义关系的幅度的片段包括具有在幅度阈值以下的幅度的片段。
[0080]示例17包含示例11-16中任一个的主题，并且其中使音频输入失真包括在通过对音频输入执行语音识别所标识的音频输入的语音分割点插入暂停。
[0081]示例18包含示例11-17中任一个的主题，并且其中使音频输入失真包括如下至少一项:(i)加速所述音频输入；(ii)减慢所述音频输入；(iii)调整所述音频输入的音调；或者(iv)向所述音频输入引入噪声。
[0082]示例19包含示例11-18中任一个的主题，并且其中所述多个语音识别结果包括至少一百个语音识别结果。
[0083]示例20包含一种用于语音识别的语音识别服务器，所述语音识别服务器包括:失真模块，用于:接收由计算装置捕获的音频输入；以及使所述音频输入失真以产生多个失真的音频变化；以及语音识别模块，用于:对所述音频输入和每一个所述失真的音频变化执行语音识别以产生多个语音识别结果；以及将所述多个语音识别结果传送到所述计算装置。
[0084]示例21包含示例20的主题，并且其中使所述音频输入失真包括移除所述音频输入的内部片段。
[0085]示例22包含示例20和示例21中任一个的主题，并且其中音频输入的内部片段包括具有与幅度阈值具有预定义关系的幅度的片段。
[0086]示例23包含示例20-22中任一个的主题，其中使音频输入失真包括扩大具有与幅度阈值具有预定义关系的幅度的音频输入的片段的长度。
[0087]示例24包含示例20-23中任一个的主题，并且其中具有与幅度阈值具有预定义关系的幅度的片段包括具有在幅度阈值以下的幅度的片段。
[0088]示例25包含示例20-24中任一个的主题，并且其中使音频输入失真包括在通过对音频输入执行语音识别所标识的音频输入的语音分割点插入暂停。
[0089]示例26包含示例20-25中任一个的主题，并且其中使音频输入失真包括如下一项:(i)加速所述音频输入；(ii)减慢所述音频输入；(iii)调整所述音频输入的音调；或者(iv)向所述音频输入引入噪声。
[0090]示例27包含示例20-26中任一个的主题，并且其中所述多个语音识别结果包括至少一百个语音识别结果。
[0091]示例28包含一种计算装置，所述计算装置包括:显示器；虚拟个人助理，用于在不参与状态、准备状态和参与状态将所述虚拟个人助理的化身显示在所述显示器上；以及参与模块，用于:确定当在所述不参与状态显示所述化身时所述计算装置的用户是否已经请求激活所述虚拟个人助理；以及确定当在所述准备状态显示所述化身时所述用户的参与级别；其中所述虚拟个人助理:响应于确定所述用户已经请求激活所述虚拟个人助理而在所述准备状态显示所述化身；响应于确定所述用户具有大于阈值级别的参与级别而在所述参与状态显示所述化身；以及响应于确定所述用户具有小于所述阈值级别的参与级别而在所述不参与状态显示所述化身。
[0092]示例29包含示例28的主题，并且其中所述参与模块还监视当在所述参与状态显示所述化身时所述用户的所述参与级别。
[0093]示例30包含示例28-29中任一个的主题，并且还包括眼睛跟踪传感器，其中确定所述用户是否已经请求激活所述虚拟个人助理包括:从所述眼睛跟踪传感器接收眼睛跟踪数据；以及基于所述眼睛跟踪数据确定所述用户是否已经聚焦在所述化身上。
[0094]示例31包含示例28-30中任一个的主题，并且还包括音频传感器，其中确定所述用户是否已经请求激活所述虚拟个人助理包括:从音频传感器接收音频输入；以及基于音频输入检测由用户发出的码字。
[0095]示例32包含示例28-31中任一个的主题，并且还包括眼睛跟踪传感器，其中确定所述用户的所述参与级别包括:从所述眼睛跟踪传感器接收眼睛跟踪数据；基于所述眼睛跟踪数据确定所述用户是否已经在视觉上聚焦在所述化身上大于阈值时间的时间段；响应于确定所述用户已经在视觉上聚焦在所述化身上大于所述阈值时间的时间段而确定所述用户具有大于所述阈值级别的参与级别；以及响应于确定所述用户未在视觉上聚焦在所述化身上大于所述阈值时间的时间段而确定所述用户具有小于所述阈值级别的参与级别。
[0096]示例33包含示例28-32中任一个的主题，并且其中确定用户是否已经在视觉上聚焦在化身上大于阈值时间的时间段包括忽略远离所述化身的瞥视第二时间段，所述第二时间段小于第二阈值时间。
[0097]示例34包含示例28-33中任一个的主题，并且还包括音频传感器，其中确定用户的参与级别包括从音频传感器接收音频输入。
[0098]示例35包含示例28-34中任一个的主题，并且其中在准备状态显示化身包括:显示化身与用户的目光接触的拟人表示；以及在参与状态显示化身包括显示化身与用户的目光接触的拟人表示。
[0099]示例36包含示例28-35中任一个的主题，并且还包括眼睛跟踪传感器，其中显示目光接触的所述拟人表示包括:从所述眼睛跟踪传感器接收眼睛跟踪数据或头部位置数据中的至少一项；以及显示所述化身跟随所述用户的目光的拟人表示。
[0100]示例37包含示例28-36中任一个的主题，并且其中:在所述不参与状态显示所述虚拟个人助理的所述化身包括:将所述化身显示为半透明，以允许所述计算装置的用户接口元件透过

完整全部详细技术资料下载

当前第4页1 2 3 4 5 6