用于虚拟个人助理系统的自然人-计算机交互的制作方法_5

文档序号：9402041阅读：来源：国知局

所述化身；在所述准备状态显示所述化身包括减小所述化身的透明度；以及在所述参与状态显示所述化身包括减小所述化身的透明度或者消除所述化身的透明度中的一项。
[0101]示例38包含示例28-37中任一个的主题，并且其中:在不参与状态显示虚拟个人助理的化身包括:在显示器上在远离计算装置活动应用的位置显示化身；在准备状态显示化身包括:在显示器上将化身移动到更靠近计算装置活动应用的位置；以及在参与状态显示化身包括:在显示器上将化身移动到计算装置活动应用上面的位置，没有阻止从用户到活动应用的输入。
[0102]示例39包含示例28-38中任一个的主题，并且还包括眼睛跟踪传感器，其中:在准备状态显示化身包括:基于从眼睛跟踪传感器接收的眼睛跟踪数据，在显示器上将化身移动到更靠近用户聚焦的位置的位置；以及在参与状态显示化身包括:基于从眼睛跟踪传感器接收的眼睛跟踪数据，在显示器上将化身移动到更靠近用户聚焦的位置的位置。
[0103]示例40包含示例28-39中任一个的主题，并且其中:在不参与状态显示虚拟个人助理的化身包括:将化身显示为不可见；以及在准备状态显示化身包括将化身显示为不可见。
[0104]示例41包含示例28-40中任一个的主题，并且其中虚拟个人助理还将:当所述化身处于所述参与状态时执行语音识别；基于所述语音识别确定所述用户是否已经发出命令；以及响应于确定所述用户已经发出所述命令而在工作状态显示所述化身。
[0105]示例42包含示例28-41中任一个的主题，并且其中在工作状态显示化身包括如下至少一项:(i)增大化身的透明度；或者(ii)在显示器上将化身移动到远离计算装置活动应用的位置。
[0106]示例43包含一种用于计算装置上的语音识别的方法，所述方法包括:使用所述计算装置的音频传感器捕获音频输入；使所述音频输入失真以产生多个失真的音频变化；对所述音频输入和每一个所述失真的音频变化执行语音识别以产生多个语音识别结果；以及基于上下文信息从所述语音识别结果中选择结果。
[0107]示例44包含示例43的主题，并且其中使所述音频输入失真包括移除所述音频输入的内部片段。
[0108]示例45包含示例43和示例44中任一个的主题，并且其中移除音频输入的内部片段包括:移除具有与幅度阈值具有预定义关系的幅度的所述音频输入的片段。
[0109]示例46包含示例43-45中任一个的主题，并且其中移除内部片段包括移除具有在幅度阈值以下的幅度的片段。
[0110]示例47包含示例43-46中任一个的主题，并且其中使音频输入失真包括扩大具有与幅度阈值具有预定义关系的幅度的音频输入的片段的长度。
[0111]示例48包含示例43-47中任一个的主题，并且其中扩大片段的长度包括扩大具有在幅度阈值以下的幅度的片段的长度。
[0112]示例49包含示例43-48中任一个的主题，并且其中使音频输入失真包括在通过对音频输入执行语音识别所标识的音频输入的语音分割点插入暂停。
[0113]示例50包含示例43-49中任一个的主题，并且其中使音频输入失真包括执行如下至少一项:(i)加速所述音频输入；(ii)减慢所述音频输入；(iii)调整所述音频输入的音调；或者(iv)向所述音频输入引入噪声。
[0114]示例51包含示例43-50中任一个的主题，并且其中对音频输入和失真的音频变化执行语音识别以产生多个语音识别结果包括:对音频输入和失真的音频变化执行语音识另U，以产生至少一百个语音识别结果。
[0115]示例52包含示例43-51中任一个的主题，并且还包括:基于计算装置的一个或多个应用的语音识别语法确定语音识别结果的语义相关结果；其中从所述语音识别结果中选择所述结果包括从所述语义相关结果中选择结果。
[0116]示例53包含示例43-52中任一个的主题，并且其中基于一个或多个应用的语音识别语法确定语义相关结果包括:基于计算装置的虚拟个人助理的语音识别语法确定语义相关结果。
[0117]示例54包含一种用于计算装置上的语音识别的方法，所述方法包括:使用所述计算装置的音频传感器捕获音频输入；在计算装置上使音频输入失真以产生多个失真的音频变化；将所述音频输入和所述失真的音频变化从所述计算装置传送到语音识别模块；基于所述音频输入和所述失真的音频变化从所述语音识别模块接收多个语音识别结果；以及在计算装置上基于上下文信息从所述语音识别结果中选择结果。
[0118]示例55包含示例54的主题，并且其中:向语音识别模块传送音频输入和失真的音频变化包括:将所述音频输入和所述失真的音频变化传送到位于远离所述计算装置的服务器上的语音识别模块；以及从所述语音识别模块接收所述多个语音识别结果包括从位于所述服务器上的语音识别模块接收所述多个语音识别结果。
[0119]示例56包含示例54和示例55中任一个的主题，并且其中使所述音频输入失真包括移除所述音频输入的内部片段。
[0120]示例57包含示例54-56中任一个的主题，并且其中移除音频输入的内部片段包括移除具有与幅度阈值具有预定义关系的幅度的音频输入的片段。
[0121]示例58包含示例54-57中任一个的主题，并且其中移除内部片段包括移除具有在幅度阈值以下的幅度的片段。
[0122]示例59包含示例54-58中任一个的主题，并且其中使音频输入失真包括扩大具有与幅度阈值具有预定义关系的幅度的音频输入的片段的长度。
[0123]示例60包含示例54-59中任一个的主题，并且其中扩大片段的长度包括扩大具有在幅度阈值以下的幅度的片段的长度。
[0124]示例61包含示例54-60中任一个的主题，并且其中使音频输入失真包括在通过对音频输入执行语音识别所标识的音频输入的语音分割点插入暂停。
[0125]示例62包含示例54-61中任一个的主题，并且其中使音频输入失真包括执行如下至少一项:(i)加速所述音频输入；(ii)减慢所述音频输入；(iii)调整所述音频输入的音调；或者(iv)向所述音频输入引入噪声。
[0126]示例63包含示例54-62中任一个的主题，并且其中对音频输入和失真的音频变化执行语音识别以产生多个语音识别结果包括:对音频输入和失真的音频变化执行语音识另U，以产生至少一百个语音识别结果。
[0127]示例64包含一种用于语音识别服务器上的语音识别的方法，所述方法包括:在语音识别服务器上接收由计算装置捕获的音频输入；在所述语音识别服务器上使所述音频输入失真以产生多个失真的音频变化；在所述语音识别服务器上对所述音频输入和每一个所述失真的音频变化执行语音识别以产生多个语音识别结果；以及将所述多个语音识别结果传送到所述计算装置。
[0128]示例65包含示例64的主题，并且其中使所述音频输入失真包括移除所述音频输入的内部片段。
[0129]示例66包含示例64和示例65中任一个的主题，并且其中移除音频输入的内部片段包括移除具有与幅度阈值具有预定义关系的幅度的音频输入的片段。
[0130]示例67包含示例64-66中任一个的主题，并且其中移除内部片段包括移除具有在幅度阈值以下的幅度的片段。
[0131]示例68包含示例64-67中任一个的主题，并且其中使音频输入失真包括扩大具有与幅度阈值具有预定义关系的幅度的音频输入的片段的长度。
[0132]示例69包含示例64-68中任一个的主题，并且其中扩大片段的长度包括扩大具有在幅度阈值以下的幅度的片段的长度。
[0133]示例70包含示例64-69中任一个的主题，并且其中使音频输入失真包括在通过对音频输入执行语音识别所标识的音频输入的语音分割点插入暂停。
[0134]示例71包含示例64-70中任一个的主题，并且其中使音频输入失真包括执行如下至少一项:(i)加速所述音频输入；(ii)减慢所述音频输入；(iii)调整所述音频输入的音调；或者(iv)向所述音频输入引入噪声。
[0135]示例72包含示例64-71中任一个的主题，并且其中对音频输入和失真的音频变化执行语音识别以产生多个语音识别结果包括:对音频输入和失真的音频变化执行语音识另U，以产生至少一百个语音识别结果。
[0136]示例73包含一种用于与计算装置上的虚拟个人助理交互的方法，所述方法包括:在所述计算装置的显示器上在不参与状态显示所述虚拟个人助理的化身；在所述计算装置上确定所述计算装置的用户是否已经请求激活所述虚拟个人助理；响应于确定所述用户已经请求激活所述虚拟个人助理而在所述计算装置上在准备状态显示所述化身；在所述计算装置上确定当所述化身处于所述准备状态时所述用户的参与级别；响应于所述用户具有大于阈值级别的参与级别而在所述计算装置上在参与状态显示所述图像；以及响应于所述用户具有小于所述阈值级别的参与级别而在所述计算装置上在所述不参与状态显示所述图像。
[0137]示例74包含示例73的主题，并且还包括监视当化身处于参与状态时用户的参与级别。
[0138]示例75包含示例73和示例74中任一个的主题，并且其中确定所述用户是否已经请求激活所述虚拟个人助理包括:从计算装置的眼睛跟踪传感器接收眼睛跟踪数据；以及基于所述眼睛跟踪数据确定所述用户是否已经聚焦在所述化身上。
[0139]示例76包含示例73-75中任一个的主题，并且其中确定所述用户是否已经请求激活所述虚拟个人助理包括:从计算装置的音频传感器接收音频输入；以及基于音频输入检测由用户发出的码字。
[0140]示例77包含示例73-76中任一个的主题，并且其中确定用户的参与级别包括:从计算装置的眼睛跟踪传感器接收眼睛跟踪数据；基于所述眼睛跟踪数据确定所述用户是否已经在视觉上聚焦在所述化身上大于阈值时间的时间段；响应于确定所述用户已经在视觉上聚焦在所述化身上大于所述阈值时间的时间段而确定所述用户具有大于所述阈值级别的参与级别；以及响应于确定所述用户未在视觉上聚焦在所述化身上大于所述阈值时间的时间段而确定所述用户具有小于所述阈值级别的参与级别。
[0141]示例78包含示例73-77中任一个的主题，并且其中确定用户是否已经在视觉上聚焦在化身上大于阈值时间的时间段包括忽略远离所述化身的瞥视第二时间段，所述第二时间段小于第二阈值时间。
[0142]示例79包含示例73-78中任一个的主题，并且其中确定用户的参与级别包括从计算装置的音频传感器接收音频输入。
[0143]示例80包含示例73-79中任一个的主题，并且其中:在准备状态显示化身包括显示化身与用户的目光接触的拟人表示；以及在参与状态显示化身包括显示与用户的目光接触的拟人表示。
[0144]示例81包含示例73-80中任一个的主题，并且其中显示目光接触的所述拟人表示包括:从所述计算装置的眼睛跟踪传感器接收眼睛跟踪数据或头部位置数据中的至少一项；以及显示所述化身跟随所述用户的目光的拟人表示。
[0145]示例82包含示例73-81中任一个的主题，并且其中:在不参与状态显示虚拟个人助理的化身包括:将化身显示为半透明，允许计算装置的用户接口元件透过图像；在所述准备状态显示所述化身包括减小所述化身的透明度；以及在所述参与状态显示所述化身包括减小所述化身的透明度或者消除所述化身的透明度中的一项。
[0146]

完整全部详细技术资料下载

当前第5页1 2 3 4 5 6