基于环境上下文的命令消歧的制作方法

文档序号:36657298发布日期:2024-01-06 23:45阅读:75来源:国知局
基于环境上下文的命令消歧的制作方法

本公开整体涉及用于基于环境上下文来对语音命令进行消歧的系统、方法和设备。


背景技术:

1、智能代理从用户接收语音命令,并且基于语音命令来改变一个或多个智能设备的状态。例如,响应于“将恒温器调到70度”的语音命令,智能代理生成将温度设置为70度的指令并向智能恒温器发送该指令。作为另一示例,响应于“解锁前门”的语音命令,智能代理生成解锁指令,并且向与名称“前门”相关联的智能锁发送该解锁指令。然而,在各种具体实施中,语音命令是不明确的,并且可能由智能代理以多种方式来解释。例如,“关闭灯”的语音命令可以被解释为关闭与“卧室”的位置相关联的第一灯、关闭与“浴室”的位置相关联的第二灯、或者去激活智能扬声器的指示器led的指令。为了改善用户体验,期望在没有进一步用户输入的情况下消除潜在指令之间的歧义。


技术实现思路

1、本文所公开的各种具体实施包括用于改变对象的状态的设备、系统和方法。在各种具体实施中,该方法由包括图像传感器、一个或多个处理器和非暂态存储器的设备执行。该方法包括接收语音命令。该方法包括使用该图像传感器获得物理环境的图像。该方法包括基于与对象的对象标识符相关联地存储在该非暂态存储器中的该对象的视觉模型,在该物理环境的该图像中检测该对象。该方法包括基于该语音命令和该对象的检测来生成包括该对象的该对象标识符的指令。该方法包括实现该指令以改变该对象的状态。

2、根据一些具体实施,一种设备包括一个或多个处理器、非暂态存储器以及一个或多个程序;一个或多个程序被存储于非暂态存储器中并且被配置为由一个或多个处理器执行。一个或多个程序包括用于执行或促使执行本文描述的任何方法的指令。根据一些具体实施,一种非暂态计算机可读存储介质中存储有指令,这些指令在由设备的一个或多个处理器执行时使该设备执行或使执行本文所述方法中的任一种。根据一些具体实施,一种设备包括:一个或多个处理器、非暂态存储器以及用于执行或使执行本文所述方法中的任一种的装置。



技术特征:

1.一种方法,所述方法包括:

2.根据权利要求1所述的方法,其中,生成所述指令包括:

3.根据权利要求1所述的方法,其中,所述对象的所述对象标识符进一步与所述对象的对象类型相关联地存储,并且生成所述指令进一步基于所述对象的所述对象类型。

4.根据权利要求1所述的方法,其中,所述对象的所述对象标识符进一步与所述对象的名称相关联地存储,并且生成所述指令进一步基于所述对象的所述名称。

5.根据权利要求1所述的方法,其中,生成所述指令进一步基于确定用户的注视指向所述对象的所述检测的位置。

6.根据权利要求1所述的方法,其中,生成所述指令进一步基于所述对象的所述状态。

7.根据权利要求1所述的方法,还包括:

8.根据权利要求1所述的方法,还包括:

9.一种设备,所述设备包括:

10.根据权利要求9所述的设备,其中,所述一个或多个处理器通过以下方式生成所述指令:

11.根据权利要求9所述的设备,其中,所述对象的所述对象标识符进一步与所述对象的对象类型相关联地存储,并且所述一个或多个处理器基于所述对象的所述对象类型生成所述指令。

12.根据权利要求9所述的设备,其中,所述对象的所述对象标识符进一步与所述对象的名称相关联地存储,并且所述一个或多个处理器基于所述对象的所述名称生成所述指令。

13.根据权利要求9所述的设备,其中,一个或多个生成所述指令进一步基于确定用户的注视指向所述对象的所述检测的位置。

14.根据权利要求9所述的设备,其中,所述一个或多个处理器基于所述对象的所述状态来生成所述指令。

15.根据权利要求9所述的设备,其中,所述一个或多个处理器进一步用于:

16.根据权利要求9所述的设备,其中,所述一个或多个处理器进一步用于:

17.一种存储一个或多个程序的非暂态存储器,所述一个或多个程序在由包括图像传感器的设备的一个或多个处理器执行时,使所述设备:

18.根据权利要求17所述的非暂态存储器,其中所述程序在被执行时使得所述设备通过以下方式来生成所述指令:

19.根据权利要求17所述的非暂态存储器,其中,所述对象的所述对象标识符进一步与所述对象的对象类型相关联地存储,并且,所述程序在被执行时使得所述设备基于所述对象的所述对象类型生成所述指令。

20.根据权利要求17所述的非暂态存储器,其中,所述对象的所述对象标识符进一步与所述对象的名称相关联地存储,并且,所述程序在被执行时使得所述设备基于所述对象的所述名称生成所述指令。

21.根据权利要求17所述的非暂态存储器,其中,所述程序在被执行时使得所述设备基于确定用户的注视指向所述对象的所述检测的位置而生成所述指令。

22.根据权利要求17所述的非暂态存储器,其中,所述程序在被执行时使得所述设备基于所述对象的所述状态生成所述指令。

23.根据权利要求17所述的非暂态存储器,其中,所述程序在被执行时进一步使得所述设备:

24.根据权利要求17所述的非暂态存储器,其中,所述程序在被执行时进一步使得所述设备:


技术总结
本公开涉及基于环境上下文的命令消歧。在一个具体实施中,一种改变对象的状态的方法在包括图像传感器、一或多个处理器和非暂态存储器的设备处执行。该方法包括接收语音命令。该方法包括使用该图像传感器获得物理环境的图像。该方法包括基于与对象的对象标识符相关联地存储在该非暂态存储器中的该对象的视觉模型,在该物理环境的该图像中检测该对象。该方法包括基于该语音命令和该对象的检测来生成包括该对象的该对象标识符的指令。该方法包括实现该指令以改变该对象的状态。

技术研发人员:D·W·查尔默斯,B·W·坦普尔,C·E·C·德尔蒙多,H·J·赛德勒,J-C·B·M·巴津
受保护的技术使用者:苹果公司
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1