话音控制的制作方法

文档序号：19489576发布日期：2019-12-21 04:13阅读：166来源：国知局

本公开涉及语音识别的使用来控制实用程序(utility)，诸如照明、加热、空调、通风、窗饰(windowtreatment)或家庭娱乐系统。
背景技术：
：话音(voice)控制正作为用户能够用来控制在家或甚至其他地方诸如办公室周围的各种电器的手段而变得越来越普遍。例如，智能扬声器是被嵌入有虚拟数字助理的扬声器设备，其中虚拟数字助理使得用户既能够控制通过扬声器播出的音乐又能够执行其他的功能，例如订购外卖、制作待办事项列表等。类似地，虚拟数字助理现在时常被包括在许多其他形式的用户终端诸如智能手机、平板计算机、台式计算机和膝上型计算机以及可穿戴智能设备诸如智能手表和智能眼镜中。基于话音的控制也正成为用户能够用来控制在家或办公室周围的实用程序的手段，诸如以便控制无线连接的照明系统、加热系统或诸如此类。这可以基于在所谈论的实用程序系统的组件（例如，在照明系统的情况中的照明桥或墙板）中包括的专用话音识别代理来实现。或越来越多地，实用程序的控制可以经由在用户设备上运行的通用数字助理来实现，其中通用数字助理能够经由在用户终端和实用程序系统之间的有线或更时常无线（例如wi-fi、bluetooth（蓝牙）或zigbee）连接而接口连接(interface)到实用程序系统。作为示例，用户能够简单地在他/她家的房间中大声说出话音命令，诸如“调暗灯光(light)”、“增加加热至21度”或“将气氛设置为舒适的”，并且在收听范围中的任何合适连接的智能设备（例如用户的智能扬声器、移动终端、台式pc或可穿戴设备）上的虚拟数字助理可以检测到这个并且相应地控制灯光和/或加热。虚拟数字助理（有时也仅被称为数字助理或虚拟助理）可以指任何的采用语音识别作为用户能够用来控制任何种类电器的功能的手段的软件代理。在虚拟数字助理背后的完整功能原则上可以被包括在所谈论的本地用户设备上的同一应用中，但是更时常，vda事实上是前端客户端应用，其访问被托管(host)在服务器上的更复杂的后端服务。无论哪种方式，用户至代理的接口是通过用户在其上面安装vda的特定用户设备。技术实现要素：然而，这能够导致问题，因为在语音接口和实际输出之间具有分离。每当用户发出话音命令时，一旦用户完成该命令，该命令才被处理。用户对他或她刚说出的话音命令具有很少的反馈或没有反馈，至少在用户等待以查看是否整个命令对他/她的环境具有所期望的效果（例如调暗灯光、调节加热、播放特定音乐曲目等）之前没有反馈。例如，如果命令失败，则用户没有关于该命令在哪失败的指示。此外，用户很难理解话音命令将做什么，因为他/她在整个效果被呈现之前没有接收到其效果的直接反馈。针对这样的问题的当前解决方案基于由接收到话音命令的设备所输出的用户反馈，例如移动电话屏幕上的动画或智能扬声器上的脉动(pulsing)led。然而，如果话音接收器在用户的环境中变得更加集成的话，则这些将不再是实用的。这在话音成为我们的家和办公室中无处不在的且隐藏的特征时将成为更大的问题，因为当前设备上用户反馈不再是可能的。下面提供一种方法，用于在话音命令正被系统说出并被处理时给用户提供涉及该话音命令的反馈。用户具有至少一个能够接收话音命令的接口，并且还提供至少一个可控的照明设备，其能够基于与话音接口进行的交互来控制。该方法包括控制照明，以便诸如通过在用户发出命令时预览所期望的灯光设置和/或通过照明系统呈现动画以提供关于该命令的处理的状态的反馈，在命令正被说出时给出关于该命令的处理的反馈。根据在本文公开的一个方面，提供一种使用语音识别来控制实用程序的方法，该方法包括：接收由用户说出并利用至少一个麦克风捕获的语音命令；处理语音命令，以便在命令中的一系列说出的元素之中的每一个元素中自动识别和颁布(enact)用户的意图，这些元素具有从第一个到最后一个的按时间排列的顺序，其中这些元素之中的至少一个元素指示用户控制实用程序的意图，并且这些元素之中的另外一个或多个元素各自指定由用户打算进行的控制的各自参数；以及在说出话音命令中的第一个元素之后但是在颁布命令的最后一个元素之前，控制由照明系统的一个或多个照明器发出的光照(illumination)，以便给用户提供有关语音命令的处理的反馈。因而，提供有关使用通用照明系统输入的话音命令的实时反馈。被控制并针对其提供反馈的实用程序可以包括在与用户相同的地点（例如，同一房间）中的照明或其他地方（即，用户在说出命令的同时无法通过他/她自己的感觉直接体验命令的效果的地方）中的照明。可供选择地，所谈论的实用程序可以是除了照明之外的另一实用程序，诸如空调、加热、通风、电子控制的窗饰（窗帘或百叶窗）或甚至诸如音乐或视频之类的媒体的播出。再次，被控制的实用程序可以或位于与用户相同的位置或其他地方（超越用户的即时体验区）。在实施例中，所述反馈至少包括：确认何时最后一个元素已被成功识别并且在被执行以便被颁布的过程中。可供选择地或附加地，在说出命令的最后一个元素（53）之前，提供所述反馈的至少一部分。例如，所述反馈可以至少包括确认：命令的第一个元素已被识别（因而指示：语音识别算法现在准备好收听命令的进一步元素）。作为另一示例，所述反馈可以至少包括在识别命令的元素之中的一个元素时具有错误的指示，从而提示用户重新说出这些元素之中的所述一个元素（例如，具有太多的背景噪声，或者该命令没有被足够大声地说出或被太快说出，以致该命令或其特定元素没有被成功识别）。作为又一个示例，所述反馈可以至少包括提供命令的一个或多个元素之中的每一个个别元素的效果的预览。进一步，在本文标识：提供给用户的反馈应当与用户共同定位，但是命令的执行可以发生在另一位置上。因此，优选地，该方法可以进一步包括：自动确定用户的位置，在此基础上自动标识从检测到的用户的位置可见的一个或多个照明器，以及从基于检测到的用户的位置所标识的那些照明器之中自动选择通过其来提供所述反馈的一个或多个照明器。例如，用户可以在客厅里，但是想要关闭卧室里的灯光。在这种情况下，实际命令将是一个位置--执行位置，但是反馈可以在第二位置--反馈位置。在进一步实施例中，该方法可以包括：基于照明系统的哪些照明器能够呈现反馈，自动选择通过其来提供所述反馈的一个或多个照明器。在进一步实施例中，该方法可以包括：取决于当前被用于提供反馈的一个或多个照明器所呈现的效果，自动选择利用其来提供反馈的效果。在更进一步实施例中，该方法可以包括：自动确定用户的身份，并且取决于所确定的用户的身份，自动选择通过其来提供反馈的一个或多个照明器和/或利用其来提供反馈的效果。根据在本文公开的另一方面，提供一种计算机程序产品，其包括被收录(embody)在计算机可读存储装置上并被配置以便当在控制系统的一个或多个处理单元上运行时根据任何所公开的方法执行操作的代码。根据在本文公开的另一方面，提供一种控制系统，其包括：包括一个或多个存储单元的存储器，该存储器存储代码；以及一个或多个处理单元，其被安排成运行来自所述存储器的代码，该代码被配置，以便当因而在一个或多个处理单元上运行时根据任何所公开的方法执行操作。附图说明为了帮助理解本公开并显示如何可以将实施例付诸实施，仅通过示例来参考附图，其中：图1是包括照明系统的环境的示意图，图2是用于控制实用程序的控制系统的示意框图，以及图3是显示不同可能的反馈动画的选择的定时的时序图。具体实施方式如上所述，随着智能扬声器、智能电话话音助理等等的兴起，用于照明系统的基于话音的命令正变得普遍。随着这些变得更不显眼，提供可供选择的用户反馈机制将是所希望的。下面提供在话音命令正被说出并被系统处理时给用户提供有关话音命令的反馈的方法。给用户提供的反馈应该与用户共同定位，但是命令的执行可以发生在另一位置上。该方法可以进一步包括自动确定哪个照明设备和/或什么灯光效果将使用来提供反馈（例如，选择最接近用户或在用户的视野内的照明器来呈现反馈，或选择与当前场景相匹配的照明效果）。反馈可以涉及过程中的至少三个阶段之中的任何一个或多个：（a）系统提供关于当前处理状态的反馈，（b）系统提供关于命令的完成和最终结果的反馈，和/或（c）在照明控制的情况下，系统预览命令的执行。例如，所提供的反馈可以区分其中系统正在接收话音命令的状态（以便给用户显示：系统正在收听）、其中命令不能被处理的状态（例如，太多的背景噪音）、其中命令已被成功接收并且正在被处理的状态（以显示：系统即将回应并阻止用户再次发出相同的命令）等等。反馈可以进一步向用户指示：说出的命令不够大声，或者用户说得太快等等。在进一步实施例中，在命令被说出的当时(as-and-when)，给出该命令的每一个元素的直接预览。例如，当用户说“设置灯光……”时，用户附近的灯光闪烁，而随后当用户继续“……在客厅里”时，只有在那个特定位置中的灯光继续闪烁。在更进一步实施例中，不仅基于位置而且还基于诸如能力（例如，白色-彩色）、可见性（例如，天花板吊坠-柜下灯带）和/或当前状态（例如，它在其中是有效的场景，哪个用户已将其设置为那个场景，和/或哪个用户正在发出话音命令）之类的因素来选择被使用来给用户提供反馈的照明器。所提供的反馈能够覆盖针对照明系统以及其他系统（例如hvac、音频等）的命令。通过示例，将结合其中用户控制照明的场景来描述下面的实施例，但是将领会到：这并不限制所公开技术的所有可能的应用。图1举例说明其中可以采用在本文公开的实施例的示例环境102。环境102可以采取以下形式：室内空间，诸如家、办公室或其他建筑物的一个或多个房间；室外空间，诸如花园或公园；部分覆盖的空间，诸如凉亭；或这样的空间的组合，诸如包括室内空间和室外空间二者的校园或体育场。环境102被配备有被安装或以其他方式被部署在整个环境102中的不同位置上的多个照明器104。照明器可以指用于照亮被用户106占用的环境或环境的一部分的任何种类的光照设备，无论提供环境照明还是任务照明。每一个照明器104可以采取各种各样的可能形式之中的任何一种，诸如天花板或壁装式照明器、独立式落地或台式照明器或不太传统的形式，诸如被嵌入家具的表面或物件中的照明器（并且环境102中的不同照明器104不需要采取彼此相同的形式）。无论采取什么形式，每一个照明器104包括至少一盏灯（光照元素）以及任何相关联的壳体、插座和/或支架。合适灯的示例包括基于led的灯或传统的白炽灯泡或气体放电灯。环境102还被配备有被部署在整个环境102中的一个或多个位置上的一个或多个麦克风108。每一个麦克风108可以采取独立式麦克风设备的形式，或者可供选择地，可以采取被集成在诸如静态或移动用户终端之类的另一用户设备中的麦克风的形式。具有就目前而言可以被访问的麦克风108的用户终端的示例包括：被放在家或办公室周围的膝上型计算机或台式计算机；移动终端，诸如智能手机或平板计算机；用户个人随身携带或穿戴的可穿戴设备；或媒体设备，诸如智能扬声器、智能电视机或机顶盒、家庭媒体中心等。在一些情形中，环境102可以被划分为多个不同的区域或地点102a、102b，诸如不同的房间，其中每一个利用不同的各自子集的一个或多个照明器104来照亮。就目前而言，这些不同的区域102a、102b彼此不同之处在于：当用户106正占用一个区域102a时，则他/她无法直接体验到他/她正对另一区域102b中的应用程序（在这种情况下，照明）进行的调整的效果，即，没有通过他或她自己的身体感觉而亲身感觉到在另一地点中的应用程序。在照明的情况下，这意味着：用户没有看到在其他区域（例如，房屋或办公室的其他部分，诸如另一房间）中的照明。例如，在图1的图示示例中，举例说明两个房间：楼下房间102a和楼上房间102b，其中用户106恰好当前占用楼下房间102a。当然，将领会到：用户的环境102事实上可以包括两个以上的房间（例如，家中的客厅、厨房、门厅、浴室和多个卧室；或者办公楼中的多个办公室、走廊、接待处和食堂或休息室）。图2举例说明控制系统202，其使得用户106能够基于由用户106说出并利用一个或多个麦克风108之中的至少一个麦克风捕获的语音命令来控制来自一个或多个照明器104的照明。这可以是控制在与用户106在其中说出话音命令的部分相同的环境102a的部分中或不同的部分102b中（例如，在楼上房间102b中，而用户106在楼下102a）的照明。控制系统202包括语音识别算法208，其被安排成从环境102或其一部分接收利用至少一个麦克风108捕获的音频信号，其中有时音频信号将包括由用户106在环境102的相关部分中说出的语音命令。控制系统202进一步包括控制器210，其被耦合至语音识别算法208，以便接收在所接收的音频信号中利用语音识别算法所标识的控制元素的指示。控制系统202的控制器210也被耦合至照明系统204，其中照明系统204包括结合图1所讨论的照明器104。控制器210从而能够基于所标识的控制元素来控制照明系统，以便调整由照明器104发出的光照的一个或多个方面，例如，接通或关闭其中的一个或多个照明器，调亮或调暗光照水平，调整所发出的光照的颜色，或设置动态效果。在实施例中，控制系统202的控制器210被配置成至少依据用户106当前被发现在一组离散的预定义区域102a、102b之中的哪一个区域（例如，哪个房间）来自动确定用户106的位置。在一些这样的情况下，控制器210可以被配置成基于利用麦克风108捕获的音频来做到这一点。如果捕获了话音命令的麦克风108或多个麦克风108的位置对于控制器210而言是已知的话，则已通过那个/那些特定（多个）麦克风108接收到话音命令的事实给出说出该命令的用户106的近似地点的指示。例如，如果麦克风被部署在每一个房间或区域102a、102b中并且话音基本上不在这些房间或区域之间传播，则标识哪个麦克风108捕获了话音命令暗示地给出用户在哪个房间或区域的指示。可选地，如果麦克风108是包括麦克风元素阵列的定向麦克风，或者如果从不同位置上的多个麦克风108捕获该命令，则这也能够用于计算用户位置的更精确估计。例如，能够基于在定向麦克风中的每一个元素上接收到的同一信号的相对相位和/或幅度来检测到达方向。和/或，如果在不同位置上的多个麦克风108上接收到该信号的实例(instance)，则通过对所接收的信号的实例应用合适的定位计算诸如三角测量、三边测量、多边测量或指纹识别，能够计算用户106的坐标。在进一步可供选择或附加的实施例中，控制系统202的控制器210可以被配置成通过访问独立的定位系统206以便自动检测用户106的当前位置来确定用户106的位置。定位系统包括一组一个或多个参考节点214以及用于基于节点214来确定用户106的位置的定位算法212。在一些情况下，该组参考节点214可以仅包括单个节点214或在不同的可能区域（例如，房间）102a、102b之中的每一个区域中至少包括单个节点。例如，该组节点214可以在每一个区域102a、102b中包括单个照相机，并且定位算法212可以包括图像识别算法，其被配置成检测是否（在是-否基础上）用户106存在于其各自区域（例如，房间）中。因而，至少在每区域（例如，每房间）基础上检测用户的位置。在其他实施例中，该组节点214可以包括使之能够在整个环境102中检测用户的坐标的无线节点的网络。这些能够是室内定位网络的专用锚节点或预先存在的无线节点诸如为了发现目的而已在设置信标(beacon)的无线接入点或甚至卫星定位网络中的卫星。无论其采取什么形式，从多个无线参考节点214之中的每一个发射信号，以便利用被部署在用户个人周围的便携式或可穿戴设备来测量（以设备为中心的方案），或反之亦然，通过用户的设备发射信号以便利用多个节点214来检测（以网络为中心的方案）。设备或节点各自进行信号的不同接收实例的属性（例如接收信号强度、飞行时间或到达角）的测量。定位算法212被安排成接收这些测量并对其应用任何合适的定位计算，诸如三角测量、三边测量、三角测量或指纹识别算法，从而检测用户106的估计位置的坐标。定位算法212随后能够在环境102的地图（例如，平面布置图）中查找坐标，以便检测用户106被发现在哪个区域（例如，哪个房间）。或作为这个的更简单变体，被发现最接近用户206的参考节点214能够被作为用户106当前在哪个区域（例如，房间）的指示。例如，如果某个房间中的某个锚节点或接入点具有最强的信号强度或在那个节点与用户个人周围的设备之间最短的飞行时间，则能够利用合理的置信度(degreeofconfidence)假定用户106在那个房间中。各种合适的定位技术本身对于本领域技术人员来说是熟悉的并在本文将不再赘述。也可以采用技术的组合来提高定位精度。无论挑选什么技术，所检测到的位置是使之可用于控制器210的这个位置。如果确实使用独立的位置系统206，则定位算法212也可以检测用户106的身份，以便控制器210将这个向上与利用语音识别算法所检测到的话音命令进行匹配。这能够例如通过与语音识别算法208相组合的面部识别或从用户个人携带的移动设备或可穿戴设备接收id信号来完成，其中语音识别算法208能够从用户106的话音签名中检测他/她的身份。可供选择地，如果检测到只有一个用户的存在，则该命令和所检测到的位置可以简单地被控制器210假定为源自同一个人。或作为另一变体，用户106做出手势来指示何时在说话，这利用手势感测定位节点214（例如，照相机）来检测。就物理实现而言，语音识别算法208、控制器210和可选的定位算法212之中的每一个可以采用被存储在存储器中并被安排成在处理装置上运行的代码（软件）的形式来实现。在其中存储这些模块208、210、212之中的任何给定一个的存储器可以包括一个或多个存储单元，其中存储单元采用被安置在一个或多个地理站点上的一个或多个设备中的一个或多个存储媒体（例如电子、磁或光学媒体）。在其上面存储这些模块208、210、212之中的任何给定一个的处理装置可以包括被安置在一个或多个地理站点上的一个或多个设备中的一个或多个处理单元。必要时，分布式存储和处理技术本身对于本领域技术人员而言是已知的。在可供选择的实现方式中，不排除语音识别算法208、控制器210和可选的定位算法212之中的任何一个或多个可以采用以下形式来实现：硬连线的电路，或可配置或可重新配置的硬件诸如pga或fpga，或者硬件或软件的任何组合。无论采取什么形式来实现，这些模块208、210、212之中的每一个可以被实现在各种各样的物理位置之中的任何一个或多个上的任何一个或多个设备中。例如，语音识别算法208、控制器210和定位算法212之中的任何一个或多个可以被实现在以下之中：用户终端，诸如被部署在用户的家或环境102周围的台式计算机、膝上型计算机、平板计算机或智能扬声器；或便携式用户终端，诸如用户个人随身携带的智能电话或平板计算机；用户个人随身穿戴的可穿戴设备；和/或远程位置上的服务器（服务器包括在一个或多个地理站点上的一个或多个服务器单元）。作为另一示例，语音识别算法208、控制器210和定位算法212之中的任何一个或多个可以被实现为在每一个照明器104中嵌入的分布式功能。（多个）麦克风108可以被并入与语音识别算法208、控制器210和/或定位算法212之中的任何一个或多个相同的设备中或者被并入不同的设备或多个设备中。语音识别算法208、控制器210和定位算法212可以被实现在彼此相同的设备中或被实现在独立安置的设备中。进一步，这些之中的任何给定一个能够被实现在单个设备中或被分布在多个设备上。再次指出：分布式计算技术本身在本领域中是已知的。在模块208、210、210需要彼此进行外部通信和/或在其自身的不同的分布式部分之间和/或与诸如（多个）麦克风108和/或参考节点214之类的外部元素进行外部通信的情况下，这个通信可以借助于任何合适的有线或无线连接或网络或者这样的组合来实现。合适的有线技术的示例包括ethernet（以太网）、dmx和internet（互联网）。合适的无线技术的示例包括wi-fi、bluetooth、zigbee等。无论物理实现采取什么形式，语音识别算法208被配置成在由用户说出的语音命令中标识用户106的意图，以便控制照明系统204中的一个或多个照明器104。如图3所示，话音命令典型地包括一个以上说出的元素或成分51、52、53，其中每一个指定该命令的不同方面。三个元素在图3中通过示例来举例说明，但是将领会到：其他的数量是可能的。这些元素之中的至少一个指示用户控制照明的愿望，这典型地是按时间顺序（但不一定）说出的第一个元素51。例如，简单的命令可以是“lightson（灯光开）”。第一个元素“灯光”指示用户希望控制照明，并且第二个元素“开”指定参数“开/关”的期望值。作为另一示例，该命令至少包括三个元素：一个表达控制灯光的愿望，一个指定灯光设置，以及一个指定实施控制的位置。所指定的灯光设置可以是例如：开/关，调光水平的改变，颜色设置，或动态效果的名称（即，时变或时空效果）。例如，这三个元素可以是：“调亮[51]厨房[53]中的灯光[52]”。在这个示例中，第一个元素51指定设置改变以增加总强度，第二个元素52表达控制照明的愿望（或者可供选择地，这个在词“调光”或短语“调亮”中能够是隐含的），并且第三个元素53指定该改变将仅在厨房102a中实现。另一示例将是：“系统，将卧室[52]中的灯光[51]设置为舒适的色温[53]”，等等。在这个示例中，第一个元素51告诉语音识别算法208：用户106打算发出照明控制命令，第二个元素52指定用于控制的位置将是卧室102b，并且第三个元素指定颜色设置（在这种情况下，被表达为所期望的照明气氛）。语音识别算法208可以是被实现为虚拟数字助理（有时仅被称为数字助理或虚拟助理）的一部分的通用语音识别算法。可供选择地，语音识别算法208可以专用于照明控制。无论哪种方式，它可以被配置成例如基于关键字识别或基于更复杂的技术诸如自然语言处理（nlp）在说出的元素51、52、53之中的每一个中识别用户106的意图。语音识别本身是已知的技术。控制器210从语音识别算法208接收利用语音识别算法208从语音命令的元素51、51、53之中的每一个中提取的用户106的意图的指示。基于这些，控制器210控制照明系统204来相应地设置由一个或多个照明器104发出的光照。语音命令的处理因而至少包括两个方面：语音的识别，和命令的执行（即，所指定的照明效果的实际呈现）。此外，根据在本文公开的实施例，控制器210也控制照明系统204来提供关于语音命令的处理的反馈，在完成完整命令的呈现之前提供该反馈。这可以包括提供关于命令的识别的反馈和/或提供关于命令的执行的状态的反馈。反馈可以包括通过一个或多个照明器104输出某种指示性的颜色、图案、动态效果或动画。例如，可以在说出命令的最后一个元素53之后但是在执行之前输出反馈，以指示该命令已经被接收并被识别但是仍在被处理，以便所指定效果的实际执行。这防止用户感觉到该命令尚未被系统成功登记(register)并且可能试图再次说出该命令。在进一步示例中，可以在用户说出命令的最后一个元素53之前输出反馈。例如，这能够用于指示：语音识别算法已识别第一个元素51（例如，唤醒词）并且正等待一个或多个进一步元素52、53。或者，该反馈可以指示一个或多个元素51、52的识别已失败，并且或许也指示原因，例如，背景噪声太高，或者用户106说话太轻声或太快。用户106随后能够重新说出该命令的失败部分。作为另一示例，反馈可以提供个别元素51、52、53的个别效果的预览。例如，当用户指定特定组的照明器104时，这个照明器闪烁或发出某种其他的效果以便将它们与其他的周围照明器区分开来；随后，当用户指定特定颜色时，所指定的照明器在当前调光水平上采用这个颜色；并且然后，当用户指定调光水平时，所指定的照明器利用已设置的颜色相应地上下调光。这帮助用户106在他/她正在制定命令时明白该命令的不同部分的效果。一般而言，反馈位置不一定与其中灯光正被控制的位置相同，尤其是如果不被用于提供预览的话。例如，话音命令可以指定在与用户106当前位于的房间不同的房间102b中的灯光的控制。在这种情况下，控制器210可以选择最适当的（多个）照明器104来呈现反馈。基于任何上述的定位技术，这可以是最接近的照明器或多个照明器104。和/或，可以考虑一个或多个其他的因素，诸如照明器的能力。因而，控制器210选择对用户而言是清晰可见的并且具有足够的能力来显示相关信息的照明器104来提供反馈。例如，与仅具有调光能力的照明器相比而言，具有色彩能力的照明器104可能是首选的，即使它离用户更远。通过举例说明，在下面的表格1中给出一些示例反馈类型。表格1id代码处理的阶段反馈的示例类型01话音命令接收（即收听）从蓝色到白色的饱和度的慢脉动02话音命令被完全接收亮度脉冲微光至亮度的10%，持续500毫秒03对话音命令执行计算亮度的慢脉动04话音命令被成功执行灯光长闪烁绿色05话音命令执行失败灯光两次短暂闪烁红色一次06在处理话音命令时出错灯光闪烁红色并淡出07结果的直接预览……在实施例中，控制器210被配置成基于（多个）麦克风108和/或位置系统206自动确定用户106的当前位置（如前所讨论的），并在此基础上将反馈位置设置为用户106的位置，而不管在话音命令中针对将要控制的照明所指定的位置。因此，如果当前在一个房间或区域102a诸如厨房中检测到用户106，但是在话音命令中指定控制在另一房间或区域102b诸如卧室（其中用户从他/她的当前位置无法看到命令的效果）中的照明；则控制器210将自动检测用户106在说出该命令时当前位于哪个房间或区域102a，并在此基础上选择从那个房间或区域102a可见的一个或多个照明器104，且通过那个/那些选择的照明器104来提供反馈。为了实现这个，控制器210可以被提供有位置数据库，其例如依据照明器104位于哪个房间或区域或者依据其坐标来记录照明器104的位置。控制器210随后能够自动确定哪个（些）照明器位于与用户106相同的房间或区域102a中，或者哪个（些）照明器当前最接近用户的估计位置。在另一可供选择的方案中，数据库可以将每一个麦克风108映射到最近的一个或多个照明器104或者映射到与每一个麦克风相同的房间或区域中的一个或多个照明器104。基于此，控制器210随后能够依据当前通过哪个麦克风108检测到他/她的语音来检测用户的位置，并将这个直接映射到关于哪个（些）照明器104将使用来提供反馈的选择。在可供选择或附加的变型中，控制器210被配置成使用照明系统内的信息来通知最适当的一个或多个照明器104的挑选。例如，可以挑选强大的上照明器(uplighter)而非小的柜下灯(undercabinetlight)，即使它更远；或者可以挑选具有色彩能力的灯光而非仅具有调光能力的灯光。这样的信息能够在调试时基于产品信息来捕获或由用户来标记(tag)。在进一步可供选择或附加的实施例中，控制器210可以取决于当前正利用照明系统204呈现的效果来选择反馈效果。例如，考虑这样的情形，其中用户106在其中说出命令的一个房间102a中的灯光当前正显示某个场景诸如日落场景，并且现在也被要求提供关于将在另一个房间102a中执行的话音命令的反馈。在这种情况下，控制器210可以选择与当前场景融为一体的反馈效果。在更进一步可供选择或附加的实施例中，控制器210可以被配置成至少部分基于说出命令的用户106的身份来选择哪个照明器104将用于反馈和/或将使用哪种反馈效果。例如，反馈效果可以是被映射到所标识的用户106的用户设置。或作为另一示例，可以选择（多个）照明器和/或效果，以便不打扰另一个附近的用户或者不打扰由在另一个附近位置上检测到的另一个用户所设置的环境照明场景。参照在上面的表格1中列出的示例反馈id代码，图3随着时间推移（从左到右）显示系统202能够回应的不同方式的一些示例。每当用户106发出话音命令时，控制系统202进入处理的第一阶段并指示它正在接收话音命令。即，通过接近用户或在用户的视线内的光源104，这个反馈被显示在反馈位置上。如所讨论的，可以具有系统确定哪个灯光接近用户的不同方式，示例设置信标技术、被动红外、相机视觉等。在实施例中，这包括确定用户所在的房间102a。（多个）反馈灯光也能够取决于哪个话音接收器108接收到命令而是不同的。在用户说话时，系统202直接处理话音命令并持续更新给用户106显示的反馈（例如，动画）。在页面上的上时间轴显示在本文可以被称为“regularanimation（常规动画）”的示例反馈类型。每当用户106开始说出话音命令时，照明系统204显示动画01，以便给用户106提供控制系统202正在收听的反馈。一旦用户106完成话音命令，照明系统204进入动画02以便向用户106指示控制系统202已停止收听，随后进入03以便通知用户106它正在处理话音命令。然后，动画04被显示给用户106，以确认由系统进行的命令的成功处理。这最后一个动画04反而可能被跳过，并且效果可以被直接呈现。在一个实施例中，用户106针对他/她当前没有位于其中的位置102b发出话音命令。因此，执行位置和反馈位置没有被共同定位。例如，用户106在他的沙发上并且想要准备好他的浴室以便洗个放松的澡。他启动话音命令“<systemname（系统名称）>”--系统202选取接近用户的灯光并显示动画01以便向用户标识它正在收听。用户随后继续“……利用我的放松场景准备好浴室”。在话音命令期间，系统202、204显示动画01。一旦用户106已完成该命令，系统就显示动画02以确认它已停止收听并随后显示动画03以显示它在思考。一旦控制器210从照明系统204接收到确认，它就显示动画04以便向用户106显示：该命令被接收、被处理并被正确执行了。页面上的中间时间轴显示在本文可以被称为“directanimation（直接动画）”的另一示例反馈类型。在此，在用户说话时，提供反馈。例如，在与上述相同的情形中，用户说“<systemname>，设置我的浴室中的灯光……”。控制系统202直接处理话音命令并识别：没有房间被命名为“浴室”。它因此在用户说“浴室”之后向用户106显示效果05，这给用户106提供该命令已失败的点的直接反馈。系统可以在任何给定的元素51、52、53上失败。这将帮助用户106在他接收到关于错误的直接反馈时更好地了解系统的能力。在图3的页面上的底部时间轴中举例说明另一示例反馈类型，其在本文可以被称为“directpreview（直接预览）”。在这样的实施例中，执行位置和反馈位置是类似的。在这种情况中，照明系统204能够在用户106说出话音命令时直接显示所处理的话音命令。例如，用户具有带有三个“地区”的开放式房间：一个命名为“厨房”，另一个命名为“餐厅”，并且第三个命名为“客厅”。当用户106说“设置灯光……”时，所有的灯光104显示01动画。他继续“……在我的客厅里……”：厨房和餐厅中的灯光停止显示动画。用户106然后说“……至我的日落场景”：客厅中的灯光104则进入日落场景。任何上面的反馈类型的变体在本文可以被称为“gracefuldegradation（优雅降级）”。在此，具有较少能力（例如，没有色彩能力）的灯光104将尽其最大努力来呈现动画。当照明系统确定将要显示的灯光时，关于其的反馈将旨在选择接近用户106的最有能力的照明器104。将领会到：仅通过示例描述了上面的实施例。例如，在智能家居应用中，可以具有许多没有反馈能力的电器。例如，诸如百叶窗、加热系统、空调系统和通风机之类的实用程序只能被接通和关闭。寻址这些设备之一的错误的话音命令将不被处理，这对于用户而言可能不是明显的。因此，照明系统204对于其他的智能家电而言也能够充当反馈机制。在这样的实施例中，控制器210被耦合到所谈论的实用程序系统（未示出）并被配置成根据利用语音识别算法所识别的话音命令来控制这个，但是控制器也仍被耦合到照明系统204，以便使用这个来提供关于话音命令的处理的反馈。通过研究附图、公开内容和所附的权利要求书，本领域技术人员在实践所要求保护的发明时能够理解并实现针对所公开的实施例的其他变型。在权利要求书中，词“包括”并不排除其他的元素或步骤，并且不定冠词“一”或“一个”并不排除多个。单个处理器或其他的单元可以履行在权利要求书中叙述的若干项的功能。在互不相同的从属权利要求中叙述某些措施的纯粹事实并不指示不能有利使用这些措施的组合。计算机程序可以被存储和/或被分布在合适的介质诸如与其他硬件的一部分一起供应或作为其他硬件的一部分供应的光学存储介质或固态介质上，但是也可以采用其他的形式诸如经由internet或者其他的有线或无线电信系统来分发。权利要求书中的任何参考符号不应被解释为限制该范畴。当前第1页12

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：R.玛吉尔瑟;G.F.易安尼
技术所有人：昕诺飞控股有限公司
我是此专利的发明人

上一篇：话音控制的制作方法
上一篇：双(2-羟基乙基)对苯二甲酸酯的制造方法及聚对苯二甲酸乙二醇酯的制造方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、田老师：1: 建筑节能绿色建筑能耗的模拟与检测(EnergyPlus)；建筑碳排放和生命周期评价；城市微气候、建筑能耗与太阳能技术的相互影响；地理信息系统(GIS)和空间回归方法用于城市建筑能耗分析；不确定性、敏感性分析和机器学习方法应用于建筑能耗分析(R)；贝叶斯方法用于城市和单体建筑能源分析 2: 过
2、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
3、毕老师：机构动力学与控制
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、周老师：1.智能机器人技术 2.智能检测与控制技术 3.机构运动学与动力学 4.机电一体化技术
如您是高校老师，可以点此联系我们加入专家库。