控制方法和装置与流程

文档序号：16092332发布日期：2018-11-27 23:10阅读：305来源：国知局

本申请实施例涉及计算机技术领域，具体涉及控制方法和装置。

背景技术：

随着计算机技术的发展，通过语音控制指令控制智能设备逐渐成为智能控制技术发展的新方向。

例如，用户可以通过语音实现控制家中同一局域网内的某些智能设备的开启、关闭、调节等功能。相对于用户手动控制，通过语音控制智能设备，为用户带了更为便捷的体验。

技术实现要素：

本申请实施例提出了控制方法和装置。

第一方面，本申请实施例提供了一种控制方法，该方法包括：从目标终端接收用户语音音频和目标终端的标识；基于标识，确定与目标终端预先建立关联关系的终端作为目标终端的关联终端；响应于确定用户语音音频指示关联终端执行操作，向关联终端发送控制指令，其中，控制指令用于指示关联终端执行用户语音音频所指示的操作。

在一些实施例中，该方法还包括：对用户语音音频进行识别，生成识别结果；以及响应于确定用户语音音频指示关联终端执行操作，向关联终端发送控制指令，包括：响应于确定识别结果表征用户语音音频指示关联终端执行操作，向关联终端发送控制指令。

在一些实施例中，该方法还包括：基于识别结果，确定用户语音音频的回复音频，以及生成音频回复指令，其中，音频回复指令用于指示目标终端播放回复音频；将音频回复指令和回复音频发送至目标终端。

在一些实施例中，关联终端所在的物理实体与目标终端所在的物理实体之间的距离小于预设的距离阈值。

在一些实施例中，关联终端包括以下至少一项：照明设备、温度调节设备、窗帘、电视机、电话、排风扇。

在一些实施例中，目标终端为音箱。

在一些实施例中，关联关系是通过如下步骤建立的：获取目标终端集合中的目标终端的标识，基于该目标终端所在的物理实体的位置，确定该目标终端的关联终端的标识，将该目标终端的标识与该目标终端的关联终端的标识关联存储，以建立该目标终端与该目标终端的关联终端的关联关系。

第二方面，本申请实施例提供了一种控制装置，该装置包括：接收单元，被配置成从目标终端接收用户语音音频和目标终端的标识；确定单元，被配置成基于标识，确定与目标终端预先建立关联关系的终端作为目标终端的关联终端；第一发送单元，被配置成响应于确定用户语音音频指示关联终端执行操作，向关联终端发送控制指令，其中，控制指令用于指示关联终端执行用户语音音频所指示的操作。

在一些实施例中，该装置还包括：第一生成单元，被配置成对用户语音音频进行识别，生成识别结果；以及第一发送单元，进一步被配置成：响应于确定识别结果表征用户语音音频指示关联终端执行操作，向关联终端发送控制指令。

在一些实施例中，该装置还包括：第二生成单元，被配置成基于识别结果，确定用户语音音频的回复音频，以及生成音频回复指令，其中，音频回复指令用于指示目标终端播放回复音频；第二发送单元，被配置成将音频回复指令和回复音频发送至目标终端。

在一些实施例中，关联终端所在的物理实体与目标终端所在的物理实体之间的距离小于预设的距离阈值。

在一些实施例中，关联终端包括以下至少一项：照明设备、温度调节设备、窗帘、电视机、电话、排风扇。

在一些实施例中，目标终端为音箱。

第三方面，本申请实施例提供了一种服务器，包括：一个或多个处理器；存储装置，其上存储有一个或多个程序，当上述一个或多个程序被上述一个或多个处理器执行，使得该一个或多个处理器实现如上述控制方法中任一实施例的方法。

第四方面，本申请实施例提供了一种控制计算机可读介质，其上存储有计算机程序，该程序被处理器执行时实现如上述控制方法中任一实施例的方法。

本申请实施例提供的控制方法和装置，通过从目标终端接收用户语音音频和目标终端的标识，然后，基于标识，确定与目标终端预先建立关联关系的终端作为目标终端的关联终端，最后，响应于确定用户语音音频指示关联终端执行操作，向关联终端发送控制指令，从而提高了控制方式的丰富性，提高了控制的灵活性。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本申请的其它特征、目的和优点将会变得更明显：

图1是本申请的一个实施例可以应用于其中的示例性系统架构图；

图2是根据本申请的控制方法的一个实施例的流程图；

图3是根据本申请的控制方法的一个应用场景的示意图；

图4A是本申请的控制方法的执行主体包括多个服务器时，执行主体的结构示意图；

图4B是针对图4A的一个应用场景的示意图；

图4C是针对图4A的又一个应用场景的示意图；

图5是根据本申请的控制方法的又一个实施例的流程图；

图6是根据本申请的控制装置的一个实施例的结构示意图；

图7是适于用来实现本申请实施例的服务器的计算机系统的结构示意图。

具体实施方式

下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释相关发明，而非对该发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与有关发明相关的部分。

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

图1示出了可以应用本申请实施例的控制方法或控制装置的实施例的示例性系统架构100。

如图1所示，系统架构100可以包括终端设备101、102、103、107，网络104、106和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络106用以在终端设备107和服务器105之间提供通信链路的介质。网络104、106可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。

用户可以使用终端设备101、102、103通过网络104与服务器105交互，进而，通过网络106控制终端设备107。

终端设备101、102、103可以是硬件，也可以是软件。当终端设备101、102、103为硬件时，可以是具有音频获取功能的各种电子设备，包括但不限于智能音箱、智能手机、平板电脑、膝上型便携计算机和台式计算机等等。当终端设备101、102、103为软件时，可以安装在智能手机、平板电脑、膝上型便携计算机和台式计算机等电子设备中。其可以实现成多个软件或软件模块(例如用来提供分布式服务的软件或软件模块)，也可以实现成单个软件或软件模块。在此不做具体限定。

终端设备107可以是硬件，也可以是软件。当终端设备107为硬件时，可以包括但不限于电灯类设备、插座类设备、窗帘类设备、门锁类设备、空调类设备、电视机、机顶盒、空气监测器类设备、空气净化器、净水器、加湿器、电风扇、热水器类设备、电暖器类设备、洗衣机类设备、晾衣架、燃气灶类设备、油烟机类设备、烤箱设备、微波炉、压力锅、电饭煲、电磁炉、破壁机、扫地机器人、冰箱、打印机、新风机、热水壶、自动晾衣架。当终端设备107为软件时，可以安装在智能手机、平板电脑、膝上型便携计算机和台式计算机或其他电子设备中，用以控制上述所列举的硬件(例如电灯类设备、扫地机器人等)。当终端设备107为软件时，其可以实现成多个软件或软件模块(例如用来提供分布式服务的软件或软件模块)，也可以实现成单个软件或软件模块。在此不做具体限定。

服务器105可以是提供各种服务的服务器。例如，服务器可以对终端设备101、102、103发送的语音音频提供支持的后台音频处理服务器。后台音频处理服务器可以对接收到的语音音频进行识别，并将处理结果(例如用于指示终端设备回复上述语音音频的指令)反馈给终端设备。

需要说明的是，本申请实施例所提供的控制方法一般由服务器105执行，相应地，控制装置一般设置于服务器105中。

需要说明的是，服务器可以是硬件，也可以是软件。当服务器为硬件时，可以实现成多个服务器组成的分布式服务器集群，也可以实现成单个服务器。当服务器为软件时，可以实现成多个软件或软件模块(例如用来提供分布式服务的软件或软件模块)，也可以实现成单个软件(例如云端服务器)或软件模块。在此不做具体限定。

应该理解，图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。当信息处理方法运行于其上的电子设备不需要控制终端设备时，该系统架构可以不包括网络106和终端设备107。

继续参考图2，示出了根据本申请的控制方法的一个实施例的流程200。该控制方法，包括以下步骤：

步骤201，从目标终端接收用户语音音频和目标终端的标识。

在本实施例中，控制方法的执行主体(例如图1所示的服务器105)可以通过有线连接方式或者无线连接方式从目标终端(例如图1所示的终端设备101、102、103)接收用户语音音频和该目标终端的标识。其中，目标终端可以是与上述执行主体通信连接的终端，其可以是硬件也可以是软件。当目标终端为硬件时，该目标终端可以是音箱、手机、电脑，也可以是其他电子设备。当目标终端为软件时，该目标终端可以是安装在电子设备上的具有音频获取功能的软件。目标终端的标识用以标识该终端设备。例如，目标终端的标识可以是目标终端的位置、名称、设备的身份标识号码(Identity，ID)，也可以是人为确定的、其他用做区分该目标终端与其他终端不同的符号。用户语音音频可以是上述终端设备采集的、用户语音的音频。作为示例，用户语音音频对应的文字可以是“打开台灯”、“发现设备”、“帮我定个明天早晨八点的闹钟”等等。

在本实施例的一些可选的实现方式中，上述目标终端为音箱。

步骤202，基于标识，确定与目标终端预先建立关联关系的终端作为目标终端的关联终端。

在本实施例中，基于步骤201中得到的标识，上述执行主体可以确定与目标终端预先建立关联关系的终端(例如图1所示的终端设备107)作为目标终端的关联终端。其中，上述关联终端可以包括但不限于以下至少一项：电灯类设备、开关类设备、插座类设备、窗帘类设备、门锁类设备、空调类设备、电视机、机顶盒、空气监测器类设备、空气净化器、净水器、加湿器、电风扇、热水器类设备、电暖器类设备、洗衣机类设备、晾衣架、燃气灶类设备、油烟机类设备、烤箱设备、微波炉、压力锅、电饭煲、电磁炉、破壁机、扫地机器人、冰箱、打印机、新风机、热水壶、自动晾衣架。

实践中，技术人员、管理人员(例如酒店的管理人员)或其他人员可以预先将目标终端与目标终端的关联终端建立关联关系。

例如，酒店管理人员可以在酒店中的每个房间放置一个目标终端(例如音箱)。然后将该房间所放置的其他的终端(即除目标终端之外的终端)确定为该房间所放置的目标终端的关联终端。最后，酒店管理人员可以将该房间所放置的目标终端，以及该房间所放置的目标终端的关联终端作为一条记录，存储于数据库中。可选的，也可以将该房间所放置的目标终端，以及该房间所放置的目标终端的关联终端存储于表格中。

在本实施例的一些可选的实现方式中，关联终端包括以下至少一项：照明设备、温度调节设备、窗帘、电视机、电话、排风扇。

步骤203，响应于确定用户语音音频指示关联终端执行操作，向关联终端发送控制指令。

在本实施例中，在确定上述用户语音音频指示关联终端执行操作的情况下，上述执行主体可以向上述关联终端发送控制指令。其中，控制指令用于指示关联终端执行用户语音音频所指示的操作(例如，打开、关闭、调节等)。

实践中，上述执行主体或者其他执行主体可以采用多种方式确定用户语音音频是否指示关联终端执行操作。

在本实施例的一些可选的实现方式中，上述执行主体可以对用户语音音频进行识别，生成识别结果，从而确定用户语音音频是否指示关联终端执行操作。

可选的，上述执行主体或者其他执行主体也可以如下确定用户语音音频是否指示关联终端执行操作：

首先，技术人员、管理人员或者用户可以确定一些词汇，包含这些词汇的用户语音音频可以用于控制关联终端。例如，用户可以设定包含词汇“打开”、“开启”、“关上”、“关闭”的用户语音音频用于控制关联终端。

然后，上述执行主体或者其他执行主体可以通过判断用户语音音频中是否包含上述所确定的词汇(例如“打开”、“开启”、“关上”、“关闭”)来确定用户语音音频是否指示关联终端执行操作。如果包含，则确定用户语音音频指示关联终端执行操作；如果不包含，则确定用户语音音频并非指示关联终端执行操作。

在这里，上述控制指令可以是json格式的控制指令，也可以是XML格式的控制指令。实践中，上述控制指令可以是符合DCS协议的指令。其中，DCS协议是DuerOS(对话式人工智能操作系统)服务端与设备端之间的通讯协议，是一套把DuerOS的智能语音交互能力向所有设备开放的应用程序编程接口。

在本实施例的一些可选的实现方式中，上述执行主体还可以对用户语音音频进行识别，生成识别结果。由此，上述响应于确定用户语音音频指示关联终端执行操作，向关联终端发送控制指令，可以包括：响应于确定识别结果表征用户语音音频指示关联终端执行操作，向关联终端发送控制指令。

作为示例，上述执行主体可以通过自动语音识别技术(Automatic Speech Recognition，ASR)、自然语言理解(natural language understanding，NLU)，对用户语音音频进行识别，生成识别结果，以识别用户意图。其中，上述自动语音识别技术是一种将人的语音转换为文本的技术，上述自然语言理解技术可以包括但不限于：句子检测，分词，词性标注，句法分析，文本分类，文本聚类，文字角度，信息抽取，自动摘要，机器翻译，自动问答，文本生成等。上述自动语音识别技术和自然语言理解技术是语音识别领域技术人员广泛研究和公知的技术，在此不再赘述。

在本实施例的一些可选的实现方式中，上述执行主体还可以基于识别结果，确定用户语音音频的回复音频，以及生成音频回复指令。然后，将音频回复指令和回复音频发送至目标终端。其中，音频回复指令用于指示目标终端播放回复音频。上述回复音频可以是用于回复用户语音音频的音频。

可以理解，上述执行主体通过自动语音识别技术、自然语言理解等技术，可以生成用户语音音频的回复音频。可选的，上述执行主体也可以通过声学模型(AM)和语言模型(LM)生成用户语音音频的回复音频。

在本实施例的一些可选的实现方式中，关联终端所在的物理实体与目标终端所在的物理实体之间的距离小于预设的距离阈值。其中，当关联终端为软件时，关联终端所在的物理实体为安装关联终端的设备。当关联终端为硬件时，关联终端所在的物理实体为关联终端本身。当目标终端为软件时，目标终端所在的物理实体为安装目标终端的设备。当目标终端为硬件时，目标终端所在的物理实体为目标终端本身。距离阈值可以是技术人员、管理人员、用户等设置的距离。例如，距离阈值可以是2米、3米等等。可以理解，当将与该目标终端的距离在一定范围(即上述距离阈值)内的终端确定为该目标终端的关联终端时，用户可以首先通过距离判断某一特定终端是否为目标终端的关联终端，从而确定是否通过目标终端实现对上述特定终端的控制，由此丰富了控制方式的灵活性，提高了用户体验。

继续参见图3，图3是根据本实施例的控制方法的应用场景的一个示意图。在图3的应用场景中，用户首先向音箱301(即上述目标终端)发送了用户语音音频“打开空调”。然后，服务器302(即上述执行主体)从音箱301接收用户语音音频“打开空调”和音箱301的标识“123”。之后，服务器302将标识“123”在记录有目标终端和目标终端的关联终端的关联关系的表格中进行查询，从而确定了音箱301的关联终端包括空调和窗帘。最后，服务器302确定用户语音音频“打开空调”指示关联终端执行操作，则向关联终端空调303发送控制指令，以控制空调303打开。

本申请的上述实施例提供的方法，通过从目标终端接收用户语音音频和目标终端的标识，然后，基于标识，确定与目标终端预先建立关联关系的终端作为目标终端的关联终端，最后，响应于确定用户语音音频指示关联终端执行操作，向关联终端发送控制指令，从而提高了控制方式的丰富性，提高了控制的灵活性，通过语音交互的方式，实现了控制关联终端(例如智能家居设备)的目的。

在一些使用情况下，本申请的控制方法的执行主体可以包括以下任一项或几项的组合：一个或多个服务器、一个或多个软件、一个或多个软件模块。

示例性的，下面请参考图4A，图4A是本申请的控制方法的执行主体包括多个服务器时，该执行主体的结构示意图。

在图4A中，控制方法的执行主体401包括云端(服务器)、请求分发服务器、天气服务器、新闻服务器、智能家居服务器。

其中，云端(服务器)被配置成从音箱(即目标终端)接收用户语音音频(例如发现设备)和音箱的标识(例如123)，然后，对用户语音音频进行自动语音识别技术、自然语言理解等处理，生成处理结果(例如json格式的描述信息)，以识别用户的意图，随后，将处理结果发送至请求分发服务器。请求分发服务器再根据处理结果(即所识别的用户意图)，确定将该处理结果发送至哪个服务器进行后续处理。例如，处理结果表征用户语音音频与天气相关时，请求分发服务器可以将处理结果发送至天气服务器；处理结果表征用户语音音频与新闻相关时，请求分发服务器可以将处理结果发送至新闻服务器；处理结果表征用户语音音频与智能家居相关时，请求分发服务器可以将处理结果发送至智能家居服务器。可以理解，技术人员可根据实际需求设置执行后续处理操作的服务器的功能和数量。例如，技术人员可以设置另一个服务器，当无法识别用户语音音频所表征的用户意图时，该服务器可以返回“对不起，我没能理解您的意思”。

可以理解，按照上述方式，设置请求分发服务器负责将用户语音音频的处理结果下发至执行后续处理操作的服务器执行后续操作，可以保证各个执行后续处理操作的服务器相对独立，互不影响。请求分发服务器只需负责确定将处理结果下发至哪个服务器即可，而无需关注具体的实现方式。

请继续参考图4B。图4B是针对图4A的一个应用场景的示意图。在图4B中，控制方法的执行主体402包括云端(服务器)、请求分发服务器、酒店管理服务器、天气服务器、新闻服务器、智能家居服务器。此处，图中未示出天气服务器、新闻服务器等其他服务器。

在这里，以用户语音音频为“发现设备”为例，对请求分发服务器与后续处理操作的服务器之间的交互关系进行说明。

在云端(服务器)从音箱(即上述目标终端)接收到用户语音音频“发现设备”之后，对其进行自动语音识别技术、自然语言理解等处理，生成处理结果(例如{“intent”:“discover devices”})。随后，将上述处理结果发送至请求分发服务器。由于上述处理结果与智能家居相关，因此，请求分发服务器将上述处理结果发送至智能家居服务器。随后，智能家居服务器通过酒店管理服务器获取各个房间的终端的信息。例如每个房间所房子的终端(例如空调、窗帘、台灯等)的名称、标识(例如ID)等。实践中，酒店管理服务器中存储有每个房间所放置的各个终端的名称、标识等信息。之后，酒店管理服务器可以通过DCS协议将所发现的设备(即关联终端)的标识(例如ID)信息发送至智能家居服务器。示例性的，上述DCS协议可以是{“devices”：{“tv”：“123”}，“light”：“234”}，该DCS协议表征关联终端电视(tv)的标识为“123”，关联终端灯(light)的标识为“234”。随后，请求分发服务器从智能家居服务器获取关联终端的标识，并将关联终端的标识返回云端。此后，云端生成与音箱进行通信的协议(例如DCS协议)。最后，云端将所生成的协议发送至音箱。音箱在接收到上述协议之后，进行解析。通常，上述协议指示音箱进行语音播报，例如播报“发现设备成功”。

需要说明的是，用户语音音频并未指示关联终端执行操作，因此，上述执行主体未向关联终端发送控制指令。

在这里，酒店管理服务器向智能家居服务器返回的终端(即关联终端)的标识可以是与发送用户语音音频的音箱位于同一房间的终端的标识，也可以是满足某些条件(例如终端的状态处于开启状态)的终端的标识。

下面请参考图4C，图4C是针对图4A的又一个应用场景的示意图。在图4C中，控制方法的执行主体402包括云端(服务器)、请求分发服务器、酒店管理服务器、天气服务器、新闻服务器、智能家居服务器。此处，图中未示出天气服务器、新闻服务器等其他服务器。

在这里，以用户语音音频为“打开台灯”为例，对请求分发服务器与后续处理操作的服务器之间的交互关系进行说明。该用户语音音频“打开台灯”可以是在用户语音音频“发现设备”之后发送的，也可以是在发送用户语音音频“发现设备”前发送的。

作为示例，当用户在房间2内输入“打开台灯”后，云端服务器从房间2的音箱接收到了用户语音音频“打开台灯”和目标终端的标识(例如1234)，随后，由于用户语音音频“打开台灯”与智能家居相关，因此，请求分发服务器将用户语音音频“打开台灯”发送至智能家居服务器。在这里，如果智能家居服务器缓存有音箱(即目标终端)和音箱的关联终端的对应关系表，则智能家居服务器可以直接确定关联终端的标识和需要执行的操作。如果智能家居服务器未缓存音箱(即目标终端)和音箱的关联终端的对应关系表，则可以按照上述操作得到该对应关系表。在得到关联终端的标识和需要执行的操作等信息的前提下，酒店管理服务器即可向关联终端发送控制指令。例如酒店管理服务器即可向关联终端发送控制指令，以控制台灯打开。

需要说明的是，本申请实施例的应用场景并不限于酒店，还可以是学校等其他场所。此外，上述服务器的名称并不构成任何特殊的限制，仅用作区分。例如，在一些使用情况下，请求分发服务器可以为度秘技能平台(Duer Bot Platform)，智能家居服务器可以为度秘智能家居技能(Duer Smart home bot)，酒店管理服务器可以为酒店物业业务管理系统(Property Management System，PMS)等等。上述服务器可以是硬件，也可以是软件。当服务器为硬件时，可以实现成多个服务器组成的分布式服务器集群，也可以实现成单个服务器。当服务器为软件时，可以实现成多个软件或软件模块(例如用来提供分布式服务的软件或软件模块)，也可以实现成单个软件(例如云端服务器)或软件模块。在此不做具体限定。

进一步参考图5，其示出了控制方法的又一个实施例的流程500。该控制方法的流程500，包括以下步骤：

步骤501，获取目标终端集合中的目标终端的标识，基于该目标终端所在的物理实体的位置，确定该目标终端的关联终端的标识，将该目标终端的标识与该目标终端的关联终端的标识关联存储，以建立该目标终端与该目标终端的关联终端的关联关系。

在本实施例中，控制方法的执行主体(例如图1所示的服务器105)可以按照如下步骤建立目标终端与目标终端的关联终端的关联关系：

首先，上述执行主体可以通过有线连接方式或者无线连接方式获取目标终端集合中的目标终端的标识。其中，上述目标终端集合可以是预先确定的终端的集合，也可以是某一类型的终端的集合。例如，上述目标终端集合可以是某一酒店中的音箱的集合。实践中，酒店中的每个房间内可以设置有一台音箱，每台音箱具有唯一标识该音箱的标识。其中，目标终端的标识用以标识该终端设备。例如，目标终端的标识可以是目标终端的位置、名称、设备的身份标识号码(Identity，ID)，也可以是人为确定的、其他用做区分该目标终端与其他终端不同的符号。上述目标终端的标识可以是技术人员或管理人员输入至上述执行主体的，也可以是通过其他电子设备发送至上述执行主体的。

然后，上述执行主体可以基于该目标终端所在的物理实体的位置，确定该目标终端的关联终端的标识。

作为示例，上述执行主体可以确定距离该目标终端所在的物理实体的位置一定范围(例如2米)内的终端作为该目标终端的关联终端，再确定关联终端的标识。

可选的，技术人员或管理人员可以对每个房间中的目标终端(例如音箱)的位置、该房间所在的位置和该房间中除目标终端之外的其他终端(即关联终端)的位置进行统计，然后，输入上述执行主体。基于此，上述执行主体可以在确定出各个目标终端的位置、各个房间的位置、各个关联终端的位置的基础上，将与某一目标终端位于同一房间的关联终端，确定为该目标终端的关联终端。

之后，上述执行主体可以将该目标终端的标识与该目标终端的关联终端的标识关联存储，以建立该目标终端与该目标终端的关联终端的关联关系。

作为示例，上述执行主体可以将该目标终端的标识与该目标终端的关联终端的标识作为一条记录，存储于数据库中，也可以存储于表格中。由此，该目标终端与该目标终端的关联终端的关联关系建立完成。

可以理解，按照上述步骤可以建立目标终端集合中的每个目标终端与该目标终端的关联终端的关联关系。

步骤502，从目标终端接收用户语音音频和目标终端的标识。

步骤503，基于标识，确定与目标终端预先建立关联关系的终端作为目标终端的关联终端。

步骤504，响应于确定用户语音音频指示关联终端执行操作，向关联终端发送控制指令。

在本实施例中，步骤502-504分别与图2对应实施例中的步骤201-203基本一致，这里不再赘述。

从图5中可以看出，与图2对应的实施例相比，本实施例中的控制方法的流程500突出了建立目标终端集合中的每个目标终端与该目标终端的关联终端的关联关系的步骤。由此，本实施例描述的方案有助于通过不同的关联关系建立方式，实现灵活的控制酒店中的每个房间中的关联终端，进一步丰富了关联终端的控制方式。

进一步参考图6，作为对上述各图所示方法的实现，本申请提供了一种控制装置的一个实施例，该装置实施例与图2所示的方法实施例相对应，除下面所记载的特征外，该装置实施例还可以包括与图2所示的方法实施例相同或相应的特征。该装置具体可以应用于各种电子设备中。

如图6所示，本实施例的控制装置600包括：接收单元601、确定单元602和第一发送单元603。其中，接收单元601被配置成从目标终端接收用户语音音频和目标终端的标识；确定单元602被配置成基于标识，确定与目标终端预先建立关联关系的终端作为目标终端的关联终端；第一发送单元603被配置成响应于确定用户语音音频指示关联终端执行操作，向关联终端发送控制指令，其中，控制指令用于指示关联终端执行用户语音音频所指示的操作。

在本实施例中，控制装置600的接收单元601可以通过有线连接方式或者无线连接方式从目标终端(例如图1所示的终端设备101、102、103)接收用户语音音频和该目标终端的标识。其中，目标终端可以是与上述装置600通信连接的终端，其可以是硬件也可以是软件。当目标终端为硬件时，该目标终端可以是音箱、手机、电脑，也可以是其他电子设备。当目标终端为软件时，该目标终端可以是安装在电子设备上的具有音频获取功能的软件。目标终端的标识用以标识该终端设备。例如，目标终端的标识可以是目标终端的位置、名称、设备的身份标识号码(Identity，ID)，也可以是人为确定的、其他用做区分该目标终端与其他终端不同的符号。用户语音音频可以是上述终端设备采集的、用户语音的音频。作为示例，用户语音音频对应的文字可以是“打开台灯”、“发现设备”、“帮我定个明天早晨八点的闹钟”等等。

在本实施例中，基于接收单元601得到的标识，上述确定单元602可以确定与目标终端预先建立关联关系的终端(例如图1所示的终端设备107)作为目标终端的关联终端。其中，上述关联终端可以包括但不限于以下至少一项：电灯类设备、开关类设备、插座类设备、窗帘类设备、门锁类设备、空调类设备、电视机、机顶盒、空气监测器类设备、空气净化器、净水器、加湿器、电风扇、热水器类设备、电暖器类设备、洗衣机类设备、晾衣架、燃气灶类设备、油烟机类设备、烤箱设备、微波炉、压力锅、电饭煲、电磁炉、破壁机、扫地机器人、冰箱、打印机、新风机、热水壶、自动晾衣架。

在本实施例中，在确定上述用户语音音频指示关联终端执行操作的情况下，上述第一发送单元603可以向上述关联终端发送控制指令。其中，控制指令用于指示关联终端执行用户语音音频所指示的操作(例如，打开、关闭、调节等)。

在本实施例的一些可选的实现方式中，该装置600还包括：第一生成单元(图中未示出)被配置成对用户语音音频进行识别，生成识别结果；以及第一发送单元603进一步被配置成：响应于确定识别结果表征用户语音音频指示关联终端执行操作，向关联终端发送控制指令。

在本实施例的一些可选的实现方式中，该装置600还包括：第二生成单元(图中未示出)被配置成基于识别结果，确定用户语音音频的回复音频，以及生成音频回复指令，其中，音频回复指令用于指示目标终端播放回复音频；第二发送单元(图中未示出)被配置成将音频回复指令和回复音频发送至目标终端。

可以理解，上述装置600通过自动语音识别技术、自然语言理解等技术，可以生成用户语音音频的回复音频。可选的，上述装置600也可以通过声学模型(AM)和语言模型(LM)生成用户语音音频的回复音频。

可以理解，当将与该目标终端的距离在一定范围(即上述距离阈值)内的终端确定为该目标终端的关联终端时，用户可以首先通过距离判断某一特定终端是否为目标终端的关联终端，从而确定是否通过目标终端实现对上述特定终端的控制，由此丰富了控制方式的灵活性，提高了用户体验。

在本实施例的一些可选的实现方式中，关联终端包括以下至少一项：照明设备、温度调节设备、窗帘、电视机、电话、排风扇。

在本实施例的一些可选的实现方式中，目标终端为音箱。

在本实施例的一些可选的实现方式中，关联关系是通过如下步骤建立的：

首先，上述装置600可以通过有线连接方式或者无线连接方式获取目标终端集合中的目标终端的标识。其中，上述目标终端集合可以是预先确定的终端的集合，也可以是某一类型的终端的集合。例如，上述目标终端集合可以是某一酒店中的音箱的集合。实践中，酒店中的每个房间内可以设置有一台音箱，每台音箱具有唯一标识该音箱的标识。其中，目标终端的标识用以标识该终端设备。例如，目标终端的标识可以是目标终端的位置、名称、设备的身份标识号码(Identity，ID)，也可以是人为确定的、其他用做区分该目标终端与其他终端不同的符号。上述目标终端的标识可以是技术人员或管理人员输入至上述装置600的，也可以是通过其他电子设备发送至上述装置600的。

然后，上述装置600可以基于该目标终端所在的物理实体的位置，确定该目标终端的关联终端的标识。

作为示例，上述装置600可以确定距离该目标终端所在的物理实体的位置一定范围(例如2米)内的终端作为该目标终端的关联终端，再确定关联终端的标识。

可选的，技术人员或管理人员可以对每个房间中的目标终端(例如音箱)的位置、该房间所在的位置和该房间中除目标终端之外的其他终端(即关联终端)的位置进行统计，然后，输入上述装置600。基于此，上述装置600可以在确定出各个目标终端的位置、各个房间的位置、各个关联终端的位置的基础上，将与某一目标终端位于同一房间的关联终端，确定为该目标终端的关联终端。

之后，上述装置600可以将该目标终端的标识与该目标终端的关联终端的标识关联存储，以建立该目标终端与该目标终端的关联终端的关联关系。

作为示例，上述装置600可以将该目标终端的标识与该目标终端的关联终端的标识作为一条记录，存储于数据库中，也可以存储于表格中。由此，该目标终端与该目标终端的关联终端的关联关系建立完成。

可以理解，按照上述步骤可以建立目标终端集合中的每个目标终端与该目标终端的关联终端的关联关系。

本申请的上述实施例提供的装置，通过接收单元601从目标终端接收用户语音音频和目标终端的标识，然后，确定单元602基于标识，确定与目标终端预先建立关联关系的终端作为目标终端的关联终端，最后，响应于确定用户语音音频指示关联终端执行操作，第一发送单元603向关联终端发送控制指令，从而提高了控制方式的丰富性，提高了控制的灵活性。

下面参考图7，其示出了适于用来实现本申请实施例的服务器的计算机系统700的结构示意图。图7示出的服务器仅仅是一个示例，不应对本申请实施例的功能和使用范围带来任何限制。

如图7所示，计算机系统700包括中央处理单元(CPU)701，其可以根据存储在只读存储器(ROM)702中的程序或者从存储部分708加载到随机访问存储器(RAM)703中的程序而执行各种适当的动作和处理。在RAM 703中，还存储有系统700操作所需的各种程序和数据。CPU 701、ROM 702以及RAM 703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线704。

以下部件连接至I/O接口705：包括键盘、鼠标等的输入部分706；包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分707；包括硬盘等的存储部分708；以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分709。通信部分709经由诸如因特网的网络执行通信处理。驱动器710也根据需要连接至I/O接口705。可拆卸介质711，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器710上，以便于从其上读出的计算机程序根据需要被安装入存储部分708。

特别地，根据本公开的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分709从网络上被下载和安装，和/或从可拆卸介质711被安装。在该计算机程序被中央处理单元(CPU)701执行时，执行本申请的方法中限定的上述功能。

需要说明的是，本申请所述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中，计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、电线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写用于执行本申请的操作的计算机程序代码，所述程序设计语言包括面向目标的程序设计语言—诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

附图中的流程图和框图，图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本申请实施例中所涉及到的单元可以通过软件的方式实现，也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中，例如，可以描述为：一种处理器包括接收单元、确定单元和第一发送单元。其中，这些单元的名称在某种情况下并不构成对该单元本身的限定，例如，接收单元还可以被描述为“从目标终端接收用户语音音频和目标终端的标识的单元”。

作为另一方面，本申请还提供了一种计算机可读介质，该计算机可读介质可以是上述实施例中描述的服务器中所包含的；也可以是单独存在，而未装配入该服务器中。上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被该服务器执行时，使得该服务器：从目标终端接收用户语音音频和目标终端的标识；基于标识，确定与目标终端预先建立关联关系的终端作为目标终端的关联终端；响应于确定用户语音音频指示关联终端执行操作，向关联终端发送控制指令，其中，控制指令用于指示关联终端执行用户语音音频所指示的操作。

以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解，本申请中所涉及的发明范围，并不限于上述技术特征的特定组合而成的技术方案，同时也应涵盖在不脱离上述发明构思的情况下，由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：常先堂
技术所有人：百度在线网络技术（北京）有限公司
我是此专利的发明人

上一篇：一种智能分隔式低压成套开关设备的制作方法
上一篇：木材家具的防腐防虫材料及其制备方法与流程