机器控制系统、机器控制方法、以及程序与流程

文档序号:21547489发布日期:2020-07-17 17:58阅读:196来源:国知局
机器控制系统、机器控制方法、以及程序与流程

本发明涉及机器控制系统、机器控制方法、以及程序。



背景技术:

近年来,例如智能电话或智能扬声器等通过利用了语音识别的语音输入而即使不进行物理上的操作也能够轻易地进行操作的机器在增加。



技术实现要素:

发明要解决的课题

在语音输入中,输入某些短语作为指示。由于这里输入的短语的句子原本自由度高,所以用户不知道什么样的短语会被受理作为语音输入。因此,考虑准备对能够受理的短语进行说明的手册的方法,但是存在如下问题:只能指导固定短语,因此,即使能够对全部用户指导公共的短语,也无法指导基于用户而变化的短语。

本发明是鉴于上述课题而完成的,其目的在于,提供用户能够容易且可靠地得到在语音输入中能够受理的短语的技术。

用于解决课题的方案

为了解决上述课题,本发明的机器控制系统包括:设定获取单元,获取与设备有关的用户设定;短语生成单元,基于所获取的所述用户设定,生成能够控制所述设备的短语;以及显示数据输出单元,输出用于使所生成的所述短语显示的数据。

此外,本发明的机器控制方法包括:获取与设备有关的用户设定的步骤;基于所获取的所述用户设定,生成能够控制所述设备的短语的步骤;以及输出用于使所生成的所述短语显示的数据的步骤。

此外,本发明的程序使计算机作为下述单元发挥功能,即:设定获取单元,获取与设备有关的用户设定;短语生成单元,基于所获取的所述用户设定,生成能够控制所述设备的短语;以及显示数据输出单元,输出用于使所生成的所述短语显示的数据。

发明效果

根据本发明,用户能够容易地得到在语音输入中能够受理的短语。

附图说明

图1是表示本发明的实施方式涉及的机器控制系统的结构的图。

图2是表示机器表格的一例的图。

图3是表示通过语音识别装置、命令数据发送装置、机器以及用户终端实现的功能的框图。

图4是表示消息的一例的图。

图5是表示语音输入的利用注册的处理的一例的流程图。

图6是表示语音输入利用表格的一例的图。

图7是对机器注册的处理进行说明的时序图。

图8是表示机器注册中的用户终端的处理的例子的流程图。

图9是表示机器注册中的机器的处理的例子的流程图。

图10是表示机器注册中的命令数据发送装置的处理的例子的流程图。

图11是表示样本短语的模板的一例的图。

图12是表示短语生成部以及短语输出部的处理的例子的流程图。

图13是表示所显示的样本短语的一例的图。

图14是表示所显示的样本短语的另一例的图。

图15是表示动作指示受理部、消息生成部、消息发送部、消息接收部、命令执行部的处理的一例的流程图。

具体实施方式

以下,基于附图对本发明的实施方式的例子进行说明。

[1.系统结构]图1表示本发明的实施方式涉及的机器控制系统的结构。如图1所示,机器控制系统1包括第一机器20-1、第二机器20-2、第三机器20-3、语音输入装置30、语音识别装置40、以及命令处理系统50。以下,有时将第一机器20-1、第二机器20-2、以及第三机器20-3总称为“机器20”来记载。

机器20以及语音输入装置30设置于本地区域,连接到lan2。lan2可以是有线lan,也可以是无线lan。lan2经由路由器4连接到互联网6。语音识别装置40以及命令处理系统50设置于本地区域外。即,从机器20以及语音输入装置30来看,语音识别装置40以及命令处理系统50设置于互联网6侧。另外,“本地区域”是指能够进行经由lan2的通信的有限范围的区域。

机器20是成为由机器控制系统1进行的控制的对象的机器。在图1中示出3台机器20,但是也可以包含4台以上的机器20,还可以只包含2台以下的机器20。

例如,机器20是音频机器或者视听机器。具体而言,机器20是av接收器、av放大器、扬声器、光盘播放机器(“ブルーレイディスク(蓝光光盘)”(注册商标)播放器或者dvd(注册商标)播放器等)、或者电视接收机。此外,例如,机器20也可以是乐器(电子乐器或者电气乐器等)。另外,机器20也可以是这些以外的机器。

在以下,设想第一机器20-1是av接收器、第二机器20-2是电视接收机、且第三机器20-3是蓝光光盘播放器的例子。第二机器20-2经由hdmi(高清多媒体接口(high-definitionmultimediainterface):注册商标)线缆连接到第一机器20-1的第一hdmi端子(hdmi1),第三机器20-3经由hdmi线缆连接到第一机器20-1的第二hdmi端子(hdmi2)。此外,私有ip地址“192.168.0.2”、“192.168.0.3”、“192.168.0.4”分别被设定给第一机器20-1、第二机器20-2、第三机器20-3。

如图1所示,第一机器20-1包括控制部21、存储部22、以及通信部23。控制部21包括至少一个微处理器(cpu),根据在存储部22中存储的程序而执行处理。存储部22包括主存储部(例如ram)以及辅助存储部(例如,非易失性的半导体存储器、或者硬盘驱动器)。存储部22用于存储程序或数据。通信部23用于在与其他装置之间发送接收数据。在图1中被省略,但是第二机器20-2以及第三机器20-3还包括控制部21、存储部22、以及通信部23。

另外,机器20也可以具有用于读取在信息存储介质(例如光盘或者存储卡等)中存储的程序或数据的结构(例如光盘驱动器或者存储卡插槽等)。并且,程序也可以经由信息存储介质而提供给机器20。程序也可以经由互联网6而提供给机器20。

语音输入装置30包括麦克风,受理语音输入。在本实施方式中,为了用户语音输入对机器20的动作指示而使用语音输入装置30。例如,在希望经由x公司提供的命令处理系统50使设置于客厅的机器20从待机状态启动的情况下,用户将“aaa叫mc打开起居室”(aaaaskmctoturnonthelivingroom)等输入给语音输入装置30。这里,“aaa”是用于开始对于语音输入装置30的语音输入的单词(唤醒词(wakeword)),例如是语音输入装置30的名称,“mc”是命令处理系统50的名称。

表示输入给语音输入装置30的语音(短语)的语音数据与用户id一起经由互联网6发送给语音识别装置40。语音识别装置40例如由服务器计算机实现。语音识别装置40也可以通过所谓的云计算由多个服务器实现。语音识别装置40通过执行语音识别处理将语音数据转换为程序(命令处理系统50)容易理解的形式的数据。例如,语音识别装置40从短语的语音数据生成规定形式的动作指示,该规定形式的动作指示包含表示该用户的指示的种类和指示的对象的字符串。并且,动作指示与用户id一起发送给命令处理系统50。另外,也可以是,在直到语音数据被发送给命令处理系统50为止的期间,通过任一个互联网侧的装置(处理)来赋予用户id。

这里,语音识别装置40能够基于从用户发送的语音的内容、例如短语中的特定的单词组而对能够处理该短语的内容的命令处理系统50发送动作指示。用户将希望利用的命令处理系统50事先注册到语音识别装置40中。语音识别装置40基于从用户输入的短语中的单词,选择所注册的命令处理系统50之中的其中一个,向所选择的命令处理系统50发送动作指示。此外,语音识别装置40也可以对特定的机器20受理多个种类的短语,经由与种类相应的命令数据发送装置10来控制机器20。例如,根据短语的种类,短语中的指示的语句的格式不同。

例如,在短语的第一种类中,使名称为“起居室”(livingroom)的机器20启动的短语是“aaa叫mc打开起居室”(aaaaskmctoturnonthelivingroom),在短语的第二种类中,使该机器20启动的短语是“aaa打开起居室”(aaaturnonthelivingroom)。在第一种类中,短语包含用于识别命令处理系统50的名称、即“mc”,但是在第二种类中,短语不包含该名称。关于语音识别装置40是受理第一种类的短语并发送动作指示还是受理第二种类的短语并发送动作指示,由用户进行设定。该设定的细节将后述。语音识别装置40受理第一种类的短语时成为发送目标的命令处理系统50也可以与第二种类不同。

用户终端60受理用户进行的触控操作等物理操作而控制机器20。此外,用户终端60基于用户的操作进行命令处理系统50或语音识别装置40的设定。用户终端60例如是智能电话或个人计算机。用户终端60包括控制部61、存储部62、以及通信部63。控制部61、存储部62、通信部63与控制部21、存储部22、以及通信部23相同。

如图1所示,命令处理系统50包括命令数据发送装置10、数据库52、以及mqtt(消息队列遥测传输(messagequeueingtelemetrytransport))服务器53。

数据库52存储各种数据。例如,数据库52存储各用户拥有的机器20的信息。图2表示在数据库52中存储的机器表格的一例。机器表格t1被按每个用户(与用户id关联地)进行存储。另外,在命令处理系统50(数据库52)、用户终端60以及机器20中使用的用户id可以与在语音输入装置30以及语音识别装置40中使用的用户id不同,也可以相同。在这些用户id不同的情况下,用于转换这些用户id的对应关系数据被存储在命令处理系统50或者语音识别装置40中。

如图2所示,机器表格t1包含“id”、“名称”、“机器id”、“ip地址”、“命令种类”、“端子”、“连接目标”、“能否接收”、“能够受理的命令”字段。

“id”字段表示对用户拥有的各机器20唯一地进行识别的信息。在图2中,第一机器20-1相当于机器id“1”,第二机器20-2相当于机器id“2”。

“名称”字段表示机器20的名称。该名称用于用户对动作指示的对象的机器20进行指定。作为名称,可以使用由用户设定的任意的名称,也可以例如使用由机器20的制造商等设定的初始名称而能够由用户进行修正。

“机器id”字段是仅通过它来唯一地确定机器20的机器id。机器id可以是机器20的mac地址,也可以是基于mac地址而生成的id。“ip地址”字段表示对机器20具有的有线或者无线网络接口卡设定的ip地址。“命令种类”字段表示在机器20中使用的命令的种类(体系)。“端子”字段表示机器20具有的输入端子的列表。“连接目标”字段表示在机器20连接到其他机器20的输入端子且从机器20输出的语音被输入给其他机器20的情况下机器20所连接的其他机器20的输入端子。

“能否接收”字段表示能否经由互联网6接收包含命令的消息。关于消息将后述。例如,“0”或者“1”被注册到“能否接收”字段中。“0”表示无法经由互联网6接收消息,“1”表示能够经由互联网6接收消息。

“能够受理的命令”字段表示机器20能够受理的命令的列表。若在“能够受理的命令”字段的列表中设定了“电源”(power),则表示该机器能够基于来自外部的命令而从待机状态启动,若没有设定“电源”则表示无法从待机状态启动。此外,若在“能够受理的命令”字段的列表中设定了“音量”(volume),则表示该机器能够基于来自外部的命令而控制音量,若没有设定“音量”则表示无法控制音量。

机器表格t1的数据由各用户进行注册。用户通过从用户终端60访问命令数据发送装置10,能够将自己拥有的机器20的信息注册到机器表格t1中。

关于注册的细节将后述。

另外,在数据库52中还存储机器表格t1以外的数据。例如,在数据库52中,用户和用于机器20而表示该用户能够输入的短语的种类的数据被关联地存储。此外,也可以将表示动作指示和命令的对应关系的数据(换言之,用于将动作指示转换为命令的数据)存储到数据库52中。

命令数据发送装置10例如由服务器计算机实现。如图1所示,命令数据发送装置10包括控制部11、存储部12、以及通信部13。控制部11、存储部12、以及通信部13与控制部21、存储部22、以及通信部23相同。另外,命令数据发送装置10也可以具有用于读取在信息存储介质(例如光盘或者存储器卡等)中存储的程序或数据的结构要素(例如光盘驱动器或者存储卡插槽等)。并且,程序也可以经由信息存储介质而提供给命令数据发送装置10。程序也可以经由互联网6而提供给命令数据发送装置10。

命令数据发送装置10能够访问数据库52。命令数据发送装置10和数据库52可以由一个服务器计算机实现,也可以由不同的服务器计算机实现。

命令数据发送装置10受理从语音识别装置40发送的对于机器20的动作指示,基于该动作指示生成包含命令的消息,将该消息向该机器20发送。更具体而言,消息被经由mqtt服务器53向机器20发送。mqtt服务器53用于使用mqtt协议来发送接收数据。命令数据发送装置10和mqtt服务器53可以由一个服务器计算机实现,也可以由不同的服务器计算机实现。

[2.功能块]图3是表示由命令数据发送装置10、机器20以及用户终端60实现的功能的框图。

如图3所示,命令数据发送装置10包括动作指示受理部110、消息生成部120、消息发送部130、机器信息获取部140、语音利用注册部150、机器注册部160、以及注册结果发送部170。动作指示受理部110、消息生成部120、消息发送部130、机器信息获取部140、语音利用注册部150、机器注册部160、以及注册结果发送部170通过由控制部11执行在存储部12中储存的各功能的程序而被实现。

此外,如图3所示,机器20包括消息接收部210、命令执行部220、机器信息发送部230以及设定部260。消息接收部210、命令执行部220、机器信息发送部230以及设定部260通过由控制部21执行在存储部22中储存的各功能的程序而被实现。

此外,如图3所示,用户终端60包括注册控制部610、设定获取部620、短语生成部630、短语输出部640。注册控制部610、设定获取部620、短语生成部630、短语输出部640通过由控制部61执行在存储部62中储存的各功能的程序而被实现。

[2-1]首先,对动作指示受理部110、消息生成部120、消息发送部130、消息接收部210、以及命令执行部220进行说明。

动作指示受理部110受理对于机器20的动作指示。例如,动作指示受理部110从语音识别装置40接收由语音识别装置40转换为文本数据等对于程序而言能够理解的形式的数据的动作指示。

在动作指示受理部110接收到对于机器20的动作指示的情况下,消息生成部120生成包含用户id和命令的消息。该用户id用于确定动作指示涉及的用户。命令是用于进行与动作指示相应的动作的文本等数据。

图4是表示消息d1的一例的图。图4所示的消息d1是在受理了动作指示的情况下所生成的消息的一例,该动作指示表示从待机状态启动第一机器20-1的意思。

消息d1包含条目“uid”、“type”(类型)、“id”、“command”(命令)。条目“uid”表示进行了动作指示的用户的用户id。在图4所示的例子中,用户id“u1”被设定给条目“uid”。条目“type”(类型)表示数据的类别。在图4所示的例子中,“cmd”被设定给条目“type”(类型)。这表示在消息中包含命令。条目“id”表示能够对消息唯一地进行识别的识别信息。在条目“command”(命令)中设定的数据表示命令的内容。条目“command”(命令)包括条目“ip”、“path”(路径)、“method”(方式)。条目“ip”表示命令的目标地址。在图4的例子中第一机器20-1的ip地址被设定给条目“ip”。条目“path”(路径)相当于命令本体。条目“method”(方式)表示所使用的http协议的方式。

消息发送部130向机器20发送由消息生成部120生成的消息。另外,在成为动作指示的对象的机器20无法经由互联网6接收消息的情况(在“能否接收”字段中被设定了“0”的情况)下,消息发送部130也可以向其他机器20发送消息,并使该其他机器20向作为对象的机器20转发消息的内容。

消息被使用mqtt协议向机器20发送。换言之,消息发送部130经由mqtt服务器53向机器20发送消息。在mqtt服务器53中存在多个主题(topic)。各个主题的识别信息基于机器20的机器id而被设定。在从命令数据发送装置10向机器20发送时,命令数据发送装置10向具有与机器id相应的识别信息的请求侧的主题发布消息,机器20获取对具有该识别信息的请求侧的主题所发布的消息。另外,也可以通过与mqtt协议不同的协议进行命令处理系统50和机器20之间的通信。

消息接收部210经由互联网6接收消息。命令执行部220基于消息中包含的命令来执行命令。命令执行部220也可以直接解释消息中包含的命令而直接控制机器20。此外,命令执行部220也可以具有:内部执行部,执行从位于本地区域的用户终端60等经由lan2接收的命令;以及转换部,转换接收到的消息中包含的命令,在内部向该内部执行部发送转换后的命令。例如,机器20使http守护进程(daemon)启动,内部执行部从转换部经由http协议受理命令即可。

[2-2]接着,对注册控制部610、设定获取部620、短语生成部630、短语输出部640、语音利用注册部150、机器注册部160、注册结果发送部170、设定部260的概要进行说明。

注册控制部610使得能够由语音识别装置40受理用户的第一种类以及第二种类之中至少一方的短语,并向命令处理系统50发送动作指示。更具体而言,注册控制部610使语音识别装置40以及命令处理系统50关于该用户执行利用注册的处理。此外,注册控制部610基于用户的操作将成为语音输入所指示的对象的机器20注册到命令处理系统50中。

设定获取部620检测连接到本地区域的机器20,从检测到的机器20获取机器20的语音输入中的包含机器20的名称在内的机器信息。此外,设定获取部620从注册控制部610或者命令处理系统50获取表示语音识别装置40能够受理的短语的种类的信息。将机器信息或表示短语的种类的信息汇总而在以下记载为用户设定。其理由在于,语音输入中的机器20的名称、或能够利用的短语的种类是能够由用户进行设定的条目。另外,在由设定获取部620检测到多个机器20的情况下,注册控制部610例如将检测到的机器20之中由用户指定的1个或者多个机器20作为成为语音输入所指示的对象的机器20进行注册。

语音利用注册部150从用户终端60的注册控制部610接收用户注册基于语音输入的命令处理系统50的利用的请求(利用注册请求),执行用于由命令数据发送装置10和语音识别装置40协作而实现该用户进行的语音输入的处理。

机器注册部160从用户终端60的注册控制部610接收注册成为语音输入所指示的对象的机器20的请求(机器注册请求),将该机器20作为语音输入的对象进行注册。注册结果发送部170发送机器20的注册的结果(机器注册结果)和样本短语的模板。

设定部260从用户终端60的注册控制部610接收用户id注册指示,将该用户id注册指示中包含的用户id写入非易失性存储器中。此外,设定部260从用户终端60的注册控制部610接收连接开始指示,使得连接到命令处理系统50中包含的mqtt服务器53,从而能够进行来自命令处理系统50的接收。

短语生成部630基于由设定获取部620获取的用户设定,生成能够控制机器20的短语。短语输出部640输出使所生成的短语显示的数据。短语输出部640通过输出该数据,在用户终端60的显示画面等用户能够进行视觉确认的设备上显示所生成的短语。

[2-3]接着,对机器信息获取部140以及机器信息发送部230进行说明。

机器信息获取部140获取机器20的机器信息。机器信息获取部140生成消息(在以下记载为“机器信息请求”),将该消息经由互联网6向机器20发送。机器信息请求包含用于使机器20向机器信息获取部140发送该机器20的机器信息的命令、以及用户id。更具体而言,机器信息获取部140经由mqtt服务器53向机器20发送机器信息请求。另外,机器信息请求的生成以及发送也可以由消息生成部120以及消息发送部130执行。

若机器信息请求被接收到,则机器信息发送部230经由互联网6向命令数据发送装置10返回机器20的机器信息。机器信息例如包含机器20的机型信息、用户确定机器20的名称、机器id、ip地址。此外,机器信息也可以包含表示机器20的当前状态的当前信息。另外,机器信息发送部230经由mqtt服务器53向命令数据发送装置发送机器信息。机器信息获取部140接收机器信息。并且,机器信息获取部140提取接收到的机器信息之中必要的条目,并将这些条目注册到机器表格t1中。

[3.处理]对机器控制系统1执行的处理进行说明。

[3-1]首先,对语音输入的利用注册的处理进行说明。语音输入的利用注册的处理包括:使语音识别装置40关于用户能够受理1个或者多个种类的短语而发送动作指示的处理;以及对使命令处理系统50能够受理该动作指示的信息进行注册的处理。在用户进行基于语音输入的命令处理系统50的利用之前,需要进行该处理。

在以下,关于第一种类的短语,对进行利用注册的处理的例子进行说明。另外,关于第二种类的短语,也通过与以下相同的处理进行注册即可。图5是表示语音输入的利用注册的处理的一例的流程图。以下记载的、语音利用注册部150进行的处理通过由控制部11执行该功能的程序来执行。注册控制部610进行的处理通过由控制部61执行该功能的程序来执行。

首先,在由用户指示了利用注册的处理的开始的情况下,用户终端60的注册控制部610向命令处理系统50发送利用注册请求(步骤s111)。此外,命令数据发送装置10的语音利用注册部150经由通信部13接收利用注册请求(步骤s121)。利用注册请求包含由用户直接地或者间接地指定的表示受理语音输入的语音识别装置40以及处理动作指示的命令处理系统50的信息。此外,注册控制部610发送用户的认证信息(步骤s112),语音利用注册部150经由通信部13接收用户的认证信息(步骤s122)。从用户终端60发送的认证信息例如也可以是用户id以及密码。此外,也可以是,在存在与命令处理系统50不同的认证服务器的情况下,注册控制部610将注册控制部610通过对认证服务器输入由用户输入的用户的识别信息和密码而从认证服务器获取到的访问许可信息(令牌的一种)作为认证信息发送。在该情况下,注册控制部610使用访问许可信息从认证服务器获取用户id即可。另外,这里输入的用户id和在命令处理系统50和机器20中利用的用户id也可以不同。例如,语音利用注册部150也可以生成认证信息中包含的用户id的哈希值作为在后续的处理中利用的用户id。

若获取到认证信息,则语音利用注册部150进行以下设定:由语音识别装置40受理基于来自用户的第一种类的短语的语音输入;以及由语音识别装置40关于第一种类的短语向命令处理系统50发送动作指示(步骤s123)。

并且,语音利用注册部150将语音输入的利用注册状况储存到数据库中(步骤s124)。图6是表示语音输入利用表格的一例的图。语音输入利用表格包含“用户id”、“第一种类注册”、“第二种类注册”字段。“用户id”成为对表格的记录唯一地进行识别的关键字(key)。“第一种类注册”表示关于“用户id”字段的用户是否进行了用于受理第一种类的短语的利用注册的处理。“第二种类注册”表示关于“用户id”字段的用户是否进行了用于受理第二种类的短语的利用注册的处理。

若语音输入的利用注册状况被储存到数据库中,则语音利用注册部150发送表示语音输入的利用注册是否成功的应答(步骤s125),注册控制部610接收利用注册应答(步骤s113)。

[3-2]接着,对基于用户的操作而将成为语音输入所指示的对象的机器20注册到命令处理系统50中的处理(注册处理)进行说明。图7是对机器注册的处理进行说明的时序图。图8是表示机器注册中的用户终端60的处理的例子的流程图。图9是表示机器注册中的机器20的处理的例子的流程图。图10是表示机器注册中的命令数据发送装置10的处理的例子的流程图。

机器注册部160、注册结果发送部170以及机器信息获取部140的处理通过由控制部11执行其功能的程序来进行。注册控制部610、设定获取部620、短语生成部630以及短语输出部640的处理通过由控制部61执行其功能的程序来进行。机器信息发送部230、设定部260的处理通过由控制部21执行其功能的程序来进行。

在以下,以基于图7的时序图的顺序,对用户终端60、命令数据发送装置10、机器20执行的注册处理进行说明。

首先,在从用户获取到机器注册开始的指示的情况下,用户终端60的注册控制部610经由通信部63向命令处理系统50发送利用注册确认请求(步骤s211)。利用注册确认请求更具体而言是语音识别装置40询问关于1个或者多个种类的短语是否进行了利用注册的信息。接着,命令数据发送装置10的机器注册部160接收利用注册确认请求,发送表示语音识别的利用注册的状况的利用注册确认应答(步骤s251)。更具体而言,机器注册部160关于进行了机器注册开始的指示的用户获取储存在语音输入利用表格中的记录,基于第一种类注册以及第二种类注册的字段的值,回答表示进行了利用注册的短语的种类的信息。另外,在利用注册确认应答中也可以包含表示正在操作用户终端60的用户的用户id的信息。用户终端60的注册控制部610接收利用注册确认应答,将表示进行了利用注册的短语的种类的信息等储存到存储部62中(步骤s212)。另外,关于用户,在用于操作机器20的任何种类的短语都没有进行利用注册的情况下,错误消息作为利用注册确认应答而被发送,注册控制部610对用户输出用于进行利用注册的画面。

设定获取部620若接收到利用注册确认应答,则检测连接到本地区域(lan2)的1个或者多个机器20,向检测到的1个或者多个机器20发送机器信息请求(步骤s213)。机器20的机器信息发送部230接收机器信息请求,向用户终端60发送机器信息(步骤s221)。机器信息包含由用户设定的机器的名称以及机器id。用户终端60的设定获取部620接收所发送的机器信息(步骤s214)。

若接收到机器信息,则注册控制部610对检索到的机器20发送用户id注册指示(步骤s215)。机器20的设定部260接收用户id注册指示(步骤s222)。用户id注册指示包含想要注册到机器20中的用户id的信息。此外,若用户id注册指示被接收到,则设定部260将用户id写入非易失性存储器(步骤s223)。

若用户id被写入,则用户终端60的注册控制部610对检索到的机器发送向mqtt服务器的连接开始指示(步骤s216)。机器20的设定部260接收向mqtt服务器53的连接开始指示(步骤s224)。并且,设定部260向mqtt服务器53连接(步骤s225),设为能够从mqtt服务器53接收动作指示的状态。

若机器20向mqtt服务器53连接,则用户终端60的注册控制部610向命令处理系统50(命令数据发送装置10)发送机器注册请求(步骤s217)。机器注册请求包含用户id、以及所要注册的机器20的机器id。命令数据发送装置10从用户终端60接收机器注册请求(步骤s252)。另外,在机器注册请求中也可以取代用户id而包含向认证服务器的访问许可信息。在该情况下,命令数据发送装置10也可以使用访问许可信息从认证服务器获取成为用户id或者用户id的基础的信息。

并且,机器注册部160向具有机器注册请求中包含的机器id的机器20发送机器信息请求(步骤s253)。机器信息发送部230从命令处理系统50(mqtt服务器53)接收机器信息请求,向命令处理系统50发送机器信息(步骤s226)。机器注册部160接收机器信息(步骤s254)。机器信息包含:表示命令的体系的信息、具有的输入端子的信息、连接到输入端子的其他机器20的信息、表示是否能够经由互联网6接收消息的信息、机器20能够受理的命令的列表。机器注册部160将接收到的机器信息之中的至少一部分(包含机器id)与用户id进行关联并储存到数据库的机器表格t1中(步骤s255)。另外,机器注册部160也可以对机器信息中包含的信息进行取舍选择以及整形,并储存到机器表格t1中。

若机器注册部160完成步骤s255为止的处理,则注册结果发送部170基于语音输入的利用注册状况,换言之基于语音识别装置40关于用户能够受理的短语的种类,选择样本短语的模板(步骤s256)。此外,机器注册部160向用户终端60发送表示机器的注册是否已成功的机器注册结果、以及所选择的样本短语的模板(步骤s257)。

图11是表示样本短语的模板的一例的图。样本短语(samplephrase)是用户通过语音输入能够控制机器20的短语。图11示出关于第一种类以及第二种类的短语进行了利用注册的情况的例子。第一模板tp1包括第一种类的短语的样本的模板,第二模板tp2包括第二种类的短语的样本的模板。样本的文本是设定到“sentence”(句子)条目中的字符串。由于机器的名称能够由用户设定而无法事先准备,所以在样本的文本中嵌入临时字符串“%s”。设定在“feature”(特征)条目中的字符串表示成为操作对象的机器20所具有的必要的命令。

短语生成部630从命令处理系统50(命令数据发送装置10)接收对于机器注册请求的处理的结果、以及样本短语的模板(步骤s218)。短语生成部630基于接收到的模板、以及作为用户设定的利用注册的状况以及机器的名称,来生成样本短语,短语输出部640输出所生成的样本短语(步骤s219)。

在以下,对短语生成部630以及短语输出部640的处理进一步进行详细说明。图12是表示短语生成部630以及短语输出部640的处理的例子的流程图。

首先,短语生成部630选择能够执行样本短语所需的命令的机器20,获取所选择的机器20的名称(步骤s311)。短语生成部630例如收集被设定在模板的“feature”(特征)条目中的命令,此外,在储存在机器表格t1中的与某个用户有关的记录之中,选择存在被收集在能够受理的命令的字段中的全部命令的记录,获取该记录中包含的机器的名称。

接着,短语生成部630进行与用户设定(表示进行了利用注册的短语的种类的信息以及机器的名称)相应的处理。更具体而言进行以下的处理。首先,短语生成部630判定表示进行了利用注册的短语的种类的信息是否表示能够受理第一种类的短语的状态(步骤s312)。在表示能够受理第一种类的短语的状态的情况下(步骤s312的“是”),短语生成部630通过将第一模板tp1的语句之中机器名的部位替换为所选择的机器的名称,从而生成样本短语(步骤s313)。并且,短语输出部640输出样本短语的数据,以使所生成的样本短语显示于用户终端60的画面(步骤s314)。这里,在表示进行了利用注册的短语的种类的信息不表示能够受理第一种类的短语的状态的情况下(步骤s312的“否”),跳过步骤s313以及s314的处理。

图13是表示所显示的样本短语的一例的图。图13的例子是在被设定为能够受理第一种类的短语的情况下基于第一模板tp1而显示的画面的一例。由于名称“livingroom”(起居室)的机器20能够处理音量操作的命令,所以被作为样本短语输出。

接着,短语生成部630判定表示进行了利用注册的短语的种类的信息是否表示能够受理第二种类的短语的状态(步骤s315)。在表示能够受理第二种类的短语的状态的情况下(步骤s315的“是”),短语生成部630通过将第二模板tp2的语句之中机器名的部位置换为所选择的机器的名称,从而生成样本短语(步骤s316)。并且,短语输出部640输出样本短语的数据,以使所生成的样本短语显示于用户终端60的画面(步骤s317)。这里,在表示进行了利用注册的短语的种类的信息不表示能够受理第二种类的短语的状态的情况下(步骤s315的“否”),跳过步骤s316以及s317的处理。

图14是表示所显示的样本短语的另一例的图。图14的例子是在被设定为能够受理第二种类的短语的情况下基于第二模板tp2而显示的画面的一例。

这样,通过动态地控制作为命令的输入例而示出的样本短语,用户能够容易且可靠地得到在语音输入中能够受理的样本短语。此外,通过在样本短语的生成中还利用用户设定,从而即使在所受理的短语根据用户而发生变化的情况下,用户也无需替换样本短语的文本。由此,用户能够容易地识别所受理的正确的样本短语。

[3-3]在以下,对命令处理系统50受理动作指示而控制机器20的处理进行说明。图15是表示动作指示受理部110、消息生成部120、消息发送部130、消息接收部210、命令执行部220的处理的一例的流程图。在以下记载的、动作指示受理部110、消息生成部120、消息发送部130的处理通过由控制部11执行其功能的程序来执行。消息接收部210、命令执行部220的处理通过由控制部21执行其功能的程序来执行。

首先,动作指示受理部110从语音识别装置40获取动作指示(步骤s511)。并且,消息生成部120基于获取到的动作指示,获取成为动作指示的对象的用户的用户id,基于动作指示中包含的机器的名称和机器表格t1,获取与用户id进行了关联的机器id且是成为动作指示的对象的机器20的机器id(步骤s512)。并且,消息生成部120生成包含与动作指示对应的命令以及获取到的用户id的消息(步骤s513),消息发送部130向成为动作指示的对象的机器20发送所生成的消息(步骤s514)。

成为动作指示的对象的机器20的消息接收部210接收消息(步骤s521)。接着,消息接收部210对消息中包含的用户id和被写入在机器20的非易失性存储器中的用户id进行比较(步骤s522)。在这些用户id相同的情况下(步骤s522的“是”),命令执行部220执行消息中包含的命令(步骤s523)。另一方面,在这些用户id不同的情况下(步骤s522的“否”),这些消息被丢弃,消息中的命令不会被执行。

如上述,消息接收部210基于用户id的比较结果来控制是否执行命令。由此,能够防止机器20的非预期的动作。特别地,在机器20已被转让而在命令处理系统50侧机器注册未被解除的情况下,在转让的用户错误地语音输入了对于机器20的命令的情况下,在以往,有机器20根据该命令进行错误动作的顾虑。另一方面,在本实施方式中,由于若受让的用户进行机器注册,则不论转让的用户输入怎样的命令,在机器20侧包含该命令的消息都会被丢弃,所以能够抑制进行非预期的动作的可能性。

[附记]根据关于以上说明的实施方式的记载能够掌握,在本说明书中公开了包含以下记载的发明的多样的技术思想。

本发明的机器控制系统包括:设定获取单元,获取与设备有关的用户设定;短语生成单元,基于所获取的所述用户设定,生成能够控制所述设备的短语;以及显示数据输出单元,输出使所生成的所述短语显示的数据。

本发明的机器控制方法包括:获取与设备有关的用户设定的步骤;基于所获取的所述用户设定,生成能够控制所述设备的短语的步骤;以及输出使所生成的所述短语显示的数据的步骤。

本发明的程序使计算机作为下述单元发挥功能,即:设定获取单元,获取与设备有关的用户设定;短语生成单元,基于所获取的所述用户设定,生成能够控制所述设备的短语;以及显示数据输出单元,输出使所生成的所述短语显示的数据。

在上述发明的一方式中,也可以是,所述设定获取单元在语音输入中获取用于确定所述设备的名称,所述短语生成单元基于所获取的所述名称而生成能够控制所述设备的短语。

在上述发明的一方式中,也可以是,所述设定获取单元在语音输入中获取多个设备各自能够执行的命令,所述短语生成单元基于所述多个设备各自能够执行的命令,生成包含所述多个设备的名称之中的其中一个的短语。

在上述发明的一方式中,也可以是,所述设定获取单元获取表示对用户的指示语音进行识别的识别部作为对于所述设备的指示而能够受理的短语的种类的信息,所述短语生成单元基于所获取的所述信息而生成能够控制所述设备的短语。

在上述发明的一方式中,也可以是,所述识别部由用户进行设定,以使能够受理包含对系统进行识别的识别名称的第一种类的短语、以及不包含所述识别名称的第二种类的短语中的其中一个,其中,所述系统是获取由该识别部生成的动作指示而控制所述设备的系统,所述短语生成单元基于是否能够受理第一类别以及第二类别的短语中的各个而生成能够控制所述设备的短语。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1