多设备协同控制装置、多设备协同控制方法及多设备协同控制程序,以及学习装置、学习方法及学习程序与流程

文档序号:26007803发布日期:2021-07-23 21:27阅读:77来源:国知局
多设备协同控制装置、多设备协同控制方法及多设备协同控制程序,以及学习装置、学习方法及学习程序与流程

本发明涉及对被连接至网络的多个设备进行协同控制的多设备协同控制装置、多设备协同控制方法及多设备协同控制程序,以及学习装置、学习方法及学习程序。



背景技术:

如今,iot(internetofthings:物联网)正在持续快速地扩大,多种多样且数量巨大的设备被连接至网络。存在2020年将有500亿台设备被连接至网络这样的预测,今后在家庭或工厂、街头等各种环境中会设置越来越多的设备,能预想到利用了这些设备的多种多样的iot服务的出现。iot服务通过使照相机、温度计这样的传感器、扬声器、灯(照明装置)、显示器这样的执行器等多种的设备根据服务环境进行协同动作而被实现。服务业者需求在提供高品质且廉价的iot服务时,能迅速且简单地构建伴随着多个设备的协同的复杂的系统。

作为使存在于现实空间的多个设备协同的现有技术,已知r-env(连舞)(注册商标)这样的技术(参照非专利文献1)。非专利文献1所记载的技术提供了在设备协同服务的开发时所需求的设备间的接口差分的吸收功能、协作场景的设计gui(graphicaluserinterface:图形化用户界面)工具,减轻了开发者的负担。

现有技术文献

非专利文献

非专利文献1:松元崇裕,其他5名,《“r-env:连舞tm”云对应型交互控制技术》,一般社团法人人工智能学会,2016年度人工智能全国大会(第三十次),人工智能学会全国大会论文集,1i4-nfc-02b-1,2016年6月



技术实现要素:

发明所要解决的问题

然而,对于伴随着设备的协同动作而控制各个设备的逻辑(控制逻辑),即使使用了非专利文献1所记载的技术,依然需要由人工实现的设计、事先的调整。控制逻辑是指与设置于环境内的装置(例如照明装置、空调装置等)分别对应的,控制更具体的输出值、输出条件的规则(处理内容)。

在使用配置于物理空间的设备的iot服务中,由人工设计、调整这样的每个设备的输出值的负担大。其原因是根据设备的设置场所可以发挥作用的区域、效果不同,因此与实际设置了设备的环境对应的最合适的控制量不同。

此外,存在于生活环境的各种外部扰乱(扰乱控制这样的外部作用)也使得事先调整困难。例如会发生黑暗而无法获取图像,因噪音使扬声器的声音无法适当地传递至对象这样的情况。在假定某种状况的基础上,对各装置构建最合适的控制逻辑非常费工作量。

在由非专利文献1所示的技术实现的iot服务的构建中,需要直接目视确认设备设置场所,并且设计、构建包括使设备协同的控制逻辑的整体系统。因此,在迅速且低成本地提供iot服务时谋求消除这样的工作量。

本发明是鉴于这点而完成的,本发明的目的在于根据服务目的和实时的状况,自动且适当地控制设置于物理空间的多种多样的设备。

用于解决问题的方案

为了解决所述的问题,实施方案1所记载的发明是一种多设备协同控制装置,控制配置于同一物理空间上的多个执行器设备,其特征在于,具备:服务充足度计算部,从所述配置于同一物理空间上的一个以上传感器设备获取与该物理空间相关的规定的信息来作为传感器信息,将获取到的所述传感器信息所表示的值转换为服务充足度,该服务充足度即表示关于由所述执行器设备的控制实现的规定服务的目的达成程度的指标;目标控制量计算部,在进行了机器学习的学习装置中,将所述转换得到的服务充足度作为输入值,执行所述学习装置的运算处理,由此获取每个所述执行器设备的执行器控制量来作为输出值,所述机器学习以如下方式进行:当输入所述服务充足度时,输出会满足目标服务充足度的每个所述执行器设备的执行器控制量,其中,所述目标服务充足度表示设为每种所述规定服务的目标的服务充足度;以及执行器控制部,将作为所述输出值得到的执行器控制量转换为与所述执行器设备分别对应的控制命令并分别发送至该执行器设备,由此执行控制命令。

此外,实施方案4所记载的发明是一种多设备协同控制方法,是控制配置于同一物理空间上的多个执行器设备的多设备协同控制装置的多设备协同控制方法,其特征在于,所述多设备协同控制装置执行以下步骤:从所述配置于同一物理空间上的一个以上传感器设备获取与该物理空间相关的规定的信息来作为传感器信息,将获取到的所述传感器信息所表示的值转换为服务充足度,该服务充足度即表示关于由所述执行器设备的控制实现的规定服务的目的达成程度的指标;在进行了机器学习的学习装置中,将所述转换得到的服务充足度作为输入值,执行所述学习装置的运算处理,由此获取每个所述执行器设备的执行器控制量来作为输出值,所述机器学习以如下方式进行:当输入所述服务充足度时,输出会满足目标服务充足度的每个所述执行器设备的执行器控制量,其中,所述目标服务充足度表示设为按每种所述规定服务的目标的服务充足度;以及将作为所述输出值得到的执行器控制量转换为与所述执行器设备分别对应的控制命令并分别发送至该执行器设备,由此执行控制命令。

通过这样设置,多设备协同控制装置能从各传感器设备获取传感器信息并计算出服务充足度,将该服务充足度作为输入值,通过学习装置计算出执行器控制量来作为输出值。然后,多设备协同控制装置将作为输出值得到的执行器控制量转换为与执行器设备分别对应的控制命令并分别发送至该执行器设备,由此执行控制命令。因此,能与服务目的和实时的状况对应地自动且适当地控制设置于物理空间的多种多样的执行器设备。

实施方案2所记载的发明根据实施方案1所记载的多设备协同控制装置,其特征在于,还具备:控制量调整部,调整每个所述执行器设备的执行器控制量,所述服务充足度计算部在所述执行器设备执行了所述控制命令之后,还从所述一个以上传感器设备获取所述传感器信息,将该传感器信息所表示的值计算为试行后的服务充足度,所述控制量调整部在试行后的服务充足度小于所述目标服务充足度的情况下,应用使用了偏离度的演化策略算法来计算调整控制量,其中,所述偏离度是表示在当前时间点得到的试行后的服务充足度与所述目标服务充足度的偏离程度的指标,使用计算出的调整控制量和成为调整当前时间点的执行器控制量的基准的执行器调整基准量来计算调整后的执行器控制量,并且在所述试行后的服务充足度大于试行之前的服务充足度的情况下,用所述当前时间点的执行器控制量更新所述执行器调整基准量,所述执行器控制部将该调整后的执行器控制量转换为与所述执行器设备分别对应的控制命令并分别发送至该执行器设备,由此执行控制命令。

通过这样设置,多设备协同控制装置即使在试行后的服务充足度小于目标服务充足度的情况下,也能应用使用了试行后的服务充足度与目标服务充足度的偏离度的演化策略算法来计算调整控制量,计算调整后的执行器控制量。因此,多设备协同控制装置即使在由仅利用配置于物理空间的传感器设备无法网罗的环境要因、学习数据不充分等使试行后的服务充足度小于目标服务充足度的情况下,也能适当地调整执行器控制量。

实施方案3所记载的发明根据实施方案2所记载的多设备协同控制装置,其特征在于,所述控制量调整部在试行后的服务充足度大于所述目标服务充足度的情况下,计算作为与试行后的多个所述执行器设备的控制相关的规定指标的成本,应用使用了偏离度的演化策略算法来计算调整控制量,其中,所述偏离度是表示在当前时间点得到的试行后的服务充足度与所述目标服务充足度的偏离程度的指标,使用计算出的调整控制量和成为调整当前时间点的执行器控制量的基准的执行器调整基准量来计算调整后的执行器控制量,并且在所述试行后的成本小于试行之前的成本的情况下,用所述当前时间点的执行器控制量更新所述执行器调整基准量,所述执行器控制部将该调整后的执行器控制量转换为与所述执行器设备分别对应的控制命令并分别发送至该执行器设备,由此执行控制命令。

通过这样设置,多设备协同控制装置能在试行后的服务充足度大于目标服务充足度的情况下,调整执行器控制量以使与执行器设备的控制相关的成本更低。

实施方案5所记载的发明是一种多设备协同控制程序,用于使计算机作为实施方案1至实施方案3中任一项所记载的多设备协同控制装置发挥功能。

通过这样设置,能使用一般的计算机实现权利要求1至权利要求3中任一项所记载的多设备协同控制装置的各功能。

实施方案6所记载的发明是一种学习装置,其特征在于,具备:学习部,获取将从配置于同一物理空间上的一个以上传感器设备获取到的传感器信息计算为服务充足度的信息和所述一个以上传感器设备获取到所述传感器信息的时间点的所述执行器设备的执行器控制量来作为学习数据,其中,所述服务充足度是表示关于由该配置于同一物理空间上的多个执行器设备的控制实现的规定服务的目的达成程度的指标,以如下方式进行机器学习:当输入所述服务充足度时,输出会满足目标服务充足度的每个所述执行器设备的执行器控制量,其中,所述目标服务充足度表示设为每种所述规定服务的目标的服务充足度。

此外,实施方案7所记载的发明是一种学习方法,其特征在于,使学习装置执行以下步骤:获取将从配置于同一物理空间上的一个以上传感器设备获取到的传感器信息计算为服务充足度的信息和所述一个以上传感器设备获取到所述传感器信息的时间点的所述执行器设备的执行器控制量来作为学习数据,其中,所述服务充足度是表示关于由该配置于同一物理空间上的多个执行器设备的控制实现的规定服务的目的达成程度的指标;以及以如下方式进行机器学习:当输入所述服务充足度时,输出会满足目标服务充足度的每个所述执行器设备的执行器控制量,其中,所述目标服务充足度表示设为每种所述规定服务的目标的服务充足度。

通过这样设置,学习装置能将服务充足度作为输入值,输出会满足目标服务充足度的每个执行器设备的执行器控制量。因此,能与服务目的对应地适当地控制执行器设备。

实施方案8所记载的发明是一种学习程序,用于使计算机作为实施方案6所记载的学习装置发挥功能。

通过这样设置,能使用一般的计算机实现实施方案6所记载的学习装置的各功能。

发明效果

根据本发明,能与服务目的和实时的状况对应地自动且适当地控制设置于物理空间的多种多样的设备。

附图说明

图1是表示包括本实施方式的多设备协同控制装置的多设备协同控制系统的构成的图。

图2是表示构成本实施方式的目标控制量计算部的学习装置的功能块的图。

图3是表示本实施方式的服务充足度-执行器控制量对应信息的数据构成例的图。

图4是用于对使用了神经网络作为机器学习算法的情况的学习部的处理进行说明的图。

图5是表示本实施方式的控制量调整部所执行的执行器控制量的调整处理的流程的流程图。

图6是表示本实施方式的多设备协同控制装置所执行的处理的流程的流程图。

具体实施方式

接着,对用于实施本发明的方式(以下称为“本实施方式”。)进行说明。

图1是表示包括本实施方式的多设备协同控制装置1的多设备协同控制系统1000的构成的图。

多设备协同控制系统1000构成为包括:多设备协同控制装置1、一个以上传感器设备2(在图1中为两台传感器设备2)、一个以上执行器设备(在图1中为两台执行器设备3)。多设备协同控制装置1与各传感器设备2和各执行器设备3被通信连接而进行信息的收发。此外,各传感器设备2和各执行器设备3是存在于同一物理空间上(例如同一室内、同一施设内、同一区域内(公园内)等)的设备。

多设备协同控制装置1从存在于同一物理空间上的各传感器设备2获取物理空间信息(传感器信息),计算作为表示关于由执行器设备3的控制实现的规定服务的目的达成程度的指标的“服务充足度”。然后,多设备协同控制装置1输入服务充足度,通过机器学习(算法)输出以满足服务充足度的目标值的方式计算出的执行器控制量,基于输出的执行器控制量控制执行器设备3。此外,多设备协同控制装置1在通过计算出的执行器控制量对执行器设备3进行了控制(试行)后,计算试行后的服务充足度,计算与目标服务充足度(设为每种服务的目标的服务充足度)的偏离度,由此调整执行器控制量,实现执行器设备3的更适当的控制。需要说明的是,详细在后文加以记述。

<多设备协同控制装置>

接着,对本实施方式的多设备协同控制装置1进行具体说明。

多设备协同控制装置1由具备控制部、输入/输出部以及存储部(均省略图示)计算机实现。

输入/输出部包括:用于进行信息的收发的通信接口;以及在触摸面板或键盘等输入装置、显示器等输出装置之间进行信息的收发的输入/输出接口。

存储部包括闪存存储器或硬盘、ram(randomaccessmemory:随机存储器)等。如后述的图3所示,在该多设备协同控制装置1的存储部存储有服务充足度-执行器控制量对应信息150、设为每个服务的目标的服务充足度(目标服务充足度)等。

此外,如图1所示,控制部包括执行器控制量计算部10、服务充足度计算部12以及执行器控制部13。

服务充足度计算部12从各传感器设备2获取传感器信息作为与物理空间相关的规定的信息(物理空间信息),将该传感器信息所表示的值转换为作为表示服务目的达成程度的定量的值(指标)的“服务充足度”。以本实施方式中的多设备协同控制装置1为对象的服务被设定为达成某种目的。例如控制执行器设备3以便达成店铺的监视图像的视听(人物的面部认知(识别))、对顾客的舒适的环境的提供等服务目的。该情况的服务充足度例如在前者的店铺的监视图像的视听中为图像的清晰度,在后者的舒适的环境的提供中为将顾客的笑脸以数值化的值来表示。

服务充足度计算部12从设置于物理空间上的各传感器设备2实时(以规定的时间间隔)获取物理空间信息(传感器信息),使用该传感器信息计算作为与服务目的对应的指标值的服务充足度。该服务充足度例如被计算为0~100的范围的值。此外,在服务充足度计算部12中预先登记有能计算与设为目的的服务对应的服务充足度的指标值的软件(规定的逻辑)。例如在传感器设备2为照相机(拍摄装置)的情况下,服务充足度的计算处理使用一般的图像分析应用等公知的技术实现。

执行器控制部13从后述的执行器控制量计算部10接受执行器控制量(也称为“控制目标量”。),转换为与各个执行器设备3对应的控制命令,使执行器设备3进行动作。需要说明的是,各执行器设备3以始终从网络上的外部装置等接受对自身的控制命令的状态待机。

由执行器控制部13实现的从执行器控制量(控制目标量)向控制命令的转换逻辑(logic)不限定于特定的方法,但例如将控制目标量规定为0~100的范围,在实际的执行器设备3以0~256的分辨能力接受输出命令时,作为使它们线性对应的方法来实现。

执行器控制量计算部10从服务充足度计算部12接受基于各传感器设备2的传感器信息计算出的服务充足度的信息作为输入值,在执行器控制部13输出用于控制各执行器设备3的执行器控制量(控制目标量)作为输出值。

此外,执行器控制量计算部10在通过计算出的执行器控制量(控制目标量)对执行器设备3进行了控制(试行)后,获取试行后的服务充足度,基于该试行后的服务充足度与目标服务充足度的偏离度(详细在后文加以记述),调整执行器控制量。然后,执行器控制量计算部10通过将调整后的执行器控制量输出至执行器控制部13,对执行器设备3进行控制(试行)并进一步计算试行后的服务充足度,按每次试行反复进行调整,由此计算更适当的执行器控制量。详细内容参照后述的图6进行说明。

该执行器控制量计算部10构成为包括目标控制量计算部100(学习装置)和控制量调整部110。

目标控制量计算部100保持设为每种服务的目标的服务充足度(目标服务充足度)。然后,目标控制量计算部100作为构成将服务充足度作为输入值、将执行器控制量(控制目标量)作为输出值的机器学习模型的学习装置发挥功能。

图2是表示构成本实施方式的目标控制量计算部100的学习装置的功能块的图。

目标控制量计算部100(学习装置)具备:服务充足度获取部101、学习部102、执行器控制量输出部103以及服务充足度-执行器控制量对应信息150(参照图3)。

服务充足度获取部101在从服务充足度计算部12(图1)获取服务充足度的信息时,存储于服务充足度-执行器控制量对应信息150(图3)制作新的记录。

此外,执行器控制量输出部103将学习部102将服务充足度作为输入值计算出的执行器控制量(目标控制量)作为与输入值对应的输出值(执行器控制量)储存于服务充足度-执行器控制量对应信息150。然后,执行器控制量输出部103将该执行器控制量(目标控制量)输出至执行器控制部13(图1)。

图3是表示本实施方式的服务充足度-执行器控制量对应信息150的数据构成例的图。

如图3所示,在服务充足度-执行器控制量对应信息150中,按每个传感器设备2(在图3中为“传感器1”“传感器2”)储存服务充足度计算部12计算出的服务充足度的信息。在图3的例子中,在no.1的记录中,传感器1的服务充足度为“50”,传感器2的服务充足度为“70”。将该服务充足度作为输入值的学习部102输出的结果按每个各执行器设备3(在图3中为“执行器1”“执行器2”)储存为执行器控制量(目标控制量)。在图3的例子中,在no.1的记录中,执行器1的执行器控制量(目标控制量)储存为“30”,执行器2的执行器控制量(目标控制量)储存为“10”。

图3所示的传感器设备2(“传感器1”“传感器2”)和执行器设备3(“执行器1”“执行器2”)是配置于同一物理空间的设备。

若举出具体例子,则例如“传感器1”“传感器2”均为照相机(拍摄装置)。而且,在图3的服务充足度的“传感器1”的栏例如储存有与店铺的监视图像的视听中的图像的清晰度对应的服务充足度的值作为服务目的。在“传感器2”的栏例如储存有与向顾客提供舒适的环境对应的服务充足度的值作为服务目的。作为实现与该服务充足度对应的执行器控制量的设备,“执行器1”为例如灯(照明装置),“执行器2”为例如空调装置。在此,输出至各执行器设备3(在此“执行器1”和“执行器2”)的执行器控制量(目标控制量)作为考虑了基于各传感器设备2(在此为“传感器1”“传感器2”)的各(所有)服务充足度来调整后的值,基于学习部102的机器学习算法而被计算出。

需要说明的是,“传感器1”“传感器2”既可以是不同种类的设备,也可以像上述这样使相同种类的设备设置于同一物理空间内的不同位置。此外,“传感器1”“传感器2”也可以一起用于相同的服务目的。

对于“执行器1”“执行器2”,即可以是像上述这样不同种类的执行器设备3,也可以是同种类的执行器设备3。在同种类的执行器设备3(例如,照明装置)的情况下,各执行器设备3例如配置于同一物理空间内的不同位置。

返回图2,学习部102将服务充足度-执行器控制量对应信息150的服务充足度的信息作为输入值,使用机器学习算法,输出(计算)执行器控制量(目标控制量)。此时,学习部102输出为了满足每种服务保持的目标服务充足度所需要的执行器控制量(目标控制量)。该学习部102基于将服务充足度-执行器控制量对应信息150(图3)中的服务充足度的值作为输入值,将执行器控制量(目标控制量)的值作为输出值的学习数据进行机器学习。然后,学习部102作为当输入某服务充足度时输出会满足目标服务充足度的执行器控制量(目标控制量)的机器学习算法发挥功能。

采用该学习部102的机器学习算法例如由神经网络、逻辑回归等实现。本实施方式的学习部102所使用的机器学习算法没有限定,但在任意一个学习模型中,都设为返回相对于任意输入值(服务充足度)的输出值(执行器控制量)。

需要说明的是,当该学习部102通过执行器控制量计算部10的处理(也包含后述的由控制量调整部110实现的调整处理)将服务充足度作为输入值、将执行器控制量(目标控制量)作为输出值存储于服务充足度-执行器控制量对应信息150(图3)时,将该数据作为学习数据取入,由此更新机器学习算法。就是说,目标控制量计算部100(学习装置)以能在每次执行处理时得到新的学习数据,计算更适当的输出值的方式进行学习。

图4是用于对使用了神经网络作为机器学习算法的情况的学习部102的处理进行说明的图。

如图4所示,与图3所示的服务充足度-执行器控制量对应信息150对应,在输入层输入各传感器设备2(“传感器1”“传感器2”)的服务充足度。然后,经由中间层,在输出层输出满足目标服务充足度这样的各执行器设备3(“执行器1”“执行器2”)的执行器控制量(目标控制量)。需要说明的是,中间层不限定于图4所示这样的一层,也可以设为多层以使通过深度学习进行学习。

返回图1,对控制量调整部110进行说明。

在以本实施方式的多设备协同控制装置1为对象的物理空间的服务中,假定存在仅利用配置于该物理空间的传感器设备2无法网罗的环境要因。此外,在服务开始初始时,服务充足度-执行器控制量对应信息150中存储的信息(学习数据)量也不充足。根据这样的要因,即使在通过执行器控制量计算部10导出的执行器控制量(目标控制量)使各执行器设备3动作的情况下,也可能使服务充足度未达到目标。控制量调整部110在基于由执行器控制量计算部10(目标控制量计算部100)导出的执行器控制量(目标控制量)使执行器设备3进行动作(试行)时得到的实际的服务充足度(以下称为“当前服务充足度”。)与目标服务充足度不同的情况下,进行执行器控制量的调整。

具体而言,控制量调整部110应用演化策略算法,计算以图5所示的流程调整后的执行器控制量。

图5是表示本实施方式的控制量调整部110所执行的执行器控制量的调整处理的流程的流程图。

需要说明的是,在此,最初通过目标控制量计算部100的处理计算执行器控制量(目标控制量),通过执行器控制部13的控制命令使各执行器设备3执行(试行)控制,各传感器设备2获取其控制结果作为传感器信息。然后,对服务充足度计算部12计算出该试行后的(当前时间点的)服务充足度(当前服务充足度)进行说明。

如图5所示,首先,控制量调整部110求出目标服务充足度(ref)与当前服务充足度(cur)的偏离度(g)(步骤s1)。该偏离度是表示当前服务充足度相对于目标服务充足度偏离何种程度的指标。偏离度的计算不限定于特定的方法,但例如可以采用单纯从目标服务充足度减去当前服务充足度的方法、使用当前服务充足度相对于目标服务充足度的比率的手法等。

接着,控制量调整部110通过将偏离度(g)的值设为方差(σ)(步骤s2)来生成正规随机数(n)。控制量调整部110将生成出的正规随机数(n)设为调整控制量,通过将调整控制量加上现执行器控制量xi(后述的“执行器调整基准量”)来求出调整后的执行器控制量xi′(步骤s3)。

通过这样设置,偏离度越大,则调整量相对于执行器控制量的增减变得越大。因此,在偏离小时进行更微小的调整,在偏离大时进行更为过大的调整。

需要说明的是,在偏离度大时,是服务充足度-执行器控制量对应信息150的信息量明显缺损或环境发生了变化的情况。通过该控制量调整部110的功能,偏离度越大,则进行越过大的调整,试行与目前为止的倾向不同的行动,因此能防止学习陷入局部解,能实时地对环境进行追踪。

执行器控制量计算部10将控制量调整部110计算出的调整后的执行器控制量输出至执行器控制部13,由此试行各执行器设备3的控制。其后,从传感器设备2获取传感器信息,服务充足度计算部12再次计算当前时间点的服务充足度(当前服务充足度)。此时,控制量调整部110仅在超过了在这之前试行了的充足度的情况下,更新在下一次调整控制量的计算时使用的现执行器控制量(执行器调整基准量)。就是说,控制量调整部110在进行了试行的结果为服务充足度高于这之前的服务充足度的情况下,判定为该调整控制量适当,用该试行中使用的现执行器控制量更新成为调整当前时间点的执行器控制量的基准的“执行器调整基准量”(参照后述的图6的步骤s18→是)。另一方面,控制量调整部110在进行了试行的结果为服务充足度比以前降低了的情况下,判定为本试行中使用的调整控制量不适当,不进行执行器调整基准量的更新(参照后述的图6的步骤s18→否)。

而且,在计算本实施方式中的执行器控制量时,设有成本这样的概念。成本是指与执行器设备3的控制相关的规定指标,例如作为伴随执行器设备3的控制的负的要因,相当于耗电量。作为代替耗电量的其他指标,也可以将执行器设备3的控制量(图3所示的执行器控制量)的总和作为成本。

需要说明的是,在使用耗电量作为成本的情况下,表示与各执行器设备3的控制量对应的耗电量的信息被预先储存于多设备协同控制装置1的存储部(省略图示)。由此,计算出与控制量对应的耗电量作为成本。以下对采用执行器设备3的控制量(执行器控制量)的总和作为成本进行说明。

控制量调整部110在试行后的实际的服务充足度(当前服务充足度)超过目标服务充足度情况下,探索满足目标服务充足度并且成本更低的执行器控制量(调整后的执行器控制量)。调整控制量的计算方法与上述的服务充足度未到达目标服务充足度的情况相同。但是,对于执行器调整基准量的更新,仅在进行了成本降低的试行时进行(参照后述的图6的步骤s19→否)。

通过像这样设置,多设备协同控制装置1能计算使成本最合适的执行器控制量。在实际的服务的例子中,执行器设备3为多个灯(照明装置),其效果是例如在重复提高分辨率这样的效果的情况下,能仅以必要的数量(控制量)驱动,防止浪费的控制(输出)。

控制量调整部110重复调整执行器控制量的试行,由此能实现各执行器设备3的更适当的控制。但是,控制量调整部110为了防止无限地重复试行,对控制量调整的试行次数设定任意的上限值(规定值),通过到达了上限值来结束调整。此外,控制量调整部110设为:若当前服务充足度与目标服务充足度的偏离度在规定的阈值以内,则结束调整。

(处理的流程)

接着,对多设备协同控制装置1所执行的处理的流程进行说明。

图6是表示本实施方式的多设备协同控制装置1所执行的处理的流程的流程图。

在此,设为预先在同一物理空间内配置有各传感器设备2和各执行器设备3。此外,设为在多设备协同控制装置1中将作为与各传感器设备2建立对应的服务充足度的目标值的目标服务充足度的信息、用于结束调整的偏离度的规定的阈值以及控制量调整的试行次数的上限值(规定值)储存于存储部(省略图示)。

首先,多设备协同控制装置1的服务充足度计算部12(图1)从各传感器设备2获取物理空间信息(传感器信息)。需要说明的是,服务充足度计算部12以规定的时间间隔执行该传感器信息的获取处理,重复这以后的处理。

接着,服务充足度计算部12基于获取到的传感器信息,计算与各传感器设备2建立对应的服务目的所对应的服务充足度(当前服务充足度)(步骤s10)。然后,服务充足度计算部12将计算出的服务充足度(当前服务充足度)输出至执行器控制量计算部10(图1)。

在执行器控制量计算部10的目标控制量计算部100(学习装置)中,服务充足度获取部101(图2)获取与各传感器设备2建立对应的服务充足度(当前服务充足度)的信息,存储于服务充足度-执行器控制量对应信息150(图3)。

接着,目标控制量计算部100(学习装置)的学习部102(图2)使用机器学习算法计算满足目标服务充足度这样的执行器控制量(目标控制量)(步骤s11)。

然后,目标控制量计算部100(学习装置)的执行器控制量输出部103(图2)将由学习部102计算出的执行器控制量(目标控制量)存储于服务充足度-执行器控制量对应信息150(图3),并且输出至执行器控制部13(图1)。

需要说明的是,该计算出的执行器控制量存储于存储部(省略图示)作为图5所示的现执行器控制量xi(执行器调整基准量)的初始值。

执行器控制部13在获取到执行器控制量(目标控制量)时,转换为与各执行器设备3对应的控制命令,将该控制命令发送至各执行器设备3(步骤s12)。由此,执行各执行器设备3的控制。

接下来的骤s13至s22的处理主要是控制量调整部110所执行的执行器控制量的调整处理。

首先,多设备协同控制装置1的服务充足度计算部12(图1)从各传感器设备2获取成为执行器设备3按照控制命令执行控制的结果的物理空间信息(传感器信息)。服务充足度计算部12计算与各传感器设备2建立对应的服务目的所对应的服务充足度(当前服务充足度)(步骤s13)。然后,服务充足度计算部12将计算出的服务充足度(当前服务充足度)输出至执行器控制量计算部10。

执行器控制量计算部10的控制量调整部110(图1)将与各传感器设备2建立对应的服务充足度(当前服务充足度)的信息存储于服务充足度-执行器控制量对应信息150(图3)生成新的记录(步骤s14)。需要说明的是,在图6中,将服务充足度-执行器控制量对应信息150记载为“对应信息”。

接着,控制量调整部110使用目标服务充足度与在步骤s13中计算出的当前服务充足度计算偏离度(步骤s15)。

控制量调整部110可以通过从目标服务充足度减去当前服务充足度的方法或使用当前服务充足度相对于目标服务充足度的比率的方法来求该偏离度。

接着,控制量调整部110判定是否与结束调整处理的条件一致。具体而言,判定是否符合计算出的偏离度在规定的阈值以内、控制量调整的试行次数在上限值(规定值)以上中的任意一个(步骤s16)。需要说明的是,控制量调整部110以每当在步骤s15中计算偏离度时使试行次数“+1”(初始值“0”)的方式进行计数。

该处理用于不使执行器控制量的调整处理无限重复。

若偏离度在规定的阈值以内(步骤s16→是),则控制量调整部110实现了满足目标服务充足度的执行器设备3的控制而结束处理。此外,在达到了预先设定的控制量调整的试行次数的上限值的情况下(步骤s16→是),控制量调整部110结束处理。

另一方面,在不符合偏离度在规定的阈值以内或试行次数为上限值以上中任一个的情况下(步骤s16→否),控制量调整部110前进至下一个步骤s17。

在步骤s17中,控制量调整部110判定本试行中的当前服务充足度是否超过了目标服务充足度。在此,在当前服务充足度超过了目标服务充足度的情况下(步骤s17→是),前进至步骤s19。另一方面,在当前服务充足度未超过目标服务充足度的情况下(步骤s17→否),前进至步骤s18。

在步骤s18中,控制量调整部110对本试行中的当前服务充足度与其前一次的试行中的服务充足度(前次试行时的服务充足度)进行比较。然后,若本试行中的当前服务充足度大于前次试行时的服务充足度(步骤s18→是),则前进至步骤s20。另一方面,若本试行中的当前服务充足度不大于上次试行时的服务充足度(步骤s18→否),则前进至步骤s21。

另一方面,在步骤s19中,控制量调整部110计算现试行成本(例如图3所示的当前的(最新的)执行器控制量的总和),与其前一次的试行中的成本(前次试行时的成本)进行比较。然后,若现试行成本大于前次试行时的成本(步骤s19→是),则前进至步骤s21。另一方面,若现试行成本不大于前试行时的成本(步骤s19→否),则前进至步骤s20。

在步骤s20中,控制量调整部110用当前的(最新的)执行器控制量更新执行器调整基准量。由此,图5所示的现执行器控制量xi(执行器调整基准量)被更新为更优选的执行器控制量。因此,能调整为满足目标服务充足度且降低成本的执行器控制量。控制量调整部110在步骤s20的执行器调整基准量的更新后前进至步骤s21。

在步骤s21中,控制量调整部110通过使用在图5中示出的演化策略算法计算调整控制量来求调整后的执行器控制量。然后,控制量调整部110将计算出的调整后的执行器控制量存储于服务充足度-执行器控制量对应信息150(图3),并且输出至执行器控制部13。

执行器控制部13在获取到调整后的执行器控制量时,转换为与各执行器设备3对应的控制命令,将该控制命令发送至各执行器设备3(步骤s22)。由此,执行各执行器设备3的控制。然后,返回步骤s13的处理。

如以上所说明的那样,根据本实施方式的多设备协同控制装置1、多设备协同控制方法以及多设备协同控制程序,能从各传感器设备2获取传感器信息并计算服务充足度,将该服务充足度作为输入值通过学习装置计算执行器控制量(控制目标量)。此外,在以计算出的执行器控制量(控制目标量)控制(试行)各执行器设备3后,计算试行后的服务充足度,并计算与目标服务充足度的偏离度,由此能适当地调整执行器控制量。因此,能与服务目的和实时的状况对应地自动且适当地控制设置于物理空间的多种多样的设备。

附图标记说明:

1:多设备协同控制装置;

2:传感器设备;

3:执行器设备;

10:执行器控制量计算部;

12:服务充足度计算部;

13:执行器控制部;

100:目标控制量计算部(学习装置);

101:服务充足度获取部;

102:学习部;

103:执行器控制量输出部;

110:控制量调整部;

150:服务充足度-执行器控制量对应信息;

1000:多设备协同控制系统。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1