控制装置的制作方法

文档序号:24305421发布日期:2021-03-17 00:58阅读:158来源:国知局
控制装置的制作方法

本发明涉及一种使控制对象追随于规定的目标指令的控制装置。



背景技术:

为了使控制对象追随于指令轨道而移动,一般利用反馈控制。例如在多关节机器人中,通过机器人的控制装置来进行各关节轴的伺服马达的控制,以使用反馈控制来使机器人的指尖部的位置追随于预先设定(示教)的指令轨道。但是,在一般的反馈控制中,无论如何各伺服马达都会产生响应延迟,因此存在机器人的实际轨迹偏离指令轨道的问题。为了抑制此种相对于指令轨道的偏离,利用有与模型预测控制相关的技术(例如参照非专利文献1)。

而且,若存在使控制对象追随于指令轨道时可能干涉到所述控制对象的、移动的障碍物,则必须对控制对象进行控制以避免与所述障碍物的碰撞。例如,专利文献1所示的技术中,基于存在控制对象周围的障碍物的存在概率来形成概率势场(potentialfield),并且基于所述概率势场的梯度来决定控制对象应行进的路径。同样,在专利文献2所示的车辆的碰撞回避控制中,也利用了基于障碍物的存在概率的概率势场。

现有技术文献

专利文献

专利文献1:日本专利特开2003-241836号公报

专利文献2:日本专利特开2011-186878号公报

非专利文献

非专利文献1:樱井裕太和大塚俊之(yutasakuraiandtoshiyukiohtsuka):借助干扰评估的连续时间模型预测控制的偏移补偿(offsetcompensationofcontinuoustimemodelpredictivecontrolbydisturbanceestimation);系统控制信息学会论文志,vol.25,no.7,pp.10-18(2012)



技术实现要素:

发明所要解决的问题

为了既能通过模型预测控制来使控制对象的输出较佳地追随于目标指令,又能较佳地避免与存在于控制对象周围的移动的障碍物的碰撞,优选的是,如以往技术所示的那样,利用基于所述障碍物的存在概率而形成的概率势场。然而,依据通过以往技术为了碰撞回避而生成的路径,控制对象存在向其前方回避以避开所述移动的障碍物的倾向。此种情况下,最终会造成控制对象与移动障碍物并行的状况,因此与障碍物碰撞的可能性长时间持续,回避所需的时间变长。尤其,在像机器人等那样因臂等结构物的长度有限而其可动范围受限的控制对象的情况下,若碰撞的可能性拖延,则结果有可能陷入避免不了与障碍物碰撞的状态。

本发明是有鉴于此种问题而完成,其目的在于提供一种技术,在通过模型预测控制来使控制对象的输出追随于目标指令的情况下,能够较佳地避免与移动的障碍物的碰撞。

解决问题的技术手段

本发明中,为了解决所述问题,使在用于对目标指令的追随控制的模型预测控制中算出的阶段成本(stagecost)包含:与实际的障碍物(实际障碍物)的概率势场关联的阶段成本;以及与跟所述实际障碍物对应的虚拟障碍物的概率势场关联的阶段成本。由此,实现对目标指令的追随和较佳的障碍物的回避。

从第一方面理解的本发明是一种控制装置,其包括模型预测控制部,且使控制对象的输出追随于规定的目标指令,所述模型预测控制部具有一预测模型,所述预测模型以规定的状态方程式的形式而划定了跟所述控制对象相关的规定的状态变量与对所述控制对象的控制输入的相关,且所述模型预测控制部针对所述控制对象的输出应追随的所述规定的目标指令,在规定时宽的预测区间内依据规定的评估函数来进行基于所述预测模型的模型预测控制,并至少输出所述预测区间的初始时刻的所述控制输入的值。并且,所述控制装置包括:第一获取部,获取实际的障碍物即实际障碍物相对于所述控制对象的位置;以及设定部,基于由所述第一获取部所获取的所述实际障碍物的位置来设定虚拟障碍物的位置,以基于所述规定的目标指令的、所述控制对象的追随目标轨道为基准,使得所述实际障碍物相关联的所述虚拟障碍物位于与所述实际障碍物大致对称之处。通过所述规定的评估函数而算出的阶段成本包含:状态量成本,为与所述规定的状态变量相关的阶段成本;控制输入成本,为与所述控制输入关联的阶段成本;第一阶段成本,与第一概率势场关联,所述第一概率势场是基于所述实际障碍物的位置来表示所述实际障碍物可能存在的概率;以及第二阶段成本,与第二概率势场关联,所述第二概率势场是基于所述虚拟障碍物的位置来表示所述虚拟障碍物可能存在的概率的概率势场且具有所述第一概率势场以上的概率值。

本发明的控制装置是使控制对象的输出追随于规定的目标指令的控制装置,且构成为,由所述模型预测控制部来生成针对所述控制对象的控制输入。并且,基于控制对象来形成模型预测控制部所具有的预测模型。此处,在所述模型预测控制中,在各控制时刻设定规定时宽的预测区间,在所述预测区间内进行依据规定的评估函数的运算处理,至少实时生成所述预测区间内的初始时刻的、所算出的控制输入值并予以输出。所述模型预测控制中,预测区间将随着控制时间的经过而移动,执行所谓的滚动时域(recedinghorizon)控制。并且,跟控制对象关联的规定的状态变量与控制输入的相关被反映至预测模型。借助此种结构,能够实时生成用于追随于规定的目标指令的控制输入并对控制对象输出。

此处,在使控制对象追随于目标指令时,若存在在其附近移动的障碍物,则必须较佳地避免与所述障碍物的碰撞,并实现对所述目标指令的追随。因此,所述控制装置通过第一获取部来获取实际的障碍物即实际障碍物的位置,并且通过设定部来设定与所述实际障碍物对应的虚拟障碍物的位置。所述虚拟障碍物并非实际存在的障碍物,而是与实际障碍物对应地,为了用于追随于目标指令的模型预测控制的运算而设定的虚拟的障碍物。虚拟障碍物的位置被设定在以控制对象的追随目标轨道为基准而与实际障碍物大致对称的位置。这是为了使得以实际障碍物为起点的概率势场与以虚拟障碍物为起点的概率势场能够夹着追随目标轨道而对称地配置。另外,这并非意味着必须使两势场形成为完全相同。

并且,像这样掌握了实际障碍物与虚拟障碍物的位置后,使通过用于模型预测控制的规定的评估函数而算出的阶段成本中,除了状态量成本与控制输入成本以外,还包含与实际障碍物对应的第一阶段成本和与虚拟障碍物对应的第二阶段成本。因此,在用于追随于目标指令的模型预测控制中,能够使与实际障碍物相关的第一概率势场、和与夹着追随目标轨道而被设定为大致对称的虚拟障碍物相关的第二概率势场产生作用。其结果,除了实际障碍物的第一势场所形成的斥力(欲使控制对象远离的作用)以外,还有虚拟障碍物的第二势场所形成的斥力作用于控制对象,由此,较佳地降低控制对象对目标指令的追随速度,从而能够使控制对象以位于实际障碍物后方(行进方向的相反方向)的方式来回避所述实际障碍物。这样,抑制像以往技术那样造成控制对象与障碍物并行的状况,从而能够较佳地避免与实际障碍物的碰撞。

尤其,在所述控制装置中,两势场被设定为,第二势场具有第一势场以上的概率值。这意味着,虚拟障碍物的第二势场所形成的斥力为实际障碍物的第一势场所形成的斥力以上。因此,通过算出如上所述的阶段成本的模型预测控制,较佳地降低控制对象对目标指令的追随速度,从而较佳地实现实际障碍物的回避。

此处,从解决所述问题的本发明的第二方面来理解。从第二方面理解的本发明是一种控制装置,其包括模型预测控制部,且使控制对象的输出追随于规定的目标指令,所述模型预测控制部具有一预测模型,所述预测模型以规定的状态方程式的形式而划定了跟所述控制对象相关的规定的状态变量与对所述控制对象的控制输入的相关,且所述模型预测控制部针对所述控制对象的输出应追随的所述规定的目标指令,在规定时宽的预测区间内依据规定的评估函数来进行基于所述预测模型的模型预测控制,并至少输出所述预测区间的初始时刻的所述控制输入的值。并且,所述控制装置包括:伺服用积分器,输入所述规定的目标指令与所述控制对象的输出的偏差;第一获取部,获取实际的障碍物即实际障碍物相对于所述控制对象的位置;以及设定部,基于由所述第一获取部所获取的所述实际障碍物的位置来设定虚拟障碍物的位置,以基于所述规定的目标指令的、所述控制对象的追随目标轨道为基准,使得所述实际障碍物相关联的所述虚拟障碍物位于与所述实际障碍物大致对称之处。通过所述规定的评估函数而算出的阶段成本包含:状态量成本,为与所述规定的状态变量相关的阶段成本;控制输入成本,为与所述控制输入关联的阶段成本;第一阶段成本,与第一概率势场关联,所述第一概率势场是基于所述实际障碍物的位置来表示所述实际障碍物可能存在的概率;以及第二阶段成本,与第二概率势场关联,所述第二概率势场是基于所述虚拟障碍物的位置来表示所述虚拟障碍物可能存在的概率的概率势场且具有所述第一概率势场以上的概率值。进而,与所述控制对象关联的状态变量包含以所述偏差与规定的积分增益之积表示的规定的积分项,所述控制对象与所述实际障碍物之间的距离越短,则所述规定的积分增益越小。

第二方面的控制装置与第一方面的控制装置的不同之处在于,还包括伺服用积分器。通过采用此种结构,将进行基于偏差的模型预测控制。由此,不会使对规定的目标指令的追随过渡响应徒然地劣化,而能够有效地消除稳态偏差。而且,所述控制装置是通过使预测模型中包含规定的积分项来实现稳态偏差的消除,因此能够大幅减轻控制系统的设计所需的负荷,能够实现控制对象的较佳的追随控制。在像以往技术那样利用对成为稳态偏差的主要原因的干扰进行推测的观测器(observer)等的情况下,其参数设计困难,计算负荷相对较大,因此基于此种观点考虑,所述本发明的结构也有用。

但是,即便通过使所述状态变量中包含此种规定的积分项,而在模型预测控制中使实际障碍物的第一势场所形成的斥力与虚拟障碍物的第二势场所形成的斥力作用于控制对象,但若随着时间经过,或者因目标指令的推移而控制对象的位置与目标位置之间的偏离变宽,则规定的积分项带来的影响将相对地变强。因此,虚拟障碍物的第二势场所形成的斥力的效果相对变弱,结果,难以将控制对象控制成在实际障碍物的后方回避。因此,第二方面的控制装置中,控制对象与实际障碍物之间的距离越短,则规定的积分项中所含的规定的积分增益越小。借此,在控制对象接近实际障碍物而碰撞的可能性提高的情况下,能够相对地提高实际障碍物及虚拟障碍物各自的势场所形成的斥力的效果,从而既能实现目标指令的追随,又能较佳地避免与实际障碍物的碰撞。

此处,在至此为止所述的控制装置中,存在下述倾向,即,实际障碍物相对于追随目标轨道的进入角越接近90度,则模型预测控制中的、实际障碍物的第一势场所形成的斥力与虚拟障碍物的第二势场所形成的斥力对控制对象的作用越弱。其结果,即使在控制对象相对较接近实际障碍物的情况下,也无法较佳地降低其追随速度,从而难以避免控制对象与实际障碍物的碰撞。因此,也可还包括第二获取部,所述第二获取部获取被定义为所述控制对象的移动方向与所述实际障碍物的移动方向之间的角度的、所述实际障碍物相对于所述追随目标轨道的进入角,此时,在通过所述规定的评估函数而算出的阶段成本中,所述进入角越接近90度,则所述第二阶段成本也可被算出得越大。通过像这样依存于进入角来算出第二阶段成本,能够避免实际障碍物与控制对象的碰撞而不受实际障碍物的进入角影响。

另外,所述的控制装置中,所述进入角也可基于由所述第一获取部所获取的所述实际障碍物的过去的位置而算出。借此,对于原本无法预先知晓其行进路线的实际障碍物,能够预测对追随目标轨道的进入角。另外,作为一例,通过根据最近两点的实际障碍物的位置来对其移动进行直线近似,或者根据最近多点的实际障碍物的位置来对其移动进行多项式近似,能够算出对追随目标轨道的进入角。

此处,在至此为止所述的控制装置中,在所述控制对象的位置经过了所述追随目标轨道与所述实际障碍物所沿循的障碍物轨道交叉的交叉点的位置后,在通过所述规定的评估函数而算出的阶段成本中,所述控制对象的位置距所述交叉点的位置越远,则所述第二阶段成本也可被算出得越小。在控制对象在追随目标轨道上前进的过程中,当所述控制对象的位置经过了所述交叉点的位置时,基本上已避免了控制对象与实际障碍物的碰撞。因此,如上所述,在控制对象的位置经过了交叉点的位置后,距所述交叉点越远,则所述第二阶段成本被算出得越小,由此,避免虚拟障碍物的第二势场所形成的斥力不慎作用于控制对象,从而能够实现较佳的控制对象的追随控制。而且,作为其他方法,在至此为止所述的控制装置中,在所述控制对象的位置经过了所述追随目标轨道与所述实际障碍物所沿循的障碍物轨道交叉的交叉点的位置后,在通过所述规定的评估函数而算出的阶段成本中,所述第二阶段成本也可设为零。

此处,在至此为止所述的控制装置中,关于进行对目标指令的追随的控制对象,在存在多个实际障碍物的情况下,通过设定部来设定与各个实际障碍物对应的虚拟障碍物的位置,使各实际障碍物及各虚拟障碍物反映到模型抑制控制的阶段成本的计算中,由此,即使实际障碍物的数量为多个,也能较佳地回避它们,并实现控制对象对目标指令的追随。但是,若欲对应于大量的实际障碍物来进行所述模型预测控制,则所述模型预测控制所需的、控制装置的处理负荷将变高,因此优选的是,将控制装置中能够应对的实际障碍物的数量指定为规定数。

并且,基于像这样将控制装置中的模型预测控制中能够应对的实际障碍物的数量限定为规定数,所述规定的评估函数也可形成为,算出与两个以上的规定数的所述实际障碍物各自对应的所述第一阶段成本及所述第二阶段成本。并且,当由所述第一获取部获取了超过所述规定数的规定超过数的所述实际障碍物的位置时,也可从所述规定超过数的实际障碍物中,基于所述控制对象与所述规定超过数的实际障碍物各自的分隔距离来提取所述规定数的实际障碍物,进而,在通过所述规定的评估函数而算出的阶段成本中,也可基于所述提取的所述规定数的实际障碍物的位置来算出所述第一阶段成本,且基于与所述提取的所述规定数的实际障碍物对应的所述规定数的虚拟障碍物的位置来算出所述第二阶段成本。即,当存在超过规定数的实际障碍物时,基于与控制对象的分隔距离来提取优先反映到模型预测控制中的实际障碍物。这是因为,控制对象与实际障碍物的分隔距离对于碰撞回避而言是重要的因素。通过采用此种结构,既能尽可能地抑制控制装置的处理负荷,又能避免控制对象与实际障碍物的碰撞,并实现对目标指令的追随控制。

发明的效果

在通过模型预测控制来使控制对象的输出追随于目标指令的情况下,能够较佳地避免与移动的障碍物的碰撞。

附图说明

图1是表示包含作为控制装置的伺服驱动器的控制系统的概略结构的第一图。

图2是表示实施方式的伺服驱动器的控制结构的第一图。

图3是说明在由实施方式的伺服驱动器所执行的模型预测控制中用于进行与实际障碍物的碰撞回避的概略的图。

图4是表示实施方式的伺服驱动器所进行的实际设备(plant)的追随控制的结果的第一图。

图5是表示实施方式的伺服驱动器的控制结构的第二图。

图6是表示在图5所示的伺服驱动器的模型预测控制中所设定的第一及第二积分增益的推移的图。

图7是表示实施方式的伺服驱动器所进行的实际设备的追随控制的结果的第二图。

图8是表示实施方式的伺服驱动器所进行的实际设备的追随控制的结果的第三图。

图9是表示实施方式的伺服驱动器所进行的实际设备的追随控制的结果的第四图。

图10是表示实施方式的伺服驱动器所进行的实际设备的追随控制的结果的第五图。

具体实施方式

<适用例>

基于图1至图3来说明实施方式的控制装置的适用例。图1是控制系统的概略结构图。所述控制系统包括网络1、伺服驱动器4以及标准可编程逻辑控制器(programmablelogiccontroller,plc)5。伺服驱动器4是用于对包含马达2和负载装置3的、实际的设备(以下简称作“实际设备”)6进行伺服控制的控制装置。实际设备6成为控制对象。所述控制系统中,伺服驱动器4对实际设备6进行反馈控制,以使实际设备6的输出追随于从标准plc5送来的目标指令。伺服驱动器4基于从标准plc5收到的目标指令,生成用于进行实际设备6的追随控制的控制输入。关于伺服驱动器4对控制输入的生成将后述。此处,作为构成实际设备6的负载装置3,能够例示各种机械装置(例如工业机器人的臂或搬送装置),马达2是作为驱动所述负载装置3的致动器而被组装在负载装置3内。例如,马达2为交流电(alternatingcurrent,ac)伺服马达。另外,在马达2中安装有未图示的编码器,通过所述编码器,将与马达2的动作相关的参数信号(位置信号、速度信号等)反馈发送给伺服驱动器4。

标准plc5生成与实际设备6的动作(运动)相关的目标指令,并发送给伺服驱动器4。伺服驱动器4经由网络1来从标准plc5接收所述伺服指令,并且接收从连接于马达2的编码器输出的反馈信号。并且,伺服驱动器4基于所述伺服指令与来自编码器的反馈信号来对马达2供给驱动电流,以使实际设备6的输出追随于规定的指令。所述供给电流利用从交流电源送往伺服驱动器4的交流电力。本实施例中,伺服驱动器4是接受三相交流的类型,但也可为接受单相交流的类型。另外,为了实际设备6的伺服控制,在伺服驱动器4中,如图2所示,通过模型预测控制部43来执行模型预测控制。

此处,基于图2来说明伺服驱动器4的控制结构。另外,从标准plc5供给至伺服驱动器4的目标指令以r来参照,对实际设备6的控制输入以u来参照。伺服驱动器4具有状态获取部42、模型预测控制部43、获取部45、设定部46。并且,这些状态获取部42、模型预测控制部43、获取部45、设定部46所进行的各处理是由搭载于伺服驱动器4的运算处理装置来运算执行。

并且,本实施例中,形成有状态获取部42及模型预测控制部43。状态获取部42是供由模型预测控制部43所进行的模型预测控制,获取与实际设备6相关的状态x中所含的状态变量的值。并且,模型预测控制部43使用状态获取部42所获取的与实际设备6相关的状态x和自身输出的对实际设备6的控制输入u,来执行模型预测控制(滚动时域控制)。

详细而言,模型预测控制部43具有一预测模型,所述预测模型利用下述的状态方程式(式1)而划定了跟实际设备6相关的状态x与对实际设备6的控制输入u的相关。另外,下述式1是非线性的状态方程式。在所述预测模型中,例如也可反映有实际设备6所具有的规定的物理特征。

[数1]

此处,模型预测控制部43将与实际设备6相关的状态x和对实际设备6的控制输入u作为输入,在具有规定的时宽t的预测区间内,根据下述的式2所示的评估函数,来进行基于以式1表示的预测模型的模型预测控制。

[数2]

所述式2右边的第一项为终止成本,右边的第二项为阶段成本。并且,所述阶段成本能够以下述的式3来表示。

[数3]

其中,xref(k)表示时刻k的目标状态量,x(k)表示时刻k的计算上的状态量,uref(k)表示时刻k的、稳态状态下的目标控制输入,u(k)表示时刻k的计算上的控制输入。而且,q及r分别为表示阶段成本中的状态量的权重的系数(权重系数)、表示控制输入的权重的系数(权重系数)。因此,式3的右边的第一项是指与状态量相关的阶段成本,称作“状态量成本”,右边的第二项是指与控制输入相关的阶段成本,称作“控制输入成本”。而且,关于右边的第三项即第一阶段成本、以及第四项即第二阶段成本将后述。

进而,本实施例中,形成有获取部45与设定部46。获取部45获取与经由摄像机8的拍摄而识别的实际的障碍物(实际障碍物)相关的规定参数。作为规定参数,被定义为实际障碍物的位置、或者实际障碍物正在移动时的其移动方向与控制对象的追随控制时的移动方向之间的角度,可列举实际障碍物相对于追随目标轨道的进入角θ(以下简称作“进入角”)等。

例如,由摄像机8所拍摄的区域为已知,由此,获取部45通过对所述拍摄图像进行图像处理等以往技术,便能够获取实际障碍物的位置。而且,关于所述实际障碍物的进入角,能够基于所获取的实际障碍物的过去的位置来获取。作为一例,根据由获取部45所获取的最近两点的实际障碍物的位置op1、op2来对其移动进行直线近似,进而,根据对应时机的实际设备6的两点位置tp1、tp2来对其移动进行直线近似。并且,进入角θ能够根据余弦定理而算出。而且,作为其他方法,通过根据最近多点的实际障碍物的位置来对其移动进行多项式近似,也能够算出对追随目标轨道的进入角θ。

而且,设定部46基于实际障碍物的位置来设定虚拟障碍物的位置。虚拟障碍物是为了用于避免作为控制对象的实际设备6与实际障碍物的碰撞的、依据式3的阶段成本的计算尤其是第二阶段成本的计算,而虚拟地设定的障碍物。因此,虚拟障碍物与实际设备6及实际障碍物不同,并非实际存在的物体。设定部46将虚拟障碍物的位置设定为,以实际设备6的追随目标轨道为基准而位于与实际障碍物大致对称之处,其详细将后述。

基于以上而在模型预测控制中算出的、预测区间的初始时刻t的控制输入u的值被输出作为此时刻t的、与目标指令r对应的对实际设备6的控制输入u。并且,在模型预测控制中,每当此控制时刻,设定规定的时宽t的预测区间,并且依据式2的评估函数来算出所述控制时刻的对实际设备6的控制输入u,并送往实际设备6。求出将式2那样的形式的评估函数j的值设为最优的操作量的问题是作为最佳控制问题而被广泛知晓的问题,算出其数值解的算法已作为公知技术而公开。作为此种技术,可例示连续变形法,例如在作为公知文献的“将连续变形法与gmres法组合而成的非线性滚动时域控制的高速算法(acontinuation/gmresmethodforfastcomputationofnonlinearrecedinghorizoncontrol)”{大塚敏之(t.ohtsuka),自动化(automatica),第40巻,p563~574,2004.}中公开了详细内容。

在连续变形法中,通过解下述式4所示的、与输入u(t)相关的联立一次方程式,从而算出模型预测控制中的输入u(t)。具体而言,解式4,对du/dt进行数值积分而更新输入u(t)。这样,在连续变形法中不进行反复计算,因此能够尽可能地抑制用于算出各时刻的输入u(t)的运算负荷。

[数4]

其中,f、u(t)是用以下的式5来表示。

[数5]

其中,h为哈密顿算符(hamiltonian),λ为共状态,μ为约束条件c=0的拉格朗日乘子(lagrangemultiplier)。

此处,基于图3来说明本实施方式中的、依据所述式3的阶段成本的计算的详细。图3表示了在以追随于目标指令r的方式受到控制的实际设备6的周围存在移动的实际障碍物61的状态。实际障碍物61是通过摄像机8的拍摄来识别其存在,并且实际障碍物61的位置是由获取部45来获取。另外,将所获取的实际障碍物61的位置以“p61”来参照。此处,基于实际障碍物61相对于实际设备6而相对移动的情况,能够算出表示在实际设备6的周围可能存在实际障碍物61的概率的概率势场(将因实际障碍物61引起的概率势场设为第一势场)。所述概率势场的计算其自身为公知的技术,因此可利用例如日本专利特开2003-241836号公报中记载的技术来算出。

并且,本实施方式中,不论是否直接算出实际障碍物61的第一势场,均使与第一势场关联的第一阶段成本包含于在模型预测控制部43的模型预测控制中所算出的阶段成本中(参照所述式3)。另外,第一阶段成本能够以下述式6来表示。

[数6]

nobs=|pt-p61|

…(式6)

其中,pt为实际设备6的位置,k为与第一势场关联的系数。

通过像这样生成第一阶段成本,从而当第一势场的概率值变高时,第一阶段成本将上升,一边进行对目标指令r的追随控制,一边通过模型预测控制部43来算出控制输入u,以使得最终实际障碍物61的第一势场所形成的“斥力”使正进行对目标指令r的追随控制的实际设备6远离实际障碍物61。例如,实际设备6根据此种控制输入u,将沿循图3中以一点链线所示的回避轨道。然而,此种回避轨道中,实际设备6自身将在移动的实际障碍物61的前方回避,因此实际设备6受实际障碍物61的第一势场影响的时间变长,根据情况,实际设备6有可能难以回避实际障碍物61(图3中表示了沿循着回避轨道的实际设备6在“×”所示的位置与实际障碍物61发生了碰撞的状态)。

因此,本实施方式中,为了较佳地避免正在移动的实际障碍物61与实际设备6的碰撞,通过设定部46来设定虚拟障碍物62的位置。具体而言,虚拟障碍物62的位置被设定为,以实际设备6的追随目标轨道为基准而位于与实际障碍物61大致对称之处。另外,虚拟障碍物62的位置将以“p62”来参照。而且,与实际障碍物61的情况同样地,能够算出表示在实际设备6的周围可能存在虚拟障碍物62的概率的概率势场(将因虚拟障碍物62引起的概率势场设为第二势场)。然后,与实际障碍物61同样地,不论是否直接算出虚拟障碍物62的第二势场,均使与第二势场关联的第二阶段成本包含于在模型预测控制部43的模型预测控制中所算出的阶段成本中(参照所述式3)。另外,第二阶段成本能够以下述式7来表示。

[数7]

npobs=|pt-p62|

…(式7)

其中,pt为实际设备6的位置,k为与第二势场关联的系数,在本实施方式中与式6所示的k相同。

通过像这样使第一阶段成本与第二阶段成本包含于在模型预测控制部43的模型预测控制中所算出的阶段成本中,从而能够从追随目标轨道的其中一侧使实际障碍物61的第一势场的斥力作用于实际设备6,并从追随目标轨道的另一侧使虚拟障碍物62的第二势场的斥力作用于实际设备6。图4中描绘(plot)了在实际障碍物61相对于实际设备6所追随的追随目标轨道而以30度的进入角θ行进的情况下,进行本实施方式的模型预测控制时的实际设备6、实际障碍物61、虚拟障碍物62的轨迹。另外,图4中须留意的是,供模型预测控制的控制轴为横轴与纵轴这两个。据此能够理解的是,根据通过本实施方式的模型预测控制而算出的控制指令u,实际设备6在与实际障碍物61接近时较佳地得以减速,从而能以在实际障碍物61的后方回避的形式而较佳地维持追随目标轨道上的追随控制。

<第一结构例>

基于图5来说明本结构例的伺服驱动器4所进行的伺服控制。本结构例的伺服驱动器4中,与所述适用例同样地,通过模型预测控制部43来进行模型预测控制,但此时,伺服积分器41的输出z是由状态获取部42所获取,以供所述模型预测控制。具体而言,从标准plc5发送的目标指令r与由反馈系统44所反馈的实际设备6的输出y的偏差e(e=r-y)被输入至伺服积分器41。并且,所述伺服积分器41的输出z经由状态获取部42而输入至模型预测控制部43。因此,通过状态获取部42,对与实际设备6相关的所述状态变量追加输出z,以供模型预测控制部43所进行的模型预测控制。

这样,基于包含伺服积分器41的控制结构,本结构中的模型预测控制部43所具有的预测模型例如能够以下述式8表示。

[数8]

式8中的(r-y)表示偏差e。并且,能够理解的是,在所述预测模型中,包含有以偏差e(r-y)与第一积分增益ki及第二积分增益ζ之积所表示的积分项。第一积分增益ki及第二积分增益ζ之积相当于规定的积分增益。由此,在使用模型预测控制的伺服驱动器4所进行的伺服控制中,除了适用例中所示的与实际障碍物的碰撞回避以及对目标指令的较佳的追随性的效果以外,还容易调整成为伺服控制驱动源的积分量,无须像以往那样利用干扰模型的扩展或观测器增益的设计等需要并不容易的调整的干扰观测器,而容易实现抑制了过冲(overshoot)的伺服控制。

此处,构成式8所示的预测模型中所含的积分项的规定积分增益的第一积分增益ki如图6的上段(a)所示,能够基于偏差e来调整。具体而言,以下述方式来调整所述第一积分增益ki,即,随着偏差e的大小变小,而第一积分增益ki的值变大。例如,在偏差e的大小为规定的e0以上的情况下,第一积分增益ki成为0,在偏差e的大小小于e0的范围内将对第一积分增益ki设定比0大且为1以下的值。而且,第一积分增益ki的推移被设定为,偏差e的大小越接近0,则第一积分增益ki的值急遽地接近1,当偏差e的大小为0时,第一积分增益ki成为1。这样,能够基于偏差e的大小来调整第一积分增益ki,由此,在实际设备6的输出y相对背离目标指令r的情况下,第一积分增益ki的值被调整为小,从而将用于伺服控制的积分量调整为不会不必要地积压。而且,当实际设备6的输出y与目标指令r的背离量变少时,即,当偏差e的大小变小时,第一积分增益ki的值被调整为大,因此能够有效地提高伺服控制中的追随性。通过像这样使第一积分增益ki的值发生变动,从而既能兼顾振动抑制与过冲抑制,又能实现较佳的伺服控制的追随性。

另一方面,若考虑实际设备6与实际障碍物61的关系,则当两者的距离(范数(norm))变小时,基本上成为两者的碰撞回避应优选于对目标指令的追随性的状况。此种状况下,如上所述,若通过第一积分增益ki的作用,而预测模型的规定的积分项的影响比起实际障碍物61及虚拟障碍物62的关联的第一阶段成本及第二阶段成本的影响而相对较大,则与实际障碍物61的碰撞回避有可能变得困难。因此,在规定的积分增益中,包含第二积分增益ζ。第二积分增益ζ如图6的下段(b)所示,能够基于与实际设备6跟实际障碍物61发生碰撞的可能性关联的参数、例如实际设备6与实际障碍物61的分隔距离(范数)ncol来调整。具体而言,在所述范数ncol的大小为规定的ncol0以上的情况下,第二积分增益ζ成为1,在范数ncol的大小小于ncol0的范围内将对第二积分增益ζ设定0以上且1以下的值。而且,第二积分增益ζ的推移被设定为,范数ncol的大小越接近0,则第二积分增益ζ的值越急遽地接近0。

这样,在式8所示的预测模型的规定的积分项中,规定的积分增益包含所述第一积分增益ki与第二积分增益ζ之积。因此,基本上,通过与偏差e相应的第一积分增益ki带来的积分效果,可实现对目标指令r的追随性的提高,但在实际设备6与实际障碍物61的范数变小而碰撞的可能性提高的情况下,通过第二积分增益ζ的效果,可实现所述积分效果的缓和。图7中描绘了在实际障碍物61相对于实际设备6所追随的追随目标轨道而以30度的进入角θ行进的情况下,进行本实施方式的模型预测控制时的实际设备6、实际障碍物61、虚拟障碍物62的轨迹。另外,图7中须留意的是,供模型预测控制的控制轴为横轴与纵轴这两个。而且,图7的上段(a)描绘了式8所示的预测模型的规定的积分项中仅包含第一积分增益ki时的轨迹,其下段(b)描绘了如式8所示那样在所述规定的积分项中包含第一积分增益ki及第二积分增益ζ时的轨迹。据此能够理解的是,在上段(a),通过所述积分效果,对目标指令的追随性良好,但实际设备6与实际障碍物61的碰撞回避不够充分。另一方面,在下段(b),所述积分效果得到缓和,结果,实际设备6的减速有效地发挥作用,从而在实际障碍物61的后方回避。

另外,关于第一积分增益ki及第二积分增益ζ的调整,与图6所示的偏差e或范数ncol和各积分增益的相关有关的数据也可被保存在伺服驱动器4的存储器内,此时,通过模型预测控制部43访问所述数据来进行所述各积分增益的调整。

<第二结构例>

对本结构例的伺服驱动器4所进行的伺服控制进行说明。若在避免了实际设备6与实际障碍物61的碰撞后,继续考虑到虚拟障碍物62的模型预测控制,则由虚拟障碍物62的第二势场所形成的斥力有可能对实际设备6对目标指令r的追随性造成不好的影响。因此,本结构例的伺服驱动器4中的模型预测控制部43所具有的模型预测控制中,例如依据下述式9来算出第二阶段成本。另外,本结构例可适用的控制结构为图2及图5的哪一种皆可。

[数9]

npobs=|pt-p62|

pseudopot=(tanh((pcross-pt)×kz)+1)/2

…(式9)

其中,所述pcross是实际设备6有可能与实际障碍物61发生碰撞的位置,例如是实际设备6的追随目标轨道、与设想实际障碍物61所行进的障碍物轨道交叉的交叉点的位置。应留意的是,pcross并非实际设备6实际与实际障碍物61发生碰撞的位置,而是设想通过本实施方式能避免所述碰撞但有可能引起碰撞的位置。因此,在实际设备6经过了以pcross表示的位置后,基本上意味着实际设备6与实际障碍物61的碰撞的可能性变小。

而且,关于所述交叉点位置pcross,能够基于所获取的实际障碍物的过去的位置而获取。作为一例,根据由获取部45所获取的最近两点的实际障碍物的位置op1、op2来对其移动进行直线近似,进而,根据对应时机的实际设备6的两点位置tp1、tp2来对其移动进行直线近似。并且,两直线的交点的位置设为交叉点位置pcross。

第二阶段成本是通过依据所述式9而以下述方式算出,即,至少在实际设备6经过了交叉点位置pcross后,在模型预测控制中的阶段成本的计算中,实际设备6的位置距交叉点位置pcross越远,则第二阶段成本越小。其结果,在实际设备6经过了交叉点位置pcross后,能够降低因虚拟障碍物62的第二势场引起的、对实际设备6的不慎的作用,从而能够避免追随性下降。

图8中描绘了在实际障碍物61相对于实际设备6所追随的追随目标轨道而以30度的进入角θ行进的情况下,进行本实施方式的模型预测控制时的实际设备6、实际障碍物61、虚拟障碍物62的轨迹。另外,图8中须留意的是,供模型预测控制的控制轴为横轴与纵轴这两个。根据图8也能够理解的是,在实际设备6经过了交叉点位置pcross后,表示虚拟障碍物62的描绘的大小变小。这意味着,通过所述式9的pseudopot,第二阶段成本的值被计算得小。其结果,在实际设备6经过了交叉点位置pcross后,虚拟障碍物62的影响得到缓和,能够避免实际设备6对目标指令r的追随性下降。

另外,所述式9中,在实际设备6经过了交叉点位置pcross后,实际设备6距交叉点位置pcross越远,则第二阶段成本的值被算出得越小,但也可在从实际设备6临近交叉点位置pcross之前便开始像这样将第二阶段成本的值算出得小。进而,作为其他方法,也可在实际设备6经过了交叉点位置pcross后将第二阶段成本的值设为零。

<第三结构例>

对本结构例的伺服驱动器4所进行的伺服控制进行说明。实际障碍物61的进入角越接近90度,则由实际障碍物61的第一势场所形成的斥力、及由与实际障碍物61对应的虚拟障碍物的第二势场所形成的斥力越难以作用于实际设备6,从而越难较佳地实现与实际障碍物61的碰撞回避。因此,在本结构例的伺服驱动器4中的模型预测控制部43所具有的模型预测控制中,例如依据下述式10来算出第二阶段成本。另外,本结构例可适用的控制结构为图2及图5的哪个皆可。

[数10]

npobs=|pt-p62|

pseudopot=1+sinθ

…(式10)

第二阶段成本是通过依据所述式10而以下述方式算出,即,实际障碍物61的进入角越接近90度,则第二阶段成本越大。其结果,即使实际障碍物61的进入角接近90度,实际设备6也能够确保对目标指令r的追随性,并且能较佳地避免与实际障碍物61的碰撞。

图9中描绘了在实际障碍物61相对于实际设备6所追随的追随目标轨道而以90度的进入角θ行进的情况下,进行本实施方式的模型预测控制时的实际设备6、实际障碍物61、虚拟障碍物62的轨迹。另外,图9中须留意的是,供模型预测控制的控制轴为横轴与纵轴这两个。而且,图9的上段(a)描绘了式10所示的预测模型的pseudopot固定为固定值(=1)时的轨迹,其下段(b)描绘了依据式10而根据进入角90度来调整了所述pseudopot时的轨迹。据此能够理解的是,在上段(a),由于进入角为90度,因此如上所述,各势场产生的斥力难以作用于实际设备6,结果,实际设备6将在移动的实际障碍物61的前方回避,其回避量也相对较大。另一方面,在下段(b),考虑进入角θ来算出第二阶段成本。即,在进入角为90度的情况下,pseudopot的值为2,比起上段(a)的情况,pseudopot的值成为两倍。其结果,能够使虚拟障碍物62的第二势场所产生的斥力的影响相对较大地起作用,从而如下段(b)所示,能够使实际设备6在移动的实际障碍物61的后方回避,其回避量也相对较小。

另外,所述的示例中,使进入角θ反映到第二阶段成本的计算中,但也可进一步如下述式11所示那样,使进入角θ也反映到第一阶段成本的计算中。

[数11]

nobs=|pt-p61|

…(式11)

进而,也可一并采用在所述第二结构例中公开的技术思想,而如下述式12所示那样,使进入角θ反映到第二阶段成本的计算中。

[数12]

npobs=|pt-p62|

pseudopot

=(1+sinθ)×(tanh((pcross-pt)×kz)+1)/2

…(式12)

<第四结构例>

对本结构例的伺服驱动器4所进行的伺服控制进行说明。本结构例中,提及在实际设备6进行对目标指令r的追随控制时,识别出多个(例如两个)实际障碍物61a、61b(参照后述的图10)的存在并由获取部45来获取各个位置时的模型预测控制。在本结构例的模型预测控制部43所进行的模型预测控制中,根据下述式12,关于所识别出的两个实际障碍物61a、61b分别算出第一阶段成本,并且关于各自对应地由设定部46所设定的虚拟障碍物62a、62b分别算出第二阶段成本。

[数13]

另外,关于各第一阶段成本及各第二阶段成本的计算,如至此为止所述的适用例及结构例所示那样。

通过像这样根据式13而在模型预测控制中算出阶段成本,从而即使在存在多个实际障碍物61a、61b的情况下,也能够较佳地兼顾实际设备6对目标指令r的追随性和与各实际障碍物的碰撞回避。图10中描绘了在两个实际障碍物61a、61b相对于实际设备6所追随的追随目标轨道而行进的情况下,进行本实施方式的模型预测控制时的实际设备6、实际障碍物61a、实际障碍物61b以及虚拟障碍物62a、虚拟障碍物62b的轨迹。另外,图10中须留意的是,供模型预测控制的控制轴为横轴与纵轴这两个。虚拟障碍物62a、虚拟障碍物62b分别是由设定部46以与实际障碍物61a、实际障碍物61b对应的方式而设定。而且,图10所示的形态中,如结构例2中所示的那样,在实际设备6经过了与各实际障碍物的交叉点位置后,将与跟所述实际障碍物对应的虚拟障碍物关联的第二阶段成本的值设为零。根据图10也能够理解的是,通过依据式13来进行本实施方式的模型预测控制,实际设备6既能在两个实际障碍物61a、61b各自的后方回避,又能较佳地维持对目标指令r的追随性。

而且,即使在实际障碍物的数量为三个以上的情况下,通过设定部46来设定与此数量相应的虚拟障碍物,并算出各自关联的第一阶段成本及第二阶段成本而进行模型预测控制,由此,也能避免与各个实际障碍物的碰撞,并实现对目标指令r的较佳的追随。

但是,若在所述模型预测控制中考虑的实际障碍物的数量变多,则与此数量相应地,伺服驱动器4的处理负荷将变大,有可能对实际设备6的实时的追随控制造成妨碍。因此,也可考虑伺服驱动器4的处理负荷,将在所述模型预测控制中考虑的实际障碍物及与此相应地设定的虚拟障碍物的数量限定为规定数(例如各为两个)。此种情况下,若识别出超过规定数的规定超过数的实际障碍物(例如三个)的存在,并由获取部45获取了规定超过数的实际障碍物的位置,则从所述规定超过数的实际障碍物中,依据规定的基准来提取在模型预测控制中能够考虑的最大限度的规定数的实际障碍物。作为所述规定的基准,可考虑实际设备6与实际障碍物的碰撞的可能性,而利用实际设备6与实际障碍物的分隔距离。例如,所述分隔距离越小,则碰撞的可能性越高,意味着处于应优先避免所述碰撞的状态,因此也可按照所述分隔距离从小到大的顺序来提取作为规定数的实际障碍物。然后,在模型预测控制中,基于所提取的实际障碍物各自的位置,来算出各自关联的第一阶段成本,且基于与所述提取的规定数的实际障碍物对应的规定数的虚拟障碍物各自的位置,来算出各自关联的第二阶段成本。通过采用此种结构,适当抑制了伺服驱动器4的处理负荷后,实现实际设备6的实时的较佳的追随控制。

<附注1>

一种控制装置(4),包括模型预测控制部(43),且使控制对象的输出追随于规定的目标指令,所述模型预测控制部(43)具有一预测模型,所述预测模型以规定的状态方程式的形式而划定了跟所述控制对象(6)相关的规定的状态变量与对所述控制对象(6)的控制输入的相关,且所述模型预测控制部(43)针对所述控制对象(6)的输出应追随的所述规定的目标指令,在规定时宽的预测区间内依据规定的评估函数来进行基于所述预测模型的模型预测控制,并至少输出所述预测区间的初始时刻的所述控制输入的值,所述控制装置(4)包括:

第一获取部(45),获取实际的障碍物即实际障碍物(61)相对于所述控制对象(6)的位置;以及

设定部(46),基于由所述第一获取部(45)所获取的所述实际障碍物(61)的位置来设定虚拟障碍物(62)的位置,以使得跟所述实际障碍物(61)相关联的所述虚拟障碍物(62)以基于所述规定的目标指令的、所述控制对象(6)的追随目标轨道为基准而位于与所述实际障碍物(61)大致对称之处,

通过所述规定的评估函数而算出的阶段成本包含:状态量成本,为与所述规定的状态变量相关的阶段成本;控制输入成本,为与所述控制输入关联的阶段成本;第一阶段成本,与第一概率势场关联,所述第一概率势场是基于所述实际障碍物(61)的位置来表示所述实际障碍物(61)可能存在的概率;以及第二阶段成本,与第二概率势场关联,所述第二概率势场是基于所述虚拟障碍物(62)的位置来表示所述虚拟障碍物(62)可能存在的概率的概率势场且具有所述第一概率势场以上的概率值。

<附注2>

一种控制装置(4),包括模型预测控制部(43),且使控制对象的输出追随于规定的目标指令,所述模型预测控制部(43)具有一预测模型,所述预测模型以规定的状态方程式的形式而划定了跟所述控制对象(6)相关的规定的状态变量与对所述控制对象(6)的控制输入的相关,且所述模型预测控制部(43)针对所述控制对象(6)的输出应追随的所述规定的目标指令,在规定时宽的预测区间内依据规定的评估函数来进行基于所述预测模型的模型预测控制,并至少输出所述预测区间的初始时刻的所述控制输入的值,所述控制装置(4)包括:

伺服用积分器(41),输入所述规定的目标指令与所述控制对象的输出的偏差;

第一获取部(45),获取实际的障碍物即实际障碍物(61)相对于所述控制对象(6)的位置;以及

设定部(46),基于由所述第一获取部(45)所获取的所述实际障碍物(61)的位置来设定虚拟障碍物(62)的位置,以使得跟所述实际障碍物(61)相关联的所述虚拟障碍物(62)以基于所述规定的目标指令的、所述控制对象(6)的追随目标轨道为基准而位于与所述实际障碍物(61)大致对称之处,

通过所述规定的评估函数而算出的阶段成本包含:状态量成本,为与所述规定的状态变量相关的阶段成本;控制输入成本,为与所述控制输入关联的阶段成本;第一阶段成本,与第一概率势场关联,所述第一概率势场是基于所述实际障碍物(61)的位置来表示所述实际障碍物(61)可能存在的概率;以及第二阶段成本,与第二概率势场关联,所述第二概率势场是基于所述虚拟障碍物(62)的位置来表示所述虚拟障碍物(62)可能存在的概率的概率势场且具有所述第一概率势场以上的概率值,

与所述控制对象(6)关联的状态变量包含以所述偏差与规定的积分增益之积表示的规定的积分项,

所述控制对象与所述实际障碍物之间的距离越短,则所述规定的积分增益越小。

符号的说明

1:网络

2:马达

3:负载装置

4:伺服驱动器

5:标准plc

6:实际设备

41:伺服积分器

42:状态获取部

43:模型预测控制部

45:获取部

46:设定部

61:实际障碍物

62:虚拟障碍物

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1