协作机器人主动动作决策方法、系统、设备及存储介质

文档序号:31224791发布日期:2022-08-23 18:46阅读:237来源:国知局
协作机器人主动动作决策方法、系统、设备及存储介质

1.本发明属于机器人控制领域,涉及一种协作机器人主动动作决策方法、系统、设备及存储介质。


背景技术:

2.协作机器人的自主决策能力,是降低与工人碰撞的风险、提高合作效率的有效手段,是实现机器人安全自主和灵活性的重要能力,但当前协作机器人的决策能力并不满足复杂的工业制造领域,在有人存在的复杂动态系统中,缺乏综合考虑工作效率、碰撞风险及工人的非理性等因素对机器人避碰决策行为的相关研究。
3.为了做出最优的行为决策,协作机器人需要预判人要通过潜在碰撞区域的意愿有多大,需要可以实时准确监测人机间碰撞距离的设备和算法,需要估计自身的工作效率,并结合三种因素来综合判断并在极短的时间内做出安全合理的决策。而人做出的判断和决策往往是主观的、有限理性的,当协作机器人与人近距离工作在具有潜在碰撞风险的场景时,频繁判断碰撞风险会极大增加人对工作的认知负荷,且由于协作机器人较低的决策分析能力,极易造成判断的失误,进而导致协作机器人与人之间的碰撞风险增大。


技术实现要素:

4.本发明的目的在于克服上述现有技术中,由于协作机器人较低的决策分析能力,导致协作机器人与人之间的碰撞风险增大的缺点,提供一种协作机器人主动动作决策方法、系统、设备及存储介质。
5.为达到上述目的,本发明采用以下技术方案予以实现:
6.本发明第一方面,一种协作机器人主动动作决策方法,包括:
7.获取人和机器人的当前位置、当前速度以及目标点位置,并通过预设的效率直觉模糊集模型,得到人和机器人的效率直觉模糊集;
8.获取人的当前心理安全场场强,并通过预设的舒适度直觉模糊集模型,得到人的舒适度梯形直觉模糊集;
9.获取人机之间的距离,计算人和机器人以当前速度移动到潜在碰撞区域的时间,以及机器人以预设最大加速度减速到停止的时间,利用评估碰撞风险方法,得到机器人的安全性直觉模糊集;
10.加权人的效率直觉模糊集和舒适度梯形直觉模糊集,得到人的动作意图的直觉模糊集;
11.加权人的动作意图的直觉模糊集、机器人的效率直觉模糊集以及机器人的安全性直觉模糊集,得到避碰直觉模糊集;
12.根据避碰直觉模糊集,得到机器人是否采取避让的动作决策。
13.可选的,所述通过预设的效率直觉模糊集模型,得到人和机器人的效率直觉模糊集包括:
14.通过下式得到人的效率直觉模糊集
[0015][0016][0017][0018][0019][0020]
通过下式得到机器人的效率直觉模糊集
[0021][0022][0023]
其中,为人的效率直觉模糊集,μh(t)和υh(t)分别为人的效率直觉模糊集随时间t变化的隶属度和非隶属度函数,为机器人的效率直觉模糊集,μr(t)和υr(t)分别为机器人的效率直觉模糊集随时间t变化的隶属度和非隶属度函数,t0为当前位置人以当前速度到达目标点所需的时间,ts为人以最大速度1.8m/s到达目标点所需的时间,t
l
为人以(ts,1)和确定的直线与x轴相交点的x轴坐标,s为当价值函数的值为零时对应的时间,f(t)为价值函数,w
+
(p)和w-(p)分别为决策权重函数在收益区域和损失区域的值,γ、δ、α和β为预设参数,0《γ,δ《1,λ是损失厌恶系数,当λ》1时,人类被建模为损失厌恶者,对损失的重视程度高于收益,p表示以时间t到达目标点位置的概率,t
sr
为机器人以最大速度运动到目标点所需的时间;tr为机器人以当前速度到达目标点所需的时间;t
lr
为以(t
sr
,1)和确定的直线与x轴相交点的x轴坐标,机器人效率价值函数在t
lr
时刻的效率为零。
[0024]
可选的,所述获取人的当前心理安全场场强,通过预设的舒适度直觉模糊集模型,得到人的舒适度梯形直觉模糊集包括:
[0025]
根据机器人的当前速度,通过下式的心理安全场场强公式得到人的当前心理安全场场强:
[0026]
se
p
=sei+sev[0027][0028][0029]
其中,se
p
为心理安全场,sei为静态障碍物产生的势能场,sev为机器人运动对人造成的心理压力情绪形成的动能场,mo为障碍物的质量,单位是kg;di为障碍物与周围环境的距离标量,ko是心理安全场常数,单位是n
·
m2/kg2,qo是障碍物的危险程度,根据障碍物的性质、体积、尖锐程度等的不同而取值不同,kr表示人对机器人运动危险程度的认知,单位是n
·
m2/kg2,决定于个人的性别、性格和经验等,qr是机器人及其夹持物体的危险程度,根据机器人外形、体积和夹持的物品等的不同取值不同,mr是机器人的质量,单位是kg;dv为机器人基座中心点周围环境之间的标量距离,sp(dr,v)代表了机器人不同的运动方式对人造成的心理压力情绪的影响规律,当机器人与人最近的运动部件以不同的最小间距dr、速度v和接近方向接近人时,对人造成的心理压力情绪不同,首先判断机器人距离人体最近的部位是头部、胸部还是腹部,再根据最接近的部位选用影响规律方程:
[0030]
sh=z
0h
+ah·dr
+bh·
v+ch·dr2
+dh·
v2+eh·dr
·v[0031]
sc=z
0c
+ac·dr
+bc·
v+cc·dr2
+dc·
v2+ec·dr
·v[0032]
sa=z
0a
+aa·dr
+ba·
v+ca·dr2
+da·
v2+ea·dr
·v[0033]
sh、sc、sa分别为机器人靠近人体头部、胸部和腹部时对人造成的心理压力情绪sp(dr,v),z
0h
、z
0c
、z
0a
、ah、ac、aa、bh、bc、ba、ch、cc、ca、eh、ec和ea均为拟合参数,dr为机器人与人最近的运动部件和人之间的间距、v为机器人接近人的速度。
[0034]
通过下式得到人的舒适度梯形直觉模糊集
[0035][0036][0037]
其中,为人的舒适度梯形直觉模糊集,μ
se
(x)和ν
se
(x)分别为人的舒适度梯形
直觉模糊集的隶属度和非隶属度函数,se
ph
为机器人当前动作对人的心理影响的大小,h为机器人当前动作速度,se
p0.3
,se
p0.5
,se
p0.8
,se
p1
为机器人速度分别在0.3m/s、0.5m/s、0.8m/s和1m/s时的se
ph
,wa和ua分别为预设的人感到最舒适的隶属度和对应的非隶属度;
[0038]
可选的,所述获取人和机器人之间的距离,计算人和机器人以当前速度移动到潜在碰撞区域的时间,以及机器人以预设最大加速度减速到停止的时间,利用评估碰撞风险方法,得到机器人的安全性直觉模糊集包括:
[0039]
获取人和机器人之间的距离,计算人和机器人以当前速度移动到潜在碰撞区域的时间ttrh和ttrr,以及机器人以预设最大加速度减速到停止的时间ttsr,通过下式得到:
[0040][0041][0042][0043]
其中,ttrh和ttrr分别为人和机器人以当前速度移动到潜在碰撞区域的时间,ttsr为机器人以预设最大加速度减速到停止的时间,ph为人的当前位置,pc为潜在碰撞区域的位置,ae为机器人的加速度,pr为机器人的当前位置,vh为人的当前速度,vr为机器人的当前速度。
[0044]
通过下式得到机器人的安全性直觉模糊集
[0045][0046]
μs(x)=1-νs(x)
[0047]
其中,为机器人的安全性直觉模糊集,μs(x)和νs(x)分别为机器人的安全性直觉模糊集的隶属度和非隶属度函数,为机器人在到达碰撞区域的剩余时间,ttrh和ttrr分别为人和机器人以当前速度移动到潜在碰撞区域的时间,ttsr为机器人以预设最大加速度减速到停止的时间,vh为人的当前速度,vr为机器人的当前速度。
[0048]
可选的,所述加权人的效率直觉模糊集和舒适度梯形直觉模糊集,得到人的动作意图的直觉模糊集包括:
[0049]
获取人对于效率和舒适度的重要性权重;
[0050]
根据人对于效率和舒适度的重要性权重,通过下式加权人的效率直觉模糊集和舒适度梯形直觉模糊集,得到人的动作意图的直觉模糊集
[0051][0052]
其中,为人的动作意图的直觉模糊集,μk(x)和νk(x)分别为人的动作意图的直觉模糊集的隶属度和非隶属度函数,we和w
se
分别为人对于效率和舒适度的重要性权重,为
人的效率直觉模糊集,为人的舒适度梯形直觉模糊集。
[0053]
可选的,所述加权人的动作意图的直觉模糊集、机器人的效率直觉模糊集以及机器人的安全性直觉模糊集,得到避碰直觉模糊集包括:
[0054]
获取机器人对安全性、人的动作意图和工作效率的重要性权重;
[0055]
根据机器人对安全性、人的动作意图和工作效率的重要性权重,通过下式加权人的动作意图的直觉模糊集、机器人的效率直觉模糊集以及机器人的安全性直觉模糊集,得到避碰直觉模糊集
[0056][0057]
其中,为避碰直觉模糊集,μc(x)和νc(x)分别为避碰直觉模糊集的隶属度和非隶属度函数,ws,wk和分别为机器人对安全性、人的动作意图和工作效率的重要性权重,为机器人感知的安全性直觉模糊集,为人的动作意图的直觉模糊集,为机器人的效率直觉模糊集。
[0058]
可选的,所述根据避碰直觉模糊集,得到机器人是否采取避让的动作决策包括:
[0059]
当人采取通过潜在碰撞区域而机器人暂时屈服时,将避碰直觉模糊集记作当人采取暂时屈服而机器人采取通过潜在碰撞区域动作时,将避碰直觉模糊集记作其中,和分别为当人采取通过潜在碰撞区域而机器人暂时屈服时避碰直觉模糊集的隶属度和非隶属度函数,和分别为当人采取暂时屈服而机器人采取通过潜在碰撞区域动作时避碰直觉模糊集的隶属度和非隶属度函数;
[0060]
通过预设的直觉模糊集排序方法,比较和的大小,当大于时,人采取通过潜在碰撞区域而机器人暂时屈服;否则,人采取暂时屈服而机器人采取通过潜在碰撞区域动作;
[0061]
其中,预设的直觉模糊集排序方法包括:
[0062]
将和依次作为模糊集通过下述方式得到和的排序结果:
[0063]
记的得分值和精确值分别为:当时,大于当时,如果则等于如果则小于如果则大于
[0064]
其中,μ和ν分别为模糊集的隶属度和非隶属度函数,为模糊集的得分值,为模糊集的精确值。
[0065]
本发明第二方面,一种协作机器人主动动作决策系统,包括:
[0066]
效率处理模块,用于获取人和机器人的当前位置、当前速度以及目标点位置,并通过预设的效率直觉模糊集模型,得到人和机器人的效率直觉模糊集;
[0067]
舒适度处理模块,用于获取人的当前心理安全场场强,并通过预设的舒适度直觉模糊集模型,得到人的舒适度梯形直觉模糊集;
[0068]
安全性处理模块,用于获取人和机器人之间的距离,计算人和机器人以当前速度移动到潜在碰撞区域的时间,以及机器人以预设最大加速度减速到停止的时间,利用评估碰撞风险方法,得到机器人的安全性直觉模糊集;
[0069]
第一加权模块,用于加权人的效率直觉模糊集和舒适度梯形直觉模糊集,得到人的动作意图的直觉模糊集;
[0070]
第二加权模块,用于加权人的动作意图的直觉模糊集、机器人的效率直觉模糊集以及机器人的安全性直觉模糊集,得到避碰直觉模糊集;
[0071]
决策模块,用于根据避碰直觉模糊集,得到机器人是否采取避让的动作决策。
[0072]
本发明第三方面,一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述协作机器人主动动作决策方法的步骤。
[0073]
本发明第四方面,一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述协作机器人主动动作决策方法的步骤。
[0074]
与现有技术相比,本发明具有以下有益效果:
[0075]
本发明协作机器人主动动作决策方法,基于获取的人和机器人的当前位置、当前速度以及目标点位置,通过预设的效率直觉模糊集模型,得到人和机器人的效率直觉模糊集,并且获取人的当前心理安全场场强,并通过预设的舒适度直觉模糊集模型,得到人的舒适度梯形直觉模糊集,通过获取人机之间的距离,分别计算人和机器人以当前速度移动到潜在碰撞区域的时间,以及机器人以预设最大加速度减速到停止的时间,得到机器人的安全性直觉模糊集,然后加权人的效率直觉模糊集和舒适度梯形直觉模糊集,得到人的动作意图的直觉模糊集,考虑到了人对工作效率的判断存在着主观情绪影响,使得对人类意图的建模更加贴近现实,最终加权人的动作意图的直觉模糊集、机器人的效率直觉模糊集以及机器人的安全性直觉模糊集,得到避碰直觉模糊集,融合人的意图、安全性和效率三者,有效提高预测人在具有潜在碰撞风险情形下的主观动作决策意图的准确性,降低机器人与人之间的碰撞情况的发生。
附图说明
[0076]
图1是本发明实施例的人和机器人在狭小空间近距离协同装配时在同一位置拾取或者放置零件交互场景的具体描述示意图;
[0077]
图2是本发明实施例的协作机器人主动动作决策方法的整体流程图;
[0078]
图3是本发明实施例的人认为的决策权重函数曲线图;
[0079]
图4是本发明实施例的期望效用函数和累积前景函数的关系图;
[0080]
图5是本发明实施例的人的效率的直觉模糊集曲线图;
[0081]
图6是本发明实施例的机器人的效率的直觉模糊集曲线图;
[0082]
图7是本发明实施例的人的舒适度直觉模糊数的隶属度和非隶属度函数曲线图;
[0083]
图8是本发明实施例的人机双方同时趋向潜在碰撞区域时人和机器人的决策结果统计图。
具体实施方式
[0084]
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
[0085]
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0086]
针对背景技术中所介绍的,协作机器人的自主决策能力,是降低与工人碰撞的风险、提高合作效率的有效手段,是实现机器人安全自主和灵活性的重要能力,但当前协作机器人的决策能力并不满足复杂的工业制造领域,在有人存在的复杂动态系统中,缺乏综合考虑工作效率、碰撞风险、工人的非理性等因素对机器人避碰决策行为的相关研究。因此,目前缺乏一种可以衡量人的模糊决策意图并制定决策的方法来解决协作机器人的主动动作决策问题,以提高协作机器人工作效率、人机安全性、降低人的认知负荷、提高舒适度和信任感。
[0087]
针对这一问题,本发明提出了一种协作机器人主动动作决策方法,允许机器人在近距离合作时,实时根据人类同事的动作选择适当的行动。所提出的协作机器人主动动作决策方法以人机协作场景中,人机同时趋向同一目标或动作轨迹产生重合的场景作为研究对象,综合考虑安全性、工人的意图和机器人工作效率因素,评价静态斗鸡博弈中出现的两种纳什均衡的得分值和精度值,实现协作机器人主动动作决策。下面对上述方案进行详细阐述。
[0088]
下面结合附图对本发明做进一步详细描述:
[0089]
参见图1,图中的场景给出人机在共享空间中相互配合中遇到的挑战:人和机器人都在同一位置拾取零件完成装配,此时,机器人无法通过改变轨迹的方式避开人,有限的空间必须让机器人在极短的时间内做出继续运行或者加速通过潜在碰撞区域以获取零件保证工作效率或暂时停止保证人机安全的选择,而人和机器人在共享空间有冲突和不便躲避的场景也类似给出的场景。在这种情况下,由于人对安全性、效率和完成工作的渴望等因素的综合判断往往是非常主观的,并在极短的时间内做出是否通过潜在碰撞区域的决定,这就为机器人的行为决策提出了非常大的挑战,且随着人机之间的距离的缩短,最佳行为决策的挑战就越大。
[0090]
而造成这种挑战的主要原因是,为了做出最优的行为决策,机器人需要预判人要通过潜在碰撞区域的意愿有多大,需要可以实时准确监测人机间碰撞距离的设备和算法,需要估计自身的工作效率,并结合三种因素来综合判断并在极短的时间内做出安全合理的决策。而对三种因素的判断本身就是不准确和模糊的,尤其针对人的意图的判断往往是模糊的、概率的,这是由于人不是一个完全理性的智能单位,人做出的判断和决策往往是主观的、有限理性的,而当人机近距离工作在具有潜在碰撞风险的场景下,长时间判断碰撞风险会极大增加人对工作的认知负荷,造成判断的失误导致碰撞风险增大。所以急需要一种可以衡量人的模糊决策意图并制定决策的方法来解决机器人决策问题,提高机器人工作效率,人机安全性,降低人的认知负荷、提高舒适度和信任感。人机协作中无法通过轨迹优化避免的具有潜在碰撞风险的场景。
[0091]
本实施例主要是针对上述场景进行机器人动作决策:当人和机器人在狭小空间近距离协同装配时,人和机器人在同一位置拾取或者放置零件,人和机器人之间没有语言等方式的信息沟通,不能规划人和机器人之间的动作顺序,两者在拾取零件的过程中会产生潜在的碰撞风险,而且由于空间的限制无法通过优化机器人轨迹的方法避碰,人和机器人必须有一方采取暂时屈服的策略才能避免碰撞。
[0092]
本实例关注的这种场景更加符合智能协作机器人在应用时实际遇到的情况,因为在实验中发现,当人在坐姿工作或者不能随意移动当前位置的工作状态下,遇到上面描述的具有潜在碰撞风险且无法通过优化轨迹避碰的情况更喜欢加速通过潜在碰撞区域,抢在机器人之前完成工作提高工作效率或者暂时停止以保证自身安全,而且人也希望机器人可以采取类似的动作策略。这是因为这样的动作策略更符合人-人协作的行为模式,而不是让机器人从人手上方穿过,虽然这种方式确实可以避碰并减少时间的浪费,但是却让人感到不舒适或不安全。
[0093]
这类场景与博弈论中提出的“斗鸡博弈”类似,当双方都希望通过独木桥的双方相遇时,如果双方都选择通过,则会出现两败俱伤的结果,而都选择屈服则双方都不能通过,只有一方通过另一方暂时屈服才能安全的让两方顺利过桥,但是对于选择屈服的一方通过桥的时间延长,效率降低。博弈论认为博弈的双方是非合作的,有限策略的,非零和的博弈。对于静态斗鸡博弈有两个纳什均衡解,如表1所示,即博弈的双方都完全清楚对方的所有策略并同时进行选择时,只有这两种方式可以达到战略平衡。如果允许混合策略的存在,则双方会以概率的形式选择各自的策略达成均衡,使双方的收益达到平衡,双方不能通过改变各自的策略使另一方收益降低。所以为了解决此情景还需要比较不同策略的成本函数,找到成本最小的一个作为纳什均衡的解,作为各自采取的策略。
[0094]
表1斗鸡博弈与纳什均衡表
[0095][0096]
参见图2,发明一实施例中,提供一种协作机器人主动动作决策方法,有效解决现
有技术中的无法综合考虑人的有限理性意图动作和机器人自身工作效率的问题,该协作机器人主动动作决策方法包括以下步骤:
[0097]
s1:获取人和机器人的当前位置、当前速度以及目标点位置,并通过预设的效率直觉模糊集模型,得到人和机器人的效率直觉模糊集。
[0098]
s2:获取人的当前心理安全场场强,并通过预设的舒适度直觉模糊集模型,得到人的舒适度梯形直觉模糊集。
[0099]
s3:获取人和机器人之间的距离,计算人和机器人以当前速度移动到潜在碰撞区域的时间,以及机器人以预设最大加速度减速到停止的时间,利用评估碰撞风险方法,得到机器人的安全性直觉模糊集。
[0100]
s4:加权人的效率直觉模糊集和舒适度梯形直觉模糊集,得到人的动作意图的直觉模糊集。
[0101]
s5:加权人的动作意图的直觉模糊集、机器人的效率直觉模糊集以及机器人的安全性直觉模糊集,得到避碰直觉模糊集。
[0102]
s6:根据避碰直觉模糊集,得到机器人是否采取避让的动作决策。
[0103]
本发明协作机器人主动动作决策方法,基于获取的人和机器人的当前位置、当前速度以及目标点位置,通过预设的效率直觉模糊集模型,得到人和机器人的效率直觉模糊集,并且获取人的当前心理安全场场强,并通过预设的舒适度直觉模糊集模型,得到人的舒适度梯形直觉模糊集,通过获取人和机器人之间的距离,计算人和机器人以当前速度移动到潜在碰撞区域的时间,以及机器人以预设最大加速度减速到停止的时间,利用评估碰撞风险方法,得到机器人的安全性直觉模糊集,然后加权人的效率直觉模糊集和舒适度梯形直觉模糊集,得到人的动作意图的直觉模糊集,考虑到了人对工作效率的判断存在着主观情绪影响,使得对人类意图的建模更加贴近现实,最终加权人的动作意图的直觉模糊集、机器人的效率直觉模糊集以及机器人的安全性直觉模糊集,得到避碰直觉模糊集,融合人的意图、安全性和效率三者,有效提高预测人在具有潜在碰撞风险情形下的主观动作决策意图的准确性,降低机器人与人之间的碰撞情况的发生。
[0104]
在一种可能的实施方式中,本发明协作机器人主动动作决策方法,具体按照以下步骤实施:
[0105]
步骤1,交互场景的描述,当人和机器人的目标点相同,并同时趋向目标点拾取或放置零件时,将此时的人机协作场景描述为人-机博弈场景:博弈的局中人p1和p2分别代表人和机器人,博弈双方采取的策略a1和a2分别代表保持和屈服和分别表示双方选择保持和屈服的成本函数,i始终代表局中人pi,每个局中人可以选择不同的策略。
[0106]
步骤2,针对步骤1中的人-机博弈场景,获取人和机器人的当前位置、当前速度以及目标点位置,并通过预设的效率直觉模糊集模型,得到人和机器人的效率直觉模糊集。
[0107]
步骤3,将人认为的舒适度设置为直觉模糊集,通过心理安全场场强公式实时计算此时人的心理安全场场强se
ph
,得到人的舒适度梯形直觉模糊集。
[0108]
步骤4,获取人机之间的距离,分别计算人和机器人以当前速度移动到潜在碰撞区域的时间,以及机器人以预设最大加速度减速到停止的时间,得到机器人的安全性直觉模糊集。
[0109]
步骤5,根据人对于效率和舒适度重要性的判断不同,给出两者之间的重要性权重
因子,给定直觉模糊集的加权集结方法对人的效率直觉模糊集和舒适度直觉模糊集进行加权集结,得到人对于当前情况是否选择通过潜在碰撞区域继续向目标点移动的动作意图的直觉模糊集。
[0110]
步骤6,对机器人综合考虑安全性、人的动作意图和工作效率三个因素做出的动作决策进行加权集结得到避碰直觉模糊集,通过对比得分值和相应的精确值可以得到机器人是否采取避让的动作决策。
[0111]
在一种可能的实施方式中,步骤2具体按照以下步骤实施:
[0112]
步骤2.1,构建中性态度的期望效用函数,具体为:假设人单独自主完成装配任务的过程中,以最大速度1.8m/s所需的时间ts记为效率最大点,此时效率为1。从当前位置以当前速度到达目标点所需的时间t0为参考点,此时效率为若人对于效率的认识是完全理性的,对于效率随到达时间的增加而降低结果认识清楚,即对于效率与速度的关系保持中性态度,以此两点构建中性态度的期望效用函数:
[0113][0114]
步骤2.2,构建人认为的效率价值函数和决策权重函数,具体为:根据累计前景理论中对于价值函数的表达,确定人认为的效率价值函数:
[0115][0116]
人认为的决策权重函数:
[0117][0118][0119]
其中,t0为当前位置人以当前速度到达目标点所需的时间,ts为人以最大速度到达目标点所需的时间,t
l
为人以(ts,1)和确定的直线与x轴相交点的x轴坐标,s为当人的效率价值函数的值为零时对应的时间,f(t)为价值函数,w
+
(p)和w-(p)分别为决策权重函数在收益区域和损失区域的值,决策权重函数呈倒“s”形,如图3所示。γ、δ、α和β为预设参数,α、β反映了决策者的风险偏好水平,参数γ、δ(0《γ,δ《1)越小函数形态越弯曲,决策者越倾向于高估小概率事件而低估大概率事件,λ是损失厌恶系数,当λ》1时,人类被建模为损失厌恶者,对损失的重视程度高于收益,t
sr
为机器人以最大速度运动到目标点所需的时间;tr为机器人以当前速度到达目标点所需的时间;t
lr
为以(t
sr
,1)和,1)和确定的直线与x轴相交点的x轴坐标,机器人效率价值函数在t
lr
时刻的效率为零。
[0120]
步骤2.3,构建人对效率的认知模型,具体为:
[0121]
根据累积前景理论,人和机器人在目标点相同的条件下,人在以当前速度接近目标点的前景,即人对效率的认知模型可以表示为:
[0122][0123]
其中,w
+
(p)和w-(p)分别为决策权重函数在收益区域和损失区域的值,f(t)为价值函数,t0为当前位置人以当前速度到达目标点所需的时间,ts为人以最大速度到达目标点所需的时间,t
l
为人以(ts,1)和确定的直线与x轴相交点的x轴坐标,α和β为预设参数,α、β反映了决策者的风险偏好水平,λ是损失厌恶系数,当λ》1时,人类被建模为损失厌恶者,对损失的重视程度高于收益。
[0124]
步骤2.4,构建人和机器人的效率直觉模糊集,具体为:从图4中可以看出期望效用函数和累积前景函数的关系,以累积前景函数作为隶属度函数,人的效率直觉模糊集的隶属度和非隶属度函数分别为:
[0125][0126][0127]
而机器人是完全理性的智能单位,所以机器人的效率直觉模糊集隶属度和非隶属度函数分别为:
[0128][0129][0130]
其中,为人的效率直觉模糊集,μh(t)和υh(t)分别为人的效率直觉模糊集随时间t变化的隶属度和非隶属度函数,为机器人的效率直觉模糊集,μr(t)和υr(t)分别为机器人的效率直觉模糊集随时间t变化的隶属度和非隶属度函数,t0为当前位置人以当前速度到达目标点所需的时间,ts为人以最大速度到达目标点所需的时间,t
l
为人以(ts,1)和
确定的直线与x轴相交点的x轴坐标,s为当人的效率价值函数的值为零时对应的时间,f(t)为价值函数,w
+
(
p
)和w-(p)分别为决策权重函数在收益区域和损失区域的值,p表示以时间t到达目标点位置的概率,t
sr
为机器人以最大速度运动到目标点所需的时间;tr为机器人以当前速度到达目标点所需的时间;t
lr
为以(t
sr
,1)和确定的直线与x轴相交点的x轴坐标,机器人效率价值函数在t
lr
时刻的效率为零。
[0131]
参见图5和6,示出了人和机器人的效率直觉模糊集。
[0132]
在一种可能的实施方式中,步骤3具体按照以下步骤实施:
[0133]
建立了一种心理安全场模型,将心理安全场场强记作se
p
,衡量机器人以一定的速度、最小分离距离和方向接近人体不同部位对人产生的心理影响。当心理安全场场强足够大时,人认为如果碰撞风险超出了心理能够承受的阈值,则会选择避让机器人。
[0134]
具体为:人可以接受的协作机器人运动速度范围在0.3m/s到1m/s之间,认为舒适的速度范围在0.5m/s到0.8m/s之间,此时利用心理安全场经验公式se
p
可以实时计算机器人当前动作对人的心理影响的大小se
ph
,再通过计算可以得出机器人速度分别在0.3m/s、0.5m/s、0.8m/s和1m/s时的se
pj
(j=0.3,0.5,0.8,1m/s)。
[0135]
se
p
=sei+sev[0136][0137][0138]
其中,se
p
为心理安全场,sei为静态障碍物产生的势能场,sev为机器人运动对人造成的心理压力情绪形成的动能场,mo为障碍物的质量,单位是kg;di为障碍物与周围环境的距离标量,ko是心理安全场常数,单位是n
·
m2/kg2,qo是障碍物的危险程度,根据障碍物的性质、体积、尖锐程度等的不同而取值不同,kr表示人对机器人运动危险程度的认知,单位是n
·
m2/kg2,决定于个人的性别、性格和经验等,qr是机器人及其夹持物体的危险程度,根据机器人外形、体积和夹持的物品等的不同取值不同,mr是机器人的质量,单位是kg;dv为机器人基座中心点周围环境之间的标量距离,sp(dr,v)代表了机器人不同的运动方式对人造成的心理压力情绪的影响规律,当机器人与人最近的运动部件以不同的最小间距dr、速度v和接近方向接近人时,对人造成的心理压力情绪不同,首先判断机器人距离人体最近的部位是头部、胸部还是腹部,再根据最接近的部位选用影响规律方程:
[0139]
sh=z
0h
+ah·dr
+bh·
v+ch·dr2
+dh·
v2+eh·dr
·v[0140]
sc=z
0c
+ac·dr
+bc·
v+cc·dr2
+dc·
v2+ec·dr
·v[0141]
sa=z
0a
+aa·dr
+ba·
v+ca·dr2
+da·
v2+ea·dr
·v[0142]
sh、sc、sa分别为机器人靠近人体头部、胸部和腹部时对人造成的心理压力情绪sp(dr,v),z
0h
、z
0c
、z
0a
、ah、ac、aa、bh、bc、ba、ch、cc、ca、eh、ec和ea均为拟合参数,具体数值如表2所示,dr为机器人与人最近的运动部件和人之间的间距、v为机器人接近人的速度。
[0143]
表2心理安全场中各拟合参数取值
[0144]
参数值参数值参数值z0c
0.20524z
0c
0.20524z
0a
0.0914a
c-0.03063a
c-0.03063a
a-0.47717b
c-0.115b
c-0.115ba0.31549cc0.0126cc0.0126ca0.4543dc0.18031dc0.18031d
a-0.13909e
c-0.10197e
c-0.10197ea0.15166
[0145]
利用梯形直觉模糊集的定义计算出此时人对于机器人危险程度的判断,参见图7,即人的舒适度直觉模糊数的隶属度和非隶属度函数。
[0146][0147][0148]
其中,为人的舒适度梯形直觉模糊集,μ
se
(x)和ν
se
(x)分别为人的舒适度梯形直觉模糊集的隶属度和非隶属度函数,se
ph
为机器人当前动作对人的心理影响的大小,h为机器人当前动作速度,se
p0.3
,se
p0.5
,se
p0.8
,se
p1
为机器人速度分别在0.3m/s、0.5m/s、0.8m/s和1m/s时的se
ph
,和分别为预设的人感到最舒适的隶属度和对应的非隶属度:将人感到最舒适的隶属度设置为0.7,对应的非隶属度设置为0.2,犹豫度为0.1,表示人对此时的舒适程度的判断有0.1的犹豫程度。
[0149]
通过比较se
ph
与se
pj
的值计算出相应的隶属度和非隶属度,最终得到人的舒适度直觉模糊集。
[0150]
在一种可能的实施方式中,步骤4具体按照以下步骤实施:
[0151]
计算机器人的安全性直觉模糊集。具体为:分别计算人和机器人以当前速度移动到潜在碰撞区域的时间ttrh和ttrr,因为人机协作的距离往往在0m到1.5m之间,由于人突然的动作很可能发生减速不及时造成的碰撞,因此一旦减速则使用最大加速度进行减速,设置机器人最大加速度为ae=1.8m/s2,则机器人以最大加速度减速到停止的时间为ttsr。
[0152][0153][0154]
[0155]
其中,ttrh和ttrr分别为人和机器人以当前速度移动到潜在碰撞区域的时间,ttsr为机器人以预设最大加速度减速到停止的时间,ph为人的当前位置,pc为潜在碰撞区域的位置,ae为机器人的加速度,pr为机器人的当前位置,vh为人的当前速度,vr为机器人的当前速度。
[0156]
所以机器人感知的安全性直觉模糊集非隶属度和隶属度函数为:
[0157][0158]
μs(x)=1-νs(x)。
[0159]
其中,为机器人的安全性直觉模糊集,μs(x)和νs(x)分别为机器人的安全性直觉模糊集的隶属度和非隶属度函数,为机器人在到达碰撞区域的剩余时间,ttrh和ttrr分别为人和机器人以当前速度移动到潜在碰撞区域的时间,ttsr为机器人以预设最大加速度减速到停止的时间,vh为人的当前速度,vr为机器人的当前速度。
[0160]
在一种可能的实施方式中,步骤5具体按照以下步骤实施:
[0161]
步骤5.1,we和w
se
分别为人对于效率和舒适度的重要性权重,人为的确定人对于效率和舒适度的重要性权重分别是we=《0.6,0.3》和w
se
=《0.5,0.4》。
[0162]
步骤5.2,对人的效率直觉模糊集和舒适度直觉模糊集进行加权集结,得到人对于当前情况是否选择通过潜在碰撞区域继续向目标点移动的动作意图的直觉模糊集
[0163][0164]
其中,为人的动作意图的直觉模糊集,μk(x)和νk(x)分别为人的动作意图的直觉模糊集的隶属度和非隶属度函数,we和w
se
分别为人对于效率和舒适度的重要性权重,为人的效率直觉模糊集,为人的舒适度梯形直觉模糊集。
[0165]
在一种可能的实施方式中,步骤6具体按照以下步骤实施:
[0166]
步骤6.1,对机器人综合考虑安全性、人的动作意图和工作效率三因素做出的动作决策进行加权集结,得到机器人避碰直觉模糊集,具体为:将机器人对安全性、人的动作意图和工作效率的重要性权重分别设置为ws=《0.95,0.05》,wk=《0.8,0.1》,再对机器人综合考虑三因素做出的动作决策进行加权集结得到避碰直觉模糊集
[0167][0168]
其中,为避碰直觉模糊集,μc(x)和νc(x)分别为避碰直觉模糊集的隶属度和非隶属度函数,ws,wk和分别为机器人对安全性、人的动作意图和工作效率的重要性权重,
为机器人感知的安全性直觉模糊集,为人的动作意图的直觉模糊集,为机器人的效率直觉模糊集。
[0169]
当人采取通过潜在碰撞区域而机器人暂时屈服时,将避碰直觉模糊集记作当人采取暂时屈服而机器人采取通过潜在碰撞区域动作时,将避碰直觉模糊集记作其中,和分别为当人采取通过潜在碰撞区域而机器人暂时屈服时避碰直觉模糊集的隶属度和非隶属度函数,和分别为当人采取暂时屈服而机器人采取通过潜在碰撞区域动作时避碰直觉模糊集的隶属度和非隶属度函数。
[0170]
步骤6.2,给出直觉模糊集排序的方法,从而判断出直觉模糊集排序的方法,从而判断的大小,具体为:
[0171]
记模糊集的得分值和精确值分别为:
[0172][0173]
(1)如果则大于记作(2)如果如果则等于记作如果则小于记作如果则大于记作
[0174]
其中,μ和ν分别为模糊集的隶属度和非隶属度函数,为模糊集的得分值,为模糊集的精确值。
[0175]
步骤6.3,通过对比得分值和和相应的精确值可以得到机器人是否采取避让的动作决策。
[0176]
在一种可能的实施方式中,为了验证本发明协作机器人主动动作决策方法的有效性,本实例利用蒙特卡洛法生成了1000组数据对避碰算法进行验证,假设人手的初始位置在x轴负半轴,本实例以-0.85m为平均值,0.2125为方差生成数据,人手的速度以0.75m/s为均值,0.1875为方差生成数据;机器人末端执行器的位置在y轴负半轴,以-0.45m为均值,0.1125为方差生成数据,机器人的速度同样以0.75m/s为均值,0.1875为方差生成数据。而潜在碰撞区域设置在中心点为(0,0)边长为0.1m的正方形区域。
[0177]
为了贴近真实场景,本实例认为人机双方同时趋向潜在碰撞区域,并且人机双方为了完成任务,以潜在碰撞区域为拾取零件的目标点,在到达目标点后必须停留2s以完成抓取工作。而且为了增加工作效率,本实例认为人机双方地位是均等的,不会认为机器人没有生命而下等级的地位,即必须给人让出工作空间,人机双方可以平等的争夺共享空间。本实例特别关注两种情形:
[0178]
1.当机器人以原速可以先到目标点,而人在机器人到达目标点后但未完成抓取工
作离开碰撞区域之前到达,而通过加速人可以在机器人之前抢先到达潜在碰撞区域,此时,为了减少效率的损失,人极有可能采取加速的方式抢先到达碰撞区域使机器人不得不采取暂时屈服停止的动作而造成碰撞风险显著增加的情形。
[0179]
2.当人以原速可以先到达碰撞区域,但是人机之间的到达时间差距不大,如果此时机器人加速赶在人之前到达潜在碰撞区域迫使人采取屈服暂停的动作,不仅可以提高效率,同时保证安全性的情形。
[0180]
参见图8,实验后统计到对于情形1总共出现584次,其中决策机器人屈服动作的有159次,而决策加速通过的有425次。情形2总共出现85次,其中决策机器人暂时屈服的有83次,加速通过的有2次。而对于情形2中,只有2次机器人决策选择通过的原因是:为了保证人的安全,本实例将安全性、人的动作意图的直觉模糊集权重设置的较高,而效率的直觉模糊集权重设置的较低。对此可以通过计算权重因子的灵敏度来判断在什么范围内通过改变权重不会改变直觉模糊集的排序方案。
[0181]
综上所述,本发明协作机器人主动动作决策方法,相较于现有的协作机器人主动动作决策方法至少具有以下几点优势:(1)基于累计前景理论建立了人主观评价自身工作效率的算法,考虑到了人对工作效率的判断存在着主观情绪影响,使得对人类意图的建模更加贴近现实;(2)基于舒适度模型建立了人判断碰撞风险的算法,同时表示支持、反对和中立3种状态,能够更细腻、全面的描述客观现象的自然属性;(3)基于直觉模糊多属性决策算法建立了融合人的意图、安全性和效率的机器人动作决策算法,为机器人提供最优的动作决策;(4)通过蒙特卡洛法生成的数据验证了决策算法的有效性,同时该算法可以准确预测人在具有潜在碰撞风险情形下的主观动作决策意图,并让人感到满意。
[0182]
基于人机交互中机器人越来越多的动作决策需要考虑人的有限理性意图和动作,人的此类属性是造成近距离人机交互碰撞的重要原因。本发明公开的基于直觉模糊多属性决策算法建立了融合人的意图、安全性和效率的机器人动作决策算法,可以产生类似人类的决策方式。所提出的决策方法综合考虑了人的有限理性行为,利用累计前景理论和直觉模糊集建立了人对于效率和舒适度的主观意图,利用直觉模糊集计算静态斗鸡博弈两个纳什均衡的得分值和精度值为机器人提供最优的动作决策,通过蒙特卡洛法生成的数据验证了决策算法的有效性,同时通过实验,该方法可以以6%的准确率预测人在具有潜在碰撞风险情形下的主观动作决策意图,同时实验参与者认为机器人的动作决策让人感到满意。
[0183]
下述为本发明的装置实施例,可以用于执行本发明方法实施例。对于装置实施例中未披露的细节,请参照本发明方法实施例。
[0184]
本发明再一实施例中,提供一种协作机器人主动动作决策系统,能够用于实现上述的协作机器人主动动作决策方法,该协作机器人主动动作决策系统包括效率处理模块、舒适度处理模块、安全性处理模块、第一加权模块、第二加权模块及决策模块。
[0185]
其中,效率处理模块用于获取人和机器人的当前位置、当前速度以及目标点位置,并通过预设的效率直觉模糊集模型,得到人和机器人的效率直觉模糊集;舒适度处理模块用于获取人的当前心理安全场场强,并通过预设的舒适度直觉模糊集模型,得到人的舒适度梯形直觉模糊集;安全性处理模块用于获取人和机器人之间的距离,计算人和机器人以当前速度移动到潜在碰撞区域的时间,以及机器人以预设最大加速度减速到停止的时间,利用评估碰撞风险方法,得到机器人的安全性直觉模糊集;第一加权模块用于加权人的效
率直觉模糊集和舒适度梯形直觉模糊集,得到人的动作意图的直觉模糊集;第二加权模块用于加权人的动作意图的直觉模糊集、机器人的效率直觉模糊集以及机器人的安全性直觉模糊集,得到避碰直觉模糊集;决策模块用于根据避碰直觉模糊集,得到机器人是否采取避让的动作决策。
[0186]
前述的协作机器人主动动作决策方法的实施例涉及的各步骤的所有相关内容均可以援引到本发明施例中的协作机器人主动动作决策系统所对应的功能模块的功能描述,在此不再赘述。
[0187]
本发明实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,另外,在本发明各个实施例中的各功能模块可以集成在一个处理器中,也可以是单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
[0188]
本发明再一个实施例中,提供了一种计算机设备,该计算机设备包括处理器以及存储器,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器用于执行所述计算机存储介质存储的程序指令。处理器可能是中央处理单元(central processing unit,cpu),还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现成可编程门阵列(field-programmable gatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,其是终端的计算核心以及控制核心,其适于实现一条或一条以上指令,具体适于加载并执行计算机存储介质内一条或一条以上指令从而实现相应方法流程或相应功能;本发明实施例所述的处理器可以用于协作机器人主动动作决策方法的操作。
[0189]
本发明再一个实施例中,本发明还提供了一种存储介质,具体为计算机可读存储介质(memory),所述计算机可读存储介质是计算机设备中的记忆设备,用于存放程序和数据。可以理解的是,此处的计算机可读存储介质既可以包括计算机设备中的内置存储介质,当然也可以包括计算机设备所支持的扩展存储介质。计算机可读存储介质提供存储空间,该存储空间存储了终端的操作系统。并且,在该存储空间中还存放了适于被处理器加载并执行的一条或一条以上的指令,这些指令可以是一个或一个以上的计算机程序(包括程序代码)。需要说明的是,此处的计算机可读存储介质可以是高速ram存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。可由处理器加载并执行计算机可读存储介质中存放的一条或一条以上指令,以实现上述实施例中有关协作机器人主动动作决策方法的相应步骤。
[0190]
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0191]
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序
指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0192]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0193]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0194]
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1