一种多空间融合的人机技能迁移与参数补偿方法及系统

文档序号:29085337发布日期:2022-03-02 01:15阅读:216来源:国知局
一种多空间融合的人机技能迁移与参数补偿方法及系统

1.本发明属于共融机器人技术领域,具体涉及一种多空间融合的人机技能迁移与参数补偿方法及系统。


背景技术:

2.传统的机器人,特别是工业机器人大多通过专业技术人员编程示教的方式实现相对单一的工作。这类机器人在结构化的环境中发挥了重要的作用,可代替人类完成简单重复的工作,很大程度上减轻了人类的工作强度,具有定位精度高、工作效率高、输出力大等优点,已广泛应用于物流、汽车工业、飞机装配、港口码头等生产方式固定的中大型企业中,并带来了十分可观的工作效率和经济效益。但这类机器人仍存在普适性差、灵活度低、维护/改造成本高、智能化程度不足、人机交互体验差、实现功能单一等缺点,大大限制了这类机器人在非结构化的环境中的应用。与机器人相比,人类可以根据环境的动态变化实时调整自己对肌骨系统的控制策略,通过协同控制力、位、阻抗完成复杂技能操作。人的肌骨协同控制机理,为赋予机器人以人类技能提供了借鉴。
3.除此之外,随着近年来生活方式和生产方式的快速变化,传统的结构化工业场景已经无法满足多元化生产生活的需求。如何赋予机器人快速编码能力以适应环境的变化;如何让人们可以不需要专业的知识也能教会机器人从事一些日常的工作,使机器人走进平常百姓家;如何赋予机器人以类人特性来满足现代化柔性生成的需求、提高人机交互的体验、完成复杂高技能的工作成为机器人智能化发展的重要方向。人类的操作技能主要包括运动学中的位置、姿态、速度、加速度,以及动力学中的刚度、力等。其中,位置、速度和加速度为欧氏空间参数,姿态和刚度则为黎曼空间参数。目前,现有的人机技能迁移技术的研究主要着眼于欧氏空间,较少将黎曼空间考虑在内。且技能迁移主要针对运动学参数,鲜有研究将动力学技能参数如演示者的刚度特性、操作过程中的末端受力等赋予机器人。


技术实现要素:

4.本发明所要解决的技术问题在于针对上述现有技术中的不足,提供一种多空间融合的人机技能迁移与参数补偿方法及系统,利用黎曼空间的测地线距离、对数/指数映射方法改造传统的dmps动态系统,将人演示的姿态、刚度等黎曼空间技能传递给机器人。
5.本发明采用以下技术方案:
6.一种多空间融合的人机技能迁移与参数补偿方法,包括以下步骤:
7.s1、构建上臂刚度模型,设计摄动法辨识模型参数,将演示过程中产生的刚度多空间矩阵分解成特征值矩阵和特征向量矩阵;
8.s2、将特征向量矩阵转换成四元数;
9.s3、分解转换的四元数,将四元数表示成轴角形式;
10.s4、将人机技能的黎曼空间部分表示成轴角形式后,建立基于dmps的多空间融合的动态系统、正则系统模块和线性加权回归更新模块;
11.s5、获取多空间技能参数,利用步骤s4建立的基于dmps的多空间融合的动态系统、正则系统模块和线性加权回归更新模块实现技能迁移,构建机器人仿人变阻抗控制器,将技能参数迁移给机器人仿人变阻抗控制器,比较对应技能参数得到的机器人复现效果与演示者在本组技能参数下演示的效果,将多次演示下的差异值和机器人实际操作效果导入概率模型进行训练,建立实际值与差异值之间的规律模型,根据实际场景中机器人末端反馈和规律模型回归得到的预计值之间的差异进行技能参数补偿。
12.具体的,步骤s1中,刚度特征值矩阵kc为:
[0013][0014]
刚度特征向量矩阵kv为:
[0015][0016]
其中,l为肩关节中心s到腕关节中心w的方向向量,r为肩关节中心s到轴关节中心e的方向向量,d1表示演示者肩关节中心s到腕关节中心e的方向向量r距离,d2表示肘关节中心e到方向向量l的距离m,α1和α2表示需要辨识的模型参数。
[0017]
具体的,步骤s2中,四元数q为:
[0018][0019]
其中,欧氏空间项:黎曼空间项:θ为四元数旋转角度,x y z为四元数旋转轴方向向量分量。
[0020]
具体的,步骤s3中,轴角形式具体为:
[0021][0022]
其中,q为四元数,θ为四元数旋转角度,v为四元数旋转轴线,为一维实数,为一维流形。
[0023]
具体的,步骤s4中,基于dmps的多空间融合的动态系统包括:
[0024]
欧氏空间动态系统:
[0025][0026][0027]
其中,表示四元数的角度,z和分别为角速度项和角加速度项,θg和θ0分别表示目标角度和起始角度,f
θ
(s)表示用于调整欧氏空间参数轨迹曲线的非线性力项,α
θ
和β
θ
为时间常量;
[0028]
黎曼空间动态系统:
[0029]
[0030][0031]
其中,||v||=1表示四元数的转轴,为相邻向量vi和v
i+1
的测地线距离,dt表示相邻向量之间的时间间隔,和分别表示第i时刻转轴变化的速度项和加速度项,vg和v0分别表示目标转轴和起始转轴,αv和βv为时间常量;fv(si)为调整黎曼空间参数轨迹曲线的非线性力项。
[0032]
进一步的,针对机器人在泛化目标时初始转轴和目标转轴与演示的情况不同,引入旋转矩阵更新相邻转轴之间的变化方向,相邻转轴之间的方向向量由黎曼空间的对数映射表示:
[0033][0034][0035]
其中,为更新后的方向向量,由演示和泛化的起始位置决定,u为更新前方向向量,为一维流形,vi,v
i+1
为相邻转轴。
[0036]
具体的,步骤s4中,正则系统具体为:
[0037]
引入相位变量,s∈[0,1],s(0)=1作为一阶线性动力系统的状态参数:
[0038][0039]
其中,τ和αs为常数,表示s的导数项,当s趋向于0时,欧氏空间和黎曼空间动态系统中的非线性项f
θ
(s)和fv(s)将消失;四元数的角度θ和转轴v将最终收敛至目标吸引子θg和vg。
[0040]
具体的,步骤s4中,利用若干个非线性径向基函数的加权线性组合表示线性加权回归更新模块如下:
[0041][0042]
其中,f(s)为动态系统中的非线性力项,n为径向基函数个数,ωi为各径向基函数的权重,ψi(s)为各径向基函数,s为相位变量。
[0043]
具体的,步骤s5中,构建机器人仿人变阻抗控制器如下:
[0044][0045][0046]
其中,m(q)为机械臂惯性项,表示机械臂科氏力离心力项,g(q)表示机械臂重力项,τ为机械臂关节力矩,j
rt
为机器人几何雅可比矩阵的转置,f
ext
为机器人末端所受外力,fc为待补偿非线性力项。
[0047]
本发明的另一技术方案是,一种多空间融合的人机技能迁移与参数补偿系统,包括:
[0048]
分解模块,构建上臂刚度模型,设计摄动法辨识模型参数,将演示过程中产生的刚度多空间矩阵分解成特征值矩阵和特征向量矩阵;
[0049]
转换模块,将特征向量矩阵转换成四元数;
[0050]
轴角模块,分解四元数,将四元数表示成轴角形式;
[0051]
技能模块,将人机技能的黎曼空间部分表示成轴角形式后,建立基于dmps的多空间融合的动态系统、正则系统模块和线性加权回归更新模块;
[0052]
补偿模块,获取多空间技能参数,利用基于dmps的多空间融合的动态系统、正则系统模块和线性加权回归更新模块实现技能迁移,构建机器人仿人变阻抗控制器,将技能参数迁移给机器人仿人变阻抗控制器,比较对应技能参数得到的机器人复现效果与演示者在本组技能参数下演示的效果,将多次演示下的差异值和机器人实际操作效果导入概率模型进行训练,建立实际值与差异值之间的规律模型,根据实际场景中机器人末端反馈和规律模型回归得到的预计值之间的差异进行技能参数补偿。
[0053]
与现有技术相比,本发明至少具有以下有益效果:
[0054]
本发明一种多空间融合的人机技能迁移与参数补偿方法,通过人机技能传递将人类演示的运动学传递给机器人,实现机器人的快速编程,可大大减少机器人轨迹规划的时间;基于四元数的多空间技能编码技术可实现包括姿态和刚度等多空间技能的编码,将人体的阻抗变化规律传递给机器人,可实现机器人仿人变阻抗控制,为下一代机器人的灵巧操作和复杂操作提供技术参考。
[0055]
进一步的,刚度技能参数为多空间参数,其中刚度特征值为欧式空间参数,刚度特征向量为黎曼空间参数,步骤s1中所提的刚度提取方法是通过建立上肢简化模型,分别得到刚度特征值和刚度特征矩阵。
[0056]
进一步的,四元数具有参数少、表达多空间参数简洁等优点。四元数由转角和转轴构成,前者为欧式空间参数,后者为黎曼空间参数,本发明采用四元数表示多空间参数,并将其导入多空间动态系统中编码学习。
[0057]
进一步的,四元数由轴角表示,前者为欧式空间参数,后者为黎曼空间参数。
[0058]
进一步的,多空间的动态系统包括欧氏空间动态系统和黎曼空间动态系统,其设置的目的在于处理姿态、刚度等多空间技能参数,其中,欧氏空间动态系统编码欧式空间技能参数部分,黎曼空间动态系统编码黎曼空间技能参数部分。
[0059]
进一步的,技能泛化时,由于泛化目标和演示目标的差异,需要设计相邻转轴的更新方案,本发明中根据泛化目标相对于泛化起点和演示目标相对于演示起点的方向向量之间的差异引入旋转矩阵,作为相邻转轴更新的依据。
[0060]
进一步的,正则系统的设计,通过一阶动态系统建立时间变量和相位变量之间的关系,其目的在于使系统在技能的学习和泛化过程中避免对时间变量的依赖。
[0061]
进一步的,在步骤s4中,通过设计的多空间动态系统,实现了对多空间技能的编码,得到了非线性力项,步骤s5中,线性加权回归更新模块对非线性力项进行拟合,通过更新各径向基函数的权重,实现对非线性力项的变化规律建模,以此学习技能规律。当多空间系统中导入新的目标时,即可通过相位变量更新当前状态下对应的非线性力项值,以此计算下一状态的技能参数。
[0062]
进一步的,机器人的变阻抗控制技术往往需要大量的设计建模,而人类特别是高
技能技师的自调整能力是机器人所不具备的,构建机器人的仿人变阻抗控制器,即可通过学习高技能技师在具体操作场景中的自调整能力,将其所表现出来的变阻抗能力迁移给机器人,实现对机器人的变阻抗控制。通过人机技能迁移的方式大大减小了工程师变阻抗策略建模的时间,真正实现机器人的拟人化操作,为下一代共融机器人的发展提供技术参考。
[0063]
综上所述,本发明能够实现在多空间的人-机技能传递,可以同时将演示者的位置、姿态、刚度等信息传递给机器人,还通过量化作用效果,概括人机复现差异规律,设计了一种技能参数补偿算法,保证精确的复现效果。
[0064]
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
[0065]
图1为本发明多空间融合的人-机技能迁移技术示意图;
[0066]
图2为本发明基于技能参数补偿的机器人仿人变阻抗控制框架图;
[0067]
图3为本发明位置技能学习与泛化的结果图;
[0068]
图4为本发明姿态技能学习与泛化的结果图,其中,(a)为角度,(b)为转轴;
[0069]
图5为本发明刚度技能学习与泛化的结果图,其中,(a)为角度,(b)为转轴。
具体实施方式
[0070]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0071]
在本发明的描述中,需要理解的是,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
[0072]
还应当理解,在本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
[0073]
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
[0074]
在附图中示出了根据本发明公开实施例的各种结构示意图。这些图并非是按比例绘制的,其中为了清楚表达的目的,放大了某些细节,并且可能省略了某些细节。图中所示出的各种区域、层的形状及它们之间的相对大小、位置关系仅是示例性的,实际中可能由于制造公差或技术限制而有所偏差,并且本领域技术人员根据实际所需可以另外设计具有不同形状、大小、相对位置的区域/层。
[0075]
本发明一种多空间融合的人机技能迁移与参数补偿方法,包括以下步骤:
[0076]
s1、构建上臂刚度模型,设计摄动法辨识模型参数,将演示过程中产生的刚度矩阵分解成刚度特征值矩阵和刚度特征向量矩阵
[0077]
刚度矩阵特征分解为:
[0078]
k=kv·ac
·
kc·kvt
[0079]
其中,决定刚度椭球的体积,为刚度特征值矩阵,对角线元素代表各轴长度的比例关系,为刚度特征向量矩阵。
[0080]ac
(p)为拮抗肌对的协同肌肉活性其大小由拮抗肌的共收缩水平决定,表达式如下:
[0081]ac
(p)=c1·
p+c2[0082]
其中,p表示拮抗肌的共收缩水平(muscle active level,mal),由拮抗肌对的表面几点信号特征决定,c1和c2为需要辨识的系数。
[0083]
在此基础上,本发明提出一种基于均方根(root mean square,rms)的移动窗口特征提取方法来提取所选拮抗肌的表面肌电信号的时域特征。
[0084][0085][0086]
其中,n表示移动窗口的长度,semgi表示原始肌电信号幅值,p1和p2为提取的拮抗肌表面肌电信号的rms时域特征。
[0087]
刚度特征值矩阵kc为:
[0088][0089]
d1=||l||,
[0090]
刚度特征向量矩阵kv为:
[0091][0092]
其中,l为肩关节中心s到腕关节中心w的方向向量,r为肩关节中心s到轴关节中心e的方向向量,d1表示演示者肩关节中心s到腕关节中心e的方向向量r距离,d2表示肘关节中心e到方向向量l的距离m,α1和α2表示需要辨识的模型参数。
[0093]
c1、c2、α1和α2通过设计摄动法实验通过最小二乘法最小化理论刚度和预测刚度的差异辨识模型参数:
[0094][0095]
其中,ks∈r3×3为基于力传感器和摄动轨迹计算出的理论刚度椭球,m表示摄动实验次数,||log(k)-log(ks)||f表示理论刚度矩阵和预测刚度矩阵的仿射距离。
[0096]
s2、将刚度特征向量矩阵转换成四元数表示:
[0097]
将刚度特征向量矩阵转换成四元数,并解耦成欧氏空间和黎曼空间表示:
[0098][0099]
其中,欧氏空间项:黎曼空间项:
[0100]
s3、分解步骤s2转换的四元数,将四元数表示成轴(黎曼空间参数)角(欧氏空间参数)形式:
[0101]
s4、建立基于dmps的多空间融合的动态系统;
[0102]
建立基于传统dmps的多空间融合的动态系统:
[0103]
(1)欧氏空间动态系统:
[0104][0105][0106]
其中,表示四元数的角度,为一维欧氏空间变量,z和分别为角速度项和角加速度项,θg和θ0分别表示目标角度(吸引子)和起始角度,f
θ
(s)表示用于调整欧氏空间参数轨迹曲线的非线性力项,α
θ
和β
θ
为时间常量,其值关系到曲线最终是否收敛到目标吸引子,选择α
θ
=4β
θ
可保证动态系统处于临界阻尼状态,具体的值由具体任务确定。
[0107]
(2)黎曼空间动态系统:
[0108][0109][0110]
其中,||v||=1表示四元数的转轴,为二维黎曼空间变量。为相邻向量vi和v
i+1
的测地线距离,dt表示相邻向量之间的时间间隔,和分别表示第i时刻转轴变化的速度项和加速度项,vg和v0分别表示目标转轴和起始转轴,αv和βv为时间常量:为调整黎曼空间参数轨迹曲线的非线性力项。
[0111]
考虑到机器人在泛化目标时初始转轴和目标转轴与演示的情况不同的情况,引入旋转矩阵来更新相邻转轴之间的变化方向,其中相邻转轴之间的方向向量由黎曼空间的对数映射表示:
[0112][0113][0114]
其中,为更新后的方向向量,由演示和泛化的起始位置决定:
[0115][0116]
其中,v0和vg表示演示时的起始转轴和目标转轴,和表示泛化时的起始转轴和
目标转轴,o和则分别表示演示时和泛化时起终转轴的矢量方向。
[0117]
因此,旋转矩阵的旋转角度和旋转轴ω由下式表示:
[0118][0119]
由罗德里格公式可知
[0120][0121]
基于此,基于黎曼空间的指数映射公式推导出演示轨迹中的各转轴v
i+1
的计算公式:
[0122][0123]
s5、建立正则系统和线性加权回归更新模块;
[0124]
(1)正则系统
[0125]
为了避免技能参数学习和泛化过程中系统的时间依赖性,引入相位变量,s∈[0,1],s(0)=1作为一阶线性动力系统的状态参数:
[0126][0127]
其中,τ和αs为常数,表示s的导数项,当s趋向于0时,欧氏空间和黎曼空间动态系统中的非线性项f
θ
(s)和fv(s)将消失,即:f
θ
(0)=fv(0)=0。
[0128]
此时,四元数的角度θ和转轴v将最终收敛至目标吸引子θg和vg,状态变量的定义使整个系统依赖于相变量s,而不是时间t。
[0129]
(2)线性加权回归更新模块
[0130]
为了拟合多空间状态系统的非线性项f
θ
(s)和fv(s),利用若干个非线性径向基函数的加权线性组合表示,如下式所示:
[0131][0132]
ψi(s)=exp(-hi(s-ci)2)
[0133]
其中,ci为核函数的中心值,hi为核函数的宽度值,为核函数的宽度值,其中i=0,1,

,n-1且hn=h
n-1

[0134]
各径向基函数ψi(s)被加权线性组合,其权值ωi由线性加权回归法更新得到。
[0135]
s6、获取多空间技能参数,实现技能迁移,将人体变阻抗技能传递给机器人后,由于人手臂和机械臂构型和动力学参数均存在差异,但演示者的阻抗调整规律可作为机器人在特定任务下阻抗调整的参考,因此引入如下公式设计机器人的阻抗控制策略,并设计技能参数补偿方法减少由于构型等原因产生的效果差异,以此构建机器人仿人变阻抗控制
器。
[0136]
人类演示获取多空间技能参数,实现技能迁移,构建机器人仿人变阻抗控制器:
[0137][0138][0139]
其中,m(q)为机械臂惯性项,表示机械臂科氏力离心力项,g(q)表示机械臂重力项,k和d分别为机器人仿人刚度和阻尼,xd和分别为期望位置和速度,xa和分别表示实际位置和速度,fc为待补偿非线性力项。
[0140]
由于刚度提取模型存在一定误差,且人和机器人构型往往存在较大差异,因此直接将人体末端刚度传递给机器人无法精准复现演示者的操作,步骤s6设计了一种基于多空间融合的技能参数补偿框架来尽可能减少由于人机构型差异和刚度模型误差导致的复现效果不一致的现象,通过在真实环境中量化作用效果,包括机器人与被操作对象之间的相互作用力fa和被操作对象的状态xa,并与人类演示的作用效果做对比,将期望位置xd和受力fd以及相对应的差异作为概率模型(gmm)的输入,以此建立期望值与差异值之间的对应关系,找出人与机器人复现的差异规律。
[0141]
具体的过程如下:
[0142]
通过演示者多次演示,记录多次演示下的技能参数(位置、姿态和刚度),在此基础上,将技能参数迁移给机器人笛卡尔变阻抗控制器,比较对应技能参数得到的机器人复现效果(被操作对象的实际状态xa、实际末端交互力fa)与演示者在这组技能参数下演示的效果(被操作对象的期望状态xd、期望末端交互力fd)。
[0143]
将多次演示下二者的差异值和机器人实际操作效果导入概率模型(gmm)训练,进而建立实际值与差异值之间的规律模型,该规律模型可根据末端机器人在执行特定任务时末端实际受力和位移预测机器人与演示者存在的差异(δx和δf)。
[0144]
最后,根据实际场景中机器人末端反馈和规律模型回归(gmr)得到的预计差异,进而设计外力补偿算法。
[0145]
针对外力补偿算法,本发明借鉴pi控制思想,通过设计pi控制器的增益补偿差异,并将外力补偿结果实时地增加到机器人变刚度控制系统中。
[0146]
δf=f
d-fa[0147][0148]
其中,fc为仿人变阻抗控制器中的待补偿非线性力项,δf为人类演示者和机器人复现的末端受力误差,k1和k2为pi控制器的增益。
[0149]
本发明再一个实施例中,提供一种多空间融合的人机技能迁移与参数补偿系统,该系统能够用于实现上述多空间融合的人机技能迁移与参数补偿方法,具体的,该多空间融合的人机技能迁移与参数补偿系统包括分解模块、转换模块、轴角模块、技能模块以及补偿模块。
[0150]
其中,分解模块,构建上臂刚度模型,设计摄动法辨识模型参数,将演示过程中产生的刚度多空间矩阵分解成特征值矩阵和特征向量矩阵;
[0151]
转换模块,将特征向量矩阵转换成四元数;
[0152]
轴角模块,分解四元数,将四元数表示成轴角形式;
[0153]
技能模块,将人机技能的黎曼空间部分表示成轴角形式后,建立基于dmps的多空间融合的动态系统、正则系统模块和线性加权回归更新模块;
[0154]
补偿模块,获取多空间技能参数,利用基于dmps的多空间融合的动态系统、正则系统模块和线性加权回归更新模块实现技能迁移,构建机器人仿人变阻抗控制器,将技能参数迁移给机器人仿人变阻抗控制器,比较对应技能参数得到的机器人复现效果与演示者在本组技能参数下演示的效果,将多次演示下的差异值和机器人实际操作效果导入概率模型进行训练,建立实际值与差异值之间的规律模型,根据实际场景中机器人末端反馈和规律模型回归得到的预计值之间的差异进行技能参数补偿。
[0155]
本发明再一个实施例中,提供了一种终端设备,该终端设备包括处理器以及存储器,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器用于执行所述计算机存储介质存储的程序指令。处理器可能是中央处理单元(central processing unit,cpu),还可以是其他通用处理器、数字信号处理器(digital signal processor、dsp)、专用集成电路(application specific integrated circuit,asic)、现成可编程门阵列(field-programmable gatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,其是终端的计算核心以及控制核心,其适于实现一条或一条以上指令,具体适于加载并执行一条或一条以上指令从而实现相应方法流程或相应功能;本发明实施例所述的处理器可以用于多空间融合的人机技能迁移与参数补偿方法的操作,包括:
[0156]
构建上臂刚度模型,设计摄动法辨识模型参数,将演示过程中产生的刚度多空间矩阵分解成特征值矩阵和特征向量矩阵;将特征向量矩阵转换成四元数;分解转换的四元数,将四元数表示成轴角形式;将人机技能的黎曼空间部分表示成轴角形式后,建立基于dmps的多空间融合的动态系统、正则系统模块和线性加权回归更新模块;获取多空间技能参数,利用建立的基于dmps的多空间融合的动态系统、正则系统模块和线性加权回归更新模块实现技能迁移,构建机器人仿人变阻抗控制器,将技能参数迁移给机器人仿人变阻抗控制器,比较对应技能参数得到的机器人复现效果与演示者在本组技能参数下演示的效果,将多次演示下的差异值和机器人实际操作效果导入概率模型进行训练,建立实际值与差异值之间的规律模型,根据实际场景中机器人末端反馈和规律模型回归得到的预计值之间的差异进行技能参数补偿。
[0157]
本发明再一个实施例中,本发明还提供了一种存储介质,具体为计算机可读存储介质(memory),所述计算机可读存储介质是终端设备中的记忆设备,用于存放程序和数据。可以理解的是,此处的计算机可读存储介质既可以包括终端设备中的内置存储介质,当然也可以包括终端设备所支持的扩展存储介质。计算机可读存储介质提供存储空间,该存储空间存储了终端的操作系统。并且,在该存储空间中还存放了适于被处理器加载并执行的一条或一条以上的指令,这些指令可以是一个或一个以上的计算机程序(包括程序代码)。需要说明的是,此处的计算机可读存储介质可以是高速ram存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。
[0158]
可由处理器加载并执行计算机可读存储介质中存放的一条或一条以上指令,以实现上述实施例中有关多空间融合的人机技能迁移与参数补偿方法的相应步骤;计算机可读存储介质中的一条或一条以上指令由处理器加载并执行如下步骤:
[0159]
构建上臂刚度模型,设计摄动法辨识模型参数,将演示过程中产生的刚度多空间矩阵分解成特征值矩阵和特征向量矩阵;将特征向量矩阵转换成四元数;分解转换的四元数,将四元数表示成轴角形式;将人机技能的黎曼空间部分表示成轴角形式后,建立基于dmps的多空间融合的动态系统、正则系统模块和线性加权回归更新模块;获取多空间技能参数,利用建立的基于dmps的多空间融合的动态系统、正则系统模块和线性加权回归更新模块实现技能迁移,构建机器人仿人变阻抗控制器,将技能参数迁移给机器人仿人变阻抗控制器,比较对应技能参数得到的机器人复现效果与演示者在本组技能参数下演示的效果,将多次演示下的差异值和机器人实际操作效果导入概率模型进行训练,建立实际值与差异值之间的规律模型,根据实际场景中机器人末端反馈和规律模型回归得到的预计值之间的差异进行技能参数补偿。
[0160]
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中的描述和所示的本发明实施例的组件可以通过各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0161]
请参阅图1和图2,作为本发明的某一具体实施方式,结合图1和图2所示,演示者基于vicon运动采集设备捕捉一个倒水任务的位置和姿态轨迹,基于表面肌电信号采集设备和ati六维力矩传感器获取演示者在执行任务的过程中上臂的末端线性刚度基于此,首先将刚度矩阵特征分解成特征值矩阵和特征向量矩阵设计摄动实验辨识演示者上臂刚度模型参数:
[0162]
{α1,α2,c1,c2}={6.2416,61.6841,0.2205,4.3949}
[0163]
在此基础上,将黎曼空间技能包括刚度特征向量矩阵和姿态矩阵转换成四元数形式:
[0164]

[0165]
接着对姿态四元数和刚度四元数分别解耦成欧氏空间变量(角度)和黎曼空间变量(转轴):
[0166][0167][0168]
其中,下标γ和k分别代表姿态和刚度。vk=[xk,yk,zk],v
γ
=[x
γ
,y
γ
,z
γ
]均为单位向量。
[0169]
在此基础上,将位置姿态/刚度四元数的欧氏项分别导入扩展dmps位于欧氏空间的动态系统。
[0170]
位置:
[0171][0172][0173]
姿态/刚度:
[0174][0175][0176]
其中,p为位置在x、y、z轴的投影。θ代表姿态四元数和刚度四元数的欧氏项。
[0177]
基于此,求出欧氏空间动态系统的非线性力项:
[0178][0179][0180]
同样地,将姿态和刚度四元数的黎曼空间参数分别导入扩展dmps位于黎曼空间的动态系统。
[0181][0182][0183]
其中,v代表姿态四元数和刚度四元数的黎曼项(转轴)。基于此,即可求出黎曼空间动态系统的非线性力项:
[0184][0185]
在此基础上,利用n个非线性径向基函数的加权线性组合拟合欧氏空间和黎曼空间的非线性力项:
[0186]
位置:
[0187][0188]
姿态/刚度四元数欧氏项:
[0189][0190]
姿态/刚度四元数黎曼项:
[0191][0192]
基于加权线性回归算法即可求出相应的权重分布:ω
p

[0193]
至此即完成了多空间融合的技能迁移的学习阶段。在多目标泛化应用阶段,我们选取了四个与演示目标不同的泛化目标以验证算法的泛化能力。
[0194]
图3是位置(欧氏空间)技能学习与泛化的实验结果;
[0195]
图4是姿态(欧氏空间+黎曼空间)技能学习与泛化的实验结果;
[0196]
图5是刚度(欧氏空间+黎曼空间)技能学习与泛化的实验结果,至此实现了人机多空间技能(位置、姿态和刚度)的学习和泛化。
[0197]
综上所述,本发明一种多空间融合的人机技能迁移与参数补偿方法及系统,能够实现在多空间的人-机技能传递,可以同时将演示者的位置、姿态、刚度等信息传递给机器人,还通过量化作用效果,概括人机复现差异规律,设计了一种技能参数补偿算法,保证精确的复现效果。
[0198]
本领域内的技术人员应明白,本技术的实施例可提供为方法、系统、或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0199]
本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0200]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0201]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0202]
以上内容仅为说明本发明的技术思想,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明权利要求书的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1