一种基于避障扩散引导的复杂场景钉孔装配方法

文档序号：41820023发布日期：2025-05-09 11:49阅读：72来源：国知局

本发明涉及机器人模仿学习装配领域，尤其是涉及一种基于避障扩散引导的复杂场景钉孔装配方法。

背景技术：

1、机器人装配作为工业应用的核心组成部分，长期以来一直是研究的热点领域，其中钉孔装配被认为是多种组件装配的基础。机器人钉孔装配在大规模物体装配以及小型组件装配中具有广泛的应用前景。现有的钉孔装配方法通常针对较为简单的场景，例如目标孔洞位于平坦的水平面上。在此类场景中，只需获取孔洞的二维坐标，即可通过逆运动学求解获得机械臂的关节角度，完成装配。然而，在实际装配任务中，孔洞的位姿往往更加复杂。例如，孔洞可能位于其他工件的非水平表面上，甚至位于其他工件的内壁中。在这种情况下，需要规划机械臂的运动轨迹，综合考虑空间中的复杂约束条件，确保机械臂能够避开障碍物后完成钉孔插入操作。

2、现有研究通常通过简化问题来降低复杂性，例如对目标与末端执行器之间的距离施加严格约束。然而，在这些简化的条件下，当目标与末端执行器之间存在更复杂的姿态差异(例如显著的旋转偏差或较大的初始对准误差)时，这些方法往往难以奏效。特别是对于旋转偏差，即便是轻微的倾斜角度也可能导致问题，因为许多方法在训练过程中通常假设插入方向始终与孔的z轴对齐。此外，基于力矩反馈控制的方法由于需要物理接触而存在局限性，而基于视觉伺服的方法又容易受到误差积累的影响。因此，现有方法难以有效应对较大的初始对准误差，当末端执行器与目标位置之间的初始距离较远时，往往会导致装配失败。

3、综上所述，现有的钉孔装配方法在应对姿态差异、复杂场景避障以及较大初始对准误差方面存在显著不足。因此，如何设计一种灵活、精确且具备鲁棒性的装配策略，以克服现有方法的局限性，提升装配精度和可靠性，成为当前亟待解决的关键问题。

技术实现思路

1、本发明的目的是克服上述现有钉孔装配方法在应对姿态差异、复杂场景避障以及较大初始对准误差方面存在的缺陷而提供一种基于避障扩散引导的复杂场景钉孔装配方法。

2、本发明的目的可以通过以下技术方案来实现：

3、一种基于避障扩散引导的复杂场景钉孔装配方法，步骤包括：

4、以深度相机采集的点云数据作为基于扩散的轨迹生成模型的输入，以碰撞损失为约束条件，利用交叉注意力机制基于点云数据对于基于扩散的轨迹生成模型的轨迹生成进行条件控制，生成一条避开障碍物到达目标孔位的末端执行器轨迹；

5、通过视觉伺服网络提取点云数据的全局特征，将全局特征输入多层感知机网络预测末端执行器关节坐标及姿态的增量，并采用闭环控制方法迭代优化平移偏移量和旋转偏移量，实现末端执行器的插入操作。

6、作为优选技术方案，所述基于扩散的轨迹生成模型包括前向扩散和反向生成两个过程：

7、所述的基于扩散的轨迹生成模型以往给定的专家轨迹中加入噪声得到的加噪数据以及当前的点云数据作为输入；

8、在所述的前向扩散过程中，将加噪数据作为unet网络的输入，由unet网络输出预测的噪声；通过计算预测的噪声与真实加入的噪声之间均方误差和碰撞损失优化unet网络模型，得到训练好的unet网络；

9、在所述的反向生成过程中，利用在前向扩散中训练好的unet网络，采用去噪扩散隐式模型对加噪数据进行去噪，并利用交叉注意力机制基于当前的点云数据指导unet网络的去噪过程，生成指向孔位附近的末端执行器避障轨迹。

10、作为优选技术方案，所述的碰撞损失具体如下：

11、

12、其中，代表第i条轨迹在t时刻的末端坐标；dj(·)函数代表符号距离函数，对于给定的封闭曲面，符号距离函数为将欧几里德空间中的点映射到该点到曲面的最小距离；如果点在曲面内，则符号距离函数返回一个负值。

13、作为优选技术方案，所述的利用交叉注意力机制基于点云数据对于扩散模型的轨迹生成进行条件控制，具体如下：

14、对于点云数据进行提取特征；以扩散模型的当前状态生成查询向量，点云特征生成键向量和值向量；查询向量与键向量的相似性经过激活函数转化为权重系数，再与值向量相乘，得到融合环境信息的特征表示。

15、作为优选技术方案，所述基于扩散的轨迹生成模型的训练过程中，通过动态调整仿真环境中的销钉和孔的颜色、孔的空间位置、孔附近的障碍物以及光照条件，以模拟多样化的场景变化。

16、作为优选技术方案，所述基于扩散的轨迹生成模型在推理阶段：

17、首先对于随机采样的高斯噪声，通过ddim进行去噪过程；并且输入当前的点云数据，利用交叉注意力机制来指导去噪过程，从而生成指向孔位附近的避障轨迹。

18、作为优选技术方案，通过所述视觉伺服网络实现末端执行器的插入操作的过程如下：

19、裁剪输入的点云数据，以聚焦于销钉和孔的局部；

20、对于裁剪后的点云数据提取全局特征；

21、将全局特征输入到多层感知机，预测平移偏移量δt和旋转偏移量δr；

22、偏移量预测完成后，采用视觉伺服迭代估计平移偏移量δt和旋转偏移量δr，并逐步调整末端执行器的姿态，实现末端执行器的插入操作。

23、作为优选技术方案，所述视觉伺服优化末端执行器的姿态，具体步骤如下：

24、记录末端执行器的初始姿态[r|t]，其中r为旋转矩阵，t为平移向量；

25、将旋转偏移量δr转换为旋转矩阵的形式δr；

26、将末端执行器移动到下一姿态[r′|t′]，其中r′＝δr·r，t′＝δt+t；

27、通过重复执行迭代操作，直至预测的偏移量小于误差容限或达到预设的最大迭代次数，最终执行插入指令以完成任务。

28、作为优选技术方案，所述视觉伺服插入的损失lfine由两部分组成：

29、lfine＝ltrans+lrot

30、其中，ltrans和lrot分别表示平移偏移和旋转偏移的损失；

31、对于平移偏移损失ltrans，使用均方根误差来学习平移偏移的大小，使用余弦距离来学习运动方向：

32、

33、其中，δt*为平移偏移的真实值；δt为预测平移偏移量；

34、对于旋转偏移损失lrot，采用均方根误差来最小化旋转误差：

35、

36、其中，是旋转偏移的真实值，δr为预测旋转偏移量。

37、作为优选技术方案，在每次迭代优化中，将末端执行器的姿态初始化为目标孔的真实姿态；

38、随机生成真实平移偏移量的负值-δt和真实旋转偏移量的负值-δθ_r，并根据真实平移偏移量的负值-δt和真实旋转偏移量的负值-δθ_r移动末端执行器至新的位置，并记录平移偏移量δt和旋转偏移量δθ_r；

39、采用行为克隆的方式进行训练，在测试时，机器人利用视觉反馈对末端执行器的平移偏移量δt和旋转偏移量δθ_r进行迭代估计和修正；视觉伺服通过闭环控制机制，逐步优化末端执行器的插入位姿，直至平移偏移量和旋转偏移量降至预设阈值以内，或达到指定的最大迭代次数。

40、与现有技术相比，本发明具有以下有益效果：

41、1)本发明方法基于避障扩散引导的搜索有效解决了机器人在初始状态下存在较大位姿误差的问题以及运动过程中可能遇到的障碍物问题。通过生成避障轨迹，使末端执行器接近目标孔位，为后续操作提供了精准的初始条件。与此同时，基于3d点云的视觉伺服插入通过闭环控制策略，迭代优化末端执行器的平移增量和旋转增量，从而实现了6自由度下的精确插孔操作。

42、2)本发明方法不同于传统直接依赖力传感器与目标物体进行物理接触的方法，而仅使用视觉传感器，从而显著提升了插孔效率。并且与其他基于视觉传感器的方法相比，本方法充分利用了3d点云信息，学习了钉孔之间的三维空间关系，并结合碰撞损失约束，显著提高了6自由度钉孔装配任务的完成度和精度。

当前第1页1 2

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：尤鸣宇,吴程亮
技术所有人：同济大学
我是此专利的发明人

该领域下的技术专家

1、平老师：1.功能涂层设计与应用 2.柔性电子器件设计与应用 3.结构动态参数测试与装置研发 4.智能机电一体化产品研发 5.3D打印工艺与设备

2、潘老师：1.机电一体化装备及其控制技术 2.多传感器信息融合与质量评定

3、王老师：机械制造

4、袁老师：1.薄膜气敏传感器 2.薄膜太阳能电池

5、李老师：新型电力电子技术在微网中的应用

网友询问留言留言:0条

还没有人留言评论。精彩留言会获得点赞！

文明留言，给您点赞！