本发明属于机器人控制,具体涉及一种用于螺母上料套件的机器人位姿控制方法、系统、设备以及存储介质。
背景技术:
1、随着工业自动化和智能制造的快速发展,机器人技术已经成为推动产业升级的重要力量,特别是在精密装配领域,如电子设备、汽车零部件的制造中。然而,传统机器人控制系统在面对小型且易损的零件,尤其是螺母的上料与装配时(关于螺母的上料套件,可参考专利文献:[1] 螺母上料套件及其上料方法,cn201611049581.3,王健,刘漫贤),存在诸多技术难题。
2、在螺母上料时,传统的机械手往往依靠固定程序和刚性夹持装置来完成任务,但在面对尺寸微小、形状不规则或材质脆弱的螺母时,这种硬性接触方式很容易造成螺母损坏或卡死,影响装配质量和生产效率。此外,螺母在料盘上的随机分布,以及与卡槽之间的精确对准,都对机器人的感知、规划和控制能力提出了挑战。
3、为了克服上述挑战,近年来,研究人员开始探索融合了传感器技术、人工智能算法和先进控制策略的智能化解决方案。力传感器的集成使得机器人能够感知与环境的交互力,从而在接触敏感部件时采取更为温和的动作。深度学习和强化学习技术的应用,让机器人能够从大量的操作数据中学习,不断提升路径规划和力控策略的精度。此外,自适应控制和多目标优化算法的进步,也为机器人在动态、不确定环境下执行高难度任务提供了技术支持。
4、尽管如此,现有的技术仍存在一些局限。例如,现有的路径规划算法虽然能够生成初步的运动轨迹,但在处理尖角和平滑性方面仍有待改进,这直接影响了机器人的运动效率和零件的完好性;力控策略的动态调整和优化,目前仍依赖于专家经验和离线调试,缺乏有效的在线学习和适应机制,进而导致机器人控制精度,效率较低。
5、基于此,本发明提出了一种用于螺母上料套件的机器人位姿控制方法。
技术实现思路
1、为了解决现有技术中的上述问题,即为了解决现有的机器人位姿控制方法控制精度和鲁棒性较差,导致机器人的效率、安全性较低的问题,本发明第一方面,提出了一种用于螺母上料套件的机器人位姿控制方法,所述螺母上料套件包括机器人和料盘机构,机器人的末端执行器的工作端设置有卡槽,该方法包括:
2、构建机器人关节空间的动力学模型以及笛卡尔空间的运动学模型;
3、结合所述动力学模型、所述运动学模型,建立所述机器人各关节的pid控制器;
4、基于螺母在所述料盘机构上的位置、所述卡槽中的位置,通过预构建的结合深度强化学习与自适应轨迹优化的路径规划方法,得到所述机器人末端执行器从初始位置到目标位置的最优路径:
5、通过高斯过程回归和非线性动力学约束,生成自适应优化轨迹;
6、通过障碍物规避函数计算每个时间点上机器人接近障碍物的规避成本,对所述自适应优化轨迹进行优化,得到最优路径;
7、根据所述最优路径逐步调整所述机器人的关节角度,并利用各pid控制器调整所述机器人的末端执行器的力和扭矩输出。
8、在一些优选的实施方式中,通过高斯过程回归和非线性动力学约束,生成自适应优化轨迹,其方法为:
9、基于状态向量、动作向量和奖励函数,构建深度强化学习策略网络;
10、根据所述深度强化学习策略网络中所述状态向量中的关节角、关节角速度、关节角加速度,通过高斯过程回归模型预测期望关节角度轨迹;
11、基于所述期望关节角度轨迹,结合速度、加速度和加速度高阶导数的平滑度以及非线性动力学约束,生成自适应优化轨迹。
12、在一些优选的实施方式中,所述状态向量、所述动作向量和所述奖励函数的构建方法为:
13、在每个时间点,基于所述机器人的关节角、关节角速度、关节角加速度、所述机器人的末端执行器相对于目标位置的误差和变化率、环境中的障碍物信息,构建状态向量;
14、基于所述机器人的关节上的控制力矩和控制周期,构建动作向量;
15、对接近目标的程度、速度、加速度、安全性以及能量消耗的加权,构建奖励函数。
16、在一些优选的实施方式中,基于所述期望关节角度轨迹,结合速度、加速度和加速度高阶导数的平滑度以及非线性动力学约束,生成自适应优化轨迹,其方法为:
17、;
18、其中,表示时间t时刻的最优关节角度,表示总时间,表示关节角,、、分别表示关节角速度、关节角加速度、关节角加加速度,表示由高斯过程回归预测的期望关节角度轨迹,、、均表示平滑度权重,表示动力学约束的惩罚权重,表示关节上的实际力矩,表示关节数量,表示基于动力学模型计算的理想力矩。
19、在一些优选的实施方式中,当在生成自适应优化轨迹还包括对尖角优化处理时,处理过程为:
20、初始化动态窗口的长度和采样时间间隔;
21、在每个采样时间点,通过模型预测控制方法预测未来 np个时间步的自适应优化轨迹,并通过核函数平滑处理尖角点,直至完成整个路径规划; np表示预测步长的数量。
22、在一些优选的实施方式中,所述障碍物的位置的预测方法为:通过预构建的深度交叉融合网络进行障碍物位置的预测;
23、所述深度交叉融合网络包括多模态输入层、时空注意力模块、时序注意力模块、跨模态注意力融合层、特征变换层、输出层;
24、所述多模态输入层,用于接收障碍物动态序列数据、环境数据;所述障碍物动态序列数据包括障碍物在设定时间段内的历史位置、速度、加速度;
25、所述时空注意力模块,用于对所述环境数据依次进行卷积、激活、池化处理;池化处理后,对各时间点和空间位置的特征进行加权并融合,将融合后的特征与池化处理后的特征残差连接,作为第一特征;
26、所述时序注意力模块,用于将所述障碍物动态序列数据输入rnn网络处理,处理后通过计算每个时间步的输入对预测的贡献程度分配权重,得到注意力权重,将每个时间步的隐藏状态与其对应的注意力权重相乘并求和,将求和后的特征与所述rnn网络的输出残差连接作为第二特征;
27、所述跨模态注意力融合层,用于将所述第一特征与所述第二特征进行加权融合,得到第三特征;将所述第一特征、所述第二特征、所述第三特征调整至相同维度并相加,将相加后的特征作为融合特征;
28、所述特征变换层,用于通过全连层对所述融合特征处理后进行非线性激活处理,将处理后的特征通过所述输出层输出。
29、在一些优选的实施方式中,通过计算每个时间步的输入对预测的贡献程度分配权重,得到注意力权重,其方法为:
30、在每个时间步w,计算与w相邻的时间步的局部注意力分数;
31、结合可学习的参数矩阵、可学习的向量、可学习的偏置向量计算全局注意力分数;
32、对所述全局注意力分数与所述局部注意力分数进行加权求和,求和后进行归一化,作为注意力权重。
33、本发明第二方面,提出了一种用于螺母上料套件的机器人位姿控制系统,所述螺母上料套件包括机器人和料盘机构,机器人的末端执行器的工作端设置有卡槽,该系统包括:
34、模型构建模块,配置为构建机器人关节空间的动力学模型以及笛卡尔空间的运动学模型;
35、控制器建立模块,配置为结合所述动力学模型、所述运动学模型,建立所述机器人各关节的pid控制器;
36、路径规划模块,配置为基于螺母在所述料盘机构上的位置、所述卡槽中的位置,通过预构建的结合深度强化学习与自适应轨迹优化的路径规划方法,得到所述机器人末端执行器从初始位置到目标位置的最优路径:
37、通过高斯过程回归和非线性动力学约束,生成自适应优化轨迹;
38、通过障碍物规避函数计算每个时间点上机器人接近障碍物的规避成本,对所述自适应优化轨迹进行优化,得到最优路径;
39、控制输出模块,配置为根据所述最优路径逐步调整所述机器人的关节角度,并利用各pid控制器调整所述机器人的末端执行器的力和扭矩输出。
40、本发明第三方面,提出了一种用于螺母上料套件的机器人位姿控制设备,所述设备包括:
41、至少一个处理器,以及与至少一个所述处理器通信连接的存储器;
42、其中,所述存储器存储有可被所述处理器执行的指令,所述指令用于被所述处理器执行以实现上述的用于螺母上料套件的机器人位姿控制方法。
43、本发明第四方面,提出了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于被计算机执行以实现上述的用于螺母上料套件的机器人位姿控制方法。
44、本发明的有益效果:
45、本发明提升了机器人位姿控制的精度和鲁棒性,提高了机器人的效率以及安全性。
46、1)深度强化学习赋予机器人在线学习和自我优化的能力,使其能够灵活应对不同的螺母类型和装配环境,减少了对人工干预的依赖,提升了生产线的灵活性和适应性;
47、2)非线性轨迹优化技术生成的平滑路径,降低了机器人运动中的振动和能耗,提高了控制精度,加快了螺母上料的速度,从而有效提升了整体生产效率和产能;
48、3)智能控制策略减少了硬性碰撞的发生,延长了机器人及其末端执行器的使用寿命,提高了安全性,进而降低了设备的维护和更换成本。