基于元学习的故障条件下无人机跟踪指令在线生成方法

文档序号:34898506发布日期:2023-07-26 05:50阅读:68来源:国知局
基于元学习的故障条件下无人机跟踪指令在线生成方法与流程

本发明涉及在线轨迹设计,特别涉及一种基于元学习的故障条件下无人机跟踪指令在线生成方法。


背景技术:

1、运行在空中和地面的自主移动机器人正在逐渐普及到我们的日常生活中。然而,在实际应用中,机器人系统面临多种挑战,例如外部干扰、模型更改和组件故障。由于这些情况通常在没有先验知识的情况下发生,因此会导致系统在降级条件下运行,使得机器人可能在实际运行时会偏离期望轨迹,产生碰撞等不安全的情况。


技术实现思路

1、本发明提供一种基于元学习的故障条件下无人机跟踪指令在线生成方法、装置、电子设备及存储介质,以解决相关技术中无人机在降级条件下运行,使得无人机在实际运行时会偏离期望轨迹,产生碰撞等不安全的问题。

2、本发明第一方面实施例提供一种基于元学习的故障条件下无人机跟踪指令在线生成方法,包括以下步骤:利用元驱动模型对无人机进行状态预测,基于状态预测结果得到所述无人机的参考轨迹;检测所述参考轨迹上所述无人机的预测位置与所述无人机的实际位置的距离是否满足校正条件,其中,所述元驱动模型为基于所述无人机的故障数据,利用元学习算法训练得到;在所述距离满足所述校正条件时,获取所述无人机的在线数据,利用所述在线数据更新所述元驱动模型的参数。

3、可选地,在本发明的一个实施例中,在利用元驱动模型对无人机进行状态预测之前,还包括:在所述无人机的离散故障集中按照不同轨迹收集故障数据,得到包含每个故障数据子集的训练数据集;利用无模型元学习算法在所述训练数据集上进行训练得到所述元驱动模型。

4、可选地,在本发明的一个实施例中,所述利用无模型元学习算法在所述训练数据集上进行训练得到所述元驱动模型,包括:

5、初始化所述元驱动模型的参数;

6、提取所述训练数据集中的多个故障数据子集,依次利用所述多个故障数据子集进行梯度计算以对所述元驱动模型参数进行更新,更新过程为:

7、

8、其中,θ为元驱动模型参数,θi′为更新后的元驱动模型参数,α为超参数,为损失函数,为参数梯度,fθ为初始化的元驱动模型,为故障i的离散故障集;

9、利用所述多个故障数据子集一同进行梯度计算以对所述元驱动模型参数进行再更新,更新过程为:

10、

11、其中,β为超参数,为更新后的元驱动模型,为全部离散故障集;

12、重复更新和再更新过程,直至所述元驱动模型更新过程中所有故障类型的故障数据集均被提取,得到所述元驱动模型。

13、可选地,在本发明的一个实施例中,检测所述参考轨迹上所述无人机的预测位置与所述无人机的实际位置的距离是否满足校正条件,包括:检测所述元驱动模型的预测位置与所述无人机的实际位置的距离是否大于预设阈值,若所述距离大于所述预设阈值,则满足所述校正条件,若所述距离小于等于所述预设阈值,则不满足所述校正条件。

14、可选地,在本发明的一个实施例中,获取所述无人机的在线数据,包括:采集所述无人机的相对参考位置和速度构建输入数据集和输出数据集;将所述输入数据集的数据聚类为多个聚类,并计算每个聚类的形心,将所述输入数据集中距离每个形心最近的点作为训练输入数据;根据所述训练输入数据调整所述输出数据集,得到所述训练输出数据,根据所述训练输入数据和所述训练输出数据构建所述无人机的在线数据。

15、可选地,在本发明的一个实施例中,利用所述在线数据更新所述元驱动模型的参数,包括:

16、利用所述无人机的在线数据进行梯度计算以对所述元驱动模型参数进行更新,更新过程为:

17、

18、其中,为未知故障数据集。

19、可选地,在本发明的一个实施例中,利用元驱动模型对无人机进行状态预测,基于状态预测结果得到所述无人机的参考轨迹,包括:利用所述元驱动模型计算所述无人机下一时刻的预测位置,计算所述预测位置和所述无人机当前轨迹上至所述预测位置最近的点之间的距离,得到预测偏差;根据pid控制的规则,基于预测偏差的历史和预测偏差计算轨迹更新向量,并更新所述无人机的参考速度;根据所述轨迹更新向量在所述预测偏差的相反侧更新所述无人机当前轨迹,得到所述无人机的参考轨迹。

20、本发明第二方面实施例提供一种基于元学习的故障条件下无人机跟踪指令在线生成装置,包括:预测模块,用于利用元驱动模型对无人机进行状态预测,基于状态预测结果得到所述无人机的参考轨迹;检测模块,用于检测所述参考轨迹上所述无人机的预测位置与所述无人机的实际位置的距离是否满足校正条件,其中,所述元驱动模型为基于所述无人机的故障数据,利用元学习算法训练得到;更新模块,用于在所述距离满足所述校正条件时,获取所述无人机的在线数据,利用所述在线数据更新所述元驱动模型的参数。

21、本发明第三方面实施例提供一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以执行如上述实施例所述的基于元学习的故障条件下无人机跟踪指令在线生成方法。

22、本发明第四方面实施例提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行,以执行如上述实施例所述的基于元学习的故障条件下无人机跟踪指令在线生成方法。

23、本发明实施例的基于元学习的故障条件下无人机跟踪指令在线生成方法、装置、电子设备及存储介质,具有以下有益效果:

24、通过使用元学习算法,使建立的元驱动模型具有“学会学习”的能力,并且将跟踪问题前移至轨迹规划阶段,对轨迹偏移进行预处理。与常规学习方法相比,本发明不是仅解决某一个问题/某个任务,而是可以跨任务求解,即处理某一类问题。此外,与传统处理不同故障时需要进行控制器调整的思路不同,本发明将这一问题前移至规划阶段处理,而不去访问控制单元,通过调整跟踪指令的方式改善故障情况下轨迹跟踪性能,能够均衡轨迹规划和控制设计的负担。

25、本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。



技术特征:

1.一种基于元学习的故障条件下无人机跟踪指令在线生成方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的方法,其特征在于,在利用元驱动模型对无人机进行状态预测之前,还包括:

3.根据权利要求2所述的方法,其特征在于,所述利用无模型元学习算法在所述训练数据集上进行训练得到所述元驱动模型,包括:

4.根据权利要求1所述的方法,其特征在于,检测所述参考轨迹上所述无人机的预测位置与所述无人机的实际位置的距离是否满足校正条件,包括:

5.根据权利要求1所述的方法,其特征在于,获取所述无人机的在线数据,包括:

6.根据权利要求3所述的方法,其特征在于,利用所述在线数据更新所述元驱动模型的参数,包括:

7.根据权利要求1所述的方法,其特征在于,利用元驱动模型对无人机进行状态预测,基于状态预测结果得到所述无人机的参考轨迹,包括:

8.一种基于元学习的故障条件下无人机跟踪指令在线生成装置,其特征在于,包括:

9.一种电子设备,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现如权利要求1-7任一项所述的基于元学习的故障条件下无人机跟踪指令在线生成方法。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行,以用于实现如权利要求1-7任一项所述的基于元学习的故障条件下无人机跟踪指令在线生成方法。


技术总结
本发明公开了一种基于元学习的故障条件下无人机跟踪指令在线生成方法,属于在线轨迹设计领域,通过元学习训练一个在线运行时容易适应的模型,对无人机的未来状态进行准确预测,并利用反馈控制逻辑在线调整参考轨迹。在未知故障运行环境下,本发明能够根据在线的采样数据调整网络模型,以准确预测当前系统输出,根据模型预测数据调整提供给无人机的参考轨迹,以在不更改控制器的情况下,提高轨迹跟踪性能。由此,本发明解决了相关技术中无人机在降级条件下运行,使得无人机在实际运行时会偏离期望轨迹,产生碰撞等不安全的问题。

技术研发人员:曹瑞,徐亮,裔扬
受保护的技术使用者:扬州大学
技术研发日:
技术公布日:2024/1/13
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1