基于神经网络的旋翼无人机的自适应逆控制方法

文档序号:8904764阅读:416来源:国知局
基于神经网络的旋翼无人机的自适应逆控制方法
【技术领域】
[0001] 本发明属于无人机技术领域,设及一种基于神经网络的旋翼无人机的自适应逆控 制方法。
【背景技术】
[0002] 旋翼无人机是一种能够垂直起降、W若干个旋翼作为动力装置、不载操作人员的 一种飞行器。它W能够垂直起降,任意悬停等灵活的控制方式W及结构简单噪声小等特点, 近年来逐步成为了一个研究热点。由于旋翼无人机动力学模型具有强禪合、欠驱动W及强 非线性等特点,设计出一个有效的旋翼无人机控制器是非常不易的,尤其是在对象模型参 数变化W及外界有干扰的情况下。在现有的技术中,一般的做法是将旋翼无人机动力学模 型进行简化,W降低其控制器设计的复杂程度,进而利用传统或现代控制方法对该简化模 型进行控制器设计。
[0003] 在现有技术对旋翼无人机控制器设计方法中,一般的做法是将旋翼无人机动力学 模型进行简化处理,来减低其控制器设计难度。但是,简化动力学模型进行控制器设计也必 将导致系统模型不匹配的问题,进而使得在实际控制中,所设计的控制器达不到理想的控 制效果。

【发明内容】

[0004] 本发明的目的是提供一种基于神经网络的旋翼无人机的自适应逆控制方法,解决 了现有技术中存在的问题,利用两个神经网络分别建立旋翼无人机系统模型的正向模型 和逆向模型,从而实现对完整旋翼无人机的控制和辨识。
[0005] 本发明所采用的技术方案是,一种基于神经网络的旋翼无人机的自适应逆控制方 法,按照下式进行控制:
[000引其中;n是学习率,巧:+|和町;分别是隐含层中第P个神经元与输出层中第t个神 经元第n+l次和第n次训练后的值,C1和C分别是输入层中第m个神经元与隐含层中第 P个神经元第n+1次和第n次训练后的值,?
分别表示能力函数Ec对变量 Wtp和Vpm的负梯度方向。
[0009] 本发明的有益效果是,利用神经网络具有较强的非线性映射能力,对旋翼无人机 完整模型进行控制器设计。利用两个神经网络分别建立旋翼无人机系统模型的正向模型和 逆向模型,从而实现对完整旋翼无人机的控制和辨识。系统辨识器(正向模型)的作用是 为系统逆控制器提供学习信号,进而实现逆控制器对外界干扰和旋翼无人机自身参数变化 具有良好的鲁椿性。没有对旋翼无人机系统模型进行任何简化处理,而直接对完整的旋翼 无人机模型进行控制器设计。由于完整旋翼无人机系统模型与真实旋翼无人机系统具有更 好的一致性,因此本发明设计的控制器在实际旋翼无人机飞行中,具有更好的控制效果。
【附图说明】
[0010] 图1是本发明中控制系统框架图。
[0011] 图2是处理后的样本集对系统辨识器的训练方法图。
[0012] 图3是处理后的样本集对逆系统控制器的训练方法图。
【具体实施方式】
[0013] 下面结合附图和【具体实施方式】对本发明进行详细说明。
[0014] 建立旋翼无人机理想系统模型情况下的系统辨识器和逆系统控制器,W达到系统 辨识器反映理想系统模型的输入输出关系,逆系统控制器反映理想逆系统模型的输入输出 关系。当目标信号值输入到如图1所示的控制系统时,由于外界干扰、载重变化等原因使得 系统模型输出与目标输出产生误差,通过自适应算法对系统辨识器和逆系统控制器做反馈 校正已使得控制系统对外界干扰和载重变化具有良好的鲁椿性。在本发明中,系统辨识器 的作用是建立一个等效于系统对象输入输出之间的映射关系,为逆系统控制器提供学习信 息。
[0015] 本发明一种基于神经网络的旋翼无人机的自适应逆控制方法,具体按照W下步骤 进行:
[0016] 1.训练样本集采集
[0017] 白噪声信号可W激励出系统的全部特征。因此用幅值一定的白噪声信号作为样本 采集时的系统激励信号,并用该激励信号激励旋翼无人机对象,得到该激励下对象的对应 输出。循环该操作,得到一个合适大小的训练样本集。
[001引 2.样本处理
[0019] 对样本集进行筛选处理。由于旋翼无人机在正常飞行过程中姿态角变化不大,因 此在本发明中总是限定姿态角大小在-10°~10°,并W此为标准对输出超过该范围的样 本进行筛选处理。虽然经过处理的样本弱化了所映射的非线性强度,但是该种处理大大简 化了神经网络结构和训练时间,并且符合旋翼无人机的实际飞行情况。
[0020] 3.确定系统辨识器和逆系统控制器的神经网络结构
[0021] 神经网络的输入层和输出层的神经元数目是由所需拟合的非线性函数决定的,而 隐含层的神经元数目是由经验得到的。根据图2和图3所示的基于BP原理的训练方法,可 W确定系统控制器网络和系统辨识器网络的输入层神经元和输出层神经元数目都为9个 和3个。根据确定隐含层的经验公式:^ = ^*^ + 〇,其中,111表示隐含层神经元数目,11 表示输入层神经元数目,1表示输出层神经元数目,a为1-10之间的常数。因此,可W把隐 含层神经元的数目确定为10个。在本方案中,可W确定系统控制器和系统辨识器采用相同 结构的BP神经网络;神经网络各层神经元数采用9X10X3的结构且隐含层激活函数采用S型对数函数,即/W=>(其中,X表示隐含层中各神经元的输入,f(x)表示隐含层 中各神经元的输出)。
[0022] 4.系统辨识器和逆系统控制器训练
[002引根据已确定的神经网络结构,利用处理后的样本集对系统辨识器和逆系统控制器 进行训练,训练方法如图2、图3所示。系统辨识器是利用样本集中白噪声信号作为输入信 号,对应对象输出信号作为系统辨识器的训练目标信号进行训练。逆系统控制器是利用样 本集中对象输出信号作为输入信号,对应的白噪声信号作为系统控制器的训练目标信号 进行训练。
[0024] 5.自适应算法设计
[0025] 根据BP算法原理,设计系统辨识器和逆系统控制器的自适应算法。自适应算法的 具体设计过程在下文给出。
[0026] 6.在线调整
[0027] 当对象实际输出与目标输出有误差时,将该误差作为反馈信号,利用自适应算法 对系统辨识器和逆系统控制器的网络权值做反馈调整。
[002引其中,控制系统的自适应算法设计是本发明中的核屯、内容。W下给出基于BP原理 自适应算法设计过程。为了方便后续工作的阐述,给出W下定义和说明:
[0029] 系统辨识器和逆系统控制器的网络结构都为MXPXT,即输入层神经元数目为M 个,隐含层神经元数目为P个,输出层神经元数目为T个。
[0030] 对于逆系统控制器,V= (Vpm)pxM,W= (Wtp)TxP分别表示输入层与隐含层之间、隐含 层与输出层之间的连接权值矩阵(Vpm和Wtp分别表式输入层第m个神经元到隐含层第P个 神经元的连接权值和隐含层第P个神经元到输出层第t个神经元的连接权值)。并且,为方 便叙述,定义Vp: = (Vpi,Vp2,…,VpM),P= 1,2,…P;Wt: = (Wti,V口,…,Vtp),t= 1,2,…T, 分别表示第一层权值矩阵中与隐含层第P个神经元相关联的的权值向量和第二层权值矩 阵中与输出层第t个神经元相关联的的权值向量。
[0031] 与上述逆控制器对应,在系统辨识器中,Q=(Qpm)pxM,U=扣tp)TXP分别表示输入 层与隐含层之间、隐含层与输出层之间的连接权值矩阵(Qpm和Utp分别表式输入层第m个 神经元到隐含层第P个神经元的连接权值和隐含层第P个神经元到输出层第t个神经元的 连接权值)。用HI=化Ip)pxi,册二化〇p)p>a分别表示系统控制器中隐含层的输入、输出向 量化Ip和册P分别表示隐含层中第P个神经元的输入、输出),XI,而分别表示系统辨识器 和逆系统控制器的输入向量。
[003引ya=(4d,白d,ih),y= (4,日,110,少二从例分别为系统目标输出,系统对 象实际
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1