一种用于避碰动态障碍物的无人机类脑避障方法

文档序号：31054339发布日期：2022-08-06 11:09阅读：来源：国知局

技术特征：
1.一种用于避碰动态障碍物的无人机类脑避障方法，其特征在于，包括步骤：1)分析脉冲神经元的响应特性，建立神经元脉冲响应模型；2)对脉冲ac网络的输入相机数据进行差分编码处理，对输出时序信号进行时序编码调制，基于a3c算法的异步更新机制和基于λ回归算法的多步更新机制对脉冲ac网络的网络更新机制进行更新；3)获取无人机的相机数据，通过神经元脉冲响应模型和更新后的脉冲ac网络输出避障决策以进行避障。2.根据权利要求1所述的用于避碰动态障碍物的无人机类脑避障方法，其特征在于，在步骤2)中，对相机数据进行脉冲化编码，使其能够直接被脉冲神经网络识别；其中对相机数据的脉冲化编码是通过识别对应像素上的数据变化来实现的；其中需要对相机的数据进行差分操作，具体为：相机的数据是rgb的亮度值，根据每个像素位置的亮度变化，产生识别变化的脉冲信号；将每个像素的亮度转化为对数亮度，如下式：l(u,t)＝log(0.299i
r
(u,t)+0.5781i
g
(u,t)+0.1141i
b
(u,t))其中，i
r
、i
g
、i
b
分别是相机的rgb数据，u是对应的像素位置，t为对应的时间；对像素的对数亮度做差分，产生对应的亮度变化；选取一个阈值δl，设定亮度变化超过阈值δl的变化是无人机需要关注的明显变化，即：f(u,t)＝1,l(u,t)-l(u,t-δt)>δl通过f(u,t)记录这些明显变化；f(u,t)就是所需要的无人机的脉冲输入。3.根据权利要求2所述的用于避碰动态障碍物的无人机类脑避障方法，其特征在于，在步骤2)中，相机输入的帧之间的时间间隔δt与仿真时使用的时间间隔δt是不同的；采用线性插值的方法，将两帧之间的像素对数亮度变化，平摊到帧时间间隔中，以补足帧与帧之间的脉冲信号编码。4.根据权利要求1或2或3所述的用于避碰动态障碍物的无人机类脑避障方法，其特征在于，在步骤2)中，对输出时序信号进行时序编码调制的过程为：critic网络中，输出层只需要一个脉冲神经元来对信息进行编码，用以表示当前状态的价值函数；经过调制，脉冲神经元可以在任意时刻产生第一个脉冲，即将信息编码到正向时轴上，取值范围为t
out
∈(0,+∞)；设置调制神经元与输出神经元之间连接的权重，调制神经元激发的脉冲，在抵达输出神经元后，会使输出神经元激发一个脉冲，且输出神经元激发脉冲的时间为脉冲响应抵达峰值的时间；在actor网络中，通过多个脉冲神经元分别产生的第一个脉冲进行编码，使每个神经元分别代表一个待选择的动作；其中为输出层的每一个神经元添加适当的随机操作，使神经元产生脉冲的时间随机化，然后通过不同的脉冲神经元产生脉冲的顺序，编码选择某个动作而不选择另外的动作的概率。5.根据权利要求4所述的用于避碰动态障碍物的无人机类脑避障方法，其特征在于，在基于a3c算法的异步更新机制对脉冲ac网络进行更新时，采用n步更新的方式，用优势函数a(s
t
,a
t
；θ’,w’)代替时序差分δ；每当actor网络产生动作信号时，输入的脉冲序列被截断，新时刻的状态开始，此时引入一个新的critic网络，将新时刻的状态输入到新的critic网络
中，而旧时刻的状态则仍然在原来的critic网络中传递，直到原来的critic网络输出旧时刻的状态值函数，此时才开始更新网络的参数；最开始，脉冲序列同时输入到actor网络和critic1网络中；在t1时刻，actor网络产生动作信号，此时，输入脉冲序列以t1时刻为新的初始0时刻，产生新的状态，输入到critic2网络中；在t2时刻，actor网络产生动作信号，此时，输入脉冲序列以t2时刻为新的初始0时刻，产生新的状态，输入到critic3网络中；以此类推。6.根据权利要求5所述的用于避碰动态障碍物的无人机类脑避障方法，其特征在于，基于λ回归算法的多步更新机制对脉冲ac网络进行更新时，将回合合并，把网络参数更新的时间转为大回合结束时更新；其中λ回归包含所有n步回归，权重系数分别为(1-λ)λ
n-1
,其中λ∈[0,1]，λ回归在最大的回合结束之后再返回更新，λ回归包含所有的n步回归。7.根据权利要求1或2或3所述的用于避碰动态障碍物的无人机类脑避障方法，其特征在于，所述避障决策包括向左飞行、向右飞行和悬停。8.一种用于避碰动态障碍物的无人机类脑避障系统，其特征在于，包括：第一程序模块，用于分析脉冲神经元的响应特性，建立神经元脉冲响应模型；第二程序模块，用于对脉冲ac网络的输入相机数据进行差分编码处理，对输出时序信号进行时序编码调制，基于a3c算法的异步更新机制和基于λ回归算法的多步更新机制对脉冲ac网络进行更新；第三程序模块，用于获取无人机的相机数据，通过神经元脉冲响应模型和更新后的脉冲ac网络输出避障决策以进行避障。9.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序在被处理器运行时执行如权利要求1～7中任意一项所述方法的步骤。10.一种计算机设备，包括存储器和处理器，所述存储器上存储有计算机程序，其特征在于，所述计算机程序在被处理器运行时执行如权利要求1～7中任意一项所述方法的步骤。

技术总结
本发明公开了一种用于避碰动态障碍物的无人机类脑避障方法，包括步骤：1)分析脉冲神经元的响应特性，建立神经元脉冲响应模型；2)对脉冲AC网络的输入相机数据进行差分编码处理，对输出时序信号进行时序编码调制，基于A3C算法的异步更新机制和基于λ回归算法的多步更新机制对脉冲AC网络的网络更新机制进行更新；3)获取无人机的相机数据，通过神经元脉冲响应模型和更新后的脉冲AC网络输出避障决策以进行避障。本发明具有决策速度快、资源消耗少和生物可解释性强等优点。少和生物可解释性强等优点。少和生物可解释性强等优点。

技术研发人员：喻煌超王祥科赵述龙尹栋陆俊麒曹粟吴欣宁周波
受保护的技术使用者：中国人民解放军国防科技大学
技术研发日：2022.04.08
技术公布日：2022/8/5

完整全部详细技术资料下载

当前第2页1 2