一种基于鼠脑海马网格细胞重构的仿生导航方法与流程

文档序号:17929443发布日期:2019-06-15 00:42阅读:335来源:国知局
一种基于鼠脑海马网格细胞重构的仿生导航方法与流程

本发明属于仿生学技术领域,用于机器人的仿生导航。利用类脑计算,借鉴大脑中进行信息处理的基本规律模仿海马体中空间细胞放电的生理特性,通过建立模型的方式将其表达出来。相比于非仿生类导航,仿生导航具有更加强大的灵活性和智能性。



背景技术:

随着社会的不断发展,机器人已经在我们的生活中扮演着非常重要的角色,而科学技术的进步也逐步使得机器人趋于全面化和智能化。仿生机器人的发明和应用使得机器人越来越向人类靠拢。原来的机器人往往都是具有固定的程序,按照程序执行任务,比较刻板,往往用来完成重复性的非智能工作。而仿生机器人可以模仿人类的行为方式,通过类脑计算来模仿人脑运动和计算,从而更加智能。对于自主移动机器人而言,机器人的自主定位能力和智能导航的能力非常重要。以往的导航机器人需要对自己所处的环境具有一定的先验知识,再通过传感器来确定自身位置。智能移动机器人的导航经历了基于符号阶段和基于行为阶段,已经取得了一定成就。比如slam技术,目前经过工业机器人和家庭服务机器人上得到的广泛的应用。但是与生物的导航能力相比,机器人的导航显得不够准确、不够灵活、不够简单。而仿生机器人需要在没有先验知识的情况下,像哺乳动物一样可以迅速对自己进行定位。在过去几十年的研究中,研究人员在海马体中发现了很多空间细胞,包括头朝向细胞、条纹细胞、网格细胞、位置细胞等,这些空间细胞都是帮助人类完成自主定位、形成认知地图并进行导航的重要因素,那么这些细胞及其运作机制的发现和研究也给仿生机器人的发明提供了参考价值。

在tolman三迷宫导航试验中,就揭示了动物的导航行为依赖于认知地图的形成。损毁实验揭示了海马体结构就是动物对环境进行认知的关键结构,一旦海马体结构、内嗅皮层或是后下托发生损毁的大鼠就无法完成morris水迷宫导航。1971年,o'keefe等科学家在海马体结构的海马角中发现了一种锥体细胞具有复杂的放电活动,并且其放电具有一定的典型性。研究表明此细胞的放电与动物所处的位置具有很强的关联,只有当动物处于某一个特定区域时,此细胞才会放电。当位置细胞产生动作电位时,将其笛卡尔坐标对应到空间坐标中,就可以得到某一个特定的位置点。也就是当动物运动到这一个特定位置点时,这个锥体细胞就会产生动作电位,由此称之为位置细胞。在ca1区和ca3区中,位置细胞更为活跃,并且大多体现为单一的位置野(位置细胞的狭小放电范围)。当空间环境比较大时,位置细胞也可能会体现为多个位置野。2005年,hafting等科学家在大鼠的内嗅皮层中发现了另外一种具有强烈空间放电特性的神经元,其会呈现出对空间中某一特定区域发生重复性规律放电的特性,并且放电野呈现出六边形的网格特性,被称为网格细胞。网格细胞的放电情况基本不受到环境的影响,无论是将大鼠置于黑暗的环境中还是改变其周围的环境标志物,都不会对网格细胞的放电结构产生明显的影响。网格细胞具有多个放电位置,具有多峰型的放电野。多个网格细胞的放电节点连接形成正三角形,可以遍布大鼠所处的整个空间环境中。根据对大鼠脑海马的生理学研究,信息由内嗅皮层投射到海马区,故而海马区中位置细胞位置野的形成需要网格细胞的信息输入。但由于在生成网格细胞的过程中,速度估计和神经计算误差的累积都会导致网格细胞的放电野不够稳定,影响位置细胞和认知地图的构建。hebbian理论是一种神经科学理论,认为突触前细胞对突触后细胞的反复和持续刺激导致了突触效能的增加,即在同一个时间内被激发的神经元之间的联系会逐渐增强。而相反,如果两个神经元总是不能同步激发,那么它们间的联系将会越来越弱。这一现象也被解释为突触可塑性,也就是大脑神经元具有比较强的适应性。对于网格细胞而言,持续或是重复的神经元之间的相互关联和激发活动会导致持久的细胞变化,从而使得其稳定性得以增加。这也就表明,任何两个细胞或是细胞系统在同一时间内反复激活都将倾向于成为“关联细胞”,那么一个细胞的激活也将会促进另外一个细胞的激活。如果系统的输入导致相同的激发模式重复发生,那么构成这个激发模式的神经元族也会具有更加紧密的联系,每一个神经元都会促进其他神经元的激发,并阻断模式之外的神经元的激发,那么整个激发过程就变成了自动关联的。那么在增强网格细胞放电野的稳定性时,通过hebbian原理就是增加一种神经元之间的权重,如果两个神经元可以同时激活,那么两个神经元之间的权重增加,而如果两个神经元不能同时激活,那么权重就减少。通过hebbian可塑性调节,可以比较明显地增强网格细胞网格野的稳定性。

哺乳动物完成自主导航,首先需要在自己所处的空间环境中构建认知地图,进行自主定位,其次根据任务制定的目的地完成导航任务,所以认知地图的构建是仿生导航中的重要一环。认知地图是由位置细胞位置野构成的,而位置细胞位置野具有单峰型的放电野。而形成位置细胞的模型也相继被提出,包括高斯分布函数模型、竞争学习模型、自组织映射模型等。大鼠进入到一个空间环境中,通过自由运动来探索环境,在其探索轨迹遍布整个空间位置时,就能够呈现出一个比较完整的覆盖大鼠所处整个环境的位置细胞位置野,再形成大鼠脑内的认知地图,最后通过强化学习的方式来完成导航任务。强化学习的过程就是一个不断探索尝试,最终获得最佳路径的过程。生物学研究发现,认知地图的确是哺乳动物完成导航任务的重要因素,但仅凭认知地图并不能帮助大鼠确认下一步的方向。在大脑前额叶皮层中,存在与运动相关的神经元,而在大脑腹侧具有奖励预测误差信号相关的多巴胺能神经元,而多巴胺能神经元就能够将信息投射到付隔核,同时前额叶皮层和付隔核之间还存在双向纤维投射。此研究表明,海马投射空间环境信息至付隔核,付隔核接受奖励预测误差信号,与前额叶皮层相互作用,对大鼠正确的运动方向进行预测。



技术实现要素:

本发明主要是以大鼠的海马体及其运行机制为基础,对海马区中的空间细胞(头朝向细胞、条纹细胞、网格细胞、距离细胞等)的生理放电现象进行建模,在此基础上完成智能机器人的面向目标的仿生矢量导航过程。本发明将为相关领域的研究提供具有实际应用方面的实验建模方法和研究结果,对于各种仿生机器人的研究具有广泛的参考价值。

本发明是基于鼠脑海马在仿生移动机器人导航中的应用,主要包括增强网格细胞网格野的稳定性、完成路径规划及导航。首先由角速度信息和线速度信息提供信息输入,由此建立空间细胞模型,其次针对网格细胞网格野,利用hebbian可塑性修正计算过程中累积的误差,增加其稳定性,并生成距离细胞,确定出发点与目标点的矢量距离,最后通过路径规划的迭代计算实现仿生导航任务。

本发明采用的技术方案是一种基于鼠脑海马网格细胞重构的仿生导航方法,本模型的整体示意图如图1所示。根据模型的整体示意图,模型主要包括两个模块。第一个模块是基于自运动信息输入构建空间细胞模型,通过hebbian可塑性生成稳定的网格细胞网格野。第二个模块是利用稳定的网格细胞网格野生成距离细胞,利用矢量距离完成导航任务。

一种基于鼠脑海马网格细胞重构的认知地图构建方法,是首先基于大鼠的自运动信息,构建空间细胞模型,之后用hebbian算法对网格细胞放电野进行稳定性优化,最后完成面向目标的导航。

具体实现步骤:

1.自我定位

1.1.通过构建头朝向细胞模型给用于定位的网格细胞模型提供前向输入,即输出头朝向信号具体过程如下:

首先,通过获取瞬时角度θ,计算出角度调整向量用于表征头朝向细胞调整角度的内核模型,用于头朝向信号的计算,具体公式如下:

其中,θ0是代表头朝向细胞的主要朝向,在[0,360]中取值,

m取正整数,

θi代表第i个头朝向细胞的瞬时速度相对于主要朝向θ0的角偏移量,计算公式如下:

θi=|θ-θ0|,

其中,θ表示运动过程中通过编码器获取的当前时刻的瞬时角度,

然后,根据角度调整向量计算得到头朝向信号用于表征头朝向细胞在当前时刻t时的头朝向信号,具体公式如下:

其中,表示机器人在时刻t的瞬时速度;

1.2通过构建条纹细胞模型给用于定位的网格细胞模型提供前向输入,输出条纹信号具体计算如下:

获取当前时刻t的瞬时速度计算出条纹信号,具体公式如下:

其中,表示第i个条纹细胞的放电活动,

代表波矢量,其矢量方向代表波等相位行进的方向

λcos代表cos波的波长,

p(t)代表当前时刻所处空间环境的位置坐标,

p(t)=(x(t-δt)+vx(t)δt,y(t-δt)+vy(t)δt)

其中,vx是t时刻速度在x轴方向上的分速度,vy是t时刻速度v在y轴方向上的分速度,δt是相邻两次位移之间的时间间隔其中;

1.3根据前文获得的瞬时时刻t的角度、速度信息,利用网格细胞模型计算获得瞬时时刻t的网格细胞模块的网格尺度s,其中所述的网格细胞模型的表达为:

其中,f[x]是一个非线性整流函数,是神经元的传递函数,当x>0时,f(x)=x,当x≤0时,f(x)=0,由前文计算获得;wij用于表征神经元j到神经元i的连接权值,用于表征投射到神经元i的抑制性递归输入信号,j与i相对应,j=i为自然数;

用于表征网格细胞的递归连接权值的wij的计算公式如下:

wij=ae-e

其中调节向量a=1.1,γ=1.05×β,β=3/t2,t是用于表征网格细胞放电野中形成网格的周期,取值为12-52之间的整数;

根据网格细胞模型求出s函数,并进一步计算获得瞬时时刻t对应的网格尺度s;

1.4在网格细胞模型中应用hebbian重塑算法增强网格细胞网格野的稳定性,更新网格尺度s,

具体过程如下:

表征突触权重的wi计算公式如下:

wi=ηxiy

其中η用来表征学习率,取值范围是[0.0001,1),xi用于表征第i个神经元的输入值,计算公式如下:

xi=φi(t)+di(t),

y用来表征后突触的响应信号,通过采集电位进行获取

网格细胞的递归连接权值公式更新为:

w′ij=wi(ae-e)

此时,更新网格细胞模型,可以得到:

利用上述公式重新求得s′函数,并计算输出修正后的表征网格细胞网格野的尺度的s′,直到修正后的s′的值趋于稳定,即t+δt时刻的s′(t+δt)与t时刻的s′(t)的差值小于1,具体为s′(t+δt)-s′(t)<1,具体方法与前文同;

2、利用距离细胞模型得到当前位置到目标点的矢量距离,矢量距离表示如下:

其中输入量s'用于表征网格细胞尺度,由前文计算得到,i取正整数,从(0,m]取值,m用于表征距离细胞的个数,由用于表征二维网格细胞神经板的长度的n决定,m=n/cosθ,其中n取正整数,取值范围是(0,+∞];θ是当前位置时刻采集到的瞬时角度,表示当前位置时刻采集到的瞬时速度;

3、面向目标的导航

在进行自我定位、计算当前位置到目标位置的矢量距离后,以δt为时间间隔进行导航活动的迭代计算,每走一步之后都更新一次位置,并根据当前位置和目标位置的相对位置做下一步的决策,循环往复,直到到达目的地。以这一方法即可实现面向目标的矢量导航。

有益效果

本发明通过有效提升网格细胞网格野的稳定性,即提升了导航主体在空间环境中针对自身位置编码的准确性,再借助矢量距离的计算,有效地提升面向目标导航的准确性和实时性。

附图说明

图1本发明模型整体示意图

图2头朝向细胞最佳方向示意图

图3网格细胞放电野示意图

图4a为边长为n的神经面板示意图

图4b为网格细胞二维环状吸引子成型后的模型示意图

图5a、b、c未使用hebbian重构的网格细胞仿真图

图6a、b、c使用hebbian重构的网格细胞仿真图,其中,线条、点和圆圈标示含义都与图5相同,图6c是由图6a、图6b重叠而来。

图7网格细胞分别在x轴和y轴方向竞争生成距离细胞示意图

图8距离细胞表示矢量距离示意图,其中,深色五角星位置用于标示当前位置,浅色五角星位置用于标示目标位置

图9a、b、c、d、e、f、g、h矢量导航结果图,其中,横纵坐标均用于标示位置坐标,方框位置为目标位置,从a-f依次为8顺次运行结果

图10多次矢量导航步数示意图,其中,横坐标为运行次数,纵坐标为步数。

具体实施方式

如图1所示,在采集大鼠的速度信息和角度信息后,分别作用于头朝向细胞和条纹细胞,生成头朝向信号和条纹信号,均作为网格细胞的输入信号,针对网格细胞建立而为连续吸引子模型,并将hebbian算法作用于网格细胞模型,计算出网格细胞的尺度,形成稳定的网格细胞网格野,在此基础上通过距离细胞模型计算当前位置到目标位置的适量距离,并通过路径规划完成面向目标的导航。

1、自我定位

1.1通过构建头朝向细胞模型给用于定位的网格细胞模型提供前向输入,即输出头朝向信号具体过程如下:

第一步,获取瞬时角度θ,计算出角度调整向量用于表征头朝向细胞调整角度的内核模型,是一个m×2的矩阵,用于头朝向信号的计算。头朝向细胞和大鼠的角速度密切相关,在本发明中,当头朝向细胞接收到角速度信息时,能够产生针对角速度的调节信号。具体公式如下:

其中,θ0是代表头朝向细胞的主要朝向。在大鼠运动和探索环境的过程中,头朝向细胞负责大鼠的运动方向编码。每一个头朝向细胞都具有一个最优方向,当大鼠的头部朝向符合优先方向时,这个头朝向细胞达到最大放电。而随着大鼠的头朝向发生变化,头朝向细胞的放电也不会立即消失,而是随着大鼠头朝向的逐渐变化而变化。如图2所示为一个主要朝向为150°的头朝向细胞,设定起点为0°,那么大鼠的头朝向从0°到150°,该头朝向细胞的放电强度逐渐增大,在150°时达到峰值,随后再随着大鼠头朝向偏离150°逐渐减小,那么头朝向细胞的放电强度可以近似于一个高斯函数表达。而每一个头朝向细胞都具有主要朝向,所以θ0在[0,360]中取值,本实施例中取150。

m用于表征头朝向细胞个数,所以其可取正整数。为了让其能够真正模拟出哺乳动物体内的头朝向细胞信号,m的取值不能过小,而为了方便计算,其取值也不能取无穷大,本实施例中取360。

θi代表第i个头朝向细胞的瞬时速度相对于主要朝向θ0的角偏移量,计算公式如下:

θi=|θ-θ0|,(2)

其中,θ表示运动过程中通过编码器获取的当前时刻的瞬时角度,

然后,根据角度调整向量计算得到头朝向信号用于表征头朝向细胞在当前时刻t时的头朝向信号,具体公式如下:

其中,表示机器人在时刻t的瞬时速度,是一个2×1的矩阵,可以表示为所以头朝向信号是一个m×1的矩阵。di(t)是整个头朝向细胞族中第i个头朝向细胞在时刻t时的头朝向信号,即矩阵中的每一个元素依次表征第1个头朝向信号到第m个头朝向信号。1.2构建条纹细胞模型,通过构建条纹细胞模型给用于定位的网格细胞模型提供前向输入,输出条纹信号具体如下:

根据生理学研究,条纹细胞是网格细胞的上游细胞,给网格细胞提供信息。条纹细胞与速度编码相关,当大鼠运动和探索环境时,其速度信息由条纹细胞编码并传递给下游细胞。基于大鼠的角速度信息和线速度信息,可以得到条纹细胞的空间表征,用二维cos波来表示。获取当前时刻t的瞬时速度计算出条纹信号是一个n×1的矩阵,可以表示为:

其中,表示第i个条纹细胞的放电活动,i是正整数,在(0,n]中取值;ki代表波矢量,表达方式为:其矢量方向代表波等相位行进的方向;λcos代表cos波的波长,λcos的取值范围是(0,+∞),在同一个实验中,λcos是固定的,故而波矢量k的值也是相同的,k的取值范围是(0,+∞),本实施例中设定λcos=7,n代表条纹细胞个数,取值为正整数,本实施例中取值为360。

p(t)代表当前时刻所处空间环境的位置坐标,t时刻位置坐标p(t)的具体计算公式如下:

p(t)=(x(t-δt)+vx(t)δt,y(t-δt)+vy(t)δt)(5)

其中,vx是t时刻速度在x轴方向上的分速度,vy是t时刻速度v在y轴方向上的分速度δt是相邻两次位移之间的时间间隔,本实施例中设为0.1s,即每隔0.1s更新一次自我定位,而初始时刻位置信息(x0,y0),在本实施例中设定导航从(1000,1000)点到横坐标取值范围[8000,9000],纵坐标取值范围[5500,6500]的一个方框区域,所以在实施例中,起始点为(1000,1000),主体从起始点出发,每隔0.1s进行一次位置更新并进行自我定位,直到到达目标方框位置。

1.3构建网格细胞模型,根据前文获得的瞬时时刻t的角度、速度信息,利用网格细胞模型计算获得瞬时时刻t的网格细胞模块的网格尺度s。

在二维空间中,条纹细胞产生的条纹波通过叠加形成具有不同空间相位、定向、间距的网格细胞网格野。网格细胞放电野示意图如图3所示,其相位表示为(x0,y0),定向角度为α,间距表示为r。在构建认知地图的过程中,网格细胞起到路径积分的作用。在本发明中,认为条纹细胞与网格细胞的前向连接对于网格细胞网格野的形成具有比较大的影响作用。

将条纹细胞和网格细胞的前向连接关系加入到网格细胞模型中,由条纹细胞驱动网格细胞吸引子并对大鼠所处环境进行编码更加符合生理学事实。对网格细胞计算模型的建立采用了二维环状吸引子模型,其中网格细胞吸引子的形成受到其周围网格细胞递归连接权值和来自条纹细胞的前向连接权值的调节影响。如图4a所示,在一个长宽均为n个神经元的神经板中,吸引子活动包就可以用响应的神经元进行表示。假设就在这样一个一维平面中建立模型,那么与一维环状吸引子模型相同,都面临着网络边界的问题,需要使用周期性循环机制。但在此模型中,将神经板的上下边界神经元进行连接、左右边界的神经元进行连接,形成一个没有边界的吸引子模型,如图4b所示。

在这个二维环状神经元板中,网格细胞的神经元动力学公式,即网格细胞模型可以表达为:

其中所述的网格细胞模型的表达为:

根据前文获得的瞬时时刻t的角度、速度信息,利用网格细胞模型计算获得瞬时时刻t的网格细胞模块的网格尺度s,

其中,f[x]是一个非线性整流函数,是神经元的传递函数,当x>0时,f(x)=x,当x≤0时,f(x)=0。由前文计算得到;wij用于表征神经元j到神经元i的连接权值,用于表征投射到神经元i的抑制性递归输入信号,j与i相对应,j=i,取值范围是(0,n],n用来表征整个神经元板长度,本实施例中j=i=32。

用于表征网格细胞的递归连接权值的wij的计算公式如下:

wij=ae-e(7)

其中调节向量a=1.1,γ=1.05×β,β=3/t2,t是用于表征网格细胞放电野中形成网格的周期,取值为12-52之间的整数;

根据前文获得的瞬时时刻t的角度、速度信息,利用网格细胞模型可求得s的函数表达式,其中,不确定参数默认选择1,最终输出瞬时时刻t的网格细胞模块的网格尺度s,s是帮助哺乳动物在空间环境中定位的关键。

1.4在网格细胞模型中应用hebbian重塑算法增强网格细胞网格野的稳定性,更新网格尺度s,具体如下:

由于1.3中的网格细胞模型计算出的用于表征网格尺度的s在不同时刻的差值比较大,即t时刻的s(t)与t+δt时刻的s(t+δt)乃至多个间隔时间之后的网格尺度具有较大的差值,那么大鼠对于整个空间环境的认知就存在较大差异,将会导致大鼠定位不准确,最终影响最后的导航准确性和实时性,在未使用hebbian重塑算法之前,网格细胞网格野仿真图如图5所示,图5a和5b均为单次网格细胞网格野实验图,图中均标示了导航主体的运动轨迹和放电点,并用圆圈标注出了集中放电点的位置,可以体现出网格细胞六边形放电的特性。图5c是将图5a和5b叠加处理后的效果图,可以明显看出放电点叠加后已经非常混乱,已经无法显现出比较明显的六边形放电野特性,那么导航主体在空间环境中的定位将会出现较大偏差,导致导航不准确。基于此,引入hebbian重塑算法对网格细胞网格野的稳定性进行影响。

hebbian认为突触前细胞对突触后细胞的反复和持续刺激导致了突触效能的增加,即在同一个时间内被激发的神经元之间的联系会逐渐增强。而相反,如果两个神经元总是不能同步激发,那么它们间的联系将会越来越弱。在形成网格细胞网格野的过程中,速度估计和神经计算误差的累积都会导致网格细胞网格野不够稳定,从而影响认知地图的构建。对于网格细胞而言,持续或是重复的神经元之间的相互关联和激发活动会导致持久的细胞变化,从而使得其稳定性得以增加。hebbian原理就是增加一种神经元之间的权重,如果两个神经元可以同时激活,那么两个神经元之间的权重增加,而如果两个神经元不能同时激活,那么权重就减少。由此可以将hebbian重塑描述为:在利用hebbian算法重塑网格细胞放电野的过程中,表征突触权重的wi计算公式如下:

wi=ηxiy(8)

其中η用来表征学习率,取值范围是[0.0001,1),本实施例中取0.0005。xi用于表征第i个神经元的输入值,计算公式如下:

xi=φi(t)+di(t)(9)

y用来表征后突触的响应信号,通过采集电位进行获取。神经元电位分为高电位和低电位,分别表示为1和0。神经元放电则表现为高电位,神经元抑制则表现为低电位。由此计算出wi的值,对网格细胞网格野进行稳定性重构。那么网格细胞的递归连接权值公式可以改写为:

w′ij=wi(ae-e)(10)

此时,更新网格细胞模型,可以得到:

利用上述公式重新求得s′函数,并计算输出瞬时时刻t对应的修正后的表征网格细胞网格野的尺度的s′,其中,不确定参数默认选择1。直到修正后的s′的值趋于稳定,即t+δt时刻的s′(t+δt)与t时刻的s′(t)的差值小于1,具体表示为s′(t+δt)-s′(t)<1,具体方法与前文同,为借助稳定的网格细胞网格野完成自主定位打好基础。在使用hebbian重塑算法之后,网格细胞网格野仿真图如图6所示,图6a和6b均为单次网格细胞网格野实验图,图中均标示了导航主体的运动轨迹和放电点,并用圆圈手动标注出了集中放电点的位置,可以体现出网格细胞六边形放电的特性。图6c是将图6a和6b叠加处理后的效果图,可以明显看出相较于图5c,图6c可以表现出网格细胞放电野的六边形放电特性,即在此模型下,导航主体在空间环境中的定位会比较准确。

2、利用距离细胞模型得到当前位置到目标点的矢量距离

面向目标的导航需要大鼠面向目标位置进行距离的测量和计算,得出矢量距离后完成导航。距离细胞能够面对目标产生编码,能够编码目标路径上的矢量距离。一个距离细胞阵列沿着一维轴编码特定的位置,并从网格细胞接收输入,网格细胞沿着这个轴在每个位置上活动,当在每个模块中对目标位置进行编码的网格细胞启动时,它们会激活对该位置进行编码的单个距离细胞。网格细胞生成距离细胞示意图如图7所示,是由网格细胞分别从x轴和y轴两个方向通过竞争得来。距离细胞表示矢量距离示意图如图8所示,深色五角星表征当前位置,浅色五角星表征目标位置,导航主体分别整合在两个方向的距离得到矢量距离那么矢量距离表示如下:

其中输入量s'用于表征网格细胞尺度,由公式(11)计算,i取正整数,从(0,m]取值,m用于表征距离细胞的个数,由用于表征二维网格细胞神经板的长度的n决定,m=n/cosθ,其中n取正整数,取值范围是(0,+∞],本实施例中i取32。θ是当前位置时刻采集到的瞬时角度,表示当前位置时刻采集到的瞬时速度;根据公式(12)计算出得到一个1×2的矩阵其中lix表征当前位置到目标位置的矢量距离在x轴上的分量,liy表征当前位置到目标位置的矢量距离在y轴上的分量,即可获得当前点到目标点的矢量距离。

3、面向目标的导航

在进行自我定位、计算当前位置到目标位置的矢量距离后,以δt为时间间隔进行导航活动的迭代计算,每走一步之后都更新一次位置,并根据当前位置和目标位置的相对位置做下一步的决策,循环往复,直到到达目的地。具体来讲,在实施例中机器人在空间环境中不断地运动,在这个过程中,用于表征头朝向信号的和用于表征条纹信号的作为前向输入信号,那么网格细胞模型将会计算出用于表征网格细胞尺度的s,利用hebbian重构算法计算出比较稳定的用于表征网格细胞尺度的s'后,距离细胞模型将会计算当前位置到目标位置的距离矢量。那么在导航的过程中,当前位置到目标位置的距离矢量是在不断地计算和更新的。机器人根据计算出的距离矢量朝向目标移动,每隔时间δt,机器人都会向前移动一步并重新计算矢量距离,并在这个基础上再次向前移动,直到到达目的地。矢量导航结果图如图9所示,图9a-f为8次矢量导航的路线图,横纵坐标均用于标示位置坐标,方框位置为目标位置。在图中可以看出这8次导航都完成了从起始点到目标点的导航,并且导航路线越来越短。多次矢量导航步数图如图10所示,横坐标为运行次数,共100次,纵坐标为步数,通过这张图可以看出100次导航几乎每一次都完成了面向目标的导航任务,并且随着导航实验次数的增加,完成导航的步数也有减少的趋势,准确率逐渐提升。

根据以上实验说明,可以看出通过本方法的应用,可以提升导航主体对于空间环境认知的准确率,同时提升导航的准确率和速度。本方法可以实现面向目标的矢量导航。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1