神经网络及编程方法_4

文档序号:9401974阅读:来源:国知局
τ+和τ控制如图5(a)所示的曲线 的增强部分和抑制部分的衰减速度。
[0121 ] 在一种方法中,在增强或抑制的时间窗内可出现不止一个前突触尖峰脉冲或后突 触尖峰脉冲。可使用加法STDP模型来执行对上述多个尖峰脉冲的计算,在所述加法STDP 模型中,在突触处的增强P和抑制D的动力学可由下式确定:
[0124] 每当后突触神经元激发出尖峰脉冲时,使得D相对于等式(6)所确定的值减少,其 减少量为Α-。类似地,每当突触从前突触神经元接收尖峰脉冲时,使得P相对于等式(7)所 确定的值增加,其增量为Α+。这些变化可总结为:
[0127] P和D的上述变化可影响突触电导的变化。如果后突触神经元激发出尖峰脉冲,则 在该尖峰脉冲的持续时间内利用P在这一时刻的值Ρ*使得突触电导增加 Aw。类似地,如 果前突触神经元激发出所述突触所见的尖峰脉冲,则在该尖峰脉冲的持续时间内利用D在 这一时刻的值D*使得突触电导减少AW。因此,净变化Aw可由下式给出:
[0128] Aw = P*-D* (8)
[0129] 由于STDP最终反应至突触电导w的改变可表示为:
[0130] w = w+ Δ w (9)
[0131] 在图8所示的一个实施例中,尖峰脉冲模型可被配置为从固定的一组输入尖峰脉 冲序列中学习多种变换。如图6所示,一些预测层神经元624可耦接至或连接至其自身的 训练输出614。预测层可表示输出的一组神经元622,其对机器人手臂的位置进行预测。在 一个实施例中,图6中的模型可按照与图1所述的模型类似的方式运作。
[0132] 在另一实施例中,下文所述的系统600可同步地学习输入尖峰脉冲序列的多种输 出或变换。在一个示例中,所述尖峰脉冲模型使用相同的输入角(Θ1,Θ 2)来利用下文中 的等式10和等式11产生多种输出。
[0133] 申请人已经示出的是,图8所示的模型可被配置为学习一些类型的功能,包括遗 传早现(anticipation)、联络(association)、预测及反变换。在一个实施例中,所述系统 可被配置为对用于输入-输出变换的多种可能的路径进行使用。如下文所讨论的那样,所 述模型也可容错。
[0134] 图9示出了在学习期间神经网络模型100的各层之间的突触电导,其展示出图8 的神经网络模型中各电导的拓扑结构的涌现。
[0135] 图IOA示出了在神经网络100的训练周期已经完成之后的给定时间t的层L/的 输出,其响应于层L101和L102的输入。在y轴、Θ 1轴和Θ2轴上的圆圈的直径随形成各轴 的各神经元的激发率增加。仅示出了激发的各神经元。
[0136] 根据本公开的一个实施例,对图7所示的神经网络80的输出进行解码包括以下步 骤:
[0137] a.向第一神经网络40和第二神经网络58各自的第一阵列12提供第一输入信号 和第二输入信号,该第一输入信号和该第二输入信号具有在测量到的参数更接近指定给所 述第一阵列的神经元的预定值时增加的速率;
[0138] b.向神经元84的输出阵列的每个神经元指定在1至N的范围内的增量位置值,N 为输出阵列84的神经兀的数量;
[0139] c.在任何给定的时间对输出阵列84的每个神经元的激发率进行测量;以及
[0140] d.将所述任何给定时间的神经网络的输出估计为对应于输出阵列84的一个神经 元,该神经元的位置值等于:所述输出阵列的每个神经元的由其在所述任何给定时间的激 发率进行加权的位置值之和除以所述输出阵列的每个神经元在所述任何给定时间的激发 率的和得到的商。
[0141] 在其他方面,
[0143] 其中yp(i,j,t)为在给定的时间t的关于Θ 1和Θ 2的给定值i、j的经评估的输 出位置;fi_jk(t)为神经元k在给定时间t的关于Θ 1和Θ 2的给定值i、j的激发率;以及 y (i, j, k, t)为神经元k在时间t的关于Θ 1和Θ 2的给定值i、j的位置值。
[0144] 图IOB示出了在神经网络100的训练周期已经完成后的给定时间t的层L/的输 出,其响应于层L101和L i02的输入,其中y轴上的输出环绕输出阵列的末端。根据本公开的 一个实施例,对阵列84的输出进行测量的方法包括:如果输出阵列84中部的神经元具有无 效激发率,则向具有更小的位置值的神经元指定增加了值N的位置值,N为输出阵列84的 神经元的数量。根据本公开的一个实施例,参照图IOA和图IOB描述的方法还可用于对图 14的例如层84的输出进行解码,在下文对其进行描述。
[0145] 图IlA至图IlC示出了图8的神经网络模型的渐进收敛(incremental convergence)作为一种学习函数。具体地,图IlA示出了在300秒的训练周期之后图8的 神经网络模型的X和y输出;图IlB示出了在600秒的训练周期之后图8的神经网络模型 的X和y输出;图IIC示出了在1500秒的训练周期之后图8的神经网络模型的X和y输出。 图IlA至图IlC中使用的各输入所对应的X和y的真实值遵循阴影所示的扭结(pretzel) 形轨迹。
[0146] 图12A和图12B示出了在中间阵列42的神经元44与网络阵列62之间使用 Gaussian稀疏连接时图8的神经网络模型的渐进收敛。
[0147] 图12C和图12D示出了在中间阵列42的神经元44与网络阵列62之间使用随机 稀疏连接时图8的神经网络模型的渐进收敛。
[0148] 图13A至图13D示出了神经元的损坏程度发生变化时图8的神经网络模型的性 能。图13A(a)示出了神经网络中5%的神经元损坏时L101和L2 01之间的各突触的神经行 为或皮质编码。图13A(b)示出了神经网络中5%的神经元损坏时L201内各突触的神经行 为或皮质编码。图13A(c)示出了神经网络中5%的神经元损坏时的输出X、y,其与用于产 生输出的输入所对应的X、y的真实值(较暗的圆圈)进行比较。
[0149] 图13B(a) (b) (c)示出了神经网络中8%的神经元损坏时与图13A(a) (b) (c)所示 数据种类相同的数据。
[0150] 图13C(a) (b) (c)示出了神经网络中12%的神经元损坏时与图13A(a) (b) (c)所示 数据种类相同的数据。
[0151] 图13D(a) (b) (c)示出了神经网络中16%的神经元损坏时与图13A(a) (b) (c)所示 数据种类相同的数据。
[0152] 如图13A至图13D所示,根据本公开的实施例的神经网络对神经元损坏具有鲁棒 性,并且即使在神经元受到明显损坏的情况下也能产生符合要求的输出。
[0153] 图14示出了根据本公开的一个实施例的神经网络或神经网络模型118的一部分, 其包括与神经元44和中间神经元48的中间阵列42耦接的神经元14的输入阵列12。根 据本公开的一个实施例,输入阵列/层12包括神经元14的第一子阵列120和第二子阵列 122。第一子阵列120的神经元14被设置为接收与第一测量参数有关的输入信号。第二子 阵列122的神经元14被设置为接收与第二测量参数有关的输入信号。根据本公开的一个 实施例,中间阵列42包括多行多列的神经元44 ;中间神经元48分布在各神经元之间,其中 神经元第一子阵列120的每个神经元14的轴突与中间阵列42的一行的多个神经元44的 树突一起形成兴奋的STDP突触;并且其中神经元第二子阵列122的每个神经元14的轴突 与中间阵列42的一列的多个神经元44的树突一起形成兴奋的STDP突触。
[0154] 根据本公开的一个实施例,可根据不包括多行多列的另一方案来布置中间阵列42 的神经元44 ;或者可根据一个方案(例如稀疏且随机的连接方案)将第一子阵列102和第 二子阵列122的神经元连接至中间阵列42的神经元,而不遵从中间阵列42的多行多列。根 据本公开的一个实施例,中间阵列42的神经元44的一个树突可与所述输入阵列的100-200 个神经元14的轴突一起形成STDP突触。根据本公开的一个实施例,子阵列120和122中 的每一个可包括1000个神经元,并且中间阵列可包括2000个神经元。
[0155] 根据本公开的一个实施例,输入阵列12可包括N个神经元子阵列(诸如120和 122),其分别设置为接收与N个关联的测量到的参数有关的输入信号。根据本公开的一个 实施例,每个子阵列的每个神经元14被设置为接收这样的输入信号,该输入信号用于表示 与所述子阵列关联的所述测量到的参数更接近指定给所述神经元的预定值。例如,当测量 到的参数更接近指定给一个神经元的预定值时,可增大发送至所述神经元的信号的速率, 如此往复。各子阵列的神经元的数量可以相同或者不同。
[0156] 根据本公开的一个实施例,所述神经元为合成和激发的神经元,或在合成和激发 的神经元的模型下进行操作,并且所述神经网络或神经网络模型是尖峰脉冲的神经网络或 尖峰脉冲的神经网络模型。
[0157] 根据本公开的一个实施例,神经网络118包括输出阵列84,其具有神经元86以及 在神经元86之间分布的中间神经元88。根据本公开的一个实施例,输出阵列84可包括面 向四个神经元86的一个中间神经元88。根据本公开的一个实施例,所述输出阵列的每个神 经元86的轴突与相邻的中间神经元88的树突一起形成兴奋的STDP突触90 ;并且所述输出 阵列的每个中间神经元88的轴突与所述输出阵列的相邻的神经元86和中间神经元88 - 起形成抑制的STDP突触92。
[0158] 根据本公开的一个实施例,输出阵列84的每个神经元86的树突与中间阵列42的 每个神经元44的轴突一起形成兴奋的STDP突触。
[0159] 根据本公开的一个实施例,神经网络118包括训练阵列124,其包括与输出阵列84 的神经元的数量相同数量的神经元126。
[0160] 根据本公开的一个实施例,每个神经元126的树突被设置为接收这样的输入信 号,该输入信号用于表示测量到的参数更接近指定给所述神经元的预定值。根据本公开的 一个实施例,训练阵列124的每个神经元126的轴突与输出阵列84的对应神经元的树突一 起形成兴奋的非STDP突触。
[0161] 根据本公开的一个实施例,第一子阵列120和第二子阵列122的输入信号与可变 参数有关,通过所述神经网络将所述可变参数与和训练阵列124的输入信号有关的参数相 关。根据本公开的一个实施例,所述参数信号发送至第一子阵列120和第二子阵列122并 且在训练周期期间发送至训练阵列124。例如,发送至第一子阵列120和第二子阵列122的 信号例如可对应于针对诸如图8所示的两级自由度的机器人手臂以及所述手臂的随机位 置而测量的两个角度,而发送至训练阵列124的信号可例如对应于如针对每个所述随机位 置而测量的所述机器人手臂的末端位置的X或y坐标。
[0162] 在训练周期之后,输入信号不再发送至训练阵列124,并且在输出阵列的神经元 86的轴突处的各信号将神经网络118的输出提供至向输入阵列120和122提供的输入信 号。
[0163] 图15示出了图14的神经网络或神经网络模型118的所述部分,其包括附加输出 层128和130,它们按照与输出层84相同的方式连接至中间层42。根据本公开的一个实施 例,输出层84、128和130可包括相同数量的神经元或不同数量的神经元。根据本公开的一 个实施例,附加输出层128和130连接至训练层132和134,其连接方式与输出层84连接至 训练层124的方式相同。根据本公开的一个实施例,神经网络118可包括任意数量的附加 输出层,每个输出层连接至如上所述的训练层。每个输出层的训练周期可具有相同的长度 并且可以同步,或者各训练周期可具有不同长度以及/或者在不同时刻发生。
[0164] 图16示出了神经网络或神经网络模型150的一部分,其包括图15的神经网络部 分118。根据本公开的一个实施例,网络150包括与神经网络部分118类似的附加神经网 络部分152、154和156,其中神经网络部分118的训练阵列134、124和132也来自各神经 网络部分152、154和156的输入层或输入子阵列。根据本公开的一个实施例,神经网络部 分152的训练阵列158形成了神经网络部分154的输入子阵列。神经网络部分118、152、 154和156可具有相同的大小或不同的大小。网络150可包括任意数量的诸如神经网络部 分118的神经网络部分。
[0165] 在本公开的各实施例中,可利用共享的处理装置、独立的处理装置或多个处理装 置来实现所述神经网络。此种处理装置可以是微处理器、微控制器、数字信号处理器、微计 算机、中央处理单元、现场可编程门阵列、可编程逻辑器件、状态机、逻辑电路、模拟电路、数 字电路和/或基于可执行指令对信号(模拟信号和/或数字信号)进行操作的任何装置。
[0166] 可利用硬件、软件或其结合来实现本公开或者其任意一个(多个)部分或一个 (多个)功能,并且可将其实现在一个或多个计算机系统或者其他处理系统中。用于执行本 公开的操作并且能够执行本文所述的功能的计算机系统可包括:连接至通信基础设施(例 如,通信总线、交叉接线器(cross-over bar)或网络)的一个或多个处理器。依照这样的 示例性计算机系统对多种不同的软件实施例进行描述。在阅读所述描述后,对于本领域技 术人员而言,如何利用其它计算机系统和/或结构实现本公开将是显而易见的。
[0167] 已经以示意和描述为目的示出了本公开的优选实施例的上述描述。上述描述并非 旨在穷尽或者将本公开限制为精确的形式或所公开的示例性实施例。显然,许多修改和变 化对本领域技术人员而言将是显而易见的。类似地,所描述的任何过程步骤可与其目的在 于实现相同结果的其他步骤进行互换。选择这些实施例并对其进行描述是为了最优地解释 本公开的原理及其实际应用的最佳模式,进而能够使本领域其他技术人员理解本公开的多 种不同的实施例以及对这些实施例所作出的适于预期的特定用途或实现的多种不同的修 改。本公开的范围旨在由所附权利要求及其等价进行限定。除非明确地这样陈述,否则元 件的单数表述并非旨在意指"一个且仅有一个",而是与其相反地意指"一个或多个"。此外, 本公开中的任何元件、部件或方法步骤均非旨在向公众公开,无论所述元件、部件或方法步 骤是否在所附权利要求中明确叙述。本文权利要求中的所有元件均不基于美国法典35卷 112节第六段进行理解,除非明确地使用短语"用于……的装置"来叙述所述元件。
[0168] 应当理解的是,使本公开的功能和优点更加突出的所示附图仅为示例目的而呈 现。本公开的结构足够灵活和可配置,使得所述结构可按照除附图所示方式之外的方式实 现(和操作)。
[0169] 此外,说明书摘要的目的为,通常使得美国专利与商标局和公众(尤其是不熟悉 专利或法律的术语或措辞的本领域的学者、工程师和从业人员)能够通过粗略浏览而快速 确定本申请的技术公开的本质与精髓。说明书摘要并非旨在以任何方式限制本公开的范 围。应当理解的是,权利要求书中叙述的步骤和处理无需按照示出的顺序执行。
[0170] 在不脱离本公开的情况下,可在不同的系统中实现本公开的各种特征。应当理解, 上述实施例仅为示例,并且不应被理解为限制本公开。各实施例的描述仅
当前第4页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1