用于修改神经动态的自动化方法_2

文档序号:9872469阅读:来源:国知局
任何组合来仿真。神经系统100可用在大范围的应用中, 诸如图像和模式识别、机器学习、电机控制、及类似应用等。神经系统100中的每一神经元可 被实现为神经元电路。被充电至发起输出尖峰的阈值的神经元膜可被实现为例如对流经其 的电流进行积分的电容器。
[0040] 在一方面,电容器作为神经元电路的电流积分器件可被除去,并且可使用较小的 忆阻器元件来替代它。这种办法可应用于神经元电路中,以及其中大容量电容器被用作电 流积分器的各种其他应用中。另外,每个突触104可基于忆阻器元件来实现,其中突触权重 变化可与忆阻器电阻的变化有关。使用纳米特征尺寸的忆阻器,可显著地减小神经元电路 和突触的面积,这可使得实现大规模神经系统硬件实现更为切实可行。
[0041] 对神经系统100进行仿真的神经处理器的功能性可取决于突触连接的权重,这些 权重可控制神经元之间的连接的强度。突触权重可存储在非易失性存储器中以在掉电之后 保留该处理器的功能性。在一方面,突触权重存储器可实现在与主神经处理器芯片分开的 外部芯片上。突触权重存储器可与神经处理器芯片分开地封装成可更换的存储卡。这可向 神经处理器提供多种多样的功能性,其中特定功能性可基于当前附连至神经处理器的存储 卡中所存储的突触权重。
[0042] 图2解说了根据本公开的某些方面的计算网络(例如,神经系统或神经网络)的处 理单元(例如,神经元或神经元电路)200的示例性示图202。例如,神经元202可对应于来自 图1的级102和106的任何神经元。神经元202可接收多个输入信号这些输 入信号可以是该神经系统外部的信号、或是由同一神经系统的其他神经元所生成的信号、 或这两者。输入信号可以是实数值或复数值的电流或电压。输入信号可包括具有定点或浮 点表示的数值。可通过突触连接将这些输入信号递送到神经元202,突触连接根据可调节突 触权重Soe 1IoeN(W1-WN)对这些信号进行按比例缩放,其中N可以是神经元202的输入连接总 数。
[0043] 神经元202可组合这些经按比例缩放的输入信号,并且使用组合的经按比例缩放 的输入来生成输出信号208(即,信号Y)。输出信号208可以是实数值或复数值的电流或电 压。输出信号可以是具有定点或浮点表示的数值。随后该输出信号208可作为输入信号传递 至同一神经系统的其他神经元、或作为输入信号传递至同一神经元202、或作为该神经系统 的输出来传递。
[0044] 处理单元(神经元)202可由电路来仿真,并且其输入和输出连接可由具有突触电 路的电连接来仿真。处理单元202及其输入和输出连接也可由软件代码来仿真。处理单元 202还可由电路来仿真,而其输入和输出连接可由软件代码来仿真。在一方面,计算网络中 的处理单元202可以是模拟电路。在另一方面,处理单元202可以是数字电路。在又一方面, 处理单元202可以是具有模拟和数字组件两者的混合信号电路。计算网络可包括任何前述 形式的处理单元。使用这样的处理单元的计算网络(神经系统或神经网络)可用在大范围的 应用中,诸如图像和模式识别、机器学习、电机控制、及类似应用等。
[0045] 在神经网络的训练过程期间,突触权重(例如,来自图1的权重 和/或来自图2的权重206^206〃)可用随机值来初始化并根据学习规则而被增大或减小。本 领域技术人员将领会,学习规则的示例包括但不限于尖峰定时依赖可塑性(STDP)学习规 贝丨J、Hebb规则、Oja规则、Bienenstock-Copper-Munro (BCM)规则等。在某些方面,这些权重可 稳定或收敛至两个值(即,权重的双峰分布)之一。该效应可被用于减少每个突触权重的位 数、提高从/向存储突触权重的存储器读取和写入的速度、以及降低突触存储器的功率和/ 或处理器消耗。
[0046]突触类型
[0047]在神经网络的硬件和软件模型中,突触相关功能的处理可基于突触类型。突触类 型可包括非可塑突触(对权重和延迟没有改变)、可塑突触(权重可改变)、结构化延迟可塑 突触(权重和延迟可改变)、全可塑突触(权重、延迟和连通性可改变)、以及基于此的变型 (例如,延迟可改变,但在权重或连通性方面没有改变)。多种类型的优点在于处理可以被细 分。例如,非可塑突触可不执行可塑性功能(或等待此类功能完成)。类似地,延迟和权重可 塑性可被细分成可一起或分开地、顺序地或并行地运作的操作。不同类型的突触对于适用 的每一种不同的可塑性类型可具有不同的查找表或公式以及参数。因此,这些方法将针对 该突触的类型来访问相关的表、公式或参数。对变化的突触类型的使用会向人工神经网络 添加灵活性和可配置性。
[0048] 还存在尖峰定时依赖结构化可塑性独立于突触可塑性而执行的暗示。结构化可塑 性即使在权重幅值没有改变的情况下(例如,如果权重已达最小或最大值、或者其由于某种 其他原因而不改变)也可执行,因为结构化可塑性(即,延迟改变的量)可以是前-后尖峰时 间差的直接函数。替换地,结构化可塑性可被设为权重变化量的函数或者可基于与权重或 权重变化的界限有关的条件来设置。例如,突触延迟可仅在权重变化发生时或者在权重到 达〇的情况下才改变,但在这些权重为最大值时则不改变。然而,具有独立函数以使得这些 过程能被并行化从而减少存储器访问的次数和交叠可能是有利的。
[0049] 突触可塑性的确定
[0050] 神经元可塑性(或简称"可塑性")是大脑中的神经元和神经网络响应于新的信息、 感官刺激、发展、损坏、或机能障碍而改变其突触连接和行为的能力。可塑性对于生物学中 的学习和记忆、以及对于计算神经元科学和神经网络是重要的。已经研究了各种形式的可 塑性,诸如突触可塑性(例如,根据Hebb ian理论)、尖峰定时依赖可塑性(STDP )、非突触可塑 性、活跃性依赖可塑性、结构化可塑性和自稳态可塑性。
[0051] STDP是调节神经元之间的突触连接的强度的学习过程。连接强度是基于特定神经 元的输出与收到输入尖峰(即,动作电位)的相对定时来调节的。在STDP过程下,如果至某个 神经元的输入尖峰平均而言倾向于紧挨在该神经元的输出尖峰之前发生,则可发生长期增 强(LTP)。于是使得该特定输入在一定程度上更强。另一方面,如果输入尖峰平均而言倾向 于紧接在输出尖峰之后发生,则可发生长期抑压(LTD)。于是使得该特定输入在一定程度上 更弱,并由此得名"尖峰定时依赖可塑性"。因此,使得可能是突触后神经元兴奋原因的输入 甚至更有可能在将来作出贡献,而使得不是突触后尖峰的原因的输入较不可能在将来作出 贡献。该过程继续,直至初始连接集合的子集保留,而所有其他连接的影响减小至无关紧要 的水平。
[0052] 由于神经元一般在其许多输入都在一短时段内发生(即,输入被累积到足以引起 输出)时产生输出尖峰,因此通常保留下来的输入子集包括倾向于在时间上相关的那些输 入。另外,由于在输出尖峰之前发生的输入被加强,因此提供对相关性的最早充分累积性指 示的那些输入将最终变成至该神经元的最后输入。
[0053] STDP学习规则可因变于突触前神经元的尖峰时间tpre与突触后神经元的尖峰时间 tpcist之间的时间差(即,t = tpcist-tpre)来有效地适配将该突触前神经元连接到该突触后神经 元的突触的突触权重。STDP的典型公式是若该时间差为正(突触前神经元在突触后神经元 之前激发)则增大突触权重(即,增强该突触),以及若该时间差为负(突触后神经元在突触 前神经元之前激发)则减小突触权重(即,抑压该突触)。
[0054]在STDP过程中,突触权重随时间推移的改变可通常使用指数式衰退来达成,如由 下式给出的:
[0056]其中k+和分别是针对正和负时间差的时间常数,a+和a-是对应的比例 缩放幅值,以及μ是可应用于正时间差和/或负时间差的偏移。
[0057]图3解说了根据STDP,突触权重因变于突触前(pre)和突触后(post)尖峰的相对定 时而改变的示例性曲线图300。如果突触前神经元在突触后神经元之前激发,则可使对应的 突触权重增大,如曲线图300的部分302中所解说的。该权重增大可被称为该突触的LTP。从 曲线图部分302可观察到,LTP的量可因变于突触前和突触后尖峰时间之差而大致呈指数地 下降。相反的激发次序可减小突触权重,如曲线图300的部分304中所解说的,从而导致该突 触的LTD。
[0058]如图3中的曲线图300中所解说的,可向STDP曲线图的LTP(因果性)部分302应用负 偏移lx轴的交越点306(y = 0)可被配置成与最大时间滞后重合以考虑到来自层i-Ι的各因 果性输入的相关性。在基于帧的输入(即,按尖峰或脉冲的特定历时的帧的形式的输入)的 情形中,可计算偏移值μ以反映帧边界。该帧中的第一输入尖峰(脉冲)可被视为随时间衰 退,要么如直接由突触后电位所建模地、要么以对神经状态的影响的形式而随时间衰退。如 果该帧中的第二输入尖峰(脉冲)被视为与特定时间帧相关或有关,则该帧之前和之后的有 关时间可通过使STDP曲线的一个或多个部分偏移以使得这些有关时间中的值可以不同(例 如,对于大于一个帧为负,而对于小于一个帧为正)来在该时间帧边界处被分开并在可塑性 意义上被不同地对待。例如,负偏移μ可被设为偏移LTP以使得曲线实际上在大于帧时间的 pre-post时间处变得低于零并且它由此为LTD而非LTP的一部分。
[0059]神经元模型及操作
[0060]存在一些用于设计有用的尖峰发放神经元模型的一般原理。良好的神经元模型在 以下两个计算态相(regime)方面可具有丰富的潜在行为:重合性检测和功能性计算。此外, 良好的神经元模型应当具有允许时间编码的两个要素。例如,输入的抵达时间影响输出时 间并且一致性检测能具有窄时间窗。另外,为了在计算上是有吸引力的,良好的神经元模型 在连续时间上可具有闭合形式解,并且具有稳定的行为,包括在靠近吸引子和鞍点之处。换 言之,有用的神经元模型是可实践且可被用于建模丰富的、现实的且生物学一致的行为并 且可被用于对神经电路进行工程设计和反向工程两者的神经元模型。
[0061] 神经元模型可取决于事件,诸如输入抵达、输出尖峰或其他事件,无论这些事件是 内部的还是外部的。为了达成丰富的行为库,能展现复杂行为的状态机可能是期望的。如果 事件本身的发生在撇开输入贡献(若有)的情况下能影响状态机并约束该事件之后的动态, 则该系统的将来状态并非仅是状态和输入的函数,而是状态、事件和输入的函数。
[0062] 在一方面,神经元η可被建模为尖峰带漏泄积分激发神经元,其膜电压vn(t)由以 下动态来支配:
[0064]其中α和β是参数,Wm,n是将突触前神经元m连接至突触后神经元 n的突触的突触权 重,以及ym(t)是神经元m的尖峰输出,其可根据Δ蚁"被延迟达树突或轴突延迟直至抵达神 经元η的胞体。
[0065
当前第2页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1