处理神经网络中的数据流的方法和神经网络的制作方法

文档序号:6412922阅读:247来源:国知局
专利名称:处理神经网络中的数据流的方法和神经网络的制作方法
技术领域
本发明涉及一种对神经网络中的数据流进行处理的方法,它由以下步骤组成a)用多个输入神经元从环境接收一个参数表示,b)把一个从输入神经元输出的加权参数表示传送到一个神经元内层的输入端,c)把一个从内层输出的加权参数表示传送到多个输出神经元的输入端,同时把一个从内层输出的加权参数表示传送至多个输入神经元的输入端,d)在一个从输出神经元输出的加权参数表示对环境施加过影响后,再把它反馈给多个输入神经元的输入端。
本发明还是涉及一种神经网络,该网络有一个内传感器,它有多个输入神经元用来从环境接收参数表示,其中外传感器的输出端与一个具有多个神经元的内层相连,内层的输出又与一个具有多个输出神经元的外操纵器的输入端相连,并且输出神经元输出的对环境产生影响的参数表示又被反馈给多个输入神经元的输入端。
这样的一种方法和一种包括三种神经元的神经网络先前已在EP0529682A2,WO9524684A1中进行了描述。
这些著名的神经网络的基础是对于意识这一概念的公认的理解,具体地说,意识和与之相联系的肌肉是受人类五种不同的感觉的影响的,即味觉、嗅觉、视觉、触觉和听觉,输出则可能是一个反射,直接把输入与输出连接起来。
本发明则是基于意识的另一种概念在两种传感输入的形式间进行识别。这两种传感输入称为传入信号和自传入信号。传入信号是不能由人自己产生的信号,例如一个爆炸的声音就是一种传入信号,因为我们没做任何事情就听见了它。
自传入信号则是由人自身引起的。接触的感觉就是一种自传入信号的例子。例如人可以通过肌肉运动从手指接收一个信号。换句话说,世界是通过自传入信号探索的。
因此,意识就被认为是一种大脑、身体与环境间的交互,而且是通过运动肌的结构来认识的。由此,就产生了两种互相关联的过程,即二者都从属于同一个控制单元,即所谓的主结点。
有关上述理论的完整的叙述,请见发明人的题为《自觉与经验的统一》的论文,该论文发表于丹麦技术大学物理研究所,307楼,DK-2800 LYNGBY,但在本申请的申请之日,公众是得不到该文的。
基于上述理论,本发明的目的是提供一种方法和一种专门的神经网络,它能按照上面所说的主结点理论的原理进行工作。
本发明的目的是通过以下方式达到的,用输出神经元的对环境影响的结果的参数表示来校正来自内层神经元输出端的参数表示。这个内层神经元的输出端就是一个主结点。
这样做的结果是在处理神经网络中的数据的过程中就对人工意识进行模拟,因为它将输出神经元的参数表示与主结点间接地连接了起来。
正如在权利要求2中所说,本方法的校正是加上去的,这一点非常有利。
这为校正参数表示提供了极其合适的方法,因为它有利于对向量的处理。
正如权利要求3中所说,在经过学习后,当用本方法处理神经网络中的信号时,只有来自内层的参数表示被反馈。
其结果是,此时神经网络将按照它所模拟的意识来工作,因此将不再依靠对环境的影响。
正如前面所述,本发明还涉及一种神经网络,其特点在于由内层输出的参数表示被另一个来自输出神经元对环境影响的结果的参数表示所校正,这里的内层输出指的就是主结点。
本发明提供了一种具有内建的模拟意识的专门的神经网络。
权利要求5-7定义了本发明的一个有用的实施例。
与本发明有关的主要部分是a)对环境产生一个输出,b)神经网络的内部工作包括状态估计,和c)检测来自环境的输入。
这里网络的环境是指所有那些或远或近地包围着神经网络的东西的物理实体和属性,它们能被神经网络的任意一个或全部检测器检测到,还指神经网络的所有那些远近环境的物理实体和属性,它们能被神经网络的任何一个或全部输出所影响。
在一个用计算机意识进行的模拟中,上面提到的环境将是模拟的环境,实体和属性将是模拟的实体和属性,神经网络的检测装置将是模拟的检测装置,神经网络的输出也将是模拟的输出。这些输出包括所有能对神经网络的远近环境的物理实体和属性及计算机产生影响的物理过程。这些过程包括所有机械的、声音的、热的、电的、磁的、电磁的(包括整个电磁谱中的辐射),电化学的、化学的、生物化学的、生物学的(包括分子生物学)、光学的、核子和亚原子粒子的过程,这些过程可以单独产生作用,也可以以任意一种或所有可能的方式组合起来起作用。
前面提到的检测装置,内部处理和状态估计也包括与上面对输出的描述中所提到的过程模拟的各种过程。
另外,状态估计器就是监测器,它们可以在任意给定的时刻对神经网络或计算机的需求和目标不能实现或不能满足的程度进行估计,并且也估计神经网络的危险是否能避免的程度。这里的危险一词与前面提到的过程有相同的意义。
神经网络的目标是指所有那些提供给神经网络且与其实现功能有关的外部事物,通过对上述神经网络的设计,使之能依靠自身的行为,人的行为或任意其它计算机来完成任务。神经网络的需求是指所有那些属于神经网络内部或与其自身相联系的事物。
如前所述,神经网的人工意识的设计是基于如下几方面进行的,创建一个传出拷贝,在传出拷贝和自传入输入间建立一种合适的相互作用,并估计这种相互作用的结果。创建一个传出拷贝,在传出拷贝和自传入输入间建立一种合适的相互作用,连同对这种相互作用的结果进行估计的机制及其对神经网络的目标和需求包括避免危险的意义,就是本发明的独特方面。因此,本发明提供了一种估计机制,它主要是给出神经网络的某些可与人类的感觉和情绪相比或相等的特性。
本发明的网络可能具有许多用途,例如-普通的感知电路-游戏和录像
-基于模拟意识软(硬)件的交互式电视游戏-军事应用-教育节目-个人友谊的模拟-翻译程序-安全设备-工业控制-认知过程下面,参考附图所示的本发明的一个具体实施例来对本发明做更具体的说明,在附图中

图1是一个说明图,说明神经元是如何设计的;图2是实现本发明的神经网络的框图,图3-8表示图2中框图的不同的工作情况。
正如图1所示,神经元分为三组,即输入神经元、主节点神和输出神经元。输入神经元可能从一个设备选择信号(图1中标为传入输入),还可以从来自一个设备的响应中接受信号,该设备的信号已在神经网络中进行了处理(图1中标为自传入输入),最后还可直接接收从主结点神经元反馈回来的信号(图1中标为传出拷贝)。
本神经元网络有一种设计方案,允许所有的神经元或者从其它神经元接收信号,或者通过一个设备直接从环境接收信号,或者同时从这两种源接收信号。
下面建立一个数学模型,说明在神经元间,基本的信号传输是如何实现的。
在图1中,输入神经元的向量记为VI,连接被称为矩阵,输入神经元包括两个矩阵EOI和SMI,矩阵EOI表示自传入路径,它对应着输出神经元向量的一个对环境产生影响后的加权参数表示。相应地,矩阵SMI指明了作为来自主结点向量VM的值的结果的加权数据表示。主结点神经元的加权参数表示包括矩阵SIM,它接收向量信号VI做为输入信号,并在其输出端给与输出神经元相联系的矩阵中的加权表示SMO发出向量信号VM。
在本例中,假定有14个输入神经元,6个主结点神经元和10个输出神经元(但图中画的是15个输入神经元和5个主结点神经元)。
在本例中,矩阵SMO各元素的初始值有在区间0.0到1.0的均匀分布。这表示本系统C在主结点和输出间开发了链路。相反,SIM和SMI的所有元素都有相同的值0.5。这种初始状态对应于对环境一无所知的情况。最后,矩阵EOI代表那些不一样的元素,以便说明环境包含信息的情况。
结合附图首先要说明的本网络的功能是网络如何探索自己的环境,这是一种重要情况。主结点中已有初始活动,它已从内部活动系统接收了活动。对于一个在主结点中以向量VM表达的给定的活动模式,输出的结果活动模式将由下式给出Vo=VM*SMO(1)其中符号*表示乘主结点也对输入侧发送活动,但在这种情况下,它是到达接收单元的第二种活动,即来自环境的,以自传入输入形式出现的活动。到达主结点输入端的净活动是主结点中活动的结果,因此由下式给出VI=VM*SMI+Vo*EoI(2)最后,输入神经元将对主结点发送信号,因此到达主结点输出端的活动就由下式给出VM=VI*SIM(3)在下面描述的具体实现中,神经元已通过改变突触(synapse)连接矩阵SMI和SIM元素的尺寸对其环境进行了学习。突触效率(也称为突触权)改变的规则是任何连接两个同时处于活跃状态的神经元的突触,其效率将会增加,如果突触所连接的两个神经元中只有一个处于活跃状态,则其效率就要稍稍下降。这两种情况由以下等式来规定ΔSIM(i、j)=ε*(1-SIM)(i,j)(4)ΔSIM(i、j)=0.5*ε*(SIM(i、j)(5)在这些等式中,符号Δ表示连接第i号输入神经元和第j号主结点神经元的突触的效率的改变量。ε表示在一组给定情况下的学习的程度,在本例中给它赋的值是0.01。在等式(5)中出现的校正系数0.5是非常有必要的。因为在神经元的活动中不匹配(即+-和-+)的概率是匹配(即++)的概率的两倍。
在本例中,网络功能的初始矩阵具有如下的元素,这些元素中具有非零值的,其值是由随机数发生器决定的。
SIM输入-主结点(14个一组,6组)0.50 0.500.500.500.500.500.500.50 0.500.500.500.500.500.500.50 0.500.500.500.500.500.500.50 0.500.500.500.500.500.500.50 0.500.500.500.500.500.500.50 0.500.500.500.500.500.500.50 0.500.500.500.500.500.500.50 0.500.500.500.500.500.500.50 0.500.500.500.500.500.500.50 0.500.500.500.500.500.500.50 0.500.500.500.500.500.500.50 0.500.500.500.500.500.50SMO主结点-输出(6个一组,10组)0.300.290.540.670.680.210.460.500.320.050.350.200.260.330.320.090.980.180.670.000.370.170.490.880.180.690.970.110.760.960.600.130.670.870.060.940.350.460.350.580.590.710.190.860.310.610.240.180.030.080.550.770.640.570.800.810.430.100.960.48SMI主结点-输入(6个一组,14组)0.500.500.500.500.500.500.500.500.500.500.500.500.500.500.500.500.500.500.500.500.500.500.500.500.500.500.500.500.500.500.500.500.500.500.500.500.500.500.500.500.500.500.500.500.500.500.500.500.500.500.500.500.500.50
SMI主结点-输入(6个一组,14组)0.500.500.500.500.500.500.500.500.500.500.500.500.500.500.500.500.500.500.500.500.500.500.500.500.500.500.500.500.500.50EOI输出-输出(10个一组,14组)0.160.120.870.650.550.960.960.690.880.020.370.200.020.990.870.820.050.330.230.120.290.450.570.230.010.710.480.410.050.020.690.940.900.770.400.280.190.210.260.950.900.660.980.520.470.070.980.730.410.190.910.050.120.610.180.510.180.530.670.740.650.080.980.680.280.270.700.260.130.710.660.310.380.890.960.890.150.890.650.470.120.361.000.050.040.030.950.820.470.790.270.410.630.770.790.890.840.240.290.410.410.2 5 0.790.480.680.470.470.530.700.700.430.920.330.140.610.450.620.960.950.640.650.900.640.580.480.360.510.340.630.120.170.630.690.000.210.830.720.980.920.13
为了使神经网络能学习其环境,在主结点中,每种可能的活动的组合都要依次生成。对于六个神经元中在任何时刻只有一半(即三个)活动的情况,就会有20种不同的组合111000,110100,110010,等等,直到000111。这些主结点中的活动模式按照等式(1)生成输出单元的活动模式。但是,由于在10个神经元一组的情形中,可能的活动模式比在6个神经元一组的情形中的活动模式要多得多,所以很清楚不能用上述的主结点活动来生成所有可能的输出模式。
如前面所讨论的,输入单元中生成的活动模式是来自传出拷贝路径的直接活动和来自自传入路径的间接活动共同作同的结果(请见等式(2))。另外,由于有14个输入神经元,所以可能的输入模式的数量要比主结点单元输出的模式数多。所以不会见到所有可能的模式。下面将列出主结点所有可能的活动,以及其它单元中的结果活动模式。每个三行组都代表序列VM、VO和VI。可以看出,在VI的各模式中很少有重复,正如所预料的那样,然而如果在每个单元中有大量的神经元,则这样的冗余就会很快减少。通常,这种模拟单元能很好地辨别环境的不同特征。
111000 1011000100110101 100001101101010001011101 10000101011101110100 1010101000011101 101110000110001101100101 00011111011000110010 1010010110101001 000111100100011010111100 11010011011000110001 0111000001111001 100011011011010011011000 11000101001101
011010 0101011010100101 000011111000011011101100 10001001011101011001 0100110000111101 00111010011000000111110110011011011000100110 0011101000011011 100011101010000101011101 10001001011101100101001101000101101100011110101000010101110111000001011101100011001011000111100100011100111101001101100011000101011100010110000111100010110110001110100000101111110010001001011101
现在,按照上述等式(4)和(5),全部网络都能够进行学习了,SIM和SMI中元素的变化结果示于下表中SIM输入-主结点(14个一组,6组)0.510.480.480.500.490.500.490.480.530.480.520.520.510.470.520.490.480.500.470.510.490.500.520.490.520.500.510.480.510.500.480.510.500.490.510.510.490.500.500.520.500.470.510.500.480.460.480.490.480.510.500.490.520.490.490.500.510.470.480.480.510.510.500.500.510.500.510.500.490.490.500.480.480.490.4 8 0.490.510.510.500.490.510.500.490.49SMI主结点-输入(6个一组,14组)0.510.520.510.510.510.500.480.490.500.500.470.480.480.480.480.480.480.480.500.500.510.460.480.490.490.470.500.480.510.480.500.510.490.490.510.490.490.490.510.480.500.510.480.500.510.510.500.510.530.520.490.500.510.500.480.490.500.490.500.490.520.520.500.520.510.510.520.500.520.490.500.500.510.510.500.490.490.490.470.480.470.500.490.49
其它矩阵自然保持不变。为了说明经训练的网络是如何对外传入作出响应的,我们采取以下步骤。外传入是指那些到达输入神经元却不是由神经网络自身对环境的探测而产生的信号。对于一个给定的主结点活动模式,到达14个输入经元中每一个的净自传入信号都被计算和存储。
为了便于说明,主结点的活动模式采用前面所讨论的20种模式中的第一种,即111000。
本主结点模式所引起的14种输入信号如下2.34 2.35 1.61 2.78 2.13 2.00 1.59 3.51 2.05 2.742.64 3.59 2.20 2.77。
现在,假如将这14个信号用作外传入输入,即假设输入前主结点没有任何活动,则在主结点中生成的活动(用上述等式(3))将计算出是111000。
这说明,单纯由传入输入信号使主结点中产生的活动将与能产生和上述传入信号相同的自传入信号的主结点的活动完全一样。换句话说,经训练的网络将通过与其自己的输出相关的内部模拟活动来作出响应。
最后,关于本模拟网络的功能还有几点要讨论。首先应当注意,在学习的过程中,从主结点传到输入单元的传出拷贝信号对14个输入神经元的影响是均匀的,因为SMI中的元素是相等的。如果此后再发生另外的学习,则这种均匀性不再严格保持了。但必须记住,这里为了说明问题所使用的网络是很小的,活动水平也非常高(即在任何给定的模式中,全部神经元的一半都是活动的)。在实际中,网络将会是很大的,而在任何给定的模式中,活动神经元所占的比例将会是相当小的,所以传出信号将能保持近似的均匀。
第二、在本简单说明中,突触矩阵SMI和SIM是对称的,这是因为输入和主结点单元是简单的(向量的)神经元集合。相反,如果二者中有一个或都是复合的,即由许多不同性质和独立的神经元的集合构成的,这种互逆的对称性就不再存在了。
图2给出了一个可能用于实现本发明的框图。正如将会看到的,该电路包括一个主结点,它与一个外传感器2,一个内活动器3,一个外操作器5,一个选择器和活动器4相连,并通过连接器和活动器4与一个内状态传感器6相连,内状态传感器另外与内活动器3相连。
本电路的工作方式示于图3-8,其中图3表示神经网络中一个内传感器如何对一个由内部激发的对环境的探测作出响应。在本实施例中,内部状态传感器检测到本设备已开发了目标和需求,它们能启动一系列致外操纵器的活动的事件。这使得本电路能探测其环境,并且传出拷贝信号和自传入信号间的相互作用产生了意识。本电路的为实现其目标,满足其需求,躲避危险而进行的外部探测的结果被反馈给内部传感器单元。这些事件的记忆同时也被存储在与外传感器和内状态传感器单元间的连接相联系的突触中。这些是用来对未来的输入信号的可能结果进行预测的。
图4表示一种对输入产生内部激发的知觉的操作模式。在本操作模式中,当输入发生时,内部状态传感器已经激活了系统,这使得系统能感觉到有输入到来并有选择地分配给它注意力,但还没有作出公开的响应。
图5表示输入产生内部激发的响应的操作。本模式与图4中所示的模式相似,但在这里受激发的程度足以产生一个实际的响应。
图6表示一种能产生被动的反射响应的电路操作模式。在缺少内部激发的情况下,一个输入信号的到达可能会产生一个反射响应,即使输入的本意并非如此。
图7表示一种产生内部激发的内部模拟响应(思维)的操作模式。本模式基本上与图6中的模式是相反的。内部状态传感器使主结点产生对一系列特定事件的后果的内部模拟,这是通过使主结点建立循环信号来实现的。这些循环信号在由传出拷贝和传入路径构成的环路上流过。本模式也在来自所存储的结果信号的路径中形成活动,并导致对上述路径中涉及的突触的接触的调整。因此,本系统不用对活动及其结果做任何事情就能对活动进行模拟。并估计其结果。这就是思维。(很可能这种特定的功能模式与人类的做梦有某些共同之处)。
最后,图8表示一种对外来的唤醒本系统的信号作出反应的操作模式。在这个例子中,机器在开始时并不激活。但输入的期望结果可以使系统开始活动,电路便开始执行与图5所示相似的功能,所有的反馈路径都被激活,并且注意力被有选择地分配给输入。
权利要求
1.一种对神经网络中的数据流进行处理方法,包括以下步骤a)用多个输入神经元从环境中接收一个参数表示;b)把一个从输入神经元输出的加权参数表示传送到一个内层神经元的输入端;c)把一个从内层输出的加权参数表示传送到多个输出神经元的输入端,同时把一个从内层输出的参数表示传送到多个输入神经元的输入端;d)在一个从输出神经元输出的加权参数表示对环境施加过影响过,再把它反馈给多个输入神经元的输入端,其特点在于e)用由输出神经元的对环境影响的结果产生的参数表示来校正从内层神经元输出的参数表示,这个内层神经元就是一个主结点。
2.根据权利要求1的方法,其特点在于校正的执行是附加的。
3.根据权利要求1或2的方法,其特点在于经过学习后,在处理神经网络信号的过程中,只有来自内层的参数表示被反馈。
4.一种神经网络,它有一个外传感器,该传感器有多个输入神经元用来从环境接收参数表示,网络中外传感器的输出端与一个具有多个神经元的内层相连,该内层的输出又与一个具有多个输出神经元的外操纵器的输入相连,并且输出神经元对环境产生影响的参数表示又被反馈给多个输入神经元的输入端,其特点在于来自内层输出的参数表示被由输出神经元的对环境影响的结果产生的参数表示来校正,这个内层就是一个主结点。
5.根据权利要求4的神经网络,其特点在于校正是加的。
6.根据权利要求4或5的神经网络,其特点在于主结点另有一个输入端,接收来自一个内活动器的输出信号,该活动器的输入与一个传感器单元的输出端相连,该传感器单元接收,代表相对于神经网络的最佳状态的偏移量的信号和外传感器输出的信号。
7.根据权利要求4-6的神经网络,其特点在于内活动器有一个输出端和一个选择和活动器的输入端相连,该选择和活动器的输出端和主结点相连。
全文摘要
本发明的神经网络有一个用来从环境接收参数表示的外传感器(2)。参数表示经加权后输出到一个主结点(1)的输入端,该主结点把上述参数表示另外再加权后送到一个外操纵器(5)的输入端。外操纵器的输出在对环境施加过影响后,又被反馈到外传感器的输入端。另外,参数表示又被直接从主结点的传感器反馈回来,构成了参数表示的反馈和。由此就导致神经网络的快速而又非常复杂的学习,经过学习后,神经网络可以不利用被环境影响了的反馈信号就能执行任务,所以本发明提供了一种能模拟人类意识的神经网络。
文档编号G06N3/00GK1212772SQ9719264
公开日1999年3月31日 申请日期1997年2月3日 优先权日1996年2月2日
发明者罗德尼·迈克尔·约翰·科特里尔 申请人:罗德尼·迈克尔·约翰·科特里尔
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1