光电计算单元、光电计算阵列及光电计算方法与流程

文档序号:20916152发布日期:2020-05-29 13:33阅读:621来源:国知局
光电计算单元、光电计算阵列及光电计算方法与流程
本发明涉及一种光电计算单元、光电计算阵列及光电计算方法。更具体地,本发明结合了计算领域和半导体器件领域的一些技术,本发明的技术方案可以独立地,或与目前的电子计算技术相结合来进行运算。
背景技术
:现有的电子计算机在原理上,根据半导体材料可以对特定的电信号进行传递、加减和倒相等特性,经过统和与集成,可以完成极其复杂的运算。这一计算,事实上已构成现代文明的一个重要基础。传统的计算机大多采取冯诺依曼架构,然而,冯诺依曼架构存储单元和运算单元的分立,在处理以神经网络算法为代表的一类算法时,因为网络的权值需要被反复调用,存储单元和运算单元的分立就导致了在数据传输上产生了极大的能量消耗,并且影响运算速度。同时,以神经网络算法、ct算法为代表的一系列算法中,需要大量运算矩阵向量乘法,而传统乘法器的规模动辄上万晶体管,这也极大的影响了传统计算在处理此类算法时的能效比和集成度。为了克服这种限制,人们提出了存-算一体器件。典型的存算一体器件主要为rram(忆阻器)和flash(闪存)两类,rram可以在断电后较长时间内保存受其电输入端输入量影响的电阻值,然而rram并不支持标准cmos工艺生产,其器件的良率和均匀性都得不到保证,这在必须大量使用存-算一体器件组成网络才能加速的神经网络算法中,是不可接受的。而如果要使用flash作为存-算一体器件,就意味着单个浮栅管必须存储超过一位的数据,即多值存储,这对于只能使用擦除和编程两种方式改变阈值的传统flash是难以做到的。并且,已知的光运算方法,多为利用光的传播规律来进行光与光学器件相互作用的纯粹光运算。技术实现要素:根据本发明的一个方面,提供一种光电计算装置,其采用半导体材料的光电性能,用外界的输入光信号来调制半导体材料中所传输的电信号,以实现加法器、乘法器以及一些高级运算。并且,本装置可以实现高精度的存-算一体功能,单个器件即可以存储光输入端的光信号并在断光后长时间保存。根据本发明的另一方面,提供一种新的光电计算方法,采用半导体材料的光电性能,用输入光信号来调制半导体材料中所传输的电信号,以实现加法器、乘法器等基本运算的新的机制。本发明采用半导体材料的光电性能,设计了一种光电计算器件,并公开了由所述光电计算器件组成的多种加法器、乘法器和算法加速器,及其相应的光电运算方法。由此可见,本发明利用半导体材料的光电特性,以及传统光学领域已经普遍使用的技术在计算领域的扩展应用,提出了一种全新的光电计算器件和一类光电计算方法,其可以实现高精度的存-算一体功能,单个器件既可以存储光输入端的光信号并在断光后长时间保存,并且可以实现单个器件即完成乘法运算,非常适合加速以神经网络算法为代表的一类需要“存储参数”的算法。本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。附图说明附图用于提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对发明的限制,在附图中:图1是示出根据本发明的光电计算单元的多功能区的基本结构的示意图。图2是示出根据本发明第一实施例的光电计算单元的正视图。图3是示出根据本发明第一实施例的光电计算单元的立体示意图。图4是示出根据本发明第一实施例的光电计算单元的多功能区的配置图。图5是示出根据本发明第一实施例的光电计算单元的电学模型。图6是示出根据本发明第二实施例的光电计算单元的正视图。图7是示出根据本发明第二实施例的光电计算单元的3d示意图。图8是示出根据本发明第二实施例的光电计算单元的多功能区的配置图。图9是示出根据本发明第三实施例的光电计算单元的正视图。图10是示出根据本发明第三实施例的光电计算单元3d的示意图。图11是示出根据本发明第三实施例的光电计算单元的多功能区的配置图。图12是示出根据本发明第三实施例的光电计算单元的电学模型。图13是示出根据本发明第四实施例的光电计算单元的结构示意图。图14是示出根据本发明第四实施例的所述光电计算单元的多功能区结构示意图。图15是示出根据本发明的直接投影方案的示意图。图16是示出根据本发明的发光单元和光电计算单元的集成的示意图。图17是示出根据本发明的镜头光输入方案的示意图。图18是示出根据本发明的光纤锥光输入方案的示意图。图19是示出根据本发明的漏斗状光纤锥方案的示意图。图20是示出根据本发明的采用光电计算单元的多控制栅极结构的示例之一结构图。图21是示出根据本发明的采用光电计算单元的多控制栅极结构的示例之一结构图。图22是示出根据本发明的采用光电计算单元的多控制栅极结构的示例之一结构图。图23是示出根据本发明的加法器之一的示例的图。图24是示出根据本发明的乘法器之一的示例的图。图25是示出根据本发明的乘法器之一的示例的图。图26是示出根据本发明的乘法器之一的示例的图。图27是示出根据本发明的向量加法器的示例的图。图28是示出根据本发明的高位宽乘法器的示例的图。图29是示出根据本发明的串行矩阵向量乘法器的示意图。图30是示出根据本发明的并行矩阵向量乘法器计算的示意图。图31是示出根据本发明的并行矩阵向量乘法器的示意图。图32是示出根据本发明的卷积运算的示意图。图33是示出根据本发明的卷积运算单元阵列示意图,其中针对3*3的卷积核。图34是示出根据本发明的alexnet网络的示意图。图35是示出根据本发明的relu函数图像的示意图。图36是示出根据本发明的x光的拍摄方式和ct的拍摄方式的示意图。图37是示出根据本发明的ct算法的示意图,其中第i条射线穿过第j个像素。图38是示出根据本发明的ct算法的示意图。图39是示出根据本发明的串行ct算法加速器阵列示意图。图40是示出根据本发明的数字控制逻辑的示意图。图41是示出根据本发明的采用本发明第一实施例的光电计算单元的光响应曲线。图42是示出根据本发明的仿真用的类alexnet网络的示意图。具体实施方式为了使得本发明实施例的目的、技术方案和优点更为明显,下面将参照附图详细描述根据本发明的各个实施例,在本说明书和附图中,具有基本上相同步骤和元素用相同的附图标记来表示,且对这些步骤和元素的重复解释将被省略。应理解,所描述的实施例仅仅是本发明的一部分实施例,而不是本发明的全部实施例。基于本发明中描述的实施例,本领域技术人员在没有付出创造性劳动的情况下所得到的所有其它实施例都应落入本发明的保护范围之内。而且,为了使说明书更加清楚简洁,将省略对本领域熟知功能和构造的详细描述。首先,将参照图1描述根据本发明的光电光电计算单元的多功能区的基本结构的示意图。大体上,根据本发明的光电计算器件单元,包括一个半导体多功能区结构,其中所述半导体多功能区结构,包括一个载流子控制区,一个耦合区,以及一个光生载流子收集和读出区,并且该多功能区可以是多层结构,也可以是通过多种空间的布置和变换实现同样的光电作用和控制的任何层或区的结构。下文将参照附图详细描述根据本发明的光电光电计算单元的四个优选实施例。光电运算单元方案第一实施例参照图2至5描述根据本发明第一实施例的光电光电计算单元。如图2和图3的光电光电计算单元的正视图和立体图所示,存在一个作为所述光生载流子收集区和读出区的p型半导体衬底分为左侧收集区和右侧读出区,其中所述左侧收集区用以在衬底上施加一个电压范围为负压的脉冲,或在控制栅上施加一个电压范围为正压的脉冲,使得收集区衬底中产生用于光电子收集的耗尽层,并通过右侧读出区读出收集的光电子数量,作为光输入端的输入量。所述右侧读出区,包含浅槽隔离、n型漏端和n型源端。所述浅槽隔离,位于半导体衬底中部收集区和读出区的中间,所述浅槽隔离通过刻蚀并填充入二氧化硅来形成,以用于隔离收集区和读出区的电信号。所述n型源端,位于读出区内靠近底层介质层的一侧,通过离子注入法掺杂而形成。所述n型漏端,位于半导体衬底中靠近底层介质层与所述n型源端相对的另一侧,同样通过离子注入法进行掺杂法形成。读出时,在控制栅极上施加一正电压,使n型源端和收集区n型漏端间形成导电沟道,再通过在n型源端和n型漏端间施加一个偏置脉冲电压,使得导电沟道内的电子加速形成源漏之间的电流。所述源漏之间沟道内形成电流的载流子,受到控制栅电压、源漏间电压和收集区收集的光电子数量共同作用,作为被光输入量和电输入量共同作用后的电子,以电流的形式进行输出,其中控制栅电压、源漏间电压可以作为器件的电输入量,光电子数量则为器件的光输入量。此外,存在一个作为所述耦合区的电荷耦合层,用以连接收集区和读出区,使收集区衬底内耗尽区开始收集光电子以后,收集区衬底表面势就会受到收集的光电子数量影响;通过电荷耦合层的连接,使得读出区半导体衬底表面势受到收集区半导体衬底表面势影响,进而影响读出区源漏间电流大小,从而通过判断读出区源漏间电流来读出收集区收集的光电子数量;此外,存在一个作为所述载流子控制区的控制栅,用以在其上施加一个脉冲电压,使得在p型半导体衬底读出区中产生用于激发光电子的耗尽区,同时也可以作为电输入端,输入其中一位运算量;此外,所述p型半导体衬底和所述电荷耦合层之间存在用于隔离的底层介质层;所述电荷耦合层和所述控制栅之间亦存在用于隔离的顶层介质层。进一步参照图4所示的光电光电计算单元的多功能区的配置图,光电计算单元包括作为所述载流子控制区的控制栅极、作为所述耦合区的电荷耦合层、作为所述光生载流子收集和读出区的p型衬底,并且用于隔离的底层介质层,被设置在所述p型半导体衬底和所述电荷耦合层之间,以及用于隔离的顶层介质层,被设置在电荷耦合层和所述控制栅之间。应理解,本文中提及的左侧、右侧、上方以及下方只代表在通过图中所示视角观察下的相对位置随观察视角变化而变化,并不理解为对具体结构的限制。另外,图5是根据本发明第一实施例的光电计算单元的电学模型,根据图5所示的电学模型详细描述该光电计算单元的原理。如图5所示,左侧收集区等效于一个电容为的mos电容,右侧读出区等效于一个标准的浮栅mos管。由于设计时,电容c2远小于c1,因此器件工作时读出区对感光区产生的影响忽略不计。对于一个mos-电容si中的电势可以通过解如下泊松方程得到:其中,εsi为硅的介电常数,ρ为p型衬底的体电荷密度。当作为载流子收集和读出区的p衬底施加一负脉冲,或作为载流子控制区的控制栅上施加一正脉冲时,衬底将处在耗尽状态,开始收集作为光输入信号的光子并产生光电子,对于耗尽区而言ρ=qna,其中na为掺杂浓度。求解上述泊松方程可以得到:其中,x方向为垂直于底层介质层向下的方向,xd为耗尽区深度,q为电子电荷量,v为深度为x处的电势。对于mos而言,p型衬底表面电势vs即为x=0时电势v的值因此可得:求导该式即可得:其中es为表面电场强度,假设衬底电压设为0v,这样感光过程中的控制栅极电势为:其中,vg为控制栅电势,解可得耗尽区深度xd为:当有光子入射器件时,在耗尽区内产生光电子并且在栅极电场的作用下收集于收集区沟道内,控制栅上的总电荷量qcg=na+q,q即为信号电荷量(e-/cm2),因为此信号电荷在控制栅和p型衬底之间电场的作用下被收集于收集区中,并且因为半导体衬底中载流子的复合需要一定的时间,再加上耗尽区内热激发载流子的存在,因此,此信号电荷将在断光后较长的时间内依旧存储于运算单元当中,实现存-算一体功能。此时,其中,vq为信号电荷产生的电势总和:由上式可以看到随着信号电荷量q的增大,xd逐渐减小,当q的值使得vq=0时xd即为0,此时表面电势vs=0,沟道电势不再变化,此时器件到达满阱。对于右侧的读出区浮栅mosfet,其沟道电流id可以表示为:其中w和l分别为栅宽栅长,vds为源漏间电压,vfg为电荷耦合层电势,其大小受到控制栅电势vg和p型衬底表面势vs的影响,可表示为:当p型衬底掺杂浓度较低时(如2e15每立方厘米),耗尽区的分压远大于电容c1和c3的分压,因此公式(1-6)可以简化为:公式(1-11)带入(1-3),即得到p型衬底表面电势vs和控制栅电势vg以及信号电荷产生的电势总和vq为近似相等,即:vs≈vq(1-12)将公式(1-12)、(1-8)带入(1-10),再带入(1-9),即可得:并用入射光子数xphoton来表示信号电荷q的大小:q=xphotontη(1-14)其中t为曝光时间,xphoton为单位时间入射的光子个数,η为器件量子效率。从而就得到器件可以作为乘法器工作的表达式:从公式(1-15)中不难看出,作为输出量的读出区源漏电流id同时受到作为光输入量的xphoton、作为电输入量的vg和vds作用,并且天生包含乘法和加法的运算关系,利用这样的作用关系,本发明可以实现各种不同功能的运算装置。所述光电计算单元的最基本结构只包含一个输出端,但是如果将右侧读出区的mosfet分割为多个并列的各自有独立源漏,并且各项器件参数都相等的小mosfet,则可扩展输出端的数量,如果给予所述多个小mosfet相同的vds,则可获得光电计算单元的多路相同的输出量。也将在后文中描述基于上述第一实施例所述方案的光电计算单元。第二实施例参照图6至8描述根据本发明第二实施例的光电计算单元。如图6和图7的光电计算单元的正视图和立体图所示,存在一个作为光生载流子收集及读出区的n型半导体衬底,分为左侧收集区和右侧读出区。所述左侧读出区用以在衬底上施加一个电压范围为正压的脉冲,或在控制栅上施加一个电压范围为负压的脉冲,使得收集区衬底中产生用于光空穴收集的耗尽层,并通过右侧读出区读出收集的光空穴电荷量;所述右侧读出区,包含浅槽隔离、p型漏端和p型源端。所述浅槽隔离,位于半导体衬底中部收集区和读出区中间,通过刻蚀并填充入二氧化硅来形成,用于隔离收集区和读出区的电信号。所述p型源端,位于读出区内靠近底层介质层的一侧,通过离子注入法掺杂而形成。所述p型漏端,位于半导体衬底中靠近底层介质层与所述p型源端相对的另一侧,同样通过离子注入法进行掺杂法形成。读出时,在控制栅极上施加一负脉冲电压,使p型源端和p型漏端间形成导电沟道,再通过在p型源端和p型漏端间施加一个偏置脉冲电压,使得导电沟道内的空穴加速形成源漏之间的电流。所述源漏之间沟道内形成电流的载流子,受到控制栅脉冲电压、源漏间电压和收集区收集的光空穴数量共同作用,作为被光输入量和电输入量共同作用后的载流子,以电流的形式进行输出,其中控制栅电压、源漏间电压可以作为器件的电输入量,光空穴数量则为器件的光输入量。此外,存在一个作为耦合区的电荷耦合层,用以连接收集区和读出区,使收集区衬底内耗尽区开始收集光空穴以后,收集区衬底表面势就会受到收集区的光空穴数量影响;通过电荷耦合层的连接,使得读出区半导体衬底表面势再受到读出区半导体衬底表面势影响,进而影响读出区源漏间电流,从而通过判断读出区源漏间电流来读出收集区收集的光空穴数量。此外,存在一个作为载流子控制区的控制栅,用以在其上施加一个负脉冲电压,使得在n型半导体衬底读出区中产生用于激发光空穴的耗尽区,同时也可以作为电输入端,输入其中一位运算量。此外,所述n型半导体衬底和所述电荷耦合层之间存在一层用于隔离的底层介质层;所述电荷耦合层和所述控制栅之间亦存在一层用于隔离的顶层介质层。进一步参照图8所示的光电计算单元的多功能区的配置图,光电计算单元包括作为所述载流子控制区的控制栅极、作为所述耦合区的电荷耦合层,以及作为所述光生载流子收集和读出区的n型衬底,并且用于隔离的底层介质层,被设置在所述n型半导体衬底和所述电荷耦合层之间,以及用于隔离的顶层介质层,被设置在电荷耦合层和所述控制栅之间。与上述的本发明的第一实施例相比,该第二实施例的区别在于将器件单元使用的p型衬底更换为n型,将读出区mosfet的n型源端和漏端更换为了p型,其他结构均无改动,因此基于原理的推导过程与第一实施例所述的过程相似,相似部分不再赘述。根据之前的推导,公式(1-7)指出,当控制栅和衬底之间的压差不变时,光子入射前,衬底的掺杂浓度越高,耗尽区的深度也就越浅,而过浅的耗尽区将导致运算器件在接收光输入时,可接收的最大光子数过少,光输入端的可输入范围变小,影响运算单元的性能;并且,根据相关理论,过高的衬底掺杂浓度会导致载流子的热激发变大,这将影响光输入端数据在存算一体器件中的存储时间。在半导体工艺中,因为晶圆天生就是低浓度的p型掺杂,制作p型衬底器件可以直接使用此掺杂作为衬底条件;而如需制作n型衬底器件,则需要通过离子注入的方式来先制作一个n井,再在n井中制作n型衬底器件。因此相对于n型衬底器件而言,p型衬底器件较容易获得更低的衬底掺杂,因此上述两种实施例中,第一实施例所述的方案往往相较于第二实施例的方案有更多的优势。同第一实施例的方案一样,第二实施例中的光电计算单元的最基本结构只包含一个输出端,但是如果将右侧读出区的mosfet分割为多个并列的各自有独立源漏,并且各项器件参数都相等的小mosfet,则可扩展输出端的数量,如果给予所述多个小mosfet相同的vds,则可获得光电计算单元的多路相同的输出量。也将在后文中描述基于上述第二实施例所述方案的光电计算单元。第三实施例参照图9至12描述根据本发明第三实施例的光电计算单元。如图9和图10的光电计算单元的正视图和立体图所示,存在一个作为所述光生载流子收集及读出区的p型半导体衬底,可以同时承担感光和读出的工作,包含一个n型漏端和一个n型源端。所述n型源端,位于读出区内靠近底层介质层的一侧,通过离子注入法掺杂而形成。所述n型漏端,位于半导体衬底中靠近底层介质层与所述n型源端相对的另一侧,同样通过离子注入法进行掺杂法形成。感光时,在所述p型半导体衬底上施加一个电压范围为负压的脉冲,同时在所述作为载流子控制区的控制栅极上施加一个电压范围为正压的脉冲,使得p型衬底中产生用于光电子收集的耗尽层,产生在耗尽区内的电子在控制栅极和p型衬底两端之间的电场作用下被加速,并在到达获得足够高的能量,穿过p型衬底和电荷耦合层之间的底层介质层势垒,进入电荷耦合层并储存于此,电荷耦合层中的电荷数量,会影响器件开启时的阈值,进而影响读出时的源漏间电流大小;读出时,在控制栅极上施加一脉冲电压,使n型源端和n型漏端间形成导电沟道,再通过在n型源端和n型漏端间施加一个脉冲电压,使得导电沟道内的电子加速形成源漏之间的电流。所述源漏之间的电流受到控制栅脉冲电压、源漏间电压和电荷耦合层中存储的电子数量共同作用,作为被光输入量和电输入量共同作用后的电子,以电流的形式进行输出,其中控制栅电压、源漏间电压可以作为器件的电输入量,电荷耦合层中存储的光电子数量则为器件的光输入量。此外,存在一个作为所述耦合区的电荷耦合层,用以储存进入其中的光电子,并改变读出时器件阈值大小,进而影响读出区源漏间电流,从而通过判断读出区源漏间电流来读出感光时产生并且进入电荷耦合层中的光电子数量。此外,存在一个作为所述载流子控制区的控制栅,用以在其上施加一个脉冲电压,使得在p型半导体衬底读出区中产生用于激发光电子的耗尽区,同时也可以作为电输入端,输入其中一位运算量。此外,所述p型半导体衬底和所述电荷耦合层之间存在一层用于隔离的底层介质层;所述电荷耦合层和所述控制栅之间亦存在一层用于隔离的顶层介质层。进一步参照图11所示的光电计算单元的多功能区的配置图,光电计算单元包括作为所述载流子控制区的控制栅极、作为所述耦合区的电荷耦合层,以及作为所述光生载流子收集和读出区的p型衬底,其中用于隔离的底层介质层,被设置在所述p型半导体衬底和所述电荷耦合层之间,以及用于隔离的顶层介质层,被设置在所述电荷耦合层和所述控制栅之间。另外,图12是根据本发明第三实施例的光电计算单元的电学模型,根据图5所示的电学模型详细描述该光电计算单元的原理。如图12所示,光电计算单元单元的结构和浮栅器件大致相当,最顶端的栅是控制栅极,与中间的电荷耦合层是完全隔开的,电荷耦合层即相当于浮栅器件中的浮栅。其中,cfc、cs、cb、cd分别是浮栅与控制栅、源端、衬底、漏端之间的电容。当浮栅中不存电荷时,即可得到:其中,vfg是浮栅上的电势,vcg是控制栅上的电势,vs、vd、vb分别为源端、漏端和衬底的电势。如果定义浮栅的总电容ct为ct=cfc+cs+cd+cb,同时定义电极j的耦合系数为其中电极j可以为控制栅g、漏端d、源端s、衬底b中的任意一个,然后浮栅的电势vfg就可以由耦合系数表示为:vfg=αgvgs+αdvds+αsvs+αbvb(2-2)其中,vgs、vds分别为栅源电压和源漏电压,αg、αs、αd、αb分别为栅、源、漏和衬底的耦合系数。可以看到浮栅的电势不仅与控制栅极相关,同时与源端、漏端和衬底的电势相关,如果源和衬底都接地,则:其中,对于浮栅器件,阈值电压vt和传导系数β可由普通mos器件的公式推导得到:其中,器件达到阈值时的浮栅电势为,为器件达到阈值时的控制栅电势,βcg为针对控制栅的体传导系数,βfg为针对浮栅的体传导系数。由此,对于线性区而言,漏端电流ids为:当浮栅中存储有电荷时,公式(2-3),(2-5),(2-7)即为:从公式(2-9)可以看到vt是与是直接相关的,同时,由该式可以的到vt的改变δvt可以表示为:其中,vt0为浮栅中不存在电荷时的阈值。在图9、图10所示的光电计算单元的控制栅极加上栅压脉冲,衬底上加负脉冲电压后,在衬底半导体中形成耗尽层。光输入时,代表光输入量的光子入射到半导体衬底耗尽区内,si半导体衬底吸收一个光子并激发一个电子空穴对。光电子在栅极电压的驱使下加速移动到沟道,并获得足够高的能量,如果能量足够高,即可在栅氧电场的作用下进入电荷耦合层中,完成电荷存储。电荷耦合层在存入光电子后,读出时浮栅mosfet的漏端电流和阈值电压将发生变化。由式(2-11)可以知道光电子进入电荷耦合层后引起的器件阈值电压的变化可表示为:其中△vt为阈值电压的变化,qe为单个电子电荷量电荷量,ccg为控制栅到浮栅的电容,nelec为存储层中的光电子数目。该公式表明阈值电压变化与光电荷量呈线性关系。通过对曝光前后阈值电压的变化量测量可推定光电子存储层中光电子数目,公式如下:将控制栅到浮栅的电容ccg表达式代入上式,得到:其中w、l分别代表浮栅器件的栅宽和栅长,h为浮栅厚度,tipd为所述器件单元中浮栅与栅之间的厚度,ε0为真空介电常数,ε0x为相对介电常数。由式(2-10)可以知道阈值电压变化对应于线性区漏端电流变化△ids可以表示为如下:因而光电子的存储数目还可以通过测量线性区漏端电流的变化得到。综上,最终读出区的漏源电流id为:从公式(2-15)中不难看出,作为读出量的读出区漏源电流id同时受到作为光输入量的n、作为电输入量的vg和vds作用,并且天生包含乘法和加法的运算关系,利用所述的作用关系,即可设计出可以实现各种不同功能的运算装置。与上述第一实施例以及第二实施例相比,第三实施例最大的区别在于:因为本方案光输入量在器件单元中的存储载体光电子是存储在隔离的电荷耦合层之中,因此具有非常长的保持时间,最多可以达到10年,而上述第一实施例以及第二实施例所述的方案的光输入信号只能维持秒级的时间,因而作为存算一体器件,具有更大的优势。同上述第一实施例以及第二实施例一样,所述光电计算单元的最基本结构只包含一个输出端,但是如果将电荷耦合层下的衬底分割为多个并列的各自有独立源漏,并且各项器件参数都相等的小mosfet,则可扩展输出端的数量,如果给予所述多个小mosfet相同的vds,则可获得光电计算单元的多路相同的输出量。也将在后文中描述基于上述第二实施例所述方案的光电计算单元。第四实施例参照图13和图14描述根据本发明第四实施例的光电计算单元。如图13所示,存在一个作为所述光生载流子收集和读出区的光电二极管和读出管,其中,光电二极管通过离子掺杂形成,负责感光。所述光电二极管的n区通过作为耦合区的所述光电子耦合引线连接到读出管的控制栅和复位管的源端上,读出管的漏端施加一正电压脉冲,作为读出电流的驱动电压;曝光前,复位管打开,复位管漏端电压施加到光电二极管上,使所述作为收集区的光电二极管处于反偏状态,产生耗尽层;曝光时,复位管关断,所述光电二极管被电学上隔离,光子入射光电二极管耗尽区后产生光电子,并在二极管中积累,二极管的n区和在电学上通过作为耦合区的所述光电子耦合引线和n区连接的读出管控制栅电势开始下降,进而影响读出管沟道内的电子浓度。所述读出管负责读出,其漏端施加一正脉冲电压,源端和选址管漏端连接,读出时,打开选址管,读出管中产生电流电流,所述电流大小受到复位管漏端电压、读出管漏端电压和入射光子数共同影响,读出管沟道内的电子,作为被光输入量和电输入量共同作用后的电子,以电流的形式输出,其中复位管漏端电压、读出管漏端电压可以作为器件的电输入量,电入射光子数则为器件的光输入量。此外,存在一个作为耦合区的光电子耦合引线用于连接作为光生载流子收集和读出区中收集区的光电二极管和作为读出区的读出管,将光电二极管n区电势施加到读出管控制栅上。此外,存在一个作为所谓载流子控制区的复位管,通过其漏端输入一个正电压作用于光电二极管,当复位管打开时,所述正电压即会作用在光电二极管上,使光电二极管产生耗尽区并感光,同时也可以作为电输入端,输入其中一位运算量。此外,所述选址管,用于控制整个运算器件作为输出量的输出电流的输出。进一步参照图14所示的光电计算单元的多功能区的配置图,光电计算单元包括作为所述载流子控制区的复位管、作为所述耦合区的光电子耦合引线,以及作为所述光生载流子收集和读出区的光电二极管和读出管,此外,还包括选址管,用于将所述光电计算单元组成阵列时行列选址使用。另外,如图13所示,复位管的漏端和电源相连,电源电压vd1,曝光前,在复位管的栅极上加一高电压,使复位管开启,电源电压vd1施加到光电二极管的负极,光电二极管正极接地,此时光电二极管两端电压vpd为:vpd=vd1(3-1)此时光电二极管内产生耗尽区,耗尽区宽度w为:其中,k为和所述二极管参数有关的常数,vbi为内建电场,mj的值取决于二极管的类型为突变结还是缓偏结。此时,关断复位管,光电二极管在电学上被隔离,代表光输入量的光子入射光电二极管耗尽区,并在耗尽区内形成光电子,单位时间内产生的光电子数iph为:iph=rphl0a(3-3)其中rph为光电二极管的敏感度,l0为其截面积,a为光强。因为光电二极管被隔离,光电子会在耗尽区内积累,有如下常微分方程:其中id为反偏电流,解上述微分方程,得到:mj为常数,可以看到,光电二极管两端电压随着入射光子数的增加逐渐降低,将光电二极管的常规参数带入会发现两端电压随时间下降的曲线有较好的线性度,因此,将上式简化为:v(t)=(vd1)-k*xphoto(3-5)xphoto即代表光输入量的入射光子数,k为拟合出的直线斜率。因为作为载流子读出区的读出管和作为载流子收集区的光电二极管,通过作为耦合区的光电子耦合引线相连,因此光电二极管两端电压即读出管控制栅极电压,读出时,将mosfet线性区沟道电流公式带入:其中,v′t为读出管本身的阈值,vd2为读出管漏源间电压,μ为沟道迁移率,w和l分别为栅宽栅长。从公式(3-6)中不难看出,作为读出量的读出区管源漏电流id同时受到作为光输入量的xphoto、作为电输入量的vd1和vd2作用,并且天生包含乘法和加法的运算关系,利用所述的作用关系,即可设计出可以实现各种不同功能的运算装置。第四实施例所述的光电运算器件单元,相对于上述另外上述三种方案而言,最大的区别在于单元面积更大,需要一个光电二极管和三个mos管才可实现,集成度较低。同另外上述三种方案一样,所述光电计算单元的最基本结构只包含一个输出端,但是如果将一个读出管扩展为多个栅极都相连的多个各项器件参数都相等的读出管,并配以相同数量的选址管,则可扩展输出端的数量,如果给予所述多个读出管相同的vds,则可获得光电计算单元的多路相同的输出量。也将在后文中描述基于上述第二实施例所述方案的光电计算单元。另外,需要强调的是,入射所述光电计算单元的光子可以来自于光学上与光电计算单元对应的发光单元,也可以来自于其他光源,例如来自自然光源或物体的景象。下文将详细描述几种光输入的方案。光输入的方案根据本发明的一个方面,提出一种发光单元阵列和光电计算单元阵列的结合方案,其中包含一个或多个发光单元和一个或多个光电计算单元,所述光电计算单元和发光单元在光学上一一对应,以实现对阵列中单个光电计算单元精确的光输入,例如,所述发光单元阵列可以使用高密度小像素led阵列来实现。具体地,发光单元和计算单元在光学上的相对应,即发光单元发出的光,精确地照射到该发光单元所对应的计算单元上,如果只使用一个发光单元和计算单元,则需要让此发光单元发出的光照射到计算单元上,如果使用例如10*10的发光单元组成发光阵列和同样数量的计算单元组成计算阵列,则需要让该发光阵列中每一个发光单元发出的光根据具体计算需求,精确照射到其对应的一个或多个计算单元上,假如此阵列实现的计算功能为矩阵向量乘法,则要求每一个发光单元发出的光都精确地照射到每一个计算单元中,为了实现这种精准的光输入,可以通过以下四种优选实施例来实现:直接投影若需实现发光单元和器件的一一对应,一种方法是直接让发光单元阵列紧贴器件阵列表面,所述发光阵列使用小像素led屏幕,如图15所示。理想发光单元发出的是一球面波,当距离足够近的时候,可以认为发光单元发出的光,只传递到了其正下方器件的表面,这样即实现了光源和器件的一一对应。发光单元和成像单元的集成本方案类似于soi技术,如果能实现发光单元和光电计算单元的三维集成,中间通过生长氧化物来进行隔离(做在一块硅片上),则无论是阵列的集成度,还是led到计算器件之间的距离,都会大大的优化,如图16所示,其中光电计算单元可以使用本发明上述的第一实施例中所述光电计算单元。镜头光输入发光阵列和计算阵列中间的实现对焦功能的光学结构,即可以是镜头。为了实现发光物体和成像芯片位置上的一一对应,最通用的方案就是使用镜头,发光单元和光电计算单元光学上的一一对应也可以通过这种途径来实现,如图17所示。光纤维输入发光阵列和计算阵列中间的实现对焦功能的光学结构,也可以是光纤锥。光纤锥,为可以实现发光单元和光电计算单元一一对应的一种微结构,其功能类似光纤。光纤可以被理解为多股密集光线排成的光纤阵列,如果使用光纤锥阵列来链接发光单元和光电计算单元,则可以很好的实现发光单元和光电计算单元的一一对应,大体结构如图18。光纤锥的方案,相比于直接投影和使用镜头有明显的优势:1、传递函数高,光纤锥实现的一一对应,可以将光学串扰有效抑制。2、集成度高、良率高、可优化空间大。上述直接投影的方案中提到,为了提高光电计算单元的集成度,单个光电计算单元的尺寸会在兼顾其他指标的情况下尽可能做小,而led像素的尺寸目前只能在8um左右。为了实现尺寸不匹配的发光单元和光电计算单元的一一对应,例如,可以使用漏斗形的光纤锥来连接两个单元,大体结构如图19所示。因此,光纤锥的使用,会使得所述的光电计算阵列在光输入问题上得到一个良好的解决方案。发光单元的驱动方案发光单元的驱动,受到数字控制系统中的光输入控制部分控制。发光单元受到驱动器发出的恒定电流驱动,保持光强不变,通过调整发光时间来实现不同大小的光输入量的输入。若只存在一个计算单元和一个发光单元,光输入控制部分将所需通过光输入输入到计算单元中的数据转化为发光单元发光时长的脉宽,根据使用的计算单元的种类不同,例如,若使用如上述第一实施例所述的具体计算单元,则光输入量越大,被驱动的发光单元的发光时长就应越短。计算阵列和发光阵列如上述光电计算单元的实施例所述,单个光电计算单元可以实现加法或者乘法的运算,若将多个光电计算组合成阵列,并将上述的与光电计算单元相对应的发光单元同样也组成阵列,即可完成一组或多组加法或者乘法的运算,同时,通过引线的连接,如将两个光电计算单元的输出端相连,让输出电流汇聚成一股电流,则又等同于实现了一次加法。通过上述方法,将光电计算单元根据具体的算法需要,改变引线的连接和光电计算单元的排布方式,就可以制作出实现特定运算的计算阵列。并且,通过对光电计算单元和发光单元的相应排布组成阵列,可以实现矩阵向量乘法的运算、平均池化运算的阵列、以及卷积运算的阵列等。第一种加法器如上所述,本发明提出了多种光电计算装置和光电计算方法的具体实施方式,通过使用发光单元和上文所述光电计算单元(包括优选的第一至第四实施例),可以实现两位加数的加法运算。根据本发明的加法器最大的优点在于:只需要单一光电计算单元和发光单元就可实现两个加数的加法运算,集成度较高。此加法器的输出端的个数,具体取决于使用的光电计算单元的输出端的个数,例如,如果使用上文所述的具有两个输出端的光电计算单元,则加法器也具有两个输出端,下文详细描述的四种方案中默认采取有一个输出端的光电计算单元,作为示例。方案1:基于上述第一实施例的光电计算单元在本方案1中,源漏输出电流符合公式:其中,xphoto为入射到光电计算单元的有效光子数,vg为代表所述载流子控制区的控制栅上的电压,t为,η为,q为。因为xphoto和vg公式中天生即为加减的关系,故而可以通过对xphoto和vg的调制,用所述的二者关系来进行加法运算,其中:xphoto代表光输入端的输入量,为第一位加数;vg代表电输入端的输入量,为第二位加数;同时载流子收集和读出区中读出区的漏源间电压vds加以恒定值,则载流子收集和读出区中读出区的输出电流id即为加法运算的结果,即等于进行了如(3-1-2)式所述的计算:r=k(ax+by+c)(3-1-2)其中,a、b、k和c都为常数。方案2:基于上述第二实施例的光电计算单元相比上述方案1而言,基于上述第二实施例的光电计算单元的方案2最大的区别在于:从p衬底器件更换为了n衬底器件,因此作为所述载流子控制区的控制栅极上加的电压从正压变为了负压,作为所述载流子收集和读出区的n型衬底在曝光时加的电压从负压变成了正压,但控制栅电压和入射光子数依旧是一对加减的关系,因此只需要在对光输入信号和电输入信号调制时进行些许变化,依旧可以实现与第一实施例的方案大体相似的加法运算。方案3:基于上述第三实施例的光电计算单元在基于上述第三实施例的光电计算单元的方案3中,源漏输出电流符合公式:其中,nelec为进入到作为所述耦合区的电荷耦合层中的电子数,vg为作为所述载流子控制区的控制栅上的电压,为器件阈值。因为nelec和vg公式中天生即为加减的关系,故而可以通过对nelec和vg的调制,用所述的二者关系来进行加法运算:nelec代表光输入端的输入量,为第一位加数;vg代表电输入端的输入量,为第二位加数;同时载流子收集和读出区中读出区的漏源间电压vds加以恒定值,则载流子收集和读出区中读出区的输出电流id即为加法运算的结果,即等于进行了如(3-3-2)式所述的计算:r=k(ax+by+c)(3-3-2)其中,a、b、k和c都为常数。方案4:基于上述第四实施例的光电计算单元在基于上述第四实施例的光电计算单元的方案4中,源漏输出电流符合公式:其中,xphoto为入射到光电计算单元的有效光子数,vd1为作为所述载流子控制区的复位管漏端电压,k为拟合出的直线斜率,vd2为读出管源漏间电压。因为xphoto和vd1公式中天生即为加减的关系,故而可以通过对xphoto和vd1的调制,用所述的二者关系来进行加法运算:xphoto代表光输入端的输入量,为第一位加数;vd1代表电输入端的输入量,为第二位加数;同时作为载流子收集和读出区中读出区的读出管的漏端电压vds加以恒定值,则载流子收集和读出区中读出区的输出电流id即为加法运算的结果,即等于进行了如(3-4-2)式所述的计算:r=k(ax+by+c)(3-4-2)其中,a、b、k和c都为常数。采取本方案进行加法运算,相较于传统加法运算器有如下优势:1、集成度高,单个光电计算单元就可实现运算。2、光输入数据具有存储特性,可在断光后长时间保存在器件内,下次运算时无需重新进行光输入。第二种加法器如上所述,本发明提出了多种光电计算装置和光电计算方法的具体实现方案,通过使用一个发光单元和多控制区光电计算单元,来实现至少两位加数的加法运算。此加法器的最大优点是不光只需要单一光电计算单元即可实现加法运算,而且输入的加数数量也不仅仅局限于两个,但是需要工艺的支持,尤其是使用上述第一、第二、第三实施例中所述光电计算单元的方案时,多控制栅参数必须有较高的均匀性。此加法器的输出端的个数,具体取决于使用的光电计算单元的输出端的个数,例如,如果使用具有两个输出端的上述光电计算单元,则加法器也具有两个输出端,下文的详细描述的四个方案中默认采取有一个输出端的光电计算单元,作为示例。方案1:基于上述第一实施例的光电计算单元在本方案1中,源漏输出电流符合公式:其中,xphoto为入射到光电计算单元的有效光子数,vg为代表所述载流子控制区的控制栅上的电压,t为曝光时间,η为量子效率,q为电子电荷量。如果将控制栅改为多栅极结构,如图20,则上式改为:其中,vg1到vgn分别代表n个控制栅上的输入的电压,为多个电输入端的电输入量,k1到kn分别为和n个控制栅面积有关的多栅极输入权重。从(4-1-2)中不难看出,各个控制栅上的电压和光输入量xphoto天生即为加减的关系,故而可以通过对xphoto和vg1到vgn的调制,用所述的关系来进行加法运算。xphoto代表光输入端的输入量,为第一位加数;vg1到vgn代表电输入端的多个输入量,为第二到第n位加数;同时载流子收集和读出区中读出区的漏源间电压vds加以恒定值,则载流子收集和读出区中读出区的输出电流id即为加法运算的结果,即等于进行了如(3-1-2)式所述的计算:r=k(ax+k1y1+k2y2......knyn+c)(4-1-3)其中,a、b、k和c都为常数。方案2:基于上述第二实施例的光电计算单元相比于方案1而言,方案2最大的区别在于从p衬底器件更换为了n衬底器件,因此作为所述载流子控制区的多栅极控制栅极上加的电压从正压变为了负压,作为所述载流子收集和读出区的n型衬底在曝光时加的电压从负压变成了正压,但多栅极的多个电压和入射光子数依旧是一对加减的关系,因此只需要在对光输入信号和电输入信号调制时进行些许变化,依旧可以实现和方案1大体相似的多个加数的加法运算。方案3:基于上述第三实施例的光电计算单元在本方案3中,如果代表所述载流子控制区的控制栅极采用多栅极结构,如图21所示,则源漏输出电流符合公式:其中,vg1到vgn分别代表n个控制栅上的输入的电压,为多个电输入端的电输入量,k1到kn分别为和n个控制栅面积有关的多栅极输入权重。从(4-2-1)中不难看出,各个控制栅上的电压和光电子进入代表所述耦合区的电荷耦合层的电荷量n天生即为加减的关系,故而可以通过对n和vg1到vgn的调制,用所述的关系来进行加法运算。n代表光输入端的输入量,为第一位加数;vg1到vgn代表电输入端的多个输入量,为第二到第n位加数;同时载流子收集和读出区中读出区的漏源间电压vds加以恒定值,则载流子收集和读出区中读出区的输出电流id即为加法运算的结果,即等于进行了如(4-3-2)式所述的计算:r=k(ax+k1y1+k2y2......knyn+c)(4-3-2)其中,a、b、k和c都为常数。方案4:基于上述第四实施例的光电计算单元在本方案4中,如果代表所述载流子控制区的复位管采用多复位管并联的方式,如图22所示,则源漏输出电流符合公式:其中,vd1到vdn分别代表n个复位管漏端的电压,为多个电输入端的电输入量,k1到kn分别为和n个复位管沟道电阻有关的多栅极输入权重。从(4-4-1)中不难看出,各个复位管漏端的电压和光输入量xphoto天生即为加减的关系,故而可以通过对xphoto和vd1到vdn的调制,用所述的关系来进行加法运算。xphoto代表光输入端的输入量,为第一位加数;vd1到vdn代表电输入端的多个输入量,为第二到第n位加数;同时载流子收集和读出区中读出区的漏源间电压vds加以恒定值,则载流子收集和读出区中读出区的输出电流id即为加法运算的结果,即等于进行了如(4-4-2)式所述的计算:r=k(ax+k1y1+k2y2......knyn+c)(4-4-2)其中,a、b、k和c都为常数。采取本方案进行加法运算,相较于传统加法运算器有如下优势:1、集成度高,单个光电计算单元就可实现多个加数的加法运算。2、光输入数据具有存储特性,可在断光后长时间保存在器件内,下次运算时无需重新进行光输入。第三种加法器如上所述,本发明提出了多种光电计算装置和光电计算方法的具体实现方案,通过使用至少两个发光单元和至少两个上文中所述光电计算单元,来实现至少两位加数的加法运算。本加法器的方案最大的优点就是利用光输入精度较高的特点,一个光电计算单元只承担一路光信号的输入,电信号只给予恒定值,这有利于计算均匀性的提高;另外,如果存在类似于固定图像噪声或器件均匀性等固定不变的计算误差,也可以通过电输入端恒定值的改变加以修正。此加法器的输出端的个数,具体取决于使用的光电计算单元的输出端的个数,例如如果使用上述中所述的具有两个输出端的光电计算单元,则加法器也具有两个输出端,下文的详细叙述中默认采取有一个输出端的光电计算单元,作为示例。方案1:基于上述第一实施例的光电计算单元在本方案1中,以两位加数的加法运算为例,使用两个光电计算单元和发光单元,如图23所示,其中,一个标有v字符的方框单元即代表一个采用本方案1的光电计算单元。在本方案1中,源漏输出电流符合公式:其中,xphoton为入射到光电计算单元的有效光子数,如果将两个各种参数均相同单元的输出端并接,让输出电流汇聚,并给予两个光电计算单元不同的光输入量xphoto,但给予相同的电输入端输入vg和vds,则上式改为:其中,xphotol和xphoto2分别为两个输出端并联的单元的光输入端输入量,从(5-1-2)中不难看出,两个单元光输入端数据天生即为加减的关系,故而可以通过对xphoto1和xphoto2的调制,用所述的关系来进行加法运算。xphotol和xphoto2分别代表光输入端的第一和第二位加数,同时两个单元的作为所述载流子控制区的控制栅极vg,和作为载流子收集和读出区中读出区的漏源间电压vds加以恒定值,则经过汇聚后的总输出电流id总,再经过ad转换,送入控制系统后,即可获得加法的结果,等于进行了如(5-1-3)式所述的计算:r=k(ax1+ax2+c)(5-1-3)其中a、c和k都为常数,如需进行加数大于2的加法运算,只需增加并接的光电计算单元和与之对应的发光单元即可。所述的控制系统,可以是数字电路,也可以是计算机、单片机、fpga等多种逻辑控制单元。方案2:基于上述第二实施例的光电计算单元在本方案2中,相比于上述方案1而言最大的区别在于从p衬底器件更换为了n衬底器件,因此作为所述载流子控制区的控制栅极上加的电压从正压变为了负压,作为所述载流子收集和读出区的n型衬底在曝光时加的电压从负压变成了正压,但并接的多个单元的光输入端数据依旧是一对加减的关系,因此只需要在对光输入信号和电输入恒定值调制时进行些许变化,依旧可以实现与方案1大体相似的多个加数的加法运算。方案3:基于上述第三实施例的光电计算单元以两位加数的加法运算为例,使用两个光电计算单元和发光单元,如图23所示连接,其中,一个标有v字符的方框单元即代表一个采用本方案3的光电计算单元。在本方案3中,源漏输出电流符合公式:其中,n为进入到作为所述耦合区的电荷耦合层中的光电子,如果将两个各种参数均相同单元的输出端并接,让输出电流汇聚,并给予两个光电计算单元不同的光输入量n,但给予相同的电输入端输入vg和vds,则上式改为:其中,n1和n2分别为两个输出端并联的单元的光输入端输入量,从(5-3-2)中不难看出,两个单元光输入端数据天生即为加减的关系,故而可以通过对n1和n2的调制,用所述的关系来进行加法运算。n1和n2分别代表光输入端的第一和第二位加数,同时两个单元的作为所述载流子控制区的控制栅极vg,和作为载流子收集和读出区中读出区的漏源间电压vds加以恒定值,则经过汇聚后的总输出电流id总,再经过ad转换,送入控制系统后,即可获得加法的结果,等于进行了如(5-3-3)式所述的计算:r=k(ax1+ax2+c)(5-3-3)其中a、c和k都为常数,如需进行加数大于2的加法运算,只需增加并接的光电计算单元和与之对应的发光单元即可。所述的控制系统,可以是数字电路,也可以是计算机、单片机、fpga等多种逻辑控制单元。方案4:基于上述第四实施例的光电计算单元以两位加数的加法运算为例,使用两个光电计算单元和发光单元,如图23所示,其中,一个标有v字符的方框单元即代表一个采用本方案4的光电计算单元。在本方案4中,源漏输出电流符合公式:其中,xphoto为被收集在作为所述载流子收集和读出区中读出区的光电二极管中的光电子,如果将两个各种参数均相同单元的输出端并接,让输出电流汇聚,并给予两个光电计算单元不同的光输入量xphoto,但给予相同的电输入端输入vd1和vd2,则上式改为:xphotol和xphoto2分别代表光输入端的第一和第二位加数,同时两个单元的作为所述载流子控制区的复位管的漏端电压vd1,和作为载流子收集和读出区中读出区的读出管的漏端电压vd2加以恒定值,则经过汇聚后的总输出电流id总,再经过ad转换,送入控制系统后,即可获得加法的结果,等于进行了如(5-4-3)式所述的计算:r=k(ax1+ax2+c)(5-4-3)其中a、c和k都为常数,如需进行加数大于2的加法运算,只需增加并接的光电计算单元和与之对应的发光单元即可。所述的控制系统,可以是数字电路,也可以是计算机、单片机、fpga等多种逻辑控制单元。采取本方案4进行加法运算,相较于传统加法运算器有如下优势:1、集成度高,两个光电计算单元就可实现两位加数的加法运算。2、可以自由选择加数的数量。3、光输入数据具有存储特性,可在断光后长时间保存在器件内,下次运算时无需重新进行光输入。第一种乘法器本发明提出了多种光电计算装置和光电计算方法的具体实现方案,通过使用一个发光单元和上述实施例中所述的光电计算单元,来实现两位乘数的乘法运算。本乘法器的方案最大的优点就是集成度高,单一器件即可实现乘法运算,但是只支持两路输入的乘法运算,并且双路模拟输入,计算精度有限。此乘法器的输出端的个数,具体取决于使用的光电计算单元的输出端的个数,例如如果使用具有两个输出端的上述实施例中所述的光电计算单元,则乘法器也具有两个输出端,下文的详细叙述中默认采取有一个输出端的光电计算单元。1)、采用上述光电计算单元的第一实施例的方案:在第一种方案中,源漏输出电流符合公式:其中,xphoto为入射到光电计算单元的有效光子数,vds为代表所述载流子收集和输出区的p型衬底的漏端电压,因为其二者公式中天生即为乘法的关系,故而可以通过对xphoto和vds的调制,用所述的二者关系来进行乘法运算:xphoto代表光输入端的输入量,为第一位乘数;vds代表电输入端的输入量,为第二位乘数;同时载流子控制区的控制栅极电压vg加以恒定值,则载流子收集和读出区中读出区的输出电流id即为乘法运算的结果,即等于进行了如(6-1-2)式所述的计算:r=k(ax+b)y(6-1-2)a,b,k都为常数。2)、采用上述光电计算单元的第二实施例的方案:第二种方案,相比于第一种方案而言最大的区别在于从p衬底器件更换为了n衬底器件,因此作为所述载流子控制区的控制栅极上加的电压从正压变为了负压,作为所述载流子收集和读出区的n型衬底在曝光时加的电压从负压变成了正压,但载流子读出区漏端电压和入射光子数依旧是一对乘法的关系,因此只需要改变控制栅电压和n型衬底电压,依旧可以实现和第一种方案大体相似的乘法运算。3)、采用上述光电计算单元的第三实施例的方案:在第三种方案中,源漏输出电流符合公式:其中,nelec为作为耦合区的电荷耦合层中收集的光电子,vds为代表所述载流子收集和输出区的p型衬底的漏端电压,因为其二者公式中天生即为乘法的关系,故而可以通过对nelec和vds的调制,用所述的二者关系来进行乘法运算:nelec代表光输入端的输入量,为第一位乘数;vds代表电输入端的输入量,为第二位乘数;同时载流子控制区的控制栅极电压vg加以恒定值,则载流子收集和读出区中读出区的输出电流id即为乘法运算的结果,即等于进行了如(6-3-2)式所述的计算:r=k(ax+b)y(6-3-2)a,b,k都为常数。4)、采用上述光电计算单元的第四实施例的方案:在第四种方案中,源漏输出电流符合公式:其中,xphoto为入射到光电计算单元的有效光子数,vd2为代表所述载流子收集和输出区的读出管的漏端电压,因为其二者公式中天生即为乘法的关系,故而可以通过对xphoto和vd2的调制,用所述的二者关系来进行乘法运算:xphoto代表光输入端的输入量,为第一位乘数;vd2代表电输入端的输入量,为第二位乘数;同时载流子控制区的复位管漏端电压vd1加以恒定值,则载流子收集和读出区中读出区的输出电流id即为乘法运算的结果,即等于进行了如(6-4-3)式所述的计算:r=k(ax+b)y(6-4-3)a,b,k都为常数。采取本方案进行乘法运算,相较于传统乘法运算器有如下优势:1、集成度高,单个光电计算单元就可实现乘法运算,相较于传统乘法器动辄上万晶体管而言有巨大的优势。2、光输入数据具有存储特性,可在断光后长时间保存在器件内,下次运算时无需重新进行光输入。第二种乘法器的方案本发明提出了多种光电计算装置和光电计算方法的具体实现方案,通过使用一个发光单元和上述实施例中所述的光电计算单元,来实现两位乘数的乘法运算。本乘法器的方案最大的优点在于电输入端改为了数字量的串行输入,具有较高的计算精度,缺点在于数据的串行输入输出影响计算速度,并且需要控制系统参与辅助运算。此乘法器的输出端的个数,具体取决于使用的光电计算单元的输出端的个数,例如如果使用具有两个输出端的上述实施例中所述的光电计算单元,则乘法器也具有两个输出端,下文的详细叙述中默认采取有一个输出端的光电计算单元。1)、采用上述光电计算单元的第一实施例的方案:以计算乘法运算a*w为例,计算示意图如图24所示,图中标有v字符的方框单元即代表采用第一种方案的光电计算单元,其中a通过电输入端输入,w通过光输入端输入。首先,将a在控制系统中进行二进制转化:a=a0a1a2......am-1(7-1-1)m取决于电输入端数据的位宽。再通过控制系统,将所述a的二进制数据按比特位,串行的将上述n个二值化的数据以调制过的电压的形式,输入到作为载流子控制区的控制栅上。在第一种方案中,源漏输出电流符合公式:其中,xphoto为入射到光电计算单元的有效光子数,vg为代表控制栅极的电压,当控制栅极输入二值化数据为0时,即等于输入使得无论光输入端数据xphoto等于多少,都足以使得输出电流id等于0的电压值;当控制栅极输入二值化数据为1时,即等于输入恒定的控制栅电压。因为当vg为0时,读出区mosfet内不存在导电沟道,电流为0,输出结果为0,符合电输入端数据0和光输入端数据xphoto的乘法结果;当vg等于一个足以使得读出区mosfet内产生沟道的电压大小时,vds假如也给予恒定值,输出结果只取决于光输入端数据xphoto,其输出结果依旧符合恒定值1和光输入端输入量xphoto乘法的结果。xphoto代表光输入端的输入量,为第一位乘数;串行输入的vg代表电输入端的输入量,为第二位乘数的二值化数据;同时作为载流子收集和读出区的p型衬底的源漏间电压vds给予恒定值,随着vg的串行输入,串行输出的载流子收集和读出区中读出区的输出电流id经过ad转换后,再送入控制系统,在控制系统中按照电输入端输入的比特位进行移位和累加操作,即可获得乘法a*w的运算结果。即等于进行了如(7-1-3)式所述的计算:r=kw(a0*20+a1*21+a2*22+…+am*2m-1+a)(7-1-3)其中a和k都为常数。所述的控制系统,可以是数字电路,也可以是计算机、单片机、fpga等多种逻辑控制单元。2)、采用上述光电计算单元的第二实施例的方案:第二种方案,相比于第一种方案而言最大的区别在于从p衬底器件更换为了n衬底器件,因此作为所述载流子控制区的控制栅极上加的电压从正压变为了负压,作为所述载流子收集和读出区的n型衬底在曝光时加的电压从负压变成了正压,但作为所述载流子控制区的控制栅极上输出的二值化电压和入射光子数依旧是一对乘法的关系,因此只需要对控制栅电压和n型衬底电压进行些许变化,依旧可以实现和第一种方案大体相似的乘法运算。3)、采用上述光电计算单元的第三实施例的方案:以计算乘法运算a*w为例,计算示意图如图24所示,图中标有v字符的方框单元即代表采用第三种方案的光电计算单元,其中a通过电输入端输入,w通过光输入端输入。首先,将a在控制系统中进行二进制转化:a=a0a1a2......am-1(7-3-1)m取决于电输入端数据的位宽。再通过控制系统,将所述a的二进制数据按比特位,串行的将上述n个二值化的数据以调制过的电压的形式,输入到作为载流子控制区的控制栅上。在第三种方案中,源漏输出电流符合公式:其中,nelec为进行电荷耦合层中的光电子数量,vg为代表控制栅极的电压,当控制栅极输入二值化数据为0时,即等于输入使得无论光输入端数据nelec等于多少,都足以使得输出电流id等于0的电压值;当控制栅极输入二值化数据为1时,即等于输入恒定的控制栅电压。因为当vg为0时,浮栅mosfet内不存在导电沟道,电流为0,输出结果为0,符合电输入端数据0和光输入端数据nelec的乘法结果;当vg等于一个足以使得浮栅mosfet内产生沟道的电压大小时,vds假如也给予恒定值,输出结果只取决于光输入端数据nelec,其输出结果依旧符合恒定值1和光输入端输入量nelec乘法的结果。nelec代表光输入端的输入量,为第一位乘数;串行输入的vg代表电输入端的输入量,为第二位乘数的二值化数据;同时作为载流子收集和读出区的p型衬底的源漏间电压vds给予恒定值,随着vg的串行输入,串行输出的载流子收集和读出区中读出区的输出电流id经过ad转换后,再送入控制系统,在控制系统中按照电输入端输入的比特位进行移位和累加操作,即可获得乘法a*w的运算结果。即等于进行了如(7-3-3)式所述的计算:r=kw(a0*20+a1*21+a2*22+…+am*2m-1+a)(7-3-3)其中a和k都为常数。所述的控制系统,可以是数字电路,也可以是计算机、单片机、fpga等多种逻辑控制单元。4)、采用上述光电计算单元的第四实施例的方案:以计算乘法运算a*w为例,计算示意图如图24所示,图中标有v字符的方框单元即代表采用第四种方案的光电计算单元,其中a通过电输入端输入,w通过光输入端输入。首先,将a在控制系统中进行二进制转化:a=a0a1a2......am-1(7-4-1)m取决于电输入端数据的位宽。再通过控制系统,将所述a的二进制数据按比特位,串行的将上述n个二值化的数据以调制过的电压的形式,输入到作为载流子控制区的复位管漏端上。在第四种方案中,源漏输出电流符合公式:其中,xphoto为作为光电子收集和读出区的读出区的光电二极管中收集的光电子数,vd1为代表控制栅极的电压,当控制栅极输入二值化数据为0时,即等于输入使得无论光输入端数据xphoto等于多少,都足以使得输出电流id等于0的电压值;当控制栅极输入二值化数据为1时,即等于输入恒定的控制栅电压。因为当vd1为0时,读出管内不存在导电沟道,电流为0,输出结果为0,符合电输入端数据0和光输入端数据xphoto的乘法结果;当vd1等于一个足以使得读出管内产生沟道的电压大小时,vd2假如也给予恒定值,输出结果只取决于光输入端数据xphoto,其输出结果依旧符合恒定值1和光输入端输入量xphoto乘法的结果。xphoto代表光输入端的输入量,为第一位乘数;串行输入的vd1代表电输入端的输入量,为第二位乘数的二值化数据;同时作为载流子收集和读出区中读出区的读出管的漏端电压vd2给予恒定值,随着vd1的串行输入,串行输出的载流子收集和读出区中读出区的输出电流id经过ad转换后,再送入控制系统,在控制系统中按照电输入端输入的比特位进行移位和累加操作,即可获得乘法a*w的运算结果。即等于进行了如(7-4-3)式所述的计算:r=kw(a0*20+a1*21+a2*22+…+am*2m-1+a)(7-4-3)其中a和k都为常数。所述的控制系统,可以是数字电路,也可以是计算机、单片机、fpga等多种逻辑控制单元。采取本方案进行乘法运算,相较于传统乘法运算器有如下优势:1、集成度高,单个光电计算单元就可实现乘法运算,相较于传统乘法器动辄上万晶体管而言有巨大的优势。2、光输入数据具有存储特性,可在断光后长时间保存在器件内,下次运算时无需重新进行光输入。第三种乘法器的方案本发明提出了多种光电计算装置和光电计算方法的具体实现方案,通过使用至少两个个发光单元和上述实施例中所述的光电计算单元,来实现两位乘数的乘法运算。本乘法器的方案最大的优点在于电输入端改为了数字量的并行输入,具有较高的计算精度,并且有着较上述第二种乘法器更高的运算速度;缺点在于数据的并行输入需要更多的光电计算单元,并且需要控制系统参与辅助运算。此乘法器的输出端的个数,具体取决于使用的光电计算单元的输出端的个数,例如如果使用具有两个输出端的上述实施例中所述的光电计算单元,则乘法器也具有两个输出端,下文的详细叙述中默认采取有一个输出端的光电计算单元。1)、采用上述光电计算单元的第一实施例的方案:以计算乘法运算a*w为例,计算示意图如图25所示,图中一个标有v字符的方框单元即代表一个采用第一种方案的光电计算单元,其中a通过电输入端输入,w通过光输入端输入。首先,将a在控制系统中进行二进制转化:a=a0a1a2......am-1(8-1-1)m和所使用的单元个数相当,取决于电输入端数据的位宽。再通过控制系统,将所述a的二进制转化后的二值化数据,按比特位并行的将上述m个二值化的数据以调制过的电压的形式,输入到m个单元的作为载流子控制区的控制栅上。在第一种方案中,源漏输出电流符合公式:其中,xphoto为入射到光电计算单元的有效光子数,vg为代表控制栅极的电压,当控制栅极输入二值化数据为0时,即等于输入使得无论光输入端数据xphoto等于多少,都足以使得输出电流id等于0的电压值;当控制栅极输入二值化数据为1时,即等于输入恒定的控制栅电压。因为当vg为0时,读出区mosfet内不存在导电沟道,电流为0,输出结果为0,符合电输入端数据0和光输入端数据xphoto的乘法结果;当vg等于一个足以使得读出区mosfet内产生沟道的电压大小时,vds假如也给予恒定值,输出结果只取决于光输入端数据xphoto,其输出结果依旧符合恒定值1和光输入端输入量xphoto乘法的结果。xphoto代表光输入端的输入量,为第一位乘数;并行输入的vg代表电输入端的输入量,为第二位乘数的二值化数据;同时作为载流子收集和读出区的p型衬底的源漏间电压vds给予恒定值,随着vg的并行输入,并行输出的载流子收集和读出区中读出区的输出电流id经过ad转换后,再送入控制系统,在控制系统中按照电输入端输入的比特位进行移位和累加操作,即可获得乘法a*w的运算结果。即等于进行了如(8-1-3)式所述的计算:r=kw(a0*20+a1*21+a2*22+…+am*2m-1+a)(8-1-3)其中a和k都为常数。所述的控制系统,可以是数字电路,也可以是计算机、单片机、fpga等多种逻辑控制单元。2)、采用上述光电计算单元的第二实施例的方案:第二种方案,相比于第一种方案而言最大的区别在于从p衬底器件更换为了n衬底器件,因此作为所述载流子控制区的控制栅极上加的电压从正压变为了负压,作为所述载流子收集和读出区的n型衬底在曝光时加的电压从负压变成了正压,但作为所述载流子控制区的控制栅极上输出的二值化电压和入射光子数依旧是一对乘法的关系,因此只需要对控制栅电压和n型衬底电压进行些许变化,依旧可以实现和第一种方案大体相似的乘法运算。3)、采用上述光电计算单元的第三实施例的方案:以计算乘法运算a*w为例,计算示意图如图25所示,图中一个标有v字符的方框单元即代表一个采用第三种方案的光电计算单元,其中a通过电输入端输入,w通过光输入端输入。首先,将a在控制系统中进行二进制转化:a=a0a1a2......am-1(8-3-1)m和所使用的单元个数相当,取决于电输入端数据的位宽。再通过控制系统,将所述a的二进制转化后的二值化数据,按比特位并行的将上述m个二值化的数据以调制过的电压的形式,输入到m个单元的作为载流子控制区的控制栅上。在第三种方案中,源漏输出电流符合公式:其中,nelec为进行电荷耦合层中的光电子数量,vg为代表控制栅极的电压,当控制栅极输入二值化数据为0时,即等于输入使得无论光输入端数据nelec等于多少,都足以使得输出电流id等于0的电压值;当控制栅极输入二值化数据为1时,即等于输入恒定的控制栅电压。因为当vg为0时,浮栅mosfet内不存在导电沟道,电流为0,输出结果为0,符合电输入端数据0和光输入端数据nelec的乘法结果;当vg等于一个足以使得浮栅mosfet内产生沟道的电压大小时,vds假如也给予恒定值,输出结果只取决于光输入端数据nelec,其输出结果依旧符合恒定值1和光输入端输入量nelec乘法的结果。nelec代表光输入端的输入量,为第一位乘数;并行输入的vg代表电输入端的输入量,为第二位乘数的二值化数据;同时作为载流子收集和读出区的p型衬底的源漏间电压vds给予恒定值,随着vg的并行输入,并行输出的载流子收集和读出区中读出区的输出电流id经过ad转换后,再送入控制系统,在控制系统中按照电输入端输入的比特位进行移位和累加操作,即可获得乘法a*w的运算结果。即等于进行了如(8-3-3)式所述的计算:r=kw(a0*20+a1*21+a2*22+…+am*2m-1+a)(8-3-3)其中a和k都为常数。所述的控制系统,可以是数字电路,也可以是计算机、单片机、fpga等多种逻辑控制单元。4)、采用上述光电计算单元的第四实施例的方案:以计算乘法运算a*w为例,计算示意图如图25所示,图中一个标有v字符的方框单元即代表一个采用第四种方案的光电计算单元,其中a通过电输入端输入,w通过光输入端输入。首先,将a在控制系统中进行二进制转化:a=a0a1a2......am-1(8-4-1)m和所使用的单元个数相当,取决于电输入端数据的位宽。再通过控制系统,将所述a的二进制转化后的二值化数据,按比特位并行的将上述m个二值化的数据以调制过的电压的形式,输入到m个单元的作为载流子控制区的复位管漏端上。在第四种方案中,源漏输出电流符合公式:其中,xphoto为作为光电子收集和读出区的读出区的光电二极管中收集的光电子数,vd1为代表控制栅极的电压,当控制栅极输入二值化数据为0时,即等于输入使得无论光输入端数据xphoto等于多少,都足以使得输出电流id等于0的电压值;当控制栅极输入二值化数据为1时,即等于输入恒定的控制栅电压。因为当vd1为0时,读出管内不存在导电沟道,电流为0,输出结果为0,符合电输入端数据0和光输入端数据xphoto的乘法结果;当vd1等于一个足以使得读出管内产生沟道的电压大小时,vd2假如也给予恒定值,输出结果只取决于光输入端数据xphoto,其输出结果依旧符合恒定值1和光输入端输入量xphoto乘法的结果。xphoto代表光输入端的输入量,为第一位乘数;并行输入的vd1代表电输入端的输入量,为第二位乘数的二值化数据;同时作为载流子收集和读出区中读出区的读出管的漏端电压vd2给予恒定值,随着vd1的并行输入,并行输出的载流子收集和读出区中读出区的输出电流id经过ad转换后,再送入控制系统,在控制系统中按照电输入端输入的比特位进行移位和累加操作,即可获得乘法a*w的运算结果。即等于进行了如(8-4-3)式所述的计算:r=kw(a0*20+a1*21+a2*22+…+am*2m-1+a)(8-4-3)其中a和k都为常数。所述的控制系统,可以是数字电路,也可以是计算机、单片机、fpga等多种逻辑控制单元。采取本方案进行乘法运算,相较于传统乘法运算器有如下优势:1、集成度高,数个光电计算单元就可实现乘法运算,相较于传统乘法器动辄上万晶体管而言有巨大的优势。2、光输入数据具有存储特性,可在断光后长时间保存在器件内,下次运算时无需重新进行光输入。第四种乘法器的方案本发明提出了多种光电计算装置和光电计算方法的具体实现方案,通过使用至少两个个发光单元和上述实施例中所述的光电计算单元,来实现两位乘数的乘法运算。本乘法器的方案最大的优点在于实现了位权的参与运算,相较于上述第二、三种乘法器的方案,不需要控制系统辅助计算;缺点在于本质上还是两路模拟输入的乘法,精度会低于上述第二、三种乘法器的方案。此乘法器的输出端的个数,具体取决于使用的光电计算单元的输出端的个数,例如如果使用具有两个输出端的上述实施例中所述的光电计算单元,则乘法器也具有两个输出端,下文的详细叙述中默认采取有一个输出端的光电计算单元。采用上述光电计算单元的第一实施例的方案:以计算乘法运算a*w为例,计算示意图如图26所示,图中一个标有v字符的方框单元即代表一个采用第一种方案的光电计算单元,其中a通过电输入端输入,w通过光输入端输入。首先,将a在控制系统中进行二进制转化:a=a0a1a2......am-1(9-1-1)m和所使用的单元个数相当,取决于电输入端数据的位宽。再通过控制系统,将所述a的二进制转化后的二值化数据,按比特位并行的将上述m个二值化的数据以调制过的电压的形式,输入到m个单元的作为载流子控制区的控制栅上。在第一种方案中,源漏输出电流符合公式:其中,xphoto为入射到光电计算单元的有效光子数,vg为代表控制栅极的电压,vds为作为所述载流子控制和输出区的p型衬底源漏间电压。当控制栅极输入二值化数据为0时,即等于输入使得无论光输入端数据xphoto等于多少,都足以使得输出电流id等于0的电压值;当控制栅极输入二值化数据为1时,即等于输入恒定的控制栅电压。因为当vg为0时,读出区mosfet内不存在导电沟道,电流为0,输出结果为0,符合电输入端数据0和光输入端数据xphoto的乘法结果;当vg等于一个足以使得读出区mosfet内产生沟道的电压大小时,vds假如也给予恒定值,输出结果只取决于光输入端数据xphoto,其输出结果依旧符合恒定值1和光输入端输入量xphoto乘法的结果。同时式(9-1-2)中,vds和vg、xphoto天生即为相乘的关系,因此在p型衬底源漏间输入和并行输入的控制栅上二值化数据对应的比特位相对应的位权20、21、22......2m-1,即等同于进行了移位操作,之后直接通过电流汇聚的方式完成累加运算,即可无需控制系统操作,就可完成一个完整的乘法运算。xphoto代表光输入端的输入量,为第一位乘数;并行输入的vg代表电输入端的输入量,为第二位乘数的二值化数据;同时作为载流子收集和读出区的p型衬底的源漏间电压vds给予和二值化数据相应比特位位权相当的调制过的电压,随着vg的并行输入,并行输出的载流子收集和读出区中读出区的输出电流id经汇聚完成相加操作,再通过ad转换后送入控制系统,即可获得乘法a*w的运算结果。即等于进行了如(9-1-3)式所述的计算:r=kw(a0*20+a1*21+a2*22+…+am*2m-1+a)(9-1-3)其中a和k都为常数。所述的控制系统,可以是数字电路,也可以是计算机、单片机、fpga等多种逻辑控制单元。2)、采用上述光电计算单元的第二实施例的方案:第二种方案,相比于第一种方案而言最大的区别在于从p衬底器件更换为了n衬底器件,因此作为所述载流子控制区的控制栅极上加的电压从正压变为了负压,作为所述载流子收集和读出区的n型衬底在曝光时加的电压从负压变成了正压,但作为所述载流子控制区的控制栅极上输出的二值化电压和入射光子数依旧是一对乘法的关系,因此只需要对控制栅电压和n型衬底电压进行些许变化,依旧可以实现和第一种方案大体相似的乘法运算。3)、采用上述光电计算单元的第三实施例的方案:以计算乘法运算a*w为例,计算示意图如图26所示,图中一个标有v字符的方框单元即代表一个采用第三种方案的光电计算单元,其中a通过电输入端输入,w通过光输入端输入。首先,将a在控制系统中进行二进制转化:a=a0a1a2......am-1(9-3-1)m和所使用的单元个数相当,取决于电输入端数据的位宽。再通过控制系统,将所述a的二进制转化后的二值化数据,按比特位并行的将上述m个二值化的数据以调制过的电压的形式,输入到m个单元的作为载流子控制区的控制栅上。在第三种方案中,源漏输出电流符合公式:其中,nelec为进行电荷耦合层中的光电子数量,vg为代表控制栅极的电压,当控制栅极输入二值化数据为0时,即等于输入使得无论光输入端数据nelec等于多少,都足以使得输出电流id等于0的电压值;当控制栅极输入二值化数据为1时,即等于输入恒定的控制栅电压。因为当vg为0时,浮栅mosfet内不存在导电沟道,电流为0,输出结果为0,符合电输入端数据0和光输入端数据nelec的乘法结果;当vg等于一个足以使得浮栅mosfet内产生沟道的电压大小时,vds假如也给予恒定值,输出结果只取决于光输入端数据nelec,其输出结果依旧符合恒定值1和光输入端输入量nelec乘法的结果。同时式(9-3-2)中,vds和vg、nelec天生即为相乘的关系,因此在p型衬底源漏间输入和并行输入的控制栅上二值化数据对应的比特位相对应的位权20、21、22......2m-1,即等同于进行了移位操作,之后直接通过电流汇聚的方式完成累加运算,即可无需控制系统操作,就可完成一个完整的乘法运算。nelec代表光输入端的输入量,为第一位乘数;并行输入的vg代表电输入端的输入量,为第二位乘数的二值化数据;同时作为载流子收集和读出区的p型衬底的源漏间电压vds给予和二值化数据相应比特位位权相当的调制过的电压,随着vg的并行输入,并行输出的载流子收集和读出区中读出区的输出电流id经汇聚完成相加操作,再通过ad转换后送入控制系统,即可获得乘法a*w的运算结果。即等于进行了如(9-3-3)式所述的计算:r=kw(a0*20+a1*21+a2*22+…+am*2m-1+a)(9-3-3)其中a和k都为常数。所述的控制系统,可以是数字电路,也可以是计算机、单片机、fpga等多种逻辑控制单元。4)、采用上述光电计算单元的第四实施例的方案:以计算乘法运算a*w为例,计算示意图如图26所示,图中一个标有v字符的方框单元即代表一个采用第四种方案的光电计算单元,其中a通过电输入端输入,w通过光输入端输入。首先,将a在控制系统中进行二进制转化:a=a0a1a2......am-1(9-4-1)m和所使用的单元个数相当,取决于电输入端数据的位宽。再通过控制系统,将所述a的二进制转化后的二值化数据,按比特位并行的将上述m个二值化的数据以调制过的电压的形式,输入到m个单元的作为载流子控制区的复位管漏端上。在第四种方案中,源漏输出电流符合公式:其中,xphoto为作为光电子收集和读出区的读出区的光电二极管中收集的光电子数,vd1为代表控制栅极的电压,当控制栅极输入二值化数据为0时,即等于输入使得无论光输入端数据xphoto等于多少,都足以使得输出电流id等于0的电压值;当控制栅极输入二值化数据为1时,即等于输入恒定的控制栅电压。因为当vd1为0时,读出管内不存在导电沟道,电流为0,输出结果为0,符合电输入端数据0和光输入端数据xphoto的乘法结果;当vd1等于一个足以使得读出管内产生沟道的电压大小时,vd2假如也给予恒定值,输出结果只取决于光输入端数据xphoto,其输出结果依旧符合恒定值1和光输入端输入量xphoto乘法的结果。同时式(9-4-2)中,vds和vg、xphoto天生即为相乘的关系,因此在读出管的漏端输入和并行输入的控制栅上二值化数据对应的比特位相对应的位权20、21、22......2m-1,即等同于进行了移位操作,之后直接通过电流汇聚的方式完成累加运算,即可无需控制系统操作,就可完成一个完整的乘法运算。xphoto代表光输入端的输入量,为第一位乘数;并行输入的vd1代表电输入端的输入量,为第二位乘数的二值化数据;同时作为载流子收集和读出区中读出区的读出管的漏端电压vd2给予和二值化数据相应比特位位权相当的调制过的电压,随着vd1的并行输入,并行输出的载流子收集和读出区中读出区的输出电流id经汇聚完成相加操作,再通过ad转换后送入控制系统,即可获得乘法a*w的运算结果。即等于进行了如(9-4-3)式所述的计算:r=kw(a0*20+a1*21+a2*22+…+am*2m-1+a)(9-4-3)其中a和k都为常数。所述的控制系统,可以是数字电路,也可以是计算机、单片机、fpga等多种逻辑控制单元。采取本方案进行乘法运算,相较于传统乘法运算器有如下优势:1、集成度高,数个光电计算单元就可实现乘法运算,相较于传统乘法器动辄上万晶体管而言有巨大的优势。2、光输入数据具有存储特性,可在断光后长时间保存在器件内,下次运算时无需重新进行光输入。向量加法器的方案,对应权利要求23、24本发明提出了多种光电计算装置和光电计算方法的具体实现方案,通过使用多个上述第一、二、三种加法器之一所述的光电计算加法器,来实现至少两个维度至少为二的向量的向量加法运算。1)、采用上述第一种加法器的方案:对于上述第一种加法器,等效于进行运算:r=d(ax+by+c)(10-1-1)其中,r为加法运算结果,xphoto为光输入端输入量,y为电输入端输入量,d、a、b和c都为和单元参数有关的常数。向量加法,即为两个维度相同的待加向量对应序号的元素一一相加,得到一个维度和待加向量相同的结果向量,以两个维度为k的待加向量的加法运算a+b为例:r=a+b=(a0+b0,a1+b1......ak-1+bk-1)(10-1-2)从式(10-1-2)可以看出,向量加法运算可以拆分成k个两位输入的单独加法运算,因此使用k个上述第一种加法器,可以组成向量加法器,如图27所示,其中,每一个中间写有“v加法器”的方框都代表一个单独的上述第一种加法器。将待加向量输入控制系统,在控制系统中将待加向量拆分成一个个独立元素,并将序号相同的元素作为同一个加法器的两位加数输入,输入同一个加法器;完成加法运算后,再将运算结果输入回控制系统,重新按照元素序号组成结果向量,即完成了完整的向量加法运算。因为上述第一种加法器只能支持两位加数的输入,因此本方案的向量加法器也只能支持两个待加向量的输入。所述的控制系统,可以是数字电路,也可以是计算机、单片机、fpga等多种逻辑控制单元。2)、采用上述第二种加法器的方案:对于上述第二种加法器,等效于进行运算:r=b(ax+k1y1+k2y2......knyn+c)(10-2-1)其中,r为加法运算结果,xphoto光输入端输入量,y1到yn为多载流子控制区电输入端输入量,b、a、c和k1到kn都为和加法器单元参数有关的常数。向量加法,即为两个维度相同的待加向量对应序号的元素一一相加,得到一个维度和待加向量相同的结果向量,以n个维度为m的待加向量的加法运算a1+a2...+an为例:r=a1+a2...an=(a10+a20...+an0,......,a1m+a2m...+anm)(10-2-2)从式(10-2-2)可以看出,n个向量加法运算可以拆分成m个n位加数输入的单独加法运算,因此使用n个上述第二种加法器,可以组成向量加法器,如图27所示,其中,每一个中间写有“v加法器”的方框都代表一个单独的上述第二种加法器。将待加向量输入控制系统,在控制系统中将待加向量拆分成一个个独立元素,并将序号相同的元素作为同一个加法器的两位加数输入,输入同一个加法器;完成加法运算后,再将运算结果输入回控制系统,重新按照元素序号组成结果向量,即完成了完整的向量加法运算。所述的控制系统,可以是数字电路,也可以是计算机、单片机、fpga等多种逻辑控制单元。3)、采用上述第三种加法器的方案:对于上述第三种加法器,等效于进行运算:r=k(ax1+ax2...+atxn+c)(10-3-1)其中,r为加法运算结果,x1到xn为多个单独光电计算单元的光输入端输入量,n和使用的并联光电计算单元数量相当,a、c和k都为和加法器单元参数有关的常数。上述第三种加法器,和上述第二种加法器相同,可以进行加数大于2的加法运算,因此采用上述第三种加法器组成的向量加法器和采用上述第二种加法器组成的向量加法器方案相似,不再重复叙述。采取本方案进行向量加法运算,相较于传统向量加法运算器有如下优势:1、集成度高,数个光电计算单元就可实现向量加法运算。2、输入数据具有存储特性,可在断光后长时间保存在器件内,下次运算时无需重新进行光输入。向量点乘器的方案本发明提出了多种光电计算装置和光电计算方法的具体实现方案,通过使用上述多种种乘法器之一所述的光电计算乘法器,来实现两个维度至少为二的向量的向量点乘运算。1)、采用上述第一种乘法器的方案:对于上述第一种乘法器,等效于进行运算:r=c(ax+b)y(11-1-1)其中,r为乘法运算结果,x为光输入端输入量,y为电输入端输入量,c、a、b都为和单元参数有关的常数。向量点乘,即为两个维度相同的待乘向量对应序号的元素一一相乘,得到一个维度和待乘向量相同的结果向量,以两个维度为k的待乘向量的乘法运算a·b为例:r=a·b=(a0*b0,a1*b1......ak-1*bk-1)(11-1-2)从式(11-1-2)可以看出,向量点乘运算可以拆分成k个两位输入的单独乘法运算,因此使用k个上述第一种乘法器,可以组成向量点乘器,图27所示的向量加法器,只需要将图中每一个中间写有“v加法器”的方框都改为“v乘法器”,代表一个单独的上述第一种乘法器,即可进行所述向量点乘运算。将待乘向量输入控制系统,在控制系统中将待乘向量拆分成一个个独立元素,并将序号相同的元素作为同一个乘法器的两位乘数输入,输入同一个乘法器;完成乘法运算后,再将运算结果输入回控制系统,重新按照元素序号组成结果向量,即完成了完整的向量点乘运算。因为上述第一种乘法器只能支持两位加数的输入,因此本方案的向量加法器也只能支持两个待加向量的输入,如需进行多个待乘向量输入的点乘运算只需进行多次两两点乘运算即可。所述的控制系统,可以是数字电路,也可以是计算机、单片机、fpga等多种逻辑控制单元。2)、采用上述第二、三、四种乘法器的方案:上述第二、三、四种乘法器,和上述第一种乘法器相似,支持两位乘数输入的乘法运算,使用上述三种乘法器组成向量点乘器的方案和使用第一种乘法器组成向量点乘器方案类似,不再重复阐述。采取本方案进行向量点乘运算,相较于传统向量点乘运算器有如下优势:1、集成度高,数个光电计算单元就可实现向量点乘运算。2、光输入数据具有存储特性,可在断光后长时间保存在器件内,下次运算时无需重新进行光输入。高位宽乘法器的方案本发明提出了多种光电计算装置和光电计算方法的具体实现方案,通过使用上述多种种乘法器之一所述的光电计算乘法器,来实现两个高位宽乘数的乘法运算。1)、采用上述第一种乘法器的方案:对于上述第一种乘法器,等效于进行运算:r=c(ax+b)y(12-1-1)其中,r为乘法运算结果,x为光输入端输入量,y为电输入端输入量,c、a、b都为和单元参数有关的常数。高位宽乘法,即为先将两个高位宽乘数按比特位拆分,再按照高低位依次两两相乘后,再将结果移位后相加,完成完整的高位宽乘法运算。以两个高位宽乘数a*b为例,将高位宽乘数拆分成多个位宽为k的低位宽乘数,再进行高低位相乘:从式(12-1-2)可以看出,高位宽乘法分为以下步骤:1)高位宽乘数拆分;2)高低位交叉相乘;3)交叉相乘结果移位;4)移位结果累加。使用控制系统进行拆分和移位累加工作,使用(n-1)*(m-1)个上述第一种乘法器进行高低位交叉相乘运算,即可实现完整的高位宽乘法,如图28所述,图中每一个写有“v乘法器”的方框即表示一个上述第一种乘法器,以及此乘法器的输出在控制系统中需要完成的移位位数,实线表示数据输入,虚线表示数据累加。将待乘的高位宽乘数输入控制系统,在控制系统中将高位宽乘数按比特位拆分成两组低位宽乘数,并将两组低位宽乘数两两组合,输入不同的乘法器;完成乘法运算后,再将运算结果输出回控制系统,按照两个输入低位宽乘数的比特位进行相应的移位操作,再将移位后的结果累加,即完成了完整的向量点乘运算。所述的控制系统,可以是数字电路,也可以是计算机、单片机、fpga等多种逻辑控制单元。2)、采用上述第二、三、四种乘法器的方案:上述第二、三、四种乘法器,和上述第一种乘法器相似,支持两位乘数输入的乘法运算,使用上述三种乘法器组成高位宽乘法器的方案和使用上述第一种乘法器组成高位宽乘法器方案类似,不再重复阐述。采取本方案进行高位宽乘法运算,相较于传统高位宽乘法器有如下优势:1、集成度高,数个光电计算单元就可实现高位宽乘法运算。2、光输入数据具有存储特性,可在断光后长时间保存在器件内,下次运算时无需重新进行光输入。串行矩阵向量乘法器的方案本发明提出了多种光电计算装置和光电计算方法的具体实现方案,通过使用多个发光单元和上述实施例中所述的光电计算单元,来实现维度符合矩阵向量乘法规则的一个矩阵和一个向量的乘法运算。此矩阵向量乘法器的输出端的个数,具体取决于使用的光电计算单元的输出端的个数,例如如果使用具有两个输出端的上述实施例中所述的光电计算单元,则矩阵向量乘法器也具有两个输出端,下文的详细叙述中默认采取有一个输出端的光电计算单元。本发明需要使用的光电计算单元数默认应与待乘矩阵中元素的个数相当,所述矩阵包含向量,即矩阵如果为3行1列,则使用的光电计算单元数目则为3,但如果光电计算单元的数目大于矩阵中元素的数目,如使用6个光电计算单元排成3行2列,则不影响运算。1)、采用上述光电计算单元的第一实施例的方案:以计算向量a和矩阵w的乘法运算a*w为例,其中a为n*1向量,w为m*n矩阵,如式(13-1-1),计算示意图如图29所示,图中标有v字符的方框单元即代表采用第一种方案的光电计算单元,其中向量a中的元素通过电输入端输入,矩阵w中的元素通过光输入端输入。首先,类似于上述第二种乘法器所述的串行输入乘法器的电输入方式,将a每一个的元素在控制系统中进行二进制转化:k取决于向量中单个元素的位宽。将采用根据上述第一实施例的光电计算单元,按照如图29所示的形式排列成阵列,其中阵列的行数为n,列数为m,并且将所述阵列的所有同一行的光电计算单元的作为所述载流子控制区的控制栅极都相连,输入同样的电输入数据;将所述阵列的所有同一列的光电计算单元的作为所述载流子收集和读出区的p型衬底的输出端都相连,使得输出的电流汇聚相加。输入时,将矩阵中的m*n个数据,通过光输入端依次输入到m*n个光电计算单元中;将向量中的元素从同行单元相连的控制栅极上串行输入,同一元素不同比特位的二值数据分时依次输入,当控制栅上输入的是最低比特位的数据时,矩阵中的元素和向量中元素的最低比特位的二值数据进行对应位的相乘,即等于进行了运算(13-1-3):电流汇聚前,n*m的光电计算单元阵列,每一个单元的计算结果分别为:再经每一列的输出端都相连的输出电流电路,即等于进行了按列相加运算,结果(13-1-4)经汇聚相加后,最下方的矩阵向量乘法输出端输出为:此结果即为式(13-1-3)的运算结果,完成了向量最低比特位和矩阵的矩阵向量乘法运算。将计算结果(13-1-5)经过ad转换后输入控制系统,因为其为最低比特位故而左移0位,再将向量的第二低比特位作为电输入端数据输入控制栅极,得到向量第二低比特位和矩阵的矩阵向量乘法结果,输入控制系统后左移1位,并与之前所述向量最低比特位和矩阵乘法结果进行向量加法,以此类推,串行输入完向量的所有比特位二值数据,在控制系统后依次移位和累加后,即得到最终的矩阵向量运算结果,等同于进行了如下运算:所述的控制系统,可以是数字电路,也可以是计算机、单片机、fpga等多种逻辑控制单元。2)、采用根据上述第二、三、四实施例的光电计算单元的方案:第二、三、四种方案,和第一种方案相似,同样可以通过串行输入的方式,完成两个乘数输入的乘法运算,如上述第二种乘法器所述,因此前文所述的使用第一种方案光电计算单元组成的矩阵向量乘法器,改为使用第二、三、四种方案所述光电计算单元构成的矩阵向量乘法器也同样可以完成运算,唯一的区别只在于:1)假如使用第二种光电计算单元方案,则因为p衬底器件更换为了n衬底器件,控制栅极和衬底上的电压极性反转了,其大小也需重新调制。2)假如使用第三种光电计算单元方案,则因为光输入方式的改变,从p型衬底的收集变为了电荷耦合层的收集,因此光输入量需要重新调制。3)假如使用第四种光电计算单元方案,则并接的载流子控制区不再是控制栅极,而是复位管漏端。采取本方案进行矩阵向量乘法运算,相较于传统矩阵向量乘法器有如下优势:1、集成度高,数个光电计算单元就可实现矩阵向量乘法运算。2、光输入数据具有存储特性,可在断光后长时间保存在器件内,下次运算时无需重新进行光输入。并行矩阵向量乘法器的方案本发明提出了多种光电计算装置和光电计算方法的具体实现方案,通过使用多个发光单元和上述实施例中所述的光电计算单元,来实现维度符合矩阵向量乘法规则的一个矩阵和一个向量的乘法运算。本发明提出的实现方案和上述串行矩阵向量乘法器的区别在于使用更多的光电计算单元和发光单元组成阵列,通过并行输入的方式输入向量中元素的二值化数据,运算速度更高,但是需要更多的单元。此矩阵向量乘法器的输出端的个数,具体取决于使用的光电计算单元的输出端的个数,例如如果使用具有两个输出端的上述实施例中所述的光电计算单元,则矩阵向量乘法器也具有两个输出端,下文的详细叙述中默认采取有一个输出端的光电计算单元。本发明需要使用的光电计算单元数默认应与待乘矩阵中元素的个数乘以单个元素的位宽的结果相等,所述矩阵包含向量,但如果光电计算单元的数目大于矩阵中元素的数目,则不影响运算。1)、采用上述光电计算单元的第一实施例的方案:以计算向量a和矩阵w的乘法运算a*w为例,其中a为n*1向量,w为m*n矩阵,如式(13-1-1),其中向量a中的元素通过电输入端输入,矩阵w中的元素通过光输入端输入。首先,类似于上述第三种乘法器所述的并行输入乘法器的电输入方式,将a每一个的元素在控制系统中进行二进制转化:k取决于向量中单个元素的位宽。将采用根据上述第一实施例的光电计算单元,总共需使用k*m*n个单元,将上述单元分成k组,每个组的单元m*n个,将每一组的单元排列成和上述串行矩阵向量乘法器阵列相同的阵列,即按照图30所示的形式排列成阵列,总共k个上述阵列,每个阵列的行数为n,列数为m,并且将所述所有组的所有阵列的所有同一行的光电计算单元的作为所述载流子控制区的控制栅极都相连,输入同样的电输入数据;将所述所有组的所有阵列的所有同一列的光电计算单元的作为所述载流子收集和读出区的p型衬底的输出端都相连,使得输出的电流汇聚相加。输入时,将矩阵中的m*n个数据,通过光输入端依次输入到每一组的m*n个光电计算单元中,所有组的阵列输入相同的光输入端数据;将向量中的元素从同行单元相连的控制栅极上并行输入。向量中各元素的第零比特位,即(a00,a10,...,an0)将上述二值矩阵的每一个元素分别输入第0组阵列的各行的控制栅上,同样,后续第i比特位,输入到第i组阵列的控制栅上,将二值化后的向量数据一一并行输入到k组阵列的全部控制栅上。对于第0组阵列,矩阵中的元素和向量中元素的第零比特位的二值数据进行对应位的相乘,即等于进行了运算(14-1-3):电流汇聚前,第零组n*m的光电计算单元阵列每一个单元的计算结果分别为:再经每一列的输出端都相连的输出电流电路,即等于进行了按列相加运算,结果(14-1-4)经汇聚相加后,最下方的第零组阵列输出端输出为:此结果即为式(14-1-3)的运算结果,完成了向量第零比特位和矩阵的矩阵向量乘法运算。和上述第零组阵列的计算过程相似,其他第1到第k-1组阵列分别从每一行的控制栅上输入向量第1比特位到第k-1比特位的二值化数据,分别输出相应的矩阵向量乘法结果后从输出端输出,再将k组的计算结果经过ad转换后输入控制系统,第i组阵列的结果向量所有元素左移i位,然后在控制系统中将完成移位后的所有组的输出结果按照向量加法的规则累加,即得到最终的矩阵向量运算结果,等同于进行了如下运算:运算的过程,如图31所示,其中图中的每一个中间写有“串行矩阵向量乘法器”的方框即代表一个n*m的单元阵列,装置的示意图,大致如图31所示。所述的控制系统,可以是数字电路,也可以是计算机、单片机、fpga等多种逻辑控制单元。2)、采用根据上述第二、三、四实施例的光电计算单元的方案:第二、三、四种方案,和第一种方案相似,同样可以通过并行输入的方式,完成两个乘数输入的乘法运算,如上述第三种乘法器所述,因此前文所述的使用第一种方案光电计算单元组成的矩阵向量乘法器,改为使用第二、三、四种方案所述光电计算单元构成的矩阵向量乘法器也同样可以完成运算,唯一的区别只在于:1)假如使用第二种光电计算单元方案,则因为p衬底器件更换为了n衬底器件,控制栅极和衬底上的电压极性反转了,其大小也需重新调制。2)假如使用第三种光电计算单元方案,则因为光输入方式的改变,从p型衬底的收集变为了电荷耦合层的收集,因此光输入量需要重新调制。3)假如使用第四种光电计算单元方案,则并接的载流子控制区不再是控制栅极,而是复位管漏端。采取本方案进行矩阵向量乘法运算,相较于传统矩阵向量乘法器有如下优势:1、集成度高,数个光电计算单元就可实现矩阵向量乘法运算。2、光输入数据具有存储特性,可在断光后长时间保存在器件内,下次运算时无需重新进行光输入。池化运算器的方案本发明提出了多种光电计算装置和光电计算方法的具体实现方案,通过使用向量点乘器、12之一所述的光电矩阵向量乘法器,来实现平均池化运算。1)、采用上述向量点乘器的方案:对于上述向量点乘器,等效于进行运算:其中,a为向量输入端,即电输入端输入的向量数据,通过串行的方式输入,w为矩阵输入端,即电输入端输入的数据,输出的结果为m*1维度的向量。池化运算包含很多类运算,例如平均池化、最大池化等,本发明所述的池化运算器,只针对平均池化运算。平均池化,即求平均数,例如式(15-1-2)从式(13-1-2)可以看出,平均池化运算可以等效为下面的向量相乘运算:因此,使用适合运算矩阵输入端数据维度为n列1行矩阵(向量)的如上述向量点乘器,使用n*1个所述的光电计算单元,即可完成上述运算。首先通过控制系统,判断待池化矩阵中元素的个数,再在控制系统中将待池化矩阵所有元素都拆散,再重新组合成一维向量,从所述矩阵向量乘法器的向量输入端输入,再通过光输入端对矩阵向量乘法器中所有单元输入相同的相当于矩阵中元素个数的倒数的光输入端数据,所述矩阵向量乘法器的输出端的一个输出量即待池化矩阵的平均池化运算结果。所述的控制系统,可以是数字电路,也可以是计算机、单片机、fpga等多种逻辑控制单元。2)、采用上述高位宽乘法器的方案:上述高位宽乘法器,和上述向量点乘器相似,唯一不同的区别在于向量输入端数据为并行输入,运算速度更快但需要更多的光电计算单元,如果使用上述高位宽乘法器来计算式(15-1-3),则需要4*k个光电计算单元,k为待池化矩阵a中元素的位宽,而使用上述向量点乘器来计算则只需要4个光电计算单元。采取本方案进行池化运算,相较于传统池化运算器有如下优势:1、集成度高,数个光电计算单元就可实现池化运算。2、光输入数据具有存储特性,可在断光后长时间保存在器件内,下次运算时无需重新进行光输入,针对池化运算中多次运算平均池化分母不变尤为有优势。卷积运算器的方案本发明提出了多种光电计算装置和光电计算方法的具体实现方案,通过使用多个发光单元和上述实施例中所述的光电计算单元,来实现矩阵的卷积运算。此卷积运算器的输出端的个数,具体取决于使用的光电计算单元的输出端的个数,例如如果使用具有两个输出端的上述实施例中所述的光电计算单元,则卷积运算器也具有两个输出端,下文的详细叙述中默认采取有一个输出端的光电计算单元。同上述串行、并行矩阵向量乘法器的方案相同,如果使用的光电计算单元数目大于实际所需的个数,并不影响运算结果的正确性。1)、采用上述光电计算单元的第一实施例的方案:以矩阵a的针对于卷积核a的卷积运算为例,简单介绍下卷积运算的过程,其中a为10*10矩阵,a为3*3的卷积核,步长为1,如式(16-1-1):卷积运算的规则,是待卷积矩阵在卷积核的映射下和卷积核中元素一一作用,再按照相应的步长移动卷积核,进行下一次映射,如图32所示,要求解(16-1-1)中的卷积运算,需要进行以下几个步骤:1)补零操作:将待卷积矩阵a从10*10矩阵扩展为12*12矩阵,即在0行之上,0列之左,10行之下和10列之又各添加一行/列,添加的行列中的元素全部为0,故而叫补零,经过后,矩阵a变为矩阵a0,如(16-1-2):2)确定初始卷积核位置:卷积核的初始位置和矩阵a的最左上角重合,即卷积核a的3行3列分别对应矩阵a0的第0、1、2行和第0、1、2列,再将卷积核中的元素和与卷积核对应位置的矩阵a0中的元素一一相乘,如式(16-1-3),变为9个乘法结果,再将所述9个乘法结果全部累加,得到当前卷积核位置的卷积运算结果,叫做r00,即为完成(16-1-4)所述运算:(a00*0)+(a01*0)+(a02*0)+(a10*0)+(a11*a00)+(a12*a01)+(a20*0)+(a21*a10)+(a22*a11)=r00(16-1-4)3)移动卷积核的位置:因为事先约定了,此次卷积运算的步长为1,因此将卷积核的位置左移1列,即左移1列后卷积核a的3行3列分别对应矩阵a0的第0、1、2行和第1、2、3列,之后再在当前位置下进行卷积运算,将卷积运算结果叫做r014)待卷积核遍历整个矩阵a0后,一共可以得到(10+2-2)2个卷积结果,将所述卷积结果按照对应的卷积核位置排列为矩阵,得到(16-1-5)上述矩阵r,即为带卷积矩阵a,在卷积核a的作用下进行步长为1的卷积运算的结果。从上述卷积运算的步骤中可以看出,卷积运算即为多次两个矩阵对应元素两两相乘再累加的运算,其中所述元素两两相乘的两个矩阵,其中一个矩阵为卷积核,为在多次运算中不变的量,另一个矩阵为带卷积矩阵与卷积核位置对应的元素,在多次运算中为变化的量,因此可以利用发明1所述的采用第一种光电计算单元方案的光电计算单元,发挥光输入存储可以存储数据这一优势特性,采用光输入端输入卷积核数据,并通过电输入端输入带卷积矩阵数据进行卷积运算,这样可以极大提高能效比和运算速度。因此,单元的电输入端为卷积运算器的待卷积矩阵数据输入端,光输入端为卷积核输入端。同矩阵向量乘法一样,卷积运算器也可以分为串行输入和并行输入两种,主要区别为使用单元的数量和电输入端数据输入的方式,串行输入方案如下:根据卷积运算方式,使用数量和卷积核中元素数量相当的采用第一种方案的光电计算单元,将单元排列成和卷积核维度相同的阵列,并将载流子收集和读出区中读出区的输出端全部相连,通过汇聚完成相加,如图33所示,为针对卷积核维度为3*3的单元阵列。图33中一个中间写有v的方框就代表一个采用第一种方案的光电计算单元。首先,将卷积核数据通过光输入端,一一输入到所述单元当中,再将矩阵中当前卷积核对应位置的数据转化为二进制,然后串行从所述作为载流子控制区的控制栅上输入所述阵列中,输出的结果汇聚相加后经过ad转换进入控制系统,再经过移位和累加,即得到当前卷积核位置的卷积运算结果,之后在移动卷积核,利用之前光输入预存好的卷积核数据,直接重新输入电输入数据,即可获得下一个卷积核位置对应的卷积运算结果,以此类推,直到卷积核便利整个待卷积矩阵,然后将输出的卷积结果重新组合成结果矩阵,即完成了全部卷积运算。如果使用并行输入的卷积运算器,只需要将使用单元数量变为原来的k倍,其中k为带卷积矩阵中元素的位宽,并且将单元变为k组和卷积核维度相同的阵列,同样输出端全部相连,再使用类似于并行矩阵向量乘法器的方法进行电输入端数据并行的输入即可。所述的控制系统,可以是数字电路,也可以是计算机、单片机、fpga等多种逻辑控制单元。2)、采用根据上述第二、三、四实施例的光电计算单元的方案:第二、三、四种方案,和第一种方案相似,同样可以通过串行或并行行输入的方式,完成卷积运算,因此前文所述的使用第一种方案光电计算单元组成的卷积运算器,改为使用第二、三、四种方案所述光电计算单元构成的矩阵向量乘法器也同样可以完成运算,唯一的区别只在于:1)假如使用第二种光电计算单元方案,则因为p衬底器件更换为了n衬底器件,控制栅极和衬底上的电压极性反转了,其大小也需重新调制。2)假如使用第三种光电计算单元方案,则因为光输入方式的改变,从p型衬底的收集变为了电荷耦合层的收集,因此光输入量需要重新调制。3)假如使用第四种光电计算单元方案,则作为载流子控制区的不再是控制栅极,而是复位管漏端。采取本方案进行卷积运算,相较于传统卷积运算器有如下优势:1、集成度高,数个光电计算单元就可实现卷积运算。2、光输入数据具有存储特性,可在断光后长时间保存在器件内,下次运算时无需重新进行光输入,针对卷积运算中多次运算卷积核不变尤为有优势。神经网络加速器的方案本发明提出了多种光电计算装置和光电计算方法的具体实现方案,通过使用上述串行、并行矩阵向量乘法器、池化运算器和卷积运算器的方案,配以相应的控制系统,来实现神经网络算法推理的加速工作。神经网络算法的推理,以最常见的alexnet网络为例,由卷积层和全连接层组成,可以进行如人脸识别等工作,网络的详细结构如图34所示,其中卷积层中包含的运算有卷积运算、池化运算和非线性函数运算;全连接层中包含的运算有矩阵向量乘运算、池化运算和非线性函数运算,可以看到除了非线性函数运算,其他运算在本发明中都已提及了相应的光电运算加速器方案。而非线性函数运算有多种方式,其中最常见的为relu函数,其函数图像如图35所示,不难看出relu函数对于小于0的输入,输出都为0,而对大于0的输入,输出都为其本身,因此函数本身仅相当于一个判断大小是否大于0的逻辑控制单元,通过控制系统完成relu函数运算相当便捷,因此使用上述的4种在神经网络算法中最为常见的计算方式的光电运算器和光电计算方法,已经能够构成一个完整的神经网络加速器和加速方法。使用光电计算单元来进行神经网络加速最大的好处在于光输入的存储特性,依旧以alexnet网络为例,对于alexnet网络,每一层的输出数据的维度,都为固定值,如上述卷积运算器的方案中所述,在卷积层中进行卷积运算时,因为卷积核在多次运算中数据是不变的,因此利用光输入数据的存储优势,打一次光即可完成多次甚至全部的卷积运算工作,这极大的降低了存储单元和光电计算单元之间来回交互数据所需要的时间和能量消耗。对于池化也同样,因为网络中每一层输入输出的数据的维度都为固定值,因此平均池化的分母:待池化矩阵中元素的数量同样为不变的量,通过光输入的存储特性也可以极大的提高运算速度。在全连接层中,大量的矩阵向量乘的存在是传统计算方式最感到无力的部分,然而所述矩阵向量乘中,矩阵数据为通过训练获得的固定权值,一但完成训练,权值的值就不再改变,因此在进行推理运算时,同样通过光输入的方式将权值输入光电计算单元当中,可以大大提高运算效率。alexnet网络的输入数据为227*227*3的三维矩阵数据,首先经过卷积层1,如图34所述。卷积层1中卷积核大小为11*11,数量为96个,步长为4的卷积运算,使用如上述的卷积运算器的方案,则需要最少96个如上述的针对卷积核尺寸11*11的卷积运算器。卷积层1中的池化运算使用平均池化,因为内核尺寸为3*3,因此为9个数平均为1个数,因此最少需要一个如上述池化运算器所述的针对3*3矩阵输入的池化运算器。以此类推,卷积层2中,最少需要256个如上述的卷积核尺寸为5*5的卷积运算器,需要至少一个如上述池化运算器所述的针对3*3矩阵输入的池化运算器。卷积层3中,最少需要384个如上述的针对卷积核尺寸为3*3的卷积运算器。卷积层4中,最少需要384个如上述的针对卷积核尺寸为3*3的卷积运算器。卷积层5中,最少需要256个如上述的针对卷积核尺寸为3*3的卷积运算器,至少一个如上述池化运算器所述的针对3*3矩阵输入的池化运算器。全连接层1中,最小需要一个如上述串行、并行矩阵向量乘法器所述的支持4096*9216规模矩阵、1*9216规模向量的矩阵向量乘法器。全连接层2中,最小需要一个如上述串行、并行矩阵向量乘法器所述的支持4096*4096规模矩阵、1*4096规模向量的矩阵向量乘法器。全连接层3中,最小需要一个如上述串行、并行矩阵向量乘法器所述的支持1000*4096规模矩阵、1*4096规模向量的矩阵向量乘法器。综述,总共需要上述如此数量的矩阵向量乘法器、池化运算器和卷积运算器,配以相应的控制系统部分,就可以组成完整的alexnet网络加速器,如需要提高计算速度,可以考虑使用并行输入的方式,消耗更多的计算器,获得更高的计算速度。所述的控制系统,可以是数字电路,也可以是计算机、单片机、fpga等多种逻辑控制单元。采取本方案进行神经网络加速,相较于传统神经网络加速器有如下优势:1、集成度高,完成完整加速工作使用的光电计算单元少。2、针对矩阵向量乘、卷积运算、池化运算中矩阵权值、卷积核和池化运算的平均值分母在多次运算中不变的特点,采用光输入输入上述运算量,能将光输入的存储特性最大化发挥出来。ct算法加速器的方案本发明提出了多种光电计算装置和光电计算方法的具体实现方案,通过使用多个发光单元和上述实施例中所述的光电计算单元,来实现ct算法的加速工作。此ct算法加速器的输出端的个数,具体取决于使用的光电计算单元的输出端的个数,例如如果使用具有两个输出端的上述实施例中所述的光电计算单元,则ct算法加速器也具有两个输出端,下文的详细叙述中默认采取有一个输出端的光电计算单元。同上述串行、并行矩阵向量乘法器相同,如果使用的光电计算单元数目大于实际所需的个数,并不影响运算结果的正确性。1)、采用上述光电计算单元的第一实施例的方案:ct算法的大致内容如下,ct,即电子计算机断层扫描,它是利用精确准直的x线束、γ射线、超声波等,与灵敏度极高的计算器一同围绕人体的某一部位作一个接一个的断面扫描,具有扫描时间快,图像清晰等特点特点。ct的拍摄方式和x光的拍摄方式有较大不同,如图36所示,从上至下分别为对一物体用x光和ct的拍摄方式。ct拍摄,即通过接收到的从不同角度穿过待观测物体一断层的x光强度,来判断出此断层内部物质分部的方法,而将接收到的多组不同断层的一维沿不同角度入射的x光强度转化为二维的多组不同断层的二维物质分部图片的算法,就为ct算法。ct算法的大致内容如下,如图37所示,图中不规则形状物体即待拍摄物体的这一断层的截面图,多束x光从不同角度穿过它,其中第i条穿过它的射线即为图中所示角度入射的射线,此物体的截面图,即为通过ct拍摄和ct算法希望复原的断层扫描图,将此断层图分割成一个个像素,从第一行第一列开始数,第一行第一列为第一个像素,总共n个像素,第j个像素刚好被第i条x光穿过。x光穿过物体时会被吸收,根据物质的种类不同(水,细胞组织,骨头等)吸收的量大小也不同,通过判断吸收量多少就能间接判断出所拍摄物体是什么物质。图37中所示截面图中,不同像素的位置对应有不同种类的物质,因此x光穿过这些像素后,会受到不同程度的吸收,沿着不同角度入射的x光因为穿过的物质不同,当其出射物体后剩余的能量也就不同。定义,图37中所示物体截面内各个像素的灰度值,即代表x光穿过单位像素面积这种物体时,剩余能量的多少,灰度值越高,代表x光穿过这个像素后损失的能量越少,因此,对于第i条射线而言,假设其沿图37所述角度穿过物体,则剩余能量pi为:pi=ωi1x1+ωi2x2......+ωinxn(18-1-1)式18-1-1中,ω代表穿透系数,ωij就代表第i条射线是否穿过了第j个像素,如果穿过了,则代表第i条射线被第j个像素中的物体吸收了一部分能量,则ωij=1,xj为第j个像素对x光的吸收系数,也就是需要重建的断层扫面图片中第j个像素的灰度值,为待求解量;如果第i条射线没有穿过第j个像素,则代表第j个像素没有吸收第i条射线的能量,则ωij=0,将ω称谓投影系数。综上所述,针对第i条射线的公式如(18-1-1),则针对所有射线(共l条)的公式如(18-1-2):ω11x1+ω12x2+ω13x3+…+ω1nxn=p1ω21x1+ω22x2+ω23x3+…+ω2nxn=p2………………………………………………ωl1x1+ωl2x2+ωl3x3+…+ωlnxn=pl(18-1-2)式(18-1-2)为一多元方程组,x为待重建断层图片像素灰度值,即需要求解的量,其他都为已知量,根据线性代数知识可知,如果l大于等于n,则此方程有唯一解,即可以还原出断层扫面图片。通常用来求解上述方程的方法称作代数重建算法:假如式(18-1-2)不是有n个未知数的由l个方程组成的方程组,而是有2个未知数的由2个方程组成的方程组,则这两个方程组可以表示为二维平面里的两条线,因为方程有解,这两条线必定有交点,而交点的坐标即为方程组的解。快速求解方程组解的方法为:1)在所述平面内随便找一点作为初始迭代点;2)做所述初始迭代点做方程组第一个方程代表的直线上的投影点,将此投影点作为第二次迭代的点;3)过所述的第二次迭代的点,做方程组第二个方程代表的直线上的投影点,将此投影点作为第三次迭代的点;4)继续将第三迭代点对第一条直线做投影,然后再对第二条直线做投影,反复迭代,直到结果收敛,所述点即为两个直线的交点,也就是方程的解。上述迭代投影的图示过程如图38所述。上述过程的数学表达式,即为反复运算迭代式(18-1-3):其中,为进行第i次投影时的投影点,也就是第i次迭代时的结果向量,而为进行第i次投影时的多维空间平面的系数(方程组系数),也同样是此方程组对应的射线穿过截面时的投影系数向量。式(18-1-3)迭代次数越多,方程组的解也就越准。迭代式(18-1-3)中,需要反复计算向量向量乘法由全部的向量组成的矩阵,称之为ct算法中的系统矩阵ω:因为的实际物理意义是该射线是否穿过了所述像素,穿过了则为1,没穿过则为0,而ct机器射线的发射角度多为固定角度,因此,对于多次ct拍摄而言,系统矩阵ω多为固定值,因此,通过使用发明1中第一种方案所述的光电计算单元的光输入端的存储特性来输入系统矩阵中的数据,会极大的提高能效比和运算速度。公式(18-1-3)的核心是向量向量乘法因此使用如图39所述的单元阵列可以实现此部计算的加速工作,图中每一个中间写有v的方框,都代表一个采用第一种方案的光电计算单元,以系统矩阵规模为n*l,x射线数目为l的ct算法为例,假设电输入端数据为串行输入,则需要使用的光电计算单元数目为n*l个,将所述数目的光电计算单元排列成n行l列,且同列的所有单元的作为所述载流子收集和读出区的p型衬底的输出端都相连在一起,使运算结果汇聚相加;所有单元的作为所述载流子控制区的控制栅极都相互独立。工作时,通过光输入端将系统矩阵中的数据全部一一对应输入维度和系统矩阵相同的阵列当中,为ct算法加速器的系统矩阵输入端,之后开始迭代,第一次迭代时,随机生成初始迭代值,带入式(18-1-3),将初始迭代值转化为二进制,并通过所述阵列的电输入端串行输入阵列中的第一列单元当中,和上述串行矩阵向量乘法器类似,光输入数据和电输入数据完成相乘后,经电流汇聚输出,然后再控制系统中完成移位和累加操作,获得此次迭代中向量乘法的结果,再在控制系统中完成除向量乘法的其他运算,即可完成此次迭代;将上次迭代的结果作为下次迭代的电输入量转化为二进制,串行输入所述阵列第二列单元当中,光输入数据和电输入数据完成相乘后,经电流汇聚输出,然后再控制系统中完成移位和累加操作,获得此次迭代中向量乘法的结果,再在控制系统中完成除向量乘法的其他运算,即完成了第二次迭代;以此类推,直到在所属阵列第l列中完成第l次迭代后,再将第l+1次迭代的输入数据输入第1列阵列中,直到获得认为准确的迭代结果,然后通过控制系统输出给显示系统,即可查看到ct断层扫面的最终结果图片。如果使用并行输入的ct算法加速器器,只需要将使用单元数量变为原来的k倍,其中k为带卷积矩阵中元素的位宽,并且将单元变为k组和系统矩阵维度相同的阵列,同样同列的单元输出端全部相连,再使用类似于并行矩阵向量乘法器的方法进行电输入端数据并行的输入即可。所述的控制系统,可以是数字电路,也可以是计算机、单片机、fpga等多种逻辑控制单元。2)、采用根据上述第二、三、四实施例的光电计算单元的方案:第二、三、四种方案,和第一种方案相似,同样可以通过串行或并行行输入的方式,完成ct算法加速的工作,因此前文所述的使用第一种方案光电计算单元组成的ct算法加速器,改为使用第二、三、四种方案所述光电计算单元构成的矩阵向量乘法器也同样可以完成运算,唯一的区别只在于:1)假如使用第二种光电计算单元方案,则因为p衬底器件更换为了n衬底器件,控制栅极和衬底上的电压极性反转了,其大小也需重新调制。2)假如使用第三种光电计算单元方案,则因为光输入方式的改变,从p型衬底的收集变为了电荷耦合层的收集,因此光输入量需要重新调制。3)假如使用第四种光电计算单元方案,则作为载流子控制区的不再是控制栅极,而是复位管漏端。采取本方案进行ct算法加速,相较于传统ct算法加速器有如下优势:1、集成度高,完成完整加速工作使用的光电计算单元少。2、针对ct算法中系统矩阵中多次运算不变的特点,采用光输入输入上述运算量,能将光输入的存储特性最大化发挥出来。单精度浮点乘法器的方案本发明提出了多种光电计算装置和光电计算方法的具体实现方案,通过使用上述高位宽乘法器,和上述第一、二、三种加法器之一所述的光电加法器,来实现两个单精度浮点数的乘法运算。单精度浮点数,即通过类似科学计数法的方式表述一个带有小数部分的实数,一个单精度浮点数位宽为32位,其中1位符号位,通过一个二进制数表述正负;8位指数位,通过8位2进制数表述小数点左侧部分数的大小;23位尾数位,通过23位2进制数表述小数点右侧部分数的大小,如式(19-1-1):(1)符号位(10000111)指数位(10000000000000000000000)尾数位=(-1)1*21000111-01111111*1.10000000000000000000000=-2135-127*1.5=-384(19-1-1)因此,两个浮点数a和b的乘法过程,如式(19-1-2)所示:a=(a)符号位(a)指数位(a)尾数位b=(b)符号位(b)指数位(b)尾数位不难看出,两个单精度浮点数的乘法就是两个单精度浮点数的符号位相乘、指数位相加再减去127、尾数位相乘的结果。综上,所述的光电单精度浮点乘法器,也就是需要运算符号位相乘、指数位相加和尾数位相乘三部分运算。其中符号位只需通过通用逻辑判断正负即可,指数位8比特位宽加数的加法再减去01111111,只需要使用如上述第一、二、三种加法器运算即可;而尾数位的两个23比特位宽乘数的乘法运算,因为乘数位宽较大,故而需要使用上述高位宽乘法器来进行运算,上述多种乘法器之一所述的光电计算乘法器,通常适用于光输入端输入精度在8比特左右,最高不超过16比特位宽的乘数输入的乘法运算。通过控制系统将所述两位待乘单精度浮点数拆分为符号位、指数位和尾数位,将符号位通过控制系统判断正负,指数位输入高位宽乘法器的两个高位宽乘数输入端,尾数位输入光电加法器的两个加数输入端。将三部分输出的结果返回给控制系统,并在控制系统中重新组合成单精度浮点数,即完成了完整的单精度浮点数乘法。本发明利用半导体材料的光电特性,公开了一种基本的光电混合运算方法和运算器件。由于半导体材料对入射光子可以具有较高的灵敏度、较长的光信号存储时间,并且本身较易于提高集成度,本发明对计算技术具有实质性的提高。采取本方案进行单精度浮点乘法运算,相较于传统单精度浮点乘法器有如下优势:1、集成度高,只需要数个光电计算单元就可完成单精度浮点数乘法运算。2、光输入数据具有存储特性,可在断光后长时间保存在器件内,下次运算时无需重新进行光输入。数字控制逻辑的权利要求本发明提出了一种光电计算模块的数字逻辑控制系统,用于控制光电计算模块的状态以及数据输入输出。下面以上述并行矩阵向量乘光电计算模块的数字逻辑控制系统为例,简要叙述数字控制逻辑的工作方法。使用并行矩阵向量乘光电计算模块运算矩阵向量乘法:并假设矩阵w中每个元素的位宽为8比特,则至少需要8组n列m行个单元的光电计算阵列来组成能够运算a*w的并行输入矩阵向量乘模块。假定使用的单元数量就为上述的最低要求,使用8组n列m行个单元来组成运算模块,并且同一组阵列的同行的载流子控制区都向量,同一组阵列同列的载流子收集和读出区的输出端都向量,和说明14中描述的相同。首先,该光电计算模块的数字控制阵列分为以下几个部分:数据输入部分、光输入控制部分、光接收控制部分、电输入接收控制部分、输出控制部分和自检控制部分,控制的对象有8组n*m的光电运算阵列以及和这些阵列供电的电源模块,以及驱动发光阵列的驱动器。电源模块,可以提供光电运算阵列在接收光信号、接收电信号、运算以及输出、复位光信号等各个状态下各功能区所需的各种电压。如对于发明1中光电计算单元的第一种实施方案而言,接收光信号时p型衬底需要加-3v,接收电信号时,控制栅上需要加4v或者0v,输出时p型衬底的读出区mosfet的源漏之间需要加0.5v,复位时衬底需要加1v,则给其供电的电源模块则需要至少能提供-3v、0v、1v、4v这几种电压,并在数字控制逻辑的控制下,在所需的时刻将电压给予阵列中单元的相应部位。完整的运算过程如下:1)数据输入将矩阵数据w和向量数据a输入到数据输入部分,数据输入部分发送给光输入控制部分和电输入接收控制部分并预存于寄存器中。2)光输入将光输入控制部分的寄存器中的矩阵数据w中的每一个元素,通过光输入控制部分转化为发光阵列中发光单元需要发光的时长,发送给发光阵列的驱动器,驱动器转化为脉冲,驱动发光阵列发光,实现光输入。3)光接收光输入的同时,通过光接收控制部分,发送接收光信号对应的状态信号给电源模块,电源模块改变供电电压,使计算阵列中的单元进入光接收状态,例如,使用发明1中第一种实施方案的光电计算单元,则电源模块在接收到接收光信号的状态信号后,给p型衬底-3v,读出区源漏浮空,控制栅0v,使p型衬底中产生耗尽层,当再有光子入射时,就会吸收该光子产生光生载流子,完成光输入。4)电输入并接收光输入完成后,通过光输入控制部分控制驱动器,停止打光;再通过电输入接收部分,发送电输入的状态信号给电源模块,使计算阵列中的单元进入电输入状态,并将寄存器中的向量数据a以并行地方式输入到计算阵列的载流子控制区中。如假如使用发明1中第一种实施方案的光电计算单元,则电源模块此时需要给予控制栅0v或3v的电压,具体给予0v还是3v受到电输入接收控制部分的控制,如果该单元的电输入量应为0,则0v电压施加到控制栅上;如电输入量为1,则3v电压施加到控制栅上,同时,p型衬底保持施加-3v不变,读出区源漏依旧浮空。5)运算和读出过程电输入完成后,通过输出控制部分发送输出运算结果的状态信号给电源模块,使光电计算单元进入输出状态,假如使用发明1中第一种实施方案的光电计算单元,则电源模块此时需要给予读出区源漏之间0.5v的电压差,并且保持p型衬底-3v和控制栅上0v/3v电压。作为运算结果的输出电流经汇聚后,先进入ad转换,输出控制部分发送开始ad转换的信号给ad转换器,ad转换器完成转换后从输出端输出转换后的结果和转换结束信号给输出控制部分,接收到转换结束信号后,输出控制部分将接收到的转换结果再送入到移位器和累加器进行移位和累加,得到最终的a*w运算的结果向量后将此结果存储到寄存器中,并发送运算结束的状态信号给电源模块,电源模块结束本次运算。如假如使用发明1中第一种实施方案的光电计算单元,则电源模块在结束运算时需取消施加在读出区源漏之间的0.5v电压差和控制栅上的0v/3v电输入二值信号,但是保持p型衬底的-3v不变,以维持光输入信号的“存储”,等待下一次运算。6)光输入信号复位过程如完成本次运算后,光输入数据不再参与之后的运算,需要重新进行下一次光输入,则通过输出控制部分发送光输入数据复位信号给电源模块,电源模块对计算阵列中的单元进行光输入数据的复位。如假如使用发明1中第一种实施方案的光电计算单元,则电源模块此时需要给予p型衬底1v,控制栅0v的电压,同时保持读出区源漏浮空。复位完成后,输出控制部分发送复位完成信号给电源模块,电源模块停止供电,等待下一次光输入。7)自检过程自检过程发生在运算模块工作之前,用于对计算阵列中的单元是否发生损坏进行检查。工作开始前,如需开始自检,自检控制部分发送状态信号给电源模块,电源模块对所有组的所有列的第一行开始自检,如假如使用发明1中第一种实施方案的光电计算单元,则电源模块此时需先给予控制栅3v电压,读出区源漏之间0.5v的电压,输出电流经每一列的输出端输出给自检控制部分,如发现有列输出端存在无电流输出的现象,则判断此列的第一个单元损坏;之后,再撤去控制栅上的3v电压,读出区源漏之间依旧保持0.5v,通过自检控制部分判断每一列的输出电流,如发现有列输出端存在断掉控制栅3v电压后依旧有电流的现象,则判断此列第一个单元损坏。完成了对第一行的自检,自检控制部分控制换行,对第二行开始自检,自检条件相同,直到完成全部行的自检,即完成了全部自检。数字控制逻辑的示意图如图40所示。数字控制逻辑的具体实现方式,可以是数字电路,单片机,fpga等多种。其他实施例本实施例提供了单个采用根据上述第一实施例的光电计算单元的实测光响应曲线,并借助于此在机台上实测获得的光响应曲线作为单个光电计算单元的模型,搭建成了如上述并行输入矩阵向量乘法器的模型和如上述的卷积运算器的模型,并借助于所述搭建成的模型组件成了完整的使用根据上述第一实施例的光电计算单元组建的神经网络加速器。通过用此加速器模型,使用仿真软件尝试仿真推理完整的类alexnet的网络(不同于上述神经网络加速器的方案中提到的标准alexnet网络)对cifar-10数据集中的图片进行分类预测这一功能,并对运行结果的准确度进行评估。单个光电计算单元实测结果以及网络仿真分析单元参数和测试条件所使用的采用根据上述第一实施例的光电计算单元的实测光响应曲线如图41所示,其中横坐标为通过曝光时间表征的入射光子数x,纵坐标为作为所述载流子收集和读出区的p型衬底中读出区mosfet输出端的运算结果大小,运算结果以电流的形式输出。测试时,作为载流子控制区的控制栅极,即vg加3v电压,p型衬底加-3v电压,并给与合适的源漏间电压时所对应的输出结果。可以看到,除了末尾处的一点不线性,光电计算单元的读出电流和入射光子数有着较好的线性度,和发明1中的公式(1-15)描述相符,实际使用时,只需要截去末尾不线性部分进行运算即可获得更高的计算精确度。为了获得一个较为保守的仿真结果,没有截去末尾的不线性部分,而是采用了完整的整条曲线来搭建神经网络加速器。网络结构和数据集所仿真的类alexnet的网络模型所包含的结构如图42所示,此类alexnet网络模型由六层卷积层、五层池化层以及两层全连接层组成,并使用relu作为激活函数。为了提高仿真程序运行的速度,池化层没有使用上述池化运算器,而是直接假设使用通用逻辑来进行池化运算。此网络实现的功能为目标识别,使用的图片数据集为cifar-10数据集。该数据集共有60000张彩色图像,这些图像大小是32*32*3,分为10个类,每类6000张图。这里面有50000张用于训练,构成了5个训练批,每一批10000张图;另外10000用于测试,单独构成一批。先使用数据集中的照片进行训练,获得收敛的权值后再将权值带入网络进行推理,用搭建的神经网络加速器模型来仿真运行类alexnet,最后得出此神经网络加速器模型进行目标识别的准确度高低。很显然,导致最后识别结果不准确的因素有两点,一个网络本身,以及通过训练所获得的权值并不完美所带来的和推理时计算准确度无关的识别误差;另一个就是因为由计算器件单管模型搭建的神经网络加速器模型存在计算误差,而带来的识别误差。ad转换精度通过上述并行矩阵向量乘法器和上述卷积运算器的方案的介绍,不难发现,无论是矩阵向量乘法器每一列的输出端,还是卷积运算器一个卷积核的总输出端,都必须接有一个ad转换,将模拟的电流运算结果转化为数字量,才能送入控制系统参与后续操作,因此,此ad转换的精度将会极大的影响计算的精度。如上述并行矩阵向量乘法器的方案中所述,在图31所示的并行矩阵向量乘法器当中,一共有k组规模为m*n的阵列,假设每一组阵列的每一列下加装一个ad,并且认为光输入端输入的值范围为(-127,127),并且将正的光输入值和负的光输入值分别输入到不同矩阵当中,ad位宽为nbit,矩阵向量乘中矩阵的行数为m行,则ad转换精度为:其中,127代表单个光电计算单元的输出最大值,即光输入端输入最大值127和电输入端输入二值化后的最大值1相乘的结果,127*m则是一整列单元因电流汇聚后的输出最大值,又因为将光输入端数据分正负矩阵输入的情况下,考虑到正矩阵或负矩阵中数值有一半概率为0,所以实际计算中m的值需要除以2,得到最后的ad转换精度如式21-1所示。以的类alexnet网络中的全连接7层为例,此层输入的矩阵规模为2048*1024,输入的向量规模为2048*1,并假设向量中单个元素的位宽为8,则此时需要使用k=8组规模为2048行*1024列的阵列,ad位数为8,此时ad的精度为:即ad转换后可以识别的最小单位为508,小于此值的输出会被舍去,从而造成一定的精度下降。同理,卷积运算器也会受到类似的因为ad造成的精度下降,不再重复叙述。网络权值的范围对于的网络中的全连接层,权值即为矩阵数据,权值的来源为网络的训练,在训练时可以自定义权值的精度,如式(21-2)中就认为权值的精度为8bit,即范围为(-127,127),训练时权值的精度越高,假设不存在任何计算误差的情况下,网络的准确度也就越高,但是运行的压力也就越大。权值精度对不存在计算误差的理想网络运行的结果如下表,结果为进行推理时目标分类的准确度:8bit(权值)7bit(权值)6bit(权值)5bit(权值)4bit(权值)8bit(激励)90.83090.82090.73090.38088.040可以看到,当向量数据精度为8bit时,权值取8bit和4bit精度差距只有2%左右,因此使用4bit的权值精度进行训练,当收敛后使用训练好的4bit权值带入的仿真模型进行模拟推理运算,对于卷积层中的卷积核中的数据,也同样使用4bit。网络仿真结果从上述仿真的精度可以看到,的神经网络加速器模型跑出的分类准确度为85.4%,只比不存在任何计算误差的理想准确度结果88%相差了3%不到,为一个较高的精度,足够胜任神经网络加速的工作。同时,假设单个ad的延迟为20ns,则可以推断出每一层网络的运行延迟为0.164ms,跑完一次完整的网络推理需要的时间也就是1.312ms,这相对于光输入数据少则数秒,多则数年(采用根据上述第三实施例的光电计算单元)的保持时间而言,已经是一个相当短的时间了,即便是数秒的维持时间,也足以在一次光输入的时间窗口内运行上千次完整的网络推理。如果将上述神经网络加速器用于视频监控中的物体识别,则完整网络1.312ms的推理耗时可以轻松满足上百帧的视频实时监控,而达到这一指标,不考虑外围逻辑电路,最少总共只需要使用约200万个光电计算单元,假设一个光电计算单元面积为3um*3um,则芯片尺寸只有5mm*5mm不到;根据单个光电计算单元的实测结果,每个光电计算单元在读出状态下的功率为仅为0.1uw级别,整个网络推理耗时1.312ms中,每个单元最多只需要运行八分之一的时间,不运行时的漏电流可以忽略不计,因此芯片运行的总功率只有不到0.05w。无论是功耗还是芯片面积,在获得同等计算力的情况下,这都是使用gpu加速神经网络推理不可比拟的。效果下表格为预估的光电存算一体芯片和谷歌的tpu芯片在功耗、芯片面积、运算能力以及制作工艺等方面的对比图,其中光电存算一体芯片的参数和性能指标来源于理论推理和仿真结果。可以看出,即便光电存算一体芯片在工作主频远远低于tpu芯片的情况下,其每秒操作数依旧远远高于tpu芯片,这主要是因为光电存算一体芯片中的计算阵列中,单个器件即能完成乘法操作,而电流的汇聚又完成了一次加法操作,因此单个单元就可在一个机械周期中贡献两个操作数,这远远优于tpu芯片,同时也导致了芯片面积也小于tpu芯片;而光电存算一体芯片的另一大优势:光输入的存储特性,又导致了光电存算一体芯片在功耗上会远远低于tpu芯片;另外,上述参数都为基于65nm工艺制作的情况下得出的,而谷歌tpu则是28nm工艺的产物,这又给光电存算一体芯在未来通过工艺节点的缩小提高器件性能上创造了可能;最后,可以看出,根据仿真和推导结果,目前的光电存算一体芯片的大部分功耗都浪费在了数字控制。以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本
技术领域
的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1