计算单元、阵列及计算方法与流程

文档序号:34964514发布日期:2023-08-01 09:03阅读:25来源:国知局
计算单元、阵列及计算方法与流程

本发明属于集成电路领域,更具体地,涉及集成电路计算芯片的体系架构和工作方式。


背景技术:

1、随着物联网与云计算的发展,计算任务的复杂性与日俱增,给计算芯片带来更大的压力。其中,计算芯片的主要性能指标可以分为功耗和算力指标。无论是在物联网等供能受限的场景还是云计算等消耗大量能量的场景中,功耗指标都是十分关键的。因此,如何在提供给定算力的前提下,进一步降低芯片功耗,是计算芯片的重要研究方向。

2、计算芯片的功耗主要来自两部分操作,一是数据读写,二是数据计算。对于特定计算,如深度神经网络中涉及的推理和训练计算,会出现大量的数据读写操作。数据读写的目标存储器可以分为片上存储和片外存储。由于片上存储广泛采用静态随机存储器(sram),其密度较低,因此其存储容量往往较小。当遇到大量数据读写操作时,就需要对片外存储进行访问。考察数据读写操作,对互连线周围寄生电容的充放电是其主要能耗来源。而片外存储通过较大间距的互连线和引脚进行数据访问,会产生相比片上存储大得多的能耗。针对这一现象,将数据尽可能地部署在片上存储中,并进一步降低对片上存储的数据访问是优化计算芯片能效的重要策略。

3、存算一体化架构就是其中的一个具体实现。这一架构通过构造基于忆阻器的高密度计算单元,可以将计算数据部分固化在计算单元内,从而减少了对于数据的访问操作。同时,由于采用模拟计算的方式,它对于存储数据有一定的鲁棒性,因而可以实现更大规模的片上存储。一种典型的存内计算方式是,在电导值为矩阵g的忆阻器阵列一侧通过数字-模拟转换器(dac)输入电压向量v,通过测量正交的另一侧的输出电流向量i,即可以实现i=gv的矩阵-向量乘法计算。其中,在神经网络推理的计算场景中,g对应网络权重,更新较少,v对应数据的特征图,更新较多。

4、上述典型计算方式对于忆阻器器件提出了一个基本要求,也就是需要表现出高度线性的电流-电压关系。现有的存储器技术均只存在一个小范围的线性区,因此要满足这一要求需要将输入电压的范围限制在一个很小的范围,这反过来对输入电路提出了较大的挑战。其次,在全并行的情况下,阵列横向的互连线都输入信号,从而需要进行互连线的寄生电容充电到输入电压。这一过程将会消耗大量的能量。


技术实现思路

1、本发明的目的在于解决上述技术问题,提出一种计算单元、阵列及计算方法。

2、本发明的目的是通过以下技术方案实现的:

3、第一方面,提供一种计算单元,包括:

4、一个树状的网络,所述网络包含一个父节点和至少两个子节点,所述父节点和至少一个子节点间具有导通能力;

5、至少一个前向的电流驱动级,与所述网络的父节点相连;

6、多个后端的电流采样级,与所述网络的子节点一一对应相连。

7、进一步地,所述电流驱动级包括串联的电压数模转换器和限流电阻。

8、进一步地,所述网络的导通能力能够调节,可采用但不限于以下方式:

9、方式一:所述计算单元包括一种存储结构,具有至少两个满足如下条件的端口,记为端口一和端口二,即在存储不同数据时,通过对所述端口一和端口二给定不同的固定输入,两个端口间电流存在差异;

10、所述子节点均和至少一个所述存储结构的端口一或端口二相连,所述存储结构未连接到所述子节点的端口一或端口二和所述父节点相连;通过对所述存储结构进行数据写入实现所述网络的导通能力调节;

11、该方式下,存储结构可以采用忆阻器,通过对忆阻器进行状态调节实现所述网络的导通能力调节。

12、方式二:所述父节点和子节点间包括磁阻存储器、阻变存储器、相变存储器、铁电存储器、静态随机存储器、动态随机存储器、浮栅存储器以及电荷捕获存储器中的一种或多种,用于实现所述网络的导通能力调节。

13、第二方面,提供一种如第一方面所述的计算单元的计算方法,包括:

14、步骤一,将所述电流采样级输入端电位设置为与所述电流驱动级的零电位相同;

15、步骤二,在所述电流驱动级施加电流;

16、步骤三,在所述电流采样级进行电流采样;

17、其中先后顺序满足,步骤二先于步骤三,步骤一先于步骤三。

18、第三方面,提供一种实现并行计算的计算单元阵列,可采用但不限于以下方式:

19、方式一:包括多个如第一方面所述的计算单元;

20、一个后端电流采样级至少连接两个不同计算单元内的子节点。

21、方式二:包括多个如第一方面所述的计算单元;

22、一个前向电流驱动级至少连接两个不同计算单元内的父节点。

23、方式三:包括多个如第一方面所述的计算单元;

24、一个后端电流采样级至少连接两个不同计算单元内的子节点;

25、一个前向电流驱动级至少连接两个不同计算单元内的父节点。

26、第四方面,提供一种如第三方面所述的计算单元阵列的计算方法,包括:

27、步骤一,将所述电流采样级输入端电位设置为与所述电流驱动级的零电位相同;

28、步骤二,在所述电流驱动级施加电流;

29、步骤三,在所述电流采样级进行电流采样;

30、其中先后顺序满足,步骤二先于步骤三,步骤一先于步骤三。

31、本发明的有益效果是:本发明提出了一种新的计算原理,基于该原理,可以通过使用合适范围的电流输入,使得器件工作在低压状态,且阵列计算时电流方便可控,从而解决忆阻器器件电流-电压关系中的非线性问题和进行阵列规模的并行运算时功耗较高的问题。

32、本领域的技术人员在阅读以下具体实施方式并看到附图时将会认识到附加的特征和和优势。



技术特征:

1.一种计算单元,其特征在于,包括:

2.根据权利要求1所述的计算单元,其特征在于,

3.根据权利要求1所述的计算单元,其特征在于,

4.根据权利要求3所述的计算单元,其特征在于,

5.根据权利要求4所述的计算单元,其特征在于,

6.根据权利要求4所述的计算单元,其特征在于,

7.一种权利要求1-6中任一项所述计算单元的计算方法,其特征在于,包括:

8.一种实现并行计算的计算单元阵列,其特征在于,

9.一种实现并行计算的计算单元阵列,其特征在于,

10.一种实现并行计算的计算单元阵列,其特征在于,

11.一种权利要求8-10中任一项所述计算单元阵列的计算方法,其特征在于,包括:


技术总结
本发明公开了一种计算单元,使用这一计算单元进行高并行计算的计算单元阵列及计算方法,主要解决现有技术受器件电流‑电压关系非线性等影响准确度较低,且并行计算时功耗较大的问题。该计算单元包括:一个树状的网络,该网络包含一个父节点和至少两个子节点,父节点和至少一个子节点间具有导通能力;至少一个前向的电流驱动级,与该网络的父节点相连;多个后端的电流采样级,与该网络的子节点一一对应相连。本发明利用电流分配的方式实现了线性运算中乘法操作在器件端的解耦合,可应用于存算一体化的大规模模拟计算系统中。

技术研发人员:赵先成
受保护的技术使用者:浙江力德仪器有限公司
技术研发日:
技术公布日:2024/1/13
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1