一种基于大规模粗粒度可重构处理器的sha256实现方法及系统的制作方法

文档序号：9579219阅读：500来源：国知局

一种基于大规模粗粒度可重构处理器的sha256实现方法及系统的制作方法
【技术领域】
[0001] 本发明设计嵌入式可重构系统领域，尤其设计一种应用于通信、加密等领域的基于大规模粗粒度嵌入式可重构系统及其处理方法。
【背景技术】
[0002] 通用处理器与专用集成电路（ASIC)是传统的计算机系统结构领域的两大主流方法。然而，随着应用领域对系统的性能、能耗、上市时间等指标需求的不断提高，这两种传统计算模式的弊端就暴露出来。
[0003]通用处理器方法适用范围广，但是计算效率低，专用集成电路虽然可以提高计算速度和计算效率，满足性能需求，但是ASIC器件的灵活性很差。
[0004] 为了在灵活性和计算效率之间实现很好的权衡，可重构计算（reconfigurable computing)技术应运而生。可重构计算是当前计算机系统结构领域的发展趋势之一，它的架构介于通用处理器和ASIC之间，并且综合了二者长处。它通过对可重构设备进行配置，可以使之由一个通用的计算平台转化为一个专用的硬件系统，以完成具体的计算任务，相当于计算任务同时在时间和空间上展开，显示出了应用的灵活性和很高的计算性能。此外，可重构计算技术还具有系统能耗低、可靠性高、上市时间短等优势。这些优势使得可重构计算技术在各个应用领域尤其是嵌入式应用领域有着广阔的应用前景。很多在嵌入式领域中的主流应用，例如多媒体应用、加/解密应用以及通信应用等都非常适合利用可重构计算技术实现。当前的可重构计算技术主要还是用于尖端技术领域中的计算平台，但随着可重构逻辑器件成本逐渐降低，运行时可重构计算技术不断完善，我们有理由相信可重构计算技术具备的种种优势会使其在更多的领域里大有作为。
[0005] 目前国内外已研究有多重可重构系统，如ReMAP，AsAP，DRP等。但是，这些阵列的互联方式较为简单，在SHA256方法的运算中需要大量的中间数据存储以及较多的轮数，因此运算的效率和速度较低。传统的可重构计算系统在SHA256的运算效率与运算周期方面存在较大问题。

【发明内容】

[0006] 有鉴于此，本发明提出一种基于大规模粗粒度可重构处理器的SHA256实现方法，利用可重构技术的并行性处理、运算模块独立可配置等优点，在支持一定的灵活性的同时，通过提高对SHA256算法的并行度以及优化流水线等方法实现了SHA256算法的高效运算。
[0007] 本发明提供了一种基于大规模粗粒度可重构处理器的SHA256系统，其包括：先进先出寄存器组、通用寄存器堆、算术逻辑单元、比特置换网络、字节置换网络以及数据载入单元和数据输出单元；
[0008] 所述可重构处理器，微处理器通过系统总线发送明文数据给可重构处理器，明文数据将存入输入先进先出寄存器组，并在最终计算完成后输出密文数据到输出先进先出寄存器组，并发送中断信号，最终输出先进先出寄存器组中的数据由微处理器读出；
[0009] 首先，对配置单元中的配置存储器进行初始化，微处理器将所需要的配置信息通过配置单元的配置与控制接口发送到配置存储器中，然后通过配置单元中的配置解析模块解析配置存储器，实现对计算阵列的配置、启动以及切换操作；
[0010] 优选地，所述的可重构处理器有10个可重构阵列块、1个通用寄存器堆、1个输入先进先出寄存器组和1个输出先进先出寄存器组；其中多个可重构阵列块通过一个1个通用寄存器堆可以互相进行数据的储存、读取和传递，保证了SHA256方法中的大量数据交换以及并行运算；且多个可重构阵列块中相邻的两个可重构阵列块通过数据载入单元和数据输出单元连接；第一个可重构阵列块通过数据载入单元与输入先进先出寄存器组相连，同时最后一个可重构阵列块通过数据输出单元与输出先进先出寄存器组相连；
[0011] 优选地，所述的可重构阵列块包括4个可重构阵列运算行和1个通用寄存器读端口运算行选择器和1个通用寄存器写端口运算行选择器；其每个可重构阵列运算行共享1 个通用寄存器堆的读端口和写端口；在SHA256运算中可重构阵列运算行可通过通用寄存器堆读出各种缓冲数据如w[i]，k[i]以及各种临时的消息摘要，同时可以向通用寄存器堆写入消息摘要的每轮计算的中间值以及缓冲数据w[i]和临时数据w[i]+k[i]，这些缓冲数据被其他可重构阵列块读出用于下一轮计算。
[0012] 优选地，所述的可重构阵列运算行包括数据载入单元，数据输出单元，字节置换网络，比特置换网络和16个8位算术逻辑单元；数据经过数据载入单元，由选择器通过读取并解析不同的配置信息来选择数据流入的字节置换网络和比特置换网络；字节置换网络与比特置换网络的128位的输出分为16个8位的数据分别固定对应于16个8位算术逻辑单元，一次性可以运算4组SHA256数据；每个算术逻辑单元可以使用数据选择器选择其中三个置换网络的输出作为其输入；数据载入单元可以暂存算术逻辑单元的结果并读取配置信息决定将数据输出到先进先出寄存器组、下一个可重构阵列运算行还是通用寄存器堆；
[0013] 优选地，算术逻辑单元中包含了模加运算、异或运算、3输入异或加、3输入异或同或加运算；同时每个算术逻辑单元有最多3个输入和最多2个输出，其中算术逻辑单元执行上述运算操作的同时，支持任选一个输入作为输出；由于SHA256方法中全部为32位运算，因此每4个8位的算术逻辑单元可以通过进位端口连接成为1个32位的算术逻辑单元；
[0014] 优选地，SHA256的流程被分为4个步骤，其中前两个步骤与第三个步骤为并行执行：
[0015] (1)第一个步骤是计算包含64个字的缓冲区数据w[i]，其中i由1到64的整数， w[i] (1 彡i彡 16)为 512 位的明文数据，w[i] (17 彡i彡 64)由w[i-2]、w[i-7]、w[i-15] 和w[i-16]计算而来，每4个连续的w[i]占用通用寄存器堆中的一个存储单元，使用4个可重构阵列块陆续读入16个w[k] (i-16彡k彡i-Ι)数据用于计算w[k] (i彡k彡i+3)，使用比特置换网络实现w[k-2]和w[k-15]的循环左移操作，其中i彡k彡i+3,字节置换网络与比特置换网络用于控制数据的流向，从而为算术逻辑单元输出合适的操作数，并由算术逻辑单元执行数据间的模加及异或运算，最终得出4个w[k](i<k<i+3)数据，并存放于通用寄存器堆中，令i为17执行上述运算，然后每次令i加4重复执行上述运算，经过 12次上述运算即可得出全部w[i] (17 <i< 64)数据；
[0016] (2)第二个步骤是计算2个64个字的缓冲区数据w[i]与k[i]的和，其中 (1<i$64)，每4个w[i]与k[i]组成两个128位的数据预先储存在通用寄存器堆中，并在一个可重构阵列块中利用算术逻辑单元执行w[i]+k[i]操作，重复执行16次即可计算出所有结果，然后将结果存于通用寄存器堆中；
[0017] (3)第三个步骤是SHA256流程的主循环运算，由A,B，C，D，E，F，G，Η这8个32位的数和第二轮中计算出的w[i]+k[i]运算64轮得出最终的消息摘要，其中i代表轮数，且第一轮A，B，C，D，E，F，G，Η的值恒定，将8个32位的迭代中间值A，B，C，D，E，F，G，Η分别组合成两个128位数存放在通用寄存器堆中，使用2个可重构阵列块进行并行计算，一个用于E，F，G，Η和w[i]+k[i]之间的异或、同或和模加运算以及Ε的移位相加运算，另一个用于 A，B，C之间的异或加以及A的移位相加运算，然后在通过2个可重构阵列块并行分别计算出新的A，B，C，D和E，F，G，H，并覆盖掉原来的通用寄存器堆中的原始值，用于下一轮的计算，其中由比特置换网络执行移位操作，由字节置换网络和比特置换网络同时执行数据的交换从而为算术逻辑单元输出合适的操作数，并由算术逻辑单元执行模加、异或、同或运算，每 512位的明文数据需要经过64轮计算。

完整全部详细技术资料下载

当前第1页1 2 3 4

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：曹鹏;陈圣华;杨锦江;陆启乐;刘波;
技术所有人：东南大学;
我是此专利的发明人

上一篇：特殊鞍点问题的高效预处理方法
上一篇：一种基于主从架构的微服务器集群系统的制作方法

该领域下的技术专家

如您需求助技术专家，请点此查看客服电话进行咨询。

1、李老师：1.计算力学 2.无损检测

2、毕老师：机构动力学与控制

3、袁老师：1.计算机视觉 2.无线网络及物联网

4、王老师：1.计算机网络安全 2.计算机仿真技术

5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用

如您是高校老师，可以点此联系我们加入专家库。

相关技术

一种基于主从架构的微服务器集...
处理器级联方法和系统的制作方...
一种背板i2c总线死锁的消除...
基于Soc的可重构/双冗余V...
一种基于fpga的pcie转...
芯片及具有芯片的传输装置及其...
用于高速串行总线的接收器和接...
一种数据突发的缓存装置和方法
一种spi接口转换i2c总线...
一种用于数据收发的自对准接口...

网友询问留言已有0条留言

还没有人留言评论。精彩留言会获得点赞！

1

精彩留言，会给你点赞！

粗粒度可重构体系结构相关技术
一种实时光场重构结构和重构方法
一种可重构天线结构的制作方法
一种面向可重构网的Agent结构的制作方法
基于粗粒度并行的指纹匹配单元的制作方法
一种面向粗粒度可重构系统的多模式动态可配高速访存接口的制作方法
一种基于自动布线互连网络的粗粒度可重构阵列电路的制作方法
用于粗粒度可重构处理器的编译优化方法
粗搪刀调整结构的制作方法
粒度选择的高效发绿光磷光体的制作方法
用于多粒度反馈的码本设计和结构的制作方法
粗粒度和细粒度相关技术
一种容软错误的粗粒度可重构阵列的制作方法
一种基于大规模粗粒度可重构处理器的sha256实现方法及系统的制作方法
用于用安全属性限制cpu事务的方法、装置和系统的制作方法
一种arp欺骗的细粒度检测方法及系统的制作方法
基于粗粒度并行的指纹匹配单元的制作方法
一种面向粗粒度可重构系统的多模式动态可配高速访存接口的制作方法
一种基于自动布线互连网络的粗粒度可重构阵列电路的制作方法
用于粗粒度可重构处理器的编译优化方法
用于可缩放视频译码的粗粒度可缩放性增强层译码的上下文自适应可变长度译码增强的制作方法
一种粗粒度动态带宽分配方法
粗粒度相关技术
一种基于粗粒度可重构架构的des算法轮迭代系统及迭代方法
一种基于大规模粗粒度可重构处理器的sm4-128加密算法实现方法及系统的制作方法
片上网络中基于路径多样性的交叉开关细粒度容错模块及其方法
用于加速磁盘阵列的数据重构的方法和装置的制造方法
用于提供对资源的访问的方法和系统的制作方法
调用数据共享的方法、装置及设备的制造方法
基于控制流粗粒度完整性的监控软件业务行为的方法
一种高效视频编码中判定滤波强弱的可重构阵列结构的制作方法
波束方向可重构的天线及波束扫描范围可重构的天线阵列的制作方法
一种实现密码信息处理的方法及终端的制作方法
砂轮粒度与粗糙度相关技术
一种基于大规模粗粒度可重构处理器的sha256实现方法及系统的制作方法
一种石英尾砂粒度分离设备的制造方法
粒度砂对辊破碎机的制作方法
基于粗粒度并行的指纹匹配单元的制作方法
一种面向粗粒度可重构系统的多模式动态可配高速访存接口的制作方法
一种基于自动布线互连网络的粗粒度可重构阵列电路的制作方法
用于粗粒度可重构处理器的编译优化方法
用于可缩放视频译码的粗粒度可缩放性增强层译码的上下文自适应可变长度译码增强的制作方法
一种粗粒度动态带宽分配方法
一种基于hii/oi的粗粒度动态频率复用方法
磨料粒度和表面粗糙度相关技术
一种超硬磨料的粒度分级方法
高效的粗粒度可重构计算系统的制作方法
粗粒度超硬磨料有序排布装置及排布方法
一种容软错误的粗粒度可重构阵列的制作方法
一种基于大规模粗粒度可重构处理器的sha256实现方法及系统的制作方法
提供磨料产品表面的方法及其磨料产品的制作方法
一种微磨料多相射流加工表面织构的装置及方法
一种超硬磨料表面高洁净处理方法
基于粗粒度并行的指纹匹配单元的制作方法
一种面向粗粒度可重构系统的多模式动态可配高速访存接口的制作方法
粗粒度锁相关技术
用于可缩放视频译码的粗粒度可缩放性增强层译码的上下文自适应可变长度译码增强的制作方法
配置事务的处理方法和装置的制作方法
一种粗粒度动态带宽分配方法
一种基于hii/oi的粗粒度动态频率复用方法
旋流器溢流粒度跑粗自动检测方法
用于粗粒度动态可重构阵列的多模式数据传输互连器的制造方法
一种粗粒度可重构层次化的阵列寄存器文件结构的制作方法
一种基于粗集的多粒度空间方向关系不确定性评价方法
粗粒度可重配置计算结构中数据输入输出结构的制作方法
粗粒度可重配置计算结构中算术单元结构的制作方法
粗粒度和细粒度程序图相关技术
旋流器溢流粒度跑粗自动检测方法
粗粒度交通状态转换为细粒度速度的方法
用于粗粒度动态可重构阵列的多模式数据传输互连器的制造方法
一种粗粒度可重构层次化的阵列寄存器文件结构的制作方法
一种基于粗集的多粒度空间方向关系不确定性评价方法
基于大规模粗粒度嵌入式可重构系统及其处理方法
基于大规模粗粒度嵌入式可重构系统及其处理方法
基于大规模粗粒度嵌入式可重构系统及其处理方法
一种粗粒度可重构系统中的配置信息缓存装置及压缩方法
一种面向多个粗粒度动态可重构阵列的共享数据缓存装置及控制方法
粗糙度与粒度对照表相关技术
一种基于hii/oi的粗粒度动态频率复用方法
旋流器溢流粒度跑粗自动检测方法
用于粗粒度动态可重构阵列的多模式数据传输互连器的制造方法
一种粗粒度可重构层次化的阵列寄存器文件结构的制作方法
一种基于粗集的多粒度空间方向关系不确定性评价方法
粗粒度可重配置计算结构中算术单元结构的制作方法
基于大规模粗粒度嵌入式可重构系统及其处理方法
基于大规模粗粒度嵌入式可重构系统及其处理方法
基于大规模粗粒度嵌入式可重构系统及其处理方法
一种粗粒度可重构系统中的配置信息缓存装置及压缩方法