基于深度优先数据调度的分块卷积计算专用架构和设备

文档序号:36505754发布日期:2023-12-28 14:34阅读:来源:国知局

技术特征:

1.一种基于深度优先数据调度的分块卷积计算专用架构,其特征在于,包括:block模块、block-wise convolution模块、weights模块、内部存储器和调度器模块;

2.根据权利要求1所述的基于深度优先数据调度的分块卷积计算专用架构,其特征在于,所述调度器模块,用于:

3.根据权利要求1所述的基于深度优先数据调度的分块卷积计算专用架构,其特征在于,所述所述内部存储器,包括sram1、sram2和sram3;

4.根据权利要求3所述的基于深度优先数据调度的分块卷积计算专用架构,其特征在于,所述调度器模块,还用于:

5.根据权利要求4所述的基于深度优先数据调度的分块卷积计算专用架构,其特征在于,所述调度器模块,还用于:

6.根据权利要求5所述的基于深度优先数据调度的分块卷积计算专用架构,其特征在于,所述调度器模块,还用于:

7.根据权利要求6所述的基于深度优先数据调度的分块卷积计算专用架构,其特征在于,所述调度器模块,还用于:

8.根据权利要求7所述的基于深度优先数据调度的分块卷积计算专用架构,其特征在于,所述sram3的每层池化层的池化结果分别设置存储区域。

9.根据权利要求1-8任一项所述的基于深度优先数据调度的分块卷积计算专用架构,其特征在于,所述架构用于实施基于深度优先数据调度的分块卷积方法,具体包括:

10.一种电子设备,包括:至少一个处理器;以及与至少一个所述处理器通信连接的存储器;其中,所述存储器存储有可被所述处理器执行的指令,所述指令用于被所述处理器执行以实现权利要求8所述的基于深度优先数据调度的分块卷积方法。

11.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于被所述计算机执行以实现权利要求8所述的基于深度优先数据调度的分块卷积方法。


技术总结
本发明属于深度学习领域,具体涉及了一种基于深度优先数据调度的分块卷积计算专用架构、方法和设备,旨在解决现有的GPU设备在进行前向推理时,难以避免大量的排外数据交互影像卷积推理效率的问题。本发明包括:将训练好的卷积模型的模型结构存入调度器,将权重参数存入Weights模块,block读取当前输入特征图像的一个block大小的特征作为特征图,Block‑wise Convolution模块调用特征图和权重参数,完成当前层运算,将当前层运算结果存入内部存储器中,优先进行下级网络的计算,若当前层的特征图小于一个block大小。本发明提高了卷积推理的效率,且对小模型仅需少量内部存储器即可实现高效推理。

技术研发人员:尹志刚,张鹏
受保护的技术使用者:中国科学院自动化研究所
技术研发日:
技术公布日:2024/1/15
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1