基于FPGA的卷积神经网络加速器实现方法

文档序号：37903323发布日期：2024-05-09 21:47阅读：来源：国知局

技术特征：

1.基于fpga的卷积神经网络加速器实现方法，其特征在于：该方法包括以下步骤：

2.根据权利要求1所述的基于fpga的卷积神经网络加速器实现方法，其特征在于：所述自适应从三种数据加载方案中选择数据加载方案具体为：

3.根据权利要求1所述的基于fpga的卷积神经网络加速器实现方法，其特征在于：所述以基于行的数据流的形式读取分块输入特征数据到fpga片上存储器具体为：

4.根据权利要求1所述的基于fpga的卷积神经网络加速器实现方法，其特征在于：所述以流水线结构和并行化运算对输入特征数据和卷积核参数进行卷积运算操作具体为：

技术总结
本发明涉及一种基于FPGA的卷积神经网络加速器实现方法，属于人工智能技术领域。通过采用基于行的数据流加载、自适应数据加载方案、基于流水线结构的卷积运算并行化三种方式，有效地提高FPGA加速卷积神经网络的数据传输效率和计算性能。本发明根据FPGA硬件计算特性，设计卷积神经网络硬件加速器。首先通过采用基于行的数据流加载，减少了输入缓存数据对片上BRAM的需求，同时提前了网络中卷积层卷积计算开始时间；其次通过采用自适应数据加载方案，根据不同的网络层参数，采取相应合适的数据加载方案，有效减少了由数据加载带来的时间开销，提高加速器计算性能；最后采用基于流水线结构的卷积运算并行化设计，提高加速器的吞吐量。

技术研发人员：王华东,邱臻博,莫乙,杨健鹏
受保护的技术使用者：重庆邮电大学
技术研发日：
技术公布日：2024/5/8

完整全部详细技术资料下载

当前第2页1 2