一种轻量型图像分类硬件加速器及其加速方法

文档序号:37943906发布日期:2024-05-11 00:25阅读:来源:国知局

技术特征:

1.一种轻量型图像分类硬件加速器,其特征在于,所述图像分类硬件加速器包括sd卡、中央处理器、双数据速率存储器和硬件加速器,所述sd卡的输出端与所述中央处理器的输入端连接,所述中央处理器的输出端与所述双数据速率存储器的第一输入端连接,所述双数据速率存储器的输出端与所述硬件加速器的输入端连接,所述硬件加速器的输出端与所述双数据速率存储器的第二输入端连接,其中:

2.根据权利要求1所述的图像分类硬件加速器,其特征在于,所述硬件加速器包括控制模块、存储模块、缓存模块和计算模块,所述控制模块的第一输出端与所述缓存模块的第一输入端连接,所述控制模块的第二输出端与所述计算模块的第一输入端连接,所述缓存模块的第一输出端与所述计算模块的第二输入端连接,所述计算模块的输出端与所述缓存模块的第二输入端连接,所述缓存模块的第二输出端与所述存储模块的输入端连接,所述存储模块的输出端与所述缓存模块的第三输入端连接,其中:

3.根据权利要求2所述的图像分类硬件加速器,其特征在于,所述缓存模块包括权值缓存器、激活缓存器和输出缓存器,其中:

4.根据权利要求2所述的图像分类硬件加速器,其特征在于,所述计算模块包括卷积阵列、加法树模块、池化模块、激活模块和通道混洗模块,所述卷积阵列的输出端与所述加法树模块的输入端连接,所述加法树模块的输出端与所述池化模块的输入端连接,所述池化模块的输出端与所述激活模块的输入端连接,所述激活模块的输出端与所述通道混洗模块的输入端连接,其中:

5.根据权利要求4所述的图像分类硬件加速器,其特征在于,所述卷积阵列包括第一图片处理单元、第二图片处理单元和第三图片处理单元,所述第一图片处理单元、所述第二图片处理单元和所述第三图片处理单元均包括若干乘法器单元,所述第一图片处理单元、所述第二图片处理单元和所述第三图片处理单元通过并行方式连接。

6.一种轻量型图像分类硬件加速器的加速方法,其特征在于,所述方法包括:

7.根据权利要求6所述的方法,其特征在于,所述基于所述训练后的卷积核权值和所述特征图像数据进行图像分类计算处理,包括:

8.根据权利要求6所述的方法,其特征在于,所述引入加速器,对所述图像分类计算处理进行加速,得到最终的特征图像数据分类计算结果,包括:

9.根据权利要求8所述的方法,其特征在于,所述对所述累加后的乘法计算结果进行最大池化处理,得到最大池化后的乘法计算结果,包括:

10.根据权利要求8所述的方法,其特征在于,所述对所述映射后的乘法计算结果进行通道混洗处理,得到最终的特征图像数据分类计算结果,包括:


技术总结
本申请公开了一种轻量型图像分类硬件加速器及其加速方法,图像分类硬件加速器包括SD卡、中央处理器、双数据速率存储器和硬件加速器;其中,硬件加速器引入卷积阵列与通道混洗模块。方法包括:获取训练后的卷积核权值和所述特征图像数据;基于训练后的卷积核权值和特征图像数据进行图像分类计算处理;引入加速器,对图像分类计算处理进行加速,得到最终的特征图像数据分类计算结果。本申请实施例能够在提高图像分类硬件的计算效率的同时提高图像分类识别的准确率。本申请可以广泛应用于图像数据处理技术领域。

技术研发人员:陈弟虎,李林双,粟涛
受保护的技术使用者:中山大学
技术研发日:
技术公布日:2024/5/10
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1