1.一种轻量型图像分类硬件加速器,其特征在于,所述图像分类硬件加速器包括sd卡、中央处理器、双数据速率存储器和硬件加速器,所述sd卡的输出端与所述中央处理器的输入端连接,所述中央处理器的输出端与所述双数据速率存储器的第一输入端连接,所述双数据速率存储器的输出端与所述硬件加速器的输入端连接,所述硬件加速器的输出端与所述双数据速率存储器的第二输入端连接,其中:
2.根据权利要求1所述的图像分类硬件加速器,其特征在于,所述硬件加速器包括控制模块、存储模块、缓存模块和计算模块,所述控制模块的第一输出端与所述缓存模块的第一输入端连接,所述控制模块的第二输出端与所述计算模块的第一输入端连接,所述缓存模块的第一输出端与所述计算模块的第二输入端连接,所述计算模块的输出端与所述缓存模块的第二输入端连接,所述缓存模块的第二输出端与所述存储模块的输入端连接,所述存储模块的输出端与所述缓存模块的第三输入端连接,其中:
3.根据权利要求2所述的图像分类硬件加速器,其特征在于,所述缓存模块包括权值缓存器、激活缓存器和输出缓存器,其中:
4.根据权利要求2所述的图像分类硬件加速器,其特征在于,所述计算模块包括卷积阵列、加法树模块、池化模块、激活模块和通道混洗模块,所述卷积阵列的输出端与所述加法树模块的输入端连接,所述加法树模块的输出端与所述池化模块的输入端连接,所述池化模块的输出端与所述激活模块的输入端连接,所述激活模块的输出端与所述通道混洗模块的输入端连接,其中:
5.根据权利要求4所述的图像分类硬件加速器,其特征在于,所述卷积阵列包括第一图片处理单元、第二图片处理单元和第三图片处理单元,所述第一图片处理单元、所述第二图片处理单元和所述第三图片处理单元均包括若干乘法器单元,所述第一图片处理单元、所述第二图片处理单元和所述第三图片处理单元通过并行方式连接。
6.一种轻量型图像分类硬件加速器的加速方法,其特征在于,所述方法包括:
7.根据权利要求6所述的方法,其特征在于,所述基于所述训练后的卷积核权值和所述特征图像数据进行图像分类计算处理,包括:
8.根据权利要求6所述的方法,其特征在于,所述引入加速器,对所述图像分类计算处理进行加速,得到最终的特征图像数据分类计算结果,包括:
9.根据权利要求8所述的方法,其特征在于,所述对所述累加后的乘法计算结果进行最大池化处理,得到最大池化后的乘法计算结果,包括:
10.根据权利要求8所述的方法,其特征在于,所述对所述映射后的乘法计算结果进行通道混洗处理,得到最终的特征图像数据分类计算结果,包括: