1.一种适用于边缘计算平台的spark卷积神经网络系统,其特征在于,包括:
fire模块,其包括:
压缩层,用于对输入模块的特征图进行通道层面的组合以降低特征图的通道数量;所述压缩层包括多个第一尺寸的第一卷积核;
扩展层,用于对所述特征图的通道数量进行扩展;所述扩展层包括数量相同的第一尺寸的第一卷积核以及第二尺寸的第二卷积核;其中,所述第二卷积核为深度可分离卷积核。
2.根据权利要求1所述的系统,其特征在于,所述第一卷积核的尺寸为1×1;所述第二卷积核的尺寸为3×3。
3.根据权利要求1所述的系统,其特征在于,包括:
若作为深度可分离卷积核的第二卷积核的尺寸为dk×dk×m,则该深度可分离卷积核能分离出尺寸为1×1×m的卷积核以及尺寸为dk×dk×1的卷积核。
4.根据权利要求1所述的系统,其特征在于,所述spark卷积神经网络系统包括:卷积层、激活层、池化层。
5.根据权利要求1所述的系统,其特征在于,所述spark卷积神经网络系统包括:6层spark结构、2层卷积模型、及3层池化层。
6.根据权利要求5所述的系统,其特征在于,所述卷积模型包括尺寸为3×3卷积,其步长为1,输入数据张量为32×32的三通道图像。
7.根据权利要求5所述的系统,其特征在于,所述池化层包括尺寸为2×2的最大池化层,其窗口滑动步长为2。
8.一种基于spark卷积神经网络模型的加速器电路,其特征在于,包括:
多个计算引擎,映射至同一个fpga芯片上,且每个所述计算引擎对应如权利要求1所述的spark卷积神经网络模型中的一层网络的计算;
片上缓存单元,用于输入特征图缓存、权重值缓存、中间值缓存、及输出特征图缓存;
流水线控制单元,用于控制所述计算引擎不同网络层的流水线式工作;
片外存储单元;位于所述fpga芯片外;
存储控制单元,其设有内存存取接口,用于实现片外存储单元和片上缓存单元之间的数据交互。
9.根据权利要求8所述的电路,其特征在于,所述片上缓存单元分为读和写两组,用以将前一级的写操作和后一级的读操作分开。
10.根据权利要求8所述的电路,其特征在于,在所述加速器电路开始工作时,所述存储控制单元将第一层网络运行所需的权重参数和输入图像从所述片外存储单元读取到所述片上存缓存元中,以供所述计算引擎根据权重参数和输入图像进行第一层网络的卷积计算。