技术特征:
技术总结
本申请提供了一种神经网络全连接层的元素运算方法及相关产品,所述方法应用运算单元,运算单元接收第一矩阵H*W以及第二矩阵W*P;运算单元确定W为非4的倍数时,分配m个线程,运算单元将第一矩阵H*W拆分成m个第一区块;将第二矩阵W*P拆分成m个第二区块,其中r为W除以4的余数;运算单元将m个第一区块以及m个第二区块按顺序分配给多个线程,每个线程并行计算分配的第一区块与第二区块中元素的内积得到运算结果,将所有线程的运算结果排列得到矩阵乘积结果。本申请提供的技术方案具有功耗低的优点。
技术研发人员:曾集伟
受保护的技术使用者:曾集伟
技术研发日:2019.01.03
技术公布日:2019.06.14