1.一种低比特神经网络输入源相加层优化的实现方法,其特征在于,所述方法通过使用simd指令对数据进行并行计算,对低比特数据进行神经网络输入源相加加速,即优化数据比特bit位宽,将低bit数据相加,结果移位,并利用银行家舍入bankround计算逻辑,对结果进行移位,得到小数与奇偶标志位,判断最后是否需要加1,全部计算基于simd低比特指令,将乘法转换为移位指令,浮点转换为低比特整形,通过&操作,完成对结果的奇偶判断,最终实现低比特神经网络输入源相加层优化。
2.根据权利要求1所述的一种低比特神经网络输入源相加层优化的实现方法,其特征在于,所述方法包括:
3.根据权利要求2所述的一种低比特神经网络输入源相加层优化的实现方法,其特征在于,所述方法包括优化数据bit位宽以及bankround计算逻辑,进一步包括:
4.根据权利要求3所述的一种低比特神经网络输入源相加层优化的实现方法,其特征在于,所述方法进一步包括以下步骤:
5.根据权利要求4所述的一种低比特神经网络输入源相加层优化的实现方法,其特征在于,所述方法以二进制显示4比特数据,设f0+f1=1111+1111,进一步包括:
6.根据权利要求3所述的一种低比特神经网络输入源相加层优化的实现方法,其特征在于,所述方法中原始数据计算逻辑为:
7.根据权利要求1所述的一种低比特神经网络输入源相加层优化的实现方法,其特征在于,所述方法通过使用simd指令对数据进行并行计算,每个寄存器具有512bit位宽,float类型为32bit位宽,一次性只能处理16个数。