一种低比特神经网络输入源相加层优化的实现方法与流程

文档序号:35016064发布日期:2023-08-04 07:10阅读:来源:国知局

技术特征:

1.一种低比特神经网络输入源相加层优化的实现方法,其特征在于,所述方法通过使用simd指令对数据进行并行计算,对低比特数据进行神经网络输入源相加加速,即优化数据比特bit位宽,将低bit数据相加,结果移位,并利用银行家舍入bankround计算逻辑,对结果进行移位,得到小数与奇偶标志位,判断最后是否需要加1,全部计算基于simd低比特指令,将乘法转换为移位指令,浮点转换为低比特整形,通过&操作,完成对结果的奇偶判断,最终实现低比特神经网络输入源相加层优化。

2.根据权利要求1所述的一种低比特神经网络输入源相加层优化的实现方法,其特征在于,所述方法包括:

3.根据权利要求2所述的一种低比特神经网络输入源相加层优化的实现方法,其特征在于,所述方法包括优化数据bit位宽以及bankround计算逻辑,进一步包括:

4.根据权利要求3所述的一种低比特神经网络输入源相加层优化的实现方法,其特征在于,所述方法进一步包括以下步骤:

5.根据权利要求4所述的一种低比特神经网络输入源相加层优化的实现方法,其特征在于,所述方法以二进制显示4比特数据,设f0+f1=1111+1111,进一步包括:

6.根据权利要求3所述的一种低比特神经网络输入源相加层优化的实现方法,其特征在于,所述方法中原始数据计算逻辑为:

7.根据权利要求1所述的一种低比特神经网络输入源相加层优化的实现方法,其特征在于,所述方法通过使用simd指令对数据进行并行计算,每个寄存器具有512bit位宽,float类型为32bit位宽,一次性只能处理16个数。


技术总结
本发明提供一种低比特神经网络输入源相加层优化的实现方法,所述方法通过使用SIMD指令对数据进行并行计算,对低比特数据进行神经网络输入源相加层加速,即优化数据比特bit位宽,将低bit数据相加,结果移位,以及利用bankround计算逻辑,对结果进行移位,得到小数与奇偶标志位,判断最后是否需要加1,全部计算基于SIMD低比特指令,将乘法转换为移位指令,浮点转换为低比特整形,通过&操作,完成对结果的奇偶判断,最终实现低比特神经网络输入源相加层优化。

技术研发人员:倪照风
受保护的技术使用者:合肥君正科技有限公司
技术研发日:
技术公布日:2024/1/14
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1