一种低比特神经网络输入源相加层优化的实现方法与流程

文档序号：35016064发布日期：2023-08-04 07:10阅读：来源：国知局

技术特征：

1.一种低比特神经网络输入源相加层优化的实现方法，其特征在于，所述方法通过使用simd指令对数据进行并行计算，对低比特数据进行神经网络输入源相加加速，即优化数据比特bit位宽，将低bit数据相加，结果移位，并利用银行家舍入bankround计算逻辑，对结果进行移位，得到小数与奇偶标志位，判断最后是否需要加1，全部计算基于simd低比特指令，将乘法转换为移位指令，浮点转换为低比特整形，通过&操作，完成对结果的奇偶判断，最终实现低比特神经网络输入源相加层优化。

2.根据权利要求1所述的一种低比特神经网络输入源相加层优化的实现方法，其特征在于，所述方法包括：

3.根据权利要求2所述的一种低比特神经网络输入源相加层优化的实现方法，其特征在于，所述方法包括优化数据bit位宽以及bankround计算逻辑，进一步包括：

4.根据权利要求3所述的一种低比特神经网络输入源相加层优化的实现方法，其特征在于，所述方法进一步包括以下步骤：

5.根据权利要求4所述的一种低比特神经网络输入源相加层优化的实现方法，其特征在于，所述方法以二进制显示4比特数据，设f0+f1＝1111+1111，进一步包括：

6.根据权利要求3所述的一种低比特神经网络输入源相加层优化的实现方法，其特征在于，所述方法中原始数据计算逻辑为：

7.根据权利要求1所述的一种低比特神经网络输入源相加层优化的实现方法，其特征在于，所述方法通过使用simd指令对数据进行并行计算，每个寄存器具有512bit位宽，float类型为32bit位宽，一次性只能处理16个数。

技术总结
本发明提供一种低比特神经网络输入源相加层优化的实现方法，所述方法通过使用SIMD指令对数据进行并行计算，对低比特数据进行神经网络输入源相加层加速，即优化数据比特bit位宽，将低bit数据相加，结果移位，以及利用bankround计算逻辑，对结果进行移位，得到小数与奇偶标志位，判断最后是否需要加1，全部计算基于SIMD低比特指令，将乘法转换为移位指令，浮点转换为低比特整形，通过&操作，完成对结果的奇偶判断，最终实现低比特神经网络输入源相加层优化。

技术研发人员：倪照风
受保护的技术使用者：合肥君正科技有限公司
技术研发日：
技术公布日：2024/1/14

完整全部详细技术资料下载

当前第2页1 2