一种基于权重归一化的深度神经网络压缩方法与流程

文档序号:18756417发布日期:2019-09-24 22:29阅读:来源:国知局

技术特征:

技术总结
本发明公开了一种基于权重归一化的深度神经网络压缩方法,权重的量化可以分解为三个步骤,首先对权重进行归一化,然后基于最小量化误差把权重量化至极低的比特,最后进行反归一化得到量化的权重,使用量化的权重进行神经网络的正向传播。为了训练量化权重的神经网络,本发明对阶跃形式的量化函数的导数进行近似,从而使得神经网络的梯度可以进行反向传播,梯度累加在浮点权重上。基于权重归一化的权重量化在一定程度上避免了权重的长尾分布,从而减小了量化误差,进而提高了模型的性能。本发明可以把现在的一些主流神经网络的权重压缩至2比特、3比特,同时保证模型的性能没有较大的损失。

技术研发人员:李武军;蔡文朴
受保护的技术使用者:南京大学
技术研发日:2019.06.28
技术公布日:2019.09.24
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1