技术特征:
技术总结
本发明提供了一种基于变分推断的逐层神经网络剪枝方法和系统,该方法包括:通过采样方式在神经网络中注噪声,得到噪化的神经网络;根据预设的目标函数对噪化的神经网络的权重进行训练,得到训练后的神经网络权重和训练后的神经网络;根据变分推断得到的变分下界,训练注入的乘性高斯噪声对应的噪声参数,得到训练后的噪声参数;基于所述训练后的噪声参数、训练后的神经网络权重,通过阈值函数逐层删除所述训练后的神经网络中相应的神经元或者卷积核。本发明的方法中,所注入的噪声在训练过程中融入了神经网络的层级关系,使得在剪枝过程中充分考虑层间的依赖,继而保证了在高度剪枝下神经网络的输出结果依旧具备鲁棒性。
技术研发人员:王延峰;周越夫;张娅
受保护的技术使用者:上海交通大学
技术研发日:2019.03.14
技术公布日:2019.07.16