技术总结
本发明公开了一种神经网络压缩方法及装置,其中方法为:将训练数据集中的每个样本值输入至预设的神经网络,对所述神经网络进行深度学习训练,通过所述神经网络输出的每个样本值的训练值,对所述神经网络中预设的至少一个参数进行更新;获取所述深度学习训练过程中,所述至少一个参数中每个参数的至少一个更新值;针对所述至少一个参数中的任一参数,对该参数的至少一个更新值进行变分后验推断,获取该参数的变分后验分布的均值,并用该均值替换该参数;对所述神经网络的所述至少一个进行聚类、裁剪、量化及霍夫曼编码,获得压缩后的神经网络;上述方法可应用于金融科技(Fintech)。
技术研发人员:姜迪
受保护的技术使用者:深圳前海微众银行股份有限公司
技术研发日:2019.06.06
技术公布日:2019.09.20