一种神经网络压缩方法及装置与流程

文档序号：18743042发布日期：2019-09-21 02:01阅读：来源：国知局

技术总结
本发明公开了一种神经网络压缩方法及装置，其中方法为：将训练数据集中的每个样本值输入至预设的神经网络，对所述神经网络进行深度学习训练，通过所述神经网络输出的每个样本值的训练值，对所述神经网络中预设的至少一个参数进行更新；获取所述深度学习训练过程中，所述至少一个参数中每个参数的至少一个更新值；针对所述至少一个参数中的任一参数，对该参数的至少一个更新值进行变分后验推断，获取该参数的变分后验分布的均值，并用该均值替换该参数；对所述神经网络的所述至少一个进行聚类、裁剪、量化及霍夫曼编码，获得压缩后的神经网络；上述方法可应用于金融科技(Fintech)。

技术研发人员：姜迪
受保护的技术使用者：深圳前海微众银行股份有限公司
技术研发日：2019.06.06
技术公布日：2019.09.20