卷积神经网络的加速方法及装置与流程

文档序号:11920972阅读:来源:国知局

技术特征:

1.一种卷积神经网络的加速方法,其特征在于,所述方法包括:

在卷积神经网络中设置半停模块;

在所述卷积神经网络的预测过程中,当执行至所述半停模块时,计算所述预测过程当前的预测结果;

判断当前的所述预测结果是否满足预设预测要求;

当当前的所述预测结果满足所述预设预测要求时,停止所述预测过程,并将当前的所述预测结果作为所述卷积神经网络的最终预测结果,否则,继续执行所述预测过程。

2.根据权利要求1所述的方法,其特征在于,计算所述预测过程当前的预测结果,包括:

确定所述半停模块的上一运算层,根据所述上一运算层的输出结果和所述卷积神经网络的参数,计算当前的所述预测结果。

3.根据权利要求1所述的方法,其特征在于,所述方法还包括:

在所述卷积神经网络的前向传播训练过程中,当执行至所述半停模块时,计算所述前向传播训练过程当前的训练结果;

判断当前的所述训练结果是否满足预设训练要求;

当当前的所述训练结果满足所述预设训练要求时,停止所述前向传播训练过程,并确定前向传播路径,否则,继续执行所述前向传播训练过程。

4.根据权利要求3所述的方法,其特征在于,所述方法还包括:

在所述卷积神经网络的反向传播训练过程中,确定所述前向传播训练过程停止时对应的第一半停模块,以及所述前向传播路径中,与所述第一半停模块相邻的第二半停模块;

更新所述第一半停模块和所述第二半停模块之间的模型参数。

5.根据权利要求4所述的方法,其特征在于,所述方法还包括:

重复所述卷积神经网络的前向传播训练过程和反向传播训练过程,直至所述卷积神经网络收敛。

6.根据权利要求4所述的方法,其特征在于,更新所述第一半停模块和所述第二半停模块之间的模型参数,包括:

计算所述第一半停模块和所述第二半停模块之间的每一运算层的模型参数的梯度;

根据每一所述运算层的模型参数的梯度更新每一所述运算层的模型参数。

7.根据权利要求3所述的方法,其特征在于,计算所述前向传播训练过程当前的训练结果,包括:

确定所述半停模块的上一运算层,根据所述上一运算层的输出结果和所述卷积神经网络的参数,计算当前的所述训练结果。

8.一种卷积神经网络的加速装置,其特征在于,所述装置包括:

设置模块,用于在卷积神经网络中设置半停模块;

第一计算模块,用于在所述卷积神经网络的预测过程中,当执行至所述半停模块时,计算所述预测过程当前的预测结果;

第一判断模块,用于判断当前的所述预测结果是否满足预设预测要求;

结束控制模块,用于当当前的所述预测结果满足所述预设预测要求时,停止所述预测过程,并将当前的所述预测结果作为所述卷积神经网络的最终预测结果,否则,继续执行所述预测过程。

9.根据权利要求8所述的装置,其特征在于,所述第一计算模块具体用于:

确定所述半停模块的上一运算层,根据所述上一运算层的输出结果和所述卷积神经网络的参数,计算当前的所述预测结果。

10.根据权利要求8所述的装置,其特征在于,所述装置还包括:

第二计算模块,用于在所述卷积神经网络的前向传播训练过程中,当执行至所述半停模块时,计算所述前向传播训练过程当前的训练结果;

第二判断模块,用于判断当前的所述训练结果是否满足预设训练要求;

中止控制模块,用于当当前的所述训练结果满足所述预设训练要求时,停止所述前向传播训练过程,并确定前向传播路径,否则,继续执行所述前向传播训练过程。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1