基于GAP8微处理器的卷积神经网络部署方法与流程

文档序号:34594275发布日期:2023-06-28 19:48阅读:63来源:国知局
基于GAP8微处理器的卷积神经网络部署方法与流程

本发明涉及神经网络算法的部署技术,特别涉及一种基于gap8微处理器的卷积神经网络部署方法。


背景技术:

1、随着深度学习、并行计算和硬件技术的飞速发展,人工智能被推上了时代热潮,基于卷积神经网络的ai算法广泛应用于图像分类、目标检测、语义分割等任务。研究人员为了追求算法的极致性能,可以在实验室环境使用性能强大的gpu进行训练和推理,在某一任务领域取得sota水准。然而对于移动设备、微型嵌入式设备,由于计算能力、存储能力的限制难以部署复杂的神经网络模型,使得ai算法的落地对于嵌入式设备成为难题。对于这一问题,有两种解决方案,一是提高微处理器的计算性能,设计专用的硬件加速器;二是模型优化,通过模型参数压缩或者改进网络结构从而减小模型大小。现阶段,手机等移动平台的神经网络模型部署已经比较成熟,一方面由于开源框架的支持,具有一套完整的解决方案,另一方面手机处理器的能力在迅速提高。但是对于微控制器级别的嵌入式设备,性能低,目前并没有合适的神经网络部署方案。

2、传统的微处理器多采用cortex-m(arm设计的微控制器架构)mcu,如stm32,能耗随mcu主频提升增加很快,运行神经网络模型资源消耗巨大。risc-v是一种新兴的开放架构,具有精简指令集、低功耗、模块化、可扩展的特点,适合定制用于边缘计算场景的ai处理器。针对微型嵌入式设备,特别是微型无人机上神经网络的部署,现有处理器处理速度还有待提高。


技术实现思路

1、发明目的:针对以上问题,本发明目的是提供一种基于gap8微处理器的卷积神经网络部署方法。

2、技术方案:本发明的一种基于gap8微处理器的卷积神经网络部署方法,包括:

3、选取卷积神经网络,对卷积神经网络进行训练,将训练后的卷积神经网络作为浮点图像分类模型;

4、选取表征数据集,利用表征数据集将浮点图像分类模型进行全整数量化;

5、按照gap8微处理器对张量的执行顺序,对量化后的浮点图像分类模型的张量通道顺序进行调整;

6、对调整后的浮点图像分类模型进行解量化;

7、将解量化后的浮点图像分类模型搭载在gap8微处理器上,实现图像分类任务。

8、进一步,对卷积神经网络进行训练包括:

9、选取图像分类数据集,将图像分类数据集的图像进行预处理,将预处理后的图像分类数据集划分成训练集和验证集,将训练集输入至卷积神经网络,并利用imagenet数据集对卷积神经网络进行迁移学习。

10、进一步,选取表征数据集,利用表征数据集将浮点图像分类模型进行全整数量化包括:

11、将验证集的图像作为表征数据集输入至浮点图像分类模型,根据浮点图像分类模型的输入范围确定量化方案,若输入范围为[0,1],则选择非对称量化,若输入范围为[-1,1],则选择对称量化。

12、进一步,对量化后的浮点图像分类模型的张量通道顺序进行调整后还包括:将浮点图像分类模型进行层融合操作。

13、进一步,将解量化后的浮点图像分类模型搭载在gap8微处理器上包括:

14、根据输入图像的像素矩阵和浮点图像分类模型输出的张量矩阵,在gap8微处理器上分配存储空间,通过调用浮点图像分类模型执行的函数,启动浮点图像分类模型。

15、有益效果:本发明与现有技术相比,其显著优点是:本发明将pc端卷积神经网络进行优化,部署至gap8微处理器上,并搭载至无人机平台实时运行,执行图像分类任务,构建一个实时飞行计算平台。



技术特征:

1.基于gap8微处理器的卷积神经网络部署方法,其特征在于,包括:

2.根据权利要求1所述的卷积神经网络部署方法,其特征在于,对卷积神经网络进行训练包括:

3.根据权利要求2所述的卷积神经网络部署方法,其特征在于,选取表征数据集,利用表征数据集将浮点图像分类模型进行全整数量化包括:

4.根据权利要求1所述的卷积神经网络部署方法,其特征在于,对量化后的浮点图像分类模型的张量通道顺序进行调整后还包括:将浮点图像分类模型进行层融合操作。

5.根据权利要求1所述的卷积神经网络部署方法,其特征在于,将解量化后的浮点图像分类模型搭载在gap8微处理器上包括:


技术总结
本发明公开了基于GAP8微处理器的卷积神经网络部署方法,选取卷积神经网络,对卷积神经网络进行训练,将训练后的卷积神经网络作为浮点图像分类模型;选取表征数据集,利用表征数据集将浮点图像分类模型进行全整数量化;按照GAP8微处理器对张量的执行顺序,对量化后的浮点图像分类模型的张量通道顺序进行调整;对调整后的浮点图像分类模型进行解量化;将解量化后的浮点图像分类模型搭载在GAP8微处理器上,实现图像分类任务。本发明将PC端卷积神经网络进行优化,部署至GAP8微处理器上,并搭载至无人机平台实时运行,执行图像分类任务,构建一个实时飞行计算平台。

技术研发人员:陶智,单冯,吴文甲,杨明,罗军舟
受保护的技术使用者:南京逸智网络空间技术创新研究院有限公司
技术研发日:
技术公布日:2024/1/13
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1