一种用于图像数据识别模型构建的方法及系统与流程

文档序号：35577266发布日期：2023-09-24 19:33阅读：56来源：国知局

本技术涉及图像数据处理，尤其涉及一种用于图像数据识别模型构建的技术。

背景技术：

1、随着城市化进程的不断推进，通过在城市交通道路的路口、重点或重要场所安装摄像头，采集视频用于城市日常管理，比如道路交通安全管理、社会治安、消防预防等，已在当前的城市治理中发挥着不可替代的作用。

2、然而通常情况下只掌握摄像头的位置信息、编号信息和/或其组合，但对于摄像头采集的视频具体内容，需要识别后才能清楚，进一步地，才能根据识别后的内容进行分类，从而实现差异化监控、预防预警等。比如，基于消防预防目的，重点关注的是摄像头采集的主要内容包括加油站、油库等，基于社会治安目的，重点关注的是摄像头采集的主要内容是人员数量多、流动大的车站等。因为此类场景容易发生危险，此类场景内容被识别后应按照类别进行差异化监控、分类管理。如果统一交由后台工作人员进行人工甄别，需要投入极大的人力和物力，而且一旦人员疲劳，容易出错。

3、目前，已有基于深度神经网络的图像识别模型应用于城市管理，但此类模型通常采用的深度神经网络的结构深度或宽度非常大，包含大量参数，要处理的数据量大，不但对硬件要求高，而且处理时间长。另外，此类模型同时是基于大量样本训练而得到的，要求用于训练的数据集规模大，对于数据样本通常较少、部署的硬件计算存储能力有限的应用场景，训练耗时大，训练模型很难收敛，效果并不好，现有基于深度神经网络的图像识别模型并不太适用。

技术实现思路

1、本技术的目的是提供一种用于图像数据识别模型构建的方法及系统，在图像数据集小、计算存储资源有限的应用场景中，构建参数少、指标高的图像数据识别模型，用以对图像数据进行识别。

2、根据本技术的一个方面，提供了一种用于图像数据识别模型构建的方法，其特征在于，所述方法包括：

3、获取图像数据集，并对所述图像数据集的每个图像数据进行真值标注，得到包括真值标注的图像数据集；

4、基于所述图像数据集和教师网络模型，采用fsp方法对学生网络各层权重进行初始化，以得到至少两个网络结构相同的学生网络模型，其中，所述教师网络模型是经过预训练已完成各层权重初始化的神经网络，所述教师网络模型和所述学生网络包括相同数量的阶段，每个阶段包括若干数量的残差块，其中，所述教师网络模型的每个阶段包括的残差块的数量大于或者等于所述学生网络的对应阶段包括的残差块的数量；

5、基于包括真值标注的图像数据集，采用dml蒸馏方法训练每个学生网络模型，当训练后的学生网络模型都满足预设条件，将训练后的学生网络模型作为图像数据识别模型。

6、可选地，其中，在对所述图像数据集的每个图像数据进行真值标注后，采用gan网络对所述图像数据集进行图像数据扩充。

7、可选地，其中，所述基于所述图像数据集和教师网络模型，采用fsp方法对学生网络各层权重进行初始化，以得到至少两个网络结构相同的学生网络模型包括：

8、基于所述图像数据集和所述教师网络模型，同步训练所述学生网络，以迁移学习所述教师网络模型的知识；

9、分别计算所述教师网络模型和所述学生网络对应的每个阶段的fsp矩阵的l2损失，并根据全部l2损失，计算总的l2损失，作为第一损失；

10、若所述第一损失满足预设第一阈值，则完成训练，得到至少两个网络结构相同的学生网络模型，其中，每个学生网络模型之间的各层权重值不完全相同。

11、可选地，其中，若第一损失不满足预设第一阈值，所述方法还包括：

12、根据第一损失的计算公式，进行反向传播，更新学生网络各层权重值；

13、基于所述图像数据集和所述教师网络模型，同步训练各层权重值更新后的学生网络。

14、可选地，其中，所述fsp矩阵通过计算相应阶段的输入特征图和输出特征图的内积确定。

15、可选地，其中，所述基于包括真值标注的图像数据集，采用dml蒸馏方法训练每个学生网络模型，当训练后的学生网络模型都满足预设条件，将训练后的学生网络模型作为图像数据识别模型包括：

16、基于包括真值标注的图像数据集，同步相互训练每个学生网络模型；

17、判断每个学生网络模型的指标，若训练后的学生网络模型的指标满足预设条件，则完成训练，将训练后的学生网络模型作为图像数据识别模型。

18、可选地，其中，在判断每个学生网络模型的指标之前，所述方法还包括：

19、分别计算每个学生网络模型的kl散度，并计算每个学生网络模型的ce损失，根据每个学生网络模型的kl散度与ce损失，确定每个学生网络模型的第二损失；

20、当每个学生网络模型的第二损失都满足预设第二阈值，再判断每个学生网络模型的指标。

21、可选地，其中，每个学生网络模型的kl散度的计算包括：

22、基于图像数据集，得到每个学生网络模型对应所述图像数据集的预测结果；

23、基于学生网络模型的预测结果，计算每个学生网络模型的kl散度。

24、可选地，其中，若训练后的学生网络模型的指标不满足预设条件，所述方法还包括：

25、根据第二损失的计算公式，进行反向传播，更新所述学生网络模型各层权重值；

26、基于包括真值标注的图像数据集，同步训练各层权重值更新后的所述学生网络模型。

27、可选地，其中，所述指标至少包括以下一项：精确率、召回率、准确率、f-score。

28、可选地，所述一种用于图像数据识别模型构建的方法还包括：

29、将待识别图像数据输入所述图像数据识别模型，确定所述待识别图像数据的类别。

30、可选地，所述一种用于图像数据识别模型构建的方法还包括：

31、将待识别图像数据的类别作为其真值标注，扩充所述包括真值标注的图像数据集；

32、基于扩充后的包括真值标注的图像数据集、教师网络模型和学生网络，重新训练，以得到升级迭代的图像数据识别模型。

33、可选地，所述一种用于图像数据识别模型构建的方法还包括：

34、根据所述待识别图像数据的类别，对所述待识别图像数据进行差异化处理。

35、根据本技术的另一方面，提供了一种用于图像数据识别模型构建的系统，其特征在于，所述系统包括：

36、第一模块，用于获取图像数据集，并对所述图像数据集的每个图像数据进行真值标注，得到包括真值标注的图像数据集；

37、第二模块，用于基于所述图像数据集和教师网络模型，采用fsp方法对学生网络各层权重进行初始化，以得到至少两个网络结构相同的学生网络模型，其中，所述教师网络模型是经过预训练已完成各层权重初始化的神经网络，所述教师网络模型和所述学生网络包括相同数量的阶段，每个阶段包括若干数量的残差块，其中，所述教师网络模型的每个阶段包括的残差块的数量大于或者等于所述学生网络的对应阶段包括的残差块的数量；

38、第三模块，用于基于包括真值标注的图像数据集，采用dml蒸馏方法训练每个学生网络模型，当训练后的学生网络模型都满足预设条件，将训练后的学生网络模型作为图像数据识别模型。

39、与现有技术相比，本技术提供了一种用于图像数据识别模型构建的方法及系统。其方法包括：获取图像数据集，并对所述图像数据集的每个图像数据进行真值标注，得到包括真值标注的图像数据集；基于所述图像数据集和教师网络模型，采用fsp方法对学生网络各层权重进行初始化，以得到至少两个网络结构相同的学生网络模型，其中，所述教师网络模型是经过预训练已完成各层权重初始化的神经网络，所述教师网络模型和所述学生网络包括相同数量的阶段，每个阶段包括若干数量的残差块，其中，所述教师网络模型的每个阶段包括的残差块的数量大于或者等于所述学生网络的对应阶段包括的残差块的数量；基于包括真值标注的图像数据集，采用dml蒸馏方法训练每个学生网络模型，当训练后的学生网络模型都满足预设条件，将训练后的学生网络模型作为图像数据识别模型。通过该方法，采用fsp方法，从阶段相同但层数较深和/或各层尺寸较大的教师网络模型(大模型)迁移学习，得到至少两个结构相同且完成各层权重初始化的各阶段层数较浅和/或各层尺寸较小的学生网络模型(小模型)，其具备基本的特征提取能力，可避免因图像数据少无法很好地初始化神经网络等问题，且可降低训练难度，然后采用dml蒸馏方法训练每个学生网络模型，可在较短训练周期内得到指标可满足图像数据识别用途的图像数据识别模型，训练周期短、推理速度快、易部署，可适用于各种图像数据分类识别的应用场景。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：岳腾飞章曙涵王夷张剑吴翔
技术所有人：上海芯翌智能科技有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。