图片归类方法、图片归类系统、电子设备及存储介质与流程

文档序号:36831769发布日期:2024-01-26 16:46阅读:20来源:国知局
图片归类方法、图片归类系统、电子设备及存储介质与流程

本发明涉及图片处理,特别涉及一种图片归类方法、图片归类系统、电子设备及存储介质。


背景技术:

1、随着制造业数字化网络化智能化发展,传统制造业信息化、智能化程度与企业生产效率的联系越来越紧密。在工业焊接领域,需要对压力容器焊接部位进行质检,通过x射线设备采集焊缝部位射线图片,工人再经过在线评片系统判断焊缝区域是否存在缺陷。从而确保焊接部位达到质量要求,随着时间的推移,焊缝胶片的积累,形成了数十万张的原始图片。为了便于以后对原始图片的管理和问题追溯,需要将原始图片进行归档管理。

2、传统通过人工手动归档,不但效率低且容易出错。目前大多数中小企业仍然通过人工标注方式归档,需要耗费大量人力物力。由于工人长时间面对屏幕进行操作,会产生视觉疲劳。出现错误在所难免。并且由于工人技术水平参次不齐,归档质量无法保证。随着胶片数量的增加,人工效率将很难满足现实生产需要。人工方法对于小批量归档,准确率高。但是当图片数量达到数十万计时,人工标注归档方式,出错率也会随之升高,归档速度与投入人员数量成正比。大多数企业并无专职人员进行标注归档,对于大部分需要快速进行数字化应用的企业而言,时间成本较高。

3、传统的基于ocr自动归档方法,适用于字符位置及格式比较固定的场景如:发票归类,需要提前建立规则库,通过识别到图片字符串的位置和格式信息进行识别比对归档。现有场景由于生产产品的规格、批次不同,图像采集及命名方式的差异,图片的字符串位置及格式没有统一标准。针对这个情况,基于提前创建规则库的归档方法无法满足要求。

4、此外,现有的归档系统的长期维护与需求更新成本高。工业场景的生产需求并非一成不变,系统的生产环境维护需要投入一定的成本,同时当需求发生改变需要生产新产品时,非弹性的系统功能容易遭到淘汰,而不断更新则会产生不低的运营成本。因此在新的生产与功能需求产生时,如何降低其实现与维护的成本,仍然是数字化过程中的一个常见问题。

5、传统归档方法还存在数据迭代的兼容性低,归档准确率不会随着数据量的增长而增加的缺陷。传统归档方法设计之初,因为需要过多人工干预,新进入图片通过与事先创建的规则进行比对,与样本量的多少并无直接关联。规则库完全依靠人工进行更新迭代,当出现格式库中不存在的新的格式字符串时,无法兼容。并不能进行自我迭代,归类的准确率取决于人工规则库的完整程度,高度依赖人工经验,并没有充分利用已存在数据进行规则加强。这种方式在数据量较小的情况下有很好的效果,随着时间的推移数据量增加,可以自我迭代,同时兼容更多格式的方法能够获得更好的效果。传统的归档方式,需要业务人员对图片的归类格式有深入的理解,并具备一定的数据分析能力,将不同数据类别进行抽象,生成对应归档规则。未经学习训练的业务人员仍然难以掌握规则的创建使用与长期维护升级。


技术实现思路

1、本发明要解决的技术问题是为了克服现有技术中图片的手动归档效率低,传统的自动归档不适用于复杂场景的缺陷,提供一种图片归类方法、图片归类系统、电子设备及存储介质。

2、本发明是通过下述技术方案来解决上述技术问题:

3、本发明提供一种图片归类方法,所述图片归类方法包括:

4、获取待归类图片的字符串;

5、预推荐与所述字符串匹配的格式矩阵;所述格式矩阵用于表征字符串的格式类型信息;

6、将所述待归类图片归类至与所述字符串的拟合度大于第一预设阈值的目标格式矩阵。

7、较佳地,所述获取待归类图片的字符串的步骤包括:

8、对所述待归类图片进行ocr识别以得到所述字符串;和/或,

9、在所述获取待归类图片的字符串的步骤之后,所述图片归类方法还包括:

10、对所述字符串进行一致性检查以处理所述字符串的无效值和缺失值。

11、较佳地,在所述预推荐与所述字符串匹配的格式矩阵的步骤之前,所述图片归类方法还包括:

12、获取批量待归类图片并根据所述批量待归类图片的字符串格式类型创建初始字符串格式数组;

13、遍历所述批量待归类图片并更新所述初始字符串格式数组的权重以得到目标格式矩阵;所述目标格式矩阵包括权重大于第二预设阈值的初始字符串格式数组;所述权重用于表征所述初始字符串格式数组匹配到字符串数量。

14、较佳地,根据所述批量待归类图片的字符串格式类型创建初始字符串格式数组的步骤包括:

15、建立初始枚举值数据,并根据所述字符串的格式类型对所述初始枚举值数据进行赋值以得到初始字符串格式数组;

16、所述字符串的格式类型包括数据类型、大小写或特殊字符中的至少一种。

17、较佳地,在所述遍历所述批量待归类图片并更新所述初始字符串格式数组的权重以得到目标格式矩阵的步骤之后,所述图片归类方法还包括:

18、将若干目标格式矩阵保存为归类方案,以在对同类图片进行归类时推荐所述归类方案。

19、较佳地,所述预推荐与所述字符串匹配的格式矩阵的步骤包括:

20、遍历所述格式矩阵,并预推荐与所述字符串匹配的且权重最高的格式矩阵。

21、较佳地,所述图片归类方法还包括:

22、当不存在与所述字符串的拟合度大于第一预设阈值的格式矩阵时,根据所述字符串的格式类型创建新的格式矩阵。

23、本发明还提供一种图片归类系统,所述图片归类系统包括:

24、字符串获取模块,用于获取待归类图片的字符串;

25、格式匹配模块,用于预推荐与所述字符串匹配的格式矩阵;所述格式矩阵用于表征字符串的格式类型信息;

26、拟合归类模块,用于将所述待归类图片归类至与所述字符串的拟合度大于第一预设阈值的目标格式矩阵。

27、较佳地,所述字符串获取模块具体用于对所述待归类图片进行ocr识别以得到所述字符串;和/或,

28、所述图片归类系统还包括:

29、数据预处理模块,用于对所述字符串进行一致性检查以处理所述字符串的无效值和缺失值。

30、较佳地,所述图片归类方法还包括:

31、格式矩阵创建模块,用于获取批量待归类图片并根据所述批量待归类图片的字符串格式类型创建初始字符串格式数组;

32、格式矩阵动态排序模块,用于遍历所述批量待归类图片并更新所述初始字符串格式数组的权重以得到目标格式矩阵;所述目标格式矩阵包括权重大于第二预设阈值的初始字符串格式数组;所述权重用于表征所述初始字符串格式数组匹配到字符串数量。

33、较佳地,所述格式矩阵创建模块具体用于建立初始枚举值数据,并根据所述字符串的格式类型对所述初始枚举值数据进行赋值以得到初始字符串格式数组;

34、所述字符串的格式类型包括数据类型、大小写或特殊字符中的至少一种。

35、较佳地,所述图片归类系统还包括:

36、归类方案保存模块,用于将若干目标格式矩阵保存为归类方案,以在对同类图片进行归类时推荐所述归类方案。

37、较佳地,所述格式匹配模块具体用于遍历所述格式矩阵,并预推荐与所述字符串匹配的且权重最高的格式矩阵。

38、较佳地,所述格式矩阵创建模块还具体用于当不存在与所述字符串的拟合度大于第一预设阈值的格式矩阵时,根据所述字符串的格式类型创建新的格式矩阵。

39、本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并用于在处理器上运行的计算机程序,所述处理器执行计算机程序时实现如上所述的方法。

40、本发明还提供一种计算机存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的方法。

41、本发明的积极进步效果在于:

42、本发明提供的图片归类方法,在图片归类过程中,实现了关键的格式矩阵匹配与推荐的自动化,降低了用户的操作难度与技术需求,用户主要完成决策性的工作;在大量原始图片批量格式化匹配过程中,不断积累了多种不同格式的方案,对于大部分格式的字符串的匹配进行了足够的迭代和调整,目前已完成的归档格式中涉及的大部分形式已经可以稳定兼容;通过大量图片识别结果创建格式矩阵进行拟合度计算、实现大批量图片自动归档,随着图片数量的不断积累,格式矩阵在每次匹配结束后,对匹配次数进行累计排序,使得匹配次数更高的格式矩阵权重自动加强,提高了后续升级迭代的效率,提高了灵活性,降低了迭代成本。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1