一种基于图像分割大模型的快捷语义标注方法与流程

文档序号：35668696发布日期：2023-10-07 13:25阅读：38来源：国知局

导航： X技术> 最新专利>计算;推算;计数设备的制造及其应用技术

本发明涉及到图像处理，尤其涉及到一种基于图像分割大模型的快捷语义标注方法。

背景技术：

1、现有生成像素级别的图像分割标注方式是：人工控制标注控件在图像上绘制出目标轮廓，然后提取目标轮廓进行对应的标注。如使用labelme软件对图像进行标注处理，labelme是一种开源的图像标注工具。

2、sam是由meta开源的图像分割大模型，其应用在计算机视觉领域。sam可在无任何标注的情况下，对图像中的物体进行分割。

3、labelme是通过人工进行图像分割的，且无法产生对应的类别信息(标注)，还需要在后续进行人为选择并补全类别信息，并且每次结果输出后都要进行对应的选择和标注，这在大批量分割标注工作中，非常繁琐耗时。

4、因此，亟需一种能够解决以上一种或多种问题的基于图像分割大模型的快捷语义标注方法。

技术实现思路

1、为解决现有技术中存在的一种或多种问题，本发明提供了一种基于图像分割大模型的快捷语义标注方法。本发明为解决上述问题采用的技术方案是：一种基于图像分割大模型的快捷语义标注方法，所述方法包括：s010，素材载入，读取素材图片并将所述素材图片载入至图像交互端；

2、s020，标注目标，用户通过所述图像交互端选择要进行标注的目标范围内的任意一个点，此点记为目标点；

3、s021，对用户选择的所述目标点进行解析，获取所述目标点在对应的所述素材图片上的位置，此位置记为目标点位置，将所述素材图片和对应的所述目标点位置送入到sam模型中；

4、s030，基于sam的分割计算，sam模型依据载入的所述素材图片和对应的所述目标点位置进行分割计算，并在计算后向所述图像交互端返回输出最可能分割区域结果；

5、s040，输入标签，用户依据返回到所述图像交互端的所述最可能分割区域结果进行类别标签填入，填入到所述类别标签中的信息为所述最可能分割区域结果所属的类别；

6、s050，当前数据标注完成，在用户完成当前的所述类别标签的填入后，对填入结果进行存储并形成标注文件；

7、s060，是否继续标注，若当前的所述素材图片需要继续进行标注则回到s020步骤中继续执行标注，若当前的所述素材图片无需再进行标注，则结束当前标注。

8、在一些实施例中，还包括：s011，图像交互端将载入的所述素材图片展示给用户。

9、在一些实施例中，还包括：s031，在所述分割计算后，获取当前的所述目标点位置的分割区域可能结果；

10、s032，对所有的所述分割区域可能结果进行提取，获取所述最可能分割区域结果。

11、进一步地，还包括：s033，对所述最可能分割区域结果进行格式转换，将其转换为预设的标准格式；

12、s034，将所述最可能分割区域结果返回至所述图像交互端，并提示用户输入区域类别标签。

13、在一些实施例中，还包括：s051，所述最可能分割区域结果在所述素材图片上对应有标注区域，所述类别标签对应有标注类别，后台将所述标注区域和所述标注类别转换成预设的ai模型标准格式，并在转换后存储到所述标注文件中。

14、以及一种装置，其包括存储器和处理器，所述存储器上存储有能够被处理器加载并执行如上述的基于图像分割大模型的快捷语义标注方法的计算机程序。

15、以及一种可读存储介质，所述存储介质存储有能够被处理器加载并执行的计算机程序，所述计算机程序为上述的基于图像分割大模型的快捷语义标注方法。

16、本发明取得的有益价值是：本发明通过使用上述方法/装置/存储介质，实现对载入图像进行精准分割，并自动获取用户在素材图片点击处对应的目标区域，避免了繁琐的轮廓绘制。配合sam模型进行工作，提高了用户通过鼠标单击素材图片以获取标注区域的效率和精度，并实现人工快速标注的效果，提高单人的标注效果、效率和便利性，极大地降低了人工标注ai数据的成本。以上极大地提高了本发明的实用性。

技术特征：

1.一种基于图像分割大模型的快捷语义标注方法，其特征在于，所述方法包括：s010，素材载入，读取素材图片并将所述素材图片载入至图像交互端；

2.根据权利要求1所述的一种基于图像分割大模型的快捷语义标注方法，其特征在于，还包括：s011，图像交互端将载入的所述素材图片展示给用户。

3.根据权利要求1所述的一种基于图像分割大模型的快捷语义标注方法，其特征在于，还包括：s031，在所述分割计算后，获取当前的所述目标点位置的分割区域可能结果；

4.根据权利要求3所述的一种基于图像分割大模型的快捷语义标注方法，其特征在于，还包括：s033，对所述最可能分割区域结果进行格式转换，将其转换为预设的标准格式。

5.根据权利要求4所述的一种基于图像分割大模型的快捷语义标注方法，其特征在于，还包括：s034，将所述最可能分割区域结果返回至所述图像交互端，并提示用户输入区域类别标签。

6.根据权利要求1所述的一种基于图像分割大模型的快捷语义标注方法，其特征在于，还包括：s051，所述最可能分割区域结果在所述素材图片上对应有标注区域，所述类别标签对应有标注类别，后台将所述标注区域和所述标注类别转换成预设的ai模型标准格式，并在转换后存储到所述标注文件中。

技术总结
本发明公开了一种基于图像分割大模型的快捷语义标注方法，所述方法包括：S010，素材载入；S020，标注目标；S030，基于SAM的分割计算，SAM模型依据载入的所述素材图片和对应的所述目标点位置进行分割计算，并在计算后向所述图像交互端返回输出最可能分割区域结果；S040，输入标签，用户依据返回到所述图像交互端的所述最可能分割区域结果进行类别标签填入；S050，当前数据标注完成，对填入结果进行存储并形成标注文件；S060，是否继续标注，若当前的所述素材图片需要继续进行标注则回到S020步骤中继续执行标注，若当前的所述素材图片无需再进行标注，则结束当前标注。避免了图像分割过程中繁琐的轮廓绘制，并实现快速、精准的图像标注和降低人工标注成本。

技术研发人员：宋航宇,闫锐
受保护的技术使用者：深圳市奇航疆域技术有限公司
技术研发日：
技术公布日：2024/1/15

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：宋航宇闫锐
技术所有人：深圳市奇航疆域技术有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。