图片格式转换方法、装置及计算机存储介质与流程

文档序号：21732390发布日期：2020-08-05 01:27阅读：178来源：国知局

本发明涉及数据处理技术领域，特别是一种图片格式转换方法、装置及计算机存储介质。

背景技术：

随着现代社会的发展，使得计算机技术以及相应的软件产品一直处于增长的状态。各行各业在生产过程中均需要使用软件产品，面对庞大的软件产品需求。例如，在人工智能(ai)开发中，后端使用深度学习模型进行训练，训练使用的资料需要统一格式。软件之间的处理对象的格式相容性成为各行各业所需要解决的问题。

技术实现要素：

鉴于上述状况，有必要提供一种图片格式转换方法、装置及计算机存储介质，通过转换图片标注格式使之兼容深度学习模型训练的软件，以解决上述问题。

本发明第一方面提供了一种图片格式转换方法，用于转换图片的格式，所述图片格式转换方法包括如下步骤：标注待转换图片；获取标注后的所述待转换图片；判断标注后的所述待转换图片的标注部位是否为正四边形；若是，则将所述待转换图片根据预设的第一转换规则进行图片格式转换；若否，则将所述待转换图片根据预设的第二转换规则进行图片格式转换。

优选的，所述第一转换规则为标注所述待换转图片的标注部位的其中一个点的坐标得到第一格式的点坐标值，根据预设的第一映射关系表将所述第一格式的点坐标值转换为第二格式的点坐标值，所述第一映射关系表中设置有所述第一格式的一个点坐标与所述第二格式的至少两个点坐标的转换关系；所述第二格式中所述至少两个点坐标是通过所述第一格式点坐标中x坐标、y坐标以及标注部分宽度、高度得到的。

优选的，所述第二转换规则为标注所述待转换图片的至少四个点的坐标值得到第一格式的点坐标，根据预设的第二映射关系表将所述第一格式的点坐标转换为第二格式的点坐标，所述第二映射关系表中设置有所述第一格式的至少四个点的点坐标值的记录方式及将所述第一格式的点坐标转换为所述第二格式的点坐标后所述四个点的点坐标值的记录方式；所述第一格式的至少四个点的坐标排列方式为先记录所述至少四个点的x坐标，再记录所述至少四个点的y坐标；转换为所述第二格式后，所述至少四个点的点坐标的排列方式为依次记录每个点的x坐标、y坐标。

优选的，所述标注待转换图片之前，还包括如下步骤：获取所有所述待转化图片；分配所述待转化图片为训练图片和验证图片，并将所述训练图片和所述验证图片分别存储于训练文件和验证文件；分别标注所述训练图片和所述验证图片。

优选的，所述分别标注所述训练图片和所述验证图片，包括如下步骤：分批标注所述训练图片和所述验证图片，每批标注后的图片形成一子文件；将多个所述子文件进行去噪后分别合并为一个训练目标文件和验证目标文件。

本发明第二方面提供了一种图片格式转换装置，用于转换图片的格式，所述图片格式转换装置包括：处理器；以及存储器，所述存储器中存储有多个程序模块，多个所述程序模块由所述处理器运行并执行如下步骤：标注待转换图片；获取标注后的所述待转换图片；判断标注后的所述待转换图片的标注部位是否为正四边形；若是，则将所述待转换图片根据预设的第一转换规则进行图片格式转换；若否，则将所述待转换图片根据预设的第二转换规则进行图片格式转换。

优选地，所述第一转换规则为标注所述待换转图片的标注部位的其中一个点的坐标得到第一格式的点坐标值，根据预设的第一映射关系表将所述第一格式的点坐标值转换为第二格式的点坐标值，所述第一映射关系表中设置有所述第一格式的一个点坐标与所述第二格式的至少两个点坐标的转换关系；所述第二格式中所述至少两个点坐标是通过所述第一格式点坐标中x坐标、y坐标以及标注部分宽度、高度得到的。

优选地，所述第二转换规则为标注所述待转换图片的至少四个点的坐标值得到第一格式的点坐标，根据预设的第二映射关系表将所述第一格式的点坐标转换为第二格式的点坐标，所述第二映射关系表中设置有所述第一格式的至少四个点的点坐标值的记录方式及将所述第一格式的点坐标转换为所述第二格式的点坐标后所述四个点的点坐标值的记录方式；所述第一格式的至少四个点的坐标排列方式为先记录所述至少四个点的x坐标，再记录所述至少四个点的y坐标；转换为所述第二格式后，所述至少四个点的点坐标的排列方式为依次记录每个点的x坐标、y坐标。

优选地，多个所述程序模块由所述处理器运行并还执行如下步骤：获取所有所述待转化图片；分配所述待转化图片为训练图片和验证图片，并将所述训练图片和所述验证图片分别存储于训练文件和验证文件；分批标注所述训练图片和所述验证图片，每批标注后的图片形成一子文件；将多个所述子文件进行去噪后分别合并为一个训练目标文件和验证目标文件。

本发明第三方面还提供了一种计算机存储介质，所述计算机存储介质存储有计算机程序代码，当所述计算机程序代码在计算设备上运行时，导致所述计算设备执行上述所述的图片格式转换方法。

本发明提供的图片格式转换方法，首先依据预设的判断规则判断标注后的训练图片和验证图片的标注部位是否正四边形。若为正四边形，则利用第一转换规则将训练图片和验证图片转换为目标格式图片；若为多边形，则利用第二转换规则将训练图片和验证图片转换为目标格式图片。本发明还对应提供了一种图片格式转换装置和计算机存储介质。利用上述图片格式转换方法和装置，将用于ai深度学习的图片进行格式转换，使其兼容深度学习模型，得到准确度更高的用于深度学习的网络模型。

附图说明

图1是本发明一个实施例中的图片格式转换装置的架构示意图。

图2是本发明一个实施例中的图片格式转换装置内的图片格式转换系统的模块示意图。

图3是本发明一个实施例中的图片格式转换方法的图片标注过程的流程示意图。

图4是本发明一个实施例中的图片格式转换方法的图片格式转换过程的流程示意图。

主要元件符号说明

如下具体实施方式将结合上述附图进一步说明本发明。

具体实施方式

为了能够更清楚地理解本发明的上述目的、特征和优点，下面结合附图和具体实施方式对本发明进行详细描述。需要说明的是，在不冲突的情况下，本申请的实施方式及实施方式中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本发明，所描述的实施方式仅是本发明一部分实施方式，而不是全部的实施方式。基于本发明中的实施方式，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施方式，都属于本发明保护的范围。

除非另有定义，本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施方式的目的，不是旨在限制本发明。

本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。

请参照图1，本发明提供了一种图片格式转换装置10。图1为该图片格式转换装置10的硬件架构示意图。在本实施例中，该图片格式转换装置10包括存储器100和处理器200。存储器100与处理器200之间建立通信连接关系。

存储器100用于存储图片格式转换装置10中的各种数据，例如，待转换图片、转换规则、存储路径及程序代码等。在本实施例中，存储器100可以包括但不限于只读存储器(read-onlymemory，rom)、随机存储器(randomaccessmemory，ram)、可编程只读存储器(programmableread-onlymemory，prom)、可擦除可编程只读存储器(erasableprogrammableread-onlymemory，eprom)、一次可编程只读存储器(one-timeprogrammableread-onlymemory，otprom)、电子擦除式可复写只读存储器(electrically-erasableprogrammableread-onlymemory，eeprom)、只读光盘(compactdiscread-onlymemory，cd-rom)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。

进一步地，本发明提供的图片格式转换装置10得到标注格式转换后的图片，主要用于ai深度学习的网络模型训练。因此，存储器100存储的待转换图片包括训练图片和验证图片。训练图片用于放入深度学习模型中对网络模型进行训练，以得到具有一定学习功能的深度学习模型。验证图片用于在深度学习训练过程中进行验证并修正权重值，以得到更准确的深度学习模型。

存储器100内存储的转换规则具体包括第一转换规则和第二转换规则。

第一转换规则具体为标注上述训练图片和验证图片的标注部分的其中一个点的坐标得到第一格式的点坐标值，根据预设的第一映射关系表将第一格式的点坐标值转换为第二格式的点坐标值。第一映射关系表中设置有第一格式的一个点坐标与第二格式的至少两个点坐标的转换关系。其中，所述第二格式中所述至少两个点坐标是通过所述第一格式点坐标中x坐标、y坐标以及标注部分宽度、高度得到的。

第一格式的a1点的坐标信息以boundingbox(缩写为bbox)表示，bbox是个能够包覆住图片中标注部位的矩形。segmentation是一种图片标注的方式，将目标物件(object)以多边形(polygon)点坐标的方式描绘图片的轮廓外框。bbox包覆住图片中矩形标注部位后，segmentation对该矩形标注部位进行标注得到标注部位第一格式的其中一个点a1的坐标信息。

具体地，在本实施例中，所述第一转换规则中将第一格式的一个点(a1点)坐标转换成第二格式中四个点(b1点、b2点、b3点和b4点)对应的坐标，第一映射表如下表所示：

其中，宽度为该点所在图片的标注部分的宽度，高度为该点所在图片的标注部分的高度。

可以理解的是，第一转换规则也可以转换第二格式的b1、b2两个点或b1、b2和b3三个点。

第二转换规则具体为标注上述训练图片和验证图片的至少四个点的坐标值得到第一格式的点坐标，根据预设的第二映射关系表将第一格式的点坐标转换为第二格式的点坐标。所述第二映射关系表中设置有第一格式的至少四个点的点坐标值的记录方式及将所述第一格式的点坐标转换为第二格式的点坐标后所述至少四个点的点坐标值的记录方式。

具体地，在本实施例中，第二映射表如下表所示，第一格式中四个点的坐标排列方式为：先记录四个点(a1点、a2点、a3点和a4点)的x坐标，再记录所述四个点的y坐标；转换为第二格式后，所述四个点(b1点、b2点、b3点和b4点)的点坐标的排列方式为依次记录每个点的x坐标、y坐标，即，第二格式坐标的排列方式为第一点的x坐标y坐标、第二点的x坐标y坐标、第三点的x坐标y坐标、第四点的x坐标y坐标：

同理，a1、a2、a3和a4点的坐标信息先采用boundingbox(缩写为bbox)包覆住图片中的标注部位的矩形，再采用segmentation对该矩形标注部位进行标注得到上述坐标信息。

在本实施例中，图片的第一格式可以但不限于适用于via(vggimageannotator)软件的图片标注格式。第二格式可以但不限于使用于mscocodataset(microsoftcommonobjectsincontextdataset)影像资料集的图片标注格式。cocodataset的标注有固定的格式，所有的图片皆需转成规范的格式方能加载ai模型中训练。

存储器100内的存储路径包括标注后的子文件和目标文件对应的存储地址。标注后的子文件和目标文件将在后面进行详述。存储路径还包括训练图片和验证图片的存储文件对应的存储地址。

处理器200可以为中央处理器(cpu，centralprocessingunit)、微处理器、数字处理芯片或任何能够执行数据处理功能的处理器芯片。

请参照图2，图片格式转换装置10中还运行有一图片格式转换系统300。图片格式转换系统300内包括一个或多个程序形式的计算机指令，该一个或多个程序形式的计算机指令存储于存储器100中，并由处理器200执行。请参照图2，在实施例中，该图片格式转换系统300包括获取模块310、分配模块320、标注模块330、判断模块340、计算模块350、转换模块360和输出模块370。

获取模块310用于获取待转换的图片。待转换图片进行格式转换后用于ai深度学习模型的训练。

分配模块320用于分配上述待转换图片为训练图片和验证图片。根据预设的比例，将上述待转换的图片分为训练图片和验证图片。在具体实施例中，70％的待转换图片为训练图片，30％的待转换图片为验证图片。在其他实施例中，不限于上述分配比例。分配后的训练图片和验证图片分别存储于训练文件和验证文件内。

标注模块330用于标注上述待转换图片。具体的，针对训练图片和验证图片分别进行标注。标注的具体信息包括基本信息类、许可信息类、分类信息类、图像信息类和标注内容类。

基本信息类包括但不限于描述保存待转换图片的文件以及保存标注图片的文件的创建时间、版本和访问网址等。保存待转换图片的文件包括训练文件和验证文件。保存标注图片的文件包括分批标注待转换图片得到的子文件和合并上述子文件得到的目标文件。

许可信息类包括但不限于待转换图片的版权。

分类信息类包括但不限于待转换图片为训练图片和验证图片。

图像信息类包括但不限于图片的宽度、高度、图片命名和读取时间等。

标注内容类包括但不限于图片分类、点坐标信息、图片边界信息等。点坐标信息以boundingbox(缩写为bbox)表示，bbox是个能够包覆住图片中标注部位的矩形。图片边界信息采用分割方式(segmentation)获得。segmentation是一种图片标注的方式，将目标物件(object)以多边形(polygon)点坐标的方式描绘图片的轮廓外框。

上述标注的具体信息是固定且需预先定义的信息。基本信息类、许可信息类和图像信息类一起作为转换基础，并独立成一个档案，成为基础档案(oiatemplate)。

当需要转换图片格式时，以基础档案为基础，再将待转换完成后的个别图片的图像信息类和标注内容类填入，即可并凑出完成的转换格式后的图片。

判断模块340用于根据预设的判断规则判断标注后的训练图片和验证图片的标注部位是否为正四边形。在本实施例中，判断规则为若训练图片和验证图片的标注部位的边数为四个，则为正四边形；若训练图片和验证图片截取的标注部位的边数为大于四个，则为多边形。在本发明中，不赘述边数小于四个的多边形。

计算模块350用于计算标注后的训练图片和验证图片的标注部位的面积。标注部位的面积采用现有技术中的api(applicationprogramminginterface，应用程序编程接口)获得。api是一些预先定义的函数，用于计算标注部位的面积，目的是提供应用程序与开发人员基于某软件或硬件得以访问一组例程的能力，而又无需访问源码，或理解内部工作机制的细节。

转换模块360用于根据预设的转换规则对待转换的图片进行格式转换。转换格式预存于存储器100内，具体包括如前所述的第一转换规则和第二转换规则。当训练图片和验证图片的标注部位为正四边形时，使用第一转换规则进行图片格式转换；当训练图片和验证图片的标注部位为多边形时，使用第二转换规则进行图片格式转换。

输出模块370用于输出格式转换后的训练图片和验证图片。输出后的图片用于ai深度学习模型的训练。

本发明提供的图片格式转换装置10，将用于ai深度学习的图片进行格式转换，使其兼容深度学习模型，得到准确度更高的用于深度学习的网络模型。

本发明还提供了一种图片格式转换方法。请同时参照图3和图4，该图片格式转换方法包括两个过程，分别为图片标注过程和图片格式转换过程。图3为该图片标注过程的流程示意图，图4为该图片格式转换过程的流程示意图。

请参照图3，图片标注过程具体包括如下步骤：

步骤s301，获取所有待转换图片。

具体地，存储器100内存储所有待转换图片。由存储器100中获取待转换图片。

步骤s302，分配待转换图片为训练图片和验证图片。

具体地，将上述待转换图片分配为训练图片和验证图片。根据预设的比例，将上述待转换的图片分为训练图片和验证图片。在具体实施例中，70％的待转换图片为训练图片，30％的待转换图片为验证图片。在其他实施例中，不限于上述分配比例。分配后的训练图片和验证图片分别存储于训练文件和验证文件内。

步骤s303，分批标注训练图片和验证图片。

具体地，分别标注训练文件里的训练图片和验证文件里的验证图片。在标注过程中，对训练图片和验证图片均分批标注。

标注的具体信息包括基本信息类、许可信息类、分类信息类、图像信息类和标注内容类。

基本信息类包括但不限于描述保存待转换图片的文件以及保存标注图片的文件的创建时间、版本和访问网址等。待转换图片的文件包括训练文件和验证文件。标注图片的文件包括分批标注待转换图片得到的子文件和合并上述子文件得到的目标文件。

许可信息类包括但不限于待转换图片的图片版权。

分类信息类包括但不限于待转换图片为训练图片和验证图片。

图像信息类包括但不限于图片的宽度、高度、图片命名和读取时间等。

上述标注的具体信息是固定且需预先定义的信息。基本信息类、许可信息类和图像信息类一起作为转换基础，并独立成一个档案，成为基础档案(oiatemplate)。基础档案在后续转换格式中使用。

在另一些替代性实施例中，待转换的图片可以在标注后分配为训练图片和验证图片。

步骤s304，每批标注后的训练图片和验证图片分别形成一子文件。

具体地，将每批标注后的训练图片和验证图片分别形成一子文件，并对子文件命名并存储至预设存储路径。存储器100内存储有上述子文件的文件命名和存储路径。在后续步骤中，一一对子文件进行处理时，方便查找。处理完一个子文件，再处理另外一个子文件，若发生错误也仅需重复当前子文件的处理过程，减少不必要的流程，提高图片处理速度。

步骤s305，分别将训练图片和验证图片形成的子文件进行去噪后对应合并为目标文件。

具体地，分别对标注后的训练图片和验证图片进行去噪处理，换句话说，将训练图片形成的所有子文件合并为训练目标文件，将验证图片形成的所有子文件合并为验证目标文件。去噪处理是去掉标注后的训练图片和验证图片中的不需要的信息。由于上述子文件具有连续性且具有累加性，因此将去噪后的训练图片和验证图片的子文件分别合并为目标文件。目标文件包括上述训练目标文件和验证目标文件。

请参照图4，图片格式转换过程具体包括如下步骤：

步骤s401，分别获取标注后的训练图片和验证图片。

具体地，分别从训练目标文件和验证目标文件获取标注后的训练图片和验证图片，以便对标注后的训练图片和验证图片进行格式转换。

步骤s402，判断训练图片或验证图片的标注部位是否为正四边形。

具体地，根据预设的判断规则判断标注后的训练图片和验证图片是否为正四边形。判断规则为若训练图片和验证图片截取的边数为四个，则为正四边形；若训练图片和验证图片截取的边数为大于四个，则为多边形。在本发明中，不赘述边数为小于四个的多边形。

若是，则进行步骤s403，训练图片或验证图片根据预设的第一转换规则进行图片格式转换。

训练图片或验证图片以基础档案为基础，将待转换的训练图片或验证图片填入对应的图像信息类和标注内容类，即可完成图片的格式转换。

若否，则进行步骤s404，训练图片或验证图片根据预设的第二转换规则进行图片格式转换。

同理，训练图片或验证图片为多边形的转换方法和正四边形的一样，也是在基础档案的基础上进行转换，不同的是转换规则具有区别。第二转换规则具体为标注上述训练图片和验证图片的至少四个点的坐标值得到第一格式的点坐标，根据预设的第二映射关系表将第一格式的点坐标转换为第二格式的点坐标。所述第二映射关系表中设置有第一格式的至少四个点的点坐标值的记录方式及将所述第一格式的点坐标转换为第二格式的点坐标后所述四个点的点坐标值的记录方式。

在一些替代性实施例中，在步骤s403和步骤s404内，还包括计算训练图片或验证图片的标注部位的面积，标注部位的面积作为图片标注格式转换的一个信息填充于图片的第二格式内。标注部位的面积采用现有技术中的api获得。api是一些预先定义的函数，用于计算标注部位的面积。

步骤s405，输出格式转换后的训练图片或验证图片。

输出格式转换后的训练图片或验证图片。输出后的图片用于ai深度学习模型的训练。

本发明提供的图片格式转换方法，首先依据预设的判断规则判断标注后的训练图片和验证图片是否正四边形。若为正四边形，则利用第一转换规则将训练图片和验证图片转换为目标格式图片；若为多边形，则利用第二转换规则将训练图片和验证图片转换为目标格式图片。利用上述图片格式转换方法，可以高效准确地进行图片格式转换。

对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外，显然“包括”一词不排除其他器或步骤，单数不排除复数。计算机装置权利要求中陈述的多个器或计算机装置也可以由同一个器或计算机装置通过软件或者硬件来实现。第一，第二等词语用来表示名称，而并不表示任何特定的顺序。

最后应说明的是，以上实施例仅用以说明本发明的技术方案而非限制，尽管参照较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或等同替换，而不脱离本发明技术方案的精神和范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：胡博章
技术所有人：鸿富锦精密工业(武汉)有限公司;鸿海精密工业股份有限公司
我是此专利的发明人

上一篇：一种带有紫外线消毒功能的台灯的制作方法
上一篇：一种多角度的家具表面加工装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。