标注方法、装置、电子设备、服务器及存储介质与流程

文档序号：28070697发布日期：2021-12-18 00:21阅读：75来源：国知局

1.本技术涉及计算机技术领域，具体涉及一种标注方法、装置、电子设备、服务器及存储介质。

背景技术：

2.图像语义分割是人工智能领域中一个重要的分支，是机器视觉技术中关于图像理解的重要一环，图像语义分割离不开大量的人工标注。目前的人工标注中，有一种场景是对当前场景的各个部分进行标注。例如：一张风景图中，可能同时存在天空、草坪、人、树木、各种小动物等等，图中可能存在较多的需要标注的物体，在人工标注的过程中，需要借助软件工具将图中的每一个需要标注的物体进行切割。当需要标注的物体的数量较多时，标注的效率较低。

技术实现要素：

3.本技术实施例提供一种标注方法、装置、电子设备、服务器及存储介质。可以提高标注效率。
4.本技术实施例的第一方面提供了一种标注方法，所述方法应用于电子设备，所述方法包括：
5.获取图像中待标注物体的位置信息；
6.将所述位置信息上传至服务器，所述服务器用于将所述图像和所述位置信息输入神经网络模型，得到包含所述待标注物体的二值图，以及用于将所述二值图转换为标注点信息；
7.接收所述服务器发送的所述标注点信息，根据所述标注点信息进行渲染后在所述图像中显示。
8.可选的，所述获取图像中待标注物体的位置信息，包括：
9.响应于用户输入的图形框选择指令，从所述图像中选择包含待标注物体的图像区域；
10.响应于用户输入的定位指令，从所述图像区域中选择针对所述待标注物体的定位点；
11.根据所述图像区域的坐标信息和所述定位点的坐标信息生成所述待标注物体的位置信息。
12.可选的，所述方法还包括：
13.将所述图像的标识信息上传至服务器，所述服务器还用于将所述图像和所述位置信息输入神经网络模型之前，根据所述标识信息从图像库中获取所述图像。
14.可选的，若所述图像区域为矩形区域，所述图像区域的坐标信息包括所述图像区域的四个顶点的坐标信息。
15.可选的，所述根据所述标注点信息进行渲染后在所述图像中显示之后，所述方法
还包括：
16.响应于用户输入的调整指令，对所述标注点信息进行微调，得到针对所述待标注物体的调整后的标注点信息。
17.本技术实施例的第二方面提供了一种标注方法，所述方法应用于服务器，所述方法包括：
18.接收电子设备发送的标识信息和待标注物体的位置信息；
19.获取与所述标识信息对应的图像，将所述位置信息和所述图像输入神经网络模型，得到包含所述待标注物体的二值图；
20.将所述二值图转换为标注点信息；
21.将所述标注点信息发送至所述电子设备。
22.可选的，所述得到包含所述待标注物体的二值图之后，所述方法还包括：
23.判断所述二值图是否仅包含一个待标注物体；
24.若所述二值图仅包含一个待标注物体，执行所述将所述二值图转换为标注点信息的步骤。
25.可选的，若所述二值图包含至少两个待标注物体，向所述电子设备发送提示消息；
26.所述提示消息用于提示用户在图像中重新选择图像区域。
27.可选的，所述判断所述二值图是否仅包含一个待标注物体，包括：
28.确定所述二值图中的黑色连通域的数量；
29.若所述黑色连通域的数量为一个，则所述二值图仅包含一个待标注物体；
30.若所述黑色连通域的数量为至少两个，则所述二值图包含至少两个待标注物体。
31.本技术实施例的第三方面提供了一种标注装置，所述标注装置应用于电子设备，所述标注装置包括：
32.第一获取单元，用于获取图像中待标注物体的位置信息；
33.上传单元，用于将所述位置信息上传至服务器，所述服务器用于将所述图像和所述位置信息输入神经网络模型，得到包含所述待标注物体的二值图，以及用于将所述二值图转换为标注点信息；
34.第一接收单元，用于接收所述服务器发送的所述标注点信息；
35.显示单元，用于根据所述标注点信息进行渲染后在所述图像中显示。
36.本技术实施例的第四方面提供了一种标注装置，所述标注装置应用于服务器，所述标注装置包括：
37.第二接收单元，用于接收电子设备发送的标识信息和待标注物体的位置信息；
38.第二获取单元，用于获取与所述标识信息对应的图像，将所述位置信息和所述图像输入神经网络模型，得到包含所述待标注物体的二值图；
39.转换单元，用于将所述二值图转换为标注点信息；
40.发送单元，用于将所述标注点信息发送至所述电子设备。
41.本技术实施例的第五方面提供了一种电子设备，包括处理器和存储器，所述存储器用于存储计算机程序，所述计算机程序包括程序指令，所述处理器被配置用于调用所述程序指令，执行如本技术实施例第一方面中的步骤指令。
42.本技术实施例的第六方面提供了一种服务器，包括处理器和存储器，所述存储器
用于存储计算机程序，所述计算机程序包括程序指令，所述处理器被配置用于调用所述程序指令，执行如本技术实施例第一方面中的步骤指令。
43.本技术实施例的第七方面提供了一种计算机可读存储介质，其中，上述计算机可读存储介质用于存储计算机程序，上述计算机程序使得计算机执行如本技术实施例第一方面中所描述的部分或全部步骤。
44.本技术实施例的第八方面提供了一种计算机可读存储介质，其中，上述计算机可读存储介质用于存储计算机程序，上述计算机程序使得计算机执行如本技术实施例第二方面中所描述的部分或全部步骤。
45.本技术实施例的第九方面提供了一种计算机程序产品，其中，上述计算机程序产品包括计算机程序，上述计算机程序被计算机执行时使得上述计算机执行如本技术实施例第一方面中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。
46.本技术实施例的第十方面提供了一种计算机程序产品，其中，上述计算机程序产品包括计算机程序，上述计算机程序被计算机执行时使得上述计算机执行如本技术实施例第二方面中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。
47.本技术实施例中，电子设备获取图像中待标注物体的位置信息；将位置信息上传至服务器，服务器用于将图像和位置信息输入神经网络模型，得到包含待标注物体的二值图，以及用于将二值图转换为标注点信息；接收服务器发送的标注点信息，根据标注点信息进行渲染后在图像中显示。本技术实施例中，与人工标注相比，只需将待标注物体的位置信息上传至服务器，服务器即可得到针对该待标注物体的标注点信息，无需用户手动进行标注，提高了标注效率。
附图说明
48.为了更清楚地说明本技术实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本技术的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
49.图1是本技术实施例提供的一种电子设备和服务器的通信连接架构图；
50.图2是本技术实施例提供的一种标注方法的流程示意图；
51.图3是本技术实施例提供的一种图像坐标系的示意图；
52.图4是本技术实施例提供的另一种标注方法的流程示意图；
53.图5a是本技术实施例提供的一种根据图形框选择指令选择图像区域的示意图；
54.图5b是本技术实施例提供的另一种根据图形框选择指令选择图像区域的示意图；
55.图5c是本技术实施例提供的一种根据定位指令选择图像中的定位点的示意图；
56.图5d是本技术实施例提供的一种根据标注点信息进行微调的示意图；
57.图6是本技术实施例提供的另一种标注方法的流程示意图；
58.图7是本技术实施例提供的一种标注装置的结构示意图；
59.图8是本技术实施例提供的另一种标注装置的结构示意图；
60.图9是本技术实施例提供的一种电子设备的结构示意图；
61.图10是本技术实施例提供的一种服务器的结构示意图。
具体实施方式
62.下面将结合本技术实施例中的附图，对本技术实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本技术一部分实施例，而不是全部的实施例。基于本技术中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本技术保护的范围。
63.本技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象，而不是用于描述特定顺序。此外，术语“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元，而是可选地还包括没有列出的步骤或单元，或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
64.在本技术中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本技术的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本技术所描述的实施例可以与其它实施例相结合。
65.本技术实施例所涉及到的电子设备可以包括具有运算能力和通信能力的设备，比如，手机、平板、个人电脑等。个人电脑也可以称为用户电脑，可以包括台式电脑、笔记本电脑等。为方便描述，上面提到的设备统称为电子设备。
66.本技术实施例所涉及到的服务器可以是具有图像处理功能的服务器。
67.请参阅图1，图1是本技术实施例提供的一种电子设备和服务器的通信连接架构图。如图1所示，电子设备101可以与服务器102进行通信。电子设备可以有多个。电子设备101可以获取图像中待标注物体的位置信息；将位置信息上传至服务器102，服务器102将图像和位置信息输入神经网络模型，得到包含待标注物体的二值图，将二值图转换为标注点信息；服务器102向电子设备101发送标注点信息，电子设备101对标注点信息进行渲染后在图像中显示。
68.电子设备101可以理解为前端，服务器102可以理解为后端，电子设备101上可以安装有浏览器，比如web浏览器。服务器102可以是web服务器。电子设备101与服务器102的架构可以是浏览器服务器(browser
‑
server，b/s)架构，b/s架构中，web浏览器是客户端最主要的应用软件。这种模式统一了客户端，将系统功能实现的核心部分集中到服务器上，简化了系统的开发、维护和使用。客户机上只要安装一个浏览器，如netscape navigator或internet explorer，服务器可以安装sql server、oracle、mysql等数据库。浏览器通过web服务器同数据库进行数据交互。b/s架构由于客户端通过浏览器与服务器通信，客户端不需要维护，扩展非常容易。
69.本技术实施例中，与人工标注相比，只需将待标注物体的位置信息上传至服务器，服务器即可得到针对该待标注物体的标注点信息，无需用户手动进行标注，提高了标注效率。
70.请参阅图2，图2是本技术实施例提供的一种标注方法的流程示意图。如图2所示，该标注方法可以包括如下步骤。
71.201，电子设备获取图像中待标注物体的位置信息。
72.本技术实施例中，待标注物体是图像中没有被标注的对象。
73.目前的人工标注中，有一种场景是对当前场景的各个部分进行语义标注。例如：一张风景图中，可能同时存在天空、草坪、人、树木、各种小动物等等，图中可能存在较多的需要标注的物体，在人工标注的过程中，需要借助软件工具将图中的每一个需要标注的物体进行标注。比如，需要对图中的人、树木、小动物进行标注，如果图中的人、树木、小动物的数量较多，需要标注的物体的数量较多，标注人员通过软件工具进行标注的效率较低。其中，软件工具可以是canvas2d。canvas2d是一种实现2d图形绘制的软件工具，canvas2d可以通过脚本(通常是javascript)来完成。canvas2d可以提供<canvas>标签，选择<canvas>标签后，通过脚本来绘制图形。不同的<canvas>标签可以绘制不同形状的图形，<canvas>标签是图形容器，在选定的<canvas>标签的情况下，通过脚本来绘制选定的形状的图形。比如，可以使用canvas2d绘制路径、盒、圆等图形。
74.待标注物体的位置信息可以是待标注物体的边缘的坐标信息。图像中的每个像素点都可以对应一个坐标。比如，可以建立图像坐标系，以图像的左上角为原点建立以像素为单位的直角坐标系x
‑
y。像素的横坐标x与纵坐标y分别是像素在其图像中所在的像素列数与所在的像素行数。请参阅图3，图3是本技术实施例提供的一种图像坐标系的示意图。如图3所示，图3中的白色区域为图像，图像的左上角为原点o，其坐标为(0，0)，横坐标为x，纵坐标为y。图像中的一个像素点p的坐标为：(x1，y1)。
75.待标注物体本身的形状并不规则，本技术实施例可以用多边形选择框来选择待标注物体，待标注物体的位置信息可以包括多边形选择框的每个顶点的坐标。举例来说，如果多边形选择框为矩形选择框，则待标注物体的位置信息可以包括该矩形选择框的四个顶点的坐标。如果多边形选择框为三角形选择框，则待标注物体的位置信息可以包括该三角形选择框的三个顶点的坐标。
76.可选的，步骤201中，电子设备获取图像中待标注物体的位置信息，可以包括如下步骤：
77.(11)电子设备响应于用户输入的图形框选择指令，从所述图像中选择包含待标注物体的图像区域；
78.(12)电子设备响应于用户输入的定位指令，从所述图像区域中选择针对所述待标注物体的定位点；
79.(13)电子设备根据所述图像区域的坐标信息和所述定位点的坐标信息生成所述待标注物体的位置信息。
80.本技术实施例中，图形框选择指令可以是多边形图形框选择指令，比如矩形框选择指令，三角形框选择指令，五边形框选择指令、六边形框选择指令等。
81.用户在用鼠标在图像中输入图形选择框指令，用图形选择框从图像中选择图像区域，用户可以通过鼠标调节图形选择框的大小，进而调整图像区域的大小，使得图像区域内包含待标注物体。
82.用户可以通过鼠标点击图像区域中待标注物体上的一个点，将这个点作为待标注物体的定位点。定位点是用户从图像区域中选择的能够表明该待标注物体的中心位置的点，该定位点理论上可以位于该待标注物体的上的任意一个点，为了更好的定位该待标注物体，用户可以通过鼠标选择认为最接近该待标注物体的中心的点作为定位点。定位点的数量可以是一个，也可以是多个，数量越多，定位该待标注物体则更准确，后续生成的二值
图更准确。
83.本技术实施例中，待标注物体的位置信息可以包括图像区域的坐标信息和定位点的坐标信息，为后续输入神经网络模型做准备，可以通过定位点的坐标信息对神经网络模型生成的二值图进行校准，从而保证定位点落入二值图中的由前景组成的区域中，进而提高生成的二值图的准确性。
84.可选的，所述图像区域的坐标信息包括所述图像区域的四个顶点的坐标信息。
85.本技术实施例中，图像区域以四边形区域为例。具体的，该四边形区域可以是矩形区域。
86.202，电子设备将位置信息上传至服务器，服务器用于将图像和位置信息输入神经网络模型，得到包含待标注物体的二值图，以及用于将二值图转换为标注点信息。
87.本技术实施例中，神经网络模型是用来根据图像和位置信息生成二值图的神经网络模型，该神经网络模型可以根据不同的图像设置生成二值图所选择的阈值。
88.二值图(binary image)是指将图像上的每一个像素只有两种可能的取值或灰度等级状态，人们经常用黑白图像表示二值图像。二值图像是指在图像中，灰度等级只有两种，图像中的任何像素点的灰度值均为0或者255，分别代表黑色和白色。可以将图像中灰度值大于某一个阈值的所有像素点的灰度值都设置为255，将灰度值小于某一个阈值的所有像素点的灰度值都设置为0。由于同一类物体在图像中的灰度值往往集中在某一个区间，而背景的灰度值在另一个区间，二值图可以较好的区分出图像中的背景和待标注物体(前景)。
89.电子设备将二值图转换为标注点信息，具体可以将二值图中的前景的边缘部分用标注点连接起来，从而得到待标注物体的标注点信息。标注点信息可以包括多个标注点组成点集信息，比如，标注点信息可以包括多个标注点的坐标信息。
90.本技术实施例中，服务器可以从电子设备获取图像，也可以从图像库中获取图像。
91.可选的，本技术实施例还可以执行如下步骤：
92.(21)电子设备将所述图像的标识信息上传至服务器，所述服务器还用于将所述图像和所述位置信息输入神经网络模型之前，根据所述标识信息从图像库中获取所述图像。
93.其中，步骤(21)可以与步骤202同时执行，步骤(21)可以在步骤202之前执行，也可以在步骤202之后执行。
94.当步骤(21)可以与步骤202同时执行时，电子设备可以将待标注物体的位置信息和图像的标识信息上传至服务器。待标注物体的位置信息和图像的标识信息可以放在同一个消息中，服务器可以知道该待标注物体的位置信息在该图像上。
95.本技术实施例不需要直接将图像上传至服务器，服务器直接根据图像标识从图像库中获取，节省了上传图片的过程，可以提高标注效率。
96.203，电子设备接收服务器发送的标注点信息，对标注点信息进行渲染后在图像中显示。
97.本技术实施例中，电子设备接收服务器发送的标注点信息后，可以根据标注点信息包括的多个标注点的坐标在图像中找到对应的标注点，对这些标注点进行渲染后在图像中显示。
98.本技术实施例中，标注点信息是服务器发送的，在电子设备侧无需用户手动进行
人工标注，与人工标注相比，只需将待标注物体的位置信息上传至服务器，服务器即可得到针对该待标注物体的标注点信息，无需用户手动进行标注，提高了标注效率。
99.可选的，步骤202中，服务器在得到包含待标注物体的二值图之后，还可以判断所述二值图是否仅包含一个待标注物体，在二值图仅包含一个待标注物体的情况下，将二值图转换为标注点信息；在二值图仅包含至少两个待标注物体的情况下，服务器向所述电子设备发送提示消息。
100.可选的，在执行步骤202之后，图2所示的方法还可以包括如下步骤：
101.电子设备接收服务器发送的提示消息，继续执行步骤201。
102.请参阅图4，图4是本技术实施例提供的另一种标注方法的流程示意图。图4是在图2的基础上进一步优化得到的，如图4所示，该标注方法可以包括如下步骤。
103.401，电子设备获取图像中待标注物体的位置信息。
104.402，电子设备将位置信息上传至服务器，服务器用于将图像和位置信息输入神经网络模型，得到包含待标注物体的二值图，以及用于将二值图转换为标注点信息。
105.403，电子设备接收服务器发送的标注点信息，对标注点信息进行渲染后在图像中显示。
106.其中步骤401至步骤403的具体实施可以参加图2所示的步骤201至步骤203，此处不再赘述。
107.404，电子设备响应于用户输入的调整指令，对标注点信息进行微调，得到针对待标注物体的调整后的标注点信息。
108.本技术实施例中，用户输入的调整指令，可以是用户在软件工具中对标注点的拖动指令。服务器发送的标注点信息不一定准确，可能会存在误差，此时，用户可以借助软件工具对标注点信息进行微调，使得调整后的标注点信息能够更准确。由于用户的调整是在已有的标注点信息上调整的，与纯手工标注相比，无需从头开始标注，标注效率更高。
109.下面结合图5a至图5d说明本技术的标注方法的具体流程。请参阅图5a，图5a是本技术实施例提供的一种根据图形框选择指令选择图像区域的示意图。图5b是本技术实施例提供的另一种根据图形框选择指令选择图像区域的示意图。
110.从图5a可以看出，用户可以通过鼠标在图像中通过矩形框选择矩形框的起始点，该起始点位于图像中的待标注物体(如图5a所示的笔记本电脑)的左上角。从图5b可以看出，用户可以通过鼠标在图像中通过矩形框选择矩形框的结束点，该结束点位于图像中的待标注物体(如图5b所示的笔记本电脑)的右下角，从图5b可以看出，以起始点和结束点为对角线确定矩形的图像区域(如图5b中的矩形虚线框)，可以看到，待标注物体位于图像区域内。该待标注物体的位置信息可以包括该图像区域的四个顶点坐标。
111.请参阅图5c，图5c是本技术实施例提供的一种根据定位指令选择图像中的定位点的示意图。如图5c所示，用户可以通过鼠标点击待标注物体(如图5c所示的笔记本电脑)的定位点，该定位点可以是用户目测的笔记本电脑的中心点，也可以是选择的矩形框的中心点。用户通过单击目标物体，从而获取定位点的坐标。电子设备向服务器发送包括该待标注物体的位置信息，位置信息包括矩形框的四个顶点的坐标值和定位点的坐标。服务器将该图像和该待标注物体的位置信息传入神经网络模型，该模型可以输出二值图，可以通过python
‑
cv2库将二值图转换为标注点的坐标返回给电子设备进行渲染。
112.图5d是本技术实施例提供的一种根据标注点信息进行微调的示意图。如图5d所示，图5d中的白色圆圈即为渲染后的标注点，标注点位于笔记本电脑的边缘，通过多个标注点相连形成了闭合的多边形框，该闭合的多边形框内的物体即为待标注物体(如图5d所示的笔记本电脑)，标注员可以对该标注点的位置进行细微的调整，从而使得调整后的标注点信息能够更准确。
113.请参阅图6，图6是本技术实施例提供的另一种标注方法的流程示意图。如图6所示，该方法可以应用于服务器，图6所示的方法可以包括如下步骤。
114.601，服务器接收电子设备发送的标识信息和待标注物体的位置信息。
115.本技术实施例中，标识信息可以是图像的标识信息，可以是图像的编号。图像可以存储在图像库中，图像库中每张图像的编号都不相同。
116.待标注物体的位置信息可以包括包含待标注物体的图像区域的顶点坐标和待标注物体的定位点的坐标。
117.602，服务器获取与标识信息对应的图像，将位置信息和图像输入神经网络模型，得到包含待标注物体的二值图。
118.本技术实施例中，服务器可以根据从图像库中获取与标识信息对应的图像，电子设备无需向服务器传输图像，可以提高标注效率。
119.神经网络模型，也可以称为二值图神经网络模型，其目的是为了将图像中处于图像区域的顶点坐标之内的区域进行二值化处理，从而得到该图像区域的二值图，由于待标注物体位于图像区域中，该图像区域的二值图包含标注物体的二值图。
120.神经网络模型可以是训练好的模型，可以通过有监督的训练对神经网络模型进行训练，具体的，可以输入原始图像和真实标签，根据模型输出检测标签与真实标签的匹配度对模型参数进行优化。神经网络模型可以包括卷积层、反卷积层、池化层(包括最大值池化层和均值池化层)和dropout层，可以使用最大值池化层来突出原始图像的边缘特征，同时均值池化层用来保留图像中的位置特征，dropout层加入噪声防止过拟合，卷积层与反卷积层可以呈对称结构，来方便对训练集标签进行更为自然的学习。
121.603，服务器将二值图转换为标注点信息。
122.本技术实施例中，标注点信息可以是标注点在图像中的坐标，服务器可以通过python
‑
cv2库将二值图转换为标注点的坐标。
123.604，服务器将标注点信息发送至电子设备。
124.本技术实施例中，标注点信息是服务器得到的，服务器只需要将标识信息对应的图像和待标注物体的位置信息输入神经网络模型，即可得到包含待标注物体的二值图，然后将二值图转换为标注点信息。在电子设备侧无需用户手动进行人工标注，与人工标注相比，只需将待标注物体的位置信息上传至服务器，服务器即可得到针对该待标注物体的标注点信息，无需用户手动进行标注，提高了标注效率。
125.可选的，在执行步骤602之后，
126.(31)服务器判断所述二值图是否仅包含一个待标注物体；
127.(32)若所述二值图仅包含一个待标注物体，执行步骤603。
128.本技术实施例中，服务器可以通过确定所述二值图中的黑色连通域的数量来判断二值图是否仅包含一个待标注物体。二值图中的黑色区域为前景区域，白色区域为背景区
域。若所述黑色连通域的数量为一个，则所述二值图仅包含一个待标注物体；若所述黑色连通域的数量为至少两个，则所述二值图包含至少两个待标注物体。
129.本技术实施例可以通过判断二值图是否包含一个待标注物体来确定是否将二值图转换为标注点信息，如果仅包含一个待标注物体，则表明电子设备侧的图形框选择指令选择的图像区域仅包含一个待标注物体。如果包含至少两个待标注物体，则表明电子设备侧的图形框选择指令选择的图像区域包含至少两个待标注物体，可能是用户输入的图形框选择指令选择的图像区域过大。比如，图5b的虚线框不仅包含笔记本电脑，还可能包括其他灰度值接近的物体(比如，图5b中的塑料瓶)，导致生成的标注点信息出现错误。
130.一般而言，同一个物体的灰度值处于同一个区间，如果两个物体的灰度值接近，则无法通过二值法将这两个物体区分开，此时二值图中可能包含两个黑色连通域，这两个黑色连通域分别代表两个物体。通过黑色连通域的数量来判断二值图中是否包含一个待标注物体，可以准确的判断二值图是否包含了其他的物体，从而避免根据二值图生成的标注点信息出现错误。
131.可选的，在执行步骤(31)之后，还可以执行如下步骤：
132.(33)若所述二值图包含至少两个待标注物体，服务器向所述电子设备发送提示消息，所述提示消息用于提示用户在图像中重新选择图像区域。
133.本技术实施例中，如果二值图包含至少两个待标注物体，服务器向电子设备发送提示消息，提示消息用于提示用户在图像中重新选择图像区域，提示用户重新选择图像区域。
134.可选的，在执行步骤(31)之后，还可以执行如下步骤：
135.(34)若所述二值图包含一个待标注物体和至少一个已标注物体，服务器向所述电子设备发送提示消息，所述提示消息用于提示用户在图像中重新选择图像区域。
136.本技术实施例中，对于一幅图像中已标注物体，该已标注物体的标注点信息服务器是已知的，只需要判断已标注物体的标注点坐标是否落入该二值图中，若是，则表明该二值图中包含已标注物体。
137.本技术实施例，在得到二值图后，先判断二值图是否仅包含一个待标注物体，在仅包含一个待标注物体时才将二值图转换为标注点信息，避免在二值图中包含至少两个待标注物体的情况下，根据二值图生成的标注点信息出现错误，从而提高标注的正确率。
138.上述主要从方法侧执行过程的角度对本技术实施例的方案进行了介绍。可以理解的是，电子设备为了实现上述功能，其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到，结合本文中所提供的实施例描述的各示例的单元及算法步骤，本技术能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用使用不同方法来实现所描述的功能，但是这种实现不应认为超出本技术的范围。
139.本技术实施例可以根据上述方法示例对服务器和电子设备进行功能单元的划分，例如，可以对应各个功能划分各个功能单元，也可以将两个或两个以上的功能集成在一个处理单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。需要说明的是，本技术实施例中对单元的划分是示意性的，仅仅为一种逻辑功能划
分，实际实现时可以有另外的划分方式。
140.请参阅图7，图7是本技术实施例提供的一种标注装置的结构示意图，该标注装置700应用于电子设备，该标注装置700可以包括第一获取单元701、上传单元702、第一接收单元703和显示单元704，其中：
141.第一获取单元701，用于获取图像中待标注物体的位置信息；
142.上传单元702，用于将所述位置信息上传至服务器，所述服务器用于将所述图像和所述位置信息输入神经网络模型，得到包含所述待标注物体的二值图，以及用于将所述二值图转换为标注点信息；
143.第一接收单元703，用于接收所述服务器发送的所述标注点信息；
144.显示单元704，用于根据所述标注点信息进行渲染后在所述图像中显示。
145.可选的，所述第一获取单元701获取图像中待标注物体的位置信息，包括：响应于用户输入的图形框选择指令，从所述图像中选择包含待标注物体的图像区域；响应于用户输入的定位指令，从所述图像区域中选择针对所述待标注物体的定位点；根据所述图像区域的坐标信息和所述定位点的坐标信息生成所述待标注物体的位置信息。
146.可选的，所述上传单元702，还用于将所述图像的标识信息上传至服务器，所述服务器还用于将所述图像和所述位置信息输入神经网络模型之前，根据所述标识信息从图像库中获取所述图像。
147.可选的，若所述图像区域为矩形区域，所述图像区域的坐标信息包括所述图像区域的四个顶点的坐标信息。
148.该标注装置700还可以包括微调单元705；
149.微调单元705，用于所述显示单元704根据所述标注点信息进行渲染后在所述图像中显示之后，响应于用户输入的调整指令，对所述标注点信息进行微调，得到针对所述待标注物体的调整后的标注点信息。
150.其中，本技术实施例中的第一获取单元701可以是电子设备的输入输出装置(比如，鼠标、显示屏)，上传单元702和第一接收单元703可以是电子设备的通信模块，微调单元705可以是电子设备的处理器。显示单元704可以是电子设备的显示装置。
151.本技术实施例中，与人工标注相比，只需将待标注物体的位置信息上传至服务器，服务器即可得到针对该待标注物体的标注点信息，无需用户手动进行标注，提高了标注效率。
152.请参阅图8，图8是本技术实施例提供的另一种标注装置的结构示意图，该标注装置800应用于服务器，该标注装置800可以包括第二接收单元801、第二获取单元802、转换单元803和发送单元804，其中：
153.第二接收单元801，用于接收电子设备发送的标识信息和待标注物体的位置信息；
154.第二获取单元802，用于获取与所述标识信息对应的图像，将所述位置信息和所述图像输入神经网络模型，得到包含所述待标注物体的二值图；
155.转换单元803，用于将所述二值图转换为标注点信息；
156.发送单元804，用于将所述标注点信息发送至所述电子设备。
157.可选的，该标注装置800还可以判断单元805；
158.判断单元805，还用于在第二获取单元802得到包含所述待标注物体的二值图之
后，判断所述二值图是否仅包含一个待标注物体；
159.转换单元805，用于在所述判断单元805判断所述二值图仅包含一个待标注物体的情况下，将所述二值图转换为标注点信息。
160.所述发送单元804，还用于在所述判断单元805判断所述二值图包含至少两个待标注物体的情况下，向所述电子设备发送提示消息；所述提示消息用于提示用户在图像中重新选择图像区域。
161.可选的，所述发送单元804，还用于在所述判断单元805判断所述二值图包含一个待标注物体和至少一个已标注物体的情况下，向所述电子设备发送提示消息，所述提示消息用于提示用户在图像中重新选择图像区域。
162.可选的，所述判断单元805判断所述二值图是否仅包含一个待标注物体，包括：确定所述二值图中的黑色连通域的数量；在所述黑色连通域的数量为一个的情况下，判断所述二值图仅包含一个待标注物体；在所述黑色连通域的数量为至少两个的情况下，判断所述二值图包含至少两个待标注物体。
163.其中，本技术实施例中第二接收单元801、第二获取单元802和发送单元804可以是服务器的通信模块，转换单元803、判断单元805可以是服务器的处理器。
164.本技术实施例中，服务器只需要将标识信息对应的图像和待标注物体的位置信息输入神经网络模型，即可得到包含待标注物体的二值图，然后将二值图转换为标注点信息。在电子设备侧无需用户手动进行人工标注，与人工标注相比，只需将待标注物体的位置信息上传至服务器，服务器即可得到针对该待标注物体的标注点信息，无需用户手动进行标注，提高了标注效率。
165.请参阅图9，图9是本技术实施例提供的一种电子设备的结构示意图，如图9所示，该电子设备900包括处理器901和存储器902，处理器901、存储器902可以通过通信总线903相互连接。通信总线903可以是外设部件互连标准(peripheral component interconnect，简称pci)总线或扩展工业标准结构(extended industry standard architecture，简称eisa)总线等。通信总线903可以分为地址总线、数据总线、控制总线等。为便于表示，图9中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。存储器902用于存储计算机程序，计算机程序包括程序指令，处理器901被配置用于调用程序指令，上述程序包括用于执行图2、图4中的方法。
166.处理器901可以是通用中央处理器(cpu)，微处理器，特定应用集成电路(application
‑
specific integrated circuit，asic)，或一个或多个用于控制以上方案程序执行的集成电路。
167.存储器902可以是只读存储器(read
‑
only memory，rom)或可存储静态信息和指令的其他类型的静态存储设备，随机存取存储器(random access memory，ram)或者可存储信息和指令的其他类型的动态存储设备，也可以是电可擦可编程只读存储器(electrically erasable programmable read
‑
only memory，eeprom)、只读光盘(compact disc read
‑
only memory，cd
‑
rom)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质，但不限于此。存储器可以是独立存在，通过总线与处理器相连接。存储器也可以和处理器集成在一起。
168.该电子设备900还可以包括显示装置904，显示装置904可以包括显示器。
169.该电子设备900还可以包括通信模块905，该通信模块905可以包括射频电路、天线等输入输出装置。
170.本技术实施例中，与人工标注相比，只需将待标注物体的位置信息上传至服务器，服务器即可得到针对该待标注物体的标注点信息，无需用户手动进行标注，提高了标注效率。
171.请参阅图10，图10是本技术实施例提供的一种服务器的结构示意图，如图10所示，该服务器1000包括处理器1001和存储器1002，处理器1001、存储器1002可以通过通信总线1003相互连接。通信总线1003可以是外设部件互连标准(peripheral component interconnect，简称pci)总线或扩展工业标准结构(extended industry standard architecture，简称eisa)总线等。通信总线1003可以分为地址总线、数据总线、控制总线等。为便于表示，图10中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。存储器1002用于存储计算机程序，计算机程序包括程序指令，处理器1001被配置用于调用程序指令，上述程序包括用于执行图6中的方法。
172.处理器1001可以是通用中央处理器(cpu)，微处理器，特定应用集成电路(application
‑
specific integrated circuit，asic)，或一个或多个用于控制以上方案程序执行的集成电路。
173.存储器1002可以是只读存储器(read
‑
only memory，rom)或可存储静态信息和指令的其他类型的静态存储设备，随机存取存储器(random access memory，ram)或者可存储信息和指令的其他类型的动态存储设备，也可以是电可擦可编程只读存储器(electrically erasable programmable read
‑
only memory，eeprom)、只读光盘(compact disc read
‑
only memory，cd
‑
rom)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质，但不限于此。存储器可以是独立存在，通过总线与处理器相连接。存储器也可以和处理器集成在一起。
174.该服务器1000还可以包括通信模块1004，该通信模块1004可以包括射频电路、天线等输入输出装置。
175.本技术实施例中，服务器只需要将标识信息对应的图像和待标注物体的位置信息输入神经网络模型，即可得到包含待标注物体的二值图，然后将二值图转换为标注点信息。在电子设备侧无需用户手动进行人工标注，与人工标注相比，只需将待标注物体的位置信息上传至服务器，服务器即可得到针对该待标注物体的标注点信息，无需用户手动进行标注，提高了标注效率。
176.本技术实施例还提供一种计算机可读存储介质，其中，该计算机可读存储介质存储用于电子数据交换的计算机程序，该计算机程序使得计算机执行如上述方法实施例中记载的任何一种标注方法的部分或全部步骤。
177.需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本技术并不受所描述的动作顺序的限制，因为依据本技术，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知
悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本技术所必须的。
178.在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。
179.在本技术所提供的几个实施例中，应该理解到，所揭露的装置，可通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性或其它的形式。
180.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
181.另外，在申请明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件程序模块的形式实现。
182.所述集成的单元如果以软件程序模块的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储器中。基于这样的理解，本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储器中，包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储器包括：u盘、只读存储器(read
‑
only memory，rom)、随机存取存储器(random access memory，ram)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
183.本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储器中，存储器可以包括：闪存盘、只读存储器、随机存取器、磁盘或光盘等。
184.以上对本技术实施例进行了详细介绍，本文中应用了具体个例对本技术的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本技术的方法及其核心思想；同时，对于本领域的一般技术人员，依据本技术的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本技术的限制。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：罗泽丰;何聪辉
技术所有人：上海商汤科技开发有限公司
我是此专利的发明人

上一篇：一种省空间在线喷水快冷装置的制作方法
上一篇：模型训练方法、装置、设备及存储介质与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。