一种训练集数据的标注方法及装置与流程

文档序号:18548147发布日期:2019-08-27 21:53阅读:1709来源:国知局
一种训练集数据的标注方法及装置与流程

本发明涉及智能驾驶技术领域,具体而言,涉及一种训练集数据的标注方法及装置。



背景技术:

在机器学习领域中,训练集数据包含了用于训练网络模型的大量样本数据。对训练集数据进行标注是目前人工智能行业中不可或缺的一环,而目前国内外数据标注工作多采用众包、外包等人工标注方案。上述方案需要雇佣大量的人力资源才能满足在机器学习不断迭代过程中的标注需求,其效率低下。

当待标注的数据为激光点云数据时,人工标注的过程将更加复杂。激光点云数据是激光雷达返回的数据类型,激光点云包括大量激光点数据。激光雷达可以安装在智能车辆、机器人等设备中,用于根据采集设备周围的激光点云数据,根据激光点云数据可以确定设备周围的障碍物信息。

所收集到的激光点云数据信息量通常过多过杂,难以直接使用,需要人工对其进行识别和标注。在实际操作时,通常需要在三维界面中标注出对象的立体包围框。在标注立体包围框时比较困难,需要标注人员多次调整。面对大量、庞杂的激光点云数据,这种对数据标注的方式效率较低。为了解决这种训练集数据标注中的效率问题,亟需一种提高训练集数据的标注效率的标注方法。



技术实现要素:

本发明提供了一种训练集数据的标注方法及装置,以提高训练集数据的标注效率。具体的技术方案如下。

第一方面,本发明实施例公开了一种训练集数据的标注方法,包括:

获取训练集中已标注的第一样本激光点云数据和对应的待标注对象的标准标注框,作为模型训练数据;

根据所述模型训练数据,对目标网络模型进行训练,得到更新后的网络模型;其中,所述更新后的网络模型用于使得样本激光点云数据与对应的标准标注框相互关联;

判断待标注数据集中未标注的样本激光点云数据的数量是否大于第一数量;

如果大于,则从所述待标注数据集中未标注的样本激光点云数据中确定第二数量个样本激光点云数据,作为第二样本激光点云数据,由更新后的网络模型确定所述第二样本激光点云数据中待标注对象的参考标注框;

根据二维俯视坐标系与三维坐标系之间的第一映射关系,将所述第二样本激光点云数据和参考标注框显示在二维俯视界面中;其中,所述三维坐标系为所述第二样本激光点云数据所在的坐标系,所述二维俯视界面与所述二维俯视坐标系对应;

获取标注员针对所述二维俯视界面显示的第二样本激光点云数据和参考标注框输入的第一调整操作,根据所述第一调整操作,确定所述第二样本激光点云数据中待标注对象的标准标注框;

将所述第二样本激光点云数据和对应的标准标注框加入所述训练集;将所述第二样本激光点云数据和对应的标准标注框作为模型训练数据,将更新后的网络模型作为目标网络模型,返回执行所述根据所述模型训练数据,对目标网络模型进行训练,得到更新后的网络模型的步骤。

可选的,在确定所述第二样本激光点云数据中待标注对象的参考标注框之后,所述方法还包括:

将所述第二样本激光点云数据显示在三维界面中;其中,所述三维界面与所述三维坐标系对应;

所述根据所述第一调整操作,确定所述第二样本激光点云数据中待标注对象的标准标注框的步骤,包括:

根据所述第一调整操作,确定所述第二样本激光点云数据中待标注对象的第一待调整标注框;

在所述三维界面中显示所述第一待调整标注框;

获取标注员针对所述三维界面中显示的第一待调整标注框输入的第二调整操作,根据所述第二调整操作,对所述第一待调整标注框进行调整,得到所述第二样本激光点云数据中待标注对象的标准标注框。

可选的,所述根据所述第一调整操作,确定所述第二样本激光点云数据中待标注对象的标准标注框的步骤,包括:

根据所述第一调整操作,确定所述第二样本激光点云数据中待标注对象的第二待调整标注框;

确定所述第二待调整标注框的其他面所在的其他二维坐标系与所述三维坐标系之间的第二映射关系;其中,所述其他面包括背面和/或侧面,所述其他二维坐标系包括:二维背视坐标系和/或二维侧视坐标系;

根据所述第二映射关系,将所述第二样本激光点云数据和所述第二待调整标注框显示在与所述其他二维坐标系对应的其他二维界面中;

获取标注员针对所述其他二维界面显示的第二待调整标注框输入的第三调整操作;

根据所述第三调整操作对所述第二待调整标注框进行调整,得到所述第二样本激光点云数据中待标注对象的标准标注框。

可选的,当更新后的网络模型确定所述第二样本激光点云数据中不存在待标注对象时,所述方法还包括:

将所述第二样本激光点云数据加入负样本训练集中;所述负样本训练集中的样本激光点云数据拒绝针对标注员进行显示。

可选的,所述根据所述模型训练数据,对目标网络模型进行训练的步骤,包括:

将所述模型训练数据中的样本激光点云数据输入目标网络模型中;所述目标网络模型包括特征提取层和回归层;

通过所述特征提取层的第一模型参数,确定所述样本激光点云数据中的特征向量;通过所述回归层的第二模型参数,对所述特征向量进行回归,得到初始标注框;

确定所述初始标注框与所述模型训练数据中样本激光点云数据对应的标准标注框之间的差异;

当所述差异大于预设差异阈值时,根据所述差异修改所述第一模型参数和所述第二模型参数,返回执行所述将所述样本激光点云数据输入目标网络模型中的步骤;

当所述差异不大于预设差异阈值时,确定所述目标网络模型训练完成。

可选的,当所述待标注数据集中未标注的样本激光点云数据的数量不大于第一数量时,所述方法还包括:

将所述待标注数据集中未标注的样本激光点云数据作为第三样本激光点云数据,直接显示所述第三样本激光点云数据;

获取标注员针对所述第三样本激光点云数据输入的标注操作;

根据所述标注操作,确定针对所述第三样本激光点云数据的待标注对象的标准标注框;

将所述第三样本激光点云数据和对应的标准标注框加入所述训练集。

第二方面,本发明实施例公开了一种训练集数据的标注装置,包括:

数据获取模块,被配置为获取训练集中已标注的第一样本激光点云数据和对应的待标注对象的标准标注框,作为模型训练数据;

模型训练模块,被配置为根据所述模型训练数据,对目标网络模型进行训练,得到更新后的网络模型;其中,所述更新后的网络模型用于使得样本激光点云数据与对应的标准标注框相互关联;

数量判断模块,被配置为判断待标注数据集中未标注的样本激光点云数据的数量是否大于第一数量;

参考框确定模块,被配置为当所述待标注数据集中未标注的样本激光点云数据的数量大于第一数量时,从所述待标注数据集中未标注的样本激光点云数据中确定第二数量个样本激光点云数据,作为第二样本激光点云数据,由更新后的网络模型确定所述第二样本激光点云数据中待标注对象的参考标注框;

二维显示模块,被配置为根据二维俯视坐标系与三维坐标系之间的第一映射关系,将所述第二样本激光点云数据和参考标注框显示在二维俯视界面中;其中,所述三维坐标系为所述第二样本激光点云数据所在的坐标系,所述二维俯视界面与所述二维俯视坐标系对应;

标准框确定模块,被配置为获取标注员针对所述二维俯视界面显示的第二样本激光点云数据和参考标注框输入的第一调整操作,根据所述第一调整操作,确定所述第二样本激光点云数据中待标注对象的标准标注框;

第一加入模块,被配置为将所述第二样本激光点云数据和对应的标准标注框加入所述训练集;

数据更新模块,被配置为将所述第二样本激光点云数据和对应的标准标注框作为模型训练数据,将更新后的网络模型作为目标网络模型,返回执行所述根据所述模型训练数据,对目标网络模型进行训练,得到更新后的网络模型的操作。

可选的,所述装置还包括:

三维显示模块,被配置为在确定所述第二样本激光点云数据中待标注对象的参考标注框之后,将所述第二样本激光点云数据显示在三维界面中;其中,所述三维界面与所述三维坐标系对应;

所述标准框确定模块,根据所述第一调整操作,确定所述第二样本激光点云数据中待标注对象的标准标注框时,包括:

根据所述第一调整操作,确定所述第二样本激光点云数据中待标注对象的第一待调整标注框;

在所述三维界面中显示所述第一待调整标注框;

获取标注员针对所述三维界面中显示的第一待调整标注框输入的第二调整操作,根据所述第二调整操作,对所述第一待调整标注框进行调整,得到所述第二样本激光点云数据中待标注对象的标准标注框。

可选的,所述标准框确定模块,根据所述第一调整操作,确定所述第二样本激光点云数据中待标注对象的标准标注框时,包括:

根据所述第一调整操作,确定所述第二样本激光点云数据中待标注对象的第二待调整标注框;

确定所述第二待调整标注框的其他面所在的其他二维坐标系与所述三维坐标系之间的第二映射关系;其中,所述其他面包括背面和/或侧面,所述其他二维坐标系包括:二维背视坐标系和/或二维侧视坐标系;

根据所述第二映射关系,将所述第二样本激光点云数据和所述第二待调整标注框显示在与所述其他二维坐标系对应的其他二维界面中;

获取标注员针对所述其他二维界面显示的第二待调整标注框输入的第三调整操作;

根据所述第三调整操作对所述第二待调整标注框进行调整,得到所述第二样本激光点云数据中待标注对象的标准标注框。

可选的,所述装置还包括:

第二加入模块,被配置为当更新后的网络模型确定所述第二样本激光点云数据中不存在待标注对象时,将所述第二样本激光点云数据加入负样本训练集中;所述负样本训练集中的样本激光点云数据拒绝针对标注员进行显示。

可选的,所述模型训练模块,具体被配置为:

将所述模型训练数据中的样本激光点云数据输入目标网络模型中;所述目标网络模型包括特征提取层和回归层;

通过所述特征提取层的第一模型参数,确定所述样本激光点云数据中的特征向量;通过所述回归层的第二模型参数,对所述特征向量进行回归,得到初始标注框;

确定所述初始标注框与所述模型训练数据中样本激光点云数据对应的标准标注框之间的差异;

当所述差异大于预设差异阈值时,根据所述差异修改所述第一模型参数和所述第二模型参数,返回执行所述将所述样本激光点云数据输入目标网络模型中的操作;

当所述差异不大于预设差异阈值时,确定所述目标网络模型训练完成。

可选的,所述二维显示模块,还被配置为当所述待标注数据集中未标注的样本激光点云数据的数量不大于第一数量时,将所述待标注数据集中未标注的样本激光点云数据作为第三样本激光点云数据,直接显示所述第三样本激光点云数据;

所述标准框确定模块,还被配置为获取标注员针对所述第三样本激光点云数据输入的标注操作;根据所述标注操作,确定针对所述第三样本激光点云数据的待标注对象的标准标注框;

所述第一加入模块,还被配置为将所述第三样本激光点云数据和对应的标准标注框加入所述训练集。

由上述内容可知,本发明实施例提供的训练集数据的标注方法及装置,可以将已标注的样本激光点云数据和对应的标准标注框对目标网络模型进行训练,使用训练后的网络模型确定未标注的激光点云数据中待标注对象的参考标注框,以参考标注框作为参考,供标注员进行标注,得到标准标注框,这样能够降低标注员的标注复杂度,提高训练集数据的标注效率;同时,由于激光点云数据为分布于三维空间中的数据,在二维俯视界面中显示激光点云数据和参考标注框供标注员对参考标注框进行调整,进而得到标准标注框,代替原来直接在三维空间中标注立体包围框,在二维俯视界面中对参考标注框进行调整,能够在较大程度上降低标注员标注时的难度,提高了训练集数据的标注效率。当然,实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。

本发明实施例的创新点包括:

1、根据已经标注的数据对网络模型进行训练,使用训练后的模型对未标注的数据进行标注,并在二维俯视界面中显示激光点云数据和模型确定的标注框,提供给标注员进行调整,得到标准标注框,针对大量样本数据的情况以及样本数据为激光点云这种标注难度较大的数据来说,这种标注方式能够降低标注难度,提高标注的效率。

2、在确定标准标注框时,还可以将参考标注框显示在其他二维界面中,供标注员对立体包围框的其他面进行调整,能够得到更准确的标准标注框,相比于直接在三维界面中对其他面进行调整,能够调高标注效率。

3、当网络模型确定样本激光点云数据中不存在待标注对象时,不再将该样本激光点云数据显示给标注员进行识别,而是直接加入负样本训练集中,供其他模型训练使用。当存在大量样本数据时,这样的操作能够对样本数据进行筛选,只将存在待标注对象的激光点云数据提供给标注员进行标注,能够提高标注的效率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单介绍。显而易见地,下面描述中的附图仅仅是本发明的一些实施例。对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的训练集数据的标注方法的一种流程示意图;

图2为本发明实施例提供的一种坐标结构体系示意图;

图3为本发明实施例提供的一种显示界面的屏幕截图;

图4为本发明实施例提供的三维坐标系和二维俯视、背视、侧视坐标系的一种示意图;

图5为本发明提供的一种实施例的执行流程示意图;

图6为本发明实施例提供的对样本激光点云数据进行筛选的逻辑示意图;

图7为本发明实施例提供的训练集数据的标注装置的一种结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述。显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

需要说明的是,本发明实施例及附图中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。例如包含的一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。

本发明实施例公开了一种训练集数据的标注方法及装置,能够提高训练集数据的标注效率。下面对本发明实施例进行详细说明。

图1为本发明实施例提供的训练集数据的标注方法的一种流程示意图。该方法应用于电子设备。该电子设备可以为普通计算机、服务器或智能移动设备等。该方法具体包括以下步骤。

s110:获取训练集中已标注的第一样本激光点云数据和对应的待标注对象的标准标注框,作为模型训练数据。

其中,训练集包含用于训练网络模型的多个样本激光点云数据和对应的待标注对象的标准标注框。每个样本激光点云数据包含多个激光数据点。样本激光点云数据可以为激光雷达采集得到的。激光雷达可以均安装在智能设备中,智能设备可以为智能车辆、机器人等设备。激光雷达可以采集以激光雷达为中心、周围一圈环境中的激光点云数据。

激光雷达在采集数据时,向周围环境发射多个激光束,各个激光束遇到物体反射回激光雷达。激光雷达根据发射的各个激光束和返回的各个激光束可以得到激光点云数据,激光点云数据能够表征以激光雷达为中心的周围物体的三维空间位置。

待标注对象可以包括车辆、行人、自行车、三轮车等。标准标注框可以理解为能够包围待标注对象的立体包围框,标准标注框可以以长方体形式表示。第一样本激光点云数据的数量可以为多个,每个第一激光点云数据中可以包含多个待标注对象,每个待标注对象对应一个标准标注框。

s120:根据上述模型训练数据,对目标网络模型进行训练,得到更新后的网络模型。

其中,更新后的网络模型用于使得样本激光点云数据与对应的标准标注框相互关联。

本步骤中,目标网络模型可以采用深度学习网络模型。训练得到的网络模型,可以根据模型参数确定输入的激光点云数据中待检测对象的标注框,该标注框可以作为参考标注。根据上述模型训练数据对目标网络模型进行训练,得到的网络模型具备一定的准确性,能够在一定程度上使得样本激光点云数据与对应的标准标注框相互关联。

s130:判断待标注数据集中未标注的样本激光点云数据的数量是否大于第一数量,如果大于,则执行步骤s140。

待标注数据集包括大量未标注的样本激光点云数据。当待标注数据集中未标注的样本激光点云数据的数量不大于第一数量时,可以无需使用网络模型先确定参考标注框,直接提供给标注员对样本激光点云数据进行标注即可。

当待标注数据集中未标注的样本激光点云数据的数量大于第一数量时,为了提高标注的效率,可以执行步骤s140,提高标注效率。

s140:从待标注数据集中未标注的样本激光点云数据中确定第二数量个样本激光点云数据,作为第二样本激光点云数据,由更新后的网络模型确定第二样本激光点云数据中待标注对象的参考标注框。

其中,第二数量可以小于第一数量,也可以大于第一数量。例如,第一数量可以为2000,第二数量可以为1000。当待标注数据集中未标注的样本激光点云数据的数量为5000时,可以从这5000个样本激光点云数据中选取1000个样本激光点云数据作为第二样本激光点云数据。

将每个第二样本激光点云数据输入更新后的网络模型,由更新后的网络模型根据该网络模型训练得到的网络参数,确定每个第二样本激光点云数据中待标注对象的参考标注框。其中,参考标注框为立体的包围框,可以采用长方体表示。该参考标注框可能还不够准确,需要标注员对参考标注框进行调整,以提高标注框的准确性。

s150:根据二维俯视坐标系与三维坐标系之间的第一映射关系,将第二样本激光点云数据和参考标注框显示在二维俯视界面中。

其中,三维坐标系为第二样本激光点云数据所在的坐标系,三维坐标系可以以激光雷达中的点为坐标原点,以智能设备的前进方向为x轴方向,以竖直向上为z轴方向,智能设备的正左方向为y轴方向。

二维俯视界面与二维俯视坐标系对应。由于上述三维坐标系中z轴的方向为竖直向上的方向,因此二维俯视坐标系可以为包含三维直角坐标系中x轴和y轴的二维坐标系。x轴和y轴可以为第一坐标轴和第二坐标轴,z轴为第三坐标轴。

参见图2,该图2为本发明实施例提供的一种坐标结构体系示意图。其中所示界面为二维俯视界面,x轴方向向上,y轴方向向左。图2中的白色点状数据为激光点云数据中的数据点,界面中的圆弧形虚线和直线虚线均为辅助线,该辅助线用于限定标注范围。

在二维俯视界面中显示的第二样本激光点云数据可以供标注员查看,以便标注待标注对象。标注员可以为人或高级智能机器人等,本申请对此不作具体限定。

由于样本激光点云数据是分布在立体空间中的数据,能够包围待标注对象的标注框也是立体的,这需要标注员在立体空间中进行操作,操作难度较大。为了便于标注员对参考标注框进行调整,本步骤将第二激光点云数据和参考标注框显示在二维俯视界面中。

s160:获取标注员针对二维俯视界面显示的第二样本激光点云数据和参考标注框输入的第一调整操作,根据第一调整操作,确定第二样本激光点云数据中待标注对象的标准标注框。

其中,第一调整操作用来调整包含待标注对象的参考标注框。第一调整操作可以包括鼠标点击操作、鼠标拖拽操作、键盘拖拽操作等中的至少一种。

根据针对参考标注框的第一调整操作,可以得到调整后的标注框,该调整后的标注框可以作为标准标注框。

参见图3,右上角为二维俯视界面显示的为第二样本激光点云数据,其中显示的参考标注框为xy平面中的二维矩形框,标注员的调整操作可以针对该二维矩形框进行,调整操作简单易实施。根据标注员的第一调整操作可以修改参考标注框顶点的x和y坐标,参考标注框顶点的z坐标保持不变。

s170:将第二样本激光点云数据和对应的标准标注框加入训练集,将第二样本激光点云数据和对应的标准标注框作为模型训练数据,将更新后的网络模型作为目标网络模型,返回执行步骤s120。

本实施例中,将第二样本激光点云数据加入训练集时,还可以删除待标注数据集中的第二样本激光点云数据。

将第二样本激光点云数据和对应的标准标注框作为模型训练数据,将更新后的网络模型作为目标网络模型,返回执行步骤s120,可以继续对目标网络模型进行训练,不断提高目标网络模型确定的参考标注框的准确性,进而减少标注员对参考标注框的调整量,提高确定标准标注框时的效率。

由上述内容可知,本实施例可以将已标注的样本激光点云数据和对应的标准标注框对目标网络模型进行训练,使用训练后的网络模型确定未标注的激光点云数据中待标注对象的参考标注框,以参考标注框作为参考,供标注员进行标注,得到标准标注框,这样能够降低标注员的标注复杂度,提高训练集数据的标注效率;同时,由于激光点云数据为分布于三维空间中的数据,在二维俯视界面中显示激光点云数据和参考标注框供标注员对参考标注框进行调整,进而得到标准标注框,代替原来直接在三维空间中标注立体包围框,在二维俯视界面中对参考标注框进行调整,能够在较大程度上降低标注员标注时的难度,提高了训练集数据的标注效率。

在本发明的另一实施例中,基于图1所示实施例,在步骤s140中确定第二样本激光点云数据中待标注对象的参考标注框之后,该方法还可以将第二样本激光点云数据显示在三维界面中。其中,三维界面与上述三维坐标系对应。

步骤s160中根据第一调整操作,确定第二样本激光点云数据中待标注对象的标准标注框的步骤,具体包括以下步骤1a~3a。

步骤1a:根据第一调整操作,确定第二样本激光点云数据中待标注对象的第一待调整标注框。

本步骤中,根据针对参考标注框的第一调整操作,可以得到调整后的标注框,该调整后的标注框可以作为第一待调整标注框。

步骤2a:在三维界面中显示第一待调整标注框。

步骤3a:获取标注员针对三维界面中显示的第一待调整标注框输入的第二调整操作,根据第二调整操作,对第一待调整标注框进行调整,得到第二样本激光点云数据中待标注对象的标准标注框。

由于第一待调整标注框为对参考标注框在xy平面内的尺寸和位置进行的调整,将第一待调整标注框显示在三维界面中后,可以根据标注员输入的第二调整操作,对第一待调整标注框的z参量进行调整,得到第二样本激光点云数据中待标注对象的标准标注框。

第二调整操作用来调整第一待调整标注框的尺寸和位置。第二调整操作可以包括鼠标点击操作、鼠标拖拽操作、键盘拖拽操作等中的至少一种。

本实施例中,当在二维俯视界面中调整参考标注框时,可以根据第一调整操作,实时地将第一调整操作显示到三维界面中。当在三维界面中调整第一待调整标注框时,可以根据第二调整操作,实时地将针对第一待调整标注框的调整显示在二维俯视界面中。

综上,本实施例可以同时在二维俯视界面和三维界面中显示第二样本激光点云数据和第一待调整标注框,三维和二维之间的映射参考,使得结果数据更为可信。同时,也能够使得标注员从更多角度查看标注框,及时修改标注框。

在本发明的另一实施例中,基于图1所示实施例,为了进一步提高标准标注框的准确性,步骤s160中根据第一调整操作,确定第二样本激光点云数据中待标注对象的标准标注框的步骤,具体可以包括以下步骤1b~5b。

步骤1b:根据第一调整操作,确定第二样本激光点云数据中待标注对象的第二待调整标注框。

本步骤中,根据针对参考标注框的第一调整操作,可以得到调整后的标注框,该调整后的标注框可以作为第二待调整标注框。

步骤2b:确定第二待调整标注框的其他面所在的其他二维坐标系与三维坐标系之间的第二映射关系。

其中,其他面包括背面和/或侧面,其他二维坐标系包括:二维背视坐标系和/或二维侧视坐标系。其他面可以理解为第二待调整标注框中除了二维俯视界面中显示的面之外、且与二维俯视界面中显示的面不平行的面。背面,是指站在激光雷达的位置面向第二待调整标注框时面对的平面或与该面对的平面平行的面。侧面,是指站在激光雷达的位置面向第二待调整标注框时第二待调整标注框侧向的平面,可以为左侧面或者右侧面。

本步骤中,可以根据第二待调整标注框在三维坐标系中的坐标确定其他二维坐标系与三维坐标系之间的第二映射关系。通过坐标转换即可以确定第二映射关系。

图4为本发明提供的三维坐标系和二维俯视、背视、侧视坐标系的一种示意图。其中,在三维坐标系中的长方体为待标注对象的第二待调整标注框,x轴方向为智能设备的行进方向,z轴竖直向上,o点为激光雷达的位置,长方体的三条边分别平行于三维坐标系中的三个坐标轴。二维俯视坐标系中包含x轴和y轴,二维背视坐标系中包含z轴和y轴,二维侧视坐标系中包含z轴和x轴。根据该图能确定二维俯视坐标系、二维背视坐标系、二维侧视坐标系分别与三维坐标系之间的对应关系。其中,二维俯视坐标系与二维俯视界面对应,二维背视坐标系与二维背视界面对应,二维侧视坐标系与二维侧视界面对应。

当长方体的边不平行于坐标轴时,可以根据边与坐标轴之间的夹角进行投影,得到立方体的背面和侧面所在的坐标系。

步骤3b:根据第二映射关系,将第二样本激光点云数据和第二待调整标注框显示在与其他二维坐标系对应的其他二维界面中。

参见图3,右下角的两个界面分别为二维背视界面和二维侧视界面,其中显示了二维的第二待调整包围框以及第二样本激光点云数据。显示的各个二维界面可以供标注员很好地查看所确定的第二待调整包围框,以便更准确地对第二待调整包围框的边进行修正。

图3的右下角文字部分还显示了可以供标注员选择待标注对象类型的按钮。这些按钮选项对应的待标注对象类型包括小汽车、卡车、公共汽车、两轮车、行人、三轮车和未知。根据标注员通过点选按钮输入的选择操作,可以确定待标注对象类型。

步骤4b:获取标注员针对其他二维界面显示的第二待调整标注框输入的第三调整操作。

其中,第三调整操作用来调整第二待调整标注框的尺寸和位置。第三调整操作可以包括鼠标点击操作、鼠标拖拽操作、键盘拖拽操作等中的至少一种。

步骤5b:根据第三调整操作对第二待调整标注框进行调整,得到第二样本激光点云数据中待标注对象的标准标注框。

当对第二待调整标注框进行调整之后,调整后得到的标准标注框可以实时地显示在二维俯视界面和三维界面中。

综上,本实施例在得到第二待调整标注框时,将第二待调整标注框和第二样本激光点云数据显示在二维背视和/或侧视界面中,这使得标注员可以从更多种视图中查看第二待调整标注框,且对第二待调整标注框进行调整,在二维界面中对第二待调整标注框进行调整,对标注员来说更易于实施,同时也能提高标准标注框的准确性,相比于直接在三维界面中对其他面进行调整,能够调高标注效率。

在本发明的另一实施例中,基于图1所示实施例,当更新后的网络模型确定第二样本激光点云数据中不存在待标注对象时,该方法还可以将第二样本激光点云数据加入负样本训练集中。

其中,负样本训练集中的样本激光点云数据拒绝针对标注员进行显示。例如,当待标注对象为车辆时,当第二样本激光点云数据中不包含车辆反射的激光数据点时,可以不将该第二样本激光点云数据向标注员显示,无需标注员再识别第二样本激光点云数据中是否存在待标注对象。负样本训练集中的样本激光点云数据可以作为对其他网络模型进行训练时的负样本。

当第二样本激光点云数据中存在待标注对象时,第二样本激光点云数据可以作为正样本加入对应的训练集中。

综上,本实施例中,当网络模型确定第二样本激光点云数据中不存在待标注对象时,不再将该样本激光点云数据显示给标注员进行识别,而是直接加入负样本训练集中,供其他模型训练使用。当存在大量样本数据时,这样的操作能够对样本数据进行筛选,只将存在待标注对象的样本激光点云数据提供给标注员进行标注,能够提高标注的效率。

在本发明的另一实施例中,基于图1所示实施例,步骤s120,根据上述模型训练数据,对目标网络模型进行训练的步骤,具体可以包括以下步骤1c~4c。

步骤1c:将模型训练数据中的样本激光点云数据输入目标网络模型中。

其中,目标网络模型包括特征提取层和回归层。模型训练数据中的样本激光点云数据,可以为第一样本激光点云数据或第二样本激光点云数据。

步骤2c:通过特征提取层的第一模型参数,确定样本激光点云数据中的特征向量,通过回归层的第二模型参数,对特征向量进行回归,得到初始标注框。

第一模型参数和第二模型参数的初始值可以根据经验预先设置,例如可以设置为较小的值。在每次训练的过程中,第一模型参数和第二模型参数不断地被修正,逐渐接近真实值。

步骤3c:确定初始标注框与上述模型训练数据中样本激光点云数据对应的标准标注框之间的差异。其中,该差异可以采用损失函数得到。

步骤4c:当上述差异大于预设差异阈值时,根据该差异修改第一模型参数和第二模型参数,返回执行步骤1c。当该差异不大于预设差异阈值时,确定目标网络模型训练完成。

返回步骤1c时,输入目标网络模型中的样本激光点云数据不同于上次循环中输入目标网络模型中的样本激光点云数据。

当差异量大于预设差异阈值时,认为目标网络模型的预测结果与真实值之间的差异较大,需要继续训练网络。根据差异对上述第一模型参数和第二模型参数进行修正时,可以参考差异的具体数值以及方向,根据该具体数值,向相反方向调整第一模型参数和第二模型参数。

综上,本实施例提供了利用样本激光点云数据和标准标注框对目标网络模型进行循环训练的实施方式。

在本发明的另一实施例中,基于图1所示实施例,当待标注数据集中未标注的样本激光点云数据的数量不大于第一数量时,也就是当待标注数据集中未标注的样本激光点云数据的数量不太多时,可以不将未标注的样本激光点云数据输入更新后的网络模型,而是执行以下步骤1d~4d。

步骤1d:将待标注数据集中未标注的样本激光点云数据作为第三样本激光点云数据,直接显示第三样本激光点云数据。

具体的,可以在二维俯视界面中显示第三样本激光点云数据。也可以同时在三维界面中显示第三样本激光点云数据。

步骤2d:获取标注员针对第三样本激光点云数据输入的标注操作。

其中,该标注操作可以包括鼠标点击操作、鼠标拖拽操作、键盘拖拽操作等中的至少一种。

步骤3d:根据该标注操作,确定针对第三样本激光点云数据的待标注对象的标准标注框。

步骤4d:将第三样本激光点云数据和对应的标准标注框加入训练集。

综上,本实施例中,当待标注数据集中未标注的样本激光点云数据的数量不太多时,无需从待标注数据集中未标注的样本激光点云数据中确定第二样本激光点云数据,也无需将未标注的样本激光点云数据输入更新后的网络模型,而是直接显示未标注的样本激光点云数据,确定标准标注框。

下面再结合具体实例对本发明实施例进行说明。

参见图5所示执行流程示意图,在初始阶段中,样本激光点云数据经过人工标注后加入训练集,使用机器学习算法对训练集中已经标注的样本激光点云数据进行学习,获得基础神经网络模型。针对后续未标注的样本激光点云数据,在人工标注之前,可以使用该基础神经网络模型对这部分未标注的样本激光点云数据进行检测,筛选出符合要求的数据(例如,筛选出存在待标注对象的数据),并生成与筛选出的数据对应的参考标注框,该参考标注框可以用作后续人工标注的辅助信息,从而提高标注的效率。经过人工标注的样本激光点云数据再进入训练神经网络模型的流程,训练所得神经网络模型将替换旧有神经网络模型,用于下一次筛选,依次循环进行,直到所有激光点云数据标注完成。

参见图6所示对样本激光点云数据的筛选逻辑示意图。基于深度学习技术,使用已标注样本激光点云数据训练得到神经网络模型。电子设备中的筛选处理器加载神经网络模型,并对每个未标注样本激光点云数据进行分析,得到是否保留该数据的筛选结果,当筛选结果为保留该数据时还得到对应的参考标注框。电子设备中的筛选处理器可以为一个,也可以为多个。在对样本激光点云数据进行筛选时,输入的每个样本激光点云数据在经过神经网络模型的每个层次时,该层会根据当前层的特征值对数据进行分类。通过神经网络模型的若干层次后,会对样本激光点云数据中的待标注对象输出一份筛选结果,该筛选结果表征样本激光点云数据中存在待标注对象的概率,且包括能包围待标注对象的包围框。因此,经过对概率大小进行判断,将概率高的数据筛选出来,对对应的包围框进行显示以便标注员调整,进而提高后续人工标注的效率。

图7为本发明实施例提供的训练集数据的标注装置的一种结构示意图。该装置实施例应用于电子设备。该装置实施例与图1所示实施例相对应。该装置包括:

数据获取模块710,被配置为获取训练集中已标注的第一样本激光点云数据和对应的待标注对象的标准标注框,作为模型训练数据;

模型训练模块720,被配置为根据模型训练数据,对目标网络模型进行训练,得到更新后的网络模型;其中,更新后的网络模型用于使得样本激光点云数据与对应的标准标注框相互关联;

数量判断模块730,被配置为判断待标注数据集中未标注的样本激光点云数据的数量是否大于第一数量;

参考框确定模块740,被配置为当待标注数据集中未标注的样本激光点云数据的数量大于第一数量时,从待标注数据集中未标注的样本激光点云数据中确定第二数量个样本激光点云数据,作为第二样本激光点云数据,由更新后的网络模型确定第二样本激光点云数据中待标注对象的参考标注框;

二维显示模块750,被配置为根据二维俯视坐标系与三维坐标系之间的第一映射关系,将第二样本激光点云数据和参考标注框显示在二维俯视界面中;其中,三维坐标系为第二样本激光点云数据所在的坐标系,二维俯视界面与二维俯视坐标系对应;

标准框确定模块760,被配置为获取标注员针对二维俯视界面显示的第二样本激光点云数据和参考标注框输入的第一调整操作,根据第一调整操作,确定第二样本激光点云数据中待标注对象的标准标注框;

第一加入模块770,被配置为将第二样本激光点云数据和对应的标准标注框加入训练集;

数据更新模块780,被配置为将第二样本激光点云数据和对应的标准标注框作为模型训练数据,将更新后的网络模型作为目标网络模型,返回模型训练模块720,执行根据模型训练数据,对目标网络模型进行训练,得到更新后的网络模型的操作。

在本发明的另一实施例中,基于图7所示实施例,该装置还包括:

三维显示模块(图中未示出),被配置为在确定第二样本激光点云数据中待标注对象的参考标注框之后,将第二样本激光点云数据显示在三维界面中;其中,三维界面与三维坐标系对应;

标准框确定模块760,根据第一调整操作,确定第二样本激光点云数据中待标注对象的标准标注框时,包括:

根据第一调整操作,确定第二样本激光点云数据中待标注对象的第一待调整标注框;

在三维界面中显示第一待调整标注框;

获取标注员针对三维界面中显示的第一待调整标注框输入的第二调整操作,根据第二调整操作,对第一待调整标注框进行调整,得到第二样本激光点云数据中待标注对象的标准标注框。

在本发明的另一实施例中,基于图7所示实施例,标准框确定模块760,根据第一调整操作,确定第二样本激光点云数据中待标注对象的标准标注框时,包括:

根据第一调整操作,确定第二样本激光点云数据中待标注对象的第二待调整标注框;

确定第二待调整标注框的其他面所在的其他二维坐标系与三维坐标系之间的第二映射关系;其中,其他面包括背面和/或侧面,其他二维坐标系包括:二维背视坐标系和/或二维侧视坐标系;

根据第二映射关系,将第二样本激光点云数据和第二待调整标注框显示在与其他二维坐标系对应的其他二维界面中;

获取标注员针对其他二维界面显示的第二待调整标注框输入的第三调整操作;

根据第三调整操作对第二待调整标注框进行调整,得到第二样本激光点云数据中待标注对象的标准标注框。

在本发明的另一实施例中,基于图7所示实施例,装置还包括:

第二加入模块(图中未示出),被配置为当更新后的网络模型确定第二样本激光点云数据中不存在待标注对象时,将第二样本激光点云数据加入负样本训练集中;负样本训练集中的样本激光点云数据拒绝针对标注员进行显示。

在本发明的另一实施例中,基于图7所示实施例,模型训练模块720,具体被配置为:

将模型训练数据中的样本激光点云数据输入目标网络模型中;目标网络模型包括特征提取层和回归层;

通过特征提取层的第一模型参数,确定样本激光点云数据中的特征向量;通过回归层的第二模型参数,对特征向量进行回归,得到初始标注框;

确定初始标注框与模型训练数据中样本激光点云数据对应的标准标注框之间的差异;

当差异大于预设差异阈值时,根据差异修改第一模型参数和第二模型参数,返回执行将样本激光点云数据输入目标网络模型中的操作;

当差异不大于预设差异阈值时,确定目标网络模型训练完成。

在本发明的另一实施例中,基于图7所示实施例,该装置还包括:

二维显示模块750,还被配置为当待标注数据集中未标注的样本激光点云数据的数量不大于第一数量时,将待标注数据集中未标注的样本激光点云数据作为第三样本激光点云数据,直接显示第三样本激光点云数据;

标准框确定模块760,还被配置为获取标注员针对第三样本激光点云数据输入的标注操作;根据标注操作,确定针对第三样本激光点云数据的待标注对象的标准标注框;

第一加入模块770,还被配置为将第三样本激光点云数据和对应的标准标注框加入训练集。

上述装置实施例与方法实施例相对应,与该方法实施例具有同样的技术效果,具体说明参见方法实施例。装置实施例是基于方法实施例得到的,具体的说明可以参见方法实施例部分,此处不再赘述。

本领域普通技术人员可以理解:附图只是一个实施例的示意图,附图中的模块或流程并不一定是实施本发明所必须的。

本领域普通技术人员可以理解:实施例中的装置中的模块可以按照实施例描述分布于实施例的装置中,也可以进行相应变化位于不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1