一种高效数据标注方法与流程

文档序号:19635080发布日期:2020-01-07 11:54阅读:4312来源:国知局
一种高效数据标注方法与流程

本发明涉及文本数据标注技术领域,具体为一种高效数据标注方法。



背景技术:

在解决目标检测问题时,常常需要对现有图像数据进行待检测目标的位置边框标注,由于摄像头和拍摄物的角度问题,原本形状较为规则的目标在成像后往往已经发生了形变,给标注工作增加了不少难度,这种情况在ocr样本上体现的尤为明显。

现有方法之一是采用矩形标注方法,即统一用矩形标注框对目标位置进行标注,该方法的优点是标注效率高,只需选取两个点(常常用鼠标点击->拖拽->松开的形式)即可完成一个目标的标注,缺点是精度不高,因为物体在发生形变后往往不能填满整个矩形框,而会留下很大的空隙。

现有方法之二是用任意四边形来对物体进行标注,该方法需要选定4个点来完成每一个目标的标注,其优点是标注精度较高,在标注人员认真标注的情况下可以获得较高质量的标注数据。但缺点是标注工作强度大(需要点四个点),容易出错,实际操作时某一个点的位置稍有偏差会造成整个四边形发生较大形变,造成频繁修改。



技术实现要素:

本发明的目的在于提供一种高效数据标注方法,以解决上述背景技术中提出的缺点是精度不高,因为物体在发生形变后往往不能填满整个矩形框,而会留下很大的空隙,工作强度大,容易出错的问题。

为实现上述目的,本发明提供如下技术方案:一种高效数据标注方法,该高效数据标注方法的具体标注步骤如下:

s1:投放待标注图像:将待标注图像传输到数据标注平台上,以便标注系统进行处理和标注人员标注;

s2:对图像进行投影变换,使标注目标形状接近矩形:以显示区域的左侧边和上边为y轴和x轴建立平面直角坐标系,且y轴和x轴的交点为原点,对步骤s1中投放的待标注图像进行投影变换处理,使得待标注图像中待标注的目标接近矩形状,将接近矩形状的待标注的目标置于视觉的中部;

s3:用矩形标注法进行标注:待标注图像投影变换至水平后,能很方便的用矩形标注法对其进行标注,只要选定矩形左上和右下两个点,即可得到矩形标注框;

s4:坐标逆变换:在第二步中标注所得的坐标可看作是投影变换后的坐标,利用之前求得的投影矩阵,对坐标进行逆变换,即可得到原始图像上相应的位置的坐标;

s5:得到原图对应标注信息:将步骤s4中逆变换后的原始图像上相应的位置的坐标输出,即可得到原图对应标注信息。

优选的,所述投影变换处理的方式包括旋转、翻转、平移和缩放等投影变换处理方式。

优选的,所述旋转的投影变换处理方式拆分为三个部分,第一部分是图像中心平移至原点,第二部分是以θ角度进行旋转,第三部分是将图像中心平移回去。

优选的,所述翻转的投影变换处理方式具体为:调控图像关于在显示区域中任意一条直线对折翻转。

优选的,所述平移的投影变换处理方式具体为:将图像中心平移至原点,之后移动图像中心并带动图像横移和纵移,且图像横移、纵移的长度分别为显示区域横向长度一半、纵向长度一半。

优选的,所述缩放的投影变换处理方式具体为:选定显示区域的中心点为缩放点,对图像按照n倍比例的缩放。

与现有技术相比,本发明的有益效果是:

1)标注省时:在单张图像样本含有大量相同方向(形态)待标注目标(如票据样本含有大量同角度方向的文本框)的情况下,经过一次投影变换后所有目标的标注难度都将大大降低,极大地提升了标注速度;

2)标注精度高:所得到的标注框能够很好得贴合目标,空隙小,精度高。

附图说明

图1为本发明标注方法的流程图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

在本发明的描述中,需要理解的是,术语“上”、“下”、“前”、“后”、“左”、“右”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。

请参阅图1,本发明提供一种技术方案:一种高效数据标注方法,该高效数据标注方法的具体标注步骤如下:

s1:投放待标注图像:将待标注图像传输到数据标注平台上,以便标注系统进行处理和标注人员标注,需要数据标注的图像通常为人工放入识别区域,通过摄像头进行采集获得需要数据标注的图像;

s2:对图像进行投影变换,使标注目标形状接近矩形:以显示区域的左侧边和上边为y轴和x轴建立平面直角坐标系,且y轴和x轴的交点为原点,对步骤s1中投放的待标注图像进行投影变换处理,使得待标注图像中待标注的目标接近矩形状,将接近矩形状的待标注的目标置于视觉的中部,建立的坐标系覆盖整改显示区域;

s3:用矩形标注法进行标注:待标注图像投影变换至水平后,能很方便的用矩形标注法对其进行标注,只要选定矩形左上和右下两个点,即可得到矩形标注框,将矩形标注框的面积覆盖整个标注目标;

s4:坐标逆变换:在第二步中标注所得的坐标可看作是投影变换后的坐标,利用之前求得的投影矩阵,对坐标进行逆变换,即可得到原始图像上相应的位置的坐标;

s5:得到原图对应标注信息:将步骤s4中逆变换后的原始图像上相应的位置的坐标输出,即可得到原图对应标注信息。

所述投影变换处理的方式包括旋转、翻转、平移和缩放等投影变换处理方式,根据不同的使用情况选用旋转、翻转、平移和缩放单一的投影变换处理方式或者其中两个或多个的组合操作方式。

所述旋转的投影变换处理方式拆分为三个部分,第一部分是图像中心平移至原点,以图像中心为基准点,带动整个图像同时移动,第二部分是以θ角度进行旋转,θ角度具体值根据具体的图像进行选择,对图像进行旋转作用,使得图像中待标注的目标能够通过旋转达到接近平直的状态,第三部分是将图像中心平移回去,使得图像的待标注的目标能够平直显示在显示区域中部。

所述翻转的投影变换处理方式具体为:调控图像关于在显示区域中任意一条直线对折翻转,翻转把图像关于显示区域中任意一条直线进行翻转180°,使得图像关于该直线翻转并显示翻转后的图像信息。

所述平移的投影变换处理方式具体为:将图像中心平移至原点,之后移动图像中心并带动图像横移和纵移,且图像横移、纵移的长度分别为显示区域横向长度一半、纵向长度一半,当图像显示的待标注的目标处于显示区域的边缘时,不方便看清楚或者难以识别时,将该图像调整到显示区域的中部方便进行识别的作用。

所述缩放的投影变换处理方式具体为:选定显示区域的中心点为缩放点,对图像按照n倍比例的缩放,当待标注的目标相对显示区域的比例较小时,其识别不准确,且难以进行识别作用,需要进行放大操作,将图像放大,使得待标注的目标与显示区域的比例适中。

实施例:

以旋转平移变换举例。如下图票据样本中有一旋转文本,直接对其进行标注较为不便,先以图像中心进行旋转直至文本成水平方向(标注人员手动完成)。旋转的投影变换处理方式的三个部分体现在下面公式中的三个变换矩阵(从右到左),其中width,height为图像长宽,x',y'为变换后坐标。

变换关系确定后,变换后图像每个像素值的确定可以通过逆映射对应到原图的坐标再通过插值算得。

仅通过旋转、平移变换有时并不足以将目标调整为水平矩形形状,需要依赖其他种类的投影变换或者其组合,但所有的投影变换及投影变换的组合都可以用下面公式表示。中间的投影变换矩阵常常是多个变换矩阵相乘所得。

在实际标注系统实现中可将投影矩阵分解成多个不同的变换矩阵,可以分开设定不同变换参数,以便于标注人员在标注系统中进行对应操作。

待标注图像旋转至水平后,能很方便的用矩形标注法对其进行标注,只要选定矩形左上和右下两个点,即可得到矩形标注框(一般会保存矩形四个顶点的坐标信息)。

在第二步中标注所得的坐标可看作是投影变换后的坐标,利用之前求得的投影矩阵,对坐标进行逆变换,即可得到原始图像上相应的位置的坐标(四边形四个顶点的坐标信息)。

至此,可得到原始图像上较为准确的目标边框位置信息。

以上显示和描述了本发明的基本原理和主要特征和本发明的优点,对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明;因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内,不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1