基于弱分割的损伤检测方法及装置与流程

文档序号：18728922发布日期：2019-09-21 00:13阅读：220来源：国知局

本说明书一个或多个实施例涉及机器学习领域，尤其涉及利用机器学习基于弱分割进行损伤检测的方法和装置。

背景技术：

随着机器学习的快速发展，各种人工智能技术已经应用于多种场景，帮助人们解决相应场景下的技术问题。其中，计算机视觉图像识别技术在多种领域多种场景下，都有强烈的应用需求，例如，应用于医疗影像分析，车损智能识别，等等。

例如，在传统车险理赔场景中,保险公司需要派出专业的查勘定损人员到事故现场进行现场查勘定损，给出车辆的维修方案和赔偿金额，并拍摄现场照片，定损照片留档以供后台核查人员核损核价。由于需要人工查勘定损，保险公司需要投入大量的人力成本，和专业知识的培训成本。从普通用户的体验来说，理赔流程由于等待人工查勘员现场拍照、定损员在维修地点定损、核损人员在后台核损，理赔周期长达1-3天，用户的等待时间较长，体验较差。针对这样的行业痛点，希望能够利用图像识别技术，根据普通用户拍摄的现场损失图片，自动识别图片中反映的车损状况，并自动给出维修方案。如此，无需人工查勘定损核损，大大减少保险公司的成本，提升普通用户的车险理赔体验。

在医疗影像分析中，也希望能够借助于图像识别技术，基于医疗影像智能地给出图像特点的分析，帮助医师进行诊断。

以上场景中，都需要从图片(车损图片或医疗图像)中识别出损伤对象。然而，目前的图像识别方案中，对于损伤对象识别的准确度以及可用性还有待进一步提高。因此，希望能有改进的方案，能够更精准地从图片中识别出损伤对象。

技术实现要素：

本说明书一个或多个实施例描述了基于弱分割的损伤检测方法和装置，其中基于自动生成的弱分割标注数据训练弱分割损伤检测模型，该模型预测输出的损伤边框和损伤分割轮廓可以互相验证，提升损伤预测的准确性。

根据第一方面，提供了一种计算机执行的、训练弱分割损伤检测模型的方法，包括：

获取样本图片，所述样本图片对应具有边框标注数据，所述边框标注数据指示出至少一个损伤标注框，每个损伤标注框是标注人员标注的、框选出所述样本图片中损伤对象的最小矩形框；

将各个损伤标注框作为对应损伤对象的轮廓，基于所述轮廓为所述样本图片中各个像素点标注分割类别，从而生成分割标注数据；

将所述样本图片输入弱分割损伤检测模型，所述弱分割损伤检测模型包括边框预测分支和分割预测分支，所述边框预测分支输出用于指示损伤预测框的边框预测数据，所述分割预测分支输出针对所述样本图片中各个像素点的分割类别进行预测的分割预测数据；

基于所述边框预测数据与所述边框标注数据的比对，确定边框预测损失项，以及，基于所述分割预测数据和分割标注数据的比对，确定分割预测损失项；

根据所述边框预测损失项和所述分割预测损失项，确定本次预测的损失函数；

在所述损失函数减小的方向，更新所述弱分割损伤检测模型。

在一个实施例中，通过以下方式为各个像素点标注分割类别：

将位于损伤标注框之内的像素点标注为第一分割类别，将位于损伤标注框之外的像素点标注为第二分割类别。

在一种实施方式中，上述至少一个损伤标注框包括第一损伤标注框；所述边框标注数据还包括，标注人员从预定的N个损伤类别中，针对该第一损伤标注框选择标注的第一损伤类别；在这样的情况下，为各个像素点标注分割类别包括：对于位于所述第一损伤标注框之内的像素点，将其分割类别标注为所述第一损伤类别对应的类别。

在一种实施方式中，所述至少一个损伤标注框包括第一损伤标注框和第二损伤标注框，所述第一损伤标注框和第二损伤标注框存在交叠区域；所述边框标注数据还包括，标注人员从预定的N个损伤类别中，针对该第一损伤标注框选择标注的第一损伤类别和针对第二损伤标注框选择标注的第二损伤类别，其中第二损伤类别的损伤严重程度大于所述第一损伤类别；在这样的情况下，为各个像素点标注分割类别包括：对于位于所述交叠区域之内的像素点，将其分割类别标注为所述第二损伤类别对应的类别。

根据一种实施方式，弱分割损伤检测模型基于卷积神经网络CNN实现，所述卷积神经网络CNN包括基础卷积层，用于对所述样本图片进行卷积处理，得到对应的卷积特征图；所述边框预测分支用于基于所述卷积特征图预测得到所述边框预测数据；所述分割预测分支用于基于所述卷积特征图预测得到所述分割预测数据。

进一步的，在一个实施例中，所述分割预测分支可以包括：

上采样层，用于将经卷积处理的特征上采样为与所述样本图片大小相同的第一特征图；

预测处理层，用于基于所述第一特征图预测各个像素点属于各个分割类别的概率。

根据一种实现方式，分割预测数据包括，各个像素点属于各个分割类别的概率；在这样的情况下，可以如下确定分割预测损失项：根据各个像素点属于各个分割类别的概率确定各个像素点的预测分割类别；将各个像素点的预测分割类别与其标注分割类别进行比对，根据比对结果确定所述分割预测损失项。

根据另一种实现方式，可以如下确定分割预测损失项：确定各个像素点属于其对应的标注分割类别的预测概率；根据所述预测概率，确定所述分割预测损失项。

根据第二方面，提供一种计算机执行的从图片中检测损伤的方法，包括：

获取根据第一方面的方法训练得到的弱分割损伤检测模型；

将待测图片输入所述弱分割损伤检测模型，所述弱分割损伤检测模型包括边框预测分支和分割预测分支，所述边框预测分支输出用于指示至少一个损伤预测框的边框预测数据，所述分割预测分支输出针对所述待测图片中各个像素点的分割类别进行预测的分割预测数据；

根据所述边框预测数据和所述分割预测数据，确定针对所述待测图片的损伤检测结果。

在一种情况下，边框预测数据可能未指示出损伤预测框，或者分割预测数据未指示出损伤对象区域，其中损伤对象区域为预测分割类别为同一类别的像素点集合构成的面积大于一定阈值的连通区域，此时，根据一种实施方式，可以将损伤检测结果确定为待测图片不包含损伤对象。

在另一种情况下，边框预测数据指示出至少一个损伤预测框，分割预测数据指示出至少一个损伤对象区域；在此情况下，可以根据所述至少一个损伤预测框和所述至少一个损伤对象区域，确定针对所述待测图片的损伤检测结果。

根据一种具体实施方式，确定针对所述待测图片的损伤检测结果可以包括：将所述至少一个损伤预测框对应的区域集合，与所述至少一个损伤对象区域对应的区域集合的并集，作为损伤检测结果。

根据另一种实施方式，确定针对所述待测图片的损伤检测结果可以包括：如果所述至少一个损伤预测框中任意的第一损伤预测框与各个损伤对象区域的交并比均小于预设阈值，则从所述损伤检测结果中移除该第一损伤预测框。

根据又一种实施方式，确定针对所述待测图片的损伤检测结果可以包括：如果所述至少一个损伤预测框中任意的第一损伤预测框与各个损伤对象区域的交叠面积，与该第一损伤预测框的框面积的比例均小于预设阈值，则从所述损伤检测结果中移除该第一损伤预测框。

在一个实施例中，所述至少一个损伤预测框包括第一损伤预测框，所述边框预测数据还包括针对该第一损伤预测框预测的第一损伤类别；所述至少一个损伤对象区域包括第一损伤对象区域，所述第一损伤对象区域中的像素点对应于第一分割类别；在这样的情况下，确定针对所述待测图片的损伤检测结果可以包括：

如果所述第一损伤预测框与所述第一损伤对象区域的交并比大于预设阈值，但所述第一损伤类别与所述第一分割类别不对应，则将所述第一损伤检测框确定为异常检测框，或将所述第一损伤对象区域确定为异常区域。

根据第三方面，提供一种训练弱分割损伤检测模型的装置，包括：

样本获取单元，配置为获取样本图片，所述样本图片对应具有边框标注数据，所述边框标注数据指示出至少一个损伤标注框，每个损伤标注框是标注人员标注的、框选出所述样本图片中损伤对象的最小矩形框；

标注生成单元，配置为将各个损伤标注框作为对应损伤对象的轮廓，基于所述轮廓为所述样本图片中各个像素点标注分割类别，从而生成分割标注数据；

模型输入单元，配置为将所述样本图片输入弱分割损伤检测模型，所述弱分割损伤检测模型包括边框预测分支和分割预测分支，所述边框预测分支输出用于指示损伤预测框的边框预测数据，所述分割预测分支输出针对所述样本图片中各个像素点的分割类别进行预测的分割预测数据；

第一确定单元，配置为基于所述边框预测数据与所述边框标注数据的比对，确定边框预测损失项，以及，基于所述分割预测数据和分割标注数据的比对，确定分割预测损失项；

第二确定单元，配置为根据所述边框预测损失项和所述分割预测损失项，确定本次预测的损失函数；

模型更新单元，配置为在所述损失函数减小的方向，更新所述弱分割损伤检测模型。

根据第四方面，提供一种从图片中检测损伤的装置，包括：

模型获取单元，配置为获取通过权利要求15的装置训练得到的弱分割损伤检测模型；

模型输入单元，配置为将待测图片输入所述弱分割损伤检测模型，所述弱分割损伤检测模型包括边框预测分支和分割预测分支，所述边框预测分支输出用于指示至少一个损伤预测框的边框预测数据，所述分割预测分支输出针对所述待测图片中各个像素点的分割类别进行预测的分割预测数据；

结果确定单元，配置为根据所述边框预测数据和所述分割预测数据，确定针对所述待测图片的损伤检测结果。

根据第五方面，提供了一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令计算机执行第一方面和第二方面的方法。

根据第六方面，提供了一种计算设备，包括存储器和处理器，其特征在于，所述存储器中存储有可执行代码，所述处理器执行所述可执行代码时，实现第一方面和第二方面的方法。

根据本说明书实施例提供的方法和装置，基于人工标注的损伤框生成弱分割标注数据，利用这样的弱分割标注数据训练具有边框检测和分割预测两个分支的弱分割损伤检测模型。在使用时，将待测图片输入该弱分割损伤检测模型，通过上述两个分支分别得到损伤预测边框和损伤对象区域。损伤预测边框和损伤对象区域可以互相验证补充，从而提高损伤检测的准确性。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1示出根据一个实施例的实施场景示意图；

图2示出根据一个实施例的训练弱分割的损伤检测模型的方法流程图；

图3示出经过人工标注的样本图片的一个具体示例；

图4示出在一个实施例中为像素点标注分割类别的示意图；

图5示出根据一个实施例的弱分割损伤检测模型的结构示意图；

图6示出根据一个实施例从图片中识别损伤的方法的步骤流程图；

图7是在一个例子中弱分割损伤检测模型输出的损伤预测框和损伤对象区域；

图8示出根据一个实施例的训练弱分割损伤检测模型的装置的示意性框图；

图9示出根据一个实施例的损伤检测装置的示意性框图。

具体实施方式

下面结合附图，对本说明书提供的方案进行描述。

如前所述，在车辆智能定损、医疗影像分析等多种场景中，需要从图片中识别出损伤对象，例如车辆损伤，器官病变损伤。为此，可以训练以损伤对象为检测目标的损伤检测模型，通过损伤检测模型来进行损伤识别。一般的，模型的训练需要大量的标注数据。对于损伤检测来说，可以由标注人员将损伤对象作为特定的目标对象进行标注，也就是，在图片中用包含损伤对象的最小矩形框标注出损伤对象，这样的矩形框又称为损伤标注框。样本原图和损伤标注框共同构成图片训练样本。利用这样的训练样本进行模型训练，即可得到损伤检测模型。在训练得到损伤检测模型后，即可利用损伤检测模型对待测图片进行损伤识别。一般地，损伤检测模型的输出结果为，在待测图片中预测得到的若干损伤预测框，每个损伤预测框用最小矩形框框选出预测的损伤对象。

然而，如前所述，目前损伤检测模型的检测准确率还有待提高。特别是在车辆损伤识别的场景下，由于车损图片的拍摄环境比较复杂，常常受到反光、污渍等影响，使得损伤检测的准确性不够理想，例如将反光、污渍等情况误检测为损伤。

为此，发明人提出，在进行常规损伤检测的基础上，还对待测图片进行图像分割，利用分割的结果来验证或补充常规损伤检测结果。

图像分割又称为图像语义分割，用于将图像分割或者划分为属于/不属于特定目标对象的区域，其输出可以表现为覆盖特定目标对象区域的蒙层(Mask)。一般地，图像分割模型基于对目标对象的轮廓进行标注的分割标注数据而训练。在损伤识别的场景下，图像分割用于将图片划分为属于/不属于损伤对象的区域。相应的，可以理解，模型训练则要求对损伤对象的轮廓进行标注的标注数据。

一般地，轮廓的标注要求标注人员用若干标注点描画出目标对象的边界，这个过程费时费力，人工成本很高。特别是对于损伤对象这样的形状不规则、边界不清晰的目标对象来说，标注成本更是高昂。

综合考虑到以上因素，根据本发明的实施例，利用损伤标注框作为损伤对象的粗略轮廓标注，进行图像分割的训练，得到一个两分支的损伤检测模型，其中一个分支进行常规的损伤对象检测，另一分支进行图像分割。由于分割标注数据是将损伤标注框直接作为损伤对象的轮廓而自动生成的，精度有限，可以将如此训练的模型称为弱分割损伤检测模型。弱分割损伤检测模型可以输出常规损伤预测框和弱分割结果，这两方面的结果可以互相融合，来优化最终的损伤检测结果。

图1示出根据一个实施例的实施场景示意图。如图1所示，预先利用训练样本训练弱分割损伤检测模型。具体而言，训练样本由样本图片和标注数据构成，其中用于分割训练的标注数据，是通过直接将损伤标注框作为损伤对象的轮廓而自动生成的。利用这样的训练样本可以训练得到如图1所示的两分支的损伤检测模型，其中第一分支为检测分支，用于进行常规的损伤检测，另一分支为分割分支，用于进行图像弱分割。

在训练得到弱分割损伤检测模型后，就可以利用该模型进行损伤检测。如图1所示，可以将待测图片输入该损伤检测模型。在该模型中，首先对待测图片进行特征提取，之后，经由检测分支，输出针对待测图片的损伤预测框，经由分割分支，输出针对待测图片的损伤分割区域。通过对损伤预测框和损伤分割区域的融合分析，可以得到最终的损伤检测结果。

下面分别描述以上弱分割的损伤检测模型的训练过程，以及使用该模型进行损伤检测的预测过程。

图2示出根据一个实施例的训练弱分割的损伤检测模型的方法流程图。可以理解，该方法可以通过任何具有计算、处理能力的装置、设备、平台、设备集群来执行。如图2所示，训练过程至少包括以下步骤：步骤21，获取样本图片，所述样本图片对应具有指示出损伤标注框的边框标注数据；步骤22，将各个损伤标注框作为对应损伤对象的轮廓，基于所述轮廓为样本图片中各个像素点标注分割类别，从而生成分割标注数据；步骤23，将样本图片输入弱分割损伤检测模型，该模型包括边框预测分支和分割预测分支，所述边框预测分支输出指示损伤预测框的损伤预测数据，所述分割预测分支通过预测各个像素点的分割类别输出分割预测数据；步骤24，基于损伤预测数据与边框标注数据的比对，确定边框预测损失项，以及，基于分割预测数据和分割标注数据的比对，确定分割预测损失项；步骤25，根据所述边框预测损失项和所述分割预测损失项，确定本次预测的损失函数；步骤26，在损失函数减小的方向，更新所述损伤预测模型。下面描述以上各个步骤的具体执行方式。

首先，在步骤21，获取经过人工标注的样本图片。该样本图片一般是包含有损伤对象的图片，例如车损现场拍摄的受损车辆的照片。这样的样本图片经由标注人员标注，而具有对应的标注数据。对于损伤检测任务的标注来说，针对图片中的一处损伤，标注人员可以采用一个包围该处损伤的最小矩形框来框选出该损伤对象，这样的最小矩形框称为损伤标注框。因此，上述样本图片的人工标注数据又称为边框标注数据，可以指示出各个损伤标注框。

图3示出经过人工标注的样本图片的一个具体示例。在图3的示例中，样本图片为受损车辆的图片。经过人工标注，标注人员在该图片中用矩形框框选出若干损伤对象，即标注出若干损伤标注框。

在一个实施例中，标注人员可以仅对损伤对象所在位置进行标注，也就是用损伤标注框框选出损伤对象，而不区分损伤种类。

在另一实施例中，标注人员还可以针对每个损伤对象，从预先设定的N种损伤类别中标注出该损伤对象的类别。例如，对于车辆损伤而言，可以预先设定N＝10种损伤类别，例如包括，刮擦，变形，撕裂，(玻璃)碎裂等等。如此，对于每处车辆损伤，标注人员在标出损伤标注框的基础上，从以上10种损伤类别中选择该处损伤对应的类别进行标注。

在图3中，损伤标注框右上角的数字，示出该损伤标注框中损伤对象的损伤类别，例如12对应于刮擦，10对应于变形。可以理解，损伤类别的标注方式可以有多种，除了图3所示的用不同数字表示不同损伤类别，还可以例如用不同颜色的标注框表示不同损伤类别，等等，图3仅仅是一种示例。

在获取到样本图片和该图片对应的边框标注数据的基础上，在步骤22，基于边框标注数据自动生成分割标注数据。

如前所述，分割标注数据是为进行图像分割训练，而对目标对象的轮廓进行标注的数据。常规技术中，基于标注人员用若干标注点描画出的目标对象的轮廓，得到分割标注数据。典型的，分割标注数据为像素级的标注，即标注出图片中各个像素点是否属于特定目标对象。

为了降低标注成本，在步骤22中，直接将各个损伤标注框作为对应损伤对象的轮廓，基于该轮廓为样本图片中各个像素点标注分割类别，从而自动生成分割标注数据。

更具体的，在一个实施例中，将损伤标注框作为损伤对象的轮廓，根据各个像素点是否落入损伤标注框，确定该像素点是否属于损伤对象，进而为其标注分割类别。例如，将位于损伤标注框之内的像素点标注为第一分割类别，将位于损伤标注框之外的像素点标注为第二分割类别。如此，样本图片中的像素点被划分为2个类别，即属于损伤对象的前景部分(对应于第一分割类别)，和不属于损伤对象的背景部分(对应于第二分割类别)。

在一种实施方式下，如前所述，边框标注数据中还包括标注人员针对各个损伤标注框标注的损伤类别，例如图3中对应于刮擦的损伤类别12，对应于变形的损伤类别10。在这样的情况下，在一个实施例中，还基于像素点落入的损伤标注框的损伤类别，为像素点标注分割类别。具体的，对于任意的一个损伤标注框，为了描述的简单，将其称为第一损伤标注框，假定该第一损伤标注框被标注具有第一损伤类别。那么，在步骤22，对于落入该第一损伤标注框之内的像素点，可以将其分割类别标注为第一损伤类别对应的类别。

在这样的情况下，如果预先设定了N种损伤类别，那么在分割标注中可以将像素点划分为N+1个分割类别，其中前N个分割类别与前述N种损伤类别一一对应，另外的1个分割类别对应于不属于任何损伤标注框的情况。更具体的，对于车辆损伤而言，如果预先为损伤对象设定了10种损伤类别，那么在标注某个像素点的分割类别时，可以根据该像素点落入的损伤标注框对应的10种损伤类别之一，为其标注分割类别；如果该像素点不落入任何损伤标注框，则将其分割类别标注为第11种类别。

在一种实施方式中，允许损伤标注框之间存在重叠。在这样的情况下，对于落入多个损伤标注框的交叠区域的像素点，可以基于预先设定的、该多个损伤标注框对应的损伤类别的严重程度的排序，为其标注分割类别。

一般而言，在设定N种损伤类别的基础上，还可以预先设定各个损伤类别对应的损伤严重程度的排序。例如，在车辆损伤的情况下，可以设定损伤类别的严重程度从轻到重的排序包括，刮擦<变形<撕裂…，等等。在一个实施例，当某个像素点落入多个损伤标注框的交叠区域时，可以基于损伤类别的严重程度的排序，确定出该多个损伤标注框中损伤程度较重的损伤类别，将该损伤类别的对应类别作为该像素点的分割类别。

图4示出在一个实施例中为像素点标注分割类别的示意图。在图4中示出3个损伤标注框A，B和C，分别被标注有损伤类别a，b和c。对于损伤标注框A中包含的各个像素点(阴影区域的像素点)，可以将其分割类别标注为损伤类别a对应的类别。

损伤标注框B和C之间存在交叠区域。假定损伤类别b的严重程度大于损伤类别c，那么可以将交叠区域中的像素点标注为损伤类别b对应的类别。对于损伤标注框B和C中交叠区域之外的像素点，分别将其标注为损伤类别b和c对应的类别。如此，斜线区域的像素点被标注为类别b，方格区域的像素点被标注为类别c。

对于未落入任何损伤标注框的其他像素点，可以将其分割类别标注为类别0。

如此，通过以上各种方式，将损伤标注框作为对应损伤对象的轮廓，针对各个像素点标注分割类别，从而自动生成分割标注数据。

可以理解，损伤标注框是框选出损伤对象的最小矩形框，通常并不等于损伤对象的真实轮廓。将损伤标注框作为损伤对象轮廓进行分割标注，只是一种粗略的近似标注，因此也可以称为弱分割标注数据。这样的弱分割标注数据可以用于训练弱分割损伤检测模型。

回到图2，另一方面，在步骤23，将样本图片输入弱分割损伤检测模型，由该弱分割损伤检测模型来预测样本图片中的损伤对象。需要理解，此处的弱分割损伤检测模型可以是初始模型，也可以是训练过程中有待进一步更新的模型。具体而言，该弱分割损伤检测模型具有两个分支，边框预测分支和分割预测分支，其中边框预测分支输出针对所述样本图片预测的损伤预测框，分割预测分支对各个像素点的分割类别进行预测而产生分割预测数据。

弱分割损伤检测模型可以基于各种算法和模型结构实现。典型的，弱分割损伤检测模型可以基于卷积神经网络CNN实现。

图5示出根据一个实施例的弱分割损伤检测模型的结构示意图。在该示例中，弱分割损伤检测模型实现为卷积神经网络CNN。如图5所示，该神经网络包括基础卷积层510，边框预测分支520和分割预测分支530。

基础卷积层510用于对输入的样本图片进行卷积处理，得到卷积特征图(feature map)。一般的，基础卷积层510可以包括多个子层，在每个子层，采用对应的卷积核对图片进行卷积处理。在子层的卷积处理后，可选的，还可以进行池化(pooling)处理。通过多次卷积和池化，得到的特征图可以反映原始样本图片中更抽象和高阶的特征。一般的，取决于卷积核的大小和卷积处理的次数，卷积处理后的特征图比原始样本图片的维度要小。

边框预测分支520基于卷积特征图进行边框预测，输出边框预测数据。边框预测数据指示出所预测的损伤预测框。在训练数据中还包括针对各个损伤标注框的损伤类别标注时，边框预测分支还预测各个损伤预测框对应的损伤类别。边框预测分支可以采用各种已知的目标检测算法实现，在结构上，也可以采用各种已知的用于进行目标检测的神经网络结构，例如可以包括，进一步的卷积处理层，边框回归层，全连接处理层，等等。

分割预测分支530基于上述卷积特征图进行像素点的分割类别预测，从而得到分割预测数据。

具体地，分割预测分支530可以包括分割卷积层531，用于对卷积特征图进行进一步的卷积处理。该分割卷积层531中的卷积核可以是针对分割预测的特点而设计，不同于基础卷积层中的卷积核，从而使得进一步卷积处理后的特征更有利于后续的分割预测处理。不过应理解，该卷积层531为可选的网络处理层，在一些情况下也可以省去该网络处理层。

分割预测分支530还包括上采样层532，用于将经卷积处理的特征上采样为与所述样本图片大小相同的第一特征图。如前所述，经过卷积处理后的特征图比原始样本图片的维度要小，因此，在分割预测分支中，通过上采样层，还原出原图大小的特征图。具体的，上采样层532可以采用插值处理等上采样方式，将卷积处理后的维度较小的特征还原为与原始样本图片维度相同的第一特征图。因此，第一特征图中的各个像素点与原始样本图片中的各个像素点分别对应。

接着，分割处理层533预测所述第一特征图中各个像素点属于各个分割类别的概率。由于第一特征图中的像素点与原始样本图片中的像素点分别对应，因此，分割处理层533对第一特征图的像素点的分割类别进行预测，即对应于预测样本图片中各个像素点属于各个分割类别的概率。

具体的，在二分类的情况下，分割处理层533可以预测各个像素点属于损伤对象(对应于第一分割类别)的概率。在一个实施例中，可以将概率值大于预定阈值的像素点确定为属于损伤对象。

在多分类的情况下，例如前述的N+1个分割类别的情况下，分割处理层533可以预测各个像素点i分别属于N+1个分割类别中第j个分割类别的概率Pij。于是，对于每个像素点i，可以形成其分别属于各个分割类别的概率向量(Pi0,Pi1,Pi2,…,PiN)。或者，对于每个分割类别j，可以形成各个像素点属于该分割类别j的概率集合。由于图片中的像素点一般排列成矩阵形式，因此针对每个分割类别j的概率集合可以形成为与像素点对应的概率矩阵。

至少通过以上的上采样层532和分割处理层533，分割预测分支530可以输出针对各个像素点的分割类别进行预测的分割预测数据。在一个实施例中，分割预测数据即分割处理层533预测的、像素点属于各个分割类别的概率。在另一实施例中，分割预测分支还可以进一步基于上述概率，确定各个像素点的预测分割类别，作为分割预测数据。例如，对于每个像素点，将预测概率最高的分割类别作为其预测分割类别。

于是，通过图5所示的弱分割损伤检测模型，分别得到边框预测数据和分割预测数据。

需要说明的是，除了用于分割训练的分割标注数据是基于损伤标注框自动生成，因而不同于常规分割标注数据之外，弱分割损伤检测模型的模型结构也与常规的损伤检测模型不同。常规的损伤检测模型并不具有分割分支，因而并不进行图像分割；常规的图像分割模型也不具有边框预测分支，不进行边框预测。尽管也存在一些同时进行边框预测和图像分割的神经网络模型，例如Mask-RCNN，但是，这样的模型通常是在选定备选损伤框后，才划分为两个分支。一个分支对备选损伤框进行进一步的回归和类别预测，另一分支基于该备选损伤框进行图像分割，也就是说，图像分割是在备选损伤框之内进行的。换而言之，在诸如Mask-RCNN之类的模型中，图像分割是在边框预测基础上进行的，而非与其独立的分支。

而在图5所示的弱分割损伤检测模型中，在通过基础卷积层进行基本的卷积处理后，模型就分裂为两个独立的分支。边框预测分支和分割预测分支各自基于卷积处理后的特征图进行进一步处理和预测，预测过程互相独立。两个分支独立进行预测，使得各自输出的预测结果更有利于进行互相验证。

实践中，可以基于多种具体的CNN网络结构进行修改，得到上述弱分割损伤检测模型。例如，可以采用循环全卷积网络RFCN作为基础网络结构，在特征图之后，位置敏感(position-sensitive)卷积之前，添加分割预测分支。

如此，通过多种具体的神经网络结构，实现两分支的弱分割损伤检测模型，该模型通过边框预测分支产生与损伤预测框相关的边框预测数据，通过分割预测分支产生与各像素点的分割类别相关的分割预测数据。

为了对这样的模型进行训练，接下来，就需要将上述预测数据与对应的标注数据进行比对，以得到本次预测的损失函数值，作为模型中参数更新和调整的依据。

具体的，回到图2，在步骤24，基于边框预测数据与边框标注数据的比对，确定边框预测损失项。在一个实施例中，边框预测数据指示出预测的各个损伤预测框的位置。可以通过比对损伤预测框和损伤标注框的位置差异，确定边框预测损失项。在一个实施例中，边框预测数据还指示出各个损伤预测框对应的预测损伤类别。此时，在上述位置差异的基础上，还比对损伤预测框的预测损伤类别与对应的损伤标注框的标注损伤类别，基于类别比对，确定边框预测损失项。在数学形式上，边框预测损失项的确定可以采用各种常规算法进行，例如采用L2误差的形式作为边框预测损失项。

在步骤24，还基于分割预测数据和分割标注数据的比对，确定分割预测损失项。

根据一种实施方式，基于分割类别的比对，确定分割预测损失项。具体的，在一个实施例中，分割预测分支输出各个像素点属于各个分割类别的概率作为分割预测数据。此时，可以根据该概率确定出各个像素点的预测分割类别，例如将概率最大的分割类别作为其对应的预测分割类别。在另一实施例中，分割预测分支直接输出各个像素点的预测分割类别，此时，可以直接从分割预测数据中获取到该预测分割类别。然后，将各个像素点的预测分割类别与其标注分割类别进行比对，统计预测分割类别与标注分割类别一致的像素点，即预测正确的像素点的数目，或者该数目占像素点总数的比例。基于上述数目或者比例，确定分割预测损失项，使得数目或者比例越大，分割预测损失项越小。

根据另一实施方式，基于分割预测数据中各个像素点属于各个分割类别的概率，与各个像素点的标注分割类别，确定分割预测损失项。具体的，对于每个像素点i，可以从分割预测数据中获取该像素点i分别属于各个分割类别的概率向量(Pi0,Pi1,Pi2,…,PiN)。另一方面，获取像素点i的标注分割类别k。于是，可以将该像素点i对应的分割损失项确定为：

其中Pij表示像素点i属于分割类别j的概率，分割类别k为标注分割类别。然后对各个像素点i的分割损失项求和，可以得到本次预测的分割损失项。

在另一实施例中，可以采用softmax函数的形式，根据各个像素点属于各个分割类别的预测概率以及其标注分割类别，确定分割损失项L为：

根据又一实施方式，基于各个像素点对应于标注分割类别的预测概率，确定分割预测损失项。具体的，对于任意像素点i，从分割标注数据中获取该像素点的标注分割类别k。另一方面，从分割预测数据中获取该像素点i分别属于各个分割类别的概率向量(Pi0,Pi1,Pi2,…,PiN)，从中提取出与标注分割类别k对应的预测概率Pik。可以基于各个像素点的与标注分割类别对应的预测概率，确定出分割预测损失项。例如，在一个例子中，分割预测损失项可以表示为：

其中，Pi表示第i个像素点属于其标注分割类别的预测概率。

在其他实施例中，还可以采用其他函数形式，交叉熵等形式，基于各个像素点属于各个分割类别的概率，确定出分割预测损失项。

接着，在步骤25，根据步骤24确定的边框预测损失项和分割预测损失项，确定本次预测的损失函数。在一个实施例中，可以将边框预测损失项和分割预测损失项的加和，确定为本次预测的损失函数。在另一实施例中，还可以对边框预测损失项和分割预测损失项进行加权求和，得到本次预测的损失函数。

然后在步骤26，在损失函数减小的方向，更新上述弱分割损伤预测模型。换而言之，调整弱分割损伤检测模型的模型参数，使得损失函数不断减小。参数调整的过程可以采用反向传播，梯度下降等常规方式。

通过以上过程，不断更新模型参数，直到达到预定的收敛条件，或者模型测试结果达到一定的准确率条件。此时，完成模型的训练，得到训练的弱分割损伤检测模型。该模型基于自动生成的弱分割标注数据而训练，通过两个独立分支实现损伤边框的强预测，以及损伤轮廓的弱预测。

下面描述使用以上训练得到的弱分割损伤检测模型进行损伤预测的过程。

图6示出根据一个实施例从图片中识别损伤的方法的步骤流程图。如图6所示，该过程包括以下步骤。

在步骤61，获取通过图2的方法训练得到的弱分割损伤检测模型，该模型包括边框预测分支和分割预测分支。该弱分割损伤检测模型例如具有图5所示的结构。

在步骤62，将待测图片输入所述弱分割损伤检测模型。于是，模型中的边框预测分支输出用于指示损伤预测框的边框预测数据，分割预测分支输出针对待测图片中各个像素点的分割类别进行预测的分割预测数据。通过两个分支分别输出边框预测数据和分割预测数据的过程与前述训练过程中的步骤23相似，不再赘述。

接着，在步骤63，根据所述边框预测数据和所述分割预测数据，确定针对所述待测图片的损伤检测结果。

为此，在一个实施例中，首先尝试根据分割预测数据，确定损伤对象区域，即预测分割类别为同一损伤类别的像素点集合构成的面积大于一定阈值的连通区域。

具体的，在一个例子中，分割预测数据包括待测图片中各个像素点对应的预测分割类别。在另一个例子中，分割预测数据中包含的是，待测图片中各个像素点属于各个分割类别的概率。在这样的情况下，可以基于上述概率，确定出各个像素点的预测分割类别。

基于各个像素点的预测分割类别，可以得到损伤对象区域。具体的，可以首先得到预测分割类别为同一损伤类别的像素点集合，判断该集合是否构成连通区域以及该连通区域面积是否大于一定阈值。如果同一损伤类别的像素点集合可以构成面积大于一定阈值的连通区域，则将该连通区域作为一个损伤对象区域。

在一种情况下，边框预测数据指示出至少一个损伤预测框，但是从分割预测数据无法得到上述损伤对象区域；或者，从分割预测数据得到至少一个损伤对象区域，但是边框预测数据没有指示出损伤预测框。在一个实施例中，在以上两种情况下，在步骤63，确定待测图片中不包含损伤对象。

在另外的情况下，边框预测数据指示出至少一个损伤预测框，从分割预测数据得到至少一个损伤对象区域，在这样的情况下，在步骤63，根据上述至少一个损伤预测框和至少一个损伤对象区域，确定针对所述待测图片的损伤检测结果。

根据一种实施方式，将所述至少一个损伤预测框对应的区域集合，与所述至少一个损伤对象区域对应的区域集合的并集，作为损伤检测结果。如此得到的损伤检测结果会较为全面地包含可能的损伤，可以最大程度地避免漏检。

在一种实施方式中，根据损伤预测框和损伤对象区域之间的交叠情况，从损伤检测结果中排除掉异常损伤预测框。下面以任意一个损伤预测框，称为第一损伤预测框为例进行说明。

在一个实施例中，可以分别计算第一损伤预测框与各个损伤对象区域的交并比(IoU)，即交叠面积与并集面积的比值。如果计算得到的各个交并比均小于预设阈值，则说明，该第一损伤预测框与各个损伤对象区域重叠太少，换而言之，不存在损伤对象区域可以验证该第一损伤预测框，于是，将该第一损伤预测框从损伤检测结果中移除。

在另一实施例中，计算该第一损伤预测框与各个损伤对象区域的交叠面积与该第一损伤预测框本身的框面积的比例。如果计算得到的比例均小于预设阈值，则从损伤检测结果中移除该第一损伤预测框。

根据一种实施方式，不仅验证损伤预测框和损伤对象区域的重叠大小，还验证类别的异同。在这样的实施方式中，要求边框预测数据还包括针对各个损伤预测框的损伤类别的预测。假定边框预测数据中，第一损伤预测框对应于预测的第一损伤类别。另一方面，对于至少一个损伤对象区域中任意的第一损伤对象区域，假定其中各个像素点对应于第一分割类别。

根据一个实施例，首先判断第一损伤预测框和第一损伤对象区域的交并比IoU。如果交并比大于预设阈值，也就是两者重叠率足够高，那么判断第一损伤类别与第一分割类别是否对应。如果对应，则第一损伤预测框和第一损伤对象区域彼此互相验证；如果不对应，例如第一损伤类别指示出刮擦，而第一分割类别指示出玻璃碎裂，则说明二者之中至少一个存在异常，于是可以将第一损伤检测框确定为异常检测框，或者将第一损伤对象区域确定为异常区域，留待进一步检测确认。如此，更进一步的从损伤检测结果中排除误检的异常结果。

图7是在一个例子中，弱分割损伤检测模型输出的损伤预测框和损伤对象区域。在图7的例子中，待测图片为车辆损伤图片。在待测图片中预测得到多个损伤预测框，每个损伤预测框左上角标出的两个数字分别示出预测损伤类别和预测的置信度。损伤对象区域根据各个像素点的预测分割类别而生成，用蒙层mask示出。实践中，对于多损伤类别的情况，可以用不同颜色的蒙层示出对应于不同分割类别的损伤对象区域。对于图7所示的损伤预测框和损伤对象区域，可以采用上述各种方式，对损伤预测框和损伤对象区域进行综合分析，得到损伤检测结果。

回顾以上过程，通过人工标注的边框强标注数据和自动生成的分割弱标注数据，训练得到两分支的弱分割损伤检测模型，其中边框预测分支和分割预测分支彼此独立地分别进行边框预测和分割预测。由于分割标注数据为弱标注，精度并不高，相应的，分割预测分支的预测结果通常并不精准，难以作为独立的损伤对象轮廓结果。但是，弱分割的预测结果可以与边框预测结果结合使用，用来与损伤预测框互相验证，从中发现漏检、误检的情况，从而优化、完善损伤检测结果，提高检测的准确性。

根据另一方面的实施例，提供了一种训练弱分割损伤检测模型的装置，该装置可以部署在任何具有计算、处理能力的设备、平台或设备集群中。图8示出根据一个实施例的训练弱分割损伤检测模型的装置的示意性框图。如图8所示，该训练装置800包括：

样本获取单元81，配置为获取样本图片，所述样本图片对应具有边框标注数据，所述边框标注数据指示出至少一个损伤标注框，每个损伤标注框是标注人员标注的、框选出所述样本图片中损伤对象的最小矩形框；

标注生成单元82，配置为将各个损伤标注框作为对应损伤对象的轮廓，基于所述轮廓为所述样本图片中各个像素点标注分割类别，从而生成分割标注数据；

模型输入单元83，配置为将所述样本图片输入弱分割损伤检测模型，所述弱分割损伤检测模型包括边框预测分支和分割预测分支，所述边框预测分支输出用于指示损伤预测框的边框预测数据，所述分割预测分支输出针对所述样本图片中各个像素点的分割类别进行预测的分割预测数据；

第一确定单元84，配置为基于所述边框预测数据与所述边框标注数据的比对，确定边框预测损失项，以及，基于所述分割预测数据和分割标注数据的比对，确定分割预测损失项；

第二确定单元85，配置为根据所述边框预测损失项和所述分割预测损失项，确定本次预测的损失函数；

模型更新单元86，配置为在所述损失函数减小的方向，更新所述弱分割损伤检测模型。

在一个实施例中，所述标注生成单元82配置为：

将位于损伤标注框之内的像素点标注为第一分割类别，将位于损伤标注框之外的像素点标注为第二分割类别。

根据一个实施例，所述至少一个损伤标注框包括第一损伤标注框；所述边框标注数据还包括，标注人员从预定的N个损伤类别中，针对该第一损伤标注框选择标注的第一损伤类别。此时，所述标注生成单元82可以配置为：对于位于所述第一损伤标注框之内的像素点，将其分割类别标注为所述第一损伤类别对应的类别。

根据一个实施例，所述至少一个损伤标注框包括第一损伤标注框和第二损伤标注框，所述第一损伤标注框和第二损伤标注框存在交叠区域；所述边框标注数据还包括，标注人员从预定的N个损伤类别中，针对该第一损伤标注框选择标注的第一损伤类别和针对第二损伤标注框选择标注的第二损伤类别，其中第二损伤类别的损伤严重程度大于所述第一损伤类别。在这样的情况下，所述标注生成单元82可以配置为：对于位于所述交叠区域之内的像素点，将其分割类别标注为所述第二损伤类别对应的类别。

根据一种实施方式，弱分割损伤检测模型可以基于卷积神经网络CNN实现，所述卷积神经网络CNN包括基础卷积层，用于对所述样本图片进行卷积处理，得到对应的卷积特征图；相应的，所述边框预测分支可以基于所述卷积特征图预测得到所述边框预测数据；所述分割预测分支可以基于所述卷积特征图预测得到所述分割预测数据。

进一步的，在一个实施例中，所述分割预测分支可以包括：

上采样层，用于将经卷积处理的特征上采样为与所述样本图片大小相同的第一特征图；

预测处理层，用于基于所述第一特征图预测各个像素点属于各个分割类别的概率。

根据一种实施方式，所述分割预测数据包括，各个像素点属于各个分割类别的概率；所述第一确定单元84配置为：

根据各个像素点属于各个分割类别的概率确定各个像素点的预测分割类别；

将各个像素点的预测分割类别与其标注分割类别进行比对，根据比对结果确定所述分割预测损失项。

根据另一种实施方式，所述第一确定单元84配置为：

确定各个像素点属于其对应的标注分割类别的预测概率；

根据所述预测概率，确定所述分割预测损失项。

根据又一方面的实施例，提供了一种从图片中检测损伤的装置，该装置可以部署在任何具有计算、处理能力的设备、平台或设备集群中。图9示出根据一个实施例的损伤检测装置的示意性框图。如图9所示，该检测装置900包括：

模型获取单元91，配置为获取通过图8的装置训练得到的弱分割损伤检测模型；

模型输入单元92，配置为将待测图片输入所述弱分割损伤检测模型，所述弱分割损伤检测模型包括边框预测分支和分割预测分支，所述边框预测分支输出用于指示至少一个损伤预测框的边框预测数据，所述分割预测分支输出针对所述待测图片中各个像素点的分割类别进行预测的分割预测数据；

结果确定单元93，配置为根据所述边框预测数据和所述分割预测数据，确定针对所述待测图片的损伤检测结果。

在一个实施例中，所述结果确定单元93配置为：

当所述边框预测数据未指示出损伤预测框，或者所述分割预测数据未指示出损伤对象区域时，将所述损伤检测结果确定为待测图片不包含损伤对象，其中所述损伤对象区域为预测分割类别为同一损伤类别的像素点集合构成的面积大于一定阈值的连通区域。

在一个实施例中，边框预测数据指示出至少一个损伤预测框，分割预测数据指示出至少一个损伤对象区域；此时所述结果确定单元93配置为，根据所述至少一个损伤预测框和所述至少一个损伤对象区域，确定针对所述待测图片的损伤检测结果。

具体地，在一个实施例中，所述结果确定单元93可以配置为：

将所述至少一个损伤预测框对应的区域集合，与所述至少一个损伤对象区域对应的区域集合的并集，作为损伤检测结果。

根据一个实施例，所述至少一个损伤预测框包括第一损伤预测框；所述结果确定单元94配置为：如果所述第一损伤预测框与各个损伤对象区域的交并比均小于预设阈值，则从所述损伤检测结果中移除该第一损伤预测框。

根据另一实施例，所述结果确定单元94还可以配置为：如果所述第一损伤预测框与各个损伤对象区域的交叠面积与所述第一损伤预测框的框面积的比例均小于预设阈值，则从所述损伤检测结果中移除该第一损伤预测框。

根据一种实施方式，所述至少一个损伤预测框包括第一损伤预测框，所述边框预测数据还包括针对该第一损伤预测框预测的第一损伤类别；所述至少一个损伤对象区域包括第一损伤对象区域，所述第一损伤对象区域中的像素点对应于第一分割类别；在这样的情况下，所述结果确定单元94可以配置为：

通过以上图8和图9的装置，基于弱标注数据训练弱分割损伤检测模型，并使用该模型从图片中识别出损伤对象。

根据另一方面的实施例，还提供一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令计算机执行结合图2和图6所描述的方法。

根据再一方面的实施例，还提供一种计算设备，包括存储器和处理器，所述存储器中存储有可执行代码，所述处理器执行所述可执行代码时，实现结合图2和图6所述的方法。

本领域技术人员应该可以意识到，在上述一个或多个示例中，本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时，可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。

以上所述的具体实施方式，对本发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施方式而已，并不用于限定本发明的保护范围，凡在本发明的技术方案的基础之上，所做的任何修改、等同替换、改进等，均应包括在本发明的保护范围之内。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张伟;褚崴
技术所有人：阿里巴巴集团控股有限公司
我是此专利的发明人

上一篇：吸油烟机及具有吸油烟机的装置的制作方法
上一篇：吸油烟机及具有吸油烟机的装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。