一种金属三维点阵结构的缺陷检测方法及系统与流程

文档序号：21369137发布日期：2020-07-04 04:45阅读：345来源：国知局

本发明涉及缺陷检测领域，特别是涉及一种金属三维点阵结构的缺陷检测方法及系统。

背景技术：

金属三维点阵材料不仅有着高孔隙率的特点，还具有轻质高强、抗爆炸抗冲击、高效散热隔热、吸收电磁波及声音等优异的性能。经常通过增材制造的方式将这种材料应用于航空航天和工业装备制造领域。增材制造时将材料加热至熔融状态再进行逐层堆积冷却成型，然而材料由熔融状态快速凝固会产生大量的残余应力，因此会造成结构翘曲、裂纹、断层等缺陷。这些缺陷影响了构件的安全性和可靠性，缺陷识别是构件质量评价工作中重要的一个环节。然而针对金属三维点阵结构的内部缺陷识别问题，目前没有一种高效的自动识别缺陷的方法。

缺陷特征提取是缺陷识别中的重要一环，sift是一种传统的特征提取方法。它用来侦测与描述影像中的局部性特征，它在空间尺度中寻找极值点，并提取出其位置、尺度、旋转不变量，此算法由davidlowe在1999年发表，2004年完善总结，可应用于物体识别。局部影像特征的描述与侦测可以帮助辨识物体，sift特征是基于物体上的一些局部外观的兴趣点而与影像的大小和旋转无关。对于光线、噪声、些微视角改变的容忍度也相当高。基于这些特性，它们是高度显著而且相对容易撷取，在母数庞大的特征数据库中，很容易辨识物体而且鲜有误认。使用sift特征描述对于部分物体遮蔽的侦测率也相当高，甚至只需要3个以上的sift物体特征就足以计算出位置与方位。在现今的电脑硬件速度下和小型的特征数据库条件下，辨识速度可接近即时运算。sift特征的信息量大，适合在海量数据库中快速准匹配。

但是传统的算法对规则缺陷以及场景比较简单的场合，能够很好工作，但是对特征不明显的、缺陷与背景相似的金属三维点阵结构，则不再适用。

技术实现要素：

本发明的目的是提供一种金属三维点阵结构的缺陷检测方法及系统，以适用于金属三维点阵结构，进而提高缺陷检测的准确度。

为实现上述目的，本发明提供了如下方案：

一种金属三维点阵结构的缺陷检测方法，包括：

获取金属三维点阵结构的断层图像；

采用darknet-53网络模型中的特征提取网络对所述断层图像进行特征提取，得到所述断层图像对应的多尺度的预测信息；所述预测信息包括预测框的位置信息、所述预测框是否存在的概率和所述预测框属于每个缺陷类别的概率；所述预测框用于预测所述断层图像中缺陷的位置；

根据所述预测信息确定每个预测框对应的缺陷类别；

根据所述darknet-53网络模型中的聚类中心，利用所述darknet-53网络模型的yolo层对每个预测框的位置信息进行修正，得到每个预测框的实际位置；

根据所有预测框的实际位置，采用nms算法确定最终预测框；

根据所述最终预测框确定所述金属三维点阵结构中缺陷的位置和缺陷类别；所述缺陷的位置为所述最终预测框框选的位置，所述缺陷的缺陷类别为所述最终预测框对应的缺陷类别。

可选的，所述获取金属三维点阵结构的断层图像，具体包括：

获取所述金属三维点阵结构的ct扫描三维图像；

对所述ct扫描三维图像进行断层处理，得到所述金属三维点阵结构的断层图像。

可选的，所述采用darknet-53网络模型中的特征提取网络对所述断层图像进行特征提取，得到每个断层图像对应的多尺度的预测信息，之前还包括：

获取样件的ct扫描三维图像；

对所述样件的ct扫描三维图像进行断层处理，得到所述样件的初始断层图像；

对所述样件的初始断层图像进行数据增强处理，得到所述样件的断层图像集；

对所述样件的断层图像集中每个断层图像进行标注，得到每个断层图像对应的标注信息；所述标注信息包括缺陷的位置信息和缺陷类别；所述缺陷的位置信息包括缺陷所在矩形框的中心坐标、所述矩形框的宽度和所述矩形框的高度；

采用k均值聚类算法对所有标注信息进行聚类，得到多个聚类中心；所述聚类中心的个数与所述特征图的尺度个数相等；

根据所述聚类中心，利用所述样件的断层图像集对所述darknet-53网络模型进行训练。

可选的，所述采用darknet-53网络模型中的特征提取网络对所述断层图像进行特征提取，得到所述断层图像对应的多尺度的预测信息，具体包括：

采用darknet-53网络模型中的特征提取网络对所述断层图像进行特征提取，得到3个尺寸的特征图，每个尺寸包括3个尺度，3个尺寸的特征图的维度分别为：(b,13,13,3n)、(b,26,26,3n)和(b,52,52,3n)，其中，b为批次大小，n＝m+5，m为缺陷类别数量。

可选的，所述根据所述darknet-53网络模型中的聚类中心，利用所述darknet-53网络模型的yolo层对每个预测框的位置信息进行修正，得到每个预测框的实际位置，具体包括：

根据公式利用所述darknet-53网络模型的yolo层对每个预测框的位置信息进行修正，得到每个预测框的实际位置；其中，σ(·)为sigmoid函数，(tx,ty,tw,th)为预测框的位置信息，(tx,ty)为预测框的中心位置所在单元格相对于所在格子左上角的偏移量，tw为预测的预测框宽度，th为预测的预测框高度，(cx,cy)为预测框的中心位置所在格子的坐标，(bx,by,bw,bh)为预测框的实际位置，(bx,by)为预测框的中心位置的实际坐标，bw为预测框的实际宽度，bh为预测框的实际高度，pw为所述特征图对应的聚类中心缩放后的宽度，ph为所述特征图对应的聚类中心缩放后的高度。

可选的，所述根据所述预测信息确定每个预测框对应的缺陷类别，具体包括：

将所述预测信息中所述预测框属于每个缺陷类别的概率进行比较，将概率最大值对应的缺陷类别确定为所述预测框对应的缺陷类别。

本发明还提供一种金属三维点阵结构的缺陷检测系统，包括：

断层图像获取模块，用于获取金属三维点阵结构的断层图像；

特征提取模块，用于采用darknet-53网络模型中的特征提取网络对所述断层图像进行特征提取，得到断层图像对应的多尺度的预测信息；所述预测信息包括预测框的位置信息、所述预测框是否存在的概率和所述预测框属于每个缺陷类别的概率；所述预测框用于标注所述金属三维点阵结构中缺陷的位置；

缺陷类别确定模块，用于根据所述预测信息确定每个预测框对应的缺陷类别；

修正模块，用于根据所述darknet-53网络模型中的聚类中心，利用所述darknet-53网络模型的yolo层对每个预测框的位置信息进行修正，得到每个预测框的实际位置；

最终预测框确定模块，用于将所有预测框采用nms算法消除多余的预测框，确定最终预测框；

缺陷确定模块，用于根据所述最终预测框确定所述金属三维点阵结构中缺陷的位置和缺陷类别；所述缺陷的位置为所述最终预测框框选的位置，所述缺陷的缺陷类别为所述最终预测框对应的缺陷类别。

可选的，所述断层图像获取模块具体包括：

ct扫描三维图像获取单元，用于获取所述金属三维点阵结构的ct扫描三维图像；

断层处理单元，用于对所述ct扫描三维图像进行断层处理，得到所述金属三维点阵结构的断层图像。

可选的，所述特征提取模块具体包括：

特征提取单元，用于采用darknet-53网络模型中的特征提取网络对所述断层图像进行特征提取，得到3个尺寸的特征图，每个尺寸包括3个尺度，3个尺寸的特征图的维度分别为：(b,13,13,3n)、(b,26,26,3n)和(b,52,52,3n)，其中，b为批次大小，n＝m+5，m为缺陷类别数量。

可选的，所述修正模块具体包括：

修正单元，用于根据公式利用所述darknet-53网络模型的yolo层对每个预测框的位置信息进行修正，得到预测框的实际位置；其中，σ(·)为sigmoid函数，(tx,ty,tw,th)为预测框的位置信息，(tx,ty)为预测框的中心位置所在单元格相对于所在格子左上角的偏移量，tw为预测的预测框宽度，th为预测的预测框高度，(cx,cy)为预测框的中心位置所在格子的坐标，(bx,by,bw,bh)为预测框的实际位置，(bx,by)为预测框的中心位置的实际坐标，bw为预测框的实际宽度，bh为预测框的实际高度，pw为所述特征图对应的聚类中心缩放后的宽度，ph为所述特征图对应的聚类中心缩放后的高度。

根据本发明提供的具体实施例，本发明公开了以下技术效果：

对于金属三维点阵结构内部缺陷的检测，若要求从大量的缺陷断层图像中判定构件是否有缺陷并统计缺陷的个数，人工筛选则需耗费大量时间而且极易漏检、误判且效率极低。传统的特征提取方法鲁棒性较差，泛化能力差，并不能完全覆盖缺陷的所有特征。本发明基于darknet-53网络的的特征提取方法鲁棒性更佳，进而提高缺陷检测的准确度；而且能够对金属三维点阵结构的内部损伤进行实时识别，并对损伤进行定位。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本发明金属三维点阵结构的缺陷检测方法的流程示意图；

图2为本发明中darknet-53网络模型的结构示意图；

图3为对预测框的位置信息进行修正的示意图；

图4为无缺陷的断层图像与有缺陷的断层图像对比图；

图5为具体示例中缺陷检测对比图；

图6为本发明金属三维点阵结构的缺陷检测系统的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本发明作进一步详细的说明。

图1为本发明金属三维点阵结构的缺陷检测方法的流程示意图。如图1所示，本发明金属三维点阵结构的缺陷检测方法包括以下步骤：

步骤100：获取金属三维点阵结构的断层图像。具体的，首先获取所述金属三维点阵结构的ct扫描三维图像，然后对所述ct扫描三维图像进行断层处理，得到所述金属三维点阵结构的断层图像，并对断层图像做数据增强处理得到缺陷数据集，最终对数据集进行标注。

步骤200：采用darknet-53网络模型中的特征提取网络对断层图像进行特征提取，得到断层图像对应的多尺度的预测信息。预测信息包括预测框的位置信息、预测框是否存在的概率和预测框属于每个缺陷类别的概率，所述预测框用于在特征图上标注所述金属三维点阵结构中的缺陷。

本发明采用darknet-53网络模型对断层图像进行特征提取与缺陷识别。图2为本发明中darknet-53网络模型的结构示意图，如图2所示，整个darknet-53网络模型共107层，包括78个卷积层、2个上采样层、4个路由层、23个shortcut层(作用是将两个层的数据相加)和3个yolo层。其中，78个卷积层、2个上采样层、4个路由层和23个shortcut层构成darknet-53网络模型的特征提取网络。卷积核是卷积神经网络的最基本的组件，与全连接相比，它实现了参数共享，极大减少了参数量。信息在darknet-53网络向前传播过程中，信息的尺寸变化是通过卷积核的步长来实现的。上采样层是将一个特征图的尺寸翻倍，例如在darknet-53网络模型中，利用上采样层将13*13大小的特征图变换为26*26大小的特征图。路由层的作用是将两个网络层的输出拼接在一起，或者是直接将网络中某层的输出直接搬到该层，拼接的是特征图通道而并非特征图大小。例如当路由层只有一个参数layer＝-4时，表示将该层的前面第4层的输出直接搬到该层。例如当路由层有两个参数layer＝-1,61时，表示将该层的前面第1层的输出和第61层的输出拼接在一起。shortcut层要做的事情是将该层前面1层和该层前面3层的输出相加，这里的相加并非路由层的数据拼接，而是将数值相加。因此这两层的数据维度一定是一样的。shortcut层使得网络层数加深，可以得到更深层的特征，同时又保证了能够收敛，避免梯度爆炸问题。

采用darknet-53网络模型中的特征提取网络对断层图像进行特征提取，会得到断层图像对应的多尺度的预测信息。本发明中采用3个yolo层，因此会得到3个尺寸共9个尺度(每个尺寸包括3个尺度)的预测信息。3个尺寸的特征图的维度分别为：(b,13,13,3n)、(b,26,26,3n)和(b,52,52,3n)，其中，b为批次大小，n＝m+5，m为缺陷类别数量。

例如，输入的断层图像尺寸是416*416，图像信息经过darknet-53网络后会被下采样五次，得到13*13*1024的张量。再经过一些卷积处理，最终得到13*13*3n的特征图，即图2中预测1，此为第一个尺寸的特征图。将13*13的信息做上采样处理并和darknet-53网络中26*26的信息拼接，再经过一些卷积处理，最终得到26*26*3n的特征图，即图2中的预测2，此为第二个尺寸的特征图。将26*26的信息做上采样处理并和darknet-53网络中52*52的信息拼接，再经过一些卷积处理，最终得到了52*52*3n的特征图，即图2中的预测3，此为第三个尺寸的特征图。这种拼接操作使得相邻两个尺寸的特征图中的信息相互融合，26*26大小的特征图中含有13*13特征图的信息，而52*52大小的特征图中又含有26*26特征图的信息。小的特征图适合预测图像中尺寸较大的目标，而大的特征图适合预测图像中尺寸较小的目标。这种多尺度的预测增加了对小目标预测的准确率。金属三维点阵结构的缺陷在整个构件中占的尺寸比例很小，因此使用darknet-53网络可以准确对金属三维点阵结构的缺陷进行特征提取。

步骤300：根据预测信息确定每个预测框对应的缺陷类别。将所述预测信息中预测框属于每个缺陷类别的概率进行比较，将概率最大值对应的缺陷类别确定为预测框对应的缺陷类别。

步骤400：根据darknet-53网络模型中的聚类中心，利用darknet-53网络模型的yolo层对预测框的位置信息进行修正，得到每个预测框的实际位置。步骤200得到断层图像对应的多尺度的特征图之后，将特征图输入yolo层进行缺陷预测。

具体的，根据公式利用darknet-53网络模型的yolo层对每个预测框的位置信息进行修正，得到每个预测框的实际位置。其中，σ(·)为sigmoid函数，(tx,ty,tw,th)为预测框的位置信息，(tx,ty)为预测框的中心位置所在单元格相对于所在格子左上角的偏移量，tw为预测的预测框宽度，th为预测的预测框高度，(cx,cy)为预测框的中心位置所在格子的坐标，(bx,by,bw,bh)为预测框的实际位置，(bx,by)为预测框的中心位置的实际坐标，bw为预测框的实际宽度，bh为预测框的实际高度，pw为所述特征图对应的聚类中心缩放后的宽度，ph为所述特征图对应的聚类中心缩放后的高度。图3为对每个预测框的位置信息进行修正的示意图，如图3所示，修正后得到预测框的实际位置(bx,by,bw,bh)。

步骤500：根据所有预测框的实际位置，采用nms算法确定最终预测框。nms算法为非极大值抑制算法，采用nms算法可以消除多余的预测框，确定最佳的预测框。

步骤600：根据最终预测框确定金属三维点阵结构中缺陷的位置和缺陷类别。缺陷的位置为最终预测框框选的位置，缺陷的缺陷类别为最终预测框对应的缺陷类别。

本发明在对金属三维点阵结构的缺陷进行检测前，需要对构建的darknet-53网络模型进行训练，具体训练过程如下：

(1)数据集采集

首先用工业ct扫描设备对样件进行扫描，得到样件的ct扫描三维图像，然后对样件的ct扫描三维图像进行断层处理，得到初始断层图像。无缺陷的断层图像和有缺陷的断层图像分别如图4所示，图4为无缺陷的断层图像与有缺陷的断层图像对比图，图4中(a)部分图像中没有突变的结构体，因此认定在这部分图像中没有缺陷。图4中(b)部分图像中含正常排列的结构和突变的结构(白色矩形框里的部分)，因此认定该部分图像存在三个缺陷的。

由于初始断层图像数据量较小，数据量太小容易产生过拟合问题，因此对初始断层图像做数据增强处理，包括图像翻转，调整图像的亮度、对比度、饱和度和色相，最终得到样件的断层图像集。例如，初始断层图像数量为100多张，数据增强后可以得到2408张断层图片，即断层图像集中包括2408张断层图片。

然后采用标签工具labelimg对断层图像中的缺陷进行标注，得到每个断层图像的标注信息，标注信息包括缺陷的位置信息和类别信息。位置信息是指缺陷所在的矩形框的中心坐标(x，y)以及矩形框的宽度w和高度h，类别信息是指缺陷类别，包括凸起缺陷。

将断层图像按照6:2:2的比例划分数据集，1445张图片作为训练集，481张图片作为验证集，482张图片作为测试集。

(2)确定聚类中心

完成信息标注之后，采用k均值聚类算法对缺陷大小进行聚类分析，得到多个聚类中心，聚类中心的个数与后续特征图的尺度个数相等。聚类中心是一组宽高固定的初始候选框，意义在于更好的去描述目标尺寸的大小。个数根据特征图的尺度而定，其设定的好坏将影响目标检测的精度。本发明k均值聚类算法中定义的距离公式为distance＝1-iou，iou代表候选框与缺陷尺寸的相似程度，计算公式为两矩形交集的面积除以并集的面积，意味着两个矩形越相似，距离越小。确定聚类中心的过程如下：

step1：从2408张标注信息中读取所有的缺陷的所在矩形框的宽和高，得到7038组数据，例如[38,42]、[24,36]等等。由于一张断层图片中可能不只有1个缺陷，有可能是2个、3个等。2408张图片中共有7038个缺陷则得到7038组数据，每组数据代表其缺陷所在矩形框的宽高。

step2：确定聚类中心的个数。例如，聚类中心个数为9，从7038组数据中随机选取9组数据作为初始聚类中心。

step3：对数据集中每一个点，计算其与每个聚类中心的距离，离哪个聚类中心近，就划分到那个聚类中心所属的集合。此处的距离并不是常用的欧式距离，而是将距离定义为distance＝1-iou，iou是指两个矩形框的交集面积与并集面积的比值，其值越大代表两个矩形框越相似。因此两个矩形框越相似，则可以理解为两个矩形框的距离越近。

step4：对聚类中心进行更新。具体的，计算各个簇中的样本点均值，将其均值作为新的簇中心即聚类中心。

step5：如果新的聚类中心和上一次的聚类中心之间的距离小于某一个设置的阈值，表示聚类中心的位置变化不大，趋于稳定，表示聚类已经达到期望的结果，算法终止。

例如，实际训练中得到的9聚类中心的尺寸分别为：[16,16]，[19,19]，[36,34]，[38,40]，[41,36]，[47,45]，[42,75]，[57,53]，[74,43]，平均iou为0.8759，每个聚类中心中第一个数字为目标框的宽度，第二个数字为目标框的高度。

(3)对darknet-53网络模型进行训练

将step1中的数据集输入darknet-53网络模型，首先进行特征提取。例如，图像集经过特征提取网络后，总共得到3个尺寸的特征图及预测信息，维度分别为(b,13,13,18)，(b,26,26,18)和(b,52,52,18)，每个尺寸包括3个尺度。例如，第一个尺寸的预测信息包含507(3*13*13)个预测信息，每个预测信息包括预测框位置信息(tx,ty,tw,th)、对应的该预测框是否存的概率以及预测框是哪种类别的概率。同样，第二个尺寸的预测信息包含2028(26*26*3)个预测框的信息，第三个尺寸的预测信息包含8112(52*52*3)个预测信息。

将3个尺寸的特征图及预测信息传入yolo层，yolo层有两个主要功能，一是修正边界框预测，二是计算预测值与真实值的损失。

边界框预测过程：每一个边界框预测信息包括(tx,ty,tw,th)，(tx,ty)并不是预测框的实际位置，而是目标中心所在的单元格相对于所在格子左上角的偏移量。(tw,th)也并不是预测框的实际宽高，而是某种意义上的缩放。因此要对这些信息按如下公式做修正，修正为预测框在特征图中实际的大小。

bx＝σ(tx)+cx

by＝σ(ty)+cy

其中，(tx,ty,tw,th)为预测框的位置信息，(tx,ty)为预测框的中心位置所在单元格相对于所在格子左上角的偏移量，tw为预测的预测框宽度，th为预测的预测框高度，(cx,cy)为预测框的中心位置所在格子的坐标，(bx,by,bw,bh)为预测框的实际位置，(bx,by)为预测框的中心位置的实际坐标，bw为预测框的实际宽度，bh为预测框的实际高度，pw为所述特征图对应的聚类中心缩放后的宽度，ph为所述特征图对应的聚类中心缩放后的高度。

计算预测值与真实值的损失：yolov3的损失函数由3部分组成。本发明在目标检测的任务里，有几个关键信息需要确定，包括中心坐标预测框框的宽高，该位置是否存在物体的概率，以及是属于某种缺陷类别的概率。根据关键信息的有三类，因此损失函数也由三部分组成。

①目标定位损失

目标定位损失采用的是平方和损失。预测框信息包括中心位置偏差值，和预测框宽高的比例信息：

首先要将预测信息的中心位置偏差值进行sigmoid处理，保证偏差值在0-1范围内，可由下公式(1)表示。而对预测框的宽高比例信息不用做任何处理，可由下公式(2)表示。到此预测信息的4个值都已准备完毕，接下来要准备真实的信息，以便求得和预测信息的差值。中心位置的真实偏差值由中心位置减去其正数部分就可以得到，可由下公式(3)表示。由于预测信息是预测框的宽高比例信息，而不是真实的宽高。因此，要将真实的宽高进行第4部分的反变换处理，可由下公式(4)表示。

式中，为预测信息中的预测框中心的坐标，分别为预测信息中的预测框的宽和高，是指标注信息中目标中心的实际位置，分别为标注信息中目标的实际宽和高。

②目标置信度损失

目标置信度可以理解为预测目标矩形框内存在目标的概率。其中，ci表示预测目标边界框i中是否真实存在目标，0表示不存在，1表示存在，ci∈{0,1}。oi表示预测目标矩形框i内是否存在目标的概率。首先要将预测的置信度进行sigmoid处理，保证置信度在0-1范围内。目标置信度损失采用了二值交叉熵损失函数，包括两部分，一部分来自有物体的置信度损失，另一部分来自没有物体的置信度损失。

lconf_no_obj＝-∑(tconfln(1-pre_confno_obj)+(1-tconf)ln(pre_confno_obj))

lconf_obj,lconf_no_obj分别代表存在目标的概率的损失和不存在目标的概率的损失。

pre_confobj,pre_confno_obj分别代表预测信息中存在目标的概率，和不存在目标的概率。

tconf是指真实的掩码信息。

其中存在目标的权重设置为1，weightobj＝1。不存在目标的权重设为100，weightno_obj＝100。

③缺陷类别损失

lclass也是采用二值交叉熵损失函数。假如要识别的目标有n类，那么每个预测框信息中会有n个元素用来表示属于某种类别的概率。首先对其进行sigmoid处理，保证概率在0-1内，例如[0.3,0.1,..0.9,0.2]。然而真实的类别信息一定是类似[0,0,..1,0]的一个向量。由预测类别概率和真实类别概率就可以求得类别的损失。可由下公式表示：

lclass＝-∑(tclsobjln(1-pre_clsobj)+(1-tclsobj)ln(pre_clsobj))

pre_clsobj代表预测的类别概率。

tclsobj代表真实的类别的概率。

将三部分损失加和得到整体的损失，采用批量梯度下降法将darknet-53网络模型的权重按照此损失函数进行优化。

下面给出一个具体的训练过程示例。本示例中darknet-53网络共有74层，训练分为两步进行，首先对前71层冻结，进行第一轮的训练，批次大小(batchsize)为32，经过46步完成对1445张训练图片的一次迭代，共迭代50次，损失值在前10次迭代过程中急速下降，后40次迭代过程中缓速下降，训练损失由2291下降到76左右。在验证集上损失值产生梯度爆炸的现象。

第二轮训练中首先解冻所有的网络层，共迭代了34次，从50次到60次损失值急速下降，后面过程缓速下降，训练损失由59下降到23。验证集的损失变化趋势跟训练集的损失变化几乎同步。

采用上述示例训练完成后，对482张测试图像的检测耗时约41秒，fps达到约11，缺陷目标的召回率达到约0.974，精度达到约0.965，ap达到约0.958。图5为具体示例中缺陷检测对比图，其中左侧为两张测试图像，右侧为相应的测试结果，两张测试图像中有3个缺陷目标，测试结果中将三个缺陷目标都正确标记了出来。

图6为本发明金属三维点阵结构的缺陷检测系统的结构示意图。如图6所示，本发明金属三维点阵结构的缺陷检测系统包括以下结构：

断层图像获取模块601，用于获取金属三维点阵结构的断层图像。

特征提取模块602，用于采用darknet-53网络模型中的特征提取网络对所述断层图像进行特征提取，得到断层图像对应的多尺度的预测信息；所述预测信息包括预测框的位置信息、所述预测框是否存在的概率和所述预测框属于每个缺陷类别的概率；所述预测框用于在特征图上标注所述金属三维点阵结构中缺陷的位置。

缺陷类别确定模块603，用于根据所述预测信息确定每个预测框对应的缺陷类别。

修正模块604，用于根据所述darknet-53网络模型中的聚类中心，利用所述darknet-53网络模型的yolo层对预测框的位置信息进行修正，得到预测框的实际位置。

最终预测框确定模块605，用于根据所有预测框的实际位置，采用nms算法确定最终预测框。

缺陷确定模块606，用于根据所述最终预测框确定所述金属三维点阵结构中缺陷的位置和缺陷类别；所述缺陷的位置为所述最终预测框框选的位置，所述缺陷的缺陷类别为所述最终预测框对应的缺陷类别。

其中，所述断层图像获取模块601具体包括：

ct扫描三维图像获取单元，用于获取所述金属三维点阵结构的ct扫描三维图像。

断层处理单元，用于对所述ct扫描三维图像进行断层处理，得到所述金属三维点阵结构的断层图像。

其中，所述特征提取模块602具体包括：

特征提取单元，用于采用darknet-53网络模型中的特征提取网络对所述断层图像进行特征提取，得到3个尺寸的特征图及预测信息，每个尺寸包括3个尺度，3个尺寸的特征图的维度分别为：(b,13,13,3n)、(b,26,26,3n)和(b,52,52,3n)，其中b为批次大小，n＝m+5，m为缺陷类别数量。

其中，所述修正模块603具体包括：

修正单元，用于根据公式利用所述darknet-53网络模型的yolo层对预测框的位置信息进行修正，得到预测框的实际位置；其中，(tx,ty,tw,th)为预测框的位置信息，(tx,ty)为预测框的中心位置所在单元格相对于所在格子左上角的偏移量，tw为预测的预测框宽度，th为预测的预测框高度，(cx,cy)为预测框的中心位置所在格子的坐标，(bx,by,bw,bh)为预测框的实际位置，(bx,by)为预测框的中心位置的实际坐标，bw为预测框的实际宽度，bh为预测框的实际高度，pw为所述特征图对应的聚类中心缩放后的宽度，ph为所述特征图对应的聚类中心缩放后的高度。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处。综上所述，本说明书内容不应理解为对本发明的限制。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张玉燕;任腾飞;温银堂;张芝威
技术所有人：燕山大学
我是此专利的发明人

上一篇：一种磁悬浮轴承的制作方法
上一篇：用于在新无线电中使用下行链路指派索引的技术和装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。