模型训练方法、路面损伤分割方法、装置和电子设备与流程

文档序号：26590026发布日期：2021-09-10 20:36阅读：83来源：国知局

1.本公开涉及人工智能技术领域，具体涉及计算机视觉和深度学习技术，具体可用于智慧城市和智能交通场景下。

背景技术：

2.路面损伤分割任务旨在从路面图像中确定出路面损伤区域。实际应用中，可以采用分割模型对路面图像进行处理，以完成路面损伤分割任务。目前，一般通过人工标注的方式确定大量路面图像中的路面损伤区域，作为路面图像的标签，基于图像和标签训练分割模型。

技术实现要素：

3.本公开提供了一种模型训练方法、路面损伤分割方法、装置和电子设备。
4.根据本公开的一方面，提供了一种模型训练方法，包括：
5.利用分类模型对第一路面图像进行处理，得到第一路面图像中各个像素点的路面损伤分类结果；
6.基于第一路面图像中各个像素点的路面损伤分类结果，标注第一路面图像中的路面损伤信息；
7.基于第一路面图像以及第一路面图像中的路面损伤信息，训练得到路面损伤分割模型。
8.根据本公开的另一方面，提供了一种路面损伤分割方法，包括：
9.利用路面损伤分割模型对第三路面图像进行分割处理，得到第三路面图像中的路面损伤信息；
10.其中，路面损伤分割模型是基于本公开任一实施例中的模型训练方法训练得到的。
11.根据本公开的另一方面，提供了一种模型训练装置，包括：
12.分类模块，用于利用分类模型对第一路面图像进行处理，得到第一路面图像中各个像素点的路面损伤分类结果；
13.标注模块，用于基于第一路面图像中各个像素点的路面损伤分类结果，标注第一路面图像中的路面损伤信息；
14.第一训练模块，用于基于第一路面图像以及第一路面图像中的路面损伤信息，训练得到路面损伤分割模型。
15.根据本公开的另一方面，提供了一种路面损伤分割装置，包括：
16.分割处理模块，用于利用路面损伤分割模型对第三路面图像进行分割处理，得到第三路面图像中的路面损伤信息；
17.其中，路面损伤分割模型是基于本公开任一实施例中的模型训练方法训练得到的。
18.根据本公开的另一方面，提供了一种电子设备，包括：
19.至少一个处理器；以及
20.与该至少一个处理器通信连接的存储器；其中，
21.该存储器存储有可被该至少一个处理器执行的指令，该指令被该至少一个处理器执行，以使该至少一个处理器能够执行本公开任一实施例中的方法。
22.根据本公开的另一方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，该计算机指令用于使计算机执行本公开任一实施例中的方法。
23.根据本公开的另一方面，提供了一种计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现本公开任一实施例中的方法。
24.根据本公开的技术，利用分类模型得到路面图像中各个像素点的路面损伤分类结果，从而可以基于各个像素点的路面损伤分类结果标注路面图像中的路面损伤信息，基于路面图像以及标注信息训练路面损伤分割模型。由于本公开的技术方案无需进行人工标注，因此，节约了大量标注的人力物力，并解决了因人工标注主观性强导致的标注不准确的问题，提高了分割模型的准确性。
25.应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
26.附图用于更好地理解本方案，不构成对本公开的限定。其中：
27.图1是本公开一个实施例提供的模型训练方法的示意图；
28.图2a是本公开实施例中类激活图的示意图；
29.图2b是本公开实施例中路面损伤分类结果的示意图；
30.图3是本公开另一个实施例提供的模型训练方法的示意图；
31.图4是本公开又一个实施例提供的模型训练方法的示意图；
32.图5是本公开一个实施例提供的路面损伤分割方法的示意图；
33.图6是本公开一个实施例提供的模型训练装置的示意图；
34.图7是本公开另一个实施例提供的模型训练装置的示意图；
35.图8是本公开一个实施例提供的路面损伤分割装置的示意图；
36.图9是用来实现本公开实施例的方法的电子设备的框图。
具体实施方式
37.以下结合附图对本公开的示范性实施例做出说明，其中包括本公开实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本公开的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。
38.图1示出了本公开一个实施例提供的模型训练方法。该方法可选地可以由电子设备执行。如图1所示，该方法包括：
39.步骤s110，利用分类模型对第一路面图像进行处理，得到第一路面图像中各个像素点的路面损伤分类结果；
40.步骤s120，基于第一路面图像中各个像素点的路面损伤分类结果，标注第一路面图像中的路面损伤信息；
41.步骤s130，基于第一路面图像以及第一路面图像中的路面损伤信息，训练得到路面损伤分割模型。
42.示例性地，本公开实施例中的第一路面图像可以指用于训练路面损伤分割模型的样本图像。具体地，第一路面图像中可以包含路面损伤区域，也可以不包含路面损伤区域。路面损伤区域例如是路面中的裂缝所对应的图像区域。
43.示例性地，分类模型可以用于针对输入的路面图像中的各个像素点，计算像素点存在路面损伤的得分，该得分可以用于确定路面损伤分类结果。具体地，分类模型输出的信息可以是类激活图。以4*4大小的第一路面图像为例，将该图像输入分类模型，分类模型通过计算并进行上采样或下采样处理，可输出如图2a示例的4*4大小的类激活图。类激活图中的各像素点与第一路面图像中各像素点一一对应，类激活图中的各像素点的值为第一路面图像中对应的像素点存在路面损伤的得分，例如，第一路面图像中第2行第2列的像素点存在路面损伤的得分为0.6。
44.示例性地，路面损伤分类结果用于表征是否存在路面损伤。例如，路面损伤结果可以是0或1，其中，0表示不存在路面损伤，1表示存在路面损伤。
45.在一种具体的示例中，若像素点存在路面损伤的得分大于等于预设值，则像素点的路面损伤分类结果表征该像素点存在损伤；若像素点存在路面损伤的得分小于预设值，则像素点的路面损伤分类结果表征该像素点不存在损伤。例如，预设值为0.5，如图2a所示，第2行第2列与第3行第2列的像素点存在路面损伤的得分大于预设值，因此，其路面损伤分类结果为1，表征存在路面损伤。其余像素点存在路面损伤的得分小于预设值，因此，其路面损伤分类结果为0，表征不存在路面损伤。第一路面图像中各个像素点的路面损伤分类结果如图2b所示，图2b可以称为标注图像，其包含各个像素点的损伤分类结果。
46.示例性地，本公开实施例中的路面损伤信息可以是第一路面图像中的路面损伤区域的位置。在第一路面图像中不包含路面损伤区域的情况下，路面损伤信息可以为空值。例如，根据如图2b所示的各像素点的路面损伤分类结果，确定第一路面图像中的路面损伤信息即第一路面图像中路面损伤区域的位置为第2行第2列与第3行第2列。
47.采用第一路面图像中的路面损伤信息为标注信息或者说第一路面图像的标签，训练预设的分割网络，可以得到路面损伤分割模型。该路面损伤分割模型可用于针对输入的路面图像，输出其中的路面损伤信息。可选地，预设的分割网络包括hrnet(high
‑
resolution net,高分辨网络)，例如hrnet
‑
w18。
48.根据本公开实施例的模型训练方法，利用分类模型得到路面图像中各个像素点的路面损伤分类结果，从而可以基于各个像素点的路面损伤分类结果标注路面图像中的路面损伤信息，基于路面图像以及标注信息训练路面损伤分割模型。由于本公开的技术方案无需进行人工标注，因此，节约了大量标注的人力物力，并解决了因人工标注主观性强导致的标注不准确的问题，提高了分割模型的准确性。
49.在一种可选的示例性的实施方式中，如图3所示，上述步骤s110，利用分类模型对第一路面图像进行处理，得到第一路面图像中各个像素点的路面损伤分类结果，包括：
50.步骤s310，利用分类模型对第一路面图像进行处理，得到第一路面图像所对应的
类激活图；
51.步骤s320，基于类激活图进行二值化，得到标注图像；其中，标注图像的各个像素点的值用于表征第一路面图像中各个像素点的路面损伤分类结果。
52.示例性地，分类模型可以基于预设的分类网络训练得到。可选地，预设的分类网络包括resnet(deep residual network,深度残差网络)，例如resnet50网络。
53.示例性地，上述步骤s310中，利用分类模型得到第一路面图像所对应的类激活图的具体计算公式可以包括：
[0054][0055]
其中，cam表示类激活图。a
i
表示分类模型对第一路面图像进行处理得到的n个特征图中的第i个特征图。表示与a
i
对应的全连接层的权重；其中，c表示类别，在本公开实施例中，针对路面损伤分类为存在路面损伤和不存在路面损伤，因此c表示存在路面损伤。类激活图cam用于表征存在路面损伤的得分，其包含各像素点存在路面损伤的得分。
[0056]
可选地，在根据公式(1)得到类激活图后，还可以对类激活图做上采样或下采样处理，以使类激活图与第一路面图像的尺寸一致。
[0057]
示例性地，在上述步骤s320中，可以基于第一预设阈值对类激活图进行二值化。例如，若像素点的得分大于等于第一预设阈值，则像素点的值为表征存在路面损伤的第一值；若像素点的得分小于第一预设阈值，则像素点的值为表征不存在路面损伤的第二值。
[0058]
实际应用中，可以根据需求调整第一预设阈值的大小。例如，将第一预设阈值调大，可以提高模型确定出的路面损伤区域的准确性。将第一预设阈值调小，可以尽可能全面地检测路面损伤区域。
[0059]
上述实施方式中，利用分类模型得到类激活图，再对类激活图进行二值化，可以得到准确的标注图像。基于准确的第一路面图像和标注图像训练路面损伤分割模型，可以提高模型的准确性。
[0060]
实际应用中，示例性地，分类模型的获取方式可以包括：
[0061]
基于预先标注有损伤分类结果的第二路面图像，训练得到分类模型。
[0062]
其中，第二路面图像的损伤分类结果可以采用人工标注的方式进行预先标注。
[0063]
根据上述应用示例，对第二路面图像的整体进行标注是否有路面损伤分类，即可使分类模型具备分类能力，减少了人工标注的数量，提高了标注效率。
[0064]
在一种可选的示例性的实施方式中，上述步骤s320，基于类激活图进行二值化，得到标注图像，可以包括：
[0065]
基于第一预设阈值对类激活图进行二值化，得到二值化图像；
[0066]
确定二值化图像中的至少一个连通域；
[0067]
根据至少一个连通域中各连通域的面积对二值化图像进行处理，得到标注图像。
[0068]
举例而言，第一预设阈值可以是0.5，将类激活图中取值大于等于0.5的像素点的值设置为1，将类激活图中取值小于等于0.5的像素点的值设置为0，可以得到二值化图像。基于二值化图像可以计算连通域。具体地，若相邻的像素点的取值相同，则将相邻的像素点确定为同一连通域中的像素点。如此，可以得到二值化图像中的至少一个连通域。
[0069]
上述实施方式中，根据各连通域的面积对二值化图像进行处理，得到标注图像，可
以对面积不符合要求的连通域进行处理，减少图像噪声的影响，提高标注图像的准确性。
[0070]
示例性地，根据至少一个连通域中各连通域的面积对二值化图像进行处理，得到标注图像，包括：
[0071]
在至少一个连通域中的第i个连通域的面积小于第二预设阈值的情况下，将第i个连通域中各个像素点的值设置为预设值，得到标注图像；其中，i为正整数。
[0072]
其中，预设值可以为表征不存在路面损伤的值，例如0。也就是说，若一个连通域的面积小于第二预设阈值例如100个像素点、500个像素点等，则无论该连通域原本的值为0还是1，均将该连通域中各个像素点的值置为0。如此，可以避免将图像中的噪声标注为路面损伤，提高标注图像的准确性。
[0073]
如图4所示，在一个具体的应用示例中，模型训练方法可包括训练、预测、去噪、再训练四个过程。首先，利用路面损伤分类标注信息410，即带有标注信息的路面图像训练分类网络。然后，将分割网络的训练数据集中的路面损伤图像420输入训练好的分类网络430，分类网络430针对路面损伤图像420进行预测，得到类激活图440。再针对类激活图440进行去噪，得到最终的路面损伤分割标注信息450。最后基于损伤分割标注信息450训练分割网络460，得到最终的路面损伤分割模型。
[0074]
根据上述方法，利用分类模型得到路面图像中各个像素点的路面损伤分类结果，从而可以基于各个像素点的路面损伤分类结果标注路面图像中的路面损伤信息，基于路面图像以及标注信息训练路面损伤分割模型。由于无需进行人工标注，因此，节约了大量标注的人力物力，并解决了因人工标注主观性强导致的标注不准确的问题，提高了分割模型的准确性。
[0075]
根据本公开的实施例，本公开还提供一种路面损伤分割方法，如图5所示，该方法包括：
[0076]
步骤s510，利用路面损伤分割模型对第三路面图像进行分割处理，得到第三路面图像中的路面损伤信息；
[0077]
其中，路面损伤分割模型是基于本公开任一实施例提供的模型训练方法训练得到的。
[0078]
本公开实施例中，第三路面图像可以指待进行分割以获得路面损伤信息的路面图像。
[0079]
根据本公开的技术，由于路面损伤分割模型的训练过程中，解决了因人工标注主观性强导致的标注不准确的问题，提高了分割模型的准确性，因此，将分割模型应用于对第三路面图像的分割处理中，可以提高第三路面图像的路面损伤信息的准确性。
[0080]
本公开的技术方案中，所涉及的用户个人信息的获取、存储和应用等，均符合相关法律法规的规定，且不违背公序良俗。
[0081]
作为上述各方法的实现，本公开实施例还提供一种模型训练装置，如图6所示，该装置包括：
[0082]
分类模块610，用于利用分类模型对第一路面图像进行处理，得到第一路面图像中各个像素点的路面损伤分类结果；
[0083]
标注模块620，用于基于第一路面图像中各个像素点的路面损伤分类结果，标注第一路面图像中的路面损伤信息；
[0084]
第一训练模块630，用于基于第一路面图像以及第一路面图像中的路面损伤信息，训练得到路面损伤分割模型。
[0085]
示例性地，本公开实施例还提供一种模型训练装置，如图7所示，该装置包括：
[0086]
分类模块710，用于利用分类模型对第一路面图像进行处理，得到第一路面图像中各个像素点的路面损伤分类结果；
[0087]
标注模块720，用于基于第一路面图像中各个像素点的路面损伤分类结果，标注第一路面图像中的路面损伤信息；
[0088]
第一训练模块730，用于基于第一路面图像以及第一路面图像中的路面损伤信息，训练得到路面损伤分割模型。
[0089]
其中，如图7所示，分类模块710包括：
[0090]
模型处理单元711，用于利用分类模型对第一路面图像进行处理，得到第一路面图像所对应的类激活图；
[0091]
二值化单元712，用于基于类激活图进行二值化，得到标注图像；其中，标注图像的各个像素点的值用于表征第一路面图像中各个像素点的路面损伤分类结果。
[0092]
示例性地，二值化单元712具体用于：
[0093]
基于第一预设阈值对类激活图进行二值化，得到二值化图像；
[0094]
确定二值化图像中的至少一个连通域；
[0095]
根据至少一个连通域中各连通域的面积对二值化图像进行处理，得到标注图像。
[0096]
示例性地，二值化单元712具体用于：
[0097]
在至少一个连通域中的第i个连通域的面积小于第二预设阈值的情况下，将第i个连通域中各个像素点的值设置为预设值，得到标注图像；其中，i为正整数。
[0098]
示例性地，如图7所示，该装置还包括：
[0099]
第二训练模块740，用于基于预先标注有损伤分类结果的第二路面图像，训练得到分类模型。
[0100]
根据本公开的实施例，本公开还提供了一种路面损伤分割装置，如图8所示，该装置包括：
[0101]
分割处理模块810，用于利用路面损伤分割模型对第三路面图像进行分割处理，得到第三路面图像中的路面损伤信息；
[0102]
其中，路面损伤分割模型是基于本公开任一实施例中的模型训练方法训练得到的。
[0103]
本公开实施例各装置中的各单元、模块或子模块的功能可以参见上述方法实施例中的对应描述，在此不再赘述。
[0104]
根据本公开的实施例，本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
[0105]
图9示出了可以用来实施本公开的实施例的示例电子设备900的示意性框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限
制本文中描述的和/或要求的本公开的实现。
[0106]
如图9所示，电子设备900包括计算单元901，其可以根据存储在只读存储器(rom)902中的计算机程序或者从存储单元908加载到随机访问存储器(ram)903中的计算机程序来执行各种适当的动作和处理。在ram 903中，还可存储电子设备900操作所需的各种程序和数据。计算单元901、rom 902以及ram 903通过总线904彼此相连。输入输出(i/o)接口905也连接至总线904。
[0107]
电子设备900中的多个部件连接至i/o接口905，包括：输入单元906，例如键盘、鼠标等；输出单元907，例如各种类型的显示器、扬声器等；存储单元908，例如磁盘、光盘等；以及通信单元909，例如网卡、调制解调器、无线通信收发机等。通信单元909允许电子设备900通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
[0108]
计算单元901可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元901的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。计算单元901执行上文所描述的各个方法和处理，例如模型训练方法或路面损伤分割方法。例如，在一些实施例中，模型训练方法或路面损伤分割方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元908。在一些实施例中，计算机程序的部分或者全部可以经由rom 902和/或通信单元909而被载入和/或安装到电子设备900上。当计算机程序加载到ram 903并由计算单元901执行时，可以执行上文描述的模型训练方法或路面损伤分割方法的一个或多个步骤。备选地，在其他实施例中，计算单元901可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行模型训练方法或路面损伤分割方法。
[0109]
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、负载可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
[0110]
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
[0111]
在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计
算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd
‑
rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
[0112]
为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，crt(阴极射线管)或者lcd(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入、或者触觉输入来接收来自用户的输入。
[0113]
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(lan)、广域网(wan)和互联网。
[0114]
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端
‑
服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，也可以为分布式系统的服务器，或者是结合了区块链的服务器。
[0115]
应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本公开公开的技术方案所期望的结果，本文在此不进行限制。
[0116]
上述具体实施方式，并不构成对本公开保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等，均应包含在本公开保护范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：于越;孙昊;谭啸
技术所有人：北京百度网讯科技有限公司
我是此专利的发明人

上一篇：一种生物技术研发用保护箱的制作方法
上一篇：一种基于深度散列与多特征融合的增量图像检索方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。