一种道路地物识别的方法以及相关装置与流程

文档序号：31631017发布日期：2022-09-24 01:58阅读：43来源：国知局

1.本技术实施例涉及地图领域，具体涉及一种道路地物识别的方法以及相关装置。

背景技术：

2.遥感图像的地物(比如：道路的道路面、车道线)识别是自动目标识别理论中的关键技术之一。城市道路作为地理信息库的重要组成部分，如何准确地从遥感图像中识别城市道路的地物目标对地表检测、城市结构描述以及道路更新等都具有重要意义。
3.遥感图像背景复杂、且易受到周围地物阴影以及道路与房屋光谱近似等问题的影响，难以保证识别精度。图1示出了相关方案中识别道路地物的示意图。如图1所示，针对遥感图像的道路地物识别，相关方案中主要是通过主成分分析对原始高光谱遥感影像进行处理，即将高光谱遥感影像的多个波段(往往数十个)降维到少数几个波段，然后将所获得到该高光谱遥感影像的第一主成分作为训练样本，利用该训练样本通过残差网络以及特征融合模块来构建网络模型进行训练，并通过训练得到的网络模型来识别该高光谱遥感影像的分类结果。
4.然而，相关方案中对高光谱遥感影像中地物识别的方式，仅采用主成分分析对高光谱遥感影像进行数据预处理，但是对于例如部分云层遮挡、像素级的遥感检测正负样本不均衡等遥感图像这类复杂的应用场景，仅依赖于主成分分析无法较好地对高光谱遥感影像进行数据理解和预处理，极大地影响了后续模型识别过程中的分类精度。另外，主成分分析的过程本身就是一个极大的计算开销，实际应用中高光谱遥感影像的获取成本也较大，而且相关方案中仅适用于高光谱遥感影像的应用场景中，这些因素使得相关方案无法适用于对其他遥感影像中的道路地物进行识别，极大地限制了遥感影像行业的应用落地。

技术实现要素：

5.本技术实施例提供了一种道路地物识别的方法以及相关装置，能够用于多光谱遥感图像中的道路地物的识别场景中，利于遥感影像行业的应用落地，而且还可以降低应用成本。另外，在目标基分类模型的预测基础上，结合目标集成分类模型实现对多光谱遥感图像中道路地物的识别，而不是仅依赖于主成分分析，极大地提升了识别过程中的分类精度。
6.第一方面，本技术实施例提供了一种道路地物识别方法。该方法包括：获取待识别的多光谱遥感图像；对待识别的多光谱遥感图像进行预处理，得到第一图像；将第一图像作为n个目标基分类模型的输入，以获取n个目标基分类模型针对第一图像进行预测得到的n个第一分类结果，其中，n个目标基分类模型中的每个目标基分类模型分别以获取图像样本的预测分类结果为训练目标，以预设图像尺寸的图像样本为训练数据进行迭代训练处理后得到的机器学习模型，n≥2、且n为整数；将n个第一分类结果作为目标集成分类模型的输入，得到目标分类结果，所述目标分类结果用于指示所述待识别的多光谱遥感图像中道路地物的分类情况，目标集成分类模型是以n个目标基分类模型对图像样本进行预测后得到的n个分类结果为训练数据进行迭代训练处理后得到的机器学习模型。
7.第二方面，本技术实施例提供一种道路地物识别装置。该道路地物识别装置包括但不限于终端设备、服务器等。该道路地物识别装置包括获取单元和处理单元。其中，获取单元用于获取待识别的多光谱遥感图像；处理单元，用于对待识别的多光谱遥感图像进行预处理，得到第一图像；处理单元，用于将第一图像作为n个目标基分类模型的输入，以获取n个目标基分类模型针对第一图像进行预测得到的n个第一分类结果，其中，n个目标基分类模型中的每个目标基分类模型分别以获取图像样本的预测分类结果为训练目标，以预设图像尺寸的图像样本为训练数据进行迭代训练处理后得到的机器学习模型，n≥2、且n为整数；处理单元，用于将n个第一分类结果作为目标集成分类模型的输入，得到目标分类结果，所述目标分类结果用于指示所述待识别的多光谱遥感图像中道路地物的分类情况，目标集成分类模型是以n个目标基分类模型对图像样本进行预测后得到的n个分类结果、以及图像样本的标注标签为训练数据进行迭代训练处理后得到的机器学习模型。
8.在一些可选的示例中，处理单元用于：根据预设图像尺寸对待识别的多光谱遥感图像进行图像切割处理，得到n个切割图像集，n个切割图像集中的任意两个切割图像集中的切割图像互不重叠；根据每个切割图像集中的正负切割图像样本的比例对对应的切割图像集进行采样处理，得到采样后的切割图像集；对采样后的切割图像集进行主成分分析pca处理，得到第一图像。
9.在另一些可选的示例中，获取单元用于获取采样后的切割图像集对应的图像矩阵，图像矩阵用于指示采样后的切割图像集中的切割图像的排列情况；处理单元用于：计算图像矩阵对应的均值向量和协方差矩阵，以及与协方差矩阵对应的正交矩阵；基于均值向量以及正交矩阵对采样后的切割图像集进行主分量变换处理，得到主分量变换图像；对主分量变换图像进行主分量逆变换处理，得到采样后的切割图像集中切割图像的目标主成分，以得到第一图像。
10.在另一些可选的示例中，处理单元用于：在对采样后的切割图像集进行主成分分析pca处理，得到第一图像之前，基于预设去噪模型对采样后的切割图像集中的每个切割图像进行去噪处理，得到去噪处理后的切割图像；对去噪处理后的切割图像进行主成分分析pca处理，得到第一图像。
11.在另一些可选的示例中，获取单元还用于：获取n个分类结果以及图像样本的标注标签，n个分类结果为n个目标基分类模型对图像样本分别进行预测后得到的分类结果；处理单元还用于：基于预设逻辑回归模型对n个分类结果以及图像样本的标注标签进行处理，得到n个目标权重，其中，每个目标权重用于指示对应的分类结果的贡献程度；基于n个目标权重对初始集成分类模型进行迭代训练处理，得到目标集成分类模型。
12.在另一些可选的示例中，获取单元还用于：获取预设图像尺寸的图像样本；处理单元还用于：基于预设处理模型对预设图像尺寸的图像样本进行处理，得到图像样本的预测分类结果；获取图像样本的预测分类结果和预设标签之间的差异，得到目标损失值；基于目标损失值对初始基分类模型进行迭代训练，得到目标基分类模型。
13.本技术实施例第三方面提供了一种道路地物识别装置，包括：存储器、输入/输出(i/o)接口和存储器。存储器用于存储程序指令。处理器用于执行存储器中的程序指令，以执行上述第一方面的实施方式对应的道路地物识别的方法。
14.本技术实施例第四方面提供了一种计算机可读存储介质，计算机可读存储介质中
存储有指令，当其在计算机上运行时，使得计算机执行以执行上述第一方面的实施方式对应的方法。
15.本技术实施例第五方面提供了一种包含指令的计算机程序产品，当其在计算机或者处理器上运行时，使得计算机或者处理器执行上述以执行上述第一方面的实施方式对应的方法。
16.从以上技术方案可以看出，本技术实施例具有以下优点：
17.本技术实施例中，由于n个目标基分类模型中的每个目标基分类模型分别以获取图像样本的预测分类结果为训练目标，以预设图像尺寸的图像样本为训练数据进行迭代训练处理后得到的机器学习模型，那么通过对待识别的多光谱遥感图像进行预处理，得到第一图像后，将该第一图像作为每个目标基分类模型的输入，获取得到每个目标基分类模型针对所述第一图像进行预测得到的第一分类结果。而且，由于所述目标集成分类模型是以所述n个目标基分类模型对所述图像样本进行预测后得到的n个分类结果为训练数据进行迭代训练处理后得到的机器学习模型，那么进一步可以将所获取得到的n个第一分类结果作为该目标集成分类模型的输入，进而预测得到待识别的多光谱遥感图像的目标分类结果，该目标分类结果能够用来指示待识别的多光谱遥感图像中道路地物的分类情况。也就是理解成，由于多光谱遥感图像的获取成本远低于高光谱遥感图像，那么通过本技术实施例提供的道路地物识别的方法可以扩展适用于多光谱遥感图像中的道路地物的识别场景中，利于遥感影像行业的应用落地，而且还可以降低应用成本。另外，在目标基分类模型的预测基础上，结合目标集成分类模型实现对多光谱遥感图像中道路地物的识别，而不是仅依赖于主成分分析，极大地提升了识别过程中的分类精度。
附图说明
18.为了更清楚地说明本技术实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本技术的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
19.图1示出了相关方案中识别道路地物的示意图；
20.图2示出了本技术实施例提供的道路地物识别的方法的一种流程图；
21.图3示出了本技术实施例提供的道路地物识别的方法的另一种流程图；
22.图4示出了本技术实施例提供的一种获取多光谱遥感图像的界面示意图；
23.图5示出了本技术实施例提供的一种道路地物识别的界面示意图；
24.图6示出了本技术实施例提供的目标分类结果的展示示意图；
25.图7示出了本技术实施例中提供的道路地物识别装置的结构示意图；
26.图8示出了本技术实施例中提供的道路地物识别装置的硬件结构示意图。
具体实施方式
27.本技术实施例提供了一种道路地物识别的方法以及相关装置，能够用于多光谱遥感图像中的道路地物的识别场景中，利于遥感影像行业的应用落地，而且还可以降低应用成本。另外，在目标基分类模型的预测基础上，结合目标集成分类模型实现对多光谱遥感图
像中道路地物的识别，而不是仅依赖于主成分分析，极大地提升了识别过程中的分类精度。
28.可以理解的是，在本技术的具体实施方式中，涉及到用户信息等相关的数据，当本技术以上实施例运用到具体产品或技术中时，需要获得用户许可或者同意，且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
29.下面将结合本技术实施例中的附图，对本技术实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本技术一部分实施例，而不是全部的实施例。基于本技术中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本技术保护的范围。
30.本技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本技术的实施例如能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
31.随着人工智能(artificial intelligence,ai)技术研究和进步，人工智能技术在多个领域展开研究和应用，例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等，相信随着技术的发展，人工智能技术将在更多的领域得到应用，并发挥越来越重要的价值。
32.本技术实施例提供了一种道路地物识别的方法。本技术实施例提供的道路地物识别的方法是基于人工智能实现的。人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。
33.人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音技术、自然语言处理技术以及机器学习/深度学习等几大方向。
34.在本技术实施例中，主要涉及的人工智能技术包括上述所提及的计算机视觉(computer visio，cv)技术等方向。例如，可以涉及图像处理中的图像压缩、图像语义理解中的图像分类等；也可以涉及机器学习(machine learning，ml)中的深度学习(deep learning)等。
35.本技术提供的道路地物识别的方法可以应用于具有数据处理能力的道路地物识别装置，如终端设备、服务器、问答机器人等。其中，终端设备可以包括但不限于智能手机、台式计算机、笔记本电脑、平板电脑、智能音箱、车载设备、智能手表、可穿戴智能设备、智能语音交互设备、智能家电、飞行器等。服务器可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云计算服务的云服务器等，本技术不做具体限定。另外，所提及的终端设备以及服务器可以通过有线通信或无线通信等方
式进行直接连接或间接连接，本技术不做具体限定。
36.上述所提及的道路地物识别装置可以具备实施上述提及的计算机视觉技术的能力。所提及的计算机视觉技术是一门研究如何使机器“看”的科学，更进一步的说，就是使用摄影机和电脑代替人眼对目标进行识别、踪迹追溯和测量等机器视觉，并进一步做图形处理，使得电脑处理成为更适合人眼观察或传送仪器检测的图像。作为一个科学学科，计算机视觉研究相关的理论和技术，试图建立能够从图像或者多维数据中获取信息的人工智能系统。计算机视觉技术通常包括图像处理、图像识别、图像语义理解、图像检索、ocr、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3d技术、虚拟现实、增强现实、同步定位与地图构建等技术，还包括常见的人脸识别、指纹识别等生物特征识别技术。在本技术实施例中，道路地物识别装置可以通过该计算机视觉技术对多光谱遥感图像进行预处理等。
37.另外，该道路地物识别装置还可以具备机器学习能力。机器学习是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。机器学习和深度学习通常包括神经网络等技术。
38.在本技术实施例提供的道路地物识别的方法中的采用人工智能模型，主要涉及对神经网络的应用，通过神经网络实现对多光谱遥感图像的分类结果进行识别处理。
39.下面结合附图对本技术实施例提供的一种道路地物识别的方法进行介绍。图2示出了本技术实施例提供的道路地物识别的方法的一种流程图。如图2所示，该道路地物识别的方法可以包括如下步骤：
40.201、获取待识别的多光谱遥感图像。
41.该示例中，多光谱遥感图像是指对道路地物辐射中多个单波段进行提取得到的图像。或者说，该多光谱遥感图像中会有多个波段的光谱信息。所描述的道路地物可以包括但不限于道路的道路面、车道线等与道路相关的物体，本技术实施例中不做具体限定。另外，所描述的待识别的多光谱遥感图像的格式可以包括但不限于tif格式。
42.202、对待识别的多光谱遥感图像进行预处理，得到第一图像。
43.该示例中，在获取得到该待识别的多光谱遥感图像后，可以对该待识别的多光谱遥感图像进行预处理，以得到第一图像。所描述的预处理可以包括但不限于图像切割、采样、主成分分析；也还可以在进行主成分分析之前，预处理还包括去噪处理等操作，具体本技术实施例中不做限定。
44.在一些示例中，对待识别的多光谱遥感图像进行预处理，得到第一图像，可以采用如下方式来实现，即：根据预设图像尺寸对待识别的多光谱遥感图像进行图像切割处理，得到n个切割图像集，n个切割图像集中的任意两个切割图像集中的切割图像互不重叠；然后，根据每个切割图像集中的正负切割图像的比例对对应的切割图像集进行采样处理，得到采样后的切割图像集，并对采样后的切割图像集进行主成分分析pca处理，得到第一图像。
45.该示例中，在获取到待识别的多光谱遥感图像后，可以按照不同的预设图像尺寸对该待识别的多光谱遥感图像进行切割，譬如按照n1×
n1、n2×
n2、n3×
n3、nn×nn
等图像尺寸分别对该待识别的多光谱遥感图像进行切割，进而得到n个不同图像尺寸的切割图像集。需
说明，这n个不同图像尺寸的切割图像集中任意两个切割图像集中的切割图像均不存在切割重叠的部分。另外，所描述的预设图像尺寸也可以理解成滑动窗口尺寸，具体本技术不做限定说明。
46.在切割得到这n个切割图像集后，针对每个预设图像尺寸的切割图像集中的每个切割图像，譬如包含n1×
n1图像尺寸的切割图像所对应的这个切割图像集，可以统计出该切割图像集中切割图像正样本的数量p和切割图像负样本的数量q，进而基于切割图像正样本的数量p和切割图像负样本的数量q确定出该切割图像集中正负切割图像样本的比例，如在r∈[r1,r2]时，可以认为该切割图像集中切割图像正样本与切割图像负样本处于一个数量均衡的状态，此时无需进行采样处理。在r∈(0,r1)时，可以认为该切割图像集中切割图像负样本的数量远大于切割图像正样本的数量，处于一个数量不均衡的状态，此时可以对该切割图像集中的切割图像负样本进行下采样处理，然后将下采样处理得到的切割图像负样本添加至该切割图像集中，进而得到采样后的切割图像集。类似地，在r∈(r2,∞)时，可以认为该切割图像集中切割图像负样本的数量远小于切割图像正样本的数量，处于一个数量不均衡的状态，此时可以对该切割图像集中的切割图像负样本进行上采样处理，然后将上采样处理得到的切割图像负样本添加至该切割图像集中，进而得到采样后的切割图像集。需说明，上述所描述的r可以属于[0.8,1.2]等区间，本技术实施例不做具体限定。另外，所描述的切割图像正样本可以理解成被标注为道路的像素点，切割图像负样本可以理解成被标注为非道路的像素点，譬如图像背景的像素点等等，本技术实施例不做具体限定。
[0047]
这样，在得到该采样后的切割图像集后，可以对该采样后的切割图像集中的切割图像进行主成分分析(principal component analysis，pca)处理，进而得到第一图像。需说明，所描述的主成分分析pca又可以称为主分量变换，能够构建数据从高维到低维的映射，譬如能够将待识别的n为多光谱遥感图像，滤除大部分冗余信息，得到尽可能保护光谱信息的m维多光谱遥感图像。pca处理，是指通过正交变换将一组可能相关的变量转换到一组线性不相关的变量(称为主成分)的统计分析过程。多光谱遥感图像中不同波段通常存在较高的相关性，主成分变换在遥感图像中的应用目的在于去除波段之间的冗余信息，大大减少总的数据量，并使得图像信息得到增强。
[0048]
示意性地，上述所提及的对采样后的切割图像集进行主成分分析pca处理，得到第一图像的处理过程，可以采样如下方式来实现，即：获取采样后的切割图像集对应的图像矩阵，图像矩阵用于指示采样后的切割图像集中的切割图像的排列情况；计算图像矩阵对应的均值向量和协方差矩阵，以及与协方差矩阵对应的正交矩阵；基于均值向量以及正交矩阵对采样后的切割图像集进行主分量变换处理，得到主分量变换图像；对主分量变换图像进行主分量逆变换处理，得到采样后的切割图像集中切割图像的目标主成分，以得到第一图像。
[0049]
该示例中，假设采样后的切割图像集中共有t幅图，每幅图的图像尺寸均为k＝m
×
h，其中，m为行数、h为列数。通过将这t幅图叠加排列，能够得到该采样后的切割图像集中切割图像的排列情况，如可以使用二维的图像矩阵x来表示该采样后的切割图像集，具体地，x＝[x1、......、xk]，其中，xi＝[x
1i
、......、x
ni
]，xi表示为位置i上所有像素值的集合。
[0050]
这时候，通过计算出该图像矩阵x的均值向量m
x
和协方差矩阵c
x
。并且，在计算得到协方差矩阵c
x
后，计算该协方差矩阵c
x
对应的正交矩阵a，a为特征向量矩阵。进一步地，可以基于均值向量m
x
以及正交矩阵a对该采样后的切割样本集进行主分量变换处理，即对图像矩阵x进行主分量变换处理，得到主分量变换图像v＝a(x-m
x
)。然后，再对该主分量变换图像v进行主分量逆变换处理，得到采样后的切割图像集中切割图像的目标主成分，如进而实现这t幅图像的信息压缩，得到该第一图像。
[0051]
在一些示例中，在对采样后的切割图像集进行主成分分析pca处理，得到第一图像之前，还可以先基于预设去噪模型对采样后的切割图像集中的每个切割图像进行去噪处理，得到去噪处理后的切割图像。然后，再通过上述所提及的主成分分析pca对该去噪处理后的切割图像进行处理，得到第一图像。
[0052]
需说明，所描述的预设去噪模型可以包括但不限于图形小波去噪算法等等，本技术不做限定说明。以预设去噪模型为图形小波去噪算法为例，该图形小波去噪算法是小波去噪的一种新方法。由于图像的实际噪声无法提前预知，而小波去噪算法针对未知噪声有较好的去噪效果，因此可以选择小波去噪算法对图像进行去噪处理。在小波去噪算法中，为了正确地区分去图像信息和噪声，多采用阈值去噪的方式来区分图像信息和噪声。图形小波去噪算法是一种自适应阈值小波去噪方法。虽然图像的实际噪声无法提前预知,但图像噪声绝大多数为高斯噪声，因此针对该采样后的切割图像集x中的每个切割图像x，都会先加入均值为0、标准差为20的高斯白噪声。这样，对加入高斯白噪声后的图像进行l级gwt分解，便可得到含噪声的gwt变换图像y。这样，基于噪声方差、切割图像的图像尺寸便可以计算得到该变换图像y的阈值t，即其中，σ表示噪声方差,m
×
h为图像尺寸,l为小波分解变换系数所在的层(l＝1，2，
…
，l)。然后，通过该阈值t可以计算得到用于区分噪声和图像信息的阈值t0，即t0＝s
×
t。这样，根据所确定得到的t和t0,对变换图像y的各子带小波系数进行阈值化,并对阈值化后的系数进行基于gwt的图像重构,得到去噪处理后的切割图像。
[0053]
需说明，上述所描述的s的确定是在区间[0,1]中,以n0为步长,根据去噪效果来决定s的最优大小。另外，所描述的噪声方差可以基于独立正态变量决策理论得到，如常用的噪声方差σ可估计为σ＝(|w
j,k
|)/0.6745等，本技术实施例中不做具体限定说明。示例性地，在得到去噪处理后的切割图像后，也可以使用均方根误差(root mean square error，rmse)、峰值信噪比(peak signal-to-noise ratio，psnr)等能够用于评价去噪处理后的切割图像与原始的切割图像之间的近似程度的客观指标,对该去噪处理后的切割图像进行质量评价。譬如，峰值信噪比的数值越大,说明去噪处理后的切割图像与原始的切割图像之间的近似程度越好，去噪效果越好。rmse值越小，表明去噪处理后的切割图像与原始的切割图像更相似，去噪效果好。
[0054]
203、将第一图像作为n个目标基分类模型的输入，以获取n个目标基分类模型针对第一图像进行预测得到的n个第一分类结果，其中，n个目标基分类模型中的每个目标基分类模型分别以获取图像样本的预测分类结果为训练目标，以预设图像尺寸的图像样本为训练数据进行迭代训练处理后得到的机器学习模型，n≥2、且n为整数。
[0055]
该示例中，所描述的n个目标基分类模型中的每个目标基分类模型，均分别以获取
图像样本的预测分类结果为训练目标，以预设图像尺寸的图像样本为训练数据进行迭代训练处理后得到的机器学习模型。
[0056]
也就是理解成，在获取到多光谱遥感数据样本以及多光谱遥感数据样本对应的标注标签后，可以按照前述步骤202中所描述的预处理方式，对该多光谱遥感数据样本以及对应的标注标签进行切割、采样、图形小波去噪处理(可选)、主成分分析pca处理后，得到图像样本集。这些图像样本集可以理解成不同图像尺寸的切割样本集，如：n1×
n1、n2×
n2、n3×
n3、nn×nn
等图像尺寸的切割样本集。然后，再对这些切割样本集按照训练集：验证集：测试集＝z1：z2：z3的比例进行分割。这样，便可以获取得到用于模型训练过程中的训练数据，该训练数据中包括预设图像尺寸的图像样本。需说明，对多光谱遥感数据样本进行人工标注，得到路面标注矢量数据；并对该路面标注矢量数据进行数据格式转换，便可以得到该多光谱遥感数据样本对应的标注标签。另外，所描述的标注标签的格式可以包括但不限于png格式。
[0057]
在获取到预设图像尺寸的图像样本后，可以基于预设处理模型对该预设图像尺寸的图像样本进行处理，进而得到该图像样本的预测分类结果。然后获取图像样本的预测分类结果与预设标签之间的差异，得到目标损失值，进而基于该目标损失值对初始基分类模型进行迭代训练，便可以得到该目标基分类模型。需说明，所描述的预设处理模型包括但不限于hrnet+ocr模型框架。所描述的语义分割模型(hrnet)可以接受不同图像尺寸的切割图像输入，能通过并行的卷积流得到不同分辨率的特征图，然后再通过上下文注意力机制(ocr)模型对不同图像尺寸的训练集分别训练，在训练得到的模型精度或者训练迭代次数达到预设阈值时，可以通过测试集对该训练得到的模型进行测试，并在测试精度满足要求的时候，训练得到n个目标基分类模型，如：model1、model2、
…
、modeln等。类似地，在训练得到的模型精度或者训练迭代次数并未达到预设阈值时，可以基于目标损失值进行模型迭代训练，直到训练得到的模型精度或者训练迭代次数达到预设阈值为止。
[0058]
这样，在训练得到n个目标基分类模型后，便可以将前述得到的第一图像作为这n个目标基分类模型的输入，由这n个目标基分类模型分别对该第一图像进行预测，进而获取得到这n个目标基分类模型针对该第一图像进行预测得到的n个第一分类结果。
[0059]
204、将n个第一分类结果作为目标集成分类模型的输入，得到目标分类结果，目标分类结果用于指示待识别的多光谱遥感图像中道路地物的分类情况，目标集成分类模型是以n个目标基分类模型对图像样本进行预测后得到的n个分类结果、以及图像样本的标注标签为训练数据进行迭代训练处理后得到的机器学习模型。
[0060]
该示例中，所描述的目标集成分类模型是以n个目标基分类模型对图像样本进行预测后得到的n个分类结果、以及图像样本的标注标签为训练数据进行迭代训练处理后得到的机器学习模型。需说明，所提及的n个目标基分类模型、图像样本、标注标签可以参照前述步骤203中的内容进行理解，此处不做赘述。
[0061]
也就是理解成，可以将n个目标基分类模型对图像样本分类进行预测后得到的分类结果，以及该图像样本的标注标签作为训练目标集成分类模型的样本集。这样，在得到该样本集后，可以基于预设逻辑回归模型对这n个分类结果进行处理，得到n个目标权重，并且这n个目标权重用于指示对应的分类结果的贡献程度。这样，能够基于这n个目标权重对初始集成分类模型进行拟合迭代训练处理，并在训练得到的模型精度或者训练迭代次数达到
预设阈值时，训练得到该目标集成分类模型。换句话说，对个n个不同的目标基分类模型的预测结果(如：p1、p2、...pn)，可以采用逻辑回归的方式与对应的标注标签之间再次建模分析，得到多个预测结果和最终的目标分类结果之间的权重，进而通过权重去拟合训练集成分类模型，进而得到最终的目标集成分类模型，如：目标集成分类模型可以表示为y＝w1×
p1+w2×
p2+wn×
pn，其中，wi为第i个目标基分类模型的预测结果pi对应的权重。
[0062]
这样，在训练得到上述所提及的目标集成分类模型后，便可以将步骤203中获取得到的n个目标基分类模型预测得到的n个第一分类结果作为该目标集成分类模型的输入，进而识别得到该待识别的多光谱遥感图像的目标分类结果。该目标分类结果能够指示出该待识别的多光谱遥感图像中道路地物的分类情况，譬如：道路路网、车道线、绿化带等，本技术不做具体限定。
[0063]
图3示出了本技术实施例提供的道路地物识别的方法的另一流程示意图。
[0064]
如图3所示，以3个图像尺寸、3个基分类模型为例进行说明。在该示例中，首先，在获取到多光谱遥感数据样本，以及对多光谱遥感数据样本进行标注得到相应的道路路面标注矢量数据，并对该道路路面标注矢量数据进行数据格式转换，得到对应的标注标签。具体可以参照前述图2中的步骤203所描述的内容进行理解，此处不做赘述。
[0065]
然后，对该多光谱遥感数据样本以及对应的标注标签进行切割，得到不同图像尺寸的切割数据集，如：n1×
n1尺寸的切割数据集、n2×
n2尺寸的切割数据集、以及n3×
n3尺寸的切割数据集。对n1×
n1尺寸的切割数据集、n2×
n2尺寸的切割数据集、以及n3×
n3尺寸的切割数据集进行采样处理，并对采样处理得到的切割数据集进行图形小波去噪处理(可选)、主成分分析pca处理后，得到图像样本集，这些图像样本集可以理解成不同图像尺寸的切割样本集，如n1×
n1尺寸的切割样本集、n2×
n2尺寸的切割样本集、以及n3×
n3尺寸的切割样本集。需说明，所描述的图形小波去噪处理、主成分分析pca处理也可以参照前述图2中的步骤202所描述的内容进行理解，此处不做赘述。
[0066]
然后，再将这些切割样本集按照训练集、验证集以及测试集进行分割。以n1×
n1尺寸的切割样本集为例，可以通过hrnet+ocr模型框架对相应的训练集和验证集进行模型训练，并在训练得到的模型精度或者训练迭代次数达到预设阈值时，可以通过测试集对该训练得到的模型进行测试，并在测试精度满足要求的时候，训练得到对应的目标基分类模型，如：model1。类似地，在训练得到的模型精度或者训练迭代次数并未达到预设阈值时，可以基于损失值进行模型迭代训练，直到训练得到的模型精度或者训练迭代次数达到预设阈值为止。针对目标基分类模型model2和model3的训练过程，也可以参照上述model1的训练过程进行理解，此处不做赘述。
[0067]
在训练得到上述提及的3个目标基分类模型，即model1、model2以及model3以后，便可以将前述得到的多光谱遥感数据样本作为这3个目标基分类模型的输入，由这3个目标基分类模型分别对该多光谱遥感数据样本进行预测，进而获取得到对应的分类结果，即model1的分类结果p1、model2的分类结果p2、model3的分类结果p3。这样，通过预设逻辑回归模型等对这3个分类结果以及对应的标注标签进行模型训练，并在训练得到的模型精度或者训练迭代次数达到预设阈值时，训练得到该目标集成分类模型。
[0068]
图4示出了本技术实施例提供的一种获取多光谱遥感图像的界面示意图。如图4所示，在数据上传界面，获取对象上传的待识别的多光谱遥感图像，如：道路测试数据等。这
样，将获取得到的待识别的多光谱遥感图像进行预处理(包括切割、采样、图像小波去噪处理(可选)以及主成分分析处理)以后，便可以将预处理得到的图像输入到上述训练得到的3个目标基分类模型中，得到3个分类结果。然后，将这个3个分类结果输入到目标集成分类模型中，得到最终的目标分类结果。示例性地，图5示出了本技术实施例提供的一种道路地物识别的界面示意图。如图5所示，在得到上述提及的待识别的多光谱遥感图像后，可以通过调用“地物检测-公路”这一任务模型，能够识别得到该待识别的多光谱遥感图像对应的目标分类结果。所描述的任务模型可以包括上述训练得到的目标基分类模型和目标集成分类模型。示例性地，图6示出了本技术实施例提供的目标分类结果的展示示意图。从图6可以看出，以目标分类结果为道路路网为例，在预测得到道路路网(图6中示出的线段)后，可以将该道路路网可视化地显示在界面上。
[0069]
本技术实施例中，由于n个目标基分类模型中的每个目标基分类模型分别以获取图像样本的预测分类结果为训练目标，以预设图像尺寸的图像样本为训练数据进行迭代训练处理后得到的机器学习模型，那么通过对待识别的多光谱遥感图像进行预处理，得到第一图像后，将该第一图像作为每个目标基分类模型的输入，获取得到每个目标基分类模型针对第一图像进行预测得到的第一分类结果。而且，由于目标集成分类模型是以n个目标基分类模型对图像样本进行预测后得到的n个分类结果为训练数据进行迭代训练处理后得到的机器学习模型，那么进一步可以将所获取得到的n个第一分类结果作为该目标集成分类模型的输入，进而预测得到待识别的多光谱遥感图像的目标分类结果。也就是理解成，由于多光谱遥感图像的获取成本远低于高光谱遥感图像，那么通过本技术实施例提供的道路地物识别的方法可以扩展适用于多光谱遥感图像中的道路地物的识别场景中，利于遥感影像行业的应用落地，而且还可以降低应用成本。另外，在目标基分类模型的预测基础上，结合目标集成分类模型实现对多光谱遥感图像中道路地物的识别，而不是仅依赖于主成分分析，极大地提升了识别过程中的分类精度。
[0070]
上述主要从方法的角度对本技术实施例提供的方案进行了介绍。可以理解的是为了实现上述功能，包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到，结合本技术中所公开的实施例描述的各示例的模块及算法步骤，本技术能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本技术的范围。
[0071]
本技术实施例可以根据上述方法示例对装置进行功能模块的划分，例如，可以对应各个功能划分各个功能模块，也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。需要说明的是，本技术实施例中对模块的划分是示意性的，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。
[0072]
下面对本技术实施例中的道路地物识别装置进行详细描述，图7为本技术实施例中提供的道路地物识别装置的一个实施例示意图。如图7所示，该道路地物识别装置可以包括获取单元701和处理单元702。
[0073]
其中，获取单元701用于获取待识别的多光谱遥感图像；处理单元702，用于对待识
别的多光谱遥感图像进行预处理，得到第一图像；处理单元702，用于将第一图像作为n个目标基分类模型的输入，以获取n个目标基分类模型针对第一图像进行预测得到的n个第一分类结果，其中，n个目标基分类模型中的每个目标基分类模型分别以获取图像样本的预测分类结果为训练目标，以预设图像尺寸的图像样本为训练数据进行迭代训练处理后得到的机器学习模型，n≥2、且n为整数；处理单元702，用于将n个第一分类结果作为目标集成分类模型的输入，得到待识别的多光谱遥感图像的目标分类结果，其中，目标集成分类模型是以n个目标基分类模型对图像样本进行预测后得到的n个分类结果、以及图像样本的标注标签为训练数据进行迭代训练处理后得到的机器学习模型。
[0074]
在一些可选的示例中，处理单元702用于：根据预设图像尺寸对待识别的多光谱遥感图像进行图像切割处理，得到n个切割图像集，n个切割图像集中的任意两个切割图像集中的切割图像互不重叠；根据每个切割图像集中的正负切割图像样本的比例对对应的切割图像集进行采样处理，得到采样后的切割图像集；对采样后的切割图像集进行主成分分析pca处理，得到第一图像。
[0075]
在另一些可选的示例中，获取单元701用于获取采样后的切割图像集对应的图像矩阵，图像矩阵用于指示采样后的切割图像集中的切割图像的排列情况；处理单元702用于：计算图像矩阵对应的均值向量和协方差矩阵，以及与协方差矩阵对应的正交矩阵；基于均值向量以及正交矩阵对采样后的切割图像集进行主分量变换处理，得到主分量变换图像；对主分量变换图像进行主分量逆变换处理，得到采样后的切割图像集中切割图像的目标主成分，以得到第一图像。
[0076]
在另一些可选的示例中，处理单元702用于：在对采样后的切割图像集进行主成分分析pca处理，得到第一图像之前，基于预设去噪模型对采样后的切割图像集中的每个切割图像进行去噪处理，得到去噪处理后的切割图像；对去噪处理后的切割图像进行主成分分析pca处理，得到第一图像。
[0077]
在另一些可选的示例中，获取单元701还用于：获取n个分类结果以及图像样本的标注标签，n个分类结果为n个目标基分类模型对图像样本分别进行预测后得到的分类结果；处理单元702还用于：基于预设逻辑回归模型对n个分类结果以及图像样本的标注标签进行处理，得到n个目标权重，其中，每个目标权重用于指示对应的分类结果的贡献程度；基于n个目标权重对初始集成分类模型进行迭代训练处理，得到目标集成分类模型。
[0078]
在另一些可选的示例中，获取单元701还用于：获取预设图像尺寸的图像样本；处理单元702还用于：基于预设处理模型对预设图像尺寸的图像样本进行处理，得到图像样本的预测分类结果；获取图像样本的预测分类结果和预设标签之间的差异，得到目标损失值；基于目标损失值对初始基分类模型进行迭代训练，得到目标基分类模型。
[0079]
上面从模块化功能实体的角度对本技术实施例中的道路地物识别装置进行描述，下面从硬件处理的角度对本技术实施例中的道路地物识别装置进行描述。图8是本技术实施例提供的道路地物识别装置的结构示意图。该道路地物识别装置可因配置或性能不同而产生比较大的差异。该道路地物识别装置可以至少一个处理器801，通信线路807，存储器803以及至少一个通信接口804。
[0080]
处理器801可以是一个通用中央处理器(central processing unit，cpu)，微处理器，特定应用集成电路(application-specific integrated circuit，服务器ic)，或一个
或多个用于控制本技术方案程序执行的集成电路。
[0081]
通信线路807可包括一通路，在上述组件之间传送信息。
[0082]
通信接口804，使用任何收发器一类的装置，用于与其他装置或通信网络通信，如以太网，无线接入网(radio access network，ran)，无线局域网(wireless local area networks，wlan)等。
[0083]
存储器803可以是只读存储器(read-only memory，rom)或可存储静态信息和指令的其他类型的静态存储装置，随机存取存储器(random access memory，ram)或者可存储信息和指令的其他类型的动态存储装置，存储器可以是独立存在，通过通信线路807与处理器相连接。存储器也可以和处理器集成在一起。
[0084]
其中，存储器803用于存储执行本技术方案的计算机执行指令，并由处理器801来控制执行。处理器801用于执行存储器803中存储的计算机执行指令，从而实现本技术上述实施例提供的道路地物识别的方法。
[0085]
可选的，本技术实施例中的计算机执行指令也可以称之为应用程序代码，本技术实施例对此不作具体限定。
[0086]
在具体实现中，作为一种实施例，该道路地物识别装置可以包括多个处理器，例如图8中的处理器801和处理器802。这些处理器中的每一个可以是一个单核(single-cpu)处理器，也可以是一个多核(multi-cpu)处理器。这里的处理器可以指一个或多个装置、电路、和/或用于处理数据(例如计算机程序指令)的处理核。
[0087]
在具体实现中，作为一种实施例，该道路地物识别装置还可以包括输出设备805和输入设备806。输出设备805和处理器801通信，可以以多种方式来显示信息。输入设备806和处理器801通信，可以以多种方式接收目标对象的输入。例如，输入设备806可以是鼠标、触摸屏装置或传感装置等。
[0088]
上述的该道路地物识别装置可以是一个通用装置或者是一个专用装置。在具体实现中，该道路地物识别装置可以是服务器、终端等或有图8中类似结构的装置。本技术实施例不限定该道路地物识别装置的类型。
[0089]
需说明，图8中的处理器801可以通过调用存储器803中存储的计算机执行指令，使得道路地物识别装置执行如图2至图3对应的方法实施例中的方法。
[0090]
具体的，图7中的处理单元702的功能/实现过程可以通过图8中的处理器801调用存储器803中存储的计算机执行指令来实现。图7中的获取单元701的功能/实现过程可以通过图8中的通信接口804来实现。
[0091]
在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。
[0092]
所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。
[0093]
在本技术所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或
通信连接，可以是电性，机械或其它的形式。
[0094]
作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0095]
另外，在本技术各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。
[0096]
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本技术各个实施例方法的全部或部分步骤。而前述的存储介质包括：u盘、移动硬盘、只读存储器(read-only memory，rom)、随机存取存储器(random access memory，ram)、磁碟或者光盘等各种可以存储程序代码的介质。
[0097]
上述实施例，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现，当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。
[0098]
计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机执行指令时，全部或部分地产生按照本技术实施例的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一计算机可读存储介质传输，例如，计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(dsl))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机可读存储介质可以是计算机能够存储的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，dvd)、或者半导体介质(例如ssd))等。
[0099]
以上实施例仅用以说明本技术的技术方案，而非对其限制；尽管参照前述实施例对本技术进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本技术各实施例技术方案的精神和范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：申炎仃刘亮史中强胡敬良
技术所有人：腾讯科技（深圳）有限公司
我是此专利的发明人

上一篇：一种难分解的固体废料再利用方法及装置与流程
上一篇：一种面食加工一体机的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。