一种遥感影像的模型自训练和优化系统的制作方法

文档序号:26007955发布日期:2021-07-23 21:27阅读:166来源:国知局
一种遥感影像的模型自训练和优化系统的制作方法

本发明涉及遥感影像应用领域,具体涉及一种遥感影像的模型自训练和优化系统。



背景技术:

遥感影像是指记录各种地物电磁波大小的胶片或照片,主要分为航空像片和卫星相片,本专利中涉及的遥感影像为卫星获取影像。遥感技术具备以下优势:(1)探测范围广、采集数据快,能在较短的时间内,从空中对大范围地区进行对地观测,并从中获取有价值的遥感数据;(2)能动态反映地面事物的变化,能周期性、重复地对同一地区进行对地观测,这有助于人们通过所获取的遥感数据,发现并动态地跟踪地球上许多事物的变化以及研究自然界的变化规律;(3)获取的数据具有综合性,综合展现了地球上许多自然与人文现象,宏观地反映了地球上各种事物的形态与分布,真实地体现了地质、地貌、土壤、植被、水文、人工构筑物等地物的特征,全面地揭示了地理事物之间的关联性。并且这些数据在时间上具有相同的现势性。

遥感影像主要用于军事侦察、国土资源调查、城市觃划和交通导航等领域,研究目标包括自然资源、飞机、船舶、车辆、道路、港口和各种建筑物等。当前遥感图像研究主要存在以下困难:(1)遥感图像视距大导致图像分辨率大,对于图像中较小尺寸的目标在大视点角度下,导致遥感图像小目标检测比较困难;(2)常见图像中的目标大多都是水平的,在拍摄遥感图像时,目标的旋转不变性也是一个重要的问题;(3)遥感图像的背景相当复杂。目前,基于深度学习的遥感图像检测正致力于解决这些问题,本发明提供了一种能够快速准确的基于遥感影像建立自训练模型和模型优化的系统。



技术实现要素:

本发明所要解决的技术问题在于:为了解决遥感图像视距大导致图像分辨率大,对于图像中较小尺寸的目标在大视点角度下,导致遥感图像小目标检测比较困难;常见图像中的目标大多都是水平的,在拍摄遥感图像时,目标的旋转不变性也是一个重要的问题;遥感图像的背景相当复杂的问题,因此提供了一种遥感影像的模型自训练和优化系统。

本发明是通过以下技术方案解决上述技术问题的,本发明包括模型训练系统、模型预测系统和模型优化系统;

所述模型训练系统用于用户自主选择预置模型,并创建满足自身场景需求的模型,在上传、标注图片后进行模型训练,训练完成后即进行预测服务的上线;

所述模型预测系统基于完成训练的模型,用户调用相关的api接口,上传遥感影像对该区域地物的分割、检测;

所述模型优化系统用于将检测的遥感影像作为训练样本再次投入到模型训练中,即从模型的训练到预测再到模型的优化,形成一个完整产品闭环;

所述模型训练系统包括以下步骤:

s1:数据采集:

针对遥感影像三大应用方向:斜框检测、地类分割和变化检测,建立不同的数据集,为保证样本数据的代表性和多样性,分别选择预设的五种分辨率的遥感影像,并分别按照省份区域选择预设省级区域内的预设面积的遥感影像,提高模型的泛化能力;

s2:数据标注的具体过程如下:

ss1:斜框检测模型的数据标注支持矩形框标注方式,按照标注对象外包框标进行矩形框的绘制;

标注对象包括:耕地、林地、草地、大棚、体育馆、火车站、飞机场、一般建筑、公园、池塘、水库、天然湖、高尔夫球场、操场共计14种常用统计地物;每一类地物类型按照影像分辨率等比例均匀选择;

ss2:地类分割模型的数据标注支持多边形、折线、涂抹、交互式分割多种标注方式,将土地地类按照预设规则划分为耕地、园地、林地、草地、商服用地、工矿仓储用地、住宅用地、公共管理与公共服务用地、特殊用地、交通运输用地、水域及水利设施用地和其他土地;

ss3:变化检测模型模型的数据标注支持多边形、折线、涂抹、交互式分割多种标注方式,标注对象为耕地、草地、水体、道路、建筑、林园地、裸土、人工堆掘地、施工地和构筑物地类之间的互相变化,并标注变化类型,并且针对建筑类,当前后两期影像建筑存在结构上的变化时,进行标注,因影像时态产生的影像变化,在地类不改变的情况下,不予标注;

s3:模型构建:基于标注好的影像数据进行高维度的问题抽象和解决,构建features和label之间的隐含关系,通过参数调整,特征优化以进行效果表达,通过目标函数的拟合,生呈最终数据;

所述模型预测系统内容如下:

模型预测系统采用的评估包括:准确率、精确率、f值、auc、ndcg,通过评估指标用于调整模型的参数,除以测试集进行模型预测外,以大量未标注遥感影像进行abtest以验证模型;

在abtest过程中,新上的模型往往由于其不确定性,初始给予较小的流量进行效果测试,当其效果优于base组模型,则分配更多的流量;

所述模型优化系统的具体内容如下:

模型优化的过程机对模型和数据进行迭代升级的过程,影像因素包括:基础数据、构造特征、算法选择、实验策略、排序结果及前端位置展示;

在应用算法模型的整个过程中,利用abtest实验,利用大量遥感数据的分割、检测结果,进行人工优化,加入到训练集中,通过逐步的训练迭代获取结果。

优选的,所述线上系统包括运行在电脑端的可视化交互界面以及运行在服务器linux端的安全管理引擎、数据管理引擎、模型训练引擎,模型应用引擎,所述建立算法模型通过gpu服务器进行模型训练,底层开发技术为paddleclass、paddledetection和paddleseg。

优选的,所述步骤s3模型构建中,采用的算法包括基于loss值的提前终止法、对遥感影像执行翻转、旋转、裁剪、变形和缩放等操作的数据增强法、在一定的概率上随机让一部分神经元不工作的dropout办法相结合的方式避免模型过拟合。

优选的,所述地类分割模型采用的通用语义分割任务的网络结构包括:deeplabv3+、pspnet与ocrnet,全部采用了考虑上下文信息的方法,根据miou分数,选择融合ocr(backbone为hrnet-w64)与deeplabv3+(back-bone为resnet101)作为最终的地类分割模型。

优选的,所述变化检测模型采用fpnres-unet模型,该模型适用于处理遥感影像中不同尺寸的物体或不同分辨率遥感影像的多尺度问题,将影像的浅层细节信息和深层语义信息融合,该模型以unet为基础,并且为了使输入和输出影像的尺寸相同,在每一次卷积后使用边界填充;

在编码路径中,用resnet18的残差结构替换unet所有卷积层来提取影像特征,在解码路径每级上采样的过程中添加支路径,将fpn融合到模型的网络主干中,通过预测上采样步骤中每个尺度不同的分类结果,优化unet模型只对原始分辨率层输出的不足,在反向传播和权重更新中利用多尺度信息,将各层的特征图用于独立预测,充分利用各层的特征进行建筑物的变化检测。

本发明相比现有技术具有以下优点:该遥感影像的模型自训练和优化系统,基于深度卷积神经网络的目标检测技术,解决了现有技术人工识别统计效率低下,无法满足社会生产效率提升的需求,为一线作业人员进行地类分割和统计,变化检测图斑提取提供一种高效率的手段,为行政部门提供快速及时的决策提供技术支撑,实现了遥感影像的三大应用方向:斜框检测、地类分割和变化检测从数据上传、标注,到模型训练、测试、发布的全自动流程,无需使用者具有任何编程能力,更加便捷值得推广使用。

附图说明

图1是本发明的系统框图图。

具体实施方式

下面对本发明的实施例作详细说明,本实施例在以本发明技术方案为前提下进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。

如图1所示,本实施例提供一种技术方案:一种遥感影像的模型自训练和优化系统,包括所述系统包括模型训练、模型预测和模型优化三部分。特征描述如下:

所述模型训练系统允许用户自主选择在预置模型的基础上创建满足自身场景需求的模型,在上传、标注图片后进行模型训练,训练完成后即可实现预测服务的上线;

所述模型预测系统基于完成训练的模型,用户调用相关的api接口,上传遥感影像即可完成对该区域地物的分割、检测;

所述模型优化系统应用于将检测的遥感影像作为训练样本再次投入到模型训练中,以此来不断提升模型的准确率,即从模型的训练到预测再到模型的优化,形成一个完整的产品闭环。通过此方式,用户可结合生产的实际情况,不断地优化模型直到模型能满足用户实际的预测需求。

所述模型训练系统包括以下步骤:

s1:数据采集

针对遥感影像三大应用方向:斜框检测、地类分割和变化检测,建立不同的数据集,为保证样本数据的代表性和多样性,分别选择0.3m、0.5m、0.8m、1m、2m五种分辨率的遥感影像,并分别按照省份区域选择北京市、黑龙江省、吉林省、内蒙古自治区、河北省、河南省、湖北省等十五个省级区域共计23万平方公里的遥感影像,提高模型的泛化能力。

s2:数据标注

a、斜框检测模型的数据标注支持矩形框标注方式,按照标注对象外包框标进行矩形框的绘制。注对象包括:耕地、林地、草地、大棚、体育馆、火车站、飞机场、一般建筑、公园、池塘、水库、天然湖、高尔夫球场、操场共计14种常用统计地物。每一类地物类型按照影像分辨率等比例均匀选择。

b、地类分割模型的数据标注支持多边形、折线、涂抹、交互式分割多种标注方式,将土地地类按照《第三次全国国土调查技术规程》划分为耕地、园地、林地、草地、商服用地、工矿仓储用地、住宅用地、公共管理与公共服务用地、特殊用地、交通运输用地、水域及水利设施用地和其他土地共计12种。

c、变化检测模型模型的数据标注支持多边形、折线、涂抹、交互式分割多种标注方式,标注对象为耕地、草地、水体、道路、建筑、林园地、裸土、人工堆掘地、施工地和构筑物共计10种地类之间的互相变化,并标注变化类型。并且针对建筑类,当前后两期影像建筑存在结构上的变化时,也需要标注出来。因影像时态产生的影像变化,在地类不改变的情况下,不予标注。

s3:模型构建

基于标注好的影像数据进行高维度的问题抽象和解决,旨在构建features和label之间的隐含关系,通过参数调整,特征优化以追求更好的效果表达。通过目标函数的拟合,追求最小的误差和最佳的效果。

所述模型预测系统内容如下:

模型预测系统采用的评估指标有:准确率、精确率、f值、auc、ndcg。通过评估指标来调整模型的参数以达到离线最优的效果,除以测试集进行模型预测外,以大量未标注遥感影像进行abtest以验证模型的优劣。在abtest过程中,新上的模型往往由于其不确定性,初始给予较小的流量进行效果测试,如果效果优于base组模型,则会分配更多的流量,以追求线上整体效果的最优。

所述模型优化系统内容如下:

模型优化的过程是对模型和数据进行迭代升级的过程,影像因素包括:基础数据、构造特征、算法选择、实验策略、排序结果及前端位置展示。在应用算法模型的整个过程中,响应的每个动作都会影响模型的效果表达,除算法和特征的着重考虑外,引入其他非数据算法方面的影响,充分利用abtest实验,利用大量遥感数据的分割、检测结果,进行人工优化,加入到训练集中,通过逐步的训练迭代提高模型准召率。

所述自训练和优化系统基于线上系统运行,所述线上系统包括运行在电脑端的可视化交互界面以及运行在服务器linux端的安全管理引擎、数据管理引擎、模型训练引擎,模型应用引擎,所述建立算法模型通过gpu服务器进行模型训练,底层开发技术为paddleclass、paddledetection和paddleseg。

所述步骤s3模型构建中,采用(1)基于loss值的提前终止法;(2)对遥感影像执行翻转、旋转、裁剪、变形和缩放等操作的数据增强法;(3)在一定的概率上随机让一部分神经元不工作的dropout办法相结合的方式避免模型过拟合。

所述地类分割模型采用了三种在通用语义分割任务中性能较好的网络结构:deeplabv3+、pspnet与ocrnet。全部采用了考虑上下文信息的方法。根据miou分数,选择融合ocr(backbone为hrnet-w64)与deeplabv3+(back-bone为resnet101)作为最终的地类分割模型。

所述变化检测模型采用fpnres-unet模型,该模型适用于处理遥感影像中不同尺寸的物体或不同分辨率遥感影像的多尺度问题,将影像的浅层细节信息和深层语义信息充分融合。该模型以unet为基础,并且为了使输入和输出影像的尺寸相同,在每一次卷积后使用边界填充。在编码路径中,用resnet18的残差结构替换unet所有卷积层来提取影像特征,在解码路径每级上采样的过程中添加支路径,将fpn融合到模型的网络主干中,通过预测上采样步骤中每个尺度不同的分类结果,优化unet模型只对原始分辨率层输出的不足。因此,可以在反向传播和权重更新中利用多尺度信息,将各层的特征图用于独立预测,充分利用各层的特征进行建筑物的变化检测。

此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1