基于深度学习的石油设施遥感自动识别方法及装置与流程

文档序号:16538502发布日期:2019-01-08 20:07阅读:506来源:国知局
基于深度学习的石油设施遥感自动识别方法及装置与流程

本申请涉及数字图像识别技术领域,尤其是涉及一种基于深度学习的石油设施遥感自动识别方法及装置。



背景技术:

随着卫星遥感技术的不断发展,高分辨率遥感影像数据急剧增加,目前很多在轨的遥感卫星可提供海量的亚米级卫星遥感影像数据,从而丰富了地物细节信息。对于油区地区,有效地利用这些遥感影像对油田的勘探开发部署、油田环境监测、地面工程规划都具有重要意义。例如可以基于遥感影像识别石油设施等。

在本文中,上述石油设施主要指井场。石油设施在油田分布广泛、数量繁多,自动识别难度大,这主要是由于石油设施属于复合目标,包含罐体、抽油机、平整土表、围栏、人工建筑等多种目标,无法像单一目标通过光谱特征直接判别,同时,石油设施特征因开采类型、开采方式和开采区域环境特征不同而不同,如石油开采区和天然气开采区的井场内设施构成与分布不同,稠油开采区和非稠油开采区的设施特征不同,不同环境条件油区的石油设施的平面形状有不同的特点,这使得无法从单纯的形态学特征中寻找到一种模式来匹配遥感图像中的石油设施,石油设施属于具有多种类型特征的复合目标,需要考虑井场自身的结构化特征,通过纹理、几何、空间分布特征,结合专家知识等综合信息进行识别;此外,由于石油设施所采用的建筑材料不同、建筑物所在区域海拔高度不同、受太阳直射的角度不同等因素的影响,遥感图像在成像上会产生如反射、阴影遮挡等干扰现象,相同目标在不同海拔高度区域成像特征存在变异,增加信息提取难度。所以目前石油设施的提取多采用人工目视解译的方法。但人工识别方法耗时耗力,容易漏检,难以适应海量数据的检测需求,从遥感数据到知识的有效转化是目前所面临的最大挑战。因此研究基于海量遥感影像的石油设施自动识别算法成为了当前迫切的需求。



技术实现要素:

本申请实施例的目的在于提供一种基于深度学习的石油设施遥感自动识别方法及装置,以实现遥感数据中的石油设施自动识别。

为达到上述目的,一方面,本申请实施例提供了一种基于深度学习的石油设施遥感自动识别方法,包括:

将油田区域的遥感数据所述遥感数据转换成多幅图像;

确定所述多幅图像中至少包含一处石油设施的图像,并形成图像数据集;

将所述图像数据集中的第一部分图像作为训练样本,并对预设的初始深度学习模型进行训练,获得识别模型;

将所述图像数据集中的第二部分图像作为测试样本输入所述识别模型,如果获得测试结果满足预设条件,则将所述识别模型作为石油设施识别模型;

获取待识别油田区域的遥感数据,并将所述遥感数据转换成待识别图像;

基于所述石油设施识别模型对所述待识别图像进行识别处理,获得识别结果。

本申请实施例的基于深度学习的石油设施遥感自动识别方法,所述图像数据集中的每幅图像具有对应的标记文件,所述标记文件包含对应石油设施的类别及归一化位置信息。

本申请实施例的基于深度学习的石油设施遥感自动识别方法,所述初始深度学习模型包括yolov2模型。

本申请实施例的基于深度学习的石油设施遥感自动识别方法,在所述对预设的初始深度学习模型进行训练的过程中,根据预设的调参策略调整yolov2模型的大小、随机性、学习速率及最大迭代次数。

本申请实施例的基于深度学习的石油设施遥感自动识别方法,所述根据预设的调参策略调整yolov2模型的大小、随机性、学习速率及最大迭代次数,包括:

预先将随机性的值设置为1,当模型达到预设的收敛程度时,调整随机性的值为0;

根据内存容限调整大小的值;

预先将学习速率的值设置为第一上限值,当模型达到预设的收敛程度时,调整学习速率的值为下限值;

预先将最大迭代次数的值设置为第二上限值,当模型达到预设的收敛程度时,调整最大迭代次数为指定值,所述指定值小于所述第二上限值。

本申请实施例的基于深度学习的石油设施遥感自动识别方法,所述预设条件包括:

所述测试结果的正确率大于预设第一阈值;

所述测试结果的误检率小于预设第二阈值;且

所述测试结果的漏检率小于预设第三阈值。

本申请实施例的基于深度学习的石油设施遥感自动识别方法,所述将油田区域的遥感数据所述遥感数据转换成多幅图像,包括:

将油田区域的遥感数据进行多波段与全色波段brovey数据融合;

对brovey数据融合后的遥感数据进行正射校正,并通过指定通道合成真彩色的遥感图像;

基于全局标准差图像增强方法对所述遥感图像进行图像增强,在此基础上,基于局部截距图像增强方法对增强后的遥感图像再次进行图像增强;

将图像增强后的遥感图像镶嵌融合成瓦片数据;

对所述瓦片数据进行多空间分辨率采样;

对多空间分辨率采样后的瓦片数据进行多时相同时采样,获得多幅图像。

本申请实施例的基于深度学习的石油设施遥感自动识别方法,在所述获取待识别油田区域的遥感数据,并将所述遥感数据转换成待识别图像之后,还包括:

将待识别图像的均匀划分为多个图像块;相邻图像块之间存在指定宽度的重叠区域;

相应的,在所述获得识别结果之后,还包括:

按照预设的空间运算规则对识别结果进行合并运算。

本申请实施例的基于深度学习的石油设施遥感自动识别方法,所述空间运算规则包括:

目标相交取并集;以及

目标包含取大者。

另一方面,本申请实施例还提供了一种基于深度学习的石油设施遥感自动识别装置,包括:

第一图像获取模块,用于将油田区域的遥感数据所述遥感数据转换成多幅图像;

第二图像获取模块,用于确定所述多幅图像中至少包含一处石油设施的图像,并形成图像数据集;

识别模型训练模块,用于将所述图像数据集中的第一部分图像作为训练样本,并对预设的初始深度学习模型进行训练,获得识别模型;

识别模型测试模块,用于将所述图像数据集中的第二部分图像作为测试样本输入所述识别模型,如果获得测试结果满足预设条件,则将所述识别模型作为石油设施识别模型;

第三图像获取模块,用于获取待识别油田区域的遥感数据,并将所述遥感数据转换成待识别图像;

图像目标提取模块,用于基于所述石油设施识别模型对所述待识别图像进行识别处理,获得识别结果。

由以上本申请实施例提供的技术方案可见,本申请实施例首先将油田区域的遥感数据遥感数据转换成多幅图像;其次确定多幅图像中至少包含一处石油设施的图像,并形成图像数据集;其次将图像数据集中的第一部分图像作为训练样本,并对预设的初始深度学习模型进行训练,获得识别模型;然后将图像数据集中的第二部分图像作为测试样本输入识别模型,如果获得测试结果满足预设条件,则将识别模型作为石油设施识别模型;然后获取待识别油田区域的遥感数据,并将遥感数据转换成待识别图像;然后基于石油设施识别模型对待识别图像进行识别处理,获得识别结果;从而实现了遥感数据中的石油设施自动识别。本申请实施例在海量数据场景下,尤其适用。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。在附图中:

图1为本申请一实施例中基于深度学习的石油设施遥感自动识别方法的流程图;

图2为本申请一实施例中构建的部分遥感数据样本库;

图3为本申请一实施例中识别出的石油设施的分布图;

图4为本申请一实施例中基于深度学习的石油设施遥感自动识别装置的结构框图;

图5为本申请另一实施例中基于深度学习的石油设施遥感自动识别装置的结构框图。

具体实施方式

为了使本技术领域的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。例如在下面描述中,在第一部件上方形成第二部件,可以包括第一部件和第二部件以直接接触方式形成的实施例,还可以包括第一部件和第二部件以非直接接触方式(即第一部件和第二部件之间还可以包括额外的部件)形成的实施例等。

而且,为了便于描述,本申请一些实施例可以使用诸如“在…上方”、“在…之下”、“顶部”、“下方”等空间相对术语,以描述如实施例各附图所示的一个元件或部件与另一个(或另一些)元件或部件之间的关系。应当理解的是,除了附图中描述的方位之外,空间相对术语还旨在包括装置在使用或操作中的不同方位。例如若附图中的装置被翻转,则被描述为“在”其他元件或部件“下方”或“之下”的元件或部件,随后将被定位为“在”其他元件或部件“上方”或“之上”。

参考图1所示,本申请实施例的基于深度学习的石油设施遥感自动识别方法可以包括以下步骤:

s101、将油田区域的遥感数据所述遥感数据转换成多幅图像。

在本申请实施例中,鉴于遥感数据具有多谱段、多时相、多空间分辨率的特征,为便于后续的石油设施识别处理,可将将油田区域的遥感数据所述遥感数据转换成多幅图像(例如jpg格式图像等)。

在本申请一实施例中,所述将油田区域的遥感数据所述遥感数据转换成多幅图像可以包括如下步骤:

1)、将油田区域的遥感数据进行多波段与全色波段brovey数据融合。

2)、对brovey数据融合后的遥感数据进行正射校正,并通过指定通道合成真彩色的遥感图像。在一示例性实施例中,例如可通过3、2、1通道将brovey数据融合后的gf2遥感数据合成真彩色的遥感图像。

其中,所述brovey数据融合可以包括以下步骤:

21)、从遥感图像中获取多光谱波段图像和全色波段图像;

22)、对所述多光谱波段图像进行几何配准,以使所述多光谱波段图像与所述全色波段图像保持几何一致性;

23)、将几何配准后的多光谱波段图像的分辨率调整至与所述全色波段图像的分辨率相同;

24)、从调整分辨率后的多光谱波段图像中选出第一待融合区域,并从所述全色波段图像中选出第二待融合区域,所述第一待融合区域与所述第二待融合区域为相同图像区域;

25)、根据所述多光谱波段图像中的与所述全色波段图像的全色波段范围重叠的多光谱波段构建模拟全色波段;

26)、将所述第一待融合区域除以所述模拟全色波段进行标准化;

27)、将标准化后的第一待融合区域与所述第二待融合区域相乘,以将所述第二待融合区域的图像信息按比例分布到所述标准化后的第一待融合区域上,获得融合结果;

28)、对所述融合结果进行三基色合成及显示。

3)、基于全局标准差图像增强方法对所述遥感图像进行图像增强,在此基础上,基于局部截距图像增强方法对增强后的遥感图像再次进行图像增强;以便于突出石油设施,而弱化其他地物。

4)、将图像增强后的遥感图像镶嵌融合成瓦片数据。在一示例性实施例中,所述瓦片数据例如可以为mbtiles格式。

5)、对所述瓦片数据进行多空间分辨率采样。在一示例性实施例中,多空间分辨率采样的最大分级可以为18级,对应的最小分辨率可以为0.6米。

6)、对多空间分辨率采样后的瓦片数据进行多时相同时采样,获得多幅图像。

s102、确定所述多幅图像中至少包含一处石油设施的图像,并形成图像数据集。

在步骤s101中所获得油田区域的多幅图像中,可能会有有一些并不包含任何石油设施,为便于模型训练及模型测试,可将这部分不包含任何石油设施的图像删除,余下的图像则至少包含一处石油设施的图像(图像是否包含石油设施例如可以基于专家知识等进行标识),从而形成图像数据集(例如图2所示)。在本申请一实施例中,所述图像数据集中的每幅图像可具有对应的标记文件。例如在一示例性实施例中,图像数据集共包含8717张图像(jpg格式),图像文件大小为640*640,图像命名可以是从0000.jpg到8716.jpg。在本申请另一实施例中,除了文件名外,所述标记文件还可以包含对应石油设施的类别及归一化位置信息;石油设施的类别可用以标识石油设施的类别,而归一化位置信息可用于指示石油设施在图像中所处的位置。

在本申请一实施例中,图像数据集中的图像数据可以包括不同开采类型、不同开采方式、不同开采区地貌和/或不同海波高度的油田区域,以便于呈现不同的复合特征,从而建立多模态的样本库。

s103、将所述图像数据集中的第一部分图像作为训练样本,并对预设的初始深度学习模型进行训练,获得识别模型。

在本申请一实施例中,可通过随机选择的方式从图像数据集中选择一部分图像作为训练样本。在一示例性实施例中,可从总共包含8717张图像的图像数据集中随机选择其中6974幅图像作为训练样本,共包含石油设施23783处;而余下的1743幅则可以作为测试样本,共包含石油设施5870处。

在本申请一实施例中,在对预设的初始深度学习模型进行训练的过程中,还可以根据预设的调参策略调整yolov2模型的大小、随机性、学习速率及最大迭代次数。在一示例性实施例中,所述根据预设的调参策略调整yolov2模型的大小、随机性、学习速率及最大迭代次数,例如可以包括:

1)、预先将随机性的值设置为1,当模型达到预设的收敛程度时,调整随机性的值为0;当随机性的值为1时,表示模型收敛速度为随机模式,这种模式下模型收敛速度快,但模型精度稍差。当随机性的值为0时,表示模型收敛速度为固定值模式,这种模式下模型精度相对较高,但模型收敛速度偏慢。为了提高训练效率且兼顾模型精度,可以预先将随机性的值设置为1,当模型达到预设的收敛程度时,再调整随机性的值为0。

2)、根据内存容限调整大小的值;在内存不溢出的情况下大小的值可应尽可能大。在一示例性实施例中,以大小为640*640的图像文件为例,可以设置大小的值均为640。

3)、预先将学习速率的值设置为第一上限值(即将学习速率的值设置为较大值,训练模型在快速收敛),当模型达到预设的收敛程度时,调整学习速率的值为下限值;在一示例性实施例中,模型开始震荡,此时可调小学习速度为下限值0.0001。

4)、预先将最大迭代次数的值设置为第二上限值(即最大迭代次数应设置尽可能大),当模型达到预设的收敛程度时,调整最大迭代次数为指定值,所述指定值小于所述第二上限值。在本申请实施例中,根据收敛程度模型训练随时可以停止。

在本申请一实施例中,实施本申请实施例的基于深度学习的石油设施遥感自动识别方法之前,可以预先搭建训练环境。其中,训练框架和识别模型的选择是构成训练环境搭建的两大要素。针对目前开源的深度学习框架,在综合考虑可操作性、可扩展性、软硬件环境、是否有遥感应用案例的基础上,可以选择caffe框架。对于目标识别深度学习模型,综合考虑速度快、准确率高的基础上,可以选择yolov2模型。在一示例性实施例中,caffe框架可选择开源的且可在windows系统运行的caffe框架,如果开源的caffe框架为linux程序,还可以对其进行改造,以可在windows系统运行。此外,所选的开源的caffe框架应支持gpu和cpu运算,支持c++、python、matlab等进行二次开发,从而搭建了便于开展yolov2模型目标识别的深度学习训练环境。

s104、将所述图像数据集中的第二部分图像作为测试样本输入所述识别模型,如果获得测试结果满足预设条件,则将所述识别模型作为石油设施识别模型。

在本申请一实施例中,可以利用预先准备好的测试样本对训练好的识别模型,以检验其性能。如果获得测试结果满足预设条件,则将所述识别模型作为石油设施识别模型。在本申请一实施例中,所述预设条件可以包括:所述测试结果的正确率大于预设第一阈值;所述测试结果的误检率小于预设第二阈值;且所述测试结果的漏检率小于预设第三阈值。其计算公式及含义如下:

a、正确率=检测相关目标个数/(检测相关目标个数+检测不相关目标个数)*100%;

b、误检率=检测不相关目标个数/(检测相关目标个数+检测不相关目标个数)*100%;

c、漏检率=未检测出相关目标个数/相关目标总个数*100%。

在一示例性实施例中,图3示出了基于本申请实施例获得的石油设施分布图,结果表明,本申请实施例能够正确识别大部分石油设施,并且能够检测出由于人为因素目视解译遗漏的检测点。在下表1中列出了运用本申请实施例石油设施识别检测和人工目视识别检测的正确率、误检率和漏检率的对比。

表1

可以看出,虽然基于本申请实施例获得的识别结果(例如图3所示)相对于人工目视的识别结果误检率偏高,但其效率更高且漏检率低,而且能够正确识别89%的目标点。因此,在海量数据场景下,非常实用。

在本申请另一实施例中,所述预设条件也可以根据需要采用其他标准,例如可以石油设施的平均准确率达到预设的准确率阈值(例如84%等),本申请对此不作限定。

s105、获取待识别油田区域的遥感数据,并将所述遥感数据转换成待识别图像。

s106、基于所述石油设施识别模型对所述待识别图像进行识别处理,获得识别结果。

在本申请另一实施例中,在所述获取待识别油田区域的遥感数据,并将所述遥感数据转换成待识别图像之后,还可以包括:

将待识别图像的均匀划分为多个图像块;相邻图像块之间存在指定宽度的重叠区域;相应的,在所述获得识别结果之后,还可以按照预设的空间运算规则对识别结果进行合并运算。在一示例性实施例中,所述空间运算规则可以包括:目标相交取并集;以及目标包含取大者。

参考图4所示,本申请实施例的一种基于深度学习的石油设施遥感自动识别装置可以包括:

第一图像获取模块41,可以用于将油田区域的遥感数据所述遥感数据转换成多幅图像;

第二图像获取模块42,可以用于确定所述多幅图像中至少包含一处石油设施的图像,并形成图像数据集;

识别模型训练模块43,可以用于将所述图像数据集中的第一部分图像作为训练样本,并对预设的初始深度学习模型进行训练,获得识别模型;

识别模型测试模块44,可以用于将所述图像数据集中的第二部分图像作为测试样本输入所述识别模型,如果获得测试结果满足预设条件,则将所述识别模型作为石油设施识别模型;

第三图像获取模块45,可以用于获取待识别油田区域的遥感数据,并将所述遥感数据转换成待识别图像;

图像目标提取模块46,可以用于基于所述石油设施识别模型对所述待识别图像进行识别处理,获得识别结果。

参考图5所示,本申请实施例的另一种基于深度学习的石油设施遥感自动识别装置,包括存储器、处理器、以及存储在所述存储器上的计算机程序,所述计算机程序被所述处理器运行时执行如下步骤:

将油田区域的遥感数据所述遥感数据转换成多幅图像;

确定所述多幅图像中至少包含一处石油设施的图像,并形成图像数据集;

将所述图像数据集中的第一部分图像作为训练样本,并对预设的初始深度学习模型进行训练,获得识别模型;

将所述图像数据集中的第二部分图像作为测试样本输入所述识别模型,如果获得测试结果满足预设条件,则将所述识别模型作为石油设施识别模型;

获取待识别油田区域的遥感数据,并将所述遥感数据转换成待识别图像;

基于所述石油设施识别模型对所述待识别图像进行识别处理,获得识别结果。

虽然上文描述的过程流程包括以特定顺序出现的多个操作,但是,应当清楚了解,这些过程可以包括更多或更少的操作,这些操作可以顺序执行或并行执行(例如使用并行处理器或多线程环境)。

为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中,计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flashram)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitorymedia),如调制的数据信号和载波。

还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法或者设备中还存在另外的相同要素。

本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1