一种基于云平台的遥感影像分割方法

文档序号:10489346阅读:382来源:国知局
一种基于云平台的遥感影像分割方法
【专利摘要】本发明公开了一种基于云平台的遥感影像分割方法,其通过构建特征样本库,基于特征样本对不同卫星的不同传感器分别进行训练生成对应的算法模型;处理过程首先根据用户提供的卫星号、传感器号以及拍摄日期到构建好的遥感影像数据库中进行搜索,找到对应的遥感影像;然后根据卫星号和传感器号以及用户所选择的算法在算法模型库中挑选出对应的算法模型,利用算法模型对相应的遥感影像特征数据进行处理,最后再将处理好的遥感影像存放到HBase当中。因此,本发明利用HBase的键值对特性以及Spark基于内存计算的特性来对遥感影像数据进行分割处理,具有较强的扩展性,对于遥感影像处理的应用具有很好的实用价值。
【专利说明】
一种基于云平台的遥感影像分割方法
技术领域
[0001] 本发明属于数据存储与处理技术领域,具体涉及一种基于云平台的遥感影像分割 方法。
【背景技术】
[0002] 随着遥感技术以及高分辨率卫星技术的发展,高分辨率遥感影像数据的规模和复 杂性在飞速增长,当今社会对高分辨率遥感卫星数据的存储和处理需求也越来越大。由于 遥感影像数据由于不同卫星和传感器所生产的数据格式、数据特征也有一定的差异性,这 给遥感影像数据的存储以及处理都带来了一定的困难,随着卫星运行时间的增长数据量也 在不断的增长给存储带来了许多挑战,同时也给遥感影像数据资源的共享与数据产品的分 发带来了巨大的困难,使得遥感影像数据的传输和管理面临新的挑战。随着中国高分辨率 卫星技术的不断发展,高分1号、高分2号卫星的发射,高分辨率遥感影像的数量也在不断增 长,国内对于遥感影像数据存储的需求也十分急切。为了解决这一问题,目前海量遥感影像 的存储均采用分布式存储系统。
[0003] 遥感影像的分割是遥感数据分析和信息提取的重要工具,一直是遥感领域的研究 热点。目前对遥感影像进行分割多采用机器学习算法进行处理,主要包括监督学习的方法, 例如决策树,和非监督学习的方法,例如KMeans。由于遥感影像数据具有格式多样性、类型 丰富、数据海量的特点,在进行特征提取、分类等工作时,会带来很大的困难。传统的机器学 习方法都是采用单机模式进行处理,尽管目前服务器性能普遍提高,但对海量的遥感影像 数据进行处理仍然很费力。另外,传统的遥感影像处理方法一般是采用串行的方式对单张 遥感影像进行处理,此类方法对于数量较少、数据量较小的遥感影像较为适用,但面对海量 高分辨率遥感影像时就显得无能为力。

【发明内容】

[0004] 针对现有技术所存在的上述技术问题,本发明提供了一种基于云平台的遥感影像 分割方法,利用了云平台的可扩展性和并行性方面的优势,可以处理海量的遥感影像数据。
[0005] -种基于云平台的遥感影像分割方法,包括如下步骤:
[0006] (1)收集来自不同卫星不同传感器所拍摄的遥感影像,并对这些遥感影像中的各 类区域(如城市、河流、森林、农村等)进行人工标记;
[0007] (2)对于任一卫星上的任一传感器,对由该传感器所拍摄的遥感影像进行特征提 取以得到多组特征样本,基于所述的特征样本从机器学习库Spark Mllib中任取一种分类 算法进行训练以得到关于该传感器遥感影像区域划分的分割模型;依此遍历所有卫星、所 有传感器以及所有分类算法,以得到多个分割模型并存储于算法模型库内;
[0008] (3)创建遥感影像数据库,采集来源于不同卫星不同传感器以及不同拍摄时间的 遥感影像存储于所述的遥感影像数据库内;
[0009] (4)根据用户的处理请求从遥感影像数据库中查找所要处理的遥感影像,从算法 模型库中查找所要选用的分割模型;进而对所要处理的遥感影像进行特征提取,并将得到 的特征数据输入至所要选用的分割模型中以得到分割后的遥感影像。
[0010] 所述的特征样本存储于特征样本库内,特征样本包括遥感影像各像素点的特征信 息(包含像素点各通道的值)以及各像素点关于区域的人工标记信息。
[0011] 所述步骤(2)中采用分类算法进行训练的过程以特征样本的特征信息作为分割模 型的输入,以特征样本的人工标记信息作为分割模型的输出进行学习。
[0012] 所述的步骤(2)在构建算法模型库时,由于Spark MLlib提供多种分类算法,选择 其中几种算法对特征样本库中的样本进行训练,生成算法模型;构建算法模型库时利用了 Spark基于内存计算的优势,加快了处理速度。
[0013] 优选地,所述的遥感影像数据库采用分布式存储系统HBase;可以利用HBase键值 对特征解决因为不同卫星、不同传感器拍摄的遥感影像数据异构存储问题,同时也能快速 查找到所需的数据,同时具有很强的存储扩展性。
[0014] 所述的步骤(3)中创建遥感影像数据库时,根据遥感影像来源的卫星、传感器以及 拍摄时间创建遥感影像数据库的列簇、列和行键,并使所述的列簇对应遥感影像所来源的 卫星,所述的列对应遥感影像所来源卫星上的传感器,所述的行键对应遥感影像的拍摄时 间。
[0015] 所述的处理请求包括待分割遥感影像所来源的卫星编号、传感器编号、拍摄时间 以及所要采用分割模型对应的分类算法名称。
[0016] 所述步骤(4)的具体实现过程如下:
[0017]首先,根据用户处理请求中的卫星编号、传感器编号以及拍摄时间从遥感影像数 据库的原始遥感影像数据表中去查找列簇为卫星编号,列为传感器编号,行键为拍摄时间 的遥感影像;根据用户处理请求中的卫星编号、传感器编号以及分类算法名称从算法模型 库中查找所要选用的分割模型;
[0018] 然后,对查找到的遥感影像进行特征提取,并将得到的特征数据输入至所要选用 的分割模型中以得到分割后的遥感影像;
[0019] 最后,将分割后的遥感影像存储于遥感影像数据库的处理后遥感影像数据表中, 对应列簇为卫星编号,列为传感器编号,行键为拍摄时间_分类算法名称的位置。
[0020] 传统的对遥感影像进行分割的方法是基于单机处理的方法,面对海量数据具有明 显缺陷;而本发明基于云平台的遥感影像处理方法利用了云平台的可扩展性的优势,可以 处理海量的遥感影像数据,具体优势体现如下:
[0021] (1)本发明利用HBase来存储遥感影像数据对于遥感影像时空检索具有很好的使 用价值:一方面可以很好地利用HBase的键值对特性存储各种异构的遥感影像数据,满足不 同的存储需求;另一方面可以很好地利用HBase的键值对特性快速访问遥感影像数据。 [0022] (2)Spark作为一个具有内存计算特性的平台,集成了MLlib库,便于进行机器学习 算法的处理,本发明利用Spark Mllib对遥感影像数据进行处理,能够加快对遥感影像的处 理速度。
【附图说明】
[0023]图1为本发明基于云平台的遥感影像分割方法流程示意图。
[0024] 图2为遥感影像训练样本库及算法模型库的构建示意图。
【具体实施方式】
[0025] 为了更为具体地描述本发明,下面结合附图及【具体实施方式】对本发明的技术方案 进行详细说明。
[0026]本实例在具体处理某个待分割的遥感影像数据前,需要先构建该分割处理模型, 构建过程包括:
[0027] 步骤1:创建遥感数据存储数据库:首先根据卫星号、传感器号分别作为存储遥感 影像原始数据表的列簇和列创建表,表结构如表1所示:
[0028] 表 1
[0030] 然后根据待存储的遥感影像数据的卫星号、传感器号和拍摄日期将该遥感影像数 据存储到对应位置;以遥感影像GF1_PMS1_E119·0_N31·9_20130712_L2A0000121522-MSSl. tiff为例,该遥感影像的拍摄卫星是GFl、传感器是PMSl、拍摄日期是2013-07-12,所 以将该遥感影像数据存放到原始遥感影像数据表中列簇为GF1、列为PMS1、行键为20130712 的位置。同时创建处理后遥感影像数据表,创建过程跟上述过程类似,不再赘述,表结构如 表2所示:
[0031] 表2
[0033] 步骤2:创建遥感影像样本特征库,分别提取不同卫星不同传感器拍摄的遥感影像 中的实物样本并标记。以卫星GFl、传感器PMSl为例,手动提取GFl、PMS1拍摄的遥感影像中 的城市、农村、河流、森林等实物的样本点,并手动标记,然后将训练样本存放到样本库中。
[0034] 在构建样本库时,因为不同卫星不同传感器拍摄的遥感影像数据特征不同,所以 需要对不同卫星不同传感器所拍的数据进行特征提取,提取出影像中的城市、河流、森林、 农村等区域的像素点并标记存放到样本库,如图2所示。
[0035] 步骤3:创建遥感影像算法模型库。以Spark Mllib中Decision Tree训练卫星GF1、 传感器PMSl卫星拍摄的遥感影像为例,到样本特征库中找到卫星GF1、传感器PMSl拍摄的遥 感影像训练数据的样本点,调用Spark MLlib中Decision Tree训练得到一个模型,即GF1_ PMSlDecisionTree模型,然后将该训练好的模型存放到算法模型库中,如图2所示。
[0036]至此,算法模型构建完毕。
[0037]接下来是对遥感影像进行分割的部分。当用户发送处理请求时,以用户需要利用 Decision Tree处理遥感影像GF1_PMS1_E119·0_N31·9_20130712_L2A0000121522-MSSl. tiff为例;如图1所示,具体实施过程分为以下步骤:
[0038]步骤1:首先,根据该遥感影像的名字,可以得到遥感影像所拍摄的卫星为GFMf 感器为PMSl,以及拍摄时间为2013-07-12,然后根据遥感影像所拍摄的卫星GF1、传感器 PMSl以及拍摄日期2013-07-12到HBase数据库原始遥感影像数据表中去寻找列簇为GFl,列 为PMSl,行键为2013-07-12所对应的遥感影像数据rs_data,该数据即为待处理的遥感影 像。
[0039]步骤2:根据遥感影像所拍摄的卫星GFl、传感器PMSl以及用户请求使用的算法 Decision Tree到算法模型库中提取出训练好的算法模型GFl_PMSl_DecisionTree,我们暂 且称为a Igorithm 〇
[0040] 步骤3 :首先根据卫星号GFl,传感器号PMSl,拍摄日期2013-07-12和处理算法 DecisionTree到处理后遥感影像数据表中去查找是否存在处理好的数据,如果存在,直接 返回结果,如果不存在,则进行处理。处理时,用算法模型algorithm对遥感影像数据rs_ data进行处理,得到分割后的遥感影像rs_data',将处理好的遥感影像数据存放到HBase数 据库中的处理后遥感影像数据表中,此时,该处理后的数据应该放在该表中列簇为GFljO 为 PMS1,行键为 2013-07-12_DecisonTree 的位置。
[0041] 上述的对实施例的描述是为便于本技术领域的普通技术人员能理解和应用本发 明。熟悉本领域技术的人员显然可以容易地对上述实施例做出各种修改,并把在此说明的 一般原理应用到其他实施例中而不必经过创造性的劳动。因此,本发明不限于上述实施例, 本领域技术人员根据本发明的揭示,对于本发明做出的改进和修改都应该在本发明的保护 范围之内。
【主权项】
1. 一种基于云平台的遥感影像分割方法,包括如下步骤: (1) 收集来自不同卫星不同传感器所拍摄的遥感影像,并对这些遥感影像中的各类区 域进行人工标记; (2) 对于任一卫星上的任一传感器,对由该传感器所拍摄的遥感影像进行特征提取以 得到多组特征样本,基于所述的特征样本从机器学习库Spark Mllib中任取一种分类算法 进行训练以得到关于该传感器遥感影像区域划分的分割模型;依此遍历所有卫星、所有传 感器以及所有分类算法,以得到多个分割模型并存储于算法模型库内; (3) 创建遥感影像数据库,采集来源于不同卫星不同传感器以及不同拍摄时间的遥感 影像存储于所述的遥感影像数据库内; (4) 根据用户的处理请求从遥感影像数据库中查找所要处理的遥感影像,从算法模型 库中查找所要选用的分割模型;进而对所要处理的遥感影像进行特征提取,并将得到的特 征数据输入至所要选用的分割模型中以得到分割后的遥感影像。2. 根据权利要求1所述的遥感影像分割方法,其特征在于:所述的特征样本存储于特征 样本库内,特征样本包括遥感影像各像素点的特征信息以及各像素点关于区域的人工标记 信息。3. 根据权利要求2所述的遥感影像分割方法,其特征在于:所述步骤(2)中采用分类算 法进行训练的过程以特征样本的特征信息作为分割模型的输入,以特征样本的人工标记信 息作为分割模型的输出进行学习。4. 根据权利要求1所述的遥感影像分割方法,其特征在于:所述的遥感影像数据库采用 分布式存储系统HBase。5. 根据权利要求1所述的遥感影像分割方法,其特征在于:所述的步骤(3)中创建遥感 影像数据库时,根据遥感影像来源的卫星、传感器以及拍摄时间创建遥感影像数据库的列 簇、列和行键,并使所述的列簇对应遥感影像所来源的卫星,所述的列对应遥感影像所来源 卫星上的传感器,所述的行键对应遥感影像的拍摄时间。6. 根据权利要求1所述的遥感影像分割方法,其特征在于:所述的处理请求包括待分割 遥感影像所来源的卫星编号、传感器编号、拍摄时间以及所要采用分割模型对应的分类算 法名称。7. 根据权利要求6所述的遥感影像分割方法,其特征在于:所述步骤(4)的具体实现过 程如下: 首先,根据用户处理请求中的卫星编号、传感器编号以及拍摄时间从遥感影像数据库 的原始遥感影像数据表中去查找列簇为卫星编号,列为传感器编号,行键为拍摄时间的遥 感影像;根据用户处理请求中的卫星编号、传感器编号以及分类算法名称从算法模型库中 查找所要选用的分割模型; 然后,对查找到的遥感影像进行特征提取,并将得到的特征数据输入至所要选用的分 割模型中以得到分割后的遥感影像; 最后,将分割后的遥感影像存储于遥感影像数据库的处理后遥感影像数据表中,对应 列簇为卫星编号,列为传感器编号,行键为拍摄时间_分类算法名称的位置。
【文档编号】G06K9/34GK105844230SQ201610161519
【公开日】2016年8月10日
【申请日】2016年3月22日
【发明人】陈华钧, 张松阳, 张晓兵, 罗丹, 郑国轴
【申请人】浙江大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1