一种自适应特征权重合成的lidar数据地物精确分类方法

文档序号:9708790阅读:749来源:国知局
一种自适应特征权重合成的lidar数据地物精确分类方法
【技术领域】
[0001 ]本发明属于遥感数据地物分类领域,具体为一种自适应特征权重合成的LIDAR数 据地物精确分类方法。
【背景技术】
[0002] 利用机载LIDAR系统获得的遥感数据实现地物的精确分类能够应用数字城市建 设、城区管理、自然灾害调查等领域,具有广阔的应用前景。LIDAR系统可以快速、主动地获 取大范围地物密集采样点的三维信息,通过处理分析点云高度,强度及波形等信息,能够得 到高精度数字高程模型。同时,光谱相机获取的相同场景的多光谱图像具备丰富的光谱和 纹理信息,弥补了传统摄影测量技术获取地物信息单一的缺陷。与被动遥感技术相比,基于 LIDAR的地物分类很大程度上排除了大气分子和气溶胶的影响,三维点云和多光谱图像数 据从不同的侧面表达了地物丰富的信息,将两者包含的地物特征信息融合进行地物分类, 增强了对地物目标的识别和解译能力,明显提高单一数据源遥感地物分类的精度,为行业 具体应用决策提供更真实可靠的基础信息,如城市违建处置过程的证据快速、可靠获取等。
[0003] 基于机载LIDAR系统的地物分类通常包括样本采集、特征提取与选择、模型选择、 分类器训练与结果评估等过程。其中特征提取与选择是关键一环,与分类器有着紧密的联 系。目前,一般是将描述地物高程的三维LIDAR点云与表面材质的强度信息转化为图像,结 合光谱信息利用监督学习算法完成LIDAR地物分类。常用的分类算法主要包括人工神经网 络(ANN)、支持向量机(SVM)、最大似然(ML)、决策树(DT)与随机森林(RF)等。Li Guo等利用 随机森林初步讨论了特征重要性,用对分类结果影响较大的特征替代原有的特征参与分 类,一定程度上提升了算法的运行效率,但简单替代特征的做法否认了某些特征对分类的 贡献,损失了部分地物信息。吴军等利用SVM估计单个特征对分类精度影响程度并计算不同 特征的权重,然后组合差异特征进行SVM训练和分类,但仅考虑了不同特征在分类中的重要 性差异,没有考虑不同特征分类结果的冲突所包含的信息。以上的两个研究代表了机载 LIDAR系统数据地物分类的重要研究内容,但其分类结果的精度有待进一步提高。在实际工 程中,不同类型特征不仅对分类精度影响程度不同,而且不可避免地存在冲突。由于某个或 少数证据间的完全冲突或严重冲突,而传统证据合成规则一般不考虑冲突证据的信息,可 能导致推理结果出现较严重悖论,从而影响分类精度。实际上即使证据之间存在着冲突,其 包含的信息也是部分可用的。在不改变规则的前提下修改证据源模型方面的研究中, Murphy提出了一种处理冲突的方法,但是其没有考虑到各个证据间的相关性,只是简单的 平均,对提高分类精度具有一定的局限。

【发明内容】

[0004] 本发明综合研究机载LIDAR系统数据不同类型特征在遥感地物分类中的重要性差 异与证据合成中的冲突证据信息,提出了一种自适应特征权重合成的LIDAR数据地物精确 分类方法。首先对实验图像进行充分特征信息提取,根据特征的物理意义与包含地物信息 的差异,构建高程、光谱、强度与纹理特征子集;其次在随机森林框架下分析不同特征子集 在地物分类过程中的重要性差异,计算各特征子集的重要性测度,获得每个像元对各类地 物的类别隶属度;然后综合利用特征子集重要性测度与基于证据冲突计算的权重系数,对 各个特征子集构成的多证据源合成;最后根据合成结果采用投票决策规则实现地物精确分 类,并采用有效的空间限制策略优化初分类结果。
[0005] 本发明一种自适应特征权重合成的LIDAR数据地物精确分类方法包括以下具体步 骤:
[0006] S1:获得LIDAR系统的点云数据和光谱相机拍摄的多光谱数据,并进行中值滤波预 处理;
[0007] S2:提取LIDAR系统数据特征,根据物理意义和地物信息区别构建高程特征子集 Ti、光谱特征子集T 2、强度特征子集T3和纹理特征子集T4;
[0008] S3:随机选择样本进行训练,基于随机森林框架计算各个特征子集的重要性测度 Fj,计算各像元对各类地物的类别隶属度mj (Αι);
[0009] S4:基于特征重要性测度与证据冲突权重的随机森林自适应权重合成方法实现特 征子集证据合成;
[0010] S5:根据证据合成结果,采用最大投票决策规则决策,确定各像元的类别属性,获 得初分类结果;
[0011] S6:对初分类结果中易被错分或漏分的混淆像元(包括树冠中心与墙面点)采用空 间邻域限制策略实现分类结果的优化;
[0012] S7:输出分类结果及分类性能指标。
[0013] 其中步骤S3所述的基于随机森林框架计算各个特征子集的重要性测度匕,计算各 像元对各类地物的类别隶属度叫(M ),主要包括以下步骤:
[0014] S32:计算各个特征子集的重要性测度,
[0015] 6 = 1/(/) Π)
[0016]其中Tj表示j特征子集,j = l,2,. . .,Μ,本例中Μ=4;
[0017] S33:根据各个特征子集计算各个像元对各个地物类别的隶属程度
[0018]⑷
/
[0019] 其中Μ为将某像元判定为1类的焦元,ntrew为特征子集j随机森林的决策树数目, treeij为根据特征子集j像元属于1类的决策树数目。
[0020] 步骤S4所述的基于特征重要性测度与证据冲突权重的随机森林自适应权重合成 方法实现特征子集证据合成,按以下步骤进行:
[0021] S43:计算证据Ei的冲突权重系数
[0022]
[0023] S44:根据^和特征子集重要性测度构造总权重系数并进行归一化
[0024] 。
[0025] 本发明与现有技术相比具有以下优点:
[0026] 1、本发明提取LIDAR系统数据的特征构建四个特征子集,随机选择样本构建随机 森林框架,获得了各个特征子集的重要性测度,减少了随机森林根据单个特征重要性程度 简单替代的特征信息损失,充分利用了不同类型的地物信息,同时也作为后续证据合成的 多个证据源。
[0027] 2、本发明在进行证据合成时,根据证据间的冲突程度适时调整描述证据的权重系 数,综合研究特征重要测度与基于冲突信息的证据权重两个不同层面自适应计算不同证据 的权重系数,能够在某特征重要测度较高但分类结果与其它特征存在较大冲突的情况下, 全面地利用不同类型的特征子集以及冲突证据包含的地物信息,反之亦然,提高了机载 LIDAR数据地物的分类精度。
【附图说明】
[0028]图1为本发明的流程图;
[0029] 图2为实验特征图像,(a)强度;(b)高度差;(c)近红外波段;(d)伪彩色图;
[0030] 图3为不同特征集实现的分类结果,(a)高程特征子集;(b)光谱特征子集;(c)强度 特征子集;(d)纹理特征子集;
[0031] 图4为证据合成前后分类结果,(a)全特征集随机森林;(b)本发明合成方法;
[0032] 图5为初分类结果优化后分类结果(a)优化后;(b)地面真值。
【具体实施方式】
[0033]本发明实验数据由TopoSys公司采用光纤扫描方式的Falcon Π传感器采集,航高 约600m,平均激光脚点密度和点间距分别为4点/m2和0.5m,被配准为0.5m空间分辨率。光谱 数据包括蓝、绿、红和近红外等四个波段,高程数据包括首末次回波高程。被测区域具有典 型的城市地貌,真实数据由人工获取,作为地面真值。具体实施步骤如下:
[0034]如图1所示,S1:获得LIDAR系统的点云数据和光谱相机拍摄的多光谱数据,并进行 中值滤波预处理;
[0035] S2:提取LIDAR系统数据特征,根据物理意义和地物信息区别构建高程特征子集 Ti、光谱特征子集T2、强度特征子集T3和纹理特征子集T4,具体步骤如下:
[0036] S21:提取高程特征子集h,包括3种特征,分别为LIDAR首次回波、末次回波与高程 差。首次归一化数字表面模型(nDSMk)反映去除地形影响的地物绝对高度,由DSM与DEM衍生 而来,数字表面模型(DSM)表达了地表所有地物(如植被、建筑物)的高度信息,数字高程模 型(DEM)只包含地球自然表面的高程值(即裸地数字高程模型),高程差(HD)用于区分激光 可穿透地物与不可穿透地物,由首次回波nDSMf e与末次回波nDSMie相差来实现。
[0037] S22:提取光谱特征子集T2,包括6种特征,分别为多光谱图像的红、绿、蓝、近红外4 个波段灰度值口^口^^^口~^以及通过波段间的运算生成的衍生光谱特征归一化植被指数 (NDVI)和修正型土壤调节植被指数(MSAVI)。
[0038] S23:提取激光回波强度特征子集Τ3,包含1种特征一激光回波强度(IN)描述地物 材质以及地物表面不规则程度,当激光落在不同的物体表面时,其反射的强度值会有很大 的差别,其受多种因素的影响,包括物体表面材料的性质,回波数、激光发射点到入射点的 距离以及入射角等。
[0039] S24:提取纹理特征子集T4,包括6种特征,分别为3种高程纹理与3种光谱纹理特 征,高程纹理特征基于高程信息获取其灰度共生矩阵(GLCM)局部纹理测度角二阶矩 (ASM1)、熵(ΕΝΤ1)与惯性矩(Η1),
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1