基于面向对象影像特征的地理本体建模与语义推理方法与流程

文档序号:12064834阅读:487来源:国知局
基于面向对象影像特征的地理本体建模与语义推理方法与流程

本发明涉及空间信息共享领域,尤其涉及一种基于面向对象影像特征的地理本体建模与语义推理方法。



背景技术:

空间信息系统已经从单机版快速发展到空间信息网格,随着空间信息集成度的提高和不同领域空间信息共享和互操作的需求越来越迫切,凸显出几个亟待解决的问题。其中,难度最大的是空间信息语义表达不一致问题,而空间信息语义网格的核心问题,是如何解决不同领域的地理本体系统之间的语义推理问题。

目前在空间信息领域,往往借助信息系统领域的研究方法讨论地理本体建模,但存在如下问题:

(1)在表达空间数据的多尺度方面存在缺陷;

(2)不同领域对同一类地理实体命名方法的不同及描述地理本体概念的特征属性集的差异,使其各自得到的无法顺利通过信息科学中的基于概念(特征)推理理论进行语义互操作。

面对以上两个关键问题,急需一种地理本体建模和语义推理方法,实现基于语义的空间信息集成和互操作。



技术实现要素:

本发明要解决的技术问题在于针对现有技术中多尺度表达不足,无法通过基于概念的推理理论进行语义互操作的缺陷,提供一种基于面向对象影像特征的地理本体建模与语义推理方法。

本发明解决其技术问题所采用的技术方案是:

本发明提供一种基于面向对象影像特征的地理本体建模与语义推理方法,包括以下步骤:

S1、获取研究地段的高分辨率遥感影像,对高分辨率遥感影像进行预处理和多尺度分割,建立影像对象层次结构;

S2、根据影像对象层次结构进行领域划分,并对每个领域进行地类划分;根据高分辨率遥感影像的遥感特征值,包括光谱特征值和形状特征值,对每个领域的不同地类进行地理本体建模,得到不同领域的地理本体;

S3、对不同领域的地理本体,计算各个地类的遥感特征值的值域;并计算不同地类的值域之间的交集;若两个值域之间存在交集,则计算两个值域之间的并集,以及交集占并集的百分比;

S4、根据交集的大小,建立领域内的地类的语义关联,以及不同领域之间的地类的语义关联。

进一步地,本发明的步骤S1中对高分辨率遥感影像进行预处理的方法包括:几何校正、大气校正和裁剪拼接。

进一步地,本发明的步骤S2中对每个领域的不同地类进行地理本体建模的方法为:

S21、地类确定:根据领域的分类标准,对不同地类进行划分;

S22、最优分割尺寸选择:对各个地类选择其对应的最优分割尺寸;

S23、地类样本选择:在各个地类的最优分割尺寸下选择地类样本,该地类样本包括同类像元组成的遥感对象和掺杂了其他类型像元的遥感对象,增加地类样本的覆盖面使后期分析的精度达到最大;

S24、计算属性统计表:对每个地类样本,计算其光谱和形状统计值,统计每个属性值的最大值、次大值、最小值和次小值,得到每个地类样本的属性统计表;

S25、计算值域范围:对每个地类样本的各个属性值,用次大值和次小值之间的范围作为地类样本在该属性上的值域;

S26、统计值域图:根据所有地类样本的值域范围统计结果,按属性进行统计,即统计每个属性值上不同地类的属性值域,并做出值域图;

S27、值域图统计规则:根据值域图,针对具体的地类,在所有属性中选择出与其他地类区别最大的属性,以此属性值值域进行筛选,剔除一部分干扰,重复此步骤,增加属性数目,进一步剔除干扰;

S28、建立地理本体:根据统计的属性规则,建立该领域的地理本体。

进一步地,本发明的步骤S22中选择最优分割尺寸的方法包括:最大面积法,均值方差法和目标函数法。

进一步地,本发明的步骤S24中的属性包括:归一化植被指数、郁闭度、边界指数、亮度、长宽比、第一波段光谱均值和形状指数。

进一步地,本发明的步骤S2中得到不同领域的地理本体后,把不同领域的地理本体映射到同一个遥感影像层次结构中。

进一步地,本发明的步骤S3中的遥感特征值包括:红波段均值,最大光谱差值、红波段比值、归一化植被指数、对比度、相关性和能量。

进一步地,本发明的步骤S4中建立语义关联包括直接语义关联和间接语义关联。

进一步地,本发明的判断直接语义关联的方法为:

若两个地类的某个遥感特征值的交集为空集,则这两个地类之间没有语义关联关系;

若两个地类的所有遥感特征值的值域均相交,且值域之间存在包含关系,则这两个地类之间为上下义关系;

若两个地类的所有遥感特征值的值域均相交,且存在交集占并集的百分比小于10%,则这两个地类之间没有语义关联关系;

若两个地类的所有遥感特征值的值域均相交,且存在交集占并集的百分比大于10%且小于80%,则这两个地类之间为语义相似关系;

若两个地类的所有遥感特征值的值域均相交,且存在交集占并集的百分比大于80%,则这两个地类之间为同义关系。

进一步地,本发明的判断间接语义关联的方法为:

若两个地类之间为同义关系,则其中任意一个地类的上层地类,与另一个地类之间为上下义关系。

本发明产生的有益效果是:本发明的基于面向对象影像特征的地理本体建模与语义推理方法,根据面向对象的多尺度分割技术把不同领域地理本体系统的概念映射到同一个遥感影像层次结构中进行地理本体建模,并在此基础上通过不同地类的特征属性值域之间的关系初步确定彼此的语义关系,然后在多维空间中确定语义逻辑联系,实现不同地理本体系统之间语义集成和互操作,从而推动空间信息社会化的进程;并最大限度地减少基础空间数据重复采集带来的沉重投资压力,在一定程度上消除不同领域空间信息系统的孤岛效应。

附图说明

下面将结合附图及实施例对本发明作进一步说明,附图中:

图1是本发明实施例的方法流程图;

图2是本发明实施例的各地类样本的边界指数属性值域图;

图3是本发明实施例的林业地类本体树;

图4是本发明实施例的地理本体概念和多尺度遥感影像对象的关系。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。

如图1所示,本发明实施例的基于面向对象影像特征的地理本体建模与语义推理方法,包括以下步骤:

S1、获取研究地段的高分辨率遥感影像,对高分辨率遥感影像进行预处理和多尺度分割,建立影像对象层次结构;预处理的方法包括:几何校正、大气校正和裁剪拼接等。

S2、根据影像对象层次结构进行领域划分,并对每个领域进行地类划分;根据高分辨率遥感影像的遥感特征值,包括光谱特征值和形状特征值,对每个领域的不同地类进行地理本体建模,得到不同领域的地理本体;得到不同领域的地理本体后,把不同领域的地理本体映射到同一个遥感影像层次结构中。

对每个领域的不同地类进行地理本体建模的方法为:

S21、地类确定:根据领域的分类标准,对不同地类进行划分;

S22、最优分割尺寸选择:对各个地类选择其对应的最优分割尺寸;选择最优分割尺寸的方法包括:最大面积法,均值方差法和目标函数法。

S23、地类样本选择:在各个地类的最优分割尺寸下选择地类样本,该地类样本包括同类像元组成的遥感对象和掺杂了其他类型像元的遥感对象,增加地类样本的覆盖面使后期分析的精度达到最大;

S24、计算属性统计表:对每个地类样本,计算其光谱和形状统计值,统计每个属性值的最大值、次大值、最小值和次小值,得到每个地类样本的属性统计表;属性包括:归一化植被指数、郁闭度、边界指数、亮度、长宽比、第一波段光谱均值和形状指数。

S25、计算值域范围:对每个地类样本的各个属性值,用次大值和次小值之间的范围作为地类样本在该属性上的值域;

S26、统计值域图:根据所有地类样本的值域范围统计结果,按属性进行统计,即统计每个属性值上不同地类的属性值域,并做出值域图;

S27、值域图统计规则:根据值域图,针对具体的地类,在所有属性中选择出与其他地类区别最大的属性,以此属性值值域进行筛选,剔除一部分干扰,重复此步骤,增加属性数目,进一步剔除干扰;

S28、建立地理本体:根据统计的属性规则,建立该领域的地理本体。

S3、对不同领域的地理本体,计算各个地类的遥感特征值的值域;并计算不同地类的值域之间的交集;若两个值域之间存在交集,则计算两个值域之间的并集,以及交集占并集的百分比;遥感特征值包括:红波段均值,最大光谱差值、红波段比值、归一化植被指数、对比度、相关性和能量。

S4、根据交集的大小,建立领域内的地类的语义关联,以及不同领域之间的地类的语义关联。

建立语义关联包括直接语义关联和间接语义关联。

判断直接语义关联的方法为:

若两个地类的某个遥感特征值的交集为空集,则这两个地类之间没有语义关联关系;

若两个地类的所有遥感特征值的值域均相交,且值域之间存在包含关系,则这两个地类之间为上下义关系;

若两个地类的所有遥感特征值的值域均相交,且存在交集占并集的百分比小于10%,则这两个地类之间没有语义关联关系;

若两个地类的所有遥感特征值的值域均相交,且存在交集占并集的百分比大于10%且小于80%,则这两个地类之间为语义相似关系;

若两个地类的所有遥感特征值的值域均相交,且存在交集占并集的百分比大于80%,则这两个地类之间为同义关系。

判断间接语义关联的方法为:

若两个地类之间为同义关系,则其中任意一个地类的上层地类,与另一个地类之间为上下义关系。

在本发明的另一个具体实施例中:

基于面向对象影像特征的地理本体建模与语义推理方法,具体步骤如下:

数据获取:获取研究地段的高分辨率遥感影像。

数据预处理:对获取的遥感影像数据进行预处理,包括几何校正、大气校正、裁剪拼接等。

遥感影像多尺度分割:利用目前已有的支持面向对象遥感影像分类的专业软件对影像进行多尺度分割,建立影像对象层次结构。

基于光谱和形状特征进行地理本体建模:通过面向对象多尺度分割,形成了由不同遥感对象构成一个多层次体系,在此基础上,通过遥感影像对象的光谱和形状特征对不同类型的遥感对象进行建模。具体过程如下:(1)地类确定:根据较为完善和业内广泛认可的领域分类标准,结合研究区域实际情况,选择其中涉及到的地类。(2)最优分割尺度选择:根据所研究的地类,选择其对应的最优分割尺度,最优分割尺度的选择一般有最大面积法,均值方差法,目标函数法等。(3)样本选择:在各个地类最优分割尺度下,各地类选择其代表性的样本,样本选择以完全由同类像元组成的遥感对象为主,同时兼顾部分掺杂了其他类型像元的遥感对象,在保障后期分析的精度的情况下,尽量增加样本的覆盖面。(4)按类统计样本属性值,得到每个地类的属性统计表:对于每个地类,计算其光谱和形状统计值,统计每个属性值的最大值、次大值、最小值、次小值。(5)确定每一地类每一属性值值域范围:用各地类属性的次最大和次最小值作为地类在该属性上的值域。选择属性的次最大和次最小值是为了防止在选择样本时可能会有人为的误差,将其它地类选为样本。一般情况下不同的地类光谱差异较大,若将其它地类误选为研究地类的样本,则该样本的光谱值就不在研究地类的值域内。因此,为了减小误差将次最大值和次最小值作为地类在属性上的值域。(6)统计每个属性值上不同地类的属性值域:根据所有地类的值域范围统计结果,按属性进行统计,即统计每个属性值上不同地类的属性值域,并做出值域图。(7)值域图统计规则:根据值域图,针对具体的地类,在所有属性中选择出与其他地类区别最大的属性,以此属性值值域进行筛选,剔除一部分干扰,重复此步骤,增加属性数目,进一步剔除干扰地块。直至取得较好效果。(8)建立地理本体:根据统计的属性规则,建立该领域地理本体。

不同领域地理本体系统构建:利用面向对象的多尺度分割技术在一幅固定分辨率的遥感影像上构造出在不同分割尺度下的影像对象层次结构,按照上述地理本体建模步骤,把不同领域地理本体系统的概念映射到同一个遥感影像层次结构中。

影像光谱特征值计算:针对所研究的不同领域的地理本体,选取某些具有代表性的对象,计算其红波段均值,最大光谱差值,红波段比值,归一化植被指数,对比度,相关性,能量等六个影像特征值,最终得出每个特征值的值域。

建立领域对象同种特征属性的交集:各领域的地类之间,通过其基于遥感特征集的值域,计算彼此之间的交集。若在各个特征值上均存在交集,则再计算两两之间的并集,并求出交集值域占并集值域的百分比。

建立领域本体内以及本体间的概念间的语义联系:特征属性上其值域有相交或包含关系可以映射出不同尺度的影像对象存在语义关联,结合上述建立的属性交集,建立领域本体内以及本体间的概念间的语义联系。语义关联分为直接语义关联和间接语义关联两种,具体推理步骤如下:

(1)直接语义关联:有如下语义推理规则:

①如果A领域a地类与B领域的b类在某个光谱特征值上交集为空集,则可以确定这a,b这两种地类没有语义关系;

②如果A领域a地类B领域b地类在所有光谱特征值上均相交,如果特征集间存在包含关系,则可以确定其为上下义关系;如果特征集间存在交集占并集的比重小于10%,则可以确定a,b这两种地类间没有语义关系;如果特征集间存在交集占并集的比重大于10%且小于80%,则可以确定a,b这两种地类间为语义相似关系;如果特征集间存在交集占并集的比重大于80%,则为同义关系。

(2)间接语义关联:根据直接语义关联推理规则,若推理出A领域的a地类与B领域的b地类为同义关系;则A领域中a地类的上层对象c与b地类为上下义关系,且B领域中b地类的上层对象d与a地类也为上下义关系。

在本发明的另一个具体实施例中,基于面向对象影像特征的地理本体建模与语义推理方法,具体步骤如下:

步骤S1,数据获取:获取研究地段的高分辨率遥感影像,本实例获取的是杭州市西湖区的高分辨率影像为实验数据。

步骤S2,数据预处理:利用地理信息系统专业软件(ARCGIS、ENVI等)对获取的遥感影像数据进行预处理,包括几何校正、大气校正、裁剪拼接等。

步骤S3,遥感影像多尺度分割:利用目前已有的支持面向对象遥感影像分类的专业软件(如eCognication、ENVI、Erdas等)对影像进行多尺度分割,建立影像对象层次结构,本实例使用的eCognication软件。

步骤S4,基于光谱和形状特征进行地理本体建模:通过面向对象多尺度分割,形成了由不同遥感对象构成一个多层次体系,在此基础上,通过遥感影像对象的光谱和形状特征对不同类型的遥感对象进行建模。具体过程如下:(1)地类确定:根据较为完善和业内广泛认可的领域分类标准,结合研究区域实际情况,选择其中涉及到的地类,本实例以林业领域分类标准为例进行介绍,林业部门土地类型有:有林地、灌木林地、乔木林地、疏林地、城乡居民建设用地、交通建设用地(道路)、湖泊水面、河流水面、其他用地等。(2)最优分割尺度选择:根据所研究的地类,选择其对应的最优分割尺度,最优分割尺度的选择一般有最大面积法,均值方差法,目标函数法等。本实例使用的是基于分维方法确定各地类的最优分割尺度。以下表1是林业领域地类对应的最佳分割尺度示例表:

表1林业领域地类对应的最佳分割尺度示例表

(3)样本选择:在各个地类最优分割尺度下,各地类选择其代表性的样本,样本选择以完全由同类像元组成的遥感对象为主,同时兼顾部分掺杂了其他类型像元的遥感对象,在保障后期分析的精度的情况下,尽量增加样本的覆盖面。(4)按类统计样本属性值:得到每个地类的属性统计表;对于每个地类,统计每个属性值的最大值、次大值、最小值、次小值。本实例中属性有NDVI(归一化植被指数)、郁闭度、边界指数、亮度、长宽比、第一波段光谱均值、形状指数。本实例首先通过归一化植被指数把林地和非林地区分开,在统计属性值域范围的时候,将林业部门样本分为两大类:林地和非林地。以下表2为各地类边界指数统计值(各地类后数字为各地类编号,与下面值域图对应):

表2各地类样本的BorderIndex(边界指数)统计值

(5)确定每一地类每一属性值值域范围:用各地类属性的次最大和次最小值作为地类在该属性上的值域。(6)统计每个属性值上不同地类的属性值域:根据所有地类的值域范围统计结果,按属性进行统计,即统计每个属性值上不同地类的属性值域,并做出值域图。附图2为各地类样本的BorderIndex(边界指数)属性值域图,图中横轴的数字代表上表中对应的地类,纵轴是属性值。(7)值域图统计规则:根据值域图,针对具体的地类,在所有属性中选择出与其他地类区别最大的属性,以此属性值值域进行筛选,剔除一部分干扰,重复此步骤,增加属性数目,进一步剔除干扰地块。直至取得较好效果。本实例首先通过NDVI值,将林业部门样本分为两大类:林地和非林地(林地NDVI值最小值要大于非林地样本NDVI值得最大值,以此进行区分);再通过NDVI值将非林地分为水域、建设用地、耕地和牧草地(水域的NDVI值均为负值,建设用地、耕地和牧草地均为正值且依次增加);再通过亮度值区分林地中的灌木林和其他林地;再通过郁闭度(有关标准中已经明确规定了不同林分的郁闭度界定值)区分其他林地中的有林地(乔木林和竹林,本实例中竹林样本较少,因此未对该地类进行研究。),疏林地,无立木林地;再通过长宽比区分湖泊水面和河流水面;再通过如附图2所示,在非林地地类中未利用地、其它用地和工矿建设用地的形状指数区间都比较小,其值域上限也比其它地类小很多,若取这三种地类的上限作为约束条件,可以与其他建设用地进行区分;再通过形状指数区分未利用地、其它用地和工矿建设用地;按相同方式,再通过第一波段光谱均值区分城乡居民建设用地和交通建设用地。(8)建立地理本体:根据统计的属性规则,建立该领域地理本体。本实例建立的地理本体如附图3所示。

步骤S5,不同领域地理本体系统构建:利用面向对象的多尺度分割技术在一幅固定分辨率的遥感影像上构造出在不同分割尺度下的影像对象层次结构,按照上述地理本体建模步骤,把不同领域地理本体系统的概念映射到同一个遥感影像层次结构中。按照步骤4,本实例构建的是林业部门林业和农业部门草原的地理本体系统,地理本体概念和多尺度遥感影像对象的关系及林业部门林业和农业部门草原的地理本体系统见附图4。

步骤S6,影像特征值计算:针对所研究的不同领域的地理本体,选取某些具有代表性的对象,计算其红波段均值,最大光谱差值,红波段比值,归一化植被指数,对比度,相关性,能量等六个影像特征值,最终得出每个特征值的值域。本实例林业部门的宜林地和农业部门的草山草坡的六个影像特征值值域如下表3:

表3宜林地和草山草坡的六个影像特征值值域

步骤S7,建立领域对象同种特征属性的交集:各领域的地类之间,通过其基于遥感特征集的值域,计算彼此之间的交集。若在各个特征值上均存在交集,则再计算两两之间的并集,并求出交集值域占并集值域的百分比。

下表4为林业部门的宜林地和土地利用部门的草山草坡六个特征属性交集情况:

表5为宜林地和草山草坡的六个特征属性交集占并集百分比:

表4宜林地和草山草坡的六个特征属性交集

表5宜林地和草山草坡的六个特征属性交集占并集百分比

步骤S8,建立领域本体内以及本体间的概念间的语义联系:特征属性上其值域有相交或包含关系可以映射出不同尺度的影像对象存在语义关联,结合上述建立的属性交集,建立领域本体内以及本体间的概念间的语义联系。语义关联分为直接语义关联和间接语义关联两种,具体推理步骤如下:

(1)直接语义关联:有如下语义推理规则:

①如果A领域a地类与B领域的b类在某个光谱特征值上交集为空集,则可以确定这a,b这两种地类没有语义关系;

②如果A领域a地类B领域b地类在所有光谱特征值上均相交,如果特征集间存在包含关系,则可以确定其为上下义关系;如果特征集间存在交集占并集的比重小于10%,则可以确定a,b这两种地类间没有语义关系;如果特征集间存在交集占并集的比重大于10%且小于80%,则可以确定a,b这两种地类间为语义相似关系;如果特征集间存在交集占并集的比重大于80%,则为同义关系。

(2)间接语义关联:根据直接语义关联推理规则,若推理出A领域的a地类与B领域的b地类为同义关系;则A领域中a地类的上层对象c与b地类为上下义关系,且B领域中b地类的上层对象d与a地类也为上下义关系。

结合上述建立的属性交集,建立领域本体内以及本体间的概念间的语义联系。由上述可知,林业部门的宜林地和农业部门的草山草坡在六个特征属性上均存在交集,且存在交集占并集的比重大于80%的特征集,根据直接语义关联的第二条语义推理规则,宜林地和草山草坡为同义关系。再根据间接语义关联:在农业领域,草山草坡的上层对象为天然草原(见附图4),则农业领域的天然草原和林业领域的宜林地为上下义关系。

本发明基于面向对象影像特征的地理本体建模与语义推理方法具体创新点如下:

(1)提出了基于光谱和形状特征进行地理本体建模方法:通过面向对象多尺度分割,形成了由不同遥感对象构成一个多层次体系,在此基础上,通过遥感影像对象的光谱和形状特征对不同类型的遥感对象进行建模。

(2)提出不同领域地理本体系统构建方法:利用面向对象的多尺度分割技术在一幅固定分辨率的遥感影像上构造出在不同分割尺度下的影像对象层次结构,按照本发明所提出的地理本体建模步骤,把不同领域地理本体系统的概念映射到同一个遥感影像层次结构中。

(3)提出了建立领域本体内以及本体间的概念间的语义联系的关联规则:语义关联分为直接语义关联和间接语义关联两种,具体推理步骤如下:

(3.1)直接语义关联:有如下语义推理规则:

①如果A领域a地类与B领域的b类在某个光谱特征值上交集为空集,则可以确定这a,b这两种地类没有语义关系;

②如果A领域a地类B领域b地类在所有光谱特征值上均相交,如果特征集间存在包含关系,则可以确定其为上下义关系;如果特征集间存在交集占并集的比重小于10%,则可以确定a,b这两种地类间没有语义关系;如果特征集间存在交集占并集的比重大于10%且小于80%,则可以确定a,b这两种地类间为语义相似关系;如果特征集间存在交集占并集的比重大于80%,则为同义关系。

(3.2)间接语义关联:根据直接语义关联推理规则,若推理出A领域的a地类与B领域的b地类为同义关系;则A领域中a地类的上层对象c与b地类为上下义关系,且B领域中b地类的上层对象d与a地类也为上下义关系。

应当理解的是,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,而所有这些改进和变换都应属于本发明所附权利要求的保护范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1