本发明涉及图像分类领域,尤其是涉及了一种基于稀疏表示的土地利用覆盖分类方法。
背景技术:
土地利用覆盖变化作为全球环境变化研究的核心内容之一,在可持续发展中占有重要地位。土地覆盖分类是遥感应用中最常见的任务之一,制定适当的分类方法目前该领域研究人员的研究重点和难点。在这种情况下,高光谱图像具有一定的研究价值,也是具有挑战性的单一数据源。高光谱传感器可以提供详细和光谱连续的空间信息,从而能够区分光谱相似的土地覆盖类别。土地利用覆盖分类可以监控土地资源利用情况,了解土地开发程度、土地利用结构和土地利用效益,对土地资源进行一系列调查、分类、统计,从而实现对土地资源的合理规划、合理开发和有效保护。然而在数据分析过程中,各个频谱带之间的数据维数和高度冗余性会给分析和图像分类带来一系列的问题,例如标准监督分类器的性能通常在分类精度方面受到限制,使用带标签的字典进行分类,则会缺少标签图像补丁。
本发明提出了一种基于稀疏表示的土地利用覆盖分类方法,先对所有图像块进行分类,并将结果以投票方式进行组合,为每个像素分配一个类别标签,接着每个补丁通过一个稀疏加权的字典元素的线性组合来表示,稀疏加权矢量是使用稀疏编码程序来确定的,然后利用一组学习过的形状和一个光谱样本集构造一个空间光谱字典,最后通过对每个图像块执行稀疏编码过程来导出图像的分类。本发明在高光谱图像分类的背景下引入了基于稀疏表示的分类器,有效解决了标准监督分类器的性能在分类精度方面受到限制的问题,实现了土地利用覆盖的有效分类。
技术实现要素:
针对各个频谱带之间的数据维数和高度冗余的问题,本发明的目的在于提供一种基于稀疏表示的土地利用覆盖分类方法,先对所有图像块进行分类,并将结果以投票方式进行组合,为每个像素分配一个类别标签,接着每个补丁通过一个稀疏加权的字典元素的线性组合来表示,稀疏加权矢量是使用稀疏编码程序来确定的,然后利用一组学习过的形状和一个光谱样本集构造一个空间光谱字典,最后通过对每个图像块执行稀疏编码过程来导出图像的分类。
为解决上述问题,本发明提供一种基于稀疏表示的土地利用覆盖分类方法,其主要内容包括:
(一)稀疏编码;
(二)基于shapelet的图像分解;
(三)字典构建;
(四)导出图像分类。
其中,所述的土地利用覆盖分类方法,设i为一个m波段高光谱图像,含有j个重叠的补丁xj,大小为
其中,所述的稀疏编码,就基本稀疏编码而言,(v×1)维测试样本x可以由从(v×n)维字典d中取出的几个元素的加权线性组合表示,所以x=dα+ε,‖ε‖b是重建误差,b是指定距离计算的范数,包含权重的参数向量由α给出;例如,测试样本x可以是来自图像的(m×1)维像素,使得v=m或((m·z)×1)维向量化图像块x=vec(x),其中z是补丁中的像素的数量,v=m·z;基于补丁的方法通过以矢量化的方式使用图像补丁来考虑空间信息;用于确定最优
其中,w是非零元素的数量;假定赋予n个字典元素(dn,yn),n=1,…,n的标签信息,并且具有类别标签yn
rk=‖dkαk-x‖b(2)
其中,dk是包含属于类k的所有元素的子字典;测试样本x被分配给产生最低重建误差的类别。
其中,所述的基于shapelet的图像分解,用合适的光谱信息填充每个形状区域,产生高度自适应的字典元素;使用超像素分割方法从每个图像中学习形状集,并且光谱信息由训练数据体现;为了构建特定于斑点的空间光谱字典,执行优化以选择给定特定图像斑点的光谱信息和形状的最佳拟合因式分解;补丁中的每个像素最后都通过投票方案进行分类。
其中,所述的字典构建,字典构建包括shapelet提取、光谱信息选择和特定于斑点的空间谱字典构造。
进一步地,所述的shapelet提取,这一步描述了从图像中提取shapelets;具有n∈{1,…,n}的
首先,使用所有图像带,将简单线性迭代聚类(slic)超像素分割方法应用于归一化图像;它将图像分割成紧凑的片段,每个片段包含均匀的光谱信息;给定图像的二进制分割掩模,提取大小为
进一步地,所述的光谱信息选择,光谱信息被假定为训练数据;训练集l个标记样本(lxl,lyl)组成,其中l∈{1,…,l}包括m维特征向量
进一步地,所述的特定于斑点的空间谱字典构造,在这个步骤中,形状谱和光谱信息被组合成每个补丁xj的((z·m)×n)维特定的空间谱dj;采用分层马尔科夫随机场(mrf)来构造空间谱字典dj,n中的第n个元素;以这种方式,对像素和形状区域之间的关系的先验知识进行建模,其中下部像素方式层包含像素信息,上层包含小波域信息;为了保持符号不变,忽略下标(·)j和(·)n,对所有的形状和所有的图像块重复下面的过程;mrf决定指数pb=[pbz],z=1,…,z,pbz∈{1,…,l},sb=[sbr],r=1,…,r,sbr∈{1,…,l},对于基于像素的层(由左上角索引p表示)和基于小波形的层(由左上角索引s表示)两者的最佳拟合光谱信息。
进一步地,所述的分层马尔科夫随机场,给定一个图像,mrf用来确定用于填充该形状的训练样本的索引;为此,利用消息传递将能量函数最小化:
其中,xz是图像块中的第z个像素,
|sr|是形状的第r个区域中的元素数量;这里,估计的类别标签由简单的最近邻近分类器确定;该项的使用选择属于主导类别的频谱信息,即将由多数票选的类别;但是,也可以选择其他类型的一元和二元项;最终字典元素d由元素x(pb)组成,字典元素标签由
其中,所述的导出图像分类,给定空间光谱字典dj,可以通过对每个图像块xj执行稀疏编码过程来导出图像的分类,其中:
优化是通过正交匹配完成的;由于图像块是完全重叠的,因此引入投票方案以通过加权投票导出每个像素的最终标签;对于第j个贴片xj,z中的第z个像素的类k的投票可以通过
附图说明
图1是本发明一种基于稀疏表示的土地利用覆盖分类方法的系统框架图。
图2是本发明一种基于稀疏表示的土地利用覆盖分类方法的稀疏编码。
图3是本发明一种基于稀疏表示的土地利用覆盖分类方法的基于shapelet的图像分解。
图4是本发明一种基于稀疏表示的土地利用覆盖分类方法的shapelet提取。
图5是本发明一种基于稀疏表示的土地利用覆盖分类方法的分层马尔科夫随机场。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互结合,下面结合附图和具体实施例对本发明作进一步详细说明。
图1是本发明一种基于稀疏表示的土地利用覆盖分类方法的系统框架图。主要包括稀疏编码,基于shapelet的图像分解,字典构建和导出图像分类。
土地利用覆盖分类方法,设i为一个m波段高光谱图像,含有j个重叠的补丁xj,大小为
字典构建,包括shapelet提取、光谱信息选择和特定于斑点的空间谱字典构造。
光谱信息选择,光谱信息被假定为训练数据;训练集l个标记样本(lxl,lyl)组成,其中l∈{1,…,l}包括m维特征向量
特定于斑点的空间谱字典构造,在这个步骤中,形状谱和光谱信息被组合成每个补丁xj的((z·m)×n)维特定的空间谱dj;采用分层马尔科夫随机场(mrf)来构造空间谱字典dj,n中的第n个元素;以这种方式,对像素和形状区域之间的关系的先验知识进行建模,其中下部像素方式层包含像素信息,上层包含小波域信息;为了保持符号不变,忽略下标(·)j和(·)n,对所有的形状和所有的图像块重复下面的过程;mrf决定指数pb=[pbz],z=1,…,z,pbz∈{1,…,l},sb=[sbr],r=1,…,r,sbr∈{1,…,l},对于基于像素的层(由左上角索引p表示)和基于小波形的层(由左上角索引s表示)两者的最佳拟合光谱信息。
导出图像分类,给定空间光谱字典dj,可以通过对每个图像块xj执行稀疏编码过程来导出图像的分类,其中:
优化是通过正交匹配完成的;由于图像块是完全重叠的,因此引入投票方案以通过加权投票导出每个像素的最终标签;对于第j个贴片xj,z中的第z个像素的类k的投票可以通过
图2是本发明一种基于稀疏表示的土地利用覆盖分类方法的稀疏编码。就基本稀疏编码而言,(v×1)维测试样本x可以由从(v×n)维字典d中取出的几个元素的加权线性组合表示,所以x=dα+∈,‖∈‖b是重建误差,b是指定距离计算的范数,包含权重的参数向量由α给出;例如,测试样本x可以是来自图像的(m×1)维像素,使得v=m或((m·z)×1)维向量化图像块x=vec(x),其中z是补丁中的像素的数量,v=m·z;基于补丁的方法通过以矢量化的方式使用图像补丁来考虑空间信息;用于确定最优
其中,w是非零元素的数量;假定赋予n个字典元素(dn,yn),n=1,…,n的标签信息,并且具有类别标签
rk=‖dkαk-x‖b(2)
其中,dk是包含属于类k的所有元素的子字典;测试样本x被分配给产生最低重建误差的类别。
图3是本发明一种基于稀疏表示的土地利用覆盖分类方法的基于shapelet的图像分解。用合适的光谱信息填充每个形状区域,产生高度自适应的字典元素;使用超像素分割方法从每个图像中学习形状集,并且光谱信息由训练数据体现;为了构建特定于斑点的空间光谱字典,执行优化以选择给定特定图像斑点的光谱信息和形状的最佳拟合因式分解;补丁中的每个像素最后都通过投票方案进行分类。
图4是本发明一种基于稀疏表示的土地利用覆盖分类方法的shapelet提取。这一步描述了从图像中提取shapelets;具有n∈{1,…,n}的
首先,使用所有图像带,将简单线性迭代聚类(slic)超像素分割方法应用于归一化图像;它将图像分割成紧凑的片段,每个片段包含均匀的光谱信息;给定图像的二进制分割掩模,提取大小为
图5是本发明一种基于稀疏表示的土地利用覆盖分类方法的分层马尔科夫随机场。给定一个图像,mrf用来确定用于填充该形状的训练样本的索引;为此,利用消息传递将能量函数最小化:
其中,xz是图像块中的第z个像素,
|sr|是形状的第r个区域中的元素数量;这里,估计的类别标签由简单的最近邻近分类器确定;该项的使用选择属于主导类别的频谱信息,即将由多数票选的类别;但是,也可以选择其他类型的一元和二元项;最终字典元素d由元素x(pb)组成,字典元素标签由
对于本领域技术人员,本发明不限制于上述实施例的细节,在不背离本发明的精神和范围的情况下,能够以其他具体形式实现本发明。此外,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围,这些改进和变型也应视为本发明的保护范围。因此,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。