基于主动学习的高分辨率遥感影像变化检测方法及系统的制作方法_2

文档序号：9506545阅读：来源：国知局

r>[0049] 其中，i和j是沿宽度和高度方向分割块的序号，（Xl，yj)是第（i，j)个集群中心的坐标，Φ (Xl，y])是该集群中心的颜色值。
[0050] 3)使用分配的各像素点特征向量重新估计集群中心。此处使用的k-means算法称为标准Lloyd算法（劳埃德算法），与标准k-means相比，其唯一不同在于每个像素只能分配到原始中心的近邻。保证了每次最小化循环都是4像素中心比较。
[0051] 4)合并过小区分割区域。当k-means收敛后，SLIC移除所有小于最小分割区域的连通区域，并将其与周围符合区域大小约束的图斑合并。
[0052] 步骤2,超像素特征提取，即对各时相遥感影像，分别取各超像素的外接矩形范围并计算该区域的颜色特征和结构特征，组合后共同构成该时相遥感影像的超像素特征集：实施例对分割后的所有超像素取外接矩形并计算该范围的DCD颜色描述子（Discriminate Color Descriptor，判别式颜色描述子）和sift (尺度不变特征转换）结构描述子，归一化后级联组成不同时相遥感影像的超像素特征集。例如，对Tl时相遥感影像的超像素分割结果提取得到Tl时相特征集，对T2时相遥感影像的超像素分割结果提取得到T2时相特征集。
[0053] 用D⑶颜色描述子描述超像素的颜色信息，其具体计算方法如下。
[0054] 将原始的颜色空间离散化为m个颜色单词，构成单词集合W = (W1, ，假设W 有L个类别，类别集合为C= Ic1，…，cj，用这些颜色单词构成的直方图即可表达不同的图像。颜色单词集合W在区分类别集合C上的判别力用下面的互信息计算，衡量了单词集合 W包含在类别集合C中的信息量I (C，W):
[0056] 其中，p(Cl，wt)表示第t个颜色单词^出现在第1个类别C 1中的概率，p(Cl)表示第1个类别C1出现的概率，p (w t)表示第t个颜色单词Wt出现的概率，这些概率值都是通过统计所有像素点的特征与类别得到的。其中，I = 1，...，L，t = 1，...，T。
[0057] 现将单词集合W聚成K个类别We= (W1,…，Wj，每个Wk都表示一组单词，k = 1，...，K。设单词集合W中第t个颜色单词Wt属于第k个聚类Wk，聚类W k中单词w t引起的互信息下降记为Δ :Δ = jrtKL(p(C|wt)，p(C|Wk))，p(C|wt)是单词集合W中第t个颜色单词w t属于类别集合C的概率，同理p (CIW k)表示聚类Wk中单词样本中属于类别集合C的概率。KL (，）表示 KL 散度（Kullback-Leibler divergence)，Jit=P(Wt)是单词的先验信息。
[0058] 通过单词聚类引起的总互信息下降等价得到下式：
[0060] 其中，A1表示通过单词聚类引起的总互信息下降。
[0061] 对颜色空间分布进行约束，得到了能量函数E(W):
[0063] 目标就是最小化此能量函数，得到对应的D⑶颜色单词（也就是使得上述能量函数最小的t个特征值）。Wt是单词集合W中第t个颜色单词，w表示像素的特征值，下标表示其位置，s和t是相邻的像素，ε表示t的邻域，即ws，Wt分别为像素 t和相邻像素 s的特征值。颜色单词是像素颜色值聚类后的聚类中心，以上公式用于形成颜色单词。整个表达式中，第一项W(K)是互信息约束即八，第二项〇,)是颜色连通性约束，第三项Φ (ws, wt) 是空间约束，其具体表达如下。
[0066] 对不属于颜色邻域^的颜色加以惩罚，所谓颜色邻域，指的是在颜色空间中与Wt 相邻的颜色集合。α ε是设置的惩罚参数，如果有足够多的选择，就可以消除不连通项，最终得到特征的连通聚类。
[0068] a D是设置的惩罚参数，表示周围不一致的代价。
[0069] 最后将图像中的所有像素均用t个颜色单词中的某一个进行表示，统计整幅图像中每个颜色单词出现的次数，构成一个颜色直方图作为该幅图像的DCD颜色描述子。
[0070] 步骤3,相似度计算，即对每个位置的两时相遥感影像中的超像素对计算直方图交叉核作为该对超像素的相似性度量指标：
[0071] 实施例用不同时相图像中对应超像素的直方图交叉核表达其相似性。直方图交差核的定义为：K hik (X，X'）= min (xd, X'd)，其中X、X'分别是两时相遥感影像中某位置超像素的特征矢量，xd、X' 4是对应第d维的取值。
[0072] 步骤4,初始样本选择，即在没有任何标注的情况下根据超像素对的直方图交叉核值采用一定的策略选择"最具代表性"的初始样本，再进行标注：实施例根据超像素直方图交叉核的分布规律找到"最优价值"的初始样本，经过标注后可构成初始的训练集。
[0073] 具体实施时，本领域技术人员可自行预设选择策略，例如可以采用的选择策略有如下3种：
[0074] 1)在所有样本中随机选择，选择的样本数量可以人工设定；
[0075] 2)用EM算法拟合高斯混合分布，将分布在最外侧的样本作为初始样本，至于具体的个数可以可由本领域技术人员自行设定，或者根据实验进行调整；
[0076] 3)用k-means进行聚类，选择距离聚类中心最近的样本作为初始样本，同样样本个数可由本领域技术人员自行设定，或者根据实验进行调整。
[0077] 具体实施时，对选择的样本的标注可由本领域技术人员自行设定，或者采用其他分析软件提供。EM算法和k-means算法为现有技术，本发明不予赘述。
[0078] 步骤5,基于主动学习的监督分类，即将已标注的样本作为训练集（初始训练时即步骤4所得初始样本）训练分类器，并在分类结果中选出"最不确定"（即可信度最低）的样本继续标注，并将其加入训练集中重新训练分类器，不断重复此过程，直至满足迭代结束条件（检测结果精度达到满意的范围或迭代次数达到所设定的上限）时迭代结束，得到最终的检测结果：
[0079] 实施例根据"已标记"的训练集用高斯过程完成分类任务，并采用合适的样本选择策略完成基于主动学习变化检测任务。在分类结果中选出"最不确定"的样本可采用预设的样本选择策略。
[0080] 具体实施时，步骤5可包括以下子步骤：
[0081] 步骤5. 1，输入步骤4所得初始的训练集；
[0082] 步骤5. 2,根据当前的训练集训练分类器；
[0083] 在高斯分类模型下，函数值受高斯噪声干扰f，σ n是白噪声的标准差，也就是Y1= f(X(1))+ ε，X = {x(1)，…，x(n)}，其中yi即为受噪声影响的预测值，X (1)是每组样本的直方图交叉核值，X是所有直方图交叉核的集合，f是特征与预测之间的映射关系，用零均值和协方差函数k的联合高斯模拟，即
表示高斯分布）。给定训练集后，即可得到K是训练样本的协方差矩阵，参数^
y为训练样本的标签。
[0084] 步骤5. 3,再根据当前的分类器处理所有未分类样本，得到相应预测均值及预测方差；
[0085] 根据K和α可以快速计算新样本的预测均值及预测方差
[0088] 根据预测均值μ $的符号即可进行分类。其中X $是新样本的特征值，k ,是新样本与训练样本的协方差矩阵，K是它的转置矩阵，k#是新样本自身的协方差值，f,表示预测函数，是新样本预测值的方差，I是单位矩阵，K是训练集中样本的协方差矩阵，α是为方便运算引入的参数。
[0089] 步骤5. 4,从步骤5. 3的分类结果中找出"最有价值"的样本并在标记后加入训练集，从未标记数据集中将该样本去掉；
[0090] 根据预测均值与方差选择"最不确定"（即可信度最低）的样本以便在标记后作为新样本，即"最有价值"的样本。具体实施时，可以选择不同的样本选择策略完成主动学习任务，当标记结果达到收敛，或迭代次数达到上限时整个过程结束，得到变化检测结果。例如以下5种选择策略之一：

[0096] 其中，和y(1)分别表示第i个样本的特征值及其预测值，
为相应预测均值及预测方差，W是全体样本集合，Q表示选出的待标记样本，其角标分别表示不同的选择策略：预测均值最小，预测方差最大，不确定性最小，权重影响和模型损失。
[0097] 步骤5. 5,判断是否满足迭代结束条件，是则结束迭代，得到最终的

完整全部详细技术资料下载

当前第2页1 2 3