基于主动学习的高分辨率遥感影像变化检测方法及系统的制作方法_2

文档序号:9506545阅读:来源:国知局
r>[0049] 其中,i和j是沿宽度和高度方向分割块的序号,(Xl,yj)是第(i,j)个集群中心 的坐标,Φ (Xl,y])是该集群中心的颜色值。
[0050] 3)使用分配的各像素点特征向量重新估计集群中心。此处使用的k-means算法称 为标准Lloyd算法(劳埃德算法),与标准k-means相比,其唯一不同在于每个像素只能分 配到原始中心的近邻。保证了每次最小化循环都是4像素中心比较。
[0051] 4)合并过小区分割区域。当k-means收敛后,SLIC移除所有小于最小分割区域的 连通区域,并将其与周围符合区域大小约束的图斑合并。
[0052] 步骤2,超像素特征提取,即对各时相遥感影像,分别取各超像素的外接矩形范围 并计算该区域的颜色特征和结构特征,组合后共同构成该时相遥感影像的超像素特征集: 实施例对分割后的所有超像素取外接矩形并计算该范围的DCD颜色描述子(Discriminate Color Descriptor,判别式颜色描述子)和sift (尺度不变特征转换)结构描述子,归一化 后级联组成不同时相遥感影像的超像素特征集。例如,对Tl时相遥感影像的超像素分割 结果提取得到Tl时相特征集,对T2时相遥感影像的超像素分割结果提取得到T2时相特征 集。
[0053] 用D⑶颜色描述子描述超像素的颜色信息,其具体计算方法如下。
[0054] 将原始的颜色空间离散化为m个颜色单词,构成单词集合W = (W1, ,假设W 有L个类别,类别集合为C= Ic1,…,cj,用这些颜色单词构成的直方图即可表达不同的图 像。颜色单词集合W在区分类别集合C上的判别力用下面的互信息计算,衡量了单词集合 W包含在类别集合C中的信息量I (C,W):
[0056] 其中,p(Cl,wt)表示第t个颜色单词^出现在第1个类别C 1中的概率,p(Cl)表示 第1个类别C1出现的概率,p (w t)表示第t个颜色单词Wt出现的概率,这些概率值都是通过 统计所有像素点的特征与类别得到的。其中,I = 1,...,L,t = 1,...,T。
[0057] 现将单词集合W聚成K个类别We= (W1,…,Wj,每个Wk都表示一组单词,k = 1,...,K。设单词集合W中第t个颜色单词Wt属于第k个聚类Wk,聚类W k中单词w t引起的 互信息下降记为Δ :Δ = jrtKL(p(C|wt),p(C|Wk)),p(C|wt)是单词集合W中第t个颜色单 词w t属于类别集合C的概率,同理p (CIW k)表示聚类Wk中单词样本中属于类别集合C的概 率。KL (,)表示 KL 散度(Kullback-Leibler divergence),Jit=P(Wt)是单词的先验信 息。
[0058] 通过单词聚类引起的总互信息下降等价得到下式:
[0060] 其中,A1表示通过单词聚类引起的总互信息下降。
[0061] 对颜色空间分布进行约束,得到了能量函数E(W):
[0063] 目标就是最小化此能量函数,得到对应的D⑶颜色单词(也就是使得上述能量函 数最小的t个特征值)。Wt是单词集合W中第t个颜色单词,w表示像素的特征值,下标表 示其位置,s和t是相邻的像素,ε表示t的邻域,即ws,Wt分别为像素 t和相邻像素 s的特 征值。颜色单词是像素颜色值聚类后的聚类中心,以上公式用于形成颜色单词。整个表达式 中,第一项W(K)是互信息约束即八,第二项〇,)是颜色连通性约束,第三项Φ (ws, wt) 是空间约束,其具体表达如下。
[0066] 对不属于颜色邻域^的颜色加以惩罚,所谓颜色邻域,指的是在颜色空间中与Wt 相邻的颜色集合。α ε是设置的惩罚参数,如果有足够多的选择,就可以消除不连通项,最终 得到特征的连通聚类。
[0068] a D是设置的惩罚参数,表示周围不一致的代价。
[0069] 最后将图像中的所有像素均用t个颜色单词中的某一个进行表示,统计整幅图像 中每个颜色单词出现的次数,构成一个颜色直方图作为该幅图像的DCD颜色描述子。
[0070] 步骤3,相似度计算,即对每个位置的两时相遥感影像中的超像素对计算直方图交 叉核作为该对超像素的相似性度量指标:
[0071] 实施例用不同时相图像中对应超像素的直方图交叉核表达其相似性。直方图交差 核的定义为:K hik (X,X')= min (xd, X'd),其中X、X'分别是两时相遥感影像中某位置超像素 的特征矢量,xd、X' 4是对应第d维的取值。
[0072] 步骤4,初始样本选择,即在没有任何标注的情况下根据超像素对的直方图交叉核 值采用一定的策略选择"最具代表性"的初始样本,再进行标注:实施例根据超像素直方图 交叉核的分布规律找到"最优价值"的初始样本,经过标注后可构成初始的训练集。
[0073] 具体实施时,本领域技术人员可自行预设选择策略,例如可以采用的选择策略有 如下3种:
[0074] 1)在所有样本中随机选择,选择的样本数量可以人工设定;
[0075] 2)用EM算法拟合高斯混合分布,将分布在最外侧的样本作为初始样本,至于具体 的个数可以可由本领域技术人员自行设定,或者根据实验进行调整;
[0076] 3)用k-means进行聚类,选择距离聚类中心最近的样本作为初始样本,同样样本 个数可由本领域技术人员自行设定,或者根据实验进行调整。
[0077] 具体实施时,对选择的样本的标注可由本领域技术人员自行设定,或者采用其他 分析软件提供。EM算法和k-means算法为现有技术,本发明不予赘述。
[0078] 步骤5,基于主动学习的监督分类,即将已标注的样本作为训练集(初始训练时即 步骤4所得初始样本)训练分类器,并在分类结果中选出"最不确定"(即可信度最低)的 样本继续标注,并将其加入训练集中重新训练分类器,不断重复此过程,直至满足迭代结束 条件(检测结果精度达到满意的范围或迭代次数达到所设定的上限)时迭代结束,得到最 终的检测结果:
[0079] 实施例根据"已标记"的训练集用高斯过程完成分类任务,并采用合适的样本选择 策略完成基于主动学习变化检测任务。在分类结果中选出"最不确定"的样本可采用预设 的样本选择策略。
[0080] 具体实施时,步骤5可包括以下子步骤:
[0081] 步骤5. 1,输入步骤4所得初始的训练集;
[0082] 步骤5. 2,根据当前的训练集训练分类器;
[0083] 在高斯分类模型下,函数值受高斯噪声干扰f,σ n是白噪声的标准差, 也就是Y1= f(X(1))+ ε,X = {x(1),…,x(n)},其中yi即为受噪声影响的预测值,X (1)是每组 样本的直方图交叉核值,X是所有直方图交叉核的集合,f是特征与预测之间的映射关系, 用零均值和协方差函数k的联合高斯模拟,即
表示高斯分布)。给 定训练集后,即可得到K是训练样本的协方差矩阵,参数^
y为训练样本的 标签。
[0084] 步骤5. 3,再根据当前的分类器处理所有未分类样本,得到相应预测均值及预测方 差;
[0085] 根据K和α可以快速计算新样本的预测均值及预测方差
[0088] 根据预测均值μ $的符号即可进行分类。其中X $是新样本的特征值,k ,是新样本 与训练样本的协方差矩阵,K是它的转置矩阵,k#是新样本自身的协方差值,f,表示预测 函数,是新样本预测值的方差,I是单位矩阵,K是训练集中样本的协方差矩阵,α是为 方便运算引入的参数。
[0089] 步骤5. 4,从步骤5. 3的分类结果中找出"最有价值"的样本并在标记后加入训练 集,从未标记数据集中将该样本去掉;
[0090] 根据预测均值与方差选择"最不确定"(即可信度最低)的样本以便在标记后作为 新样本,即"最有价值"的样本。具体实施时,可以选择不同的样本选择策略完成主动学习 任务,当标记结果达到收敛,或迭代次数达到上限时整个过程结束,得到变化检测结果。例 如以下5种选择策略之一:

[0096] 其中,和y(1)分别表示第i个样本的特征值及其预测值,
为相 应预测均值及预测方差,W是全体样本集合,Q表示选出的待标记样本,其角标分别表示不 同的选择策略:预测均值最小,预测方差最大,不确定性最小,权重影响和模型损失。
[0097] 步骤5. 5,判断是否满足迭代结束条件,是则结束迭代,得到最终的
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1