一种用于遥感图像分类的基于类心对齐的迁移学习方法_2

文档序号：9708801阅读：来源：国知局

br>[0055]其中di为第i个类别的类心差；
[0056] (7)对于目标域内任一样本点xt，t = l，-_，N，利用基于光谱角制图距离度量方法在目标域图像数据中搜索xt的k个近邻点构成xt的近邻点集X=[xi,. . .，xk]，xt的近邻点集X 包括xt本身，这k个近邻点的预测标记结果为Y=[yi，. . .，yk];
[0057] (8)对于目标域任一样本点Xt，t=l，-_，N，计算其移动方向d:
[0058]
[0059] 其中δ为克罗内克函数，^是^的第i个近邻点^的预测标签，山是第j个类别数据的类心差，如果Xl被预测为第j类，即 yi等于j，那么函数s(yij) = i，否则等于〇;
[0060] (9)将目标域样本点xt，t = l，…，N，按照其移动方向d移动，移动后的目标域样本点的光谱特征xts为xts = xt_d，t = l，…，N;
[0061] (10)更新迭代参数1使其累加1，利用步骤(2)训练得到的分类器对移动后的目标域图像数据xts，t = 1，…，N进行预测，得到新的分类结果Yt1;
[0062] (11)重复步骤(5)到步骤（10)至少5次，直到达到收敛条件，输出最后一次分类结果 Yt1;
[0063] 所述收敛条件为:连续5次分类结果Υ/(大小为N X 1的向量)对应的总体分类精度 (Overall Accuracy，0A)的变化很小，也就是连续5次0A的变化小于阈值T。假设目标域图像数据Xt的真实标记信息为Yt(大小为NX1的向量），那么总体分类精度为Yt1和Yt中相同元素的个数除以N，阈值T设为0.005。
[0064]至此，对于目标域图像的每个数据点，都进行了分类。
[0065]为证明以上方法的有效性，采用实际高光谱遥感数据为例进行说明。
[0066]实验采用的Β0Τ数据包括三幅高光谱遥感图像，是由E0-1观测卫星搭载的 Hyperion传感器分别于2001年5月、6月和7月在Okavango Delta，Botswana(BOT)地区采集。该数据是具有242波段，光谱范围是357~2576纳米，具有10纳米的光谱分辨率和30 X 30m2 的空间分辨率，去除未校准波段，噪声波段，以及光谱重叠波段，剩余145个波段。该地区包括湿地和高地两个生态系统，包含9种地物类别，分别是：
[0067] 第1类:水；
[0068]第2类:泛洪区；
[0069]第3类:河岸；
[0070]第4类:树木烧焦区；
[0071] 第5类:岛屿；
[0072] 第6类:林地；
[0073]第7类:热带草原植被；
[0074] 第8类:短阔叶树；
[0075]第9类:裸土。
[0076]对Β0Τ三幅影像，可以选择一幅作为源域图像，另外一幅作为目标域图像，例如"5 月-6月"表示5月份Β0Τ图像作为源域训练数据，6月份Β0Τ图像作为目标域图像数据。这样，有六组实验数据，分别表示为5月-6月、6月-5月、5月-7月、7月-5月、6月-7月、7月-6月。本发明提出的方法和SVM分类器做比较，其中SVM是指由源域训练数据训练得到的SVM分类器直接作用于目标域图像数据进行分类，CCA是本发明提出的用于遥感图像分类的基于类心对齐的迀移学习方法，是以SVM分类结果作为初始分类结果，然后通过变化目标域图像数据，从而利用同样的SVM分类器可以达到更高的分类精度。对于CCA方法，有一个参数k，表示近邻中数据点的数量，在本实验中设置为k = 5。
[0077] 表1列出了两个分类器在六组数据上的总体分类精度(Overal 1 Accuracy，0A)和卡帕系数(Kappa)。可以看到，相较于SVM分类器，通过CCA算法对目标域图像数据变化，分类精度显著提高。当初始分类精度(〇A>85 %，6月-7月，7月-6月），CCA能够获得很高的精确度 (约95% );当初始精度非常低（〈60%，6月-5月，7月-5月），CCA也可以将初始分类精度提高 13 ~26%〇
[0078]
[0079] 表1在Β0Τ图像的六组实验数据中比较SVM和CCA分类结果
[0080] 图2分析了在不同参数k取值下的CCA算法对六组实验数据的分类结果，其中k取1、 3、5、7和9这五种不同取值，X轴表示迭代次数，y轴表示总体分类精度0A。可以看到，（1)迭代初始的分类结果对应SVM分类结果，随着迭代的进行，所有不同的k值都可以得到0A的提高，表明本发明提出CCA算法，在不同k值下，将目标域图像数据进行变化后，都可以得到比SVM 分类更高的分类精度。（2)对于迭代结束后收敛的分类精度，k = 1的分类精度最低，k = 5、7 和9这三种取值可以取得相似的较好的分类结果。k=l表明邻域只包含一个数据点，也就是目标域图像数据点的移动只由该数据点本身预测结果对应的类心差决定，并没有考虑其邻域信息，其他k值情况下，目标域图像数据点的移动方向由邻域内多个点共同决定，可以使得数据点在移动后仍然保持原数据的局部相似性关系，因而可以达到更好的分类效果。
[0081] 本发明提出一种用于遥感图像分类的基于类心对齐的迀移学习方法，目的在于调整目标域图像数据特征，使其更接近于源域训练数据，从而可以直接使用源域训练数据训练的分类器，对目标域图像数据进行分类。在高光谱遥感图像上的实验结果证明了本发明算法的有效性，另外，该方法是基于对目标域图像数据进行调整而达到迀移学习的目的，因此，不限于使用SVM分类器，任何有效的分类器(例如k近邻分类器，线性判别分类器，朴素贝叶斯分类器等)都可以使用。同时，实验只是给出了一种高光谱遥感数据，该方法同样可以适用于其他高光谱遥感图像或多光谱遥感图像。
【主权项】
1. 一种用于遥感图像分类的基于类心对齐的迀移学习方法，其特征在于包括以下步骤： (1) 选取源域图像中的训练数据Xs以及目标域图像数据Xt; 其中Xs是源域图像中的Μ个标记数据点的集合，每个数据点的维数是D，xs的标记信息表示为Ys，用MX 1的向量表示，假设Xs数据集中包含C种地物类型，其中第i种地物类型数据组成集合表示为Xsi，包含Mi个数据点，那么乂 5=%1，'"义。]，1=11+12+"_+1^丄是目标域图像中N个数据点的集合，每个数据点的维数是D，Xt数据集中也包含C种地物类型，其中第i种地物类型数据组成集合表示为Xti，包含Ni个数据点，那么X t = [Xtl，…，Xtc]，Ν=Λ+Ν2+…+Nc; (2) 用源域训练数据Xs及其标记信息Ys训练分类器； (3) 利用训练好的分类器对Xt中的全部数据点进行预测，得到N个目标域图像数据Xt的分类结果Yt1，Yt 1是N X 1的向量，其中1为当前迭代次数，初始值为1; (4) 利用源域训练数据Xs及其标记信息Ys，计算源域训练数据的C个类别数据的类心，表示为U s=[Usl，…，usC]，其中第i类类别数据的类心usl的计算包括以下过程：首先根据源域训练数据Xs的标记信息Ys，找出属于第i个类别数据对应的所有源域训练数据点，组成集合XS1=[X1，…，xMl]，i = l，…，C，然后通过以下公式计算集合XS1的平均光谱 usl做为源域第i类类别数据类心： I 碼其中，Xsj为集合Xsi中的数据点； (5) 利用目标域图像数据Xt和其预测结果Yt1，计算C个类别数据的类心以=[utl，…， u tc]，包括以下过程：首先根据目标域图像数据Xt的预测标记信息Yt1，找出属于第i个类别数据的所有目标域图像数据点，组成集合Xtl=[X1，~，XNl]，i = l，···，(：，然后通过以下公式计算集合Xtl的平均光谱utl做为目标域第i类类心： 1 N,. 丄、' J=.l' 其中，xtj为集合Xti中的数据点； (6) 通过以下公式计算源域和目标域每个类别数据的类心差： di = uti_usi，i = 1，…，C 其中cU为第i个类别数据的类心差； (7) 对于目标域内任一样本点xt，t = l，···，N，利用基于光谱角制图距离度量方法在目标域图像数据中搜索xt的k个近邻点构成xt的近邻点集X=[xi, . . .，xk]，xt的近邻点集X包括xt 本身，这k个近邻点的预测标记结果为Y=[yi，. . .，yk]; (8) 对于目标域任一样本点xt，t = 1，…，N，计算其移动方向d: d=^ZZ^>^j)di 其中δ为克罗内克函数，y^Xt的第i个近邻AXl的预测标签，山是第j个类别数据的类心差，如果Xl被预测为第j类，即yi等于j，那么函数s(yi，j) = l，否则等于0; (9) 将目标域样本点xt，t = 1，…，N，按照其移动方向d移动，移动后的目标域样本点的光谱特征xts为xts = xt_d，t = 1，…，N; (10) 更新迭代参数1使其累加1，利用步骤(2)训练得到的分类器对移动后的目标域图像数据Xts，t = 1，…，N进行预测，得到新的分类结果Yt1; (11) 重复步骤(5)到步骤(10)至少5次，直到达到收敛条件，输出最后一次分类结果ΥΛ 所述收敛条件为:连续5次分类结果Yt 1对应的总体分类精度的变化小于阈值Τ，总体分类精度为Yt1和Yt中相同元素的个数除以N，阈值T在0.001~0.01范围内选择。2. 根据权利要求1所述的用于遥感图像分类的基于类心对齐的迀移学习方法，其特征在于:步骤(2)所述的分类器为SVM分类器，采用libSVM工具箱中的svmtrain函数对SVM分类器进行训练。3. 根据权利要求2所述的用于遥感图像分类的基于类心对齐的迀移学习方法，其特征在于:步骤(3)中采用libSVM工具箱中的svmpredict函数对Xt中的全部数据点进行预测。4. 根据权利要求1所述的用于遥感图像分类的基于类心对齐的迀移学习方法，其特征在于:步骤(11)中，阈值T设置为0.005。
【专利摘要】本发明提供了一种用于遥感图像分类的基于类心对齐的迁移学习方法，(1)准备源域数据和目标域数据；(2)利用源域数据训练分类器；(3)利用分类器对目标域数据进行分类；(4)计算源域各类别数据的类心；(5)计算目标域各类别数据的类心；(6)计算源域和目标域各类别类心差；(7)对目标域的样本点，在目标域数据中搜索其k个近邻点；(8)计算目标域样本点移动方向；(9)计算移动后目标域数据；(10)利用分类器对移动后的目标域数据分类；(11)重复步骤(5)到(10)直到收敛。本发明使得移动后的目标域数据和源域数据光谱特征相似，达到迁移学习的目的，多种遥感数据分类都表现良好适用性，具有明显的迁移学习的效果。
【IPC分类】G06K9/62
【公开号】CN105469109
【申请号】CN201510799789
【发明人】马丽, 祝蕾
【申请人】中国地质大学（武汉）
【公开日】2016年4月6日
【申请日】2015年11月19日

完整全部详细技术资料下载

当前第2页1 2