1.一种基于无监督聚类和度量学习的迁移学习方法,其特征在于,包括以下步骤:
S1、准备源域样本DS和目标域样本DT;
S2、使用主成份分析方法降低全部样本的维度;
S3、对源域样本DS进行无监督聚类,将源域样本聚为多个类别,本质相似的样本聚在一起;
S4、为每个聚类学习一个度量矩阵G;
S5、通过每个聚类和所有的度量矩阵的关联性得出权重矩阵w0;
S6、根据已知标签的目标域样本DTL训练权重矩阵w0,得到最优的权重矩阵W;
S7、根据权重矩阵W预测未知标签的目标域样本DTU的标签。
2.根据权利要求1所述的一种基于无监督聚类和度量学习的迁移学习方法,其特征在于:所述步骤S4每个聚类在学习一个度量矩阵之前均需要将样本的顺序打乱。
3.根据权利要求1所述的一种基于无监督聚类和度量学习的迁移学习方法,其特征在于:所述步骤S4学习度量矩阵G之前需设置收敛条件:
||G-G0||<Lamda,其中,G0为度量矩阵G的初始值,Lamda为设定的阈值,
||G-G0||表示G和G0之间距离;
求解度量矩阵G的目标函数的公式如下:
subject to dG(xi,xj)≤α(i,j)∈S,
dG(xi,xj)≥β(i,j)∈D
其中,xi、xj指其中的某个样本,S表示xi与xj同类,D表示xi与xj不同类;p(x;G)表示度量矩阵G下的样本x的概率分布;
α和β为设定的阈值。
4.根据权利要求3所述的一种基于无监督聚类和度量学习的迁移学习方法,其特征在于:所述阈值α和β的设置方式为:从训练集里任意选取100个样本对,并且将它们之间的距离按从小到大的顺序排列,排第5的距离值为α,排第95的距离值为β。
5.根据权利要求1所述的一种基于无监督聚类和度量学习的迁移学习方法,其特征在于:
所述步骤S6的具体过程如下:
S61、求出每个已知标签的目标域样本DTL的所属聚类Ci;
S62、使用每个度量矩阵进行预测,若结果与真实标签相同,则不需要调整,若结果与真实标签不相同,则调整聚类Ci和该度量矩阵所对应元素的权重;直至所有已知标签的目标域样本DTL均已测试;
S63、若经所有已知标签的目标域样本DTL测试后的权重矩阵w0满足收敛条件,则训练结束,该权重矩阵即为最优的权重矩阵W;否则继续使用DTL更新权重矩阵,直至满足收敛条件为止。
6.根据权利要求5所述的一种基于无监督聚类和度量学习的迁移学习方法,其特征在于:所述权重矩阵w0满足收敛条件后,对于w0的每个元素wij(1≤i,j≤n),均执行归一化操作,公式如下:
7.根据权利要求1所述的一种基于无监督聚类和度量学习的迁移学习方法,其特征在于:所述步骤S7的具体过程如下:
S71、求出每个未知标签的目标域样本DTU各自所属的聚类Ct;
S72、使用全部的度量矩阵预测样本i的类型;
S73、使用KNN分类器进行分类得出分类值;
S74、若分类值大于阈值threshold,则预测样本i的标签值为Label1,否则预测样本i的标签值为Label2;其中,
threshold=(Label1-Label2)/NumOfCategory,NumOfCategory为标签种类。