一种基于无监督聚类和度量学习的迁移学习方法与流程

文档序号：14774547发布日期：2018-06-23 02:44阅读：来源：国知局

技术特征：

1.一种基于无监督聚类和度量学习的迁移学习方法，其特征在于,包括以下步骤：

S1、准备源域样本DS和目标域样本DT；

S2、使用主成份分析方法降低全部样本的维度；

S3、对源域样本DS进行无监督聚类，将源域样本聚为多个类别，本质相似的样本聚在一起；

S4、为每个聚类学习一个度量矩阵G；

S5、通过每个聚类和所有的度量矩阵的关联性得出权重矩阵w0；

S6、根据已知标签的目标域样本DTL训练权重矩阵w0，得到最优的权重矩阵W；

S7、根据权重矩阵W预测未知标签的目标域样本DTU的标签。

2.根据权利要求1所述的一种基于无监督聚类和度量学习的迁移学习方法，其特征在于：所述步骤S4每个聚类在学习一个度量矩阵之前均需要将样本的顺序打乱。

3.根据权利要求1所述的一种基于无监督聚类和度量学习的迁移学习方法，其特征在于：所述步骤S4学习度量矩阵G之前需设置收敛条件：

||G-G0||＜Lamda，其中，G0为度量矩阵G的初始值，Lamda为设定的阈值，

||G-G0||表示G和G0之间距离；

求解度量矩阵G的目标函数的公式如下：

subject to dG(xi,xj)≤α(i,j)∈S,

dG(xi,xj)≥β(i,j)∈D

其中，xi、xj指其中的某个样本，S表示xi与xj同类，D表示xi与xj不同类；p(x；G)表示度量矩阵G下的样本x的概率分布；

α和β为设定的阈值。

4.根据权利要求3所述的一种基于无监督聚类和度量学习的迁移学习方法，其特征在于：所述阈值α和β的设置方式为：从训练集里任意选取100个样本对，并且将它们之间的距离按从小到大的顺序排列，排第5的距离值为α，排第95的距离值为β。

5.根据权利要求1所述的一种基于无监督聚类和度量学习的迁移学习方法，其特征在于：

所述步骤S6的具体过程如下：

S61、求出每个已知标签的目标域样本DTL的所属聚类Ci；

S62、使用每个度量矩阵进行预测，若结果与真实标签相同，则不需要调整，若结果与真实标签不相同，则调整聚类Ci和该度量矩阵所对应元素的权重；直至所有已知标签的目标域样本DTL均已测试；

S63、若经所有已知标签的目标域样本DTL测试后的权重矩阵w0满足收敛条件，则训练结束，该权重矩阵即为最优的权重矩阵W；否则继续使用DTL更新权重矩阵，直至满足收敛条件为止。

6.根据权利要求5所述的一种基于无监督聚类和度量学习的迁移学习方法，其特征在于：所述权重矩阵w0满足收敛条件后，对于w0的每个元素wij(1≤i,j≤n)，均执行归一化操作，公式如下：

7.根据权利要求1所述的一种基于无监督聚类和度量学习的迁移学习方法，其特征在于：所述步骤S7的具体过程如下：

S71、求出每个未知标签的目标域样本DTU各自所属的聚类Ct；

S72、使用全部的度量矩阵预测样本i的类型；

S73、使用KNN分类器进行分类得出分类值；

S74、若分类值大于阈值threshold，则预测样本i的标签值为Label1，否则预测样本i的标签值为Label2；其中，

threshold＝(Label1-Label2)/NumOfCategory，NumOfCategory为标签种类。

完整全部详细技术资料下载

当前第2页1 2 3