一种基于无监督聚类和度量学习的迁移学习方法与流程

文档序号:14774547发布日期:2018-06-23 02:44阅读:来源:国知局
一种基于无监督聚类和度量学习的迁移学习方法与流程

技术特征:

1.一种基于无监督聚类和度量学习的迁移学习方法,其特征在于,包括以下步骤:

S1、准备源域样本DS和目标域样本DT;

S2、使用主成份分析方法降低全部样本的维度;

S3、对源域样本DS进行无监督聚类,将源域样本聚为多个类别,本质相似的样本聚在一起;

S4、为每个聚类学习一个度量矩阵G;

S5、通过每个聚类和所有的度量矩阵的关联性得出权重矩阵w0;

S6、根据已知标签的目标域样本DTL训练权重矩阵w0,得到最优的权重矩阵W;

S7、根据权重矩阵W预测未知标签的目标域样本DTU的标签。

2.根据权利要求1所述的一种基于无监督聚类和度量学习的迁移学习方法,其特征在于:所述步骤S4每个聚类在学习一个度量矩阵之前均需要将样本的顺序打乱。

3.根据权利要求1所述的一种基于无监督聚类和度量学习的迁移学习方法,其特征在于:所述步骤S4学习度量矩阵G之前需设置收敛条件:

||G-G0||<Lamda,其中,G0为度量矩阵G的初始值,Lamda为设定的阈值,

||G-G0||表示G和G0之间距离;

求解度量矩阵G的目标函数的公式如下:

subject to dG(xi,xj)≤α(i,j)∈S,

dG(xi,xj)≥β(i,j)∈D

其中,xi、xj指其中的某个样本,S表示xi与xj同类,D表示xi与xj不同类;p(x;G)表示度量矩阵G下的样本x的概率分布;

α和β为设定的阈值。

4.根据权利要求3所述的一种基于无监督聚类和度量学习的迁移学习方法,其特征在于:所述阈值α和β的设置方式为:从训练集里任意选取100个样本对,并且将它们之间的距离按从小到大的顺序排列,排第5的距离值为α,排第95的距离值为β。

5.根据权利要求1所述的一种基于无监督聚类和度量学习的迁移学习方法,其特征在于:

所述步骤S6的具体过程如下:

S61、求出每个已知标签的目标域样本DTL的所属聚类Ci;

S62、使用每个度量矩阵进行预测,若结果与真实标签相同,则不需要调整,若结果与真实标签不相同,则调整聚类Ci和该度量矩阵所对应元素的权重;直至所有已知标签的目标域样本DTL均已测试;

S63、若经所有已知标签的目标域样本DTL测试后的权重矩阵w0满足收敛条件,则训练结束,该权重矩阵即为最优的权重矩阵W;否则继续使用DTL更新权重矩阵,直至满足收敛条件为止。

6.根据权利要求5所述的一种基于无监督聚类和度量学习的迁移学习方法,其特征在于:所述权重矩阵w0满足收敛条件后,对于w0的每个元素wij(1≤i,j≤n),均执行归一化操作,公式如下:

7.根据权利要求1所述的一种基于无监督聚类和度量学习的迁移学习方法,其特征在于:所述步骤S7的具体过程如下:

S71、求出每个未知标签的目标域样本DTU各自所属的聚类Ct;

S72、使用全部的度量矩阵预测样本i的类型;

S73、使用KNN分类器进行分类得出分类值;

S74、若分类值大于阈值threshold,则预测样本i的标签值为Label1,否则预测样本i的标签值为Label2;其中,

threshold=(Label1-Label2)/NumOfCategory,NumOfCategory为标签种类。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1