一种实现有效特征抽取的深度子空间聚类方法及系统与流程

文档序号：20920521发布日期：2020-05-29 14:05阅读：来源：国知局

技术特征：

1.一种实现有效特征抽取的深度子空间聚类方法，其特征在于，包括：

利用自编码器抽取输入样本特征表达，并通过最小化输入与输出样本的误差获得自编码器损失函数；

利用自表达模块实现子空间学习，获取自表达模块损失函数；

通过监督特征学习模块从潜在表示中提取与聚类任务相关的特征，得到监督特征学习模块损失函数；所述监督特征学习模块损失函数为通过kl散度进行优化得到的；其中，通过定义一个均匀分布的标签先验分布函数以及平衡标签类别的分布使监督特征学习模块损失函数通过kl散度进行优化；

根据所述自编码器损失函数、自表达模块损失函数以及监督特征学习模块损失函数得到优化目标函数；

根据得到的相关系数矩阵计算出亲和矩阵，并利用所述亲和矩阵进行谱聚类。

2.根据权利要求1所述的实现有效特征抽取的深度子空间聚类方法，其特征在于，所述自编码器损失函数用于优化网络参数，所述自编码器损失函数由以下公式确定：

其中，x＝{x1,x2,x3,...,xn}为输入样本，是输入样本的重构输出，n为输入样本数量。

3.根据权利要求2所述的实现有效特征抽取的深度子空间聚类方法，其特征在于，所述利用自表达模块实现子空间学习，获取自表达模块损失函数，具体的，

自表达模块通过其他样本的线性组合表示每个样本，实现子空间学习，所述子空间学习由以下公式确定：

z＝zc

其中，c∈r^n×n代表相关系数矩阵，所述c具有块对角的性质，z＝{z1,z2,z3,...,zn}代表每个输入样本对应的中间向量表达；

所述自表达模块损失函数由以下公式确定：

λ为用于平衡不同损失项权重的参数，||·||p表示一个合适的矩阵范数。

4.根据权利要求3所述的实现有效特征抽取的深度子空间聚类方法，其特征在于，所述监督特征学习模块损失函数由以下公式确定：

，

pik为预测标分布中第i个样本属于第k个类的概率qik为目标分布中第i个样本属于第k个类的概率。

5.根据权利要求4所述的实现有效特征抽取的深度子空间聚类方法，其特征在于，所述优化目标函数由以下公式确定：

minl1+γ1l2+γ2l3s.t.diag(c)＝0

其中，l1为自编码器损失函数，l2为自表达模块损失函数，l3为监督特征学习模块损失函数，γ1,γ2为正则化参数。

6.根据权利要求5所述的实现有效特征抽取的深度子空间聚类方法，其特征在于，所述亲和矩阵由以下公式确定：

7.一种实现有效特征抽取的深度子空间聚类系统，其特征在于，包括：

自编码器损失函数获取模块，用于利用自编码器抽取输入样本特征表达，并通过最小化输入与输出样本的误差获得自编码器损失函数；

自表达模块损失函数获取模块，用于利用自表达模块实现子空间学习，获取自表达模块损失函数；

监督特征学习模块损失函数获取模块，用于通过监督特征学习模块从潜在表示中提取与聚类任务相关的特征，得到监督特征学习模块损失函数；所述监督特征学习模块损失函数为通过kl散度进行优化得到的；其中，通过定义一个均匀分布的标签先验分布函数以及平衡标签类别的分布使监督特征学习模块损失函数通过kl散度进行优化；

优化目标函数获取模块，用于根据所述自编码器损失函数、自表达模块损失函数以及监督特征学习模块损失函数得到优化目标函数；

聚类模块，用于根据得到的相关系数矩阵计算出亲和矩阵，并利用所述亲和矩阵进行谱聚类。

8.根据权利要求7所述的实现有效特征抽取的深度子空间聚类系统，其特征在于，所述优化目标函数由以下公式确定：

minl1+γ1l2+γ2l3s.t.diag(c)＝0

其中，l1为自编码器损失函数，l2为自表达模块损失函数，l3为监督特征学习模块损失函数，γ1,γ2为正则化参数，c∈r^n×n代表相关系数矩阵，所述c具有块对角的性质。

9.根据权利要求8所述的实现有效特征抽取的深度子空间聚类系统，其特征在于，所述亲和矩阵由以下公式确定：

10.根据权利要求9所述的实现有效特征抽取的深度子空间聚类系统，其特征在于，所述自编码器损失函数由以下公式确定：

其中，x＝{x1,x2,x3,...,xn}为输入样本，是输入样本的重构输出，n为输入样本数量；

所述自表达模块损失函数由以下公式确定：

，

z＝{z1,z2,z3,...,zn}为每个输入样本对应的中间向量表达，λ为用于平衡不同损失项权重的参数，||·||p为一个合适的矩阵范数

所述监督特征学习模块损失函数由以下公式确定：

pik为预测标分布中第i个样本属于第k个类的概率qik为目标分布中第i个样本属于第k个类的概率。

技术总结
本发明实施例提供一种实现有效特征抽取的深度子空间聚类方法和系统，所述方法包括：利用自编码器抽取输入样本特征表达，并通过最小化输入与输出样本的误差获得自编码器损失函数；利用自表达模块实现子空间学习，获取自表达模块损失函数；通过监督特征学习模块从潜在表示中提取与聚类任务相关的特征，得到监督特征学习模块损失函数；根据所述自编码器损失函数、自表达模块损失函数以及监督特征学习模块损失函数得到优化目标函数；根据得到的相关系数矩阵计算出亲和矩阵，并利用所述亲和矩阵进行谱聚类。本发明实施例能够抽取到对于聚类有用的特征，降低噪声数据的影响，提高聚类效果，也避免了标签不对齐的问题。

技术研发人员：蔡宏民;黄钦建
受保护的技术使用者：华南理工大学
技术研发日：2020.01.08
技术公布日：2020.05.29

完整全部详细技术资料下载

当前第2页1 2