一种基于潜在空间平滑自表征的子空间聚类方法

文档序号:8259577阅读:534来源:国知局
一种基于潜在空间平滑自表征的子空间聚类方法
【技术领域】
[0001] 本发明涉及子空间聚类技术领域,尤其涉及一种基于潜在空间平滑自表征的子空 间聚类方法。
【背景技术】
[0002] 许多实际的计算机视觉和图像处理应用中,往往需要处理和表示高维度数据。通 常这些高维数据可以表征为一个低维度的子空间。例如,不同光照条件下的人脸图像可以 近似为存在于一个9维的子空间;视频中一个刚体运动的目标轨迹以及不同变化的手写数 字存在于低维度子空间中。因此来自于不同类别的数据集合可以看为低维度子空间的集 合。子空间聚类的目标为给定数据集合的情况下,寻找子空间的数目,子空间的维数,以及 每个数据的类别分割。
[0003] 目前,子空间聚类常用的方法为求解数据平滑自表征矩阵构建关联图,利用谱分 割方法进行聚类。在进行数据平滑自表征矩阵求解之前,往往需要对数据进行降维处理,目 前现有技术中的降维方法包括主成分分析或者随机投影等,降维处理后数据维度降低,减 少了后续算法的计算复杂度以及计算时间,并且一定程度上剔除了数据中存在的噪声。
[0004] 上述现有技术中的降维方法的缺点为:这些降维方法是通用的,没有考虑子数据 集合中的空间聚类算法的具体特性。

【发明内容】

[0005] 本发明的实施例提供了一种基于潜在空间平滑自表征的子空间聚类方法,以提高 数据集合中的子空间聚类的准确度。
[0006] 一种基于潜在空间平滑自表征的子空间聚类方法,包括:
[0007] 对数据集合进行特征提取,构建数据矩阵X,根据所述数据矩阵X计算出初始的数 据投影矩阵P ;利用所述初始的数据投影矩阵P对所述数据矩阵X进行降维处理,得到初始 的数据平滑自表征矩阵C;
[0008] 按照设定的迭代算法,交替进行所述数据投影矩阵P和数据平滑自表征矩阵C的 优化处理,获取最终的数据平滑自表征矩阵c z;
[0009] 利用所述最终的数据平滑自表征矩阵cz构建关联图,利用所述关联图对所述数据 集合进行子空间聚类处理。
[0010] 所述的对数据集合X进行特征提取,构建数据矩阵,根据所述数据矩阵计算出初 始的数据投影矩阵P,包括:
[0011] 对数据集合进行特征提取,将数据集合本身和/或提取的特征扩展为一个向量, 将所有的向量组成数据矩阵X ;
[0012] 用0-1核函数构建数据矩阵X的K近邻图,得到权重矩阵W = (Wip,计算所述权 重矩阵W的对角矩阵D,所述对角矩阵D中的对角线元素D,., = ,计算拉普拉斯矩阵L =D-W;
[0013] 对XXT进行特征值分解,X T表示数据矩阵X的转置矩阵,P为XX T的前d个最大特 征值对应的特征向量组成的矩阵,将P作为初始的数据投影矩阵。
[0014] 所述的利用所述初始的数据投影矩阵P对所述数据矩阵X进行降维处理,得到初 始的数据平滑自表征矩阵C,包括:
[0015] 计算数据矩阵X降维投影后的数据Y = PTX,PT为初始的数据投影矩阵P的转置矩 阵;
[0016] 求解等式:a YTYC+CL = a YTY,得到初始的数据平滑自表征矩阵C,所述a为设定 的数值。
[0017] 所述的按照设定的迭代算法,交替进行所述数据投影矩阵P和数据平滑自表征矩 阵C的优化处理,获取最终的数据平滑自表征矩阵c z,包括:
[0018] 进行第一次迭代:固定数据平滑自表征矩阵,优化数据投影矩阵。
[0019] 计算 M = X i (x-xc) (X-XC)T- X 2XXT,上述 X jP A 2为设定的常数;
[0020] 对所述M进行特征值分解,选取M的前d个最小特征值所对应的特征向量作为第 一次迭代后得到的优化数据投影矩阵P1;
[0021] 进行第二次迭代:固定数据投影矩阵,优化数据平滑自表征矩阵;
[0022] 计算数据矩阵X降维投影后的数据Y2= P iTX,PiT为第一次迭代后得到的优化数据 投影矩阵?:的转置矩阵,求解等式:a Y2TY2C2+C2L = a Y2TY2,得到第二次迭代后的数据平滑 自表征矩阵C 2;
[0023] 进行第三次迭代:固定数据平滑自表征矩阵,优化数据投影矩阵;
[0024] 计算 M3=人丄(X_XC2) (X_XC2)T-人 2XXt
[0025] 对所述%进行特征值分解,选取M 3的前d个最小特征值所对应的特征向量作为第 三次迭代后得到的优化数据投影矩阵P3;
[0026] 依次类推,直到达到设定的迭代次数Z,得到最终的数据平滑自表征矩阵Cz。
[0027] 所述的利用所述最终的数据平滑自表征矩阵Cz构建关联图,利用所述关联图对所 述数据集合进行子空间聚类处理,包括:
[0028] 利用最终的数据平滑自表征矩阵Cz构建关联图:
【主权项】
1. 一种基于潜在空间平滑自表征的子空间聚类方法,其特征在于,包括: 对数据集合进行特征提取,构建数据矩阵X,根据所述数据矩阵X计算出初始的数据投 影矩阵P;利用所述初始的数据投影矩阵P对所述数据矩阵X进行降维处理,得到初始的数 据平滑自表征矩阵C; 按照设定的迭代算法,交替进行所述数据投影矩阵P和数据平滑自表征矩阵C的优化 处理,获取最终的数据平滑自表征矩阵cz; 利用所述最终的数据平滑自表征矩阵cz构建关联图,利用所述关联图对所述数据集合 进行子空间聚类处理。
2. 根据权利要求1所述的基于潜在空间平滑自表征的子空间聚类方法,其特征在于, 所述的对数据集合X进行特征提取,构建数据矩阵,根据所述数据矩阵计算出初始的数据 投影矩阵P,包括: 对数据集合进行特征提取,将数据集合本身和/或提取的特征扩展为一个向量,将所 有的向量组成数据矩阵X; 用0-1核函数构建数据矩阵X的K近邻图,得到权重矩阵W=(Wip,计算所述权重矩阵W的对角矩阵D,所述对角矩阵D中的对角线元素Dfi =,计算拉普拉斯矩阵L=D-W; 对XXT进行特征值分解,XT表示数据矩阵X的转置矩阵,P为XXT的前d个最大特征值 对应的特征向量组成的矩阵,将P作为初始的数据投影矩阵。
3. 根据权利要求2所述的基于潜在空间平滑自
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1