基于低秩张量学习的无监督多视图特征选择方法及系统

文档序号:30218072发布日期:2022-05-31 19:15阅读:164来源:国知局
基于低秩张量学习的无监督多视图特征选择方法及系统

1.本发明涉及图像处理技术领域,尤其涉及一种基于低秩张量学习的无监督多视图特征选择方法及系统。


背景技术:

2.本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
3.随着信息采集和信息处理技术的快速发展,图像数据样本通常具有多视图特征。例如,一幅图像可以从颜色、边缘、纹理等不同的角度进行描述。多视图数据可以更加全面、准确地描述事物的数据信息。由于包含异构信息的多视图数据比传统的单视图数据具有更大的优势,因此,多视图学习已经成为了一个非常重要的研究方向,其中包括多视图聚类、多视图检索等。由于多视图数据总是高维的,直接使用会造成较高的存储和计算成本并对后续的学习过程产生不利影响。特征选择作为一种有效解决这些问题的方法,在多视图学习中受到了广泛关注。
4.多视图特征选择旨在从原始特征空间中过滤掉冗余、不相关的特征,选取判别性强的特征组成特征子集。由于实际应用中标签信息很难获取,对数据进行人工标注非常耗时耗力。因此,无监督多视图特征选择方法更具有实用性。目前,已有的无监督多视图特征选择方法通常通过挖掘不同视图之间的互补性和多样性信息来选择判别特征,但没有考虑到不同视图之间的高阶信息,这可能会影响特征选择的性能。


技术实现要素:

5.为了解决上述问题,本发明提出了一种基于低秩张量学习的无监督多视图特征选择方法及系统,将伪标签学习与特征选择整合到一个统一的学习框架中,联合多视图谱聚类和低秩张量学习得到高质量的伪标签来指导特征选择过程。
6.在一些实施方式中,采用如下技术方案:
7.一种基于低秩张量学习的无监督多视图特征选择方法,包括:
8.获取图像数据集,对每个图像数据提取若干个视图特征,获得多视图特征数据集;
9.基于多视图谱聚类和低秩张量学习得到每个视图数据的伪标签矩阵,通过稀疏回归模型学习特征选择矩阵,构造基于低秩张量学习的无监督多视图特征选择目标函数;
10.采用迭代优化方法求解所述目标函数,得到特征选择矩阵;
11.根据特征选择矩阵计算各个特征的重要性,将特征按照所计算结果从大到小排序,选择前k个特征构成多视图特征子集。
12.在另一些实施方式中,采用如下技术方案:
13.一种基于低秩张量学习的无监督多视图特征选择系统,包括:
14.数据集获取模块,用于获取图像数据集,对每个图像数据提取若干个视图特征,获得多视图特征数据集;
15.目标函数构造模块,用于基于多视图谱聚类和低秩张量学习得到每个视图数据的伪标签矩阵,通过稀疏回归模型学习特征选择矩阵,构造基于低秩张量学习的无监督多视图特征选择目标函数;
16.求解模块,用于采用迭代优化方法求解所述目标函数,得到特征选择矩阵;
17.特征选择模块,用于根据特征选择矩阵计算各个特征的重要性,将特征按照所计算结果从大到小排序,选择前k个特征构成多视图特征子集。
18.在另一些实施方式中,采用如下技术方案:
19.一种终端设备,其包括处理器和存储器,处理器用于实现各指令;存储器用于存储多条指令,所述指令适于由处理器加载并执行上述的基于低秩张量学习的无监督多视图特征选择方法。
20.在另一些实施方式中,采用如下技术方案:
21.一种计算机可读存储介质,其中存储有多条指令,所述指令适于由终端设备的处理器加载并执行上述的基于低秩张量学习的无监督多视图特征选择方法。
22.与现有技术相比,本发明的有益效果是:
23.(1)本发明方法将伪标签学习与特征选择整合到一个统一的学习框架中,联合多视图谱聚类和低秩张量学习得到高质量的伪标签进而指导最终的特征选择过程。
24.(2)本发明方法利用谱聚类捕获每个视图的局部结构信息,同时通过最小化由不同视图的指示矩阵组成的张量核范数来捕获不同视图之间隐藏的高阶信息。使得学到的伪标签更具有指导性和判别性,从而选择出判别性高的特征。
25.本发明的其他特征和附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本方面的实践了解到。
附图说明
26.图1为本发明实施例中的基于低秩张量学习的无监督多视图特征选择方法流程图;
27.图2为本发明实施例中基于低秩张量学习的无监督多视图特征选择方法过程示意图。
具体实施方式
28.应该指出,以下详细说明都是例示性的,旨在对本技术提供进一步的说明。除非另有指明,本发明使用的所有技术和科学术语具有与本技术所属技术领域的普通技术人员通常理解的相同含义。
29.需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本技术的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
30.实施例一
31.在一个或多个实施方式中,公开了一种基于低秩张量学习的无监督多视图特征选择方法,结合图1和2,具体包括:
32.步骤1:获取真实的原始数据集;对每个图像数据提取若干个视图特征,获得多视图特征数据集;
33.本实施例中,原始数据集由多个图像数据构成;对每个图像数据进行特征提取,得到多视图特征数据集;视图特征如lbp、sift和gist等。
34.步骤2:对于多视图数据集,基于多视图谱聚类和低秩张量学习得到每个视图数据的伪标签矩阵,通过稀疏回归模型学习特征选择矩阵,构造基于低秩张量学习的无监督多视图特征选择目标函数;
35.步骤2.1:伪标签学习。
36.由于无监督特征选择方法没有可用的标签信息,因此,通常通过探索数据的聚类结构信息作为伪标签来指导特征选择过程。多视图谱聚类是一种能够有效捕获数据聚类结构信息的方法。为了更好利用不同视图指示矩阵间的高阶结构和互补信息,受基于t-svd张量核范数的启发,在伪标签学习中加入低秩张量约束。此外,为了获得更精确的伪标签,对指示矩阵施加非负约束。因此,伪标签学习的目标函数为:
[0037][0038]
其中,表示第v个视图的指示矩阵,即伪标签矩阵;n是图像数据个数,c是聚类数,v代表视图序号,v=1,

,v,v表示视图总数;l
(v)
是第v个视图的拉普拉斯矩阵;对于张量其横向切片由指示矩阵f
(v)
组成;表示的张量核范数。
[0039]
步骤2.2:学习特征选择矩阵。
[0040]
在已学习的伪标签的指导下,通过回归模型学习特征选择矩阵,并利用l
2,1
范数给特征选择矩阵w
(v)
施加行稀疏约束,特征选择矩阵学习的目标函数为:
[0041][0042]
其中,分别表示第v个视图的特征数据集和特征选择矩阵,||w
(v)
||
2,1
表示特征选择矩阵w
(v)
的l
2,1
范数。β
(v)
表示第v个视图的权重因子。第一项表示回归模型,第二项是稀疏正则化项,利用l
2,1
范数可以使特征选择矩阵能更好地去除冗余和噪声特征。通过最小化稀疏回归模型可以利用伪标签学习具有行稀疏性的特征选择矩阵。
[0043]
步骤2.3:联合学习框架。
[0044]
将伪标签和特征选择矩阵学习整合到一个统一的学习框架中,得到基于低秩张量学习的无监督多视图特征选择方法的整体目标函数如下所示:
[0045][0046]
其中,第一项和第四项分别表示谱聚类和低秩张量约束,用于学习各个视图数据的伪标签矩阵,第二项表示通过回归模型学习每个视图的特征选择矩阵,第三项是利用l
2,1
范数将特征选择矩阵w
(v)
约束为行稀疏,α
(v)
,β
(v)
是各项的权重参数,λ表示平衡参数。在该框架中,伪标签可以用于指导特征选择矩阵的学习,特征选择矩阵有助于获取更准确的伪标签,两者相互促进。
[0047]
步骤3:采用迭代优化方法求解基于低秩张量学习的无监督多视图特征选择的目标函数,得到特征选择矩阵。
[0048]
步骤3.1:引入辅助变量目标函数改写为:
[0049][0050]
进一步地,目标函数的增广拉格朗日函数如下所示:
[0051][0052]
步骤3.2:固定其他变量,求解特征选择矩阵w
(v)
。目标函数变为:
[0053][0054]
公式(6)不可微,因此将公式(6)转化为以下等价形式:
[0055][0056]
其中,表示对角矩阵,第i个对角元素为通过对上式求导,并将导数设为0,可得:
[0057][0058]
步骤3.3:固定其他变量,求解辅助变量目标函数变为:
[0059][0060]
利用张量阈值收缩算子计算可得公式(9)的最优解为:
[0061][0062]
其中,表示张量的奇异值分解和表示张量的奇异值分解和是f-对角张量,其对角元素在傅里叶域表示为
[0063]
步骤3.4:固定其他变量,求解指示矩阵f
(v)
。目标函数变为:
[0064][0065]
并根据公式(8),公式(11)可以改写为:
[0066][0067]
其中,是单位矩阵。
[0068]
公式(12)的拉格朗日函数为:
[0069][0070]
其中,γ和ψ
(v)
是拉格朗日乘子,分别用于调节正交约束和非负约束。
[0071]
根据karush-kuhn-tuckre(kkt)条件,可得
[0072]
通过对上式求导,并将导数设为0,可得:
[0073][0074]
步骤3.4:固定其他变量,求解α
(v)
。更新公式为:
[0075][0076]
步骤3.5:固定其他变量,求解β
(v)
。更新公式为:
[0077]
β
(v)
=1/(2||x
(v)w(v)-f
(v)
||f)
ꢀꢀꢀꢀ
(16)
[0078]
步骤4:根据特征选择矩阵计算各个特征的重要性,将特征按照所计算结果从大到小排序,选择前k个特征构成特征子集,其中,k是所选特征数;
[0079]
特征数据集中的第i个特征与特征选择矩阵中第i个行向量相对应,利用衡量第i个特征的重要性。将所有特征按照计算结果从大到小排序,选择前k个特征构成特征子集,其中,k是所选择的特征数。
[0080]
步骤5:根据已选择的特征子集,利用k-means聚类算法评价特征选择性能。采用常用的两个聚类评价指标:聚类准确度(acc)和归一化互信息(nmi)来评价聚类效果。acc和nmi这两个聚类评价指标可以在执行k-means聚类算法之后根据得到的预测标签进行计算。其中,acc代表正确预测的数据的数量占数据总数的比例;nmi用来衡量两个随机变量之间的相关程度,即一个随机变量中有关另一个随机变量的信息量。这两个评价指标数值范围都在0和1之间,数值越大表示性能越好。
[0081]
本实施例中,得到的特征子集可以用于后续的图像分类、图像中重要特征的识别与提取或者临床重要基因的识别等,这是本领域技术人员能够实现的,不再详述。
[0082]
实施例二
[0083]
在一个或多个实施方式中,公开了一种基于低秩张量学习的无监督多视图特征选择系统,包括:
[0084]
数据集获取模块,用于获取图像数据集,对每个图像数据提取若干个视图特征,获得多视图特征数据集;
[0085]
目标函数构造模块,用于基于多视图谱聚类和低秩张量学习得到每个视图数据的伪标签矩阵,通过稀疏回归模型学习特征选择矩阵,构造基于低秩张量学习的无监督多视图特征选择目标函数;
[0086]
求解模块,用于采用迭代优化方法求解所述目标函数,得到特征选择矩阵;
[0087]
特征选择模块,用于根据特征选择矩阵计算各个特征的重要性,将特征按照所计算结果从大到小排序,选择前k个特征构成多视图特征子集。
[0088]
需要说明的是,上述各模块的具体实现方式已经在实施例一中进行说明,此处不再详述。
[0089]
实施例三
[0090]
在一个或多个实施方式中,公开了一种终端设备,包括服务器,所述服务器包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现实施例一中的基于低秩张量学习的无监督多视图特征选择方法。为了简洁,在此不再赘述。
[0091]
应理解,本实施例中,处理器可以是中央处理单元cpu,处理器还可以是其他通用处理器、数字信号处理器dsp、专用集成电路asic,现成可编程门阵列fpga或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
[0092]
存储器可以包括只读存储器和随机存取存储器,并向处理器提供指令和数据、存储器的一部分还可以包括非易失性随机存储器。例如,存储器还可以存储设备类型的信息。
[0093]
在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。
[0094]
实施例四
[0095]
在一个或多个实施方式中,公开了一种计算机可读存储介质,其中存储有多条指令,所述指令适于由终端设备的处理器加载并执行实施例一中所述的基于低秩张量学习的无监督多视图特征选择方法。
[0096]
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1