多视图聚类方法、终端设备以及计算机可读存储介质

文档序号:32521944发布日期:2022-12-13 19:49阅读:56来源:国知局
多视图聚类方法、终端设备以及计算机可读存储介质

1.本技术主要涉及多视图图像技术领域,尤其涉及一种多视图聚类方法、终端设备以及计算机可读存储介质。


背景技术:

2.锚点图是构建大尺度图矩阵的有效方法,在大尺度多视图数据谱聚类任务中展现了优异性能,然而,目前尚没有工作研究锚点图在不完备多视图数据聚类问题中的应用。当前不完备多视图数据聚类算法在大规模数据上的计算复杂度普遍较高,并且没有考量过各视图私有信息和视图间共享信息的发掘与融合问题。


技术实现要素:

3.本技术提供了一种多视图聚类方法、终端设备以及计算机可读存储介质。
4.为解决上述技术问题,本技术提供了一种多视图聚类方法,所述多视图聚类方法包括:
5.获取多视图数据的多视图数据矩阵;
6.基于所述多视图数据矩阵,获取每个视图数据的锚点图矩阵;
7.对所述每个视图数据的锚点图矩阵进行拼接,得到融合特异锚点图矩阵;
8.基于所述多视图数据矩阵,获取所述多视图数据的共享锚点图矩阵;
9.拼接所述融合特异锚点图矩阵和所述共享锚点图矩阵,得到融合锚点图矩阵;
10.基于所述融合锚点图矩阵,获取所述多视图数据的融合特征矩阵;
11.利用预设聚类算法对所述融合特征矩阵进行聚类,得到所述多视图数据的聚类结果。
12.其中,所述基于所述多视图数据矩阵,获取每个视图数据的锚点图矩阵,包括:
13.基于所述多视图数据矩阵,获取每个视图数据;
14.从所述每个视图数据中采样若干样本构成对应视图数据的锚点矩阵;
15.利用所述锚点矩阵,获取所述每个视图数据的锚点图矩阵。
16.其中,所述利用所述锚点矩阵,获取所述每个视图数据的锚点图矩阵,包括:
17.利用所述锚点矩阵构建视图数据与视图锚点之间的第一目标函数;
18.通过最小化所述第一目标函数,求取所述锚点图矩阵。
19.其中,所述利用所述锚点矩阵,获取所述每个视图数据的锚点图矩阵之后,所述多视图聚类方法还包括:
20.对所述每个视图数据的锚点图矩阵进行列规范化,其规范化方式如下:
[0021][0022]
其中,zv为列规范化前的锚点图矩阵,为列规范化后的锚点图矩阵。
[0023]
其中,所述基于所述多视图数据矩阵,获取所述多视图数据的共享锚点图矩阵,包括:
[0024]
初始化每个视图数据的锚点矩阵,以及初始化所述共享锚点图矩阵;
[0025]
构建关于所述锚点矩阵与所述共享锚点图矩阵的第二目标函数;
[0026]
将所述多视图数据矩阵输入所述第二目标函数,通过迭代求解得到所述每个视图数据的锚点矩阵和所述多视图数据的共享锚点图矩阵。
[0027]
其中,所述拼接所述融合特异锚点图矩阵和所述共享锚点图矩阵,得到融合锚点图矩阵,包括:
[0028]
获取所述融合特异锚点图矩阵和所述共享锚点图矩阵之间的平衡参数;
[0029]
利用所述平衡参数拼接所述融合特异锚点图矩阵和所述共享锚点图矩阵,得到融合锚点图矩阵。
[0030]
其中,所述基于所述融合锚点图矩阵,获取所述多视图数据的融合特征矩阵,包括:
[0031]
对所述融合锚点图矩阵进行奇异值分解,得到由左奇异向量构成的多视图数据的融合特征矩阵。
[0032]
其中,所述利用预设聚类算法对所述融合特征矩阵进行聚类,得到所述多视图数据的聚类结果之后,所述多视图聚类方法还包括:
[0033]
基于所述多视图数据的聚类结果,获取预测样本集,其中,所述预测样本集包括:正样本被正确预测为正样本的个数、负样本被正确预测为负样本的个数、负样本被错误预测为正样本的个数以及正样本被错误预测为负样本的个数;
[0034]
基于所述预测样本集,计算聚类结果评判指标,用于评判所述多视图数据的聚类效果;
[0035]
其中,所述聚类结果评判指标为准确率、精确率、召回率和/或f-score值。
[0036]
为解决上述技术问题,本技术提供了一种终端设备,其中,所述终端设备包括处理器、与所述处理器连接的存储器,其中,所述存储器存储有程序指令;
[0037]
所述处理器用于执行所述存储器存储的程序指令以实现如上述多视图聚类方法。
[0038]
为解决上述技术问题,本技术提供了一种计算机可读存储介质,所述存储介质存储有程序指令,所述程序指令被执行时实现上述多视图聚类方法。
[0039]
与现有技术相比,本技术的有益效果是:终端设备获取多视图数据的多视图数据矩阵;基于所述多视图数据矩阵,获取每个视图数据的锚点图矩阵;对所述每个视图数据的锚点图矩阵进行拼接,得到融合特异锚点图矩阵;基于所述多视图数据矩阵,获取所述多视图数据的共享锚点图矩阵;拼接所述融合特异锚点图矩阵和所述共享锚点图矩阵,得到融合锚点图矩阵;基于所述融合锚点图矩阵,获取所述多视图数据的融合特征矩阵;利用预设聚类算法对所述融合特征矩阵进行聚类,得到所述多视图数据的聚类结果。本技术提出的方法与同类基于锚点图的多视图聚类方法以及代表性不完备多视图聚类方法相比,计算速度更快;此外,在多视图数据特异信息、共享信息发掘与融合方面的探索,使所提出方法的聚类精度更高。
附图说明
[0040]
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于
本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。其中:
[0041]
图1是本技术提供的多视图聚类方法一实施例的流程示意图;
[0042]
图2是本技术基于信息互补锚点图的不完备多视图聚类实施方案ssaglimc流程图;
[0043]
图3是本技术提供的终端设备的一实施例的框架示意图;
[0044]
图4是本技术提供的计算机存储介质一实施例的结构示意图。
具体实施方式
[0045]
下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本技术的一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
[0046]
本技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本技术的实施例,例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0047]
为了解决上述的问题,本技术提出了基于信息互补锚点图的快速不完备多视图聚类算法,该方法首先通过分别构建各不完备视图的特异锚点图学习各视图的私有信息,其次通过构建多视图一致锚点图学习视图间的共享信息,综合多视图数据的私有信息和共享信息,使模型可以更快速、更全面地捕获多视图数据内部隐含的表征信息。
[0048]
具体请参阅图1和图2,图1是本技术提供的多视图聚类方法一实施例的流程示意图,图2是本技术基于信息互补锚点图的不完备多视图聚类实施方案ssaglimc流程图。
[0049]
如图1所示,本实施例的多视图聚类方法具体包括以下步骤:
[0050]
步骤s11:获取多视图数据的多视图数据矩阵。
[0051]
在本技术实施例中,多视图数据可以包括针对同一区域的不同视角拍摄得到的多个视图,还可以基于每个视图生成的锚点图。多视图数据矩阵可以包括多个视图的原始图像,也可以包括是多个视图的锚点图,还可以同时包括原始图像和锚点图。
[0052]
具体地,原多视图数据中的第v个视图的数据矩阵表示为v=1,2,...v,v为视图个数,mv为第v个视图样本的维数,nv为第v个视图样本个数。
[0053]
步骤s12:基于多视图数据矩阵,获取每个视图数据的锚点图矩阵。
[0054]
在本技术实施例中,终端设备从多视图数据矩阵,提取每个视图数据,然后从每个视图数据中采样l个样本构成对应视图数据的锚点矩阵然后,终端设备利用所述锚点矩阵,获取所述每个视图数据的锚点图矩阵。
[0055]
具体地,终端设备通过最小化如下目标函数得到视图数据与视图锚点之间的锚点图矩阵zv,其中,矩阵大小为nv×
l:
[0056][0057]
其中,为视图数据,为视图锚点。
[0058]
进一步地,终端设备进一步约束锚点图矩阵的每行数据仅有k个非零元素,约束条件如下式按行求解
[0059][0060]
其中,
[0061]
终端设备根据每个视图缺失样本的位置定义对应的缺失指示矩阵gv:如果在完整数据中的第i个样本是缺失数据中的第j个样本,那么否则
[0062]
终端设备还可以通过如下方式规范化各个视图数据的锚点图矩阵,实现列规范化:
[0063][0064]
其中,zv为列规范化前的锚点图矩阵,为列规范化后的锚点图矩阵。
[0065]
步骤s13:对每个视图数据的锚点图矩阵进行拼接,得到融合特异锚点图矩阵。
[0066]
在本技术实施例中,终端设备用如下方式拼接各视图锚点图矩阵得到融合特异锚点图矩阵:
[0067][0068]
其中,表示将矩阵的行数由nv扩展为n,对于第v个视图,如果缺失数据中的第j个样本是在完整数据中的第i个样本,即那么的第j行就填充到第i行,否则行填充0。
[0069]
步骤s14:基于多视图数据矩阵,获取多视图数据的共享锚点图矩阵。
[0070]
在本技术实施例中,为了学习多个不完备多视图数据之间的共享锚点图矩阵,如图2所示,终端设备可以初始化各视图锚点矩阵bv,v=1,2,...v,以及初始化共享锚点图矩阵z为0元素矩阵。
[0071]
然后,终端设备最小化以下目标函数:
[0072][0073]
其中,ls为共享锚点图对应的锚点个数,z=[z
ij
],约束各视图锚点矩阵列正交,即(bv矩阵大小为mv×
ls),是为了去除锚点间的信息冗余。
[0074]
终端设备迭代求解各视图锚点矩阵bv和共享锚点图矩阵z(矩阵大小为n
×
ls),具体操作如下:
[0075]
固定z
(t)
,求b
v(t+1)
(v=1,2,...v),对x
vtgvtz(t)
进行奇异值分解得到左右奇异向量
矩阵u和v,则各视图锚点矩阵为b
v(t+1)
=uv;
[0076]
固定b
v(t+1)
(v=1,2,...v),按行求
[0077][0078]
其中,其中,g
vdv(t+1)
表示将矩阵d
v(t+1)
的行数由nv扩展为n,对于第v个视图,如果缺失数据中的第j个样本是在完整数据中的第i个样本,即那么d
v(t+1)
的第j行就填充到第i行,否则行填充0。
[0079]
终端设备还可以通过如下方式规范化共享锚点图矩阵:
[0080][0081]
步骤s15:拼接融合特异锚点图矩阵和共享锚点图矩阵,得到融合锚点图矩阵。
[0082]
在本技术实施例中,终端设备加权拼接融合特异锚点图矩阵和共享锚点图矩阵得到融合锚点图矩阵:
[0083][0084]
其中,τ是特异锚点图和共享锚点图间的平衡参数。
[0085]
步骤s16:基于融合锚点图矩阵,获取多视图数据的融合特征矩阵。
[0086]
在本技术实施例中,终端设备对融合锚点图矩阵z
fuse
进行奇异值分解,左奇异向量构成的矩阵即为融合特征矩阵u
fuse

[0087]
步骤s17:利用预设聚类算法对融合特征矩阵进行聚类,得到多视图数据的聚类结果。
[0088]
在本技术实施例中,终端设备利用k-means算法对融合特征矩阵u
fuse
聚类。在其他实施例中,也可以采用其他聚类算法对融合特征矩阵u
fuse
聚类,在此不再赘述。
[0089]
进一步地,终端设备还可以基于多视图数据的聚类结果,获取预测样本集,其中,所述预测样本集包括:正样本被正确预测为正样本的个数、负样本被正确预测为负样本的个数、负样本被错误预测为正样本的个数以及正样本被错误预测为负样本的个数。
[0090]
终端设备基于所述预测样本集,计算聚类结果评判指标,用于评判所述多视图数据的聚类效果。其中,所述聚类结果评判指标为准确率、精确率、召回率和/或f-score值。
[0091]
例如,终端设备可以计算聚类结果评判指标:聚类精度ac和f-score值:
[0092][0093][0094]
其中,tp为正样本被正确预测为正样本的个数,tn为负样本被正确预测为负样本的个数,fp为负样本被错误预测为正样本的个数,fn为正样本被错误预测为负样本的个数。进行10次聚类,并记录10次聚类结果的均值。
[0095]
本技术进行了实验验证:本技术提出的方法与当前几种流行算法在不完备多视图数据上进行了聚类性能(聚类精度ac和f-score值)和计算效率的比较,结果如表1所示。多视图数据是常见色素性皮肤病变的多源皮肤镜图像数据集,包含10015个样本,提取像素特征、gabor小波特征、lbp特征以及灰度直方图特征作为数据的4个视图,对应的特征维度分别为784、392、256和11。每个视图均存在随机的样本缺失,缺失比例为30%。mvsc、lmvsc、bmvc和smvsc是完备多视图聚类算法,对于上述四个算法,首先用各视图的平均值填充缺失样本,然后将数据作为完备多视图数据输入算法。对于所有算法,运行时间测试不包含最后一步中涉及的k-means聚类过程消耗的时间,仅考虑各算法生成最终的融合特征矩阵所消耗的时间。所有方法均在相同的计算机配置上进行的运算复杂度测试:windows 10系统、matlab 2017a、intel core 9700cpu和16gb ram。可以看出本技术中的算法聚类性能明显优于对比算法,并且计算效率也是最高的。
[0096]
表1与当前几种基于锚点图的多视图聚类算法以及代表性不完备多视图聚类算法在30%缺失比例下的多视图数据上的聚类性能及计算时间对比
[0097][0098]
在本技术实施例中,终端设备获取多视图数据的多视图数据矩阵;基于所述多视图数据矩阵,获取每个视图数据的锚点图矩阵;对所述每个视图数据的锚点图矩阵进行拼接,得到融合特异锚点图矩阵;基于所述多视图数据矩阵,获取所述多视图数据的共享锚点图矩阵;拼接所述融合特异锚点图矩阵和所述共享锚点图矩阵,得到融合锚点图矩阵;基于所述融合锚点图矩阵,获取所述多视图数据的融合特征矩阵;利用预设聚类算法对所述融合特征矩阵进行聚类,得到所述多视图数据的聚类结果。本技术提出的方法与同类基于锚点图的多视图聚类方法以及代表性不完备多视图聚类方法相比,计算速度更快;此外,在多视图数据特异信息、共享信息发掘与融合方面的探索,使所提出方法的聚类精度更高。
[0099]
本技术提出基于信息互补锚点图的不完备多视图聚类算法ssaglimc:(1)通过对各视图数据随机采样得到锚点,并构建各视图数据与锚点的特异锚点图以学习各视图的私有信息;(2)设计共享锚点图学习模型以学习视图间的共享信息,在共享锚点图的学习过程中,模型自适应学习各视图锚点;(3)拼接各视图的特异锚点图和共享锚点图得到融合锚点图;(4)对融合锚点图进行奇异值分解,得到融合特征表征。
[0100]
为实现上述实施例中的多视图聚类方法,本技术还提供一种终端设备300,具体请参见图3,本技术实施例的终端设备300包括处理器31、存储器32、输入输出设备33以及总线34。
[0101]
该处理器31、存储器32、输入输出设备33分别与总线34相连,该存储器32中存储有
程序数据,处理器31用于执行程序数据以实现上述实施例所述的多视图聚类方法。
[0102]
在本技术实施例中,处理器31还可以称为cpu(central processing unit,中央处理单元)。处理器31可能是一种集成电压控制系统芯片,具有信号的处理能力。处理器31还可以是通用处理器、数字信号处理器(dsp,digital signal process)、专用集成电压控制系统(asic,application specific integrated circuit)、现场可编程门阵列(fpga,field programmable gate array)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器31也可以是任何常规的处理器等。
[0103]
本技术还提供一种计算机存储介质,请继续参阅图4,图4是本技术提供的计算机存储介质一实施例的结构示意图,该计算机存储介质400中存储有程序数据41,该程序数据41在被处理器执行时,用以实现上述实施例的多视图聚类方法。
[0104]
本技术的实施例以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本技术各个实施方式所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0105]
以上所述仅为本技术的实施方式,并非因此限制本技术的专利范围,方式利用本技术说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本技术的专利保护范围内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1