一种多源异构大数据的一致性表示方法

文档序号:10535062阅读:619来源:国知局
一种多源异构大数据的一致性表示方法
【专利摘要】本发明公开了一种多源异构大数据的一致性表示方法。本方法针对多源异构数据的特征异构性问题,利用多源异构数据间的语义互补性,基于子空间学习方法,将多源异构数据投影到一个中层冗余特征同构空间。并在这个同构空间中,将来自不同来源的相关描述耦合到一起。为了挖掘出中层空间中同构描述之间的语义一致性,利用先验知识,将特征同构描述投影到高层语义共享子空间上,进而消除冗余和噪声信息。由此,可以获得多源异构数据的语义一致模式。本发明有助于在多媒体分析、信息检索和医疗诊断等领域,获得准确且鲁棒的多源数据评估分析结果。
【专利说明】
一种多源异构大数据的一致性表示方法
技术领域
[0001] 本发明属于信息技术领域,针对海量多源异构数据环境下的特征异构性问题,提 出了一种多源异构大数据的一致性表示方法。
【背景技术】
[0002] 近年来,随着大量高技术数码产品的出现,由这些异源电子设备产生的多源异构 数据(felti-source Heterogeneous Data)己经遍布到人们现实生活的各个角落。所谓多 源异构数据是指来自不同来源或者渠道,但表达的内容相似,以不同形式、不同来源、不同 视角和不同背景等多种样式出现的数据。如图1所示,新浪微博、腾讯微信和搜狐网站关于 相同的新闻的不同形式的报道;老年痴呆症(Alzheimer)患者的大脑可以由核磁共振 (MRI)、正电子成像技术(PET)和X光产生多种不同视角的医学成像;Wikipedia网站上对花 豹的描述采用了图片、文本和语音等不同来源的媒介;相同的建筑物白宫可以处在不同的 背景之下。
[0003] 然而,多源数据呈现出底层特征异构、高层语义相关的特性。传统的单源学习 (Mono-source Learning)方法已无法适应多源数据的特性。一种朴素的(naive)处理多源 异构数据的方式就是直接将所有来源的样本描述强行拼接成一个长向量,使其变成一般的 单源学习问题(仅对配对数据有效)。该方法符合将一个困难问题归结为一个已解决简单问 题的思想,然而其实际效果往往不尽如人意。事实上,这种强行拼接的方法完全忽视了对学 习有极大用处的不同来源间的语义互补性。因此,如若利用针对单源数据的方法处理多源 异构数据的若干相关问题,必然导致错误的结果。
[0004] 近年来,国内外的研究人员提出了各种各样的多源学习方法,探索异源数据间的 潜在关系,以期提高多源学习的效率。这些研究主要包括:协同训练(Co-training)、多核学 习(Multiple Kernel Learning,MKL)、子空间学习(Subspace Learning,SL) 〇
[0005] 协同训练是一种半监督学习方法,利用异源间的互补信息,提高训练模型的泛化 能力。它要求每个来源都有大量的有标记样本,以训练出一个强学习器,然后使用这个学习 器对未标记样本进行标记,并从中挑选出若干标记可信度较高的样本,加入对方来源的学 习器中,以便对方利用这些新标记的样本进行更新,提高训练模型的泛化能力。这种方法的 缺陷在于,它要求每个来源都有大量的有标记样本,学习条件太高。此外,它要求不同的来 源间是同构的,所以无法解决异源间的特征异构性问题。(参考文献:Blum A,Mitche 11 T M.Combining Labeled and Unlabeled Data with Co-Training.Proceedings of the ACM International Conference on Computational Learning Theory,Madison, Wisconsin,USA,1998:92-100.)
[0006] 而多核学习是一种非线性模式分析方法,它组合利用了各个基本核的特征映射能 力,使数据在由多个特征空间构建的组合空间中得到更好的表达,从而找出多个来源间的 关联结构。在多核框架下,每个来源使用不同的基本核函数,样本在特征空间中的表示问题 转化成为基本核与组合权系数的选择问题。在这个由多个特征空间构建的组合空间中,通 过将异构数据的不同特征分量分别输入对应的基本核函数进行映射,使数据在新的组合空 间中得到更好的表达,从而提高分类正确率或预测精度。其缺点在于:很难针对每个来源选 择恰当的基本核函数和组合权系数。(参考文献:G6aenM,A1 paydin E.Multiple Kerne 1 Learning Algorithms.Journal of Machine Learning Research,2011,12:2211-2268?)
[0007] 共享子空间学习旨在获得多个来源间共享的潜在子空间。利用多源异构数据间的 相关性和先验知识,将异构数据投影到共享子空间上,从而消除不同来源间的特征异构性, 以捕捉不同来源间的互补信息。这类方法的优点在于:1)可以得到异构描述的同构描述,便 于直接度量异构描述间的相关性,消除不同来源之间的异构性;2)在投影过程中,能够充分 利用不同来源间的相关性和近似分布,提取更多的互补信息。(参考文献:Hard 〇〇n D R, Szedmak S,Taylor J S.Canonical Correlation Analysis:an Overview with Application to Learning Methods.Neural Computation,2004,16(12):2639-2664.)
[0008] 表1列出了各类多源学习方法的优缺点。
[0009]表1.各类多源学习方法的优缺点


【发明内容】

[0011] 本发明的目的:
[0012] 在多媒体分析、信息检索和医疗诊断等现实应用中,经常会遇到相同的语义概念 由不同来源的对象表达的情况。然而,多源异构数据通常呈现出底层特征异构、高层语义相 关的特性。传统的单源学习方法已无法适应多源数据的特性。如何充分利用异源数据,挖掘 其一致性和互补信息,以充分理解多源数据的内容是当今多源数据分析的热点和难点。人 们很自然地意识到,如果能将不同来源的异构描述整合为某个涵盖了所有来源间互补信息 的语义一致模式,那么由此得来的一致性描述就更加有利于捕捉不同来源间的互补性。因 此,如何从不同来源的异构数据中挖掘出嵌入了异源间互补信息的语义一致模式,对于这 些应用获得准确且鲁棒的多源数据评估分析结果是十分重要的。
[0013] 然而,挖掘多源异构数据的语义一致模式是一项艰巨的任务。首先,如图2所示,由 于不同的来源横跨异构的底层特征空间,所以多源异构描述之间没有显式的对应关系。例 如,在同一张网页中,共生的图片和文本分别从视觉和文字角度传达了相同的语义概念,所 以基于它们各自的异构描述很难度量它们之间的关系。因此,为了关联不同的来源,首先需 要解决的问题就是构建一个中层特征同构空间,并且在这个空间中充分嵌入不同来源间的 互补信息。
[0014] 如图3所示,对于中层空间中的同构描述主要由必要成分、冗余成分和噪声成分组 成(参考文南犬:Qiang Cheng,Hongbo Zhou,Jie Cheng.The Fisher-Markov Selector:Fast Selecting Maximally Separable Feature Subset for Multiclass Classification with Applications to High-Dimensional Data.IEEE Trans.Pattern Analysis and Machine Intelligence ,2011,33(6): 1217-1233.)。必要成分指的是同构描述之间的互补 信息,这些信息对于利用先验知识构建语义一致模式是必要的。不同于必要成分,后两者指 的是非必要信息。它们之间的区别在于冗余成分和必要成分高度相关,而噪声成分和前两 者之间没有相关性。因此,在挖掘语义一致模式过程中另一个需要亟待解决的问题就是提 取特征同构描述之间共享的高层语义子空间。由此,必要成分得以很好地保留而没有残留 冗余和噪声成分。
[0015] 而本发明的具体目的就是针对多源异构数据的特征异构性问题,提供一种多源异 构大数据的一致性表示方法,利用多源异构数据间的语义互补性,基于子空间学习方法,将 多源异构数据投影到一个中层冗余特征同构空间。并在这个同构空间中,将来自不同来源 的相关描述耦合到一起,消除高维中层特征同构描述中的冗余和噪声成分,以此挖掘出嵌 入了异源间互补信息的语义一致模式,进而获得多源异构数据特征描述的融合表示。
[0016] 本发明的技术方案:
[0017] 以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并 非用于限定本发明的范围。
[0018] 如图4所示,本发明提供了一种挖掘多源异构数据语义一致模式的基本框架。这个 框架由两个数学模型组成,一个为同构相关冗余变换(Isomorphic Relevant Redundant Transformation,IRRT)模型,另一个为基于相关性的联合特征学习(Correlation-based Joint Feature Learning,CJFL)模型。其中,通过学习多个线性变换,IRRT模型将多个异构 的底层特征空间线性地映射到一个中层高维冗余特征同构空间,消除异源间的特征异构 性,从而捕捉到更多的不同来源间的互补信息。为了挖掘出中层空间中同构描述之间的语 义一致性,CJFL模型利用先验知识,将特征同构描述投影到一个低维的高层语义共享子空 间上,进而消除冗余和噪声信息。由此,可以获得多源异构数据的语义一致模式。从而有助 于在多媒体分析、信息检索和医疗诊断等领域,获得准确且鲁棒的多源数据评估分析结果。 [0019]具体的技术方案为:
[0020] 1)IRRT模型会利用不同来源之间的互补性,学习多个线性变换A和B,以消除不同 来源间的特征异构性,从而可以获得一个中层冗余特征同构空间。在这个同构空间中,来自 不同来源的相关描述被耦合到一起,以此捕捉出不同来源间的互补信息。从而便于在中层 高维同构空间中直接度量多源异构数据间的相似性。
[0021] 例如,如图4所示,第i对共生样本XjPyi被投影到中层高维特征同构空间中,以此 消除了它们之间的特征异构性。
[0022] 2)与此同时,为了挖掘同构描述之间的语义一致性,CJFL模型在IRRT模型学习到 的高维特征同构空间中,利用先验知识提取特征同构描述之间共享的高层语义子空间。在 语义共享子空间中,来自同一来源相同类别的样本靠拢在一起,而不同类别的实例则保持 一定距离。从而,在中层空间中有效地去除了冗余和噪声信息。
[0023] 如图4所示,第i对耦合描述被映射到语义共享子空间中,并同时保持了它们之间 的互补性。由于带有来自中层空间的必要互补信息,由此得来的语义一致模式和任一单一 来源的描述相比更可能是线性可分的。
[0024] 下面进一步说明本发明的主要内容:
[0025] 1)同构相关冗余变换模型
[0026]本发明提供的同构相关冗余变换IRRT模型,利用了不同来源之间的互补性,学习 多个线性变换,比如图4中有两个不同来源X和Y,则学习两个线性变换A和B,以消除不同来 源间的特征异构性,从而将多源异构数据X e Ewx~和r E股0七(心为来源X的维度,dy为来源 Y的维度,n为样本数量)投影到一个中层冗余特征同构空间。在这个同构空间中,来自不同 来源的相关描述被耦合到一起,并对变换后的数据施加低秩(Low-rank)约束,以此捕捉出 不同来源间的互补信息。
[0027] IRRT方法的优化模型如下: min ||A'^-
[0028] f (1) s.t. and ||V < f
[0029] 其中4 e EdxXp,B E Edyxp,p> >max(dx,dy),p为中层高维冗余特征同构空间的维 度,e和y是预先指定的正参数,用来控制变换后的数据携带的信息量。在公式(1)中引入迹 范数(低秩)约束的目的就是在特征同构空间中捕捉更多不同来源间的潜在互补信息。
[0030] 需要注意的是,直接求解公式(1)中的问题^^不是一个简单的任务,原因有两点。 首先,尽管问题V:单独对于每个变量A和B都是凸问题,但问题^^整体上是一个非凸问题。 第二,迹范数约束是不平滑的,这就使得求解这个模型的最优解变得更加困难。然而,引理1 表明在问题^^中对变换数据的迹范数约束可以松弛地转换为问题中对投影矩阵的迹范 数约束。
[0031] 引理1对于正数s和任意两个可相乘矩阵C和D,如果
[0032] IIClkllDll^S
[0033] 那么
[0034] IICDII* 彡 S
[0035]证明:由于迹范数是矩阵范数,所以它满足任意两个可相乘矩阵的相容性原理。 (参考文南犬:Carl D . Meyer . Matrix Analysis and Applied Linear Algebra . SIAM Publishers,2000?)所以,可以得到下式:
[0036] ||CD||* 彡 IICIWIDII*
[0037] 因此,如果IICIWIDIKS,那么IICDIKS。这就完成了引理1的证明。
[0038] 根据引理1,如果在问题中预先指定的正参数£和丫满足:
[0039] ||X||*||A||*彡e和||Y||*||B||*彡 y (2)
[0040] 那么,可以得到||XA|Ke和IlYBlKy。因此,在问题W冲的迹范数约束可以转化 为:
[0041 ] ||A||*彡e/||X||*和||B||*彡 y/||Y||* (3)
[0042] 由此,利用公式(3)中的松弛约束,可以将问题%转化为如下问题W2: min \\XA - YB\\j
[0043] A'B (4) s.t. ||/l|U<£/p|U md \\B\U<y/\\Y\U
[0044] 2)基于相关性的联合特征学习
[0045]本发明提供的基于相关性的联合特征学习模型CJFL,在IRRT模型构建的中层高维 冗余特征同构空间中,利用先验知识消除冗余和噪声信息,将特征同构的高维描述投影到 一个低维的高层语义共享子空间上。由此,获得多源异构数据的语义一致模式。
[0046] CJFL模型的具体细节如下:设(A'B,是问题%的最优解。那么,可以得到两组同 构相关几余描述:/= 和R 8 'yj丨^、设歧和分别是j和r中第t个类的样 本集合。定义如下各式:
[0047] <S| = {(a^ayjjai.cjy G C^i ^ /) (5)
[0048] 辟=為)丨屹 b G 轉,i 尹 /} (6)
[0049] T)lx - I {at, ?,)|?; G A ay- £ C'S, i t- j, t k] (7)
[0050] 力铲二[(b0 e 贫八 bj. e Cp, i 幸 j, t * k) (8)
[0051] 设
[0052] 各=Zr.凝和知=2.r 碎 (9)
[0053] % = StSfcl# 和?k = &;^?浐 (1U)
[0054] 显然,来自于心或馬的每对数据在语义上是彼此相似,而来自于或%的每对数 据在语义上是彼此不相似。
[0055] 为了消除中层高维空间中的冗余和噪声信息,需要利用先验知识(类信息)学习一 个线性变换0elRPxfc(p为中层高维冗余特征同构空间的维度,k为高层低维语义共享子空间 的维度),以此参数化语义共享子空间。在数学上,需要最小化如下类内距离: 2 (0Ta, - 0Taj) (07〇[ - 0Ta/) + I (0Th - 07bj)'(&Tb「0Tbj)
[0056] 二 X tr(07(?i -ay)(ar-a/),0) + ^ tr (〇r(>; - /?;)(〇; - bjY&) YlutAjJ^Sx -tr(0Tjs0) -f tr(9rRs6) -tr(eru;: + Rs)e) (11)
[0057] 其中
[0058] Z (fli ~ ~ aif (12) Y(atAj)BSx
[0059] Rs = ^ {bi ~ bj)(hi - hj) (丨 3) ¥{hi,bj)eSY
[0060] 并且厶+馬是由数据集J和R构成的联合类内散度矩阵。与此同时,还要最大化如下 类间距离: (0ra( - 0ray)T (〇7aj - 0rr/y) + ^ (0r/?, - & ! hj)' ^Brh[ - 0rh() V( fi i而)£2?覃 V (i 力 j.)
[0061] = E ^(0T(a<-?;)(?<-?/)f0)+ Y, trle^bi-b^hi-hj)' e) =tr(0T/D0) + tr(0r/?.D0) -cr(0r(/r + /?z〇0) v*4)
[0062] 其中
[0063]】.$ 二 H (ai ~ aMat- %) (] 5) y(ai,aj)eVx
[0064] Z (^~hJ^bi~bj')T (16)
[0065] 并且/? +知是由数据集J和R构成的联合类间散度矩阵。为了同时最小化类内距离 并且最大化类间距离。可以直接将上述问题归纳为如下迹率优化问题:
(17)
[0067]其中,tr( ?)表示矩阵的迹,对?的正交约束用来消除中层空间中和必要信息高 度相关的冗余信息。
[0068] 在另一方面,应当完好地保留同构描述之间的互补性。因此,可将模型Qi重新定 义为如下形式:
(1約
[0070] 其中,丨|/0 - R0|||表示基于相关性的残差,用来避免破坏耦合描述的内在结构,而 正规化项丨|0丨||控制模型的复杂度,a和0为正规化参数。
[0071] 3)语义一致模式
[0072] 设(A'B,是问题W2的最优解,?$是问题02的最优解。那么,对于第i对异构描述 & 1,71),可以利用最优解#,8,?%得到异构描述各自的同构相关描述:
[0073] % = 0*rTrx;和 Ty;二 0*rrry( (19)
[0074] 此外,可以基于\和%得到不同模态的一致性描述Tl,即多源异构数据在高层语 义共享子空间上的语义一致模式:
[0075] Tj = (^, + %.)/2 (20)
[0076]本发明的有益效果:
[0077]针对于多源异构数据中存在的特征异构性问题,本发明提供了一种挖掘多源异构 数据语义一致模式的框架。该框架首先包含一种带有低秩(Low-rank)约束的IRRT模型,学 习多个线性变换,从而可以有效地捕捉到不同来源间的语义互补性,将多个异构底层特征 空间和一个高层语义共享子空间桥接起来。此外,为了挖掘出中层空间中同构描述之间的 语义一致性,CJFL模型在IRRT模型学习到的高维特征同构空间中,将特征同构的高维描述 投影到一个低维的高层语义共享子空间上,进而消除冗余和噪声信息。由此,可以获得多源 异构数据的语义一致模式,从而有助于在多媒体分析、信息检索和医疗诊断等领域,获得准 确且鲁棒的多源数据评估分析结果。
【附图说明】
[0078]图1为多源异构数据的示例图。
[0079]图2为多源异构数据的特征异构性的示例图。
[0080]图3为中层空间中同构描述的成分的示例图。
[0081 ]图4为挖掘多源异构数据语义一致模式的框架的示例图。
【具体实施方式】
[0082] 为使本发明的上述目的、特征和优点能够更加明显易懂,下面通过具体实施例和 附图,对本发明做进一步说明。
[0083] 本发明提供的多源异构大数据的一致性表示方法,由同构相关冗余变换IRRT和基 于相关性的联合特征学习CJFL算法组成,通过循环迭代过程实现模型的逐步优化。
[0084] 在公式(4)中的IRRT模型可以简化为:
[0085] (21)
[0086] 其中,代)=丨HI1是平滑的目标函数,Z=[Az Bz]象征优化变量,而e为封闭的凸集, 其定义为:
[0087] e = {zi< F/nu (22)
[0088] 由于f( ?)是连续可微函数且带有Lipschitz连续梯度L(参考文献: Y.Nesterov.Introductory lectures on convex optimization,volume 87.Springer Science&Business Media,2004.):
[0089] ||F/(Zy) - Vf{Zy)\\F < L\\ZX - Zy\\F,VZ..Z, G (23)
[0090] 所以,很适合采用加速投影梯度(Accelerated Projected Gradient,APG)(参考 文献:Y ? Nesterov ? Introductory lectures on convex optimization,volume 87? Springer Science&Business Media,2004?)算法求解公式(21)中的问题。APG算法已成 功应用于如下优化问题:
[0091] ⑵ (24)
[0092] 其中,g( ?)是一个平滑的目标函数,z是优化变量,而沒是优化问题的可执行域。
[0093] 需要注意的是,在APG算法中一个给定点s在凸集f = {zlllzKm}上的欧几里德投 影可以定义为:
[0094] pro/5(s) = ar" |k - -?|丨异/2 (25)
[0095] 其中,m是预先指定的正常数。那么,可以使用在迹范数约束上的有效投影 (Efficient Projection on Trace Norm Constraints,EPTNC)算法(参考文南犬:John Duchi,Shai Shalev-Shwartz,Yoram Singer,Tushar Chandra.Efficient Projections onto the il-Ball for Learning in High Dimensions.Proc.International Conference on Machine 1^&^^邱,2008 4口.272-279.)求解等式(25)。算法1给出了£?1?^算法的具体 细节。
[0097] 当应用APG算法求解公式(21)中的问题时,一个给定点S=[As Bs]在集合e上的欧 几里德投影Z=[Az Bz]可以定义为:
[0098] ?",o/c(S)二 览皆 - S||f/2 (26)
[0099] 通过结合APG算法和算法1,就可以求解公式(21)中的问题。算法2给出了 IRRT算法 的具体细节。
[0101] 13; 计算[祝+1]=五pt顧(霉,e) * 14: 设 4+1 =[~+1 H. 15: if f(Zi+1) < fyhSi(Zi+1) then break 16: eke更新朽=x 2。 17; end-if 18: end-while 19:更新 g = (1 十 Jl + 4t?_1^/2 和)= rp 201 end-for 2-1;设Z* 二 A+1
[0102] 可以通过最大化如下迹差问题获得公式(18)中的CJFL模型的最优解?' &* - ara max\tr(&1 (Jv + Rt))&) - ??£fr(0? (J^ + R^)〇) -r]tatr((J6 - R〇yr(j8 - R6)) - rnptr{67 0)\ =arg max\tr(9T(jv + Rv - ri, (Js + Rs)')0)
[0103] 0 0=1 (27) -rjl tr{a(QTjTjQ - 20r/r/?0 + &TRTR&) + peT&)] -art) max \trtr(&1 {jv + Rv - m (h + Rs + a{jTj - 2JtR + RtR) + (^I))0)]
[0104] 其中nt(见等式(28))为第t次迭代的迹率值。因此,?*由矩阵 /? + /?B -仏仏+心+ aC/T./ - 2/' R +Z?7"/?) + /?/)的k个最大特征值对应的特征向量构成的。算 法3给出了 CJFL算法的具体细节。
[0106] 本发明提供的挖掘多源异构大数据语义一致模式的IRRT+CJFL框架,针对多源异 构数据的特征异构性问题,利用多源异构数据间的语义互补性,基于子空间学习方法,将多 源异构数据投影到一个中层冗余特征同构空间。并在这个同构空间中,将特征同构的高维 描述投影到一个低维的高层语义共享子空间上,进而消除冗余和噪声信息,使来自不同来 源的相关描述耦合到一起,以此挖掘出嵌入了异源间互补信息的语义一致模式。从而获得 多源异构数据特征描述的融合表示。
[0107] 以上实施例仅用以说明本发明的技术方案而非对其进行限制,本领域的普通技术 人员可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明的精神和范围,本 发明的保护范围应以权利要求书所述为准。
【主权项】
1. 一种多源异构大数据的一致性表示方法,其特征在于,包括以下步骤: 1) 利用多源异构数据之间的互补性学习多个线性变换,以消除不同来源间的特征异构 性,从而将多源异构数据投影到一个中层冗余特征同构空间,在这个中层冗余特征同构空 间中,来自不同来源的相关描述被耦合到一起,以此捕捉到不同来源间的互补信息; 2) 在所述中层冗余特征同构空间中,利用先验知识将特征同构描述投影到高层语义共 享子空间上,在高层语义共享子空间中来自同一来源相同类别的样本靠拢在一起,而不同 类别的实例则保持一定距离,从而消除冗余和噪声信息,获得多源异构数据的语义一致模 式。2. 如权利要求1所述的方法,其特征在于,步骤1)对于多源异构数据X eirx夂和 7 e ,学习两个线性变换A和B,其中dx为来源X的维度,dy为来源Y的维度,η为样本数量; 并建立如下的优化模型其中4 € EdxXp,β e IRdyxp,p> >max(dx,dy),ρ为中层冗余特征同构空间的维度;ε和γ 是预先指定的正参数,用来控制变换后的数据携带的信息量。3. 如权利要求2所述的方法,其特征在于,为求解屯i,将Ψ i中对变换数据的迹范数约束 松弛地转换为下而Ψ 9由对枵影钽陈的W茹教約市,4. 如权利要求3所述的方法,其特征在于,步骤2)中,为了消除冗余和噪声信息,利用先 验知识学习一个线性变换ITwS其中k为子空间的维度,以此参数化语义共享子空间,进 而最小化类内距离并且最大化悉问!?亩-刖归妯先加下?亦东什仆陆颚:其中,A + %是由两组同构相关冗余描述的数据集J和R构成的联合类内散度矩阵, + 是由数据集J和R构成的联合类间散度矩阵,对Θ的正交约束用来消除中层空间中和 必要信息高度相关的冗余信息。5. 如权利要求4所述的方法,其特征在于,步骤2)为了完好地保留同构描述之间的互补 性,将Ω :重新定々为如下形式:其中,||/Θ - /?Θ表示基于相关性的残差,用来避免破坏耦合描述的内在结构,而正规 化项ΙΙΘΙΙΙ控制模型的复杂度,α和β为正规化参数。6. 如权利要求5所述的方法,其特征在于,步骤2)中,设(Α'Β,是问题Ψ2的最优解, 是问题〇2的最优解,那么对于第i对异构描述( Xl,yi),利用最优解Α'Β?ΡΘ%得到异构描 述各自的同构相关描述: Tjei = .Θ*Γ4*Γχ:? 和·^ = 然后基于~和以·得到不同模态的一致性描述^,即多源异构数据在高层语义共享子空 A = (? + τ;^)/2〇 间上的语义一致模式:
【文档编号】G06F17/30GK105893612SQ201610266857
【公开日】2016年8月24日
【申请日】2016年4月26日
【发明人】张磊, 王树鹏, 云晓春
【申请人】中国科学院信息工程研究所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1