一种基于特征选择的多示例多标签学习方法及系统的制作方法_2

文档序号:9327457阅读:来源:国知局
选择目标函数,表示为:
[0043] 所述新的特征选择目标函数的具体求解过程为:
[0044] (1)、将所述新的特征选择目标函数转换为如下的等价形式:
[0046]
,所述目标函数可进一步转换为:
[0048] 将所述目标函数进一步整理可得:
[0051] (3)、令
上述步骤⑵中的目标函 数进一步转化为:
[0053] 写出上述目标函数的拉格朗日算子:
[0054] L ⑶=I IUI 12,「Tr (ΛT (AU-Y))
[0055] 对所述目标函数的拉格朗日算子求导并令导数为零,得到:
[0057] 其中,D是一个对角矩阵,对角元素取值为
,其中U1为矩阵U第i行的 行向量;对上述等式的等号两边同乘以AD \又因为AU = Y,所以上述等式可以转化为:
[0058] Λ = 2 (AD 1At) 1Y
[0061] (4)、由于公式是一个凸问题,所以根据公式U = D V(AD 1At) 1Y求解得到 的U是一个全局最优解,同时从公式U = D 1AtMD 1At) 1Y也可以看出要求出矩阵U需要首 先求出矩阵D,而矩阵D的值又依赖于矩阵U,因此采用迭代算法来求解所述公式,所述迭代 算法流程为:
[0062] (41)、输入矩阵A以及矩阵Y,其中,A e Rmxa以及Y e Rmxb;
[0063] (42)、设置t = 0,初始化Dt为单位矩阵,其中,D te Raxa;
[0064] (43)、重复如下操作,直至收敛:
[0065] (431)、计算矩阵Ut+1,其中,矩阵Ut+1表示为:
[0066] (432)、计算对角矩阵Dt+1,其中第i个对角元素为
[0067] (433)、t = t+Ι ;
[0068] (44)、步骤(43)收敛后,输出矩阵U,其中,U e RaXb。
[0069] (5)、根据步骤4求出U后,根据公式
便可求出样本拟合系数W。
[0070] 所述样本拟合系数W的零行对应的是对包的标签标注无效的包的特征,而这些特 征对应的投影示例就是无用的干扰示例;所述样本拟合系数W的非零行对应的是对包的标 签标注有效的包的特征,而这些特征对应的投影示例就是有用的投影示例。
[0071] 根据所述样本拟合系数W的求解结果剔除掉所述投影示例参考空间中对所述包 的标签标注无效的包的特征对应的投影示例;将对包的标签标注有效的包的特征对应的投 影示例选择为代表性投影示例,所述代表性投影示例集组成代表性投影示例参考空间α, 其中,所述代表性投影示例集表示为
q为代表性示例的个数,Cp为代表性投影 示例。
[0072] S3、将所述多示例多标签的已知数据集中所有的包重新特征映射到所述代表性投 影示例参考空间,得到包的新的特征向量。
[0073] 具体的,将所述多示例多标签的已知数据集中所有的包重新特征映射到所述代表 性投影示例参考空间α,得到包的新的q维特征向量,表示为:
[0074]
[0075] 其中,舛X,)为包的新的q维特征向量,s (cq,X1)为包X1到投影示例参考空间α 中示例Cq的相似性距离,表达式为:
[0077] 将所有的包特征映射到所述代表性投影示例参考空间α,可以得到所有包的特征 集合,每个包的特征都由一个特征向量表示出来。
[0078] S4、根据所述包的新的特征向量构造出一个线性决策函数,并采用兼顾标签相关 性的优化算法训练出基于标签相关性的分类器。
[0079] 具体的,根据步骤S3中得到的所述包X1的新的q维特征向量,构造出一个 线性决策函数:
[0080]
[0081] 其中,Vt= [vt, ,…,'q] e R1~表示为线性决策函数矩阵,所述包X1对应的 标签集Y1中每一个标签t均对应一个线性决策函数f t。
[0082] 采用兼顾标签相关性的优化算法训练出基于标签相关性的分类器,令矩阵V = [V' 1>v' 2,…,V' Jeirxb,其中,矩阵V中的列向量为^的转置;然后定义一个标签相 关性矩阵G,其中,G e [0, l]bxb,b为标签类别总个数,所述标签相关性矩阵G为对称矩阵, 当标签t和标签g是相关的,矩阵中第t行$列的值以及第?行t列的值为1,否则为0 ;根据 所述线性决策函数ft与所述标签相关性矩阵G,构造出一个分类器目标函数,求解出矩阵V 使其满足所述分类器目标函数,所述分类器目标函数表示为:
[0083]
[0084] 其中,/(兄_,,4供(岑))为铰链损失函数,表示为/(八,,1,,與尤))= 1^丨0,1-凡,1,(疋)丨,711 为包X1对应的标签集Y1的第t个标签的标签值;Ω (V,G)为描述矩阵V与矩阵G-致性的正
S为平衡铰链损失函数与正则化项的参数;所以,所述分类器目标函数可进一步转化为:
[0085]
[0086] 因为上述转化后的目标函数是非连续以及非凸的,根据凸松弛法,
可以 用严格凸函数代替,即I2il范数
,所以上述转化后的分类器目标函数可进一步整理 为:
[0087]
[0088] 对整理后的分类器目标函数采用迭代优化算法进行求解,具体求解过程为:
[0089] (1)、引入矩阵λ,将分类器目标函数的I21范数转化为一个联合凸函数,表示如 下:
[0092] 其中
f的伪逆,ε为一个保证收敛的趋于零的常数。
[0093] (2)、采用迭代的方法优化V和λ,直到收敛为止,具体步骤如下:
[0094] (21)、当
呆持不变时,V可以通过求解Vt的二次规划问题得到,表示为:
[0095]
[0096] (22)、当V保持不变时,
可以通过一个封闭解求得,表示为:
[0099] (3)、根据步骤⑵求解出矩阵V后,根据矩阵V与矩阵Vt的关系:V =
[V' 1>v' 2,…,V' Jeirxb,其中,矩阵V中的列向量为Vt的转置,求解出矩阵Vt的值。
[0100] 根据求得的所述线性决策函数ft中矩阵V t的值,完成基于标签相关性的分类器 X = 1M(A)的训练。
[0101] 实施例2、一种采用基于特征选择的多示例多标签学习方法预测多示例多标签的 未知样本的标签集的方法。下面结合图2对本实施例提供的方法进行详细说明。
[0102] 参见图2,本实施例提供了一种采用基于特征选择的多示例多标签学习方法预测 多示例多标签的未知样本的标签集的方法。
[0103] S51、将待预测的多示例多标签的未知样本中的全部未知包特征映射到由代表性 投影示例集C = 组成的代表性投影示例参考空间α中,进而获得全部未知包的特征 集合,其中,未知包Pj.征映射后得到q维特征向量Φ (Ρ J。
[0104] 具体的,将待预测的多示例多标签的未知样本中的未知包P1特征映射到由代表性 投影示例集组成的代表性投影示例参考空间α中,进而获得表示未知包? 1特征 的q维特征向量,表示为:
[0105] Φ (Pi) = [s (C1, Pi),s (c2, Pi),…,s (cq,Pi) ]τ
[0106] 其中,Φ (P1)为包的q维特征向量,s (cq,P1)为包P1到投影示例参考空间α中的 示例C q的相似性距离,表达式为:
[0108] 其中,Pli j为包P1中的示例。
[0109] 将待预测的多示例多标签的未知样本中所有的包特征映射到所述代表性投影示 例参考空间α,可以得到所有包的特征集合,每个包的特征都由一个特征向量表示。
[0110] S52、将未知包P1特征映射后得到的q维特征向量Φ (Ρ J带入基于标签相关性的 分类器中替代KJQ,,其中,线性决策函数矩阵Vi =lv, …,为已知,进 而可以获得未知包P1对应的标签集Y i中每一个标签t对应的线性决策函数f t的值。
[0111] 具体的,将未知包Pi特征映射后得到的q维特征向量Φ (Pi)带入到基于标签相关 性的分类器中,用Φ (P1)替代/=VM不)中的,可以获得未知包P1对应 的标签集Y1中每一个标签t对应的线性决策函数f t的值,所述线性决策函数f t表示为:
[0112] ft= V t Φ (P1)
[0113] 其中,线性决策函数矩阵Vi: = k, νΛ2,…,νΛι/ j为已知。
[0114] 将待预测的多示例多标签的未知样本中所有的包特征映射后得到的特征向量都 带入基于标签相关性的分类器石=V^(Z i)中替代Ml),可以得到每个包对应的标签集Y1 中每一个标签t对应的线性决策函数ft的值。
[0115] S53、根据所述线性决策函数ft的值确定未知包是否标记有所述f t对应的标签t, 若所述ft的值为正值,表示未知包标记有所述f t对应的标签t,标签值y lt= +1 ;若所述f t 的值为负值,表示未知包没有标记所述ft对应的标签t,标签值y lt= -1 ;根据标签值y lt的 值得到多示例多标签的未知样本中每个未知包P1对应的标签集Y1= Ly1^yli2, ,…] τ,进而可以得到未知样本中全部未知包的特征集合对应的标签集合(Y1, Y2,…,Y1, ···}。
[0116] 具体的,根据所述步骤S52中线性决策函数ft= vti]5 (Pi)求解出的匕的值来确定 未知包是否标记有所述ft对应的标签t。若求解出的所述f t的值为正值,表示未知包标记 有所述ft对应的标签t,标签t的标签值y lt= +1 ;若求解出
当前第2页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1