一种基于特征选择的多示例多标签学习方法及系统的制作方法_3

文档序号:9327457阅读:来源:国知局
的所述f t的值为负值,表示未 知包没有标记所述ft对应的标签t,标签t的标签值y tk= -1 ;根据标签t的标签值y lt的 值可以得到未知包P1对应的标签集Y1= Ly1^yli2,…,Y1,t,…Γ中的标签值,进而可以实现 对未知包P 1的标签识别。
[0117] 进一步可以得到所述待预测的多示例多标签的未知样本中全部未知包的特征集 合对应的标签集合{Yi,Y 2,…,Y1,…}。从而实现了采用基于特征选择的多示例多标签学习 方法预测多示例多标签的未知样本的标签集。
[0118] 实施例3、一种基于特征选择的多示例多标签学习系统。下面结合图3对本实施例 提供的系统进行详细说明。
[0119] 参见图3,本实施例提供的一种基于特征选择的多示例多标签学习系统包括已知 数据集存放单元61、第一特征映射单元62、特征选择单元63、第二特征映射单元64、标签相 关性分类器单元65,其中,特征选择单元63具体包括目标函数获得模块631、目标函数求解 模块632、剔除投影示例模块633以及参考空间获得模块634,标签相关性分类器单元65具 体包括线性决策函数模块651、相关性矩阵定义模块652、分类器目标函数模块653以及标 签相关性分类器获得模块654。
[0120] 其中,已知数据集存放单元61,用于存放多示例多标签的已知数据集。
[0121] 第一特征映射单元62,用于将所述多示例多标签的已知数据集中所有的包特征映 射到由已知数据集中所有的示例组成的投影示例参考空间,得到包的特征向量。
[0122] 特征选择单元63,用于根据体现了包与投影示例关系的所述包的特征向量,采用 基于1 211范数约束的特征选择方法剔除掉所述投影示例参考空间中对包的标签标注无效 的包的特征对应的投影示例,进而得到由代表性投影示例集组成的代表性投影示例参考空 间。
[0123] 其中,特征选择单元63具体包括:
[0124] 目标函数获得模块631,用于采用所述所有包的特征集合{Φ (X1), Φ (X2),… ,Φ (Xni)}线性拟合所有包的特征集合对应的标签集合(Y1, Y2,…,YJ,并用范式约束的特征 选择方法保留对包的标签标注贡献较大的包的特征,摒弃无用的包的特征,得到一个特征 选择目标函数。
[0125] 目标函数求解模块632,用于采用迭代算法对所述特征选择目标函数进行求解,得 到求解结果。
[0126] 剔除投影示例模块633,用于根据所述求解结果剔除所述投影示例参考空间中对 所述包的标签标注无效的包的特征对应的投影示例。
[0127] 参考空间获得模块634,用于将对包的标签标注有效的包的特征对应的投影示例 选择为代表性投影示例,代表性投影示例集组成代表性投影示例参考空间α,其中,所述代 表性投影示例集表示为c=y%,q为代表性投影示例的个数,Cp为代表性投影示例。
[0128] 第二特征映射单元64,用于将所述多示例多标签的已知数据集中所有的包重新特 征映射到所述代表性投影示例参考空间,得到包的新的特征向量。
[0129] 标签相关性分类器单元65,用于根据所述包的新的特征向量构造出一个线性决策 函数,并采用兼顾标签相关性的优化算法训练出基于标签相关性的分类器。
[0130] 其中,标签相关性分类器单元65具体包括:
[0131] 线性决策函数模块651,用于根据第二特征映射单元得到的包的新的q维特征向 量Pd)构造出一个线性决策函数f t,表示为/, =ViP(Xi),.其中,1? =|ν",νΛ2,…,V」表示 为线性决策函数矩阵,所述包X1对应的标签集Y i中每一个标签t均对应一个线性决策函数 ft〇
[0132] 相关性矩阵定义模块652,用于定义一个标签相关性矩阵G,其中,G e [0, l]bxb,b 为标签类别总个数,所述标签相关性矩阵G为对称矩阵,当标签t和标签?是相关的,矩阵中 第t行?列的值以及第?行t列的值为1,否则为0。
[0133] 分类器目标函数模块653,用于根据所述线性决策函数匕以及所述标签相关性矩 阵G,构造出一个分类器目标函数。
[0134] 标签相关性分类器获得模块654,用于根据构造的分类器目标函数,采用迭代优化 的方法求得所述线性决策函数匕中V t的值,完成基于标签相关性的分类器/= η舛夂,)的 训练。
[0135] 实施例4、一种采用基于特征选择的多示例多标签学习系统预测多示例多标签的 未知样本的标签集的系统。下面结合图4对本实施例提供的系统进行详细说明。
[0136] 参见图4,本实施例提供的一种采用基于特征选择的多示例多标签学习系统预测 多示例多标签的未知样本的标签集的系统包括未知样本存放单元71、第三特征映射单元 72、分类器预测单元73、确定单元74以及输出样本标签单元75。
[0137] 其中,未知样本存放单元71,用于存放待预测的多示例多标签的未知样本。
[0138] 第三特征映射单元72,用于将待预测的多示例多标签的未知样本中的全部未知包 特征映射到由代表性投影示例集组成的代表性投影示例参考空间α中,进而获 得全部未知包的特征集合,其中,未知包Pj.征映射后得到q维特征向量Φ (Ρ J。
[0139] 分类器预测单元73,用于将未知包P1特征映射后得到的q维特征向量Φ (P1) 带入基于标签相关性的分类器= $#(?:)中替代免(I/),其中,线性决策函数矩阵 η = ,…,tU为已知,进而可以获得未知包已对应的标签集γ:中每一个标签t对应 的线性决策函数仁的值。
[0140] 确定单元74,用于根据所述分类器预测单元中所述线性决策函数匕的值确定未知 包是否标记有所述f t对应的标签t,若所述f t的值为正值,表示未知包标记有所述f t对应 的标签t,标签ylt= +1 ;若所述f t的值为负值,表示未知包没有标记所述f t对应的标签t, ylt= -1。
[0141] 输出样本标签单元75,用于根据所述确定单元中标签值ylt的值得到多示例多标 签的未知样本中每个未知包Pi对应的标签集Yi= [y y^,…,yi,t,···]'进而可以得到未 知样本中全部未知包的特征集合对应的标签集合{Yl,Y2,…,Yi,…}。
[0142] 本发明提供了一种基于特征选择的多示例多标签学习方法及系统,将已知数据集 中所有的包特征映射到由已知数据集中所有的示例组成的投影示例参考空间,得到表示每 个包的特征向量,然后采用基于U 1范数约束的特征选择方法剔除掉对包的特征判别性无 用的投影示例,保留了判别性强的代表性投影示例,这是提高包的标签预测准确率的关键, 再将所有的包重新特征映射到由代表性投影示例集组成的代表性投影示例参考空间,得到 所述包的新的特征向量,最后兼顾标签相关性的优化算法训练出分类器,这种方式兼顾了 标签之间的相关性,增加了标注的可用信息,进一步提高标注效果,能更好的对标签进行预 测,提高了预测未知样本中包的标签的准确率。
[0143] 另外,本发明提出了一种采用基于特征选择的多示例多标签学习方法及系统预测 多示例多标签的未知样本的标签集的方法及系统,将待预测的多示例多标签的未知样本中 的包特征映射到由代表性投影示例集组成的代表性投影示例参考空间,得到未知样本中包 的特征向量,将所述包的特征向量通过基于标签相关性的分类器,获得未知样本中包对应 的标签集中的标签值,进而获得未知样本中包对应的标签集,从而实现了对多示例多标签 的未知样本中包的标签预测与标签识别。
[0144] 以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和 原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
【主权项】
1. 一种基于特征选择的多示例多标签学习方法,其特征在于,所述方法包括: 51、 将多示例多标签的已知数据集中所有的包特征映射到由已知数据集中所有的示例 组成的投影示例参考空间,得到包的特征向量; 52、 根据体现了包与投影示例关系的所述包的特征向量,采用基于I2il范数约束的特征 选择方法剔除掉所述投影示例参考空间中对包的标签标注无效的包的特征对应的投影示 例,进而得到由代表性投影示例集组成的代表性投影示例参考空间; 53、 将所述多示例多标签的已知数据集中所有的包重新特征映射到所述代表性投影示 例参考空间,得到包的新的特征向量; 54、 根据所述包的新的特征向量构造出一个线性决策函数,并采用兼顾标签相关性的 优化算法训练出基于标签相关性的分类器。2. 如权利要求1所述的一种基于特征选择的多示例多标签学习方法,其特征在于, 所述步骤Sl中所述多示例多标签的已知数据集具体包括:已知数据集中的包以及包的 个数、已知每个包中的示例以及示例个数、已知表示每个示例的特征向量、已知每个包对 应的标签集以及所有包对应的标签集合,所述多示例多标签的已知数据集具体表示为 {(U),(X2,Y2),…,(X1,Y1),…,(XJJ},其中,;为已知数据集中包X1中的Ii1 个示例,Y1=[yu,yli2,…,ylit,…,ylib]T为包X3寸应的标签集,ylit为标签集Yi中第t个 标签的标签值,b为标签类别总个数,m为包的个数; 所述步骤Sl具体包括: 511、 将包Xj#征映射到投影示例参考空间X中的一个投影示例,得到包X;的一维特 征值;将包乂;特征映射到投影示例参考空间X中的所有投影示例,得到包X;的(1维特征向 量伞(Xi); 512、 将已知数据集中所有包特征映射到投影示例参考空间X中的所有投影示例,得 到已知数据集中所有包的特征集合{> (X1),巾(X2),…,巾(X1),…,巾(Xni) },已知所有包的 特征集合对应的标签集合为(Y1,Y2,…,Y1,…,YJ。3. 如权利要求2所述的一种基于特征选
当前第3页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1