一种基于集成学习的观点挖掘方法与流程

文档序号:12039806阅读:来源:国知局
一种基于集成学习的观点挖掘方法与流程

技术特征:
1.一种基于集成学习的观点挖掘方法,用于统筹分析每个分类器对不同分析领域进行预测时的不同预测结果,提升观点分析的效果,其特征在于,包括如下步骤:样本获取步骤,将已标注样本分为互不相交的大小不相等的第一集合T1和第二集合T2;元分类器训练步骤,在所述第一集合T1上分别训练多个概念分类器,得到多个元分类器;元分类器选取步骤,根据所述元分类器的准确度与分类结果的多样性,选取一组元分类器作为元分类器组;样本预测步骤,利用所述元分类器组对所述第二集合T2中的已标注样本进行预测,生成的预测结果与已标注样本的已有标签相整合,得到新的已标注样本;集成分类器训练步骤,使用所述新的已标注样本确定集成分类模型的参数,得到集成分类器;观点挖掘步骤,对于一个观点挖掘实例,通过所述元分类器组对所述观点挖掘实例进行预测,得到多个预测结果,将所述多个预测结果合并后作为所述集成分类器的输入,由所述集成分类器进行预测产生最终的观点挖掘结果;选取所述元分类器组的要求如下式表示:式中,D表示元分类器的集合,Ci表示一个元分类器,A(Ci)表示元分类器Ci的准确度,κ(Ci,Cj)为元分类器Ci和Cj间分类结果的FleissKappa值,λ为调整准确度与多样性的权重,λ为0到1间的实数;样本获取步骤中的所述已标注样本为根据特征类型与特征加权法经向量化处理的样本。2.如权利要求1所述的基于集成学习的观点挖掘方法,其特征在于,所述第一集合T1中的已标注样本数量大于所述第二集合T2中的已标注样本数量。3.如权利要求1所述的基于集成学习的观点挖掘方法,其特征在于,进一步包括:样本获取步骤中通过k折交叉验证方法生成多个不同的已标注样本。4.如权利要求1所述的基于集成学习的观点挖掘方法,其特征在于,进一步包括:所述元分类器组中至少包括三个元分类器。5.如权利要求1所述的基于集成学习的观点挖掘方法,其特征在于,所述元分类器选取步骤中,根据设定的特征类型、特征函数以及分类方法自动选择元分类器组进行观点预测。6.如权利要求1所述的基于集成学习的观点挖掘方法,其特征在于,进一步包括:在所述元分类器选取步骤中,通过贪心方法选择元分类器作为所述元分类器组。
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1