一种CCMI文本特征选择方法与流程

文档序号:13422105阅读:来源:国知局

技术特征:

技术总结
本发明公开了一种CCMI文本特征选择方法,从预处理过后的语料库中提取所有的特征,构成原始特征集合F;选择改进的χ2统计(IPX2)和改进的互信息(IPMI)并将二者联合作为评估函数,对原始特征集合F中的每个特征计算其评估函数值;对原始特征集合F中的特征根据其评估函数值以从高到低的顺序进行排序,选择最佳数量的特征构成新的特征集合,形成降维后的特征空间V。该方法同时适用于平衡数据集和非平衡数据集,并且能取得不错的分类效果。

技术研发人员:柏文阳;吴海涛;张剡;周嵩
受保护的技术使用者:南京大学
技术研发日:2017.09.15
技术公布日:2018.01.09
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1