一种基于组合特征加权的科技文献标注精简研究结论的方法流程与流程

文档序号:11234108阅读:来源:国知局

技术特征:

技术总结
本发明新型公开了一种基于组合特征加权的科技文献标注精简研究结论的方法流程,其包括分类抽取流程,既是基于训练语料,做数据前清洗,然后分句获得句子和类标签,句子特征选择进行特征化,然后训练分类器,评价分类器,对训练的分类器进行保存序列化,在应用阶段,获得应用文本,对其同样数据清洗,分句,然后特征化(应用阶段chi词特征是使用训练阶段的chi词),加载训练分类器对应用文本进行研究结论预测,之后对预测的结果句子人工审核,进行后数据清洗处理,然后将这些清洗规则加入到原有程序中,迭代实验,实际应用中更贴近问题的本质,从而有很高的发明效果。

技术研发人员:贺惠新;史亚平;张魏巍;熊海涛
受保护的技术使用者:同方知网(北京)技术有限公司;《中国学术期刊(光盘版)》电子杂志社有限公司
技术研发日:2016.03.04
技术公布日:2017.09.12
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1