一种基于文本分类的城市管理案件分类方法与流程

文档序号:12598614阅读:来源:国知局
技术总结
本发明公开了一种基于文本分类的城市管理案件分类方法,包括以下步骤,S1:预处理,对短文本进行预处理,进行分词、去除文本中的停用词、统计词频等操作,其中停用词包括标点符号、表情符号、语气助词、介词和连接词;S2:互邻特征组合,通过互邻特征组合算法对文本特征空间中的特征进行组合,形成新的特征,并扩展特征空间,S3:基于类别特征域的特征选择,经上述互邻特征组合算法进行特征扩展之后,整个短文本的特征空间变得十分庞大,在产生对短文本分类描述力更强的组合特征的同时,也产生了很多对分类效果贡献不大甚至有影响的特征,需要对其进行特征选择,S4:采用tf‑idf加权,计算每个文本特征向量;S5:训练分类器并对测试文本分类。

技术研发人员:李灵巧;魏文;杨浩;丁煜;何胜韬
受保护的技术使用者:广西智度信息科技有限公司
文档号码:201610750148
技术研发日:2016.08.29
技术公布日:2017.01.11

当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1