技术总结
本发明公开了一种对字符串进行分类的方法和装置,属于计算机通信技术领域。所述方法包括:获取待分类字符串;从所述待分类字符串中提取多个分类特征;对每个所述分类特征分别进行归一化处理,得到多个归一化分类特征;通过离线训练得到的分类模型,根据多个所述归一化分类特征,对所述待分类字符串进行分类,得到所述待分类字符串的分类结果。所述装置包括:获取模块、第一提取模块、归一化模块和分类模块。本发明通过离线训练得到的分类模型,根据多个归一化分类特征,对待分类字符串进行分类,得到待分类字符串的分类结果,不需要依靠人工,即可自动实现,效率很高。
技术研发人员:李家宏
受保护的技术使用者:阿里巴巴集团控股有限公司
文档号码:201510162076
技术研发日:2015.04.07
技术公布日:2016.11.23