一种分词词库更新方法及系统与流程

文档序号:11155056阅读:来源:国知局
技术总结
本发明提供了一种分词词库更新系统,包括:日志采集模块、日志分析模块、分词评价模块以及分词校正与过滤模块,其中该分词校正和过滤模块包括构造子模块、切分子模块以及过滤子模块。本发明还提供了对应的方法。实施本发明的分词词库更新系统及方法,基于分词业务日志分析,通过对分词业务系统的分词效果进行评价,提取出分词效果不好的分词输入,根据使用参考概率表的Z分词过滤算法对分词效果不好的分词输入进行分词校正和过滤输出新词词组,并将该新词词组更新到分词词库中,不断完善分词词库,解决了分词词库不能适时且适应实际分词应用环境的问题,有效提高分词效果。

技术研发人员:杨睛龙;胡正才;周美芳;刘平华;李海平;曲晓园;高宝兵;陈国锐
受保护的技术使用者:卓望数码技术(深圳)有限公司
文档号码:201510715638
技术研发日:2015.10.28
技术公布日:2017.05.10

当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1