一种基于MMseg算法与逐点互信息算法的分词方法与流程

文档序号:12120963阅读:来源:国知局
技术总结
本发明涉及一种基于MMseg算法与逐点互信息算法的分词方法,基于词典使用MMseg算法对文本进行分词处理,获得分词结果后使用逐点互信息算法对分词结果进行校正;所述逐点互信息算法校正分词结果的具体过程如下:计算文本中相邻的字x与字y的逐点互信息,然后判断字x与字y的逐点互信息是否大于所设定的阈值,若是则将字x与字y作为一个独立的词语进行划分。

技术研发人员:谭军;张凯华
受保护的技术使用者:中山大学
文档号码:201610843783
技术研发日:2016.09.22
技术公布日:2017.03.22

当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1