一种基于成词率适应度函数的新词识别免疫遗传方法与流程

文档序号:11950221阅读:来源:国知局
技术总结
一种基于成词率适应度函数的新词识别免疫遗传方法,属于自然语言信息处理应用领域。本发明首先根据网络新词的特点,提取共同语素,将共同语素和独词作为免疫遗传方法中的示范性抗体,然后利用成词率设计合适的适应度函数,并在适应度函数中加入调节参数,以优化最终实验结果,最后对由免疫遗传方法识别出的候选词用新闻语料进行处理,得到最终的网络新词。对比现有技术,本发明针对网络新词的特点,设计适合网络新词识别的适应度函数,充分考虑网络新词长度,单字和字串所占比例等因素,并将字串的频数信息加入适应度函数的设计中,从而提高了网络新词发现的正确率、召回率和F值。

技术研发人员:史树敏;史胜清;黄河燕;周新宇
受保护的技术使用者:北京理工大学
文档号码:201610532187
技术研发日:2016.07.04
技术公布日:2016.12.07

当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1