用于自然语言处理的领域词典生成系统的制作方法

文档序号:12550763阅读:来源:国知局
技术总结
本发明涉及自然语言处理领域,特别涉及用于自然语言处理的领域词典生成系统;所述系统在自动区分文本主题领域的基础上,根据种子词进行对应领域词典的自动构建。用户将待处理文本和领域种子词输入本系统中,本系统在自动获取文本关键词的基础上对待处理文本进行聚类,进而分析出聚类后的主题文本集与所选领域种子词的关系远近,在关系较密切的主题文本集内结合算法进行词典的自动扩展。本发明系统在自动区分文本主题领域的基础上通过少量种子词实现领域词典的自动扩充;词典的构建效率较高,准确性高,领域的针对性很强;为文本分析和自然语言处理提供有力工具。

技术研发人员:张晓霞;刘世林
受保护的技术使用者:成都数联铭品科技有限公司
文档号码:201611145025
技术研发日:2016.12.13
技术公布日:2017.06.06

当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1