一种柬埔寨语组织机构名识别方法与流程

文档序号:12464647阅读:来源:国知局
技术总结
本发明涉及一种柬埔寨语组织机构名识别方法,属于自然语言处理技术领域。本发明首先对抽取的柬埔寨语篇章进行切分,切分后的句子进行分词和词性标注,通过人工校对,然后标注柬埔寨语命名实体,得到相当规模的柬埔寨语组织机构名语料;通过标注的语料提取命名实体指示词,构建指示词库,构建特征模板,通过改进的Tri‑training算法学习得到组织机构名识别模型;对选取的测试语料通过组织机构名识别模型进行训练得到组织机构名的标注结果。本发明对柬埔寨语组织机构名进行有效的识别,为信息抽取和机器翻译等工作提供强有力的支撑;目前没有发现柬埔寨语做相关的组织机构名识别的报告,本发明取得了很好的效果。

技术研发人员:严馨;王若兰;余正涛;郭剑毅
受保护的技术使用者:昆明理工大学
文档号码:201611157511
技术研发日:2016.12.15
技术公布日:2017.05.31

当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1