构建命名实体标注资源库方法、装置、存储介质和计算机设备与流程

文档序号:12887154阅读:来源:国知局

技术特征:

技术总结
本发明涉及一种构建命名实体标注资源库方法、装置、存储介质和计算机设备。本发明使用少量种子库与未标注文本集中的未标注文本构成本轮迭代的资源库进行计算,通过计算未标注文本中每个命名实体的平均效用值,生成下一轮迭代的种子库,再将生成的种子库与其他未标注文本构成下一轮迭代的资源库进行计算出再下一轮的种子库,就这样一直计算直到将未标注文本全部计算,发现新的命名实体,并生成命名实体标注资源库。这种方法计算简单,所得结果的置信度高,适合处理大规模文本。文本数据为一种非结构化数据,通常对非结构化数据进行效果评估都比较困难,而该方法可以实现对文本命名实体进行量化评估。

技术研发人员:秦兴德;秦祎晗;刘奕慧;郭玮
受保护的技术使用者:深圳市牛鼎丰科技有限公司
技术研发日:2017.06.14
技术公布日:2017.11.07
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1