一种蕴含地理实体关系的关键词提取方法及装置与流程

文档序号:12719461阅读:来源:国知局
技术总结
本发明提供了一种蕴含地理实体关系的关键词提取方法及装置,该方法包括:从网络文本中获取至少一个地理实体对及其对应的原始语境,地理实体对包含至少两个地理实体;根据每一个地理实体对中各个地理实体对应的类型映射表,获取各个地理实体对类型标签及其对应的当前原始语境,并且依据预设同义词词典信息对各个当前原始语境进行语境增强,得到各个增强语境;针对每一个地理实体对类型标签,从对应的增强语境中获取关键词选择语料,并从关键词选择语料中选取至少一个蕴含地理实体关系的关键词。基于上述方法可有效增强稀疏地理实体关系的关键词识别能力,且能生成大量新关键词,有助于以无监督学习方式抽取关键词。

技术研发人员:陆锋;余丽;彭澎;刘希亮;程诗奋
受保护的技术使用者:中国科学院地理科学与资源研究所
文档号码:201710093485
技术研发日:2017.02.21
技术公布日:2017.06.23

当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1