一种矿物领域知识图谱构建方法及系统

文档序号:27037964发布日期:2021-10-24 06:32阅读:来源:国知局

技术特征:
1.一种矿物领域知识图谱构建方法及系统,其特征在于,所述方法包括:获取矿物领域的数据,进行人工标注得到标注数据集mineraldata;利用数据集mineraldata训练基于albert

bilstm

crf的实体识别模型,得到矿物领域实体识别模型mineralentitymodel;利用数据集mineraldata训练基于albert

bilstm

attention的关系抽取模型,得到矿物领域关系抽取模型mineralrelationmodel;及根据所述模型识别得到的矿物领域实体和矿物实体关系,建立矿物领域知识图谱。2.根据权利要求1所述的矿物领域知识图谱构建方法及系统,其特征在于,步骤“获取矿物领域的数据,进行人工标注得到标注数据集mineraldata”具体包括:基于互联网资源获取国家岩矿化石标本资源库的矿物数据和公开发表的矿物相关论文摘要数据;对获取到的矿物领域部分数据进行人工标注;及将人工标注好的数据按照一定比例划分为训练集和测试集,形成数据集mineraldata。3.根据权利要求2所述的矿物领域知识图谱构建方法,其特征在于,步骤“对获取到的矿物领域部分数据进行人工标注”具体包括:根据获取到的矿物领域数据抽取部分数据构建语料库;及对所述语料库中的内容进行分词、词性标注和关系标注。4.根据权利要求2所述的矿物领域知识图谱构建方法,其特征在于,步骤“将人工标注好的数据按照一定比例划分为训练集和测试集,形成数据集mineraldata”具体包括:对标注好的数据按照7:3的比例划分训练集和测试集;及将标注、划分好的词性标注数据集和关系标注数据集保存下来形成数据集mineraldata。5.根据权利要求1所述的矿物领域知识图谱构建方法,其特征在于,步骤“利用数据集mineraldata训练基于albert

bilstm

crf的实体识别模型,得到矿物领域实体识别模型mineralentitymodel”具体包括:使用python编程语言,基于tensorflow框架构建albert

bilstm

crf实体识别模型;将mineraldata数据集中的词性标注数据集输入到albert

bilstm

crf实体识别模型中进行训练,训练初始参数batch_size为16,learn rate为0.001,dropout为0.2,epoch为100,优化器为adam;及将训练好的模型保存下来得到矿物领域实体识别模型mineralentitymodel。6.根据权利要求1所述的矿物领域知识图谱构建方法,其特征在于,步骤“利用数据集mineraldata训练基于albert

bilstm

attention的关系抽取模型,得到矿物领域关系抽取模型mineralrelationmodel”具体包括:使用python编程语言,基于tensorflow框架构建albert

bilstm

attention关系识别模型;将mineraldata数据集中的关系标注数据集输入到albert

bilstm

attention关系识别模型中进行训练,训练初始参数batch_size为16,learn rate为0.001,dropout为0.2,epoch为100,优化器为adam;及将训练好的模型保存下来得到矿物领域关系识别模型mineralrelationmodel。
7.根据权利要求1所述的矿物领域知识图谱构建方法,其特征在于,步骤“根据所述模型识别得到的矿物领域实体和矿物实体关系,建立矿物领域知识图谱”具体包括:将获取到的数据中未经过人工标注的部分输入到mineralentitymodel中得到矿物领域的矿物实体;将获取到的数据中未经过人工标注的部分输入到mineralrelationmodel中得到矿物领域的矿物关系;及将得到的多个矿物领域实体及实体之间的关系关系导入到预设图形数据库,并进行可视化转换得到所述矿物领域知识图谱。8.如权利要求1所述的矿物领域知识图谱构建方法,其特征在于:所述矿物领域知识图谱用于提供矿物领域实体识别、矿物领域关联实体查询和矿物领域实体概览。

技术总结
本发明公开了一种矿物领域知识图谱构建方法及系统,该方法包括:获取矿物相关数据,提取矿物实体和矿物实体间的关系,并构建知识图谱。本发明提供的矿物领域知识图谱构建方法及系统,其通过获取矿物领域数据,对数据应用实体识别模型和关系抽取模型获得矿物知识三元组,最后构建一个较为全面的矿物知识图谱。可以通过该知识图谱进行实体识别,实体搜索和关系搜索,提高矿物领域相关知识的检索速度。提高矿物领域相关知识的检索速度。提高矿物领域相关知识的检索速度。


技术研发人员:季晓慧 董雨航 张悦 杨眉
受保护的技术使用者:中国地质大学(北京)
技术研发日:2021.07.14
技术公布日:2021/10/23
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1