知识图谱构建方法及装置、计算设备、存储介质与流程

文档序号:24125447发布日期:2021-03-02 13:15阅读:来源:国知局

技术特征:
1.一种知识图谱构建方法,其特征在于,所述方法包括:接收信息抽取指令,所述信息抽取指令用于指示对构建知识图谱的源数据进行信息抽取采用的信息抽取策略;采用所述信息抽取指令所指示的信息抽取策略,对所述源数据进行信息抽取,得到多个多元组数据,每个多元组数据包括:用于指示实体的实体类型的信息、实体属性的信息和关联关系的信息;根据所述多个多元组数据,构建所述知识图谱,所述知识图谱记录所述源数据所包括的实体及不同实体之间的关系。2.根据权利要求1所述的方法,其特征在于,在所述根据所述多个多元组数据,构建所述知识图谱之前,所述方法还包括:获取用于构建所述知识图谱时需要使用的知识图谱本体模型,所述知识图谱本体模型定义所述知识图谱中多元组数据的标准化描述;接收映射策略指令,所述映射策略指令用于指示根据所述多元组数据的标准化描述对所述多个多元组数据进行关联映射的映射策略;根据所述多元组数据的标准化描述和所述映射策略指令所指示的映射策略,对所述多个多元组数据进行关联映射,得到采用所述多元组数据的标准化描述进行标准化描述的多个多元组数据;所述根据所述多个多元组数据,构建所述知识图谱,包括:根据标准化描述后的多个多元组数据,构建所述知识图谱。3.根据权利要求1或2所述的方法,其特征在于,在所述根据所述多个多元组数据,构建所述知识图谱之前,所述方法还包括:根据指定的多元组数据匹配策略,在所述多个多元组数据中,确定包括有指示同一实体的信息的不同多元组数据;对包括有指示同一实体的信息的不同多元组数据进行合并处理;所述根据所述多个多元组数据,构建所述知识图谱,包括:根据经过合并处理后的多个多元组数据,构建所述知识图谱。4.根据权利要求3所述的方法,其特征在于,在所述根据指定的多元组数据匹配策略,在所述多个多元组数据中,确定包括有指示同一实体的信息的不同多元组数据之前,所述方法还包括:接收匹配策略指令,所述匹配策略指令用于指示判断不同多元组数据中是否包括有指示同一实体的信息的匹配算法和匹配度阈值;所述根据指定的多元组数据匹配策略,在所述多个多元组数据中,确定包括有指示同一实体的信息的不同多元组数据,包括:当根据所述匹配策略指令所指示的匹配算法,确定两个多元组数据中指示实体的信息的匹配度不小于所述匹配度阈值时,确定所述两个多元组数据包括有指示同一实体的信息。5.根据权利要求1至4任一所述的方法,其特征在于,所述源数据包括:来源不同的多路数据,所述采用所述信息抽取指令所指示的信息抽取策略,对所述源数据进行信息抽取,得到多个多元组数据,包括:
分别采用所述信息抽取指令所指示的对每路数据进行信息抽取采用的信息抽取策略,对每路数据进行信息抽取,得到分别与所述多路数据对应的多个多元组数据;所述根据所述多个多元组数据,构建所述知识图谱,包括:根据与所述多路数据对应的多个多元组数据,构建所述知识图谱。6.根据权利要求1至5任一所述的方法,其特征在于,在所述根据所述多个多元组数据,构建所述知识图谱之后,所述方法还包括:在确定所述源数据发生更新后,根据所述信息抽取指令所指示的策略,对更新后的源数据中的增量数据进行信息抽取,得到所述增量数据对应的多个多元组数据;根据所述增量数据对应的多个多元组数据更新所述知识图谱。7.根据权利要求1所述的方法,其特征在于,所述采用所述信息抽取指令所指示的信息抽取策略,对所述源数据进行信息抽取,包括:采用所述信息抽取指令所指示的ai模型,对所述源数据进行信息抽取;其中,所述ai模型为已经过训练的模型,且所述ai模型的训练样本使用知识图谱本体模型中多元组数据的标准化描述进行标注,所述知识图谱本体模型定义所述知识图谱中多元组数据的标准化描述。8.一种知识图谱构建装置,其特征在于,所述装置包括:接收模块,用于接收信息抽取指令,所述信息抽取指令用于指示对构建知识图谱的源数据进行信息抽取采用的信息抽取策略;抽取模块,用于采用所述信息抽取指令所指示的信息抽取策略,对所述源数据进行信息抽取,得到多个多元组数据,每个多元组数据包括:用于指示实体的实体类型的信息、实体属性的信息和关联关系的信息;构建模块,用于根据所述多个多元组数据,构建所述知识图谱,所述知识图谱记录所述源数据所包括的实体及不同实体之间的关系。9.根据权利要求8所述的装置,其特征在于,所述装置还包括:获取模块,用于获取用于构建所述知识图谱时需要使用的知识图谱本体模型,所述知识图谱本体模型定义所述知识图谱中多元组数据的标准化描述;所述接收模块,还用于接收映射策略指令,所述映射策略指令用于指示根据所述多元组数据的标准化描述对所述多个多元组数据进行关联映射的映射策略;映射模块,用于根据所述多元组数据的标准化描述和所述映射策略指令所指示的映射策略,对所述多个多元组数据进行关联映射,得到采用所述多元组数据的标准化描述进行标准化描述的多个多元组数据;所述构建模块,具体用于:根据标准化描述后的多个多元组数据,构建所述知识图谱。10.根据权利要求8或9所述的装置,其特征在于,所述装置还包括:确定模块,用于根据指定的多元组数据匹配策略,在所述多个多元组数据中,确定包括有指示同一实体的信息的不同多元组数据;合并模块,用于对包括有指示同一实体的信息的不同多元组数据进行合并处理;所述构建模块,具体用于:根据经过合并处理后的多个多元组数据,构建所述知识图谱。
11.根据权利要求10所述的装置,其特征在于,所述接收模块,还用于接收匹配策略指令,所述匹配策略指令用于指示判断不同多元组数据中是否包括有指示同一实体的信息的匹配算法和匹配度阈值;所述确定模块,具体用于:当根据所述匹配策略指令所指示的匹配算法,确定两个多元组数据中指示实体的信息的匹配度不小于所述匹配度阈值时,确定所述两个多元组数据包括有指示同一实体的信息。12.根据权利要求8至11任一所述的装置,其特征在于,所述源数据包括:来源不同的多路数据,所述抽取模块,具体用于:分别采用所述信息抽取指令所指示的对每路数据进行信息抽取采用的信息抽取策略,对每路数据进行信息抽取,得到分别与所述多路数据对应的多个多元组数据;所述构建模块,具体用于:根据与所述多路数据对应的多个多元组数据,构建所述知识图谱。13.根据权利要求8至12任一所述的装置,其特征在于,所述抽取模块,还用于在确定所述源数据发生更新后,根据所述信息抽取指令所指示的策略,对更新后的源数据中的增量数据进行信息抽取,得到所述增量数据对应的多个多元组数据;所述构建模块,还用于根据所述增量数据对应的多个多元组数据更新所述知识图谱。14.根据权利要求8所述的装置,其特征在于,所述抽取模块,具体用于:采用所述信息抽取指令所指示的ai模型,对所述源数据进行信息抽取;其中,所述ai模型为已经过训练的模型,且所述ai模型的训练样本使用知识图谱本体模型中多元组数据的标准化描述进行标注,所述知识图谱本体模型定义所述知识图谱中多元组数据的标准化描述。15.一种计算设备,其特征在于,所述计算设备包括处理器和存储器;所述存储器中存储有计算机程序;所述处理器执行所述计算机程序时,所述计算设备实现权利要求1至7中任一所述的知识图谱构建方法。16.一种非易失性的存储介质,其特征在于,当所述存储介质中的指令被处理器执行时,实现权利要求1至7中任一所述的知识图谱构建方法。
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1