实体信息图谱生成方法、装置、电子设备及存储介质与流程

文档序号:35438545发布日期:2023-09-13 23:27阅读:23来源:国知局
实体信息图谱生成方法、装置、电子设备及存储介质与流程

本发明涉及信息图谱生成,尤其涉及一种实体信息图谱生成方法、装置、电子设备及存储介质。


背景技术:

1、信息图谱是真实世界中存在的各种实体、概念及关系构成的语义网络图,用于形式化地描述真实世界中各类事物及对应的关联关系,信息图谱的本质是加强不同数据源之间的连接,并使用本体模型对数据进行规范化处理,有利于挖掘数据的隐含语义。但是,传统方法中信息图谱的构建存在较为明显的两个问题:第一,信息图谱没有统一的表示体系,具体信息完全依赖于处理程序的解释形式,推理无法保证较高的正确性,并且在逻辑上可能不充分,无法消除二义性;第二,由于信息量过大,导致实体之间的关系多且复杂,从而在构建信息图谱时信息可能不够完善。因此,如何从海量信息源中挖掘出有价值的信息数据,将非结构化的信息数据转化为结构化数据,并根据结构化数据生成具有逻辑关系的信息图谱成为一个亟待解决的问题。


技术实现思路

1、本发明提供一种实体信息图谱生成方法、装置、电子设备及存储介质,其主要目的在于解决如何从海量信息源中挖掘出有价值的信息数据并生成具有逻辑关系的信息图谱。

2、为实现上述目的,本发明提供的一种实体信息图谱生成方法,包括:

3、获取实体信息数据,对所述实体信息数据进行信息抽取,得到三元组;

4、对所述三元组进行信息融合,得到融合信息,并根据所述融合信息构建评分函数及损失函数;

5、基于所述评分函数及所述损失函数利用所述融合信息构建初始信息图谱,并对所述初始信息图谱进行链接预测;

6、根据链接预测的结果对所述初始信息图谱进行更新,得到实体信息图谱。

7、可选地,所述对所述实体信息数据进行信息抽取,得到三元组,包括:

8、对所述实体信息数据进行结构化处理,得到结构化数据;

9、对所述结构化数据进行分词处理,得到信息分词;

10、对所述信息分词进行分类,得到分词类别;

11、对所述分词类别及所述信息分词进行关联性分析,根据关联性分析的结果确定所述分词类别及所述信息分词的关联关系;

12、根据所述信息分词、所述关联关系及所述分词类别生成三元组。

13、可选地,所述对所述三元组进行信息融合,得到融合信息,包括:

14、对所述三元组进行特征提取,得到三元特征;

15、对多个所述三元特征进行拼接处理,得到拼接特征;

16、对所述拼接特征进行聚合,得到聚合特征,根据所述聚合特征确定融合信息。

17、可选地,所述对所述拼接特征进行聚合,得到聚合特征,包括:

18、对所述拼接特征进行归一化处理,得到归一化特征;

19、利用下述公式对所述归一化特征及所述拼接特征进行计算,得到聚合特征;

20、

21、其中,a表示所述聚合特征,bi表示第i个拼接特征,ci表示第i个拼接特征对应的归一化特征,i表示所述拼接特征的总数。

22、可选地,所述根据所述融合信息构建评分函数及损失函数,包括:

23、从所述融合信息中随机选取两个候选信息作为目标信息,计算所述目标信息之间的相似度,基于所述相似度获取所述目标信息之间的信息关联关系;

24、对所述目标信息进行特征提取,得到目标特征,并对所述目标特征进行映射处理,得到映射矩阵;

25、根据所述相似度、所述信息关联关系及所述映射矩阵生成评分函数:

26、

27、其中,d表示所述评分函数计算得到的评分,ej表示第j个映射矩阵,e表示所述相似度,r表示所述信息关联关系,j表示所述映射矩阵的总数,b表示预设的计算参数,tanh表示激活函数,exp表示指数函数;

28、根据所述目标特征及所述评分函数生成损失函数:

29、

30、其中,l表示所述损失函数计算得到的损失值,ff表示第f个目标特征,d表示所述评分函数计算得到的评分,其中,l(·)表示当括号内的等式成立时,l(·)=1,反之,l(·)=0。

31、可选地,所述基于所述评分函数及所述损失函数利用所述融合信息构建初始信息图谱,包括:

32、获取所述融合信息的数据结构,对所述数据结构进行标准化处理,得到标准结构,并利用所述标准结构对所述融合信息进行更新,得到更新融合信息;

33、根据所述评分函数对所述更新融合信息进行评分,得到信息分值,并根据所述信息分值对所述更新融合信息进行排序,得到信息序列;

34、根据所述更新融合信息及所述信息序列生成知识库,并根据所述损失函数计算所述知识库的损失值;

35、基于所述损失值对所述知识库进行修正处理,得到修正知识库;

36、获取所述更新融合信息之间的目标关联关系,根据所述目标关联关系及所述修正知识库生成初始信息图谱。

37、可选地,所述对所述初始信息图谱进行链接预测,包括:

38、获取所述初始信息图谱中更新融合信息之间的关联实体,判断所述关联实体之间是否存在关联关系;

39、当所述关联实体之间存在关联关系时,判定所述初始信息图谱为正常信息图谱;

40、当所述关联实体之间不存在关联关系时,判定所述初始信息图谱为异常信息图谱。

41、为了解决上述问题,本发明还提供一种实体信息图谱生成装置,所述装置包括:

42、三元组生成模块,用于获取实体信息数据,对所述实体信息数据进行信息抽取,得到三元组;

43、函数构建模块,用于对所述三元组进行信息融合,得到融合信息,并根据所述融合信息构建评分函数及损失函数;

44、链接预测模块,用于基于所述评分函数及所述损失函数利用所述融合信息构建初始信息图谱,并对所述初始信息图谱进行链接预测;

45、实体信息图谱生成模块,用于根据链接预测的结果对所述初始信息图谱进行更新,得到实体信息图谱。

46、为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:

47、至少一个处理器;以及,

48、与所述至少一个处理器通信连接的存储器;其中,

49、所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述所述的实体信息图谱生成方法。

50、为了解决上述问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个计算机程序,所述至少一个计算机程序被电子设备中的处理器执行以实现上述所述的实体信息图谱生成方法。

51、本发明实施例通过对实体信息数据进行信息抽取,能够将非结构化的实体信息数据转化为结构化的三元组,从而保证数据的准确性及统一性;通过对三元组进行信息融合,能够保证得到的融合信息更加完善;通过评分函数、损失函数及融合信息构建初始信息图谱,能够保证初始信息图谱的精确性;通过对初始信息图谱进行链接预测,根据预测的结果对初始信息图谱进行更新,使得到的实体信息图谱更加准确,并且使得实体信息图谱能够准确体现信息之间的内部关系。因此本发明提出的实体信息图谱生成方法、装置、电子设备及存储介质,可以解决如何从海量信息源中挖掘出有价值的信息数据并生成具有逻辑关系的信息图谱的问题。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1