本公开涉及知识图谱构建,尤其涉及一种态势分析领域的知识抽取方法、装置、设备和存储介质。
背景技术:
1、知识抽取是知识图谱构建过程中至关重要的一环。近些年来,针对非结构化数据,研究者大多青睐于采用基于“提示”预训练的模型进行知识抽取。通过设计不同的prompt(提示),预训练模型可以抽取不同类型的信息,可以满足各种任务需求,例如实体识别、关系提取、事件提取等,具有很高的灵活性和可扩展性,代表性的预训练模型为uie(unifiedstructure generation for universal information extraction,基于统一结构生成的通用信息抽取模型)。
2、基于uie的知识抽取技术,通过任务描述和少量样例就可以满足各种信息抽取的需求,但该模型基于统一结构进行知识抽取,需要在进行抽取和微调之前,清晰地定义所有的抽取需求,才能提取出准确的知识信息。然而,对于态势分析领域的文本数据,通常包含有大量不同种类的行为关系,这些行为关系对后期态势分析、多源数据融合分析有着极大作用,但uie基于预先定义的行为关系进行关系抽取时,很容易漏掉重要的关系信息,从而影响知识抽取的准确性。
技术实现思路
1、有鉴于此,本公开提出了一种态势分析领域的知识抽取方法、装置、设备和存储介质,可以提高关系抽取的准确性,进而提高整个知识抽取的准确性。
2、根据本公开的第一方面,提供了一种态势分析领域的知识抽取方法,包括:
3、获取目标文本,基于预先训练的大语言模型,抽取所述目标文本中的第一实体指称,并将所述第一实体指称与预先构建的态势分析领域知识建模数据中定义的本体进行映射,得到所述第一实体指称对应的本体;
4、基于所述第一实体指称对应的本体,在所述态势分析领域知识建模数据中筛选出与所述第一实体指称对应的标准实体属性和标准关系,并将所述标准实体属性作为所述第一实体指称的实体属性;
5、基于所述大语言模型,由所述目标文本中抽取所述实体属性的属性信息,将所述第一实体指称、所述第一实体指称的实体属性以及所述实体属性的属性信息作为所述第一实体指称的实体数据;
6、基于所述大语言模型,由所述目标文本中抽取出与所述第一实体指称关联的行为信息、时间信息、地点信息、经纬度信息以及对象信息中的至少一种关系信息,并基于至少一种所述关系信息以及所述第一实体指称对应的标准关系,确定所述第一实体指称的关系数据;
7、其中,各所述第一实体指称的实体数据和关系数据,即为所述目标文本的知识抽取结果。
8、在一种可能的实现方式中,在获取所述目标文本时,包括:
9、获取待处理的态势分析文本;
10、对所述态势分析文本进行数据格式转换、文本清洗中的至少一种预处理操作,得到标准态势分析文本;
11、对所述标准态势分析文本进行划分,得到多个所述目标文本。
12、在一种可能的实现方式中,在基于至少一种所述关系信息以及所述第一实体指称对应的标准关系,确定所述第一实体指称的关系数据时,包括:
13、提取所述关系信息中的行为信息,判断所述标准关系中是否存在与所述行为信息相匹配的标准关系:
14、在存在与所述行为信息相匹配的标准关系时,将与所述行为信息相匹配的标准关系作为所述第一实体指称的关系,将所述关系信息中的其它信息作为所述关系的关系属性信息;
15、在不存在与所述行为信息相匹配的标准关系时,将所述行为信息作为所述第一实体指称的关系,将所述关系信息中的其它信息作为所述关系的关系属性信息;
16、将所述第一实体指称的关系以及所述关系属性作为所述第一实体指称的关系数据。
17、在一种可能的实现方式中,在由所述目标文本中抽取出与所述实体指称关联的地点信息和或所述对象信息时,还包括:
18、基于所述大语言模型,抽取所述地点信息和或所述对象信息中的第二实体指称,并将所述第二实体指称与所述态势分析领域知识建模数据中定义的本体进行映射,得到所述第二实体指称对应的本体;
19、以所述第二实体指称对应的本体为标签,将所述第二实体指称加入至知识图谱库中。
20、在一种可能的实现方式中,在由所述目标文本中抽取出与所述实体指称关联的时间信息之后,还包括:将所述时间信息转换为标准时间信息的操作。
21、在一种可能的实现方式中,判断所述第一实体指称是否属于预设的特定类型,在所述第一实体指称属于所述特定类型时,还包括:
22、获取所述第一实体指称对应的轨迹数据,并将所述轨迹数据加入至所述第一实体指称的关系数据中。
23、在一种可能的实现方式中,在所述第一实体指称属于所述特定类型时,还包括:
24、生成所述第一实体指称对应的遥感影像的存储路径,并根据所述存储路径获取对应遥感影像,并将获取到所述遥感影像存储至所述第一实体指称的关系数据中。
25、根据本公开的第二方面,提供了一种态势分析领域的知识抽取方法装置,包括:
26、实体抽取模块,用于获取目标文本,基于预先训练的大语言模型,抽取所述目标文本中的第一实体指称,并将所述第一实体指称与预先构建的态势分析领域知识建模数据中定义的本体进行映射,得到所述第一实体指称对应的本体;
27、标准信息抽取模块,用于基于所述第一实体指称对应的本体,在所述态势分析领域知识建模数据中筛选出与所述第一实体指称对应的标准实体属性和标准关系,并将所述标准实体属性作为所述第一实体指称的实体属性;
28、实体数据抽取模块,用于基于所述大语言模型,由所述目标文本中抽取所述实体属性的属性信息,将所述第一实体指称、所述第一实体指称的实体属性以及所述实体属性的属性信息作为所述第一实体指称的实体数据;
29、关系数据抽取模块,用于基于所述大语言模型,由所述目标文本中抽取出与所述第一实体指称关联的行为信息、时间信息、地点信息、经纬度信息以及对象信息中的至少一种关系信息,并基于至少一种所述关系信息以及所述第一实体指称对应的标准关系,确定所述第一实体指称的关系数据;
30、其中,各所述第一实体指称的实体数据和关系数据,即为所述目标文本的知识抽取结果。
31、根据本公开的第三方面,提供了一种态势分析领域的知识抽取方法设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为执行本公开第一方面所述的方法。
32、根据本公开的第四方面,提供了一种非易失性计算机可读存储介质,其上存储有计算机程序指令,其中,所述计算机程序指令被处理器执行时实现本公开第一方面所述的方法。
33、本公开提供了一种态势分析领域的知识抽取方法,包括获取目标文本,基于预先训练的大语言模型,抽取目标文本中的第一实体指称,并将第一实体指称与预先构建的态势分析领域知识建模数据中定义的本体进行映射,得到第一实体指称对应的本体;基于第一实体指称对应的本体,在态势分析领域知识建模数据中筛选出与第一实体指称对应的标准实体属性和标准关系,并将标准实体属性作为第一实体指称的实体属性;基于大语言模型,由目标文本中抽取实体属性的属性信息,将第一实体指称、第一实体指称的实体属性以及实体属性的属性信息作为第一实体指称的实体数据;基于大语言模型,由目标文本中抽取出与第一实体指称关联的行为信息、时间信息、地点信息、经纬度信息以及对象信息中的至少一种关系信息,并基于至少一种关系信息以及第一实体指称对应的标准关系,确定第一实体指称的关系数据;其中,各第一实体指称的实体数据和关系数据,即为目标文本的知识抽取结果。通过本公开的方法可以提高关系抽取的准确性,进而提高整个知识抽取的准确性。
34、根据下面参考附图对示例性实施例的详细说明,本公开的其它特征及方面将变得清楚。