本技术属于人工智能,尤其涉及一种知识图谱的构建方法、装置、存储介质、电子设备及计算机程序产品。
背景技术:
1、随着信息技术的高速发展,大数据已成为人们谈论的热点名词,随之而来的是数据量的爆发、数据形式的多样化。传统的数据存储和分析方式,已经无法应对和满足人们对大数据分析的要求,从而引发人们对新的数据表示存储方式——知识图谱的研究热潮。
2、知识图谱在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。知识图谱的本质是一种叫做语义网络的知识库,用来描述真实世界中那些客观存在的实体、概念和这些实体概念之间的关联关系。
3、目前,工业领域的知识类型由于需要精准可溯源,故该领域的知识图谱大多是通过领域专家对概念、实体、属性、关系进行系统梳理后,人工手动创建的,工作量巨大,知识图谱的创建效率较低。
技术实现思路
1、本技术旨在至少解决现有技术中存在的技术问题之一。为此,本技术提出一种知识图谱的构建方法、装置、存储介质、电子设备及计算机程序产品,能借助大模型实现工业领域知识图谱的自动化创建,知识图谱创建效率高。
2、第一方面,本技术提供了一种知识图谱的构建方法,包括:
3、获取工业知识样本集,所述工业知识样本集包括多个工业知识样本;
4、根据已创建的多个任务流程模板和工业大模型,确定每个所述工业知识样本对应的三元组数据集,不同的所述任务流程模板用于生成不同的任务流程,所述任务流程用于指示所述工业大模型执行相应任务;
5、根据每个所述三元组数据集确定相应工业知识样本的知识图谱;
6、根据所有的所述知识图谱生成工业知识图谱。
7、在一些实施例中,所述根据已创建的多个任务流程模板和工业大模型,确定每个所述工业知识样本对应的三元组数据集,包括:
8、根据已创建的第一任务流程模板和所述工业知识样本,生成第一任务流程,所述第一任务流程用于指示所述工业大模型对所述工业知识样本进行段落切分;
9、将所述第一任务流程输入工业大模型中,以得到所述工业知识样本对应的至少一个文本段落;
10、根据已创建的第二任务流程模板和所述文本段落,生成第二任务流程,所述第二任务流程用于指示所述工业大模型对所述文本段落进行三元组数据提取;
11、将所述第二任务流程输入所述工业大模型中,以得到所有的所述文本段落对应的三元组数据集,所述三元组数据集包括至少一个三元组数据。
12、在一些实施例中,所述根据所有的所述知识图谱生成工业知识图谱,包括:
13、对所有的所述知识图谱中的实体数据进行预处理;
14、对预处理后的所述实体数据进行实体对齐,得到实体对齐结果;
15、根据所述实体对齐结果,将所有的所述知识图谱进行融合,得到工业知识图谱。
16、在一些实施例中,所述知识图谱的构建方法还包括:
17、获取用户输入的待解答问题;
18、根据所述工业大模型和所述工业知识图谱,对所述待解答问题进行解答。
19、在一些实施例中,所述根据所述工业大模型和所述工业知识图谱,对所述待解答问题进行解答,包括:
20、根据已创建的第三任务流程模板和所述待解答问题,生成第三任务流程,所述第三任务流程用于指示所述工业大模型从所述待解答问题中提取关键词;
21、将所述第三任务流程输入所述工业大模型中,以得到至少一个关键词;
22、根据所述至少一个关键词和所述工业知识图谱,确定所述待解答问题的解答结果。
23、在一些实施例中,所述根据所述至少一个关键词和所述工业知识图谱,确定所述待解答问题的解答结果,包括:
24、从所述工业知识图谱中确定与所述至少一个关键词相匹配的知识,得到目标知识;
25、根据已创建的第四任务流程模板、所述目标知识和所述待解答问题,生成第四任务流程,所述第四任务流程用于指示所述工业大模型根据所述待解答问题对所述目标知识进行优化;
26、将所述第四任务流程输入所述工业大模型中,以得到优化后的所述目标知识;
27、在用户界面上显示优化后的所述目标知识,以向所述用户解答所述待解答问题。
28、第二方面,本技术提供了一种知识图谱的构建装置,包括:
29、获取模块,用于获取工业知识样本集,所述工业知识样本集包括多个工业知识样本;
30、第一确定模块,用于根据已创建的多个任务流程模板和工业大模型,确定每个所述工业知识样本对应的三元组数据集,不同的所述任务流程模板用于生成不同的任务流程,所述任务流程用于指示所述工业大模型执行相应任务;
31、第二确定模块,用于根据每个所述三元组数据集确定相应工业知识样本的知识图谱;
32、生成模块,用于根据所有的所述知识图谱生成工业知识图谱。
33、在一些实施例中,第一确定模块具体用于:
34、根据已创建的第一任务流程模板和所述工业知识样本,生成第一任务流程,所述第一任务流程用于指示所述工业大模型对所述工业知识样本进行段落切分;
35、将所述第一任务流程输入工业大模型中,以得到所述工业知识样本对应的至少一个文本段落;
36、根据已创建的第二任务流程模板和所述文本段落,生成第二任务流程,所述第二任务流程用于指示所述工业大模型对所述文本段落进行三元组数据提取;
37、将所述第二任务流程输入所述工业大模型中,以得到所有的所述文本段落对应的三元组数据集,所述三元组数据集包括至少一个三元组数据。
38、在一些实施例中,生成模块具体用于:
39、对所有的所述知识图谱中的实体数据进行预处理;
40、对预处理后的所述实体数据进行实体对齐,得到实体对齐结果;
41、根据所述实体对齐结果,将所有的所述知识图谱进行融合,得到工业知识图谱。
42、在一些实施例中,该知识图谱的构建装置还包括解答模块,用于:
43、获取用户输入的待解答问题;
44、根据所述工业大模型和所述工业知识图谱,对所述待解答问题进行解答。
45、在一些实施例中,该解答模块具体用于:
46、根据已创建的第三任务流程模板和所述待解答问题,生成第三任务流程,所述第三任务流程用于指示所述工业大模型从所述待解答问题中提取关键词;
47、将所述第三任务流程输入所述工业大模型中,以得到至少一个关键词;
48、根据所述至少一个关键词和所述工业知识图谱,确定所述待解答问题的解答结果。
49、在一些实施例中,该解答模块具体用于:
50、从所述工业知识图谱中确定与所述至少一个关键词相匹配的知识,得到目标知识;
51、根据已创建的第四任务流程模板、所述目标知识和所述待解答问题,生成第四任务流程,所述第四任务流程用于指示所述工业大模型根据所述待解答问题对所述目标知识进行优化;
52、将所述第四任务流程输入所述工业大模型中,以得到优化后的所述目标知识;
53、在用户界面上显示优化后的所述目标知识,以向所述用户解答所述待解答问题。
54、第三方面,本技术提供了一种非暂态计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的知识图谱的构建方法。
55、第四方面,本技术提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述任一项所述的知识图谱的构建方法。
56、第五方面,本技术提供了一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的知识图谱的构建方法。
57、本技术实施例提供的知识图谱的构建方法、装置、存储介质、电子设备及计算机程序产品,通过获取工业知识样本集,工业知识样本集包括多个工业知识样本;根据已创建的多个任务流程模板和工业大模型,确定每个工业知识样本对应的三元组数据集,不同的任务流程模板用于生成不同的任务流程,任务流程用于指示工业大模型执行相应任务;根据每个三元组数据集确定相应工业知识样本的知识图谱;根据所有的知识图谱生成工业知识图谱,从而能利用工业大模型和各种预设好的任务流程模板实现知识图谱的自动化创建,无需人工手动创建,极大地提高了图谱的创建效率,灵活性高。