本发明涉及大型语言模型领域,尤其涉及大模型基于图结构的推理路径生成及自行修正方法、装置和计算机设备。
背景技术:
1、大型语言模型(llm)在图结构中的推理任务通常涉及多跳推理,它要求模型首先准确理解用户用自然语言提出的问题,并从中提取关键信息如实体和属性。然后,模型将这些信息与图结构数据中的相应实体、关系相匹配。推理过程需要模型能够从大量信息中提取相关部分,构建推理路径,最终得出符合问题的答案。这一过程对于模型的语义理解能力和逻辑推理能力提出了很高的要求,尤其是在处理大规模和复杂的图结构数据时。
2、现有的方法通常采用llm逐步构建推理路径,从特定元素(例如知识图谱中的实体或关系)开始,利用图谱的结构来扩展推理路径。这些方法通过llm与图结构进行频繁交互,利用图结构(如图谱)提供的知识来减少模型进行复杂推理时的错误,但推理过程需要多次调用模型,效率低下。此外,一些方法通过微调模型参数来注入图结构知识,虽然在推理过程中不需要与图结构交互,提高了推理效率,但无法确保模型输出信息的可靠性,并且依赖大量标注数据,在未见过的数据上性能也会下降。
3、针对上述问题,本发明通过结合图结构特性和llm的语义理解能力,提出了一种新的高效推理路径生成和优化机制。旨在提高llm在大规模图结构上的推理效率和准确性。
技术实现思路
1、针对现有技术存在的不足,本发明提供大模型基于图结构的推理路径生成及自行修正方法、装置和计算机设备。
2、为实现上述目的,本发明采用的技术方案如下:
3、一方面,本法提供大模型基于图结构的推理路径生成及自行修正方法,包括以下步骤:
4、s1、对待处理源文档进行分块、提取元素实例和元素摘要并构建为图结构;
5、s2、根据给定问题和所述图结构,计算出和给定问题最相关的k跳子图并转为关系三元组;
6、s3、将所述给定问题和所述k跳子图作为上下文输入大语言模型,生成一个或多个推理路径;
7、s4、将当前生成的推理路径在所述图结构上实例化,并判断实例化是否成功,若推理路径实例化失败并转s4,若实例化成功则转s8;
8、s5、实例化失败后收集错误原因;
9、s6、利用收集的错误原因以及当前正在进行实例化的推理路径,修正正在进行实例化的候选关系;
10、s7、基于所述给定问题和修正的候选关系调用大语言模型编辑实例化失败的推理路径,生成修正后的推理路径并转s4;
11、s8、将实例化成功或编辑次数达到最大的推理路径和给定问题发送给大语言模型,大语言模型以cot方式处理用于回答问题的三元组,生成最终的答案。
12、进一步地,所述s1包括:
13、s11、提取待处理源文档的输入文本,将输入文本分割为设定粒度的文本块;
14、s12、使用大语言模型提示识别每个文本块中的所有实体以及所有明确相关实体之间的关系,抽取得到各文本块中实体、关系和声明的描述,即元素实例;
15、s13、对各文本块中实体、关系和声明的描述进行大语言模型摘要,使实体、关系和声明的描述转换为对应的实体节点、关系边和声明协变量的单个描述文本块,即元素摘要;
16、s14、将各文本块中的实体节点、关系边建模为一个同质无向加权图,即图结构。
17、进一步地,所述每个文本块中的所有实体包括名称、类型和描述;
18、所述所有明确相关实体之间的关系包括源实体和目标实体以及它们关系的描述。
19、进一步地,所述s2中和给定问题最相关的k跳子图根据以下步骤计算:
20、根据给定问题识别出实体,利用bm25和contriever算法计算得到图结构中实体最相似的节点,取这些节点的k跳子图作为和给定问题最相关的k跳子图。
21、进一步地,所述s4中推理路径的实例化,并判断实例化是否成功,包括关系绑定和路径连接;其中,关系绑定包括对推理路径中每一个用自然语言表达的关系,系统通过bm25和contriever算法查找图结构中语义信息相似的关系作为候选关系;路径连接包括在关系绑定的基础上,检查是否存在从起始实体触发的推理路径实例,将该推理路径上与起始实体连接的关系依次匹配候选关系,若候选关系能够连接到当前处理的实体,说明该部分推理路径成功实例化,并对推理路径上的剩余关系重复上述步骤,直至整个推理路径被成功实例化;若没有候选关系能够连接到当前处理的实体,说明该部分推理路径实例化失败。
22、进一步地,所述错误原因包括:不相关的自然语言关系,候选的图结构关系没有一个连接到当前实体、空推理路径、推理路径以复合节点结束。
23、进一步地,所述最大编辑次数根据实验需求和资源限制来设定。
24、另一方面,本发明提供大模型基于图结构的推理路径生成及自行修正装置,包括:
25、第一模块,用于对待处理源文档进行分块、提取元素实例和元素摘要并构建为图结构;
26、第二模块,用于根据给定问题和所述图结构,计算出和给定问题最相关的k跳子图并转为关系三元组;
27、第三模块,用于将所述给定问题和所述k跳子图作为上下文输入大语言模型,生成一个或多个推理路径;
28、第四模块,用于将当前生成的推理路径在所述图结构上实例化,并判断实例化是否成功;
29、第五模块,用于实例化失败后收集错误原因;
30、第六模块,用于利用收集的错误原因以及当前正在进行实例化的推理路径,修正正在进行实例化的候选关系;
31、第七模块,用于基于所述给定问题和修正的候选关系调用大语言模型编辑实例化失败的推理路径,生成修正后的推理路径;
32、第八模块,用于将实例化成功或编辑次数达到最大的推理路径和给定问题发送给大语言模型,大语言模型以cot方式处理用于回答问题的三元组,生成最终的答案。
33、另一方面,本发明提供一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现大模型基于图结构的推理路径生成及自行修正方法的步骤。
34、另一方面,本发明提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现大模型基于图结构的推理路径生成及自行修正方法的步骤。
35、相对于现有技术,本发明能够产生的有益技术效果是:
36、本发明所提供大模型基于图结构的推理路径生成及自行修正方法、装置和计算机设备,利用图结构保存文本信息,以节点和边的形式,将长文本的关键元素及关系进行有效组织和表征,以便于捕捉多跳关系;本发明借助图的结构特性,提升模型的长上下文信息理解和处理能力,从而有助于生成更准确的答案。
37、本发明结合待查询的问题和图结构,找出问题最为相关的k跳子图(k为超参数)并转为关系三元组,大语言模型再结合看k跳子图信息和待查询的问题,生成一个完整的且与图强关联的推理路径,大幅提升推理路径实例化的效率,仅在必要时编辑路径,利用错误信息和环境反馈来指导编辑过程,而不是反复调用大语言模型进行路径生成,减少了大语言模型调用次数(即与图结构的交互次数),提高了推理的效率和准确性。
38、本发明利用图片中的结构化信息和实体、关系的嵌入表示,提升推理过程中对用户查询问题的准确理解,从而提高推理结果的准确性。并且通过自动化的推理路径生成和编辑机制,减少人工干预,提高推理过程的智能化水平,使大语言模型能够更加独立自主地完成复杂的推理任务。
39、本发明通过图结构信息存储方法,并创新地把大语言模型结合图结构信息,能在任务开始阶段就生成完整的推理路径,优化了推理过程,仅在必要时利用错误信息和环境反馈来指导编辑路径,减少对大语言模型的调用。