基于大语言模型的信息获取方法、装置、设备及介质与流程

文档序号:37161620发布日期:2024-03-01 11:57阅读:16来源:国知局
基于大语言模型的信息获取方法、装置、设备及介质与流程

本公开涉及大模型领域,具体涉及人工智能、大语言模型和人机交互领域,尤其涉及一种基于大语言模型的信息获取方法、装置、设备及介质。


背景技术:

1、近年来,大语言模型的理解和生成能力大幅提升,其应用领域也得到了广泛的扩展。

2、大型语言模型(llm,large language model,其本质是生成式模型),是指使用大量文本数据训练的深度学习模型,可以理解语言文本的含义,并生成符合用户意图的内容,例如,执行任务、进行人机对话、问题解答和图像生成等。


技术实现思路

1、本公开提供了一种基于大语言模型的信息获取方法、装置、设备及介质。

2、根据本公开的一方面,提供了一种基于大语言模型的信息获取方法,包括:

3、获取自然语言内容;

4、将所述自然语言内容输入至大语言模型中,得到当前的第一中间状态;

5、响应于确定所述第一中间状态不包括目标生成内容,根据所述第一中间状态更新当前的第一输入状态,得到第二输入状态;

6、将所述自然语言内容和所述第二输入状态输入到大语言模型中,更新所述第一中间状态,得到第二中间状态;

7、响应于确定所述第二中间状态中包括所述目标生成内容,根据所述第二中间状态得到所述自然语言内容的回复内容。

8、根据本公开的一方面,提供了一种基于大语言模型的信息获取装置,包括:

9、自然语言内容获取模块,用于获取自然语言内容;

10、当前中间状态获取模块,用于将所述自然语言内容输入至大语言模型中,得到当前的第一中间状态;

11、输入状态更新模块,用于响应于确定所述第一中间状态不包括目标生成内容,根据所述第一中间状态更新当前的第一输入状态,得到第二输入状态;

12、中间状态更新模块,用于将所述自然语言内容和所述第二输入状态输入到大语言模型中,更新所述第一中间状态,得到第二中间状态;

13、回复内容输出模块,用于响应于确定所述第二中间状态中包括所述目标生成内容,根据所述第二中间状态得到所述自然语言内容的回复内容。

14、根据本公开的另一方面,提供了一种电子设备,包括:

15、至少一个处理器;以及

16、与所述至少一个处理器通信连接的存储器;其中,

17、所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开任一实施例所述的基于大语言模型的信息获取方法。

18、根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行本公开任一实施例所述的基于大语言模型的信息获取方法。

19、根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现本公开任一实施例所述的基于大语言模型的信息获取方法。

20、本公开实施例可以提高大语言模型的输出结果准确性。

21、应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。



技术特征:

1.一种基于大语言模型的信息获取方法,包括:

2.根据权利要求1所述的方法,其中,所述根据所述第一中间状态更新当前的第一输入状态,得到第二输入状态,包括:

3.根据权利要求1所述的方法,其中,所述将所述自然语言内容和所述第二输入状态输入到大语言模型中,包括:

4.根据权利要求1所述的方法,其中,所述将所述自然语言内容和所述第二输入状态输入到大语言模型中,更新所述第一中间状态,得到第二中间状态,包括:

5.根据权利要求1所述的方法,其中,所述第一中间状态,包括:第一动作、第一动作描述内容、第一动作推理过程、第一中间结果和第一动作标识;所述第二中间状态包括下述至少一项:第二动作、第二动作描述内容、第二动作推理过程、第二中间结果和第二动作标识;其中,所述动作是所述大语言模型在预设的多个动作中筛选得到。

6.根据权利要求5所述的方法,其中,所述动作描述内容包括历史的动作标识对应的中间状态。

7.根据权利要求1所述的方法,还包括:

8.根据权利要求7所述的方法,其中,所述将所述自然语言内容、所述第一输入状态和所述第三中间状态输入到大语言模型中,得到第三中间状态的校验结果,包括:

9.根据权利要求8所述的方法,其中,所述获取校验提示内容,包括:

10.一种基于大语言模型的信息获取装置,包括:

11.根据权利要求10所述的装置,其中,所述输入状态更新模块,包括:

12.根据权利要求10所述的装置,其中,所述中间状态更新模块,包括:

13.根据权利要求10所述的装置,其中,所述中间状态更新模块,包括:

14.根据权利要求10所述的装置,其中,所述第一中间状态,包括:第一动作、第一动作描述内容、第一动作推理过程、第一中间结果和第一动作标识;所述第二中间状态包括下述至少一项:第二动作、第二动作描述内容、第二动作推理过程、第二中间结果和第二动作标识;其中,所述动作是所述大语言模型在预设的多个动作中筛选得到。

15.根据权利要求14述的装置,其中,所述动作描述内容包括历史的动作标识对应的中间状态。

16.根据权利要求10所述的装置,还包括:

17.根据权利要求16所述的装置,其中,所述第二状态校验模块,包括:

18.根据权利要求17所述的装置,其中,所述校验提示内容获取子单元,具体用于:

19.一种电子设备,包括:

20.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-9中任一项所述的基于大语言模型的信息获取方法。

21.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-9中任一项所述的基于大语言模型的信息获取方法。


技术总结
本公开提供了一种基于大语言模型的信息获取方法、装置、设备及介质,涉及大模型领域,具体涉及人工智能、大语言模型和人机交互领域。具体实现方案为:获取自然语言内容;将所述自然语言内容输入至大语言模型中,得到当前的第一中间状态;响应于确定所述第一中间状态不包括目标生成内容,根据所述第一中间状态更新当前的第一输入状态,得到第二输入状态;将所述自然语言内容和所述第二输入状态输入到大语言模型中,更新所述第一中间状态,得到第二中间状态;响应于确定所述第二中间状态中包括所述目标生成内容,根据所述第二中间状态得到所述自然语言内容的回复内容。本公开实施例可以提高大语言模型的输出结果准确性。

技术研发人员:梁晨,姜文斌,冯知凡,崔骁鹏,袁星,佘俏俏
受保护的技术使用者:北京百度网讯科技有限公司
技术研发日:
技术公布日:2024/2/29
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1