一种基于大语言模型的SQL语句生成方法、装置及设备与流程

文档序号:36505003发布日期:2023-12-28 10:12阅读:45来源:国知局
一种基于大语言模型的的制作方法

本申请涉及人工智能,尤其涉及一种基于大语言模型的sql语句生成方法、装置及设备。


背景技术:

1、大语言模型(large language models,llms)已经被证明具有推理能力,能够解决涉及数学、符号、常识、以及知识推理的任务。目前大语言模型的推理过程是使用原始自回归的机制去生成文本,也就是在字符级别逐个地从左到右地生成文字。

2、相关技术中,一般是将待转换文本输入到大语言模型中,大语言模型直接输出该待转换文本对应的结构化查询语言(structured query language,sql)语句,但是,由于大语言模型是从左到右逐字进行处理的,如果待转换文本是比较复杂的文本,那么大语言模型输出的sql语句的可靠性和稳健性不能保证。

3、因此,如何提高sql语句生成的准确率成为亟待解决的问题。


技术实现思路

1、本申请实施例提供了一种基于大语言模型的sql语句生成方法、装置、及设备,用以解决现有技术中大语言模型直接输出的sql语句的可靠性和稳健性不能保证的问题。

2、第一方面,本申请提供了一种基于大语言模型的sql语句生成方法,所述方法包括:

3、获取待转换文本;

4、将所述待转换文本输入到所述大语言模型中,所述大语言模型根据所述待转换文本中包括的内容,确定对所述待转换文本进行转换的n个转换计划,任一转换计划中包括至少一个执行步骤;确定每个所述执行步骤对应的多个候选sql语句;基于路径搜索算法确定最优转换计划中的每个执行步骤对应的目标候选sql语句,将所述目标候选sql语句确定为所述待转换文本对应的目标sql语句。

5、第二方面,本申请还提供了一种基于大语言模型的sql语句生成装置,所述装置包括:

6、获取模块,用于获取待转换文本;

7、生成模块,用于将所述待转换文本输入到所述大语言模型中,所述大语言模型根据所述待转换文本中包括的内容,确定对所述待转换文本进行转换的n个转换计划,任一转换计划中包括至少一个执行步骤;确定每个所述执行步骤对应的多个候选sql语句;基于路径搜索算法确定最优转换计划中的每个执行步骤对应的目标候选sql语句,将所述目标候选sql语句确定为所述待转换文本对应的目标sql语句。

8、第三方面,本申请还提供了一种电子设备,所述电子设备包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如上述任一所述基于大语言模型的sql语句生成方法的步骤。

9、第四方面,本申请还提供了一种计算机可读存储介质,其存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一所述基于大语言模型的sql语句生成方法的步骤。

10、在本申请实施例中,获取待转换文本,将待转换文本输入到大语言模型中,由大语言模型根据待转换文本中包括的内容,确定对待转换文本进行转换的n个转换计划,任一转换计划中包括至少一个执行步骤,并确定每个执行步骤对应的多个候选sql语句,再基于路径搜索算法确定最优转换计划中的每个执行步骤对应的目标候选sql语句,从而将目标候选sql语句确定为待转换文本对应的目标sql语句,即利用大语言模型的语言处理能力,使大语言模型生成多种转换计划,每个转换计划包括至少一个执行步骤,即将待转换文本分解为简单文本,以提高大语言模型处理文本的能力,并针对每个执行步骤生成多个候选sql语句,基于路径搜索算法,确定最优转换计划及最优转换计划中的最优候选sql语句,有效提高了大语言模型生成sql语句的准确率。



技术特征:

1.一种基于大语言模型的sql语句生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述大语言模型根据所述待转换文本中包括的内容,确定对所述待转换文本进行转换的n个转换计划包括:

3.根据权利要求1所述的方法,其特征在于,所述确定每个所述执行步骤对应的多个候选sql语句包括:

4.根据权利要求3所述的方法,其特征在于,确定所述下一执行步骤是否为该转换计划中的最后一个执行步骤的过程包括:

5.根据权利要求1所述的方法,其特征在于,所述路径搜索算法确定最优转换计划中的每个执行步骤对应的目标候选sql语句,将所述目标候选sql语句确定为所述待转换文本对应的目标sql语句包括:

6.根据权利要求5所述的方法,其特征在于,所述大语言模型对该待评估语句进行评估,得到第一评分包括:

7.根据权利要求5所述的方法,其特征在于,所述根据所述第一数量、所述第一评分、所述第二数量,以及预设权重,确定该待评估语句对应的目标评分包括:

8.根据权利要求6所述的方法,其特征在于,所述将所述最优sql语句所在的转换计划中,位于所述最优sql语句所对应的执行步骤的下一执行步骤对应的每个候选sql语句确定为所述待评估语句包括:

9.一种基于大语言模型的sql语句生成装置,其特征在于,所述装置包括:

10.一种电子设备,其特征在于,所述电子设备包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1-8任一项所述基于大语言模型的sql语句生成方法的步骤。


技术总结
本申请涉及人工智能技术领域,尤其涉及一种基于大语言模型的SQL语句生成方法、装置及设备。由大语言模型确定对待转换文本进行转换的N个转换计划,及每个执行步骤对应的多个候选SQL语句,再基于路径搜索算法确定最优转换计划中的每个执行步骤对应的目标候选SQL语句,也就是说使大语言模型确定多种转换计划,每个转换计划包括至少一个执行步骤,即将待转换文本分解为简单文本,以提高大语言模型处理文本的能力,并生成每个执行步骤的多个候选SQL语句,基于路径搜索算法确定最优候选SQL语句,有效提高了大语言模型生成SQL语句的准确率。本申请所保护的技术方案具有可泛化性、实时性、可控性、可靠性特点,符合可信赖特性。

技术研发人员:冯卫森,刘微,孟卫明,杨斌,刘秀美,葛赛赛,张传伟
受保护的技术使用者:海信集团控股股份有限公司
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1