一种将文本转换为SQL语句的方法及设备与流程

文档序号:35208886发布日期:2023-08-24 02:21阅读:44来源:国知局
一种将文本转换为SQL语句的方法及设备与流程

本申请涉及数据处理,尤其涉及一种将文本转换为sql语句的方法及设备。


背景技术:

1、在城市问答系统的应用场景中,用于回答用户提问的答案往往存放在关系型数据库中,城市问答系统在接收到问题语句之后,需要将该问题语句转换为结构化查询语言(structured query language,sql)语句,并基于该sql语句在关系型数据库中,查找该sql语句对应的答案。

2、在现有技术中,在将问题语句转换为sql语句时,往往通过一个语言模型实现,如基于转换器的双向编码器表示(bidirectional encoder representations fromtransformer,bert)模型等。具体包括两种方式:方式一是bert模型直接生成问题语句对应的sql语句;方式二是bert模型对问题语句进行命名实体识别和分类,确定问题语句对应的问题类型、主题及关键字,然后用预先定义好的该问题类型模板拼装成sql语句。

3、但是,方式一中由于bert模型的性能限制,不能准确理解问题语句中的用户意图,并且直接将问题语句转化成sql语句,转换跨度太大,将文本转换为sql语句的转换准确率过低;方式二中由于需要使用模板生成sql语句,对于每一种问题类型,都需要一个模板相匹配,这就需要构造大量的模板,并且实际使用中往往出现模板不足的情况,导致将文本转换为sql语句的准确率低。


技术实现思路

1、本申请提供了一种将文本转换为sql语句的方法及设备,用以解决现有技术中将问题语句转换为sql语句时,转换的准确率低的问题。

2、第一方面,本申请实施例提供了一种将文本转换为sql语句的方法,所述方法包括:

3、将问题语句填充到schema link模板中,并将填充好的schema link模板输入到语言大模型中,获取所述语言大模型输出的所述问题语句对应的schema link信息;

4、根据所述schema link信息以及所述问题语句,对问题难度分类模板进行填充,并将填充好的问题难度分类模板输入到所述语言大模型中,获取所述语言大模型输出的所述问题语句对应的问题难度分类信息;

5、根据所述问题难度分类信息、所述schema link信息以及所述问题语句,对结构化查询语言sql语句生成模板进行填充,并将填充好的sql语句生成模板输入到所述语言大模型中,获取所述语言大模型输出的sql语句。

6、第二方面,本申请实施例还提供了一种电子设备,所述电子设备包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如上述任一所述将文本转换为sql语句的方法的步骤。

7、在本申请实施例中,城市问答系统将问题语句填充到schema link模板中,并将填充好的schema link模板输入到语言大模型中,获取该语言大模型输出的该问题语句对应的schema link信息;根据该schema link信息以及该问题语句,对问题难度分类模板进行填充,并将填充好的问题难度分类模板输入到该语言大模型中,获取该语言大模型输出的该问题语句对应的问题难度分类信息;根据该问题难度分类信息、该schema link信息以及该问题语句,对结构化查询语言sql语句生成模板进行填充,并将填充好的sql语句生成模板输入到该语言大模型中,获取该语言大模型输出的sql语句。在本申请实施例中,城市问答系统使用语言大模型处理输入的问题语句,具体的,该城市问答系统将问题语句填充到schema link模板,再通过语言大模型,得到schema link信息;城市问答系统再将该schemalink信息填充到问题难度分类模板,然后通过语言大模型,得到问题难度分类信息;城市问答系统再根据问题难度分类信息,填充sql语句生成模板,然后通过语言大模型,得到sql语句。城市问答系统通过语言大模型将问题语句转化为sql语句的过程逐步分解,提高了城市问答系统的可靠性、鲁棒性和可泛化性。



技术特征:

1.一种将文本转换为sql语句的方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述schema link模板包括:用于提示所述语言大模型进行schema link识别的第一提示词、预设的表信息、示例问题语句、示例问题语句对应的示例schema link信息以及待填充问题语句的第一字段。

3.根据权利要求2所述的方法,其特征在于,所述将问题语句填充到schema link模板中包括:

4.根据权利要求1所述的方法,其特征在于,所述问题难度分类模板包括:用于提示所述语言大模型进行问题难度分类的第二提示词、预设的表信息、问题难度分类信息分别对应的示例问题语句和示例schema link信息、待填充问题语句的第二字段以及待填充schema link信息的第三字段。

5.根据权利要求4所述的方法,其特征在于,所述根据所述schema link信息以及所述问题语句,对问题难度分类模板进行填充包括:

6.根据权利要求1所述的方法,其特征在于,所述问题难度分类信息包括:简单问题、非嵌套复杂问题或嵌套复杂问题。

7.根据权利要求6所述的方法,其特征在于,所述sql语句生成模板包括:简单问题对应的第一sql语句生成模板、非嵌套复杂问题对应的第二sql语句生成模板以及嵌套复杂问题对应的第三sql语句生成模板;

8.根据权利要求7所述的方法,其特征在于,所述根据所述问题难度分类信息、所述schema link信息以及所述问题语句,对结构化查询语言sql语句生成模板进行填充包括:

9.根据权利要求1所述的方法,其特征在于,所述将问题语句填充到schema link模板中之前,所述方法还包括:

10.根据权利要求1所述的方法,其特征在于,所述方法还包括:

11.一种电子设备,其特征在于,所述电子设备包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1-10任一项所述的将文本转换为sql语句的方法的步骤。


技术总结
本申请涉及数据处理技术领域,尤其涉及一种将文本转换为SQL语句的方法及设备,在本申请实施例中,城市问答系统使用语言大模型处理输入的问题语句,具体的,该城市问答系统将问题语句填充到schema link模板,再通过语言大模型,得到schema link信息;城市问答系统再将该schema link信息填充到问题难度分类模板,然后通过语言大模型,得到问题难度分类信息;城市问答系统再根据问题难度分类信息,填充SQL语句生成模板,然后通过语言大模型,得到SQL语句。城市问答系统通过语言大模型将问题语句对应的文本转化为SQL语句的过程逐步分解,提高了城市问答系统的可靠性、鲁棒性和可泛化性。

技术研发人员:陈帅,刘微,张建安,曲磊
受保护的技术使用者:海信集团控股股份有限公司
技术研发日:
技术公布日:2024/1/14
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1