用于文本到SQL任务的数据生成方法、电子设备和存储介质与流程

文档序号:33383780发布日期:2023-03-08 07:09阅读:来源:国知局

技术特征:
1.一种用于文本到sql任务的数据生成方法,包括:基于原始文本到sql数据的第一数据库架构图中的关系类表以及实体类表,构建包含实体、关系的第一实体关系图,其中,所述实体确定为所述第一实体关系图的节点,各实体间的关系确定为所述第一实体关系图的边;至少通过所述第一实体关系图中的节点或边进行图变换,得到第二实体关系图;根据所述第二实体关系图生成关系类变化的第二实体关系图,基于所述第二实体关系图确定的抽象语法树,生成结构化数据增强的文本到sql数据。2.根据权利要求1所述的方法,其中,所述至少根据所述第一实体关系图中的节点或边进行图变换包括:实体到属性的图变换、概念到属性的图变换、命名关系到未命名关系的图变换、未命名关系到命名关系的图变换。3.根据权利要求2所述的方法,其中,所述实体到属性的图变换包括:选择所述第一实体关系图中的成对节点确定为源实体和目标实体,其中,所述目标实体包含所述源实体对应表的外键表;基于所述目标实体的属性对所述源实体的属性进行转换,以实现实体到属性的图变换。4.根据权利要求2所述的方法,其中,所述概念到属性的图变换包括:利用预训练的命名实体识别模型检测所述第一实体关系图中节点的实体对应表的上级类别,基于所述上级类别创建的表存储所述实体的概念;将所述实体的概念替换为所述实体的属性,以实现概念到属性的图变换。5.根据权利要求2所述的方法,其中,所述命名关系到未命名关系的图变换包括:为所述第一实体关系图中边对应的关系创建用于更改关系类型的外键,将所述边对应的关系确定为named-命名关系,将所述外键对应的关系确定为unnamed-未命名关系;基于所述named-命名关系对所述unnamed-未命名关系进行修改,以实现命名关系到未命名关系的图变换。6.根据权利要求5所述的方法,其中,所述未命名关系到命名关系的图变换包括:基于所述named-命名关系对所述unnamed-未命名关系进行逆向修改,以实现未命名关系到命名关系的图变换。7.一种用于文本到sql任务的数据生成系统,包括:实体关系确定程序模块,用于基于原始文本到sql数据的第一数据库架构图中的关系类表以及实体类表,构建包含实体、关系的第一实体关系图,其中,所述实体确定为所述第一实体关系图的节点,各实体间的关系确定为所述第一实体关系图的边;图变换程序模块,用于至少通过所述第一实体关系图中的节点或边进行图变换,得到第二实体关系图;数据生成程序模块,用于根据所述第二实体关系图生成关系类变化的第二实体关系图,基于所述第二实体关系图确定的抽象语法树,生成结构化数据增强的文本到sql数据。8.根据权利要求7所述的系统,其中,所述图变换程序模块用于:实体到属性的图变换、概念到属性的图变换、命名关系到未命名关系的图变换、未命名关系到命名关系的图变换。9.一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少
一个处理器执行,以使所述至少一个处理器能够执行权利要求1-6中任一项所述方法的步骤。10.一种存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-6中任一项所述方法的步骤。

技术总结
本发明实施例提供一种用于文本到SQL任务的数据生成方法、电子设备和存储介质。该方法包括:基于原始文本到SQL数据的第一数据库架构图中的关系类表以及实体类表,构建包含实体、关系的第一实体关系图;至少通过第一实体关系图中的节点或边进行图变换,得到第二实体关系图;根据第二实体关系图生成关系类变化的第二实体关系图,基于第二实体关系图确定的抽象语法树,生成结构化数据增强的文本到SQL数据。本发明实施例利用少量的标注可以自动生成大量的适用于结构泛化性研究的数据,同时也可以使用本方法生成的结构化的文本到SQL数据用作数据增强来提升text-to-SQL系统的鲁棒性,进而提升用户语音交互的体验。进而提升用户语音交互的体验。进而提升用户语音交互的体验。


技术研发人员:俞凯 陈露 李杰宇 曹瑞升 朱苏 陈志 张晗翀
受保护的技术使用者:思必驰科技股份有限公司
技术研发日:2022.11.24
技术公布日:2023/3/7
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1