一种数据库表连接优化方法、装置、计算设备和存储介质与流程

文档序号:34024338发布日期:2023-05-05 08:04阅读:20来源:国知局
本发明涉及数据处理,具体涉及一种数据库表连接优化方法、装置、计算设备和存储介质。
背景技术
::1、在关系型数据库里面,每个实体有自己的一张表(table),所有属性都是这张表的字段(field),表与表之间根据关联字段"连接"(join)在一起。所以,表的连接是关系型数据库的核心问题。查询优化表的连接是数据库技术重要的研究领域,表连接次序的选择是影响查询性能的一个重要因素,表连接次序对于减少临时结果的大小是很重要的,因此大部分查询优化器在连接次序上花了很多功夫。基于关系代数理论,自然连接的结合满足结合律,面对等价计算,如何获取代价最小的结合方式成为数据库研究热点。n个表格做自然连接是一个非确定性多项式难题(non-deterministic polynomialhard,np-hard),当n值变的很大的时候将产生数据库无法承受的代价,因此如何在n值比较大的情况下,代价控制在可接受范围内是亟待解决的技术问题。2、现有技术中针对n值比较大的情况,通过将遗传算法和动态规划算法引入数据库系统用来解决连接优化问题,遗传算法有助于解决连接空间膨胀的问题,其将搜索范围限制在一个较小的范围内,而动态规划算法需要遍历搜索空间中的每一个路径。3、然而,动态规划算法以及遗传算法解题都是利用代价模型评估的代价进行估算,未能全面利用节点信息以及欧式空间信息,且动态规划算法的时间复杂度为指数级别,遗传算法虽然在速度上可以通过控制参数得到提升,但是对于大规模的寻优问题容易陷入局部最优,无法找到全局最优解。技术实现思路1、鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种数据库表连接优化方法、装置、计算设备和存储介质。2、根据本发明的一个方面,提供了一种数据库表连接优化方法,包括:3、获取待连接表数据,依据所述待连接表数据和数据库代价模型构建有向图模型;4、依据所述有向图模型确定对应的特征矩阵和邻接矩阵,将所述特征矩阵和所述邻接矩阵通过图卷积网络进行特征提取,得到目标特征数据;5、将所述目标特征数据输入至transformer模型中,通过transformer模型预测得到有向图模型中的节点路径,依据所述节点路径确定表连接顺序。6、根据本发明的另一方面,提供了一种数据库表连接优化装置,包括:7、模型构建模块,用于获取待连接表数据,依据所述待连接表数据和数据库代价模型构建有向图模型;8、特征提取模块,用于依据所述有向图模型确定对应的特征矩阵和邻接矩阵,将所述特征矩阵和所述邻接矩阵通过图卷积网络进行特征提取,得到目标特征数据;9、处理模块,用于将所述目标特征数据输入至transformer模型中,通过transformer模型预测得到有向图模型中的节点路径,依据所述节点路径确定表连接顺序。10、根据本发明的又一方面,提供了一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;11、所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行上述一种数据库表连接优化方法对应的操作。12、根据本发明的再一方面,提供了一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如上述一种数据库表连接优化方法对应的操作。13、根据本发明的一种数据库表连接优化方法、装置、计算设备和存储介质,通过获取待连接表数据,依据待连接表数据和数据库代价模型构建有向图模型;依据有向图模型确定对应的特征矩阵和邻接矩阵,将特征矩阵和邻接矩阵通过图卷积网络进行特征提取,得到目标特征数据;将目标特征数据输入至transformer模型中,通过transformer模型预测得到有向图模型中的节点路径,依据节点路径确定表连接顺序。本发明将数据库表连接问题抽象成一个基于有向图模型的序列预测问题,通过图卷积网络进行空间特征提取,通过transformer模型进行选择决策,预测得到有向图模型中的节点路径,实现最优路径选择,将深度学习引入数据库表连接中,充分利用空间特征与节点表征特性等优势,图卷积网络与transformer模型结合可以在多项式时间复杂度内完成节点路径预测,弥补现有技术中遗传算法的不足。14、上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。技术特征:1.一种数据库表连接优化方法,其特征在于,包括:2.根据权利要求1所述的方法,其特征在于,所述依据所述待连接表数据和数据库代价模型构建有向图模型进一步包括:3.根据权利要求1所述的方法,其特征在于,所述依据所述有向图模型确定对应的特征矩阵和邻接矩阵进一步包括:4.根据权利要求3所述的方法,其特征在于,所述表信息包括以下信息的一项或多项:待连接表数据的表序列号、行数、列数、表字节大小。5.根据权利要求1所述的方法,其特征在于,在所述依据所述有向图模型确定对应的特征矩阵和邻接矩阵之后,所述方法还包括:6.根据权利要求1-5任一项所述的方法,其特征在于,所述通过transformer模型预测得到有向图模型中的节点路径进一步包括:7.一种数据库表连接优化装置,其特征在于,包括:8.根据权利要求7所述的装置,其特征在于,所述模型构建模块进一步用于:9.一种计算设备,其特征在于,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;10.一种计算机存储介质,其特征在于,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如权利要求1-6中任一项所述的一种数据库表连接优化方法对应的操作。技术总结本发明公开了一种数据库表连接优化方法、装置、计算设备和存储介质,该方法包括:依据待连接表数据和数据库代价模型构建有向图模型;依据有向图模型确定对应的特征矩阵和邻接矩阵,将特征矩阵和邻接矩阵通过图卷积网络进行特征提取得到目标特征数据;将目标特征数据输入至transformer模型中,预测得到有向图模型中的节点路径,依据节点路径确定表连接顺序。本发明将数据库表连接问题抽象成一个基于有向图模型的序列预测问题,将深度学习引入数据库表连接中,充分利用空间特征与节点表征特性等优势,图卷积网络与transformer模型结合可以在多项式时间复杂度内完成节点路径预测,弥补现有技术中遗传算法的不足。技术研发人员:蒋忠强受保护的技术使用者:中移(苏州)软件技术有限公司技术研发日:技术公布日:2024/1/12
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1