一种分布式数据库系统的跨节点查询优化方法及系统的制作方法_4

文档序号:9547240阅读:来源:国知局
尽可能做到本地化或近地化)片段上进行查 询。
[0158] 步骤S230,多因素决策的模糊评估模块430进行多因素决策的模糊评估(无论查 询结果是否在本地),判定多个影响因素中对降低查询代价贡献最大的影响因素。
[0159] 步骤S240,连接建立模块440进行连接建立,即在当前的分片查询路径中,根据对 降低查询代价贡献最大的影响因素,查找到查询代价最小的数据库节点并与之建立连接进 行查询,从而得到片段上的查询结果。
[0160] 步骤S250,局部优化模块450在与片段上的查询结果有关的各个数据库节点进行 局部优化,即将多因素决策的模糊评估的评估结果作为局部优化的输入,由拥有与查询有 关的片段的各个站点进行局部优化。局部优化的输出是在片段上的查询结果,即最优分片 查询路径
[0161] 在第三阶段,即全局优化阶段300中:
[0162] 步骤S310, Bp神经网络自适应优化模块460进行Bp神经网络自适应优化,其输入 是在片段上的查询结果,即最优分片查询路径。定义全局优化代价函数并采用BP神经网络 求得其最小值。
[0163] 步骤S320,全局优化模块470进行全局优化并最终输出最优的全局查询路径。
[0164] 所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非 旨在暗示本公开的范围(包括权利要求)被限于这些例子;在本发明的思路下,以上实施例 或者不同实施例中的技术特征之间也可以进行组合,并存在如上所述的本发明的不同方面 的许多其它变化,为了简明它们没有在细节中提供。因此,凡在本发明的精神和原则之内, 所做的任何省略、修改、等同替换、改进等,均应包含在本发明的保护范围之内。
【主权项】
1. 一种分布式数据库系统的跨节点查询优化方法,其特征在于,包括: 确定全局查询总代价以及全局查询总代价最低要求; 在局部优化阶段: 通过查询分解及数据本地化的步骤将查询问题落在合适的片段上; 通过多因素决策的模糊评估判定多个影响因素中对降低查询代价贡献最大的影响因 素; 进行连接建立,即在当前的分片查询路径中,根据对降低查询代价贡献最大的影响因 素,查找到查询代价最小的数据库节点并与之建立连接进行查询,从而得到片段上的查询 结果; 在与片段上的查询结果有关的各个数据库节点进行局部优化; 在全局优化阶段: 定义全局优化代价函数; 采用Bp神经网络求得全局优化代价函数的最小值,使得输出满足全局查询总代价逼 近全局查询总代价最低要求,其中,Bp神经网络的输入为片段上的查询结果; 进行全局优化并最终输出最优的全局查询路径。2. 根据权利要求1所述的方法,其特征在于,所确定全局查询总代价以及全局查询总 代价最低要求的步骤中,将全局查询总代价最低要求定义为查询时间误差估计和查询响应 时间的加权和,即Cmin= w i·%+w;;·tp其中,Cmin是指全局查询总代价最低要求,t^是指查 询时间误差估计,其为全部网络时延及时钟漂移引起的查询时间误差之和的估计,t是指 查询响应时间,其是从用户提交查询请求到收到完整的返回信息的平均时间,并有Wl+w2 = 1〇3. 根据权利要求1所述的方法,其特征在于,所述多因素决策的模糊评估至少包括以 下过程: 构建多因素决策的模糊评估模型; 对每个分片查询路径进行优化判决; 评估结果作为局部优化的输入。4. 根据权利要求3所述的方法,其特征在于,所述构建多因素决策的模糊评估模型至 少包括以下步骤: 定义每个分片查询路径中共有I个影响因素能够降低查询代价; 定义在I个影响因素共同作用下得到的查询代价函数为F(Xl),其中Xl为函数输入; 定义其优化目标函数,即min{F(Xl) },用于判定对降低查询代价贡献最大的影响因素。5. 根据权利要求4所述的方法,其特征在于,所述对每个分片查询路径进行优化判决 至少包括以下步骤: 对min{F(Xl)}进行求解得到一组Ul,其中+为优化目标函数解析式中的一个参数,其 表示第i(i<I)个影响因素对降低查询代价的贡献; 选取其中最大的^,判定对应第i个影响因素对降低查询代价贡献最大; 查找当前的分片查询路径中,在第i个影响因素作用下查询代价最小的数据库节点并 与之建立连接进行查询。6. -种分布式数据库系统的跨节点查询优化系统,其特征在于,包括: 全局查询总代价最低要求模块,用于在全局总代价定义确定全局查询总代价以及全局 查询总代价最低要求; 查询分解及本地化模块,用于将查询问题落在合适的片段上; 多因素决策的模糊评估模块,用于通过构建多因素决策的模糊评估模型,判定多个影 响因素中对降低查询代价贡献最大的影响因素; 连接建立模块,用于在当前的分片查询路径中,根据对降低查询代价贡献最大的影响 因素,查找到查询代价最小的数据库节点并与之建立连接进行查询;从而得到片段上的查 询结果; 局部优化模块,用于在与片段上的查询结果有关的各个数据库节点进行局部优化; Bp神经网络自适应优化模块,用于定义全局优化代价函数,并采用Bp神经网络求得全 局优化代价函数的最小值,使得输出满足全局查询总代价逼近全局查询总代价最低要求, 其中,Bp神经网络的输入为片段上的查询结果; 全局优化模块,用于进行全局优化并最终输出最优的全局查询路径。7. 根据权利要求6所述的系统,其特征在于,所述全局查询总代价最低要求模块,用于 将全局查询总代价最低要求定义为查询时间误差估计和查询响应时间的加权和,即C_ = Wi·ν^2 ·ty其中,Cmin是指全局查询总代价最低要求,t^是指查询时间误差估计,其为全 部网络时延及时钟漂移引起的查询时间误差之和的估计,t是指查询响应时间,其是从用 户提交查询请求到收到完整的返回信息的平均时间,并有Wl+W2= 1。8. 根据权利要求6所述的系统,其特征在于,所述多因素决策的模糊评估模块,包括: 模型构建模块,用于构建多因素决策的模糊评估模型; 优化判决模块,用于对每个分片查询路径进行优化判决; 局部优化输入模块,用于将评估结果作为局部优化的输入。9. 根据权利要求8所述的系统,其特征在于,所述模型构建模块包括: 影响因素定义模块,用于定义每个分片查询路径中共有I个影响因素能够降低查询代 价; 查询代价函数定义模块,用于定义在I个影响因素共同作用下得到的查询代价函数为Fh),其中X:为函数输入; 优化目标函数定义模块,用于定义其优化目标函数,即min{F(Xl) },其用于判定对降低 查询代价贡献最大的影响因素。10. 根据权利要求9所述的系统,其特征在于,所述优化判决模块包括: 求解模块,用于对min{F(Xl)}进行求解得到一组Ul,其中Ul为优化目标函数函数解析 式中的一个参数,其表示第i(i<I)个影响因素对降低查询代价的贡献; 影响因素判定模块,用于选取其中最大的^,判定对应第i个影响因素对降低查询代价 贡献最大; 查询连接模块,用于查找当前的分片查询路径中,在第i个影响因素作用下查询代价 最小的数据库节点并与之建立连接进行查询。
【专利摘要】本发明公开了一种分布式数据库系统的跨节点查询优化系统,包括:全局查询总代价最低要求模块,查询分解及本地化模块,多因素决策的模糊评估模块,连接建立模块,局部优化模块,Bp神经网络自适应优化模块,全局优化模块。在此系统的基础上,提出了一种分布式数据库系统的跨节点查询优化方法,实现了在局部优化阶段对每个分片查询路径进行优化判决,以及在全局优化阶段对全部分片查询路径进行Bp神经网络自适应优化。本发明通过对每个分片查询路径的优化,降低全局优化的计算负担,使得全局查询具有更快的查询速度,并通过定义全局优化代价函数使得查询总代价可控。
【IPC分类】G06N3/04, G06F17/30
【公开号】CN105302858
【申请号】CN201510601093
【发明人】张春光, 孙乔, 焦艳斌, 孙甲松
【申请人】北京国电通网络技术有限公司, 国家电网公司, 国网浙江省电力公司, 北京中电飞华通信股份有限公司, 清华大学, 北京万里开源软件有限公司
【公开日】2016年2月3日
【申请日】2015年9月18日
当前第4页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1