本文件涉及分布式,尤其涉及一种分布式数据库的数据查询方法及装置。
背景技术:
1、随着互联网在不断发展和推广,为了应对互联网上迅猛增长的数据的存储和管理需求,分布式处理技术被广泛应用,尤其是分布式数据库作为分布式处理技术在数据存储领域的重要手段得到了广泛应用,分布式数据库是指利用高速计算机网络将物理上分散的多个数据存储节点连接起来组成一个逻辑上统一的数据库集群,基于建立的分布式数据库可以进行高效的数据存储和数据访问。
技术实现思路
1、本说明书一个或多个实施例提供了一种分布式数据库的数据查询方法,包括:获取在分布式数据库进行数据查询的查询语句。对所述查询语句包含的查询关键词进行特征提取,获得查询关键词特征。在所述分布式数据库的历史数据分布中确定所述查询关键词对应的关键词数据分布,并基于所述关键词数据分布生成关键词密度特征。将所述查询关键词特征和所述关键词密度特征输入基数估计模型进行数据基数估计,获得所述查询关键词对应的目标数据的基数估计值。
2、本说明书一个或多个实施例提供了一种分布式数据库的数据查询装置,包括:查询语句获取模块,被配置为获取在分布式数据库进行数据查询的查询语句。特征提取模块,被配置为对所述查询语句包含的查询关键词进行特征提取,获得查询关键词特征。密度特征生成模块,被配置为在所述分布式数据库的历史数据分布中确定所述查询关键词对应的关键词数据分布,并基于所述关键词数据分布生成关键词密度特征。数据基数估计模块,被配置为将所述查询关键词特征和所述关键词密度特征输入基数估计模型进行数据基数估计,获得所述查询关键词对应的目标数据的基数估计值。
3、本说明书一个或多个实施例提供了一种分布式数据库的数据查询设备,包括:处理器;以及,被配置为存储计算机可执行指令的存储器,所述计算机可执行指令在被执行时使所述处理器:获取在分布式数据库进行数据查询的查询语句。对所述查询语句包含的查询关键词进行特征提取,获得查询关键词特征。在所述分布式数据库的历史数据分布中确定所述查询关键词对应的关键词数据分布,并基于所述关键词数据分布生成关键词密度特征。将所述查询关键词特征和所述关键词密度特征输入基数估计模型进行数据基数估计,获得所述查询关键词对应的目标数据的基数估计值。
4、本说明书一个或多个实施例提供了一种存储介质,用于存储计算机可执行指令,所述计算机可执行指令在被处理器执行时实现以下流程:获取在分布式数据库进行数据查询的查询语句。对所述查询语句包含的查询关键词进行特征提取,获得查询关键词特征。在所述分布式数据库的历史数据分布中确定所述查询关键词对应的关键词数据分布,并基于所述关键词数据分布生成关键词密度特征。将所述查询关键词特征和所述关键词密度特征输入基数估计模型进行数据基数估计,获得所述查询关键词对应的目标数据的基数估计值。
1.一种分布式数据库的数据查询方法,包括:
2.根据权利要求1所述的分布式数据库的数据查询方法,所述对所述查询语句包含的查询关键词进行特征提取,获得查询关键词特征,包括:
3.根据权利要求2所述的分布式数据库的数据查询方法,所述对所述查询关键词进行查询数据范围提取获得数据范围特征,包括:
4.根据权利要求1所述的分布式数据库的数据查询方法,所述在所述分布式数据库的历史数据分布中确定所述查询关键词对应的关键词数据分布,包括:
5.根据权利要求4所述的分布式数据库的数据查询方法,所述基于所述关键词数据分布生成关键词密度特征,包括:
6.根据权利要求1所述的分布式数据库的数据查询方法,所述基数估计模型,包括:第一感知机模块、卷积神经网络和第二感知机模块;
7.根据权利要求1所述的分布式数据库的数据查询方法,所述基数估计模型,采用如下方式训练:
8.根据权利要求1所述的分布式数据库的数据查询方法,所述获取在分布式数据库进行数据查询的查询语句步骤执行之后,且所述对所述查询语句包含的查询关键词进行特征提取,获得查询关键词特征步骤执行之前,还包括:
9.根据权利要求8所述的分布式数据库的数据查询方法,所述基于所述分布式数据库的历史查询记录表对所述查询关键词进行匹配校验,包括:
10.一种分布式数据库的数据查询装置,包括:
11.一种分布式数据库的数据查询设备,包括:
12.一种存储介质,用于存储计算机可执行指令,所述计算机可执行指令在被处理器执行时实现以下流程: