索引构建的方法、装置、客户端、服务器及系统与流程

文档序号:18267198发布日期:2019-07-27 09:16阅读:189来源:国知局
索引构建的方法、装置、客户端、服务器及系统与流程

本申请涉及检索领域,具体而言,涉及一种索引构建的方法、装置、客户端、服务器及系统。



背景技术:

hive是基于hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为mapreduce任务进行运行。elasticsearch是一个基于lucene的搜索服务器,它提供了一个分布式多用户能力的全文搜索引擎,是当前流行的企业级搜索引擎。目前hive一般用于离线数据存储,对实时查询和全文检索支持较弱,所以需要结合elasticsearch实现快速检索。

目前elasticsearch官方提供了基于hive操作的api应用程序编程接口,但它有一个痛点,无法自动在elasticsearch中建立索引,并且在建立索引时需要手动配置与hive对应的数据类型,配错一个就会导致hive操作elasticsearch时出现问题,所以手动建立索引是一个非常繁杂的过程。



技术实现要素:

本申请的目的在于提供一种索引构建的方法、装置、客户端、服务器及系统,以解决上述问题。

本申请实施例采用的技术方案如下:

第一方面,本申请实施例提供一种索引构建的方法,应用于客户端,所述方法包括:

依据hive表向服务器发送查询信息;其中,所述查询信息携带索引参数,所述索引参数包括所述服务器的id,所述索引参数存储于所述hive表;

当接收到所述服务器反馈的第一信息,生成映射表;

其中,所述第一信息表征所述服务器内不存在与所述hive表对应的索引,所述映射表表征所述hive表中的各个字段的数据类型和所述服务器中的各种数据类型之间的映射关系;

向所述服务器发送索引构建请求;其中,所述索引构建请求携带所述映射表和所述索引参数。

第二方面,本申请实施例提供一种索引构建的装置,应用于客户端,所述装置包括:

信息收发模块:用于依据hive表向服务器发送查询信息;其中,所述查询信息携带索引参数,所述索引参数包括所述服务器的id,所述索引参数存储于所述hive表;

处理模块:用于当接收到所述服务器反馈的第一信息,生成映射表;

其中,所述第一信息表征所述服务器内不存在与所述hive表对应的索引,所述映射表表征所述hive表中的各个字段的数据类型和所述服务器中的各种数据类型之间的映射关系;

所述信息收发模块还用于向所述服务器发送索引构建请求;其中,所述索引构建请求携带所述映射表和所述索引参数。

综上所述,相对于现有技术,本申请实施例所提供的一种索引构建的方法及装置中,当客户端接收到服务器反馈的第一信息时,即依据hive表生成映射表,并将映射表和索引参数通过索引构建请求发送给服务器,以使服务器接收到该请求后,构建对应的索引。减少了手动建立索引的繁杂过程,从而节约了大量的时间和人力成本,减少了出错的可能性。

第三方面,本申请实施例还提供了一种索引构建的方法,应用于服务器,所述方法包括:

接收客户端发送的查询信息;其中,所述查询信息携带索引参数;

依据所述索引参数向所述客户端反馈第一信息;其中,所述第一信息表征所述服务器内不存在与所述索引参数对应的索引;

当接收到所述客户端发送的索引构建请求时,构建索引;其中,所述索引构建请求携带所述映射表和所述索引参数。

第四方面,本申请实施例还提供了一种客户端,所述客户端包括处理器、存储器,所述存储器存储有计算机指令,所述处理器读取并运行所述计算机指令,以执行第一方面所述的索引构建的方法。

第五方面,本申请实施例还提供了服务器,所述服务器包括处理器、存储器,所述存储器存储有计算机指令,所述处理器读取并运行所述计算机指令,以执行第三方面所述的索引构建的方法。

第六方面,本申请实施例还提供了系统,所述系统包括第五方面所述的服务器和第四方面所述的客户端,所述服务器与所述客户端通过有线或无线的网络进行通讯交互。

为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。

附图说明

为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它相关的附图。

图1为本申请实施例提供的系统的交互示意图;

图2为本申请实施例提供的应用于系统的索引构建的方法的流程示意图;

图3为本申请实施例提供的客户端的结构应用示意图;

图4为本申请实施例提供的应用于客户端的索引构建的方法的流程示意图;

图5为本申请实施例提供的s202的子步骤流程示意图;

图6为本申请实施例提供的应用于客户端的索引构建的装置的功能单元示意图;

图7为本申请实施例提供的应用于服务器的索引构建的方法的流程示意图;

图8为本申请实施例提供的服务器的电路连接框图。

图中:10-索引构建系统;200-客户端;201-处理器;202-存储器;203-总线;204-通信接口;300-服务器;301-主控芯片;302-存储单元;303-通信单元;401-信息收发模块;402-处理模块。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。

因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

在本申请的描述中,需要说明的是,术语“上”、“下”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,或者是该申请产品使用时惯常摆放的方位或位置关系,仅是为了便于描述本申请和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本申请的限制。

在本申请的描述中,还需要说明的是,除非另有明确的规定和限定,术语“设置”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本申请中的具体含义。

下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。

请参阅图1,图1为本申请实施例提供的一种索引构建系统10。索引构建系统10包括客户端200和服务器300。在一种可能的实现方式中,客户端200可以为pda、智能手机、平板或pc中的任一种,服务器300为elasticsearch(es),一个基于lucene的搜索服务器。客户端200和服务器300通过有线或无线网络进行通讯交互。

本发明实施例提供的一种索引构建的方法,应用于索引构建系统10,具体的流程,请参见图2:

s101:客户端依据hive表向服务器发送查询信息。

在一种可能的实现方式中,当客户端200创建hive表时,即设置完成该hive表对应的表名称、字段名称、字段类型。同时,将建立与该hive表对应的索引所需的参数(即索引参数)创建完成,并将索引参数存储于该hive表中。索引参数包括服务器300的id,服务器300用于建立与该hive表对应的索引。

当hive创建完成时,即向服务器300发送查询信息。查询信息携带索引参数。

s102:服务器接收客户端发送的查询信息。

s103:服务器依据索引参数向客户端反馈第一信息。

具体地,服务器300在接收到查询信息时,依据查询信息携带的索引参数判断服务器300中是否存在与该索引参数对应的索引(即与该hive表对应的索引)。若否,则向客户端200反馈第一信息;若是,则向客户端200反馈第二信息。当客户200接收到第二信息时,即接收。

第一信息表征服务器300内不存在与hive表对应的索引。

s104:当接收到服务器反馈的第一信息,客户端生成映射表。

具体地,hive表中设置有多个字段。在一种可能的实现方式中,多个字段的数据类型不完全相同。并且,客户端200内的hive表所支持的数据类型与服务器300所支持的数据类型可能不完全相同。故需要将hive表中的各个字段的数据类型转换为服务器300所支持的数据类型,从而需要客户端200生成映射表。映射表表征hive表中的各个字段的数据类型和服务器300中的各种数据类型之间的映射关系。

s105:客户端向服务器发送索引构建请求。

具体地,在映射表构建完成后,客户端200向服务器300发送索引构建请求。该请求携带有构建完成的映射表以及索引参数。

s106:当接收到客户端发送的索引构建请求时,服务器构建索引。

当服务器300接收到客户端200发送的索引构建请求时,服务器300执行该请求,构建对应的索引,该索引与hive表对应。

综上所述,本发明实施例提供的索引构建的方法中,当客户端接收到服务器反馈的第一信息时,即依据hive表生成映射表,并将映射表和索引参数通过索引构建请求发送给服务器,服务器接收到该请求后,构建对应的索引。减少了手动建立索引的繁杂过程,从而节约了大量的时间和人力成本,减少了出错的可能性。

对于图1中的客户端200,本发明实施例提供了一种可能的结构,请参见图3。

客户端200包括:处理器201、存储器202、总线203以及通信接口204。处理器201、存储器202、通信接口204通过总线203连接,处理器201用于执行存储器202中存储的可执行模块,例如计算机程序。

处理器201可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,索引构建的方法的各步骤可以通过处理器201中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器201可以是通用处理器,包括中央处理器(centralprocessingunit,简称cpu)、网络处理器(networkprocessor,简称np)等;还可以是数字信号处理器(digitalsignalprocessor,简称dsp)、专用集成电路(applicationspecificintegratedcircuit,简称asic)、现成可编程门阵列(field-programmablegatearray,简称fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

存储器202可能包含高速随机存取存储器(ram:randomaccessmemory),也可能还包括非不稳定的存储器(non-volatilememory),例如至少一个磁盘存储器。

总线203可以是isa(industrystandardarchitecture)总线、pci(peripheralcomponentinterconnect)总线或eisa(extendedindustrystandardarchitecture)总线等。图3中仅用一个双向箭头表示,但并不表示仅有一根总线203或一种类型的总线203。

存储器202用于存储程序,例如索引构建的装置。索引构建的装置包括至少一个可以软件或固件(firmware)的形式存储于存储器202中或固化在客户端200的操作系统(operatingsystem,os)中的软件功能模块。处理器201在接收到执行指令后,执行所述程序以实现索引构建的方法。

通信接口204,(可以支持有线或者无线的通信协议)以实现与外部的其它设备之间的通信连接,例如通过通信接口204与服务器300的通讯交互。

应当理解的是,图3所示的结构仅为客户端200的结构应用示意图,客户端200还可包括比图3中所示更多或者更少的组件,或者具有与图3所示不同的配置。图3中所示的各组件可以采用硬件、软件或其组合实现。

本发明实施例提供的一种索引构建的方法,应用于客户端200,具体的流程,请参见图4:

s201:依据hive表向服务器发送查询信息。

s202:当接收到服务器反馈的第一信息,生成映射表。

s203:向服务器发送索引构建请求。

在图4的基础上,对于图4中的s202的内容,本发明实施例还提供了一种可能的实现方式,具体流程,请参见图5:

s202-1:当接收到服务器反馈的第一信息,依据hive表支持的数据类型和服务器支持的数据类型生成映射网络。

具体地,客户端200将hive表支持的数据类型和服务器300支持的数据类型加载到存储器202中,将hive表支持的数据类型和服务器300支持的数据类型封装成映射网络。

在映射网络中,hive表支持的数据类型和服务器支持的数据类型一一对应。

s202-2:依据映射网络和hive表生成映射表。

具体地,依据映射网络将hive表中的各个字段的数据类型转换为服务器300所支持的数据类型,并依据转换后的数据类型生成映射表,即elasticsearchmapping。

通过图5中的流程,保障了服务器300中的数据类型与hive表中的各个字段的数据类型建立对应关系,保障了服务器300的搜索功能的正常运行。

在一种可能的实现方式中,索引参数还包括如下任一或组合:端口、索引名称、字段映射、分页数、副本数;hive表还包括如下任一或组合:

表名称,字段名称,字段类型。

请参阅图6,图6为本发明实施例提供的一种索引构建的装置,可选的,该索引构建的装置可以采用客户端200的实现方式。需要说明的是,本实施例所提供的索引构建的装置,其基本原理及产生的技术效果和上述实施例相同,为简要描述,本实施例部分未提及之处,可参考上述的实施例中相应内容。

索引构建的装置包括:信息收发模块401和处理模块402。

信息收发模块401:用于依据hive表向服务器发送查询信息;其中,查询信息携带索引参数,索引参数包括服务器的id,索引参数存储于hive表。具体地,信息收发模块401可以执行上述实施例中的s201。

处理模块402:用于当接收到服务器反馈的第一信息,生成映射表;其中,第一信息表征服务器内不存在与hive表对应的索引,映射表表征hive表中的各个字段的数据类型和服务器中的各种数据类型之间的映射关系。具体地,处理模块402可以执行上述实施例中的s202。

信息收发模块401还用于向服务器发送索引构建请求;其中,索引构建请求携带映射表和索引参数。具体地,信息收发模块401可以执行上述实施例中的s203。

在一种可能的实现方式中,处理模块402具体用于依据hive表支持的数据类型和服务器支持的数据类型生成映射网络;其中,在映射网络中,hive表支持的数据类型和服务器支持的数据类型一一对应;依据映射网络和hive表生成映射表。具体地,处理模块402可以执行上述实施例中的s202-1和s202-2。

下面提供一种客户端200,该客户端200如图3所示,可以实现上述对应的索引构建的方法;具体的,该客户端200包括:处理器201,存储器202、总线203以及通信接口204。除了图中该客户端200可能具有的器件外,该客户端200还可以包含:电池、各类传感器、触摸屏、射频电路等等。可选地,该客户端200可以为:pda、智能手机、平板、智能穿戴、pc等产品。

对于图1中的服务器300,本发明实施例还提供了一种可能的索引构建的方法,应用于服务器300,具体的流程,请参见图7:

s301:接收客户端发送的查询信息。

s302:依据索引参数向客户端反馈第一信息。

s303:当接收到客户端发送的索引构建请求时,构建索引。

下面提供一种服务器300,该服务器300如图8所示,可以实现上述对应的索引构建的方法;具体的,该服务器300包括:主控芯片301,存储单元302、通信单元303。主控芯片301分别与存储单元302、通信单元303电连接。存储单元302中存储有计算机指令,主控芯片301通过调用该计算机指令,可以实现图7所示的索引构建的方法。通信单元303用于与图1中的客户端200进行交互。除了图中该服务器300可能具有的器件外,该服务器300还可以包含:电池、各类传感器、触摸屏、射频电路等等。服务器300可以为elasticsearch(es),一个基于lucene的搜索服务器。

在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。

所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

对于本领域技术人员而言,显然本申请不限于上述示范性实施例的细节,而且在不背离本申请的精神或基本特征的情况下,能够以其它的具体形式实现本申请。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本申请的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1