一种数据拉取方法及装置与流程

文档序号:11261778阅读:253来源:国知局
一种数据拉取方法及装置与流程

本发明涉及数据处理领域,特别是涉及一种数据拉取方法及装置。



背景技术:

随着科技的发展,电子书已经成为人们生活中不可或缺的一部分。电子书也称为电子图书,是一种可通过终端设备阅读的电子版形式的图书。

在实际情况中,一些电子书的运营商最初提供的电子书是一个不可读的电子书数据包,需要特定的阅读系统对电子书数据包中的数据进行拉取,并形成可读格式的电子书,以供用户阅读。

通常情况下,电子书数据包的结构类型包括二级结构和三级结构两种类型。其中,二级结构为书章结构,三级结构为书卷章结构。现有的阅读系统包括拉取二级结构的电子书数据包的阅读系统(简称“第一类阅读系统”),以及拉取三级结构的电子书数据包的阅读系统(简称“第二类阅读系统”)。第一类阅读系统在对二级结构的电子书数据包进行拉取时,要拉取该电子书数据包的基本编目信息和章信息;第二类阅读系统在对三级结构的电子书数据包进行拉取时,要拉取该电子书数据包的基本编目信息、卷信息和章信息。

对于阅读系统的运营商而言,对二级结构的电子书数据包进行拉取时需要采用第一类阅读系统,对三级结构的电子书数据包进行拉取时需要采用第二类阅读系统。因此,在对不同结构的电子书数据包进行拉取时,需要更换不同的阅读系统,这就导致了运营时操作程序较繁琐。



技术实现要素:

本发明的目的在于提供一种数据拉取方法及装置,以简化运营时的操作程序。

为达到上述目的,本发明实施例提供了一种数据拉取方法,所述方法包括:

获取目标电子书数据包;

对所述目标电子书数据包的结构类型进行检测;

当检测出所述目标电子书数据包的结构类型为三级结构时,通过阅读系统拉取所述目标电子书数据包的基本编目信息、章信息和卷信息;

当检测出所述目标电子书数据包的结构类型为二级结构时,在所述目标电子书数据包中添加虚拟卷,并通过所述阅读系统拉取所述目标电子书数据包的基本编目信息、章信息和所述虚拟卷的卷信息。

优选地,所述在所述目标电子书数据包中添加虚拟卷的步骤,包括:

在所述目标电子书数据包中添加一个虚拟卷。

优选地,所述在所述目标电子书数据包中添加虚拟卷的步骤,包括:

确定所述目标电子书数据包中包含的章的数量;

在所述目标电子书数据包中添加相应数量的虚拟卷。

优选地,在所述获取目标电子书数据包的步骤之前,所述方法还包括:

获取图书清单列表;所述图书清单列表中包括各电子书数据包的标识信息及各电子书名称的对应关系;

根据所述图书清单列表,确定待处理的目标电子书名称,并确定所述目标电子书名称对应的目标电子书数据包的标识信息;

在本地存储的电子书数据包中,确定对应标识的电子书数据包为目标电子书数据包。

优选地,所述方法还包括:

根据拉取到的数据生成目标电子书。

本发明实施例还提供了一种数据拉取装置,所述装置包括:

第一获取模块,用于获取目标电子书数据包;

检测模块,用于对所述目标电子书数据包的结构类型进行检测;

第一拉取模块,用于当所述检测模块检测出所述目标电子书数据包的结构类型为三级结构时,通过阅读系统拉取所述目标电子书数据包的基本编目信息、章信息和卷信息;

第二拉取模块,用于当所述检测模块检测出所述目标电子书数据包的结构类型为二级结构时,在所述目标电子书数据包中添加虚拟卷,并通过所述阅读系统拉取所述目标电子书数据包的基本编目信息、章信息和所述虚拟卷的卷信息。

优选地,所述第二拉取模块,具体用于在所述目标电子书数据包中添加一个虚拟卷。

优选地,所述第二拉取模块,包括:

确定单元,用于确定所述目标电子书数据包中包含的章的数量;

添加单元,用于在所述目标电子书数据包中添加相应数量的虚拟卷。

优选地,所述装置还包括:

第二获取模块,用于获取图书清单列表;所述图书清单列表中包括各电子书数据包的标识信息及各电子书名称的对应关系;

第一确定模块,用于根据所述图书清单列表,确定待处理的目标电子书名称,并确定所述目标电子书名称对应的目标电子书数据包的标识信息;

第二确定模块,用于在本地存储的电子书数据包中,确定对应标识的电子书数据包为目标电子书数据包。

优选地,所述装置还包括:

生成模块,用于根据拉取到的数据生成目标电子书。

本发明实施例提供的一种数据拉取方法及装置,通过对获取的目标电子书数据包的结构类型进行检测;当检测出目标电子书数据包的结构类型为三级结构时,通过阅读系统拉取目标电子书数据包的基本编目信息、章信息和卷信息;当检测出目标电子书数据包的结构类型为二级结构时,在目标电子书数据包中添加虚拟卷,将目标电子书数据包的结构类型变为三级结构,然后通过阅读系统拉取目标电子书数据包的基本编目信息、章信息和虚拟卷的卷信息。本申请既适用于对二级结构的电子书数据包进行拉取,又适用于对三级结构的电子书数据包进行拉取,无需像现有技术中一样更换不同的阅读系统,因此可以简化运营时的操作程序。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的数据拉取方法的流程图;

图2为本发明实施例提供的数据拉取方法的第二种流程图;

图3为本发明实施例提供的数据拉取装置的第一种结构示意图;

图4为本发明实施例提供的数据拉取装置的第二种结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

为达到上述目的,本发明实施例提供了一种数据拉取方法。图1为本发明实施例提供的数据拉取方法的流程图,该方法可应用于阅读系统,所述方法包括:

s110,获取目标电子书数据包。

本实施例中,目标电子书数据包可以为一个单独的电子书数据包,也可以为存放的多个电子书数据包中的某一个电子书数据包。目标电子书数据包可以是由外界的服务器或移动终端发送给阅读系统的。

具体地,当阅读系统接收到多个电子书数据包后,可以将这些电子书数据包存储在本地。当阅读系统对电子书数据包进行拉取时,可以确定其中的某个电子书数据包为目标电子书数据包,然后获取该目标电子书数据包。

s120,对所述目标电子书数据包的结构类型进行检测。

具体地,目标电子书数据包的结构类型可能为二级结构或三级结构。由于三极结构的电子书数据包中包含卷信息,而二级结构的电子书数据包中不包含卷信息。因此,在一种实现方式中,阅读系统可根据目标电子书数据包是否包含卷信息,来检测该目标电子书数据包的结构类型是二级结构还是三级结构。

s130,当检测出所述目标电子书数据包的结构类型为三级结构时,通过阅读系统拉取所述目标电子书数据包的基本编目信息、章信息和卷信息。

本实施例中,基本编目信息可以包括:封面图、标题、简介和/或作者信息等。卷信息可以包括卷类型信息、卷标识信息和卷标题信息。其中,卷类型信息可以为前言卷、后记卷或普通卷等;卷标识信息可以为卷的序号;卷标题信息为卷的名称。章信息可以包括章标识信息、章标题信息以及章内容。其中,章标识信息可以为章的序号;章标题信息为章的名称;章内容为每一章中的电子书的具体内容。

具体地,当检测出目标电子书数据包的结构类型为三级结构时,通过阅读系统可按照基本编目信息、卷信息和章信息的顺序对目标电子书数据包进行拉取。具体的拉取方法为现有方法,此处不再赘述。

s140,当检测出所述目标电子书数据包的结构类型为二级结构时,在所述目标电子书数据包中添加虚拟卷,并通过所述阅读系统拉取所述目标电子书数据包的基本编目信息、章信息和所述虚拟卷的卷信息。

当阅读系统检测出目标电子书数据包的结构类型为二级结构时,可以在目标电子书数据包中添加虚拟卷。虚拟卷具有相应的卷标识信息和卷标题信息等卷信息,通过该方式将目标电子书数据包的结构类型从二级结构变成三级结构。

然后,可以通过阅读系统拉取目标电子书数据包的基本编目信息、章信息和虚拟卷的卷信息。需要说明的是,虚拟卷与现有的卷并没有什么区别,只是虚拟卷为阅读信息根据预设的卷信息自动生成的卷。

可选的,在所述目标电子书数据包中添加虚拟卷的步骤可包括如下两种具体实现方式。

第一种具体实现方式为:在目标电子书数据包中添加一个虚拟卷。

具体地,为了便于实现,可在目标电子书数据包中仅仅添加一个虚拟卷,即将所有的章分配到同一个虚拟卷下。

第二种具体实现方式为:确定目标电子书数据包中包含的章的数量;在目标电子书数据包中添加相应数量的虚拟卷。

具体地,阅读系统在检测目标电子书数据包的结构类型时,可同时检测目标电子书数据包中包含的章的数量,然后按照每章对应一个虚拟卷的方式,在目标电子书数据包中添加相应数量的虚拟卷。本实施例中,由于每一章的章标识信息不同,目标电子书数据包中包含的章标识信息的数量即为章的数量,因此可通过检测章标识信息确定目标电子书数据包中包含的章的数量。

本发明实施例提供的数据拉取方法,通过对获取的目标电子书数据包的结构类型进行检测;当检测出目标电子书数据包的结构类型为三级结构时,通过阅读系统拉取目标电子书数据包的基本编目信息、章信息和卷信息;当检测出目标电子书数据包的结构类型为二级结构时,在目标电子书数据包中添加虚拟卷,将目标电子书数据包的结构类型变为三级结构,然后通过阅读系统拉取目标电子书数据包的基本编目信息、章信息和虚拟卷的卷信息。本申请既适用于对二级结构的电子书数据包进行拉取,又适用于对三级结构的电子书数据包进行拉取,无需像现有技术中一样更换不同的阅读系统,因此可以简化运营时的操作程序;另外,对于阅读系统的运营商而言,不需要同时开发第一类阅读系统和第二类阅读系统以适配不同结构类型的电子书数据包,节省了开发成本和适配成本。

作为本发明实施例的一种实现方式,阅读系统还可以根据拉取到的数据生成目标电子书。

具体地,阅读系统可以根据拉取的目标电子书数据包的基本编目信息、章信息和卷信息,或者,目标电子书数据包的基本编目信息、章信息和虚拟卷的卷信息,对电子书的框架结构进行填充,生成可供用户阅读的目标电子书。本实施例中,目标电子书的具体生成方法为现有技术,此处不再赘述。

图2为本发明实施例提供的数据拉取方法的第二种流程图,与图1不同之处在于,在步骤s110之前,所述方法还包括:

s150,获取图书清单列表。

具体地,图书清单列表中包括各电子书数据包的标识信息及各电子书名称的对应关系。其中,电子书数据包的标识信息可以为存储该电子书数据包的id(identity,身份标识号码)信息,各电子书名称与各电子书数据包的id信息一一对应。

s160,根据所述图书清单列表,确定待处理的目标电子书名称,并确定所述目标电子书名称对应的目标电子书数据包的标识信息。

本实施例中,确定目标电子书名称的方法可以为随机选择的方式,确定的目标电子书名称可以为图书清单列表上任意一个待处理的电子书名称。或者,确定目标电子书名称的方法还可以为按照顺序选择的方式,确定的目标电子书名称为按照图书清单列表上电子书名称的顺序,下一个待处理的电子书名称。

进一步地,可采用标记的方式,判断电子书名称是否为待处理的电子书名称。举例而言,在对某一个电子书名称进行处理后,可对该电子书名称进行标记,阅读系统检测到没有被标记的电子书名称则为待处理的电子书名称。

具体地,在确定了待处理的目标电子书名称后,根据对应关系可确定目标电子书名称对应的目标电子书数据包的标识信息。

s170,在本地存储的电子书数据包中,确定对应标识的电子书数据包为目标电子书数据包。

具体地,在确定了目标电子书数据包的标识信息后,阅读系统可以根据该标识信息从本地存储的电子书数据包中查找与该标识信息对应的电子书数据包,并将该电子书数据包确定为目标电子书数据包。

本发明实施例提供的数据拉取方法,在图1所示的数据拉取方法的基础上,还可通过各电子书数据包的标识信息及各电子书名称的对应关系,从多个电子书数据包中确定待处理的目标电子书数据包。

在其他实施例中,阅读系统还可以获取到一个存储有多本电子书的数据包和图书清单列表,这个数据包中包括多本电子书的各基本信息、各卷信息和各章信息,这些信息都是杂乱的放置在一起的,每本电子书的基本信息、卷信息和章信息都有相应的id信息,这些id信息记录在图书清单列表上。

阅读系统可根据id信息将各电子书对应的基本信息、卷信息和章信息分别存放在不同的数据包内,形成电子书数据包,然后对各电子书数据包的结构类型进行检测。阅读系统通过检测id信息,判断各电子书数据包是否有卷信息。如果某电子书数据包有卷信息,说明该电子书数据包的结构类型为三级结构,可根据图书清单列表上的id信息拉取该电子书数据包的基本信息、卷信息和章信息;如果某电子书数据包没有卷信息,说明该电子书数据包的结构类型为二级结构,阅读系统会为该电子书数据包添加虚拟卷,然后根据图书清单列表上的id信息拉取该电子书的基本信息和章信息,并拉取添加的虚拟卷的卷信息。

优选地,对于阅读系统的运行商而言,可根据不同电子书运营商提供的图书清单的数量进行不同拉取策略的定制。例如,尽量不要在同一时间点对一些大型电子书运营商提供的电子书数据包进行拉取;另外,还可以对一些服务受限的电子书运营商服或对方接口不稳定的电子书运营商进行限速拉取等。

进一步地,目前在拉取过程中,阅读系统可以记录大量操作日志,可以将这些日志开放给电子书运行商,供其运营平台进行自检,然后将自检结果反馈给阅读系统,可进一步降低阅读系统的运行商的测试成本;同时,一些电子书运行商的运营平台具有能快速发现和修复有问题电子书的能力,可及时优化用户的体验。

阅读系统和电子书运行商的运营平台之间传输的数据优选为可扩展的json格式的数据,以方便运营人员定制可扩展需求,达到快速增加新功能的能力。

阅读系统本地数据库中可以同时维护电子书运行商的运营平台的原始数据,以及阅读系统的自有数据。阅读系统运营商的运营人员所有的修改编辑都是针对阅读系统的自有数据,电子书运行商运营平台的原始数据更多是用来拉取比对发现更新,进而可根据运营策略决定是否覆盖更新阅读系统的自有数据。

与方法实施例相对应的,本发明还提供了一种数据拉取装置,图3为本发明实施例提供的数据拉取装置的第一种结构示意图,所述装置包括:

第一获取模块310,用于获取目标电子书数据包;

检测模块320,用于对所述目标电子书数据包的结构类型进行检测;

第一拉取模块330,用于当所述检测模块320检测出所述目标电子书数据包的结构类型为三级结构时,通过阅读系统拉取所述目标电子书数据包的基本编目信息、章信息和卷信息;

第二拉取模块340,用于当所述检测模块320检测出所述目标电子书数据包的结构类型为二级结构时,在所述目标电子书数据包中添加虚拟卷,并通过所述阅读系统拉取所述目标电子书数据包的基本编目信息、章信息和所述虚拟卷的卷信息。

本发明实施例提供的数据拉取装置,通过对获取的目标电子书数据包的结构类型进行检测;当检测出目标电子书数据包的结构类型为三级结构时,通过阅读系统拉取目标电子书数据包的基本编目信息、章信息和卷信息;当检测出目标电子书数据包的结构类型为二级结构时,在目标电子书数据包中添加虚拟卷,将目标电子书数据包的结构类型变为三级结构,然后通过阅读系统拉取目标电子书数据包的基本编目信息、章信息和虚拟卷的卷信息。本申请既适用于对二级结构的电子书数据包进行拉取,又适用于对三级结构的电子书数据包进行拉取,无需像现有技术中一样更换不同的阅读系统,因此可以简化运营时的操作程序;另外,对于阅读系统的运营商而言,不需要同时开发第一类阅读系统和第二类阅读系统以适配不同结构类型的电子书数据包,节省了开发成本和适配成本。

优选地,所述第二拉取模块340,具体用于在所述目标电子书数据包中添加一个虚拟卷。

优选地,所述第二拉取模块340,包括:

确定单元,用于确定所述目标电子书数据包中包含的章的数量;

添加单元,用于在所述目标电子书数据包中添加相应数量的虚拟卷。

图4为本发明实施例提供的数据拉取装置的第二种结构示意图,与图3不同之处在于,所述装置还包括:

第二获取模块350,用于获取图书清单列表;所述图书清单列表中包括各电子书数据包的标识信息及各电子书名称的对应关系;

第一确定模块360,用于根据所述图书清单列表,确定待处理的目标电子书名称,并确定所述目标电子书名称对应的目标电子书数据包的标识信息;

第二确定模块370,用于在本地存储的电子书数据包中,确定对应标识的电子书数据包为目标电子书数据包。

本发明实施例提供的数据拉取装置,在图3所示的数据拉取装置的基础上,还可通过各电子书数据包的标识信息及各电子书名称的对应关系,从多个电子书数据包中确定待处理的目标电子书数据包。

优选地,所述装置还包括:

生成模块,用于根据拉取到的数据生成目标电子书。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1