电子文件处理方法和装置与流程

文档序号:18397074发布日期:2019-08-09 23:31阅读:189来源:国知局
本发明涉及电子文件
技术领域
:,尤其涉及一种电子文件处理方法和装置。
背景技术
::随着数字出版技术的发展,已经开始将数字出版物应用到移动终端中,进而产生了移动阅读技术。可以在终端中设置阅读器,进而终端可以在阅读器中显示电子文件。随着各种阅读器的出现,电子出版(electronicpublication,epub)作为一个开放的电子书标准,正逐步成为终端电子书阅读的主流格式。现有技术中,在用户需要在线阅读epub文件的时候,服务器会将epub格式的文件发送给终端;终端获取epub格式的文件,然后终端对epub格式的文件进行解读处理,然后以网页的形式将epub格式的文件显示处理。然而现有技术中,由于终端获取到的时候epub格式的文件,终端需要对epub格式的文件进行处理,而epub格式的文件中的元素比较多,终端对epub格式的文件放到网页中进行显示的时候,终端的处理过程较多,如需要进行渲染、排版等,进而终端在线显示epub格式的文件的时候就不会比较慢,不便于用户在线阅读。技术实现要素:本发明提供一种电子文件处理方法和装置,用以解决终端在线显示epub格式的文件的时候就不会比较慢,不便于用户在线阅读的问题。一方面,本发明提供一种电子文件处理方法,包括:接收终端发送的第一阅读请求,其中,所述第一阅读请求中包括epub文件的待阅读章节的标识;从电子文档缓存器中,提取与所述epub文件的待阅读章节的标识对应的epub章节内容,其中,所述电子文档缓存器中包括解析后的epub文件,所述解析后的epub文件中包括了epub章节的标识、epub章节内容、以及所述epub章节的标识与所述epub章节内容之间的对应关系;将与所述epub文件的待阅读章节的标识对应的epub章节内容,发送给所述终端,以使所述终端在网页上显示与所述epub文件的待阅读章节的标识对应的epub章节内容。另一方面,本发明提供一种电子文件处理装置,包括:第一接收模块,用于接收终端发送的第一阅读请求,其中,所述第一阅读请求中包括epub文件的待阅读章节的标识;提取模块,用于从电子文档缓存器中,提取与所述epub文件的待阅读章节的标识对应的epub章节内容,其中,所述电子文档缓存器中包括解析后的epub文件,所述解析后的epub文件中包括了epub章节的标识、epub章节内容、以及所述epub章节的标识与所述epub章节内容之间的对应关系;第一发送模块,用于将与所述epub文件的待阅读章节的标识对应的epub章节内容,发送给所述终端,以使所述终端在网页上显示与所述epub文件的待阅读章节的标识对应的epub章节内容。本发明提供的电子文件处理方法和装置,通过接收终端发送的第一阅读请求,其中,第一阅读请求中包括epub文件的待阅读章节的标识;从电子文档缓存器中,提取与epub文件的待阅读章节的标识对应的epub章节内容,其中,电子文档缓存器中包括解析后的epub文件,解析后的epub文件中包括了epub章节的标识、epub章节内容、以及epub章节的标识与epub章节内容之间的对应关系;将与epub文件的待阅读章节的标识对应的epub章节内容,发送给终端,以使终端在网页上显示与epub文件的待阅读章节的标识对应的epub章节内容。从而在终端请求epub文件的时候,服务器只发送给终端对应的epub章节内容。并且,服务器已经对epub文件进行了解析处理,发送给终端的epub章节内容是解析后的epub章节内容;从而终端对epub格式的文件放到网页中进行显示的时候,终端不再需要对epub格式的文件进行渲染、排版等处理,加快了终端在线显示epub文件的速度,便于用户在线阅读。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。图1为本申请实施例提供的一种电子文件处理方法的流程示意图;图2为本申请实施例提供的另一种电子文件处理方法的流程示意图;图3为本发明实施例提供的一种电子文件处理装置的结构示意图;图4为本发明实施例提供的另一种电子文件处理装置的结构示意图。通过上述附图,已示出本公开明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围,而是通过参考特定实施例为本领域技术人员说明本公开的概念。具体实施方式这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。首先对本发明所涉及的名词进行解释:epub:是一个自由的开放标准,属于一种可以“自动重新编排”的内容;也就是文字内容可以根据阅读设备的特性,以最适于阅读的方式显示。便携式文档格式(portabledocumentformat,pdf):是由adobesystems用于与应用程序、操作系统、硬件无关的方式进行文件交换所发展出的文件格式。本发明具体的应用场景如下。在用户需要在线阅读epub文件的时候,服务器会将epub格式的文件发送给终端;终端获取epub格式的文件,然后终端对epub格式的文件进行解读处理,然后以网页的形式将epub格式的文件显示处理。然而现有技术中,由于终端获取到的时候epub格式的文件,终端需要对epub格式的文件进行处理,而epub格式的文件中的元素比较多,终端对epub格式的文件放到网页中进行显示的时候,终端的处理过程较多,如需要进行渲染、排版等,进而终端在线显示epub格式的文件的时候就不会比较慢,不便于用户在线阅读。本发明提供的电子文件处理方法和装置,旨在解决现有技术的如上技术问题。下面以具体地实施例对本发明的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本发明的实施例进行描述。图1为本申请实施例提供的一种电子文件处理方法的流程示意图。如图1所示,该方法包括:步骤101、接收终端发送的第一阅读请求,其中,第一阅读请求中包括epub文件的待阅读章节的标识。在本实施例中,具体的,服务器接收终端发送的第一阅读请求,第一阅读请求中包括待阅读文件类型、待阅读文件标识、待阅读文件的阅读章节的标识;进而服务器可以确定与待阅读文件标识对应的待阅读文件。然后,服务器在待阅读文件类型为epub格式的文件的时候,服务器可以确定出待阅读文件的阅读章节的标识,为epub文件的待阅读章节的标识。步骤102、从电子文档缓存器中,提取与epub文件的待阅读章节的标识对应的epub章节内容,其中,电子文档缓存器中包括解析后的epub文件,解析后的epub文件中包括了epub章节的标识、epub章节内容、以及epub章节的标识与epub章节内容之间的对应关系。在本实施例中,具体的,服务器中设置了一个电子文档缓存器,电子文档缓存器中包括了至少一个解析后的epub文件,每一个解析后的epub文件中包括了epub章节的标识、epub章节内容、以及epub章节的标识与epub章节内容之间的对应关系。进而服务器在确定出终端所请求的epub文件是哪一个之后,服务器可以从电子文档缓存器,查询出该epub文件所对应的解析后的epub文件;然后服务器根据epub章节的标识与epub章节内容之间的对应关系,确定出与epub文件的待阅读章节的标识对应的epub章节内容。其中,epub文件章节内容中包括了以下的至少一种:文字、图片、视频、音频。步骤103、将与epub文件的待阅读章节的标识对应的epub章节内容,发送给终端,以使终端在网页上显示与epub文件的待阅读章节的标识对应的epub章节内容。在本实施例中,具体的,服务器将确定出的epub章节内容,发送给终端。服务器与终端之间传输文件的时候,采用超文本传输协议(hypertexttransferprotocol,http)进行传输。具体来说,服务器采用javascript的rsa加密算法(rsaalgorithm),对确定出的epub章节内容,进行加密处理,生成加密后的epub章节内容;然后服务器采用http协议,将加密后的epub章节内容发送给终端。然后终端对加密后的epub章节内容进行解密,得到解密后的epub章节内容;终端在网页上显示解密后的epub章节内容。并且,终端可以接收用户发送的添加请求,添加请求中包括添加内容;终端将添加内容,添加加到显示出的epub章节内容上。进而完成与用户的添加批注、书签等功能。并且,在本实施例的过程中,服务器与终端之间会完成用户注册以及心跳检查的过程,以保证终端与服务器的通讯质量;并且第一阅读请求中还可以包括用户信息,服务器可以通过第一阅读请求中的用户信息,判断用户所在终端是否支持阅读、以及用户操作请求是否安全健壮等。本实施例通过接收终端发送的第一阅读请求,其中,第一阅读请求中包括epub文件的待阅读章节的标识;从电子文档缓存器中,提取与epub文件的待阅读章节的标识对应的epub章节内容,其中,电子文档缓存器中包括解析后的epub文件,解析后的epub文件中包括了epub章节的标识、epub章节内容、以及epub章节的标识与epub章节内容之间的对应关系;将与epub文件的待阅读章节的标识对应的epub章节内容,发送给终端,以使终端在网页上显示与epub文件的待阅读章节的标识对应的epub章节内容。从而在终端请求epub文件的时候,服务器只发送给终端对应的epub章节内容。并且,服务器已经对epub文件进行了解析处理,发送给终端的epub章节内容是解析后的epub章节内容;从而终端对epub格式的文件放到网页中进行显示的时候,终端不再需要对epub格式的文件进行渲染、排版等处理,加快了终端在线显示epub文件的速度,便于用户在线阅读。图2为本申请实施例提供的另一种电子文件处理方法的流程示意图。如图2所示,该方法包括:步骤201、根据预设的epub文件规则,对epub文件进行解析处理,生成解析后的epub文件。在本实施例中,具体的,服务器可以对epub文件进行解析处理,以生成解析后的epub文件。具体来说,服务器首先对epub文件进行预解压处理,得到解压处理的epub文件;然后,服务器根据epub文件规则,通过minetype、content.opf、toc.ncx文件等对解压处理后的epub文件整体进行解析归类处理,服务器可以支持多种图片格式的收集和归类处理,并且可以生成文件的线性阅读顺序和章节目录结构。从而得到的解析后的epub文件中包括了章节目录、章节内容、以及章节目录与章节内容的对应关系,章节目录表征了epub文件的各章节的标识。步骤202、将解析后的epub文件,存储到电子文档缓存器中。在本实施例中,具体的,服务器将解析后的epub文件,放到电子文档缓存器中进行存储。并且,服务器可以对解析后的epub文件的内容,进行多重cache封装,进而利用opensymphony(oscache)实现页面级缓存,可缓存单个文件、缓存统一资源定位符(uniformresourcelocator,url)模式(pattern),并且可以设定缓存属性。步骤203、接收终端发送的第一阅读请求,其中,第一阅读请求中包括epub文件的待阅读章节的标识。在本实施例中,具体的,本步骤可以参见图1的步骤101,不再赘述。步骤204、从电子文档缓存器中,提取与epub文件的待阅读章节的标识对应的epub章节内容,其中,电子文档缓存器中包括解析后的epub文件,解析后的epub文件中包括了epub章节的标识、epub章节内容、以及epub章节的标识与epub章节内容之间的对应关系。在本实施例中,具体的,本步骤可以参见图1的步骤102,不再赘述。步骤205、将与epub文件的待阅读章节的标识对应的epub章节内容,发送给终端,以使终端在网页上显示与epub文件的待阅读章节的标识对应的epub章节内容。在本实施例中,具体的,本步骤可以参见图1的步骤103,不再赘述。本实施例通过根据预设的epub文件规则,对epub文件进行解析处理,生成解析后的epub文件;将解析后的epub文件,存储到电子文档缓存器中;进而在服务器端对epub文件进行处理和解析,不需要终端再对epub文件进行处理和解析。通过接收终端发送的第一阅读请求,其中,第一阅读请求中包括epub文件的待阅读章节的标识;从电子文档缓存器中,提取与epub文件的待阅读章节的标识对应的epub章节内容,其中,电子文档缓存器中包括解析后的epub文件,解析后的epub文件中包括了epub章节的标识、epub章节内容、以及epub章节的标识与epub章节内容之间的对应关系;将与epub文件的待阅读章节的标识对应的epub章节内容,发送给终端,以使终端在网页上显示与epub文件的待阅读章节的标识对应的epub章节内容。从而在终端请求epub文件的时候,服务器只发送给终端对应的epub章节内容。并且,服务器已经对epub文件进行了解析处理,发送给终端的epub章节内容是解析后的epub章节内容;从而终端对epub格式的文件放到网页中进行显示的时候,终端不再需要对epub格式的文件进行渲染、排版等处理,加快了终端在线显示epub文件的速度,便于用户在线阅读。在可选的一种实施方式中,在上述实施例的基础上,还可以包括以下步骤:步骤301、对pdf文件进行图片切分处理,生成切分后的pdf文件,其中,切分后的pdf文件中包括图片、pdf章节的标识、图片路径、以及pdf章节的标识与图片路径之间的对应关系。在本实施例中,具体的,服务器首先对pdf文件进行图片切分处理;服务器可以将pdf文件,切分为至少一个图片,图片的格式可以为以下的任意一种:标签图像文件格式(tagimagefileformat,tiff)、便携式网络图形(portablenetworkgraphics,png)、图像互换格式(graphicsinterchangeformat,gif)、jpeg、可缩放矢量图形(scalablevectorgraphics,svg)、文本文档(txt)。并且,生成的图片是支持pdf的内嵌字体的。具体来说,为了更高效和快速的解析和切分pdf文件,服务器使用了jdk线程池;服务器利用jdk线程池,将pdf文件分割成小文件,然后再将小文件分割为多个图片;然后服务器可以对每一个图片进行缩放处理。进而可以满足图片的一定精度的同时,减少内存开销以及内存占用,进而减少内存占用溢出的情况。然后,服务器为每一个图片配置图片路径,进而得到切分后的pdf文件,该切分后的pdf文件中包括图片、pdf章节的标识、图片路径、以及pdf章节的标识与图片路径之间的对应关系。其中,图片路径为url。步骤302、将图片路径、以及pdf章节的标识与图片路径之间的对应关系,存储到电子文档缓存器中。在本实施例中,具体的,服务器将得到图片路径、以及pdf章节的标识与图片路径之间的对应关系,存储到电子文档缓存器中。并且,服务器可以对得到的图片路径,进行多重cache封装,进而利用oscache实现页面级缓存,可缓存单个文件、缓存urlpattern,并且可以设定缓存属性。进而,减少了产生的图片和pdf文件在服务器加载的耗时问题;服务器可以通过servlet2.3的缓存过滤功能,能够缓存任意的统一资源标识符(uniformresourceidentifier,uri)。并且集成jgroups实现了缓存的集群,使获取电子缓存器中的文件的时候更加快捷。步骤303、接收终端发送的第二阅读请求,其中,第二阅读请求中包括pdf文件的待阅读章节的标识。在本实施例中,具体的,服务器接收终端发送的第二阅读请求,第二阅读请求中包括待阅读文件类型、待阅读文件标识、待阅读文件的阅读章节的标识;进而服务器可以确定与待阅读文件标识对应的待阅读文件。然后,服务器在待阅读文件类型为pdf格式的文件的时候,服务器可以确定出待阅读文件的阅读章节的标识,为pdf文件的待阅读章节的标识。步骤304、根据电子文档缓存器,确定与pdf文件的待阅读章节的标识对应的图片路径,其中,电子文档缓存器中还包括pdf章节的标识与图片路径之间的对应关系。在本实施例中,具体的,由于电子文档缓存器中具有pdf章节的标识与图片路径之间的对应关系,进而服务器可以确定出与当前的pdf文件的待阅读章节的标识对应的图片路径。步骤305、根据预设的图片路径与图片之间的对应关系,确定与图片路径对应的图片。在本实施例中,具体的,服务器中存储有图片路径与图片之间的对应关系,进而服务器可以确定出图片路径所对应的图片。步骤306、将与图片路径对应的图片,发送给终端,以使终端在网页上显示与图片路径对应的图片。在本实施例中,具体的,服务器将确定出的图片,发送给终端。服务器与终端之间传输图片的时候,采用http协议进行传输。然后,终端可以在网页上显示接收到的图片。并且,终端可以接收用户发送的添加请求,添加请求中包括添加内容;终端将添加内容,添加加到显示出的图片上。进而完成与用户的添加批注、书签等功能。通过以上步骤服务器对pdf文件进行图片切分,将pdf文件切分为多个图片,并对图片进行缩放处理;服务器将pdf文件的阅读章节对应的图片,发送给终端;终端在网页上显示图片;终端也不需要对pdf式的文件进行处理,直接显示就可以了,便于用户在线阅读。图3为本发明实施例提供的一种电子文件处理装置的结构示意图,如图3所示,本实施例的装置可以包括:第一接收模块31,用于接收终端发送的第一阅读请求,其中,第一阅读请求中包括epub文件的待阅读章节的标识;提取模块32,用于从电子文档缓存器中,提取与epub文件的待阅读章节的标识对应的epub章节内容,其中,电子文档缓存器中包括解析后的epub文件,解析后的epub文件中包括了epub章节的标识、epub章节内容、以及epub章节的标识与epub章节内容之间的对应关系;第一发送模块33,用于将与epub文件的待阅读章节的标识对应的epub章节内容,发送给终端,以使终端在网页上显示与epub文件的待阅读章节的标识对应的epub章节内容。本实施例的电子文件处理装置可执行本发明实施例提供的一种电子文件处理方法,其实现原理相类似,此处不再赘述。本实施例通过接收终端发送的第一阅读请求,其中,第一阅读请求中包括epub文件的待阅读章节的标识;从电子文档缓存器中,提取与epub文件的待阅读章节的标识对应的epub章节内容,其中,电子文档缓存器中包括解析后的epub文件,解析后的epub文件中包括了epub章节的标识、epub章节内容、以及epub章节的标识与epub章节内容之间的对应关系;将与epub文件的待阅读章节的标识对应的epub章节内容,发送给终端,以使终端在网页上显示与epub文件的待阅读章节的标识对应的epub章节内容。从而在终端请求epub文件的时候,服务器只发送给终端对应的epub章节内容。并且,服务器已经对epub文件进行了解析处理,发送给终端的epub章节内容是解析后的epub章节内容;从而终端对epub格式的文件放到网页中进行显示的时候,终端不再需要对epub格式的文件进行渲染、排版等处理,加快了终端在线显示epub文件的速度,便于用户在线阅读。图4为本发明实施例提供的另一种电子文件处理装置的结构示意图,在图3所示实施例的基础上,如图4所示,本实施例提供的装置,还包括:解析模块41,用于在第一接收模块31接收终端发送的第一阅读请求之前,根据预设的epub文件规则,对epub文件进行解析处理,生成解析后的epub文件;第一存储模块42,用于将解析后的epub文件,存储到电子文档缓存器中。本实施例提供的装置,还包括:第二接收模块43,用于接收终端发送的第二阅读请求,其中,第二阅读请求中包括pdf文件的待阅读章节的标识;第一确定模块44,用于根据电子文档缓存器,确定与pdf文件的待阅读章节的标识对应的图片路径,其中,电子文档缓存器中还包括pdf章节的标识与图片路径之间的对应关系;第二确定模块45,用于根据预设的图片路径与图片之间的对应关系,确定与图片路径对应的图片;第二发送模块46,用于将与图片路径对应的图片,发送给终端,以使终端在网页上显示与图片路径对应的图片。本实施例提供的装置,还包括:切分模块47,用于在第二接收模块43接收终端发送的第二阅读请求之前,对pdf文件进行图片切分处理,生成切分后的pdf文件,其中,切分后的pdf文件中包括图片、pdf章节的标识、图片路径、以及pdf章节的标识与图片路径之间的对应关系;第二存储模块48,用于将图片路径、以及pdf章节的标识与图片路径之间的对应关系,存储到电子文档缓存器中。epub文件章节内容中包括了以下的至少一种:文字、图片、视频、音频。本实施例的电子文件处理装置可执行本发明实施例提供的另一种电子文件处理方法,其实现原理相类似,此处不再赘述。本实施例通过根据预设的epub文件规则,对epub文件进行解析处理,生成解析后的epub文件;将解析后的epub文件,存储到电子文档缓存器中;进而在服务器端对epub文件进行处理和解析,不需要终端再对epub文件进行处理和解析。通过接收终端发送的第一阅读请求,其中,第一阅读请求中包括epub文件的待阅读章节的标识;从电子文档缓存器中,提取与epub文件的待阅读章节的标识对应的epub章节内容,其中,电子文档缓存器中包括解析后的epub文件,解析后的epub文件中包括了epub章节的标识、epub章节内容、以及epub章节的标识与epub章节内容之间的对应关系;将与epub文件的待阅读章节的标识对应的epub章节内容,发送给终端,以使终端在网页上显示与epub文件的待阅读章节的标识对应的epub章节内容。从而在终端请求epub文件的时候,服务器只发送给终端对应的epub章节内容。并且,服务器已经对epub文件进行了解析处理,发送给终端的epub章节内容是解析后的epub章节内容;从而终端对epub格式的文件放到网页中进行显示的时候,终端不再需要对epub格式的文件进行渲染、排版等处理,加快了终端在线显示epub文件的速度,便于用户在线阅读。在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施例的方法的部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本发明旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本
技术领域
:中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求书指出。应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求书来限制。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1