一种基于网页的文献批量下载的方法与流程

文档序号:12363878阅读:215来源:国知局
一种基于网页的文献批量下载的方法与流程

本发明涉及互联网技术领域,具体是一种基于网页的文献批量下载的方法。



背景技术:

文件下载领域已经很成熟了,但是基于PDF/CAJ/专利等学术文献及科技成果的下载领域鱼龙混杂,在学术出版领域,中国知网有着自己的数据库检索以及下载技术,

现有专利提供的方法对服务器压力大容易断链,以往文献下载方法都是单片下载,而无论是毕业生写论文或者是科研工作者搞科研都是需要下载大量文献来阅读和使用,单篇下载文献比较麻烦;另外文献下载下来之后很多时候并不是每一篇都有用处,有些文献其实通过看题录信息就可以排除,而没有通过题录信息排除法就下载下来,造成了不必要的资源浪费,毕竟文献还是比较贵的。

现有专利CN201210473807.8提供了一种批量下载录音文件的方法,而不能应用在格式比较特殊的文献等学术类型的批量下载中,而本文提供的方法可以弥补这个缺点。



技术实现要素:

本发明的目的在于提供一种减少下载量、提高效率的基于网页的文献批量下载的方法,以解决上述背景技术中提出的问题。

为实现上述目的,本发明提供如下技术方案:

一种基于网页的文献批量下载的方法,步骤如下:

1)在Web端检索文献,选中所选文献,导出分析文献;

2)保存所选文献的题录信息到本地;以文献的题录信息为种子,在Web端向K-base数据库发出请求,

3)题录从K-base数据库中调出数据并通过数字化学习平台CNKI E-Study端打开,

4)在数字化学习平台CNKI E-Study端选中需要下载的文献,向K-base数据库发出请求,批量下载文献。

作为本发明进一步的方案:在步骤4)中,在数字化学习平台CNKI E-Study端选批量 下载文献的具体步骤如下所述:

a)选中需要下载的文献后,数字化学习平台CNKI E-Study端判断是否达到最大数量,如果是,则结束下载;如果不是,则解析链接地址;

b)判断链接地址是否正确,如果不正确,则更新题录,并返回步骤a),如果正确,则进行下一步;

c)下载次数是否小于2,如果下载次数不是小于2,则判断前两次下载是否IP下载,如果前两次下载是IP下载,则获取账号,并判断账号是否为空,如果是空,则进行IP下载,如果账号不为空,则进行账号下载;如果前两次下载不是IP下载,则进行IP下载;如果下载次数小于2,则获取系统下载设置,并进行下一步;

d)判断是否是初次下载,如果是初次下载,则获取系统文献下载格式,并构造下载链接,开始下载;如果不是初次下载,则判断是否选择PDF下载,如果是选择PDF下载,并构造下载链接,开始下载;如果不是选择PDF下载,则进行CAJ格式下载,并构造下载链接,开始下载;

e)在下载的过程中,如果存在网页错误,则获取账户信息,判断其余额是否充足、是否需要购买,如果余额充足,则付费下载至下载结束;如果余额不足且不购买,则获取错误信息并结束下载;如果不存在网页错误,则进行下载至下载结束。

与现有技术相比,本发明的有益效果是:本文提供的方法是利用网页技术下载题录信息排除不需要的文献,之后利用数字化学习平台CNKI E-Study端批量下载文献的方法。网页技术是利用网络协议及服务器等下载文献的技术。本文提供的方法是根据题录信息点对点的向服务器提出申请,可以提高获取文献信息的准确性和稳定性;一个是减少了下载的工作量,批量下载大量文献;二是可以先下载题录信息,在通过阅读题录信息排除了不需要的文献之后再进行下载,这样提高了科研效率。

附图说明

图1是本发明的整体流程图;

图2是利用网页下载文献题录及全文的方法结构图。

图3是在数字化学习平台CNKI E-Study端批量下载文献部分的流程图。

具体实施方式

下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

实施例1

本发明实施例中,本发明的整体流程图如图1所示。文献的批量下载技术在业内是首先提出的,本专利中提出的技术是以文献的题录信息为种子,在数字化学习平台CNKI E-Study向K-base数据库发出请求,批量从服务器获取文献的一种方法。(所述的题录信息指每篇文献的篇名、作者、摘要等信息)

一种基于网页的文献批量下载的方法,步骤如下:

1)在Web端检索文献,选中所选多篇文献,导出分析文献;

2)保存所选文献的题录信息到本地;以文献的题录信息为种子,在Web端向K-base数据库发出请求,

3)题录从K-base数据库中调出数据并通过数字化学习平台CNKI E-Study端打开,

4)在数字化学习平台CNKI E-Study端选中需要下载的文献,向K-base数据库发出请求,批量下载文献。

利用网页下载文献题录及全文的方法结构图如图2所示。用户通过计算机在Web端进行检索,通过Web服务器向K-base数据库进行请求,K-base数据库通过IP-SAN交换机向存储数据的IP-SAN磁盘阵列中调取数据,并通过K-base跨库检索服务器、Web服务器、电子商务服务器、全文下载服务器将所需文献下载题录及全文至计算机。

在数字化学习平台CNKIE-Study端批量下载文献部分的流程图如图3所示。在步骤4)中,具体步骤如下所述:

a)选中需要下载的文献后,数字化学习平台CNKI E-Study端判断是否达到最大数量,如果是,则结束下载;如果不是,则解析链接地址;

b)判断链接地址是否正确,如果不正确,则更新题录,并返回步骤a),如果正确,则进行下一步;

c)下载次数是否小于2,如果下载次数不是小于2,则判断前两次下载是否IP下载,如果前两次下载是IP下载,则获取账号,并判断账号是否为空,如果是空,则进行IP下载,如果账号不为空,则进行账号下载;如果前两次下载不是IP下载,则进行IP下载;如果下载次数小于2,则获取系统下载设置,并进行下一步;

d)判断是否是初次下载,如果是初次下载,则获取系统文献下载格式,并构造下载链接,开始下载;如果不是初次下载,则判断是否选择PDF下载,如果是选择PDF下载,并构造下载链接,开始下载;如果不是选择PDF下载,则进行CAJ格式下载,并构造下载链接,开始下载;

e)在下载的过程中,如果存在网页错误,则获取账户信息,判断其余额是否充足、是否需要购买,如果余额充足,则付费下载至下载结束;如果余额不足且不购买,则获取错误信息并结束下载;如果不存在网页错误,则进行下载至下载结束。

对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。

此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1