获取资源的下载链接的方法及系统的制作方法

文档序号:6515239阅读:228来源:国知局
获取资源的下载链接的方法及系统的制作方法
【专利摘要】本发明公开了获取资源的下载链接的方法及系统,其中,所述方法包括:获取用户通过网页跳转最终进行资源下载的跳转行为;根据所述跳转行为,生成访问下载链接的跳转路径;当用户访问所述跳转路径上的网页时,将所述跳转路径上的下载链接呈现给用户。通过本发明,可以利用用户通过网页跳转最终进行资源下载的跳转行为,获取与用户浏览网页相关的资源的下载链接并呈现给用户,使所获取的下载链接契合用户的真实需求,提高了获取资源的下载链接的效率,进而提高了用户进行资源下载的效率。
【专利说明】获取资源的下载链接的方法及系统
【技术领域】
[0001]本发明涉及计算机网络【技术领域】,具体涉及获取资源的下载链接的方法及系统。【背景技术】
[0002]随着计算机网络的飞速发展和计算机设备的普及,越来越多的用户通过互联网获取各种信息和各种所需的资源,网络下载成为用户获取互联网资源的主要手段之一。为了更好满足用户不断提高的下载需求,互联网上出现了大量以资源下载为主要服务的网络站点,很多综合类门户网站也会提供网络资源的下载服务。这些站点中有的专门提供某一类资源的下载服务,如专门提供文档资料、音/视频、软件等类别中的某一类下载服务的站点,有的则提供了相对全面的多类别综合下载服务,下载服务和网络资源的不断增加,为用户在互联网上获取各种资源提供了便利。当然,还有一些网站可能并不是专门提供下载服务的网站,但是偶尔也会有些资源可供下载。例如,某论坛网站,其主要服务是为用户提供交流平台,但也可能有些用户上传一些资料等文件,可以供其他用户下载。
[0003]通常,用户在网络上下载所需的资源,需要先定位到目标网络资源,然后才能根据目标网络资源的网络位置进行下载。定位目标网络资源的手段有多种,例如使用搜索引擎,以所需资源的关键词或者目标下载站点的信息进行检索,通过搜索引擎提供的搜索结果到达目标资源的下载页面;或者输入地址访问下载站点或者下载页面,进而获取所需资源的下载链接。但在这些目标资源的下载页面中,有的需要通过输入验证码或需要登录等方式才能获取的资源下载链接;有的则出于增加点击率,将资源的下载链接设计在了当前下载页面的下级子页面中;甚至为了推广产品等目的,有的下载页面中包含虚假的资源下载链接误导用户点击;这些都给用户从下载页面中获取真实有效的资源下载链接造成了不便。
[0004]此外,在现有技术中,能够在下载页面中提供与用户所需资源具有一定相关度的其他资源的链接,在一定程度上起到了方便了用户的作用。但页面中所提供的这些其他资源,其与用户所需资源的相关度的确定往往比较机械,例如对于软件类的资源,仅仅从软件功能分类的角度去确定相关度,且页面中所提供的多数甚至全部的相关的资源,往往仅限于该网站内的资源,导致多数时候这些相关资源不能很好地满足用户的真实需求。另外,现有技术手段中提供的资源链接,依赖与网站的页面的结构布局,资源链接作为一种网络链接,其正确性与站点的结构是相关的,一旦站点改版路径改变,资源链接也就相应的会发生改变,这将直接影响到向用户提供的资源链接的正确性。当资源链接发生改变,则需要重新分析站点的结构才能将错误的资源链接排除或修正,而完成这种排除或修正资源链接的工作,需要付出的很多的工作量和成本。
[0005]综上,迫切需要本领域技术人员解决的问题就在于,如何获取资源的下载链接,使所获取的下载链接契合用户的真实需求,提高用户下载资源的效率。

【发明内容】

[0006]鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的获取资源的下载链接的方法及相应的获取资源的下载链接的系统。
[0007]依据本发明的一个方面,提供了一种获取资源的下载链接的方法,包括:
[0008]获取用户通过网页跳转最终进行资源下载的跳转行为;
[0009]根据所述跳转行为,生成访问下载链接的跳转路径;
[0010]当用户访问所述跳转路径上的网页时,将所述跳转路径上的下载链接呈现给用户。
[0011]可选地,所述获取用户通过网页跳转最终进行资源下载的跳转行为,包括:
[0012]获取用户通过网页跳转最终进行资源下载的跳转行为中,所访问的各网页地址,以及相应的下载链接;
[0013]所述根据所述跳转行为,生成访问下载链接的跳转路径,包括:
[0014]根据获取到的用户访问的所述各网页地址,以及相应的下载链接,生成访问下载链接的跳转路径。
[0015]可选地,所述获取用户通过网页跳转最终进行资源下载的跳转行为,包括:
[0016]通过浏览器程序,获取用户通过网页跳转最终进行资源下载的跳转行为中,所访问的各网页地址,以及相应的下载链接;
[0017]所述根据所述跳转行为,生成访问下载链接的跳转路径,包括:
[0018]根据浏览器程序获取到的用户访问的所述各网页地址,以及相应的下载链接,生成访问下载链接的跳转路径。
[0019]可选地,所述获取用户通过网页跳转最终进行资源下载的跳转行为,包括:
[0020]获取用户标识信息,以及所述用户标识信息对应的用户通过网页跳转最终进行资源下载的过程中,每次跳转的跳转时间及跳转方式,所访问的各网页地址,以及相应的下载链接;所述跳转方式用于标识跳转的目标是另一个网页,或者是一个下载链接;
[0021]所述根据所述跳转行为,生成访问下载链接的跳转路径,包括:
[0022]根据所述用户标识信息、跳转时间、跳转方式、所访问的各网页地址,以及相应的下载链接,还原对应用户通过网页跳转最终进行资源下载的过程,生成访问下载链接的跳转路径。
[0023]可选地,所述获取用户标识信息,以及所述用户标识信息对应的用户通过网页跳转最终进行资源下载的过程中,每次跳转的跳转时间及跳转方式,所访问的各网页地址,以及相应的下载链接,包括:
[0024]在产生通过网页跳转最终进行资源下载的跳转行为时,由浏览器程序获取所述用户标识信息,并将所述用户标识信息,以及用户标识信息对应的用户通过网页跳转最终进行资源下载的过程中,每次跳转的跳转时间、跳转方式、所访问的各网页地址,以及相应的下载链接记录为跳转日志;
[0025]所述根据所述跳转行为,生成访问下载链接的跳转路径,包括:
[0026]根据所述跳转日志中记录的所述用户标识信息,以及用户标识信息对应的用户通过网页跳转最终进行资源下载的过程中,每次跳转的跳转时间、跳转方式、所访问的各网页地址,以及相应的下载链接,还原对应用户通过网页跳转最终进行资源下载的过程,生成访问下载链接的跳转路径。
[0027]可选地,所述浏览器程序将获取到的所述用户标识信息、跳转时间、跳转方式、所访问的各网页地址、以及相应的下载链接记录为日志,并上传至服务器端;
[0028]所述根据所述跳转行为,生成访问下载链接的跳转路径,包括:
[0029]由服务器端根据接收到的所述日志,还原对应用户通过网页跳转最终进行资源下载的过程,生成访问下载链接的跳转路径。
[0030]可选地,所述获取用户通过网页跳转最终进行资源下载的跳转行为,包括:
[0031]获取用户从预定范围的网页为起始,通过网页跳转最终进行资源下载的跳转行为;
[0032]所述根据所述跳转行为,生成访问下载链接的跳转路径,包括:
[0033]根据所述跳转行为,生成以所述预定范围的网页为起始的所述访问下载链接的跳
转路径。
[0034]可选地,所述根据所述跳转行为,生成以所述预定范围的网页为起始的所述访问下载链接的跳转路径,包括:
[0035]根据所述跳转行为中,以所述预定范围内的网页起始经过次数小于预置阈值的跳转最终进行资源下载的跳转行为,生成以所述预定范围的网页为起始的所述访问下载链接的跳转路径。
[0036]可选地,还包括:
[0037]以预置的判定方法对所述跳转路径上的下载链接进行过滤;
[0038]所述当用户访问所述跳转路径上的网页时,将所述跳转路径上的下载链接呈现给用户,包括:
[0039]当用户访问所述跳转路径上的网页时,根据过滤的结果,将过滤后得到的下载链接呈现给用户。
[0040]可选地,所述预置的判定方法为特征阈值判定,用于判定的特征为以下的至少一种:
[0041]以所述预定范围的网页为起始的跳转路径上,由该起始网页到达所述下载链接的平均路径长度;
[0042]以所述预定范围的网页为起始的跳转路径上,由该起始网页到达所述下载链接,并进行下载的下载次数;
[0043]以所述预定范围的网页为起始的跳转路径上,由该起始网页到达所述下载链接,并进行下载的下载次数,与由该起始网页到达的所有下载链接并进行下载的总的下载次数的下载次数比;
[0044]由所述预定范围的网页开始跳转而进行资源下载的次数,与由该起始网页开始的不区分目的的所有跳转的跳转次数比;
[0045]以所述预定范围的网页为起始的跳转路径上,由该起始网页到达所述下载链接,访问该下载链接是否需要提供用户认证信息;
[0046]以所述预定范围的网页为起始的跳转路径上,由该起始网页到达所述下载链接,访问该下载链接对应文件的文件类型;
[0047]所述以预置的判定方法对所述跳转路径上的下载链接进行过滤,包括:
[0048]对各所述用于判定的特征分别设置预置对应的特征阈值;当获取到的下载链接对应的特征符合对应的特征阈值要求时,将该下载链接确定为过滤后得到的下载链接;其中,当使用至少两个所述用于判定的特征时,在所有特征同时符合对应的特征阈值时,将该下载链接确定为过滤后得到的下载链接;
[0049]或,
[0050]根据至少一种所述用于判定的特征,计算所述跳转路径上的下载链接的权值,将所述权值达到预置权值阈值的下载链接确定为过滤后得到的下载链接;其中,当使用至少两个所述用于判定的特征时,计算下载链接的对应于每个特征的权值并进行累计,得到该下载链接的权值。
[0051]可选地,所述获取用户通过网页跳转最终进行资源下载的跳转行为,包括:
[0052]统计用户通过网页跳转最终进行资源下载的过程中网页跳转的次数,当所述跳转的次数小于预置的次数阈值时,获取用户通过网页跳转最终进行资源下载的跳转行为。
[0053]可选地,还包括:
[0054]以预置的判定方法对所述跳转路径上的下载链接进行过滤;
[0055]所述当用户访问所述跳转路径上的网页时,将所述跳转路径上的下载链接呈现给用户,包括:
[0056]当用户访问所述跳转路径上的网页时,根据过滤的结果,将过滤后得到的下载链接呈现给用户。
[0057]可选地,所述预置的判定方法为特征阈值判定,用于判定的特征为以下的至少一种:
[0058]由同一网页通过不同的跳转路径上到达同一下载链接时,由该网页到达该下载链接的平均路径长度;
[0059]跳转路径上一网页到达下载链接,该下载链接被下载的下载次数;
[0060]由一网页到达一下载链接,该下载链接被下载的下载次数,与由该网页到达的所有下载链接并进行下载的总的下载次数的下载次数比;
[0061]由一网页开始跳转而进行资源下载的次数,与由该网页开始的不区分目的的所有跳转的跳转次数比;
[0062]由一网页跳转到达一下载链接,访问该下载链接是否需要提供用户认证信息;
[0063]通过网页跳转到达一下载链接,该下载链接对应文件的文件类型;
[0064]所述当用户访问所述跳转路径上的网页时,以预置的判定方法对所述跳转路径上的下载链接进行过滤,包括:
[0065]对各所述用于判定的特征分别设置预置对应的特征阈值;当获取到的下载链接对应的特征符合对应的特征阈值要求时,将该下载链接确定为过滤后得到的下载链接;其中,当使用至少两个所述用于判定的特征时,在所有特征同时符合对应的特征阈值时,将该下载链接确定为过滤后得到的下载链接;
[0066]或,
[0067]根据至少一种所述用于判定的特征,计算所述跳转路径上的下载链接的权值,将所述权值达到预置权值阈值的下载链接确定为过滤后得到的下载链接;其中,当使用至少两个所述用于判定的特征时,计算下载链接的对应于每个特征的权值并进行累计,得到该下载链接的权值。
[0068]可选地,所述预置的判断方法还包括预置模板判定,所述方法,包括:[0069]利用预置的判断模板对所述跳转路径上的网页,以及对应的所述下载链接的URL进行相关度判断,并产生一判断结果,根据所述判定结果对所述跳转路径上的下载链接进行过滤;其中,所述预置的判断模板包括:预置的判断用户访问网页和下载链接的URL相关度的正则表达式模板。
[0070]可选地,所述以预置的判定方法对所述跳转路径上的下载链接进行过滤,包括:
[0071]对所述下载链接进行有效性检测,如果检测所述下载链接为有效链接,则将该下载链接确定为过滤后得到的下载链接。
[0072]可选地,还包括:
[0073]检测所述下载链接的链接类型,所述链接类型用于指示所述下载链接是否为特定下载工具的专用链接;
[0074]如果检测到所述下载链接类型为所述专用链接,则在将所述跳转路径上的下载链接呈现给用户的同时,显示该链接的链接类型。
[0075]可选地,所述将所述跳转路径上的下载链接呈现给用户,包括:
[0076]将所述跳转路径上的下载链接以操作系统弹出窗口、或浏览器弹出子窗口、或系统托盘弹出窗口、或浏览器窗口内的抽屉式弹窗的方式呈现给用户。
[0077]根据本发明的另一方面,提供了一种获取资源的下载链接的系统,包括:
[0078]信息获取单元,用于获取用户通过网页跳转最终进行资源下载的跳转行为;
[0079]路径生成单元,用于根据所述跳转行为,生成访问下载链接的跳转路径;
[0080]链接获取及显示单元,用于当用户访问所述跳转路径上的网页时,将所述跳转路径上的下载链接呈现给用户。
[0081]可选地,所述信息获取单元,包括:
[0082]第一信息获取子单元,用于获取用户通过网页跳转最终进行资源下载的跳转行为中,所访问的各网页地址,以及相应的下载链接;
[0083]所述路径生成单元,包括:
[0084]第一路径生成子单元,用于根据获取到的用户访问的所述各网页地址,以及相应的下载链接,生成访问下载链接的跳转路径。
[0085]可选地,所述信息获取单元,包括:
[0086]第二信息获取子单元,用于通过浏览器程序,获取用户通过网页跳转最终进行资源下载的跳转行为中,所访问的各网页地址,以及相应的下载链接;
[0087]所述路径生成单元,包括:
[0088]第二路径生成子单元,用于根据通过浏览器程序获取到的用户访问的所述各网页地址,以及相应的下载链接,生成访问下载链接的跳转路径。
[0089]可选地,所述信息获取单元,包括:
[0090]第三信息获取子单元,用于获取用户标识信息,以及所述用户标识信息对应的用户通过网页跳转最终进行资源下载的过程中,每次跳转的跳转时间及跳转方式,所访问的各网页地址,以及相应的下载链接;所述跳转方式用于标识跳转的目标是另一个网页,或者是一个下载链接;
[0091]所述路径生成单元,包括:
[0092]第三路径生成子单元,用于根据所述用户标识信息、跳转时间、跳转方式、所访问的各网页地址,以及相应的下载链接,还原对应用户通过网页跳转最终进行资源下载的过程,生成访问下载链接的跳转路径。
[0093]可选地,所述第三信息获取子单元,具体用于:
[0094]在产生通过网页跳转最终进行资源下载的跳转行为时,通过浏览器程序获取所述用户标识信息,并将所述用户标识信息,以及用户标识信息对应的用户通过网页跳转最终进行资源下载的过程中,每次跳转的跳转时间、跳转方式、所访问的各网页地址,以及相应的下载链接记录为跳转日志;
[0095]所述第三路径生成子单元,具体用于:
[0096]根据所述跳转日志中记录的所述用户标识信息,以及用户标识信息对应的用户通过网页跳转最终进行资源下载的过程中,每次跳转的跳转时间、跳转方式、所访问的各网页地址,以及相应的下载链接,还原对应用户通过网页跳转最终进行资源下载的过程,生成访问下载链接的跳转路径。
[0097]可选地,通过所述浏览器程序将获取到的所述用户标识信息、跳转时间、跳转方式、所访问的各网页地址、以及相应的下载链接记录为日志,并上传至服务器端第三路径生成子单元;
[0098]所述第三路径生成子单元位于服务器端,具体用于:
[0099]在服务器端根据接收到的所述日志,还原对应用户通过网页跳转最终进行资源下载的过程,生成访问下载链接的跳转路径。
[0100]可选地,所述信息获取单元,包括:
[0101]第四信息获取子单元,用于获取用户从预定范围的网页为起始,通过网页跳转最终进行资源下载的跳转行为;
[0102]所述路径生成单元,包括:
[0103]第四路径生成子单元,用于根据所述跳转行为,生成以所述预定范围的网页为起始的所述访问下载链接的跳转路径。
[0104]可选地,所述第四路径生成子单元,具体用于:
[0105]根据所述跳转行为中,以所述预定范围内的网页起始经过次数小于预置阈值的跳转最终进行资源下载的跳转行为,生成以所述预定范围的网页为起始的所述访问下载链接的跳转路径。
[0106]可选地,其特征在于,还包括:
[0107]筛选单元,以预置的判定方法对所述跳转路径上的下载链接进行过滤;
[0108]所述链接获取及显示单元,具体用于:
[0109]当用户访问所述跳转路径上的网页时,根据过滤的结果,将过滤后得到的下载链接呈现给用户。
[0110]可选地,所述预置的判定方法为特征阈值判定,所述系统还包括:第一特征获取单元,用于获取以下用于判定的特征的至少一种:
[0111]以所述预定范围的网页为起始的跳转路径上,由该起始网页到达所述下载链接的平均路径长度;
[0112]以所述预定范围的网页为起始的跳转路径上,由该起始网页到达所述下载链接,并进行下载的下载次数;[0113]以所述预定范围的网页为起始的跳转路径上,由该起始网页到达所述下载链接,并进行下载的下载次数,与由该起始网页到达的所有下载链接并进行下载的总的下载次数的下载次数比;
[0114]由所述预定范围的网页开始跳转而进行资源下载的次数,与由该起始网页开始的不区分目的的所有跳转的跳转次数比;
[0115]以所述预定范围的网页为起始的跳转路径上,由该起始网页到达所述下载链接,访问该下载链接是否需要提供用户认证信息;
[0116]以所述预定范围的网页为起始的跳转路径上,由该起始网页到达所述下载链接,访问该下载链接对应文件的文件类型;
[0117]所述筛选单元,具体用于:
[0118]对各所述用于判定的特征分别设置预置对应的特征阈值;当获取到的下载链接对应的特征符合对应的特征阈值要求时,将该下载链接确定为过滤后得到的下载链接;其中,当使用至少两个所述用于判定的特征时,在所有特征同时符合对应的特征阈值时,将该下载链接确定为过滤后得到的下载链接;
[0119]或,
[0120]根据至少一种所述用于判定的特征,计算所述跳转路径上的下载链接的权值,将所述权值达到预置权值阈值的下载链接确定为过滤后得到的下载链接;其中,当使用至少两个所述用于判定的特征时,计算下载链接的对应于每个特征的权值并进行累计,得到该下载链接的权值。
[0121]可选地,所述信息获取单元,包括:
[0122]第五信息获取子单元,用于统计用户通过网页跳转最终进行资源下载的过程中网页跳转的次数,当所述跳转的次数小于预置的次数阈值时,获取用户通过网页跳转最终进行资源下载的跳转行为。
[0123]可选地,其特征在于还包括:
[0124]过滤单元,用于以预置的判定方法对所述跳转路径上的下载链接进行过滤;
[0125]所述链接获取及显示单元用于:当用户访问所述跳转路径上的网页时,将经过过滤单元过滤后得到的下载链接呈现给用户。
[0126]可选地,所述预置的判定方法为特征阈值判定,所述系统还包括:第二特征获取单元,用于获取以下至少一种特征:
[0127]由同一网页通过不同的跳转路径上到达同一下载链接时,由该网页到达该下载链接的平均路径长度;
[0128]跳转路径上一网页到达下载链接,该下载链接被下载的下载次数;
[0129]由一网页到达一下载链接,该下载链接被下载的下载次数,与由该网页到达的所有下载链接并进行下载的总的下载次数的下载次数比;
[0130]由一网页开始跳转而进行资源下载的次数,与由该网页开始的不区分目的的所有跳转的跳转次数比;
[0131]由一网页跳转到达一下载链接,访问该下载链接是否需要提供用户认证信息;
[0132]通过网页跳转到达一下载链接,该下载链接对应文件的文件类型;
[0133]所述过滤单元,具体用于:[0134]对各所述用于判定的特征分别设置预置对应的特征阈值;当获取到的下载链接对应的特征符合对应的特征阈值要求时,将该下载链接确定为过滤后得到的下载链接;其中,当使用至少两个所述用于判定的特征时,在所有特征同时符合对应的特征阈值时,将该下载链接确定为过滤后得到的下载链接;
[0135]或,
[0136]根据至少一种所述用于判定的特征,计算所述跳转路径上的下载链接的权值,将所述权值达到预置权值阈值的下载链接确定为过滤后得到的下载链接;其中,当使用至少两个所述用于判定的特征时,计算下载链接的对应于每个特征的权值并进行累计,得到该下载链接权值。
[0137]可选地,所述预置的判定方法还包括预置模板判定,所述过滤单元,用于:
[0138]利用预置的判断模板对所述用户访问网页,以及对应的下载链接的URL进行相关度判断,并产生一判断结果,根据所述判定结果对所述跳转路径上的下载链接进行过滤;其中,所述预置的判断模板包括:预置的判断用户访问网页和下载链接的URL相关度的正则表达式模板。
[0139]可选地,所述过滤单元,包括:
[0140]有效性检测子单元,用于对所述下载链接进行有效性检测,如果检测所述下载链接为有效链接,则将该下载链接确定为过滤后得到的下载链接。
[0141]可选地,还包括:
[0142]链接类型检测单元,用于检测所述下载链接的链接类型,所述链接类型用于指示所述下载链接是否为特定下载工具的专用链接;
[0143]所述链接获取及显示单元,用于:
[0144]如果检测到所述下载链接类型为所述专用链接,则在将所述跳转路径上的下载链接呈现给用户的同时,显示该链接的链接类型。
[0145]可选地,所述链接获取及显示单元,用于:
[0146]将所述跳转路径上的下载链接以操作系统弹出窗口、或浏览器弹出子窗口、或系统托盘弹出窗口、或浏览器窗口内的抽屉式弹窗的方式呈现给用户。
[0147]根据本发明的获取资源的下载链接的方法可以在用户浏览网页的过程中,特别是通过网页跳转访问下载链接的过程中,收集到达所访问下载链接跳转行为,跳转行为实际上反映了用户访问下载链接的过程,利用收集到的这些下载过程的信息,生成下载链接过程的访问下载链接的跳转路径,相当于生成了从页面到达网络资源的链式路径数据,在用户访问跳转路径上的网页地址时,根据跳转路径得到与用户访问的地址相关的下载链接并呈现,由于获得的与用户访问的网页地址相关的下载链接以用户日常的下载行为和过程为基础,所得到的相关下载链接更加符合浏览网页者的下载需求,同时所得到的下载链接可以并不局限于本网页或网页所在网站内的下载链接,并将该网页相关的真实有效的下载链接呈现给用户。而且,获得的与用户访问的网页相关的下载链接以用户日常的下载行为和过程为基础,而不是依赖与网站的页面的结构布局,一旦出现失效链接,可以很容易地从获取到用户对链接的日常访问中体现出来,从而降低了排除或修正失效资源链接的工作成本。解决了通过页面进行下载的效率较低的问题,取得了获取更加符合用户需要的下载链接,丰富了用户的下载选择,排除了虚假链接的干扰,提高了通过页面进行下载的效率的有益效果。
[0148]进一步的,通过本发明的获取资源的下载链接的方法,可以通过浏览器程序,获取用户标识信息,并记录用户标识信息对应的用户访问下载链接过程中,每次跳转的跳转时间、跳转方式、所访问的各网页地址,以及相应的下载链接。进而,根据用户标识信息、跳转时间、跳转方式、所访问的各网页地址,以及相应的下载链接,还原对应用户通过网页跳转访问下载链接的过程,并获取用户通过网页跳转访问下载链接的跳转行为,从而根据获取的数据,准确地还原了用户通过网页跳转方式访问下载链接的过程,为根据跳转行为生成跳转路径打好基础。
[0149]再进一步的,本发明获取资源的下载链接的方法,还可以依据获得的多种特征对跳转路径上的下载链接进行过滤,进而将过滤后得到的下载链接呈现给用户,使得与用户浏览的网页地址有较高相关性的下载链接能够得到优先呈现,提高了所呈现的链接地址与用户需求的匹配度。以及,
[0150]在依据获得的多种特征对跳转路径上的下载链接进行过滤时,可以使用特征阈值的判定方法,基于所获取到的用于判定的特征,对跳转路径上的下载链接进行过滤,进而将过滤后得到的下载链接呈现给用户,同时,特征阈值的判定方法还可以与预置的判断模板结合使用,对用户访问网页地址,以及下载链接的URL进行相关度判断,进一步提高了对相关下载链接进行过滤的有效性,进一步提高了所呈现的链接地址与用户需求的匹配度。
[0151]上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的【具体实施方式】。
【专利附图】

【附图说明】
[0152]为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
[0153]图1是根据本发明一个实施例的获取资源的下载链接的方法流程图;
[0154]图2是根据本发明一个实施例的访问下载链接的跳转路径的示意图;
[0155]图3是根据本发明一个实施例的获取资源的下载链接的系统结构示意图。
【具体实施方式】
[0156]下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。
[0157]如图1所示,是根据本发明一个实施例的获取资源的下载链接的方法,该方法可以包括以下步骤:
[0158]SlOl:获取用户通过网页跳转最终进行资源下载的跳转行为;
[0159]要获取网络上的可下载的资源,首先需要获得资源的网络地址,即下载链接,而要获取资源的下载链接,可以通过浏览网站网页,根据其中提供的下载地址来获得。在传统的获取方式中,用户可以通过搜索引擎,输入所需资源的关键词,通过搜索引擎给出的搜索结果,来到达包含所需资源链接信息的网页;或者也可以根据记忆或者地址收藏来访问目标网络资源的下载站点/页面。这些访问方式中,大多数情况下用户都需要通过多步操作,通过网页间的跳转的方式访问多个页面,才能到达和获取资源的下载链接。
[0160]在本发明实施例提供的方法中,首先可以获取用户通过网页跳转最终进行资源下载的跳转行为,具体在获取的过程中,可以通过具有信息收集功能的浏览器程序,来收集通过网页跳转访问资源的下载链接过程中的跳转行为;也可以通过具有相关功能的浏览器插件,或者在操作系统上安装的监控程序来实现等等,具体实现获取跳转行为的手段可以有多种,本发明实施例对此并没有限制。
[0161]而所要获取的通过网页跳转最终进行资源下载的跳转行为,可以包括两方面的信息:通过网页跳转最终进行资源下载的过程中所访问各网页,以及相应的下载链接。这里的所访问网页可以以对应的网页地址来表示,跳转行为可以仅包括一个网页,也可以包括多个网页,具体情况可以根据通过网页跳转访问下载链接的实际过程来确定,例如在某个用户打开的网页中直接包含了所需的目标下载链接并对该下载链接进行了访问,则所获取的网页可以只包含这一个网页;而如果用户是通过一系列的网页跳转才访问到某个下载链接,则所获取的网页可以包括整个过程中所访问的各个网页。在实际应用中,后者是更经常出现的情况,即用户是通过多个网页间的多次跳转才最终进行资源下载,这种情况下,可以获取通过多次跳转访问下载链接的过程中所访问的各个网页,以及相应的下载链接。
[0162]具体在获取用户通过网页跳转最终进行资源下载的跳转行为的过程中,可以首先获取用户标识信息,以及用户标识信息对应用户每次通过网页跳转最终进行资源下载的过程中,每次跳转的跳转时间及跳转方式、所访问各网页的地址、以及相应的下载链接;再根据用户标识信息、每次网页跳转的跳转时间以及跳转方式,各网页地址,和对应的下载链接,还原对应用户通过网页跳转最终进行资源下载的过程。其中跳转方式用来标识跳转的目标是另一个网页,或者是一个下载链接。这个过程实际上是利用上述的标识信息、跳转时间,跳转方式,网页地址,下载链接等信息,对用户的通过网页跳转最终进行资源下载的过程进行还原的过程,获取的用户标识用于在还原该过程时对不同的用户进行区分,标识信息可以通过客户端程序来获取,如现有很多浏览器软件都提供了登录功能,可以根据将用户在浏览器软件上的登录的用户信息作为用户标识信息,也可以根据用户机器的硬件信息,如硬盘、CPU之类的硬件生成唯一的用户标识信息,不需要进行登录;而跳转时间信息,则反映了用户所访问之间的顺序,即先访问了那个网页,进而通过该网页又跳转到了哪个网页,所访问的网页被访问的先后顺序,可以通过访问时间来体现,根据上述标识信息、跳转时间,跳转方式,将用户访问通过网页跳转访问下载链接过程中所访问的网页地址、下载链接串联起来,就还原了用户通过网页跳转最终进行资源下载的过程,从而获取了用户通过网页跳转最终进行资源下载的跳转行为。
[0163]具体在获取标识信息、跳转时间,跳转方式,将用户访问通过网页跳转访问下载链接过程中所访问的网页地址、下载链接等信息时,可以在产生通过网页跳转最终进行资源下载的行为时,由浏览器程序获取用户标识信息,并将用户标识信息,以及用户标识信息对应的用户访问下载链接过程中,每次跳转的跳转时间、跳转方式、所访问的各网页地址,以及相应的下载链接记录为跳转日志。进而,根据日志中所记录的跳转日志,用户标识信息,以及用户标识信息对应的用户访问下载链接过程中,每次跳转的跳转时间、跳转方式、所访问的各网页地址,以及相应的下载链接,还原对应用户通过网页跳转访问下载链接的过程,并获取用户通过网页跳转访问下载链接的跳转行为。
[0164]获取跳转行为的操作,在不同的系统中,也可以有不同的实现方式,例如可以由浏览器端和服务器端来配合完成,具体的,可以由浏览器端将用户标识信息,网页跳转信息(包括跳转时间和跳转方式),所访问的网页地址以及下载链接等信息上传到服务器端,由服务器端对这些信息进行组织和分析。具体浏览器端收集和上传上述信息时,可以将上述收集到的信息保存为日志文件,进而将包括上述信息的日志文件传输到服务器端进行分析。需要说明的是,在浏览器端收集到信息中,可能部分信息并不是必需的,例如如果用户某次打开浏览器程序只是为了浏览信息,期间并不涉及对网络资源的下载,如用户进行了类似于这样的操作:
[0165]打开浏览器程序,浏览页面A,跳转并浏览页面B,又跳转到并浏览页面C,关闭浏览器程序。
[0166]这样的一系列操作更只是为了浏览网页信息,其中并没有访问任何下载链接,对于浏览器程序收集到的类似这样信息,可以在浏览器端上传数据到服务器端前将这些与访问下载链接无关的信息过滤掉,保留过滤后的信息。当然,在实际应用中,为了减轻浏览器端的压力,也可以由服务器端对浏览器端上传的数据中的这些与下载无关的数据进行过滤。
[0167]此外,在获取跳转行为的过程中,也可以获取用户通过跳转次数小于预置阈值的网页跳转最终进行资源下载的跳转行为,具体可以是统计用户通过网页跳转最终进行资源下载的过程中网页跳转的次数,当跳转的次数小于预置的次数阈值时,才获取用户通过网页跳转最终进行资源下载的跳转行为。这是因为通过网页跳转的方式访问一个下载链接的过程中,所经历的跳转次数越多,则起始的页面与最终访问的下载链接之间的联系更倾向于越小;反之,所经历的跳转次数越少,则起始的页面与最终访问的下载链接之间的联系更倾向于越紧密;如果需要经历相当多的次数跳转才能到达一个下载链接,比如五十次,则可以认为起始的页面与最终访问的下载链接之间已经接近于没有联系了。所以可以仅获取用户通过跳转次数小于预置阈值的网页跳转最终进行资源下载的跳转行为,如一次访问下载链接经过了 5次跳转:
[0168]从网页I开始跳转到网页2,跳转到网页3,......一直跳转到网页5,由网页5跳转
到下载链接A。如果预置的跳转次数的阈值为3次,则在这个过程中可以只获取最后3次跳转所经过的网页地址,即网页3的地址、网页4的地址、网页5的地址、以及下载链接A,所到达的下载链接以及其他相关信息。
[0169]S102:根据所述跳转行为,生成访问下载链接的跳转路径;
[0170]在步骤SlOl中获取到的跳转行为是一种用户的下载过程信息,反映了通过一次或多次网页跳转访问下载链接的过程,可以根据跳转行为生成访问下载链的跳转路径,将这种跳转的过程以计算机数据的形式表示,以将收集到的跳转行为进行有效的组织和利用。所生成的跳转路径可以存储为特定数据结构的数据库。通过一次或多次跳转访问下载链接的过程,可以抽象为由一系列受访问网页地址和下载链接组成的一条链式数据,每一次从一个页面开始到达一个下载链接,都可以作为一条链式数据,可以将这些链式的数据以数据库的形式组织存储。在Sioi中,不排除获取到的跳转行为是单一用户的跳转行为的情况,单一用户对应的跳转行为,也可以用来反映该用户的浏览习惯,可以用来作为向该用户推荐下载链接的依据,但在实际应用中,所获取到的跳转行为更倾向于是多个用户所组成的用户群体的跳转行为,通过综合用户群体的跳转行为生成的资源下载跳转路径,更加能反映一个网页与从这个网页进行跳转所到达的下载资源之间的关系紧密程度。
[0171]如前所述,所要获取的跳转行为至少可以包括两方面的信息:通过网页跳转最终进行资源下载的过程中所访问各网页的网页,以及相应的下载链接,则根据跳转行为生成访问下载链接的跳转路径的过程中,可以根据获取到的用户访问的各网页地址,以及相应的下载链接,生成访问下载链接的跳转路径。而在根据跳转行为生成的跳转路径中,至少存在两个对应的节点:对应于所访问网页的网页节点;以及,对应于下载链接的下载链接节点。在通过跳转进行资源下载的过程中,如果涉及到两次以上的网页跳转,则跳转行为中包括了多个网页,对应的,所生成的跳转路径中,可以包含多个对应的网页节点,分别对应于跳转过程中所访问的各个网页。
[0172]在资源下载跳转路径中,包括了网页节点和下载链接节点,这些节点对应的网页或下载链接,可以以其在网络上的链接地址作为唯一的标识信息,因此网络地址也可以作为跳转路径中各个节点的表达形式,其中,网页可以以其对应的统一资源定位符URL表示,而下载链接除了以URL形式表示,还有一些专有的特殊形式,如某些下载软件专有的下载链接表达形式。跳转路径可以表达为类似于如下示例中的形式:
[0173]网页URLOl -网页URL02 -…-网页URL (η)-下载链接。
[0174]此外,还可以将网页地址或下载链接转化为其他数据形式,例如转化为链接或地址对应的MD5值,进而利用各链接或地址对应的MD5值来表达跳转路径,进一步提高了数据的安全性,易于实现检索,此时,跳转路径可以表达为类似于如下示例中的形式:
[0175]URLOl 的 MD5 - URL02 的 MD5 -…-URL (η)的 MD5 -下载链接的 MD5。
[0176]在实际应用中跳转行为所体现的下载过程之间还经常表现出更为复杂的关系,表现在跳转路径上时,跳转路径上的节点可能同时也是另外一条跳转路径上的节点,同一个节点在不同的同时位于不同的跳转路径上时可能对应不同的下载链接节点等等,而使用树状或者网状数据结构来表达或存储这种更为复杂的关系,则更为贴近实际应用场景,同时也更利于计算机存储和对数据进行索引。下面结合附图进行更清楚的举例说明,以使读者对根据跳转行为生成跳转路径这一过程有更清楚的了解。
[0177]参见附图2,其中PageA代表一个页面地址Α,以此类推;Source_Sl代表下载链接SI,以此类推。通过图2可以看出,通过从同一页面地址A进行跳转访问下载链接,先后生成了 3条跳转路径,分别为:
[0178]PageA - PageB - PageC - Source_Sl;
[0179]PageA - PageD - PageE - Source_S2;
[0180]PageA - PageB - PageF - PageG - Source_S3。
[0181]可见,从同一页面地址A可以通过不同的跳转路径访问到至少3个不同的下载链接。在其中第一条跳转路径中的节点PageB,又同时位于两条跳转路径中,并且以PageB为起点又可以形成另外两条分别能够到达资源SI和S3跳转路径:[0182]PageB - PageC - Source_SI;
[0183]PageB - PageF - PageG - Source_S3。
[0184]可见,图2中使用的树状的数据结构很好地表达或存储这种更为复杂的关系。
[0185]需要说明的是,以上各示例是为了阐述资源下载跳转路径的表达形式,使读者对资源下载跳转路径及其生成过程有更清晰的了解,在实际应用中,资源下载跳转路径还可以有其他的计算机表达形式,以上示例不应当被理解为对本发明的限制。此外,如前所述,跳转行为可以是通过浏览器程序获取到的,用户通过网页跳转最终进行资源下载过程中,所访问的各网页地址,以及相应的下载链接,那么在根据跳转行为,生成访问下载链接的跳转路径的过程中,就可以根据浏览器程序获取到的用户访问的各网页地址以及相应的下载链接,生成访问下载链接的跳转路径。
[0186]S103:当用户访问所述跳转路径上的网页时,将所述跳转路径上的下载链接呈现
给用户。
[0187]当用户访问所述跳转路径上的网页时,可以将所述跳转路径上的下载链接呈现给用户。具体在呈现时,可以采用操作系统弹出窗口、或浏览器弹出子窗口、或系统托盘弹出窗口、或浏览器窗口内的抽屉式弹窗的方式,也可以在浏览器的内容浏览区域开辟一块单独的区块来呈现下载链接。
[0188]访问下载链接的跳转路径可以反映页面与通过跳转能够访问的下载链接之间的关联关系,但有些情况下,如下载链接要经过比较多次数的跳转才能访问,则可能两者的关联性不强,又如同一个页面可能对应于多个下载链接,每个下载链接的受关注度并不相同,因此,在根据跳转行为,生成跳转路径后,还可以在网页所在的跳转路径上,以预置的判定方法对跳转路径上的下载链接进行过滤,将过滤后得到的下载链接对应的下载链接,确定为该网页的相关下载链接。通过对跳转路径上的下载链接进行过滤,得到与用户所访问的网页的相关度相对较高的下载链接。
[0189]在以预置的判定方法对跳转路径上的下载链接进行过滤时,可以有不同的实现方式,下面对这些不同的实现方式进行介绍。
[0190]首先,预置的判定方法可以是特征阈值判定,具体实现时,首先可以获取以下用于判定的特征中的至少一种:
[0191]用户访问网页所在的跳转路径上,由该网页到达下载链接的平均路径长度;
[0192]用户访问网页所在的跳转路径上,由该网页到达下载链接,该下载链接被所有用户下载的下载次数;
[0193]用户访问网页所在的跳转路径上,由该网页到达下载链接,该链接被所有用户下载的下载次数,与由该网页到达的所有下载链接被下载的总的下载次数的下载次数比;
[0194]由用户访问网页开始跳转而访问下载链接的次数,与由该网页开始的不区分目的的所有跳转的跳转次数比;
[0195]用户访问网页所在的跳转路径上,由该网页到达一下载链接,访问该下载链接是否需要提供用户认证信息;
[0196]用户访问网页所在的跳转路径上,由该网页到达一下载链接,访问该下载链接对应文件的文件类型;
[0197]下面对上述的用于判定的特征进行详细介绍。[0198]由一网页到达一个下载链接的过程中,不同的用户或者同一用户在不同的时间条件下,所经过的跳转路径以及跳转路径的长度可能是不一样的,而跳转路径的长度能反映出网页与下载链接之间联系的紧密程度。
[0199]可以在通过统计同一网页到达同一下载链接的不同跳转路径的长度,来获取平均跳转路径长度。一个下载链接被用户下载的下载次数,可以反映出该下载链接受用户关注的程度,下载链接的被下载次数,可以通过统计用户对对应资源的下载次数来获得,具体的可以在用户下载时统计,也可以根据该下载链接在所有跳转路径中出现的次数来确定。在同一个网页同时对应有多个不同的下载链接时,还可以计算各个下载链接被所有用户下载的次数占该网页能够到达的所有下载链接被下载总次数的下载次数比例,这个比例也可以反映出该网页相关的下载链接中,每个链接的受关注程度。
[0200]用户通过一个网页进行跳转,可以根据跳转是否下载行为分为下载跳转和浏览跳转,如果用户通过一个网页进行下载跳转的次数比较多,则该页面更可能是与下载行为相关度较高的页面,因此可以通过统计由一网页出发跳转而访问下载链接的次数,占所有跳转次数的比例,来确定该网页与用户下载的相关度,进而为确定该页面与对应下载链接的相关度确定提供参考。
[0201]对一些下载链接进行访问时,有时需要提供用户认证信息才能被允许访问,而需要用户认证信息才能访问的下载链接,无疑会增加用户的下载难度,因此,是否需要用户认证信息才能访问下载链接也可以作为对下载链接进行过滤的特征之一。此外,下载链接对应文件的文件类型也可以作为用于判定的特征对下载链接进行过滤,在一个提供软件服务的站点中,比较这些软件安装文件的文件类型,可能是后缀名是.exe,.msi等的文件,比一个以.pdf为后缀名的软件说明文档更加符合用户的需求。
[0202]在获取用于判定的特征中的至少一种后,可以利用获取到的用于判定的特征,通过特征阈值判定的方法对跳转路径上的下载链接进行过滤,具体实现时,可以有不同的实现方式,如:
[0203]可以对各用于判定的特征分别设置预置对应的特征阈值;当获取到的下载链接对应的特征符合对应的特征阈值要求时,将该下载链接确定为过滤后得到的下载链接,将过滤后得到的下载链接呈现给用户;其中,当使用至少两个所述用于判定的特征时,在所有特征同时符合对应的特征阈值时,将该下载链接确定为过滤后得到的下载链接。例如使用上述的前三个用于判定的特征对下载链接进行过滤时,可以平均路径长度、下载次数、跳转次数比分别设置阈值,只有同时符合这三个特征分别对应的阈值的情况下,才将该下载链接确定为过滤后得到的下载链接。
[0204]或者,也可以根据至少一种用于判定的特征,计算所述跳转路径上的下载链接的权值,将所述权值达到预置权值阈值的下载链接呈现给用户;其中,当使用至少两个所述用于判定的特征时,计算下载链接的对应于每个特征的权值并进行累计,得到该下载链接的权值。在获取了其中一种或几种用于判定的特征后,可以根据获取到的用于判定的特征,计算所述跳转路径上的下载链接的权值,如果是根据多种用于判定的特征去计算权值,还可以为各个用于判定的特征分配一定的权重比例,进而综合多种用于判定的特征更加准确的判断网页与下载链接的相关度。最后将达到预置权值阈值的下载链接,确定为该网页的相关下载链接。[0205]其次,在以预置的判定方法对跳转路径上的下载链接进行过滤时,预置的判定方法还可以是预置模板判定,这种方法是利用预置的判断模板对用户访问网页地址,以及所述下载链接的URL进行相关度判断,并产生一判断结果,根据所述判定结果对所述跳转路径上的下载链接进行过滤;其中,预置的判断模板包括:预置的判断用户访问网页地址和下载链接的URL相关度的正则表达式模板。
[0206]网页所属站点如果与相关下载链接所属站点如果是同一站点,则一般认为网页与相关下载链接的相关度较高,例如一般情况下,用户通过提供下载服务的站点寻找所需下载资源时,一般都会优先下载该网站内的资源,而后才会选择再跳转到其他网站进行下载;由于一般的网页和下载链接都可以以URL表示,因此可以基于URL对网页与对应下载链接进行相关度判断,产生一判断结果,如果判断结果是网页跟下载链接属于同一站点,则确定该下载链接与当前访问的网页相关度较高,反之则较低。根据这一结果,可以在过滤时,仅将相关度较高的下载链接确定为过滤后得到的下载链接,也可以为相关度较高的下载链接较高的权值,反之则赋予以较低权值。判断网页与对应下载链接是否位于同一站点时,可以利用预置的判断模板对所述网页与对应下载链接进行相关度判断,其中,预置的判断模板可以是判断网页地址以及对应下载链接相关度的正则表达式模板。如当页面地址符合正则“http: //www.0nlinedown.net/soft/.*,,,同时下载链接符合正则 “http: //*.0nlinedown.net/down/.*”时,则认为下载链接与该页面相关度较高。
[0207]再者,在以预置的判定方法对跳转路径上的下载链接进行过滤时,还可以结合使用上述的特征阈值判定的方法和预置模板判定的方法,如可以先通过特征阈值判定的方法得到对下载链接的过滤的下载链接集合,再用阈值模板判定的方法对下载链接集合再进行一次过滤。
[0208]此外,一些网页上可能存在一些已经失效的链接,如页面中引用了其它站点的下载链接,如果该引用其它站点上的链接已经失效,这个引用也就失效了,因此还可以对下载链接进行有效性检测;进而在网页所在的跳转路径上,以预置条件对跳转路径上被检测为有效的下载链接进行过滤,将过滤后得到的有效的下载链接作为该网页的相关下载资源并呈现给用户。当然,这种对下载链接的有效性的检测可以单独使用,或结合前述的三种对下载链接进行过滤的方法中的任意一种来使用。
[0209]进一步的,在确定了网页的相关下载链接后,当用户访问某网页时,可以将该网页的相关下载链接呈现给用户。具体在呈现时,可以以操作系统弹出窗口、或浏览器弹出子窗口、或系统托盘弹出窗口、或浏览器窗口内的抽屉式弹窗的方式将下载链接展现在用户的显示器上,便于用户查看。此外,一些下载链接还可能是特定下载工具的专用链接类型,例如下载工具迅雷、emule电驴等下载工具都有各自的专用链接类型,此时还可以首先检测所述下载链接的链接类型,即检测相关链接否为特定下载工具的专用链接,如果下载链接是特定下载工具的专用链接,则将该网页的相关下载链接呈现给用户的同时,显示该链接的链接类型,用户可以根据显示的链接类型调用专用链接对应的下载工具,进一步方便了用户对链接对应的资源进行下载。
[0210]在另一种实施方式下,在获取用户通过网页跳转最终进行资源下载的跳转行为时,可以预先设定一定范围的目标网页,仅在用户访问这些预定范围内的目标网页,并以这些目标网页为起始通过网页跳转最终进行资源下载时,获取用户从预定范围的网页开始,通过网页跳转最终进行资源下载的跳转行为。因为在全网的所有网页中,存在一部分可能触发资源下载行为的页面,即通过这些网页触发的资源下载行为的几率较高,如下载站点的下载页面,可能触发下载行为的博客网页、新闻网页等;同时也存在通过网页跳转触发资源下载的可能性相对较低的网页。因此,可以将触发资源下载行为的可能性较高的网页收集起来,作为预定范围的目标页面,进而仅在用户访问这些预定范围的网页,并以这些网页为起始通过网页跳转最终进行资源下载时,对其跳转行为进行收集。
[0211]在这种实现方式下,在根据跳转行为生成访问下载链接的跳转路径的过程中,就可以根据跳转行为,生成以预定范围的网页为起点的访问下载链接的跳转路径。当用户访问跳转路径上的网页时,将跳转路径上的下载链接呈现给用户,可以是在用户访问跳转路径上的任意网页时,也可以只在用户访问跳转路径上的起点对应的网页时,将跳转路径上的下载链接呈现给用户。
[0212]与之前实施例的实现方式类似,具体在实现本实施例时,可以获取用户通过预定范围的网页为起点进行跳转最终进行资源下载的跳转行为中,所访问的各网页地址,以及相应的下载链接,进而根据获取到的用户访问的所述各网页地址,以及相应的下载链接,生成访问下载链接的跳转路径。具体实现时,可以通过浏览器程序获取用户通过网页跳转最终进行资源下载的跳转行为中,所访问的各网页地址,以及相应的下载链接。还可以获取用户标识信息,以及所述用户标识信息对应的用户通过网页跳转最终进行资源下载的过程中,每次跳转的跳转时间及跳转方式,所访问的各网页地址,以及相应的下载链接;根据用户标识信息、跳转时间、跳转方式、所访问的各网页地址,以及相应的下载链接,还原对应用户通过网页跳转最终进行资源下载的过程,生成访问下载链接的跳转路径。具体实现时,也可以以浏览器记录日志的方式记录这些数据。
[0213]如前所述,通过网页跳转的方式访问一个下载链接的过程中,所经历的跳转次数越多,则起始的页面与最终访问的下载链接之间的联系更倾向于越小;反之则起始的页面与最终访问的下载链接之间的联系更倾向于越紧密。在获取跳转行为的过程中,可以获取用户从预定范围的网页为起始,且经过跳转次数小于预置阈值的网页跳转,最终进行资源下载的跳转行为。即可以统计用户从预定范围的网页开始跳转,并最终进行资源下载的过程中网页跳转的次数,当跳转的次数小于预置的次数阈值时,才获取用户通过网页跳转最终进行资源下载的跳转行为。
[0214]类似的,当用户访问跳转路径上的网页时,同样可以用一定的预置判定方法对跳转路径上的下载链接进行过滤,当用户访问跳转路径上的网页时,根据过滤的结果,将过滤后得到的下载链接呈现给用户。其中,预置的判断方法可以是特征阈值判定,此时,可以获取至少一种如下用于判定的特征:
[0215]以预定范围的网页为起始的跳转路径上,由该起始网页到达下载链接的平均路径长度;
[0216]以预定范围的网页为起始的跳转路径上,由该起始网页到达下载链接,并进行下载的下载次数;
[0217]以预定范围的网页为起始的跳转路径上,由该起始网页到达所述下载链接,并进行下载的下载次数,与由该起始网页到达的所有下载链接并进行下载的总的下载次数的下载次数比;[0218]由预定范围的网页开始跳转而进行资源下载的次数,与由该起始网页开始的不区分目的的所有跳转的跳转次数比;
[0219]以预定范围的网页为起始的跳转路径上,由该起始网页到达下载链接,访问该下载链接是否需要提供用户认证信息;
[0220]以预定范围的网页为起始的跳转路径上,由该起始网页到达下载链接,访问该下载链接对应文件的文件类型。
[0221]获取了以上用于判定的特征的一种或几种后,在对跳转路径上的下载链接进行过滤时,可以对各用于判定的特征分别设置预置对应的特征阈值;当获取到的下载链接对应的特征符合对应的特征阈值要求时,将该下载链接确定为过滤后得到的下载链接;其中,当使用至少两个所述用于判定的特征时,只有在所有特征都符合对应的特征阈值时,才将该下载链接确定为过滤后得到的下载链接;
[0222]或者也可以根据至少一种用于判定的特征,计算跳转路径上的下载链接的权值,将权值或所有权值的和达到预置权值阈值的下载链接确定为过滤后得到的下载链接;其中,当使用至少两个用于判定的特征时,计算下载链接的对应于每个特征的权值并进行累计,得到该下载链接的权值(和)。
[0223]此外,本实施例中,以预置的判定方法对跳转路径上的下载链接进行过滤时,同样也可以结合使用特征阈值判定以及模板判定的方法,以及对下载链接进行有效性检测,具体进行判定和检测的方法可以参考前述的实施方式。在当用户访问跳转路径上的网页时,将跳转路径上的下载链接呈现给用户,具体的呈现方式同样可以参考前述的实施方式,在此就不再赘述了。
[0224]通过上述步骤得到的网页的相关下载链接,取自于通过网页跳转最终进行资源下载的过程,并借助于生成的跳转路径,通过过滤最终得到的网页对应的下载链接更加符合用户的下载需求,使用户在浏览页面时,不必进行多次跳转就能得到和使用该页面相关的下载链接,提高了用户通过网页进行下载的效率。同时,由于获得的与用户访问的网页相关的下载链接以用户日常的下载行为和过程为基础,而不是依赖于从网站自身的页面的结构布局进行抽取,一旦出现失效链接,可以很容易地从获取到用户对链接的日常访问中体现出来,并自动降低失效链接降低获得推荐的几率直至将其剔除,从而降低了排除或修正失效资源链接的工作成本。
[0225]与本发明实施例提供的获取资源的下载链接的方法相对应,本发明实施例还提供了一种获取资源的下载链接的系统,参见图3,该系统具体可以包括:
[0226]信息获取单元301,用于获取用户通过网页跳转最终进行资源下载的跳转行为;
[0227]路径生成单元302,用于根据跳转行为,生成访问下载链接的跳转路径;
[0228]链接获取及显示单元303,用于当用户访问跳转路径上的网页时,将跳转路径上的下载链接呈现给用户。
[0229]其中,信息获取单元301,可以包括:
[0230]第一信息获取子单元,用于获取用户通过网页跳转最终进行资源下载的跳转行为中,所访问的各网页地址,以及相应的下载链接;
[0231]在这种实现方式下路径生成单元302可以包括:
[0232]第一路径生成子单元,用于根据获取到的用户访问的各网页地址,以及相应的下载链接,生成访问下载链接的跳转路径。
[0233]跳转路径可以由至少一个网页节点,以及一个下载链接节点组成;其中,网页节点至少可以包括:通过其他页面跳转而直接或间接到达的,且包含下载链接的网页对应的网页节点。
[0234]在另一种实现方式下,信息获取单元301可以包括:
[0235]第二信息获取子单元,用于通过浏览器程序,获取用户通过网页跳转最终进行资源下载的跳转行为中,所访问的各网页地址,以及相应的下载链接;
[0236]在这种实现方式下,路径生成单元302可以包括:
[0237]第二路径生成子单元,用于根据通过浏览器程序获取到的用户访问的各网页地址,以及相应的下载链接,生成访问下载链接的跳转路径。
[0238]在另一种实现方式下,信息获取单元301可以包括:
[0239]第三信息获取子单元,用于获取用户标识信息,以及用户标识信息对应的用户通过网页跳转最终进行资源下载的过程中,每次跳转的跳转时间及跳转方式,所访问的各网页地址,以及相应的下载链接;其中的跳转方式用于标识跳转的目标是另一个网页,或者是一个下载链接;
[0240]在这种实现方式下,路径生成单元302可以包括:
[0241]第三路径生成子单元,用于根据用户标识信息、跳转时间、跳转方式、所访问的各网页地址,以及相应的下载链接,还原对应用户通过网页跳转最终进行资源下载的过程,生成访问下载链接的跳转路径。
[0242]其中第三信息获取子单元,具体还可以用于:
[0243]在产生通过网页跳转最终进行资源下载的跳转行为时,通过浏览器获取用户标识信息,并将用户标识信息,以及用户标识信息对应的用户通过网页跳转最终进行资源下载的过程中,每次跳转的跳转时间、跳转方式、所访问的各网页地址,以及相应的下载链接记录为跳转日志;
[0244]此时,第三路径生成子单元,具体可以用于:根据跳转日志中记录的用户标识信息,以及用户标识信息对应的用户通过网页跳转最终进行资源下载的过程中,每次跳转的跳转时间、跳转方式、所访问的各网页地址,以及相应的下载链接,还原对应用户通过网页跳转最终进行资源下载的过程,生成访问下载链接的跳转路径。
[0245]在这种实现方式下,可以通过浏览器程序将获取到的用户标识信息、跳转时间、跳转方式、所访问的各网页地址、以及相应的下载链接记录为日志,并上传至服务器端第三路径生成子单元;
[0246]其中,第三信息获取子单元可以位于服务器端,具体可以用于:
[0247]在服务器端根据接收到的日志,还原对应用户通过网页跳转最终进行资源下载的过程,生成访问下载链接的跳转路径。
[0248]在又一种实现方式下,信息获取单元301可以包括:
[0249]第四信息获取子单元,用于获取用户从预定范围的网页为起始,通过网页跳转最终进行资源下载的跳转行为;
[0250]对应的,路径生成单元302,可以包括:
[0251]第四路径生成子单元,用于根据所述跳转行为,生成以预定范围的网页为起始的访问下载链接的跳转路径。
[0252]在这种实施方式下,第四路径生成子单元,具体可以用于:
[0253]根据跳转行为中,以所述预定范围内的网页起始经过次数小于预置阈值的跳转最终进行资源下载的跳转行为,生成以预定范围的网页为起始的访问下载链接的跳转路径。
[0254]在这种实施方式下,该系统还可以包括:
[0255]筛选单元,以预置的判定方法对跳转路径上的下载链接进行过滤;
[0256]此时,链接获取及显示单元303具体可以用于:
[0257]当用户访问跳转路径上的网页时,根据过滤的结果,将过滤后得到的下载链接呈现给用户。
[0258]在这种实施方式下,预置的判定方法可以是特征阈值判定,系统还可以包括第一特征获取单元,第一特征获取单元用于获取以下用于判定的特征的至少一种:
[0259]以预定范围的网页为起始的跳转路径上,由该起始网页到达所述下载链接的平均路径长度;
[0260]以预定范围的网页为起始的跳转路径上,由该起始网页到达下载链接,并进行下载的下载次数;
[0261]以预定范围的网页为起始的跳转路径上,由该起始网页到达下载链接,并进行下载的下载次数,与由该起始网页到达的所有下载链接并进行下载的总的下载次数的下载次数比;
[0262]由预定范围的网页开始跳转而进行资源下载的次数,与由该起始网页开始的不区分目的的所有跳转的跳转次数比;
[0263]以预定范围的网页为起始的跳转路径上,由该起始网页到达下载链接,访问该下载链接是否需要提供用户认证信息;
[0264]以预定范围的网页为起始的跳转路径上,由该起始网页到达下载链接,访问该下载链接对应文件的文件类型;
[0265]在这种实施方式下,筛选单元具体可以用于:
[0266]对各用于判定的特征分别设置预置对应的特征阈值;当获取到的下载链接对应的特征符合对应的特征阈值要求时,将该下载链接确定为过滤后得到的下载链接;其中,当使用至少两个所述用于判定的特征时,在所有特征同时符合对应的特征阈值时,将该下载链接确定为过滤后得到的下载链接;
[0267]或,
[0268]根据至少一种上述用于判定的特征,计算跳转路径上的下载链接的权值,将权值达到预置权值阈值的下载链接确定为过滤后得到的下载链接;其中,当使用至少两个用于判定的特征时,计算下载链接的对应于每个特征的权值并进行累计,得到该下载链接的权值。
[0269]在另一种实现方式下,信息获取单元301可以包括:
[0270]第五信息获取子单元,用于统计用户通过网页跳转最终进行资源下载的过程中网页跳转的次数,并在跳转的次数小于预置的次数阈值时,获取用户通过网页跳转最终进行资源下载的跳转行为。
[0271]此外,该系统还可以包括:[0272]过滤单元,用于以预置的判定方法对所述跳转路径上的下载链接进行过滤;
[0273]此时链接获取及显示单元303可以在用户访问跳转路径上的网页时将经过过滤单元过滤后得到的下载链接呈现给用户。
[0274]预置的判定方法可以是特征阈值判定,此时,该系统还可以包括第二特征获取单元,用于获取以下至少一种特征:
[0275]由同一网页通过不同的跳转路径上到达同一下载链接时,由该网页到达该下载链接的平均路径长度;
[0276]跳转路径上一网页到达下载链接,该下载链接被下载的下载次数;
[0277]由一网页到达一下载链接,该下载链接被下载的下载次数,与由该网页到达的所有下载链接并进行下载的总的下载次数的下载次数比;
[0278]由一网页开始跳转而进行资源下载的次数,与由该网页开始的不区分目的的所有跳转的跳转次数比;
[0279]由一网页跳转到达一下载链接,访问该下载链接是否需要提供用户认证信息;
[0280]通过网页跳转到达一下载链接,该下载链接对应文件的文件类型
[0281]在这种实现方式下,过滤单元具体可以用于:
[0282]对各用于判定的特征分别设置预置对应的特征阈值;当获取到的下载链接对应的特征符合对应的特征阈值要求时,将该下载链接确定为过滤后得到的下载链接;其中,当使用至少两个用于判定的特征时,在所有特征同时符合对应的特征阈值时,将该下载链接确定为过滤后得到的下载链接;
[0283]或,
[0284]根据至少一种用于判定的特征,计算跳转路径上的下载链接的权值,将权值达到预置权值阈值的下载链接确定为过滤后得到的下载链接;其中,当使用至少两个用于判定的特征时,计算下载链接的对应于每个特征的权值并进行累计,得到该下载链接权值。
[0285]在另一种实现方式下,预置的判定方法还可以是预置模板判定,此时过滤单元,具体可以用于:利用预置的判断模板对用户访问网页,以及对应的下载链接的URL进行相关度判断,并产生一判断结果,根据判定结果对跳转路径上的下载链接进行过滤;其中,预置的判断模板包括:预置的判断用户访问网页和下载链接的URL相关度的正则表达式模板。
[0286]这里,过滤单元还可以包括有效性检测子单元,用于对下载链接进行有效性检测,如果检测下载链接为有效链接,则将该下载链接确定为过滤后得到的下载链接。
[0287]在另一种实现方式下,该获取资源的下载链接的系统还可以包括:
[0288]链接类型检测单元,用于检测下载链接的链接类型,其中,链接类型用于指示下载链接是否为特定下载工具的专用链接;链接获取及显示单元303可以用于:如果检测到下载链接类型为专用链接,则在将跳转路径上的下载链接呈现给用户的同时,显示该链接的链接类型。
[0289]此外,链接获取及显示单元303,还可以用于:
[0290]将跳转路径上的下载链接以操作系统弹出窗口、或浏览器弹出子窗口、或系统托盘弹出窗口、或浏览器窗口内的抽屉式弹窗的方式呈现给用户。
[0291]通过上述获取资源的下载链接的系统得到的网页的相关下载链接,其数据取自于用户通过网页跳转进行资源下载的过程,根据跳转行为生成访问下载链接的跳转路径,通过过滤最终得到的网页对应的下载链接更加符合用户的下载需求,使用户在浏览页面时,不必进行多次跳转就能得到该页面相关的下载链接,提高了用户通过网页获取链接进而进行下载的效率。
[0292]通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如R0M/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
[0293]本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
[0294]以上对本发明所提供的获取资源的下载链接的方法及系统,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在【具体实施方式】及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
【权利要求】
1.一种获取资源的下载链接的方法,其特征在于,包括: 获取用户通过网页跳转最终进行资源下载的跳转行为; 根据所述跳转行为,生成访问下载链接的跳转路径; 当用户访问所述跳转路径上的网页时,将所述跳转路径上的下载链接呈现给用户。
2.根据权利要求1所述的方法,其特征在于,所述获取用户通过网页跳转最终进行资源下载的跳转行为,包括: 获取用户通过网页跳转最终进行资源下载的跳转行为中,所访问的各网页地址,以及相应的下载链接; 所述根据所述跳转行为,生成访问下载链接的跳转路径,包括: 根据获取到的用户访问的所述各网页地址,以及相应的下载链接,生成访问下载链接的跳转路径。
3.根据权利要求2所述的方法,其特征在于,所述获取用户通过网页跳转最终进行资源下载的跳转行为,包括: 通过浏览器程序,获取用户通过网页跳转最终进行资源下载的跳转行为中,所访问的各网页地址,以及相应的下载链接; 所述根据所述跳转行为, 生成访问下载链接的跳转路径,包括: 根据浏览器程序获取到的用户访问的所述各网页地址,以及相应的下载链接,生成访问下载链接的跳转路径。
4.根据权利要求1所述的方法,其特征在于,所述获取用户通过网页跳转最终进行资源下载的跳转行为,包括: 获取用户标识信息,以及所述用户标识信息对应的用户通过网页跳转最终进行资源下载的过程中,每次跳转的跳转时间及跳转方式,所访问的各网页地址,以及相应的下载链接;所述跳转方式用于标识跳转的目标是另一个网页,或者是一个下载链接; 所述根据所述跳转行为,生成访问下载链接的跳转路径,包括: 根据所述用户标识信息、跳转时间、跳转方式、所访问的各网页地址,以及相应的下载链接,还原对应用户通过网页跳转最终进行资源下载的过程,生成访问下载链接的跳转路径。
5.根据权利要求4所述的方法,其特征在于,所述获取用户标识信息,以及所述用户标识信息对应的用户通过网页跳转最终进行资源下载的过程中,每次跳转的跳转时间及跳转方式,所访问的各网页地址,以及相应的下载链接,包括: 在产生通过网页跳转最终进行资源下载的跳转行为时,由浏览器程序获取所述用户标识信息,并将所述用户标识信息,以及用户标识信息对应的用户通过网页跳转最终进行资源下载的过程中,每次跳转的跳转时间、跳转方式、所访问的各网页地址,以及相应的下载链接记录为跳转日志; 所述根据所述跳转行为,生成访问下载链接的跳转路径,包括: 根据所述跳转日志中记录的所述用户标识信息,以及用户标识信息对应的用户通过网页跳转最终进行资源下载的过程中,每次跳转的跳转时间、跳转方式、所访问的各网页地址,以及相应的下载链接,还原对应用户通过网页跳转最终进行资源下载的过程,生成访问下载链接的跳转路径。
6.根据权利要求5所述的方法,其特征在于,所述浏览器程序将获取到的所述用户标识信息、跳转时间、跳转方式、所访问的各网页地址、以及相应的下载链接记录为日志,并上传至服务器端; 所述根据所述跳转行为,生成访问下载链接的跳转路径,包括: 由服务器端根据接收到的所述日志,还原对应用户通过网页跳转最终进行资源下载的过程,生成访问下载链接的跳转路径。
7.根据权利要求1所述的方法,其特征在于,所述获取用户通过网页跳转最终进行资源下载的跳转行为,包括: 获取用户从预定范围的网页为起始,通过网页跳转最终进行资源下载的跳转行为; 所述根据所述跳转行为,生成访问下载链接的跳转路径,包括: 根据所述跳转行为,生成以所述预定范围的网页为起始的所述访问下载链接的跳转路径。
8.根据权利要求7所述的方法,其特征在于,所述根据所述跳转行为,生成以所述预定范围的网页为起始的所述访问下载链接的跳转路径,包括: 根据所述跳转行为中,以所述预定范围内的网页起始经过次数小于预置阈值的跳转最终进行资源下载的跳转行为,生成以所述预定范围的网页为起始的所述访问下载链接的跳 转路径。
9.根据权利要求7或8所述的方法,其特征在于,还包括: 以预置的判定方法对所述跳转路径上的下载链接进行过滤; 所述当用户访问所述跳转路径上的网页时,将所述跳转路径上的下载链接呈现给用户,包括: 当用户访问所述跳转路径上的网页时,根据过滤的结果,将过滤后得到的下载链接呈现给用户。
10.根据权利要求9所述的方法,其特征在于,所述预置的判定方法为特征阈值判定,用于判定的特征为以下的至少一种: 以所述预定范围的网页为起始的跳转路径上,由该起始网页到达所述下载链接的平均路径长度; 以所述预定范围的网页为起始的跳转路径上,由该起始网页到达所述下载链接,并进行下载的下载次数; 以所述预定范围的网页为起始的跳转路径上,由该起始网页到达所述下载链接,并进行下载的下载次数,与由该起始网页到达的所有下载链接并进行下载的总的下载次数的下载次数比; 由所述预定范围的网页开始跳转而进行资源下载的次数,与由该起始网页开始的不区分目的的所有跳转的跳转次数比; 以所述预定范围的网页为起始的跳转路径上,由该起始网页到达所述下载链接,访问该下载链接是否需要提供用户认证信息; 以所述预定范围的网页为起始的跳转路径上,由该起始网页到达所述下载链接,访问该下载链接对应文件的文件类型; 所述以预置的判定方法对所述跳转路径上的下载链接进行过滤,包括:对各所述用于判定的特征分别设置预置对应的特征阈值;当获取到的下载链接对应的特征符合对应的特征阈值要求时,将该下载链接确定为过滤后得到的下载链接;其中,当使用至少两个所述用于判定的特征时,在所有特征同时符合对应的特征阈值时,将该下载链接确定为过滤后得到的下载链接; 或, 根据至少一种所述用于判定的特征,计算所述跳转路径上的下载链接的权值,将所述权值达到预置权值阈值的下载链接确定为过滤后得到的下载链接;其中,当使用至少两个所述用于判定的特征时,计算下载链接的对应于每个特征的权值并进行累计,得到该下载链接的权值。
11.根据权利要求1-6任一项所述的方法,其特征在于,所述获取用户通过网页跳转最终进行资源下载的跳转行为,包括: 统计用户通过网页跳转最终进行资源下载的过程中网页跳转的次数,当所述跳转的次数小于预置的次数阈值时,获取用户通过网页跳转最终进行资源下载的跳转行为。
12.根据权利要求1-6任一项所述的方法,其特征在于,还包括: 以预置的判定方法对所述跳转路径上的下载链接进行过滤; 所述当用户访问所述跳转路径上的网页时,将所述跳转路径上的下载链接呈现给用户,包括: 当用户访问所述跳转路径上的网页时,根据过滤的结果,将过滤后得到的下载链接呈现给用户。
13.根据权利要求12所·述的方法,其特征在于,所述预置的判定方法为特征阈值判定,用于判定的特征为以下的至少一种: 由同一网页通过不同的跳转路径上到达同一下载链接时,由该网页到达该下载链接的平均路径长度; 跳转路径上一网页到达下载链接,该下载链接被下载的下载次数; 由一网页到达一下载链接,该下载链接被下载的下载次数,与由该网页到达的所有下载链接并进行下载的总的下载次数的下载次数比; 由一网页开始跳转而进行资源下载的次数,与由该网页开始的不区分目的的所有跳转的跳转次数比; 由一网页跳转到达一下载链接,访问该下载链接是否需要提供用户认证信息; 通过网页跳转到达一下载链接,该下载链接对应文件的文件类型; 所述当用户访问所述跳转路径上的网页时,以预置的判定方法对所述跳转路径上的下载链接进行过滤,包括: 对各所述用于判定的特征分别设置预置对应的特征阈值;当获取到的下载链接对应的特征符合对应的特征阈值要求时,将该下载链接确定为过滤后得到的下载链接;其中,当使用至少两个所述用于判定的特征时,在所有特征同时符合对应的特征阈值时,将该下载链接确定为过滤后得到的下载链接; 或, 根据至少一种所述用于判定的特征,计算所述跳转路径上的下载链接的权值,将所述权值达到预置权值阈值的下载链接确定为过滤后得到的下载链接;其中,当使用至少两个所述用于判定的特征时,计算下载链接的对应于每个特征的权值并进行累计,得到该下载链接的权值。
14.根据权利要求13所述的方法,其特征在于,所述预置的判断方法还包括预置模板判定,所述方法,包括: 利用预置的判断模板对所述跳转路径上的网页,以及对应的所述下载链接的URL进行相关度判断,并产生一判断结果,根据所述判定结果对所述跳转路径上的下载链接进行过滤;其中,所述预置的判断模板包括:预置的判断用户访问网页和下载链接的URL相关度的正则表达式模板。
15.根据权利要求12所述的方法,其特征在于,所述以预置的判定方法对所述跳转路径上的下载链接进行过滤,包括: 对所述下载链接进行有效性检测,如果检测所述下载链接为有效链接,则将该下载链接确定为过滤后得到的下载链接。
16.根据权利要求1-15任一项所述的方法,其特征在于,还包括: 检测所述下载链接的链接类型,所述链接类型用于指示所述下载链接是否为特定下载工具的专用链接; 如果检测到所述下载链接类型为所述专用链接,则在将所述跳转路径上的下载链接呈现给用户的同时,显示该链接的链接类型。
17.根据权利要求1-15任一项所述的方法,其特征在于,所述将所述跳转路径上的下载链接呈现给用户,包括: 将所述跳转路径上的下载链接以操作系统弹出窗口、或浏览器弹出子窗口、或系统托盘弹出窗口、或浏览器窗口内的抽屉式弹窗的方式呈现给用户。
18.一种获取资源的下载链接的系统,其特征在于,包括: 信息获取单元,用于获取用户通过网页跳转最终进行资源下载的跳转行为; 路径生成单元,用于根据所述跳转行为,生成访问下载链接的跳转路径; 链接获取及显示单元,用于当用户访问所述跳转路径上的网页时,将所述跳转路径上的下载链接呈现给用户。
19.根据权利要求18所述的系统,其特征在于,所述信息获取单元,包括: 第一信息获取子单元,用于获取用户通过网页跳转最终进行资源下载的跳转行为中,所访问的各网页地址,以及相应的下载链接; 所述路径生成单元,包括: 第一路径生成子单元,用于根据获取到的用户访问的所述各网页地址,以及相应的下载链接,生成访问下载链接的跳转路径。
20.根据权利要求19所述的系统,其特征在于,所述信息获取单元,包括: 第二信息获取子单元,用于通过浏览器程序,获取用户通过网页跳转最终进行资源下载的跳转行为中,所访问的各网页地址,以及相应的下载链接; 所述路径生成单元,包括: 第二路径生成子单元,用于根据通过浏览器程序获取到的用户访问的所述各网页地址,以及相应的下载链接,生成访问下载链接的跳转路径。
21.根据权利要求18所述的系统,其特征在于,所述信息获取单元,包括:第三信息获取子单元,用于获取用户标识信息,以及所述用户标识信息对应的用户通过网页跳转最终进行资源下载的过程中,每次跳转的跳转时间及跳转方式,所访问的各网页地址,以及相应的下载链接;所述跳转方式用于标识跳转的目标是另一个网页,或者是一个下载链接; 所述路径生成单元,包括: 第三路径生成子单元,用于根据所述用户标识信息、跳转时间、跳转方式、所访问的各网页地址,以及相应的下载链接,还原对应用户通过网页跳转最终进行资源下载的过程,生成访问下载链接的跳转路径。
22.根据权利要求21所述的系统,其特征在于,所述第三信息获取子单元,具体用于: 在产生通过网页跳转最终进行资源下载的跳转行为时,通过浏览器程序获取所述用户标识信息,并将所述用户标识信息,以及用户标识信息对应的用户通过网页跳转最终进行资源下载的过程中,每次跳转的跳转时间、跳转方式、所访问的各网页地址,以及相应的下载链接记录为跳转日志; 所述第三路径生成子单元,具体用于: 根据所述跳转日志中记录的所述用户标识信息,以及用户标识信息对应的用户通过网页跳转最终进行资源下载的过程中,每次跳转的跳转时间、跳转方式、所访问的各网页地址,以及相应的下载链接,还原对应用户通过网页跳转最终进行资源下载的过程,生成访问下载链接的跳转路径。
23.根据权利要求22 所述的系统,其特征在于,通过所述浏览器程序将获取到的所述用户标识信息、跳转时间、跳转方式、所访问的各网页地址、以及相应的下载链接记录为日志,并上传至服务器端第三路径生成子单元; 所述第三路径生成子单元位于服务器端,具体用于: 在服务器端根据接收到的所述日志,还原对应用户通过网页跳转最终进行资源下载的过程,生成访问下载链接的跳转路径。
24.根据权利要求18所述的系统,其特征在于,所述信息获取单元,包括: 第四信息获取子单元,用于获取用户从预定范围的网页为起始,通过网页跳转最终进行资源下载的跳转行为; 所述路径生成单元,包括: 第四路径生成子单元,用于根据所述跳转行为,生成以所述预定范围的网页为起始的所述访问下载链接的跳转路径。
25.根据权利要求24所述的系统,其特征在于,所述第四路径生成子单元,具体用于: 根据所述跳转行为中,以所述预定范围内的网页起始经过次数小于预置阈值的跳转最终进行资源下载的跳转行为,生成以所述预定范围的网页为起始的所述访问下载链接的跳转路径。
26.根据权利要求24或25所述的系统,其特征在于,还包括: 筛选单元,以预置的判定方法对所述跳转路径上的下载链接进行过滤; 所述链接获取及显示单元,具体用于: 当用户访问所述跳转路径上的网页时,根据过滤的结果,将过滤后得到的下载链接呈现给用户。
27.根据权利要求26所述的系统,其特征在于,所述预置的判定方法为特征阈值判定,所述系统还包括:第一特征获取单元,用于获取以下用于判定的特征的至少一种: 以所述预定范围的网页为起始的跳转路径上,由该起始网页到达所述下载链接的平均路径长度; 以所述预定范围的网页为起始的跳转路径上,由该起始网页到达所述下载链接,并进行下载的下载次数; 以所述预定范围的网页为起始的跳转路径上,由该起始网页到达所述下载链接,并进行下载的下载次数,与由该起始网页到达的所有下载链接并进行下载的总的下载次数的下载次数比; 由所述预定范围的网页开始跳转而进行资源下载的次数,与由该起始网页开始的不区分目的的所有跳转的跳转次数比; 以所述预定范围的网页为起始的跳转路径上,由该起始网页到达所述下载链接,访问该下载链接是否需要提供用户认证信息; 以所述预定范围的网页为起始的跳转路径上,由该起始网页到达所述下载链接,访问该下载链接对应文件的文件类型; 所述筛选单元,具体用于: 对各所述用于判定的 特征分别设置预置对应的特征阈值;当获取到的下载链接对应的特征符合对应的特征阈值要求时,将该下载链接确定为过滤后得到的下载链接;其中,当使用至少两个所述用于判定的特征时,在所有特征同时符合对应的特征阈值时,将该下载链接确定为过滤后得到的下载链接; 或, 根据至少一种所述用于判定的特征,计算所述跳转路径上的下载链接的权值,将所述权值达到预置权值阈值的下载链接确定为过滤后得到的下载链接;其中,当使用至少两个所述用于判定的特征时,计算下载链接的对应于每个特征的权值并进行累计,得到该下载链接的权值。
28.根据权利要求18-23任一项所述的系统,其特征在于,所述信息获取单元,包括: 第五信息获取子单元,用于统计用户通过网页跳转最终进行资源下载的过程中网页跳转的次数,当所述跳转的次数小于预置的次数阈值时,获取用户通过网页跳转最终进行资源下载的跳转行为。
29.根据权利要求18-23任一项所述的系统,其特征在于,还包括: 过滤单元,用于以预置的判定方法对所述跳转路径上的下载链接进行过滤; 所述链接获取及显示单元用于:当用户访问所述跳转路径上的网页时,将经过过滤单元过滤后得到的下载链接呈现给用户。
30.根据权利要求29所述的系统,其特征在于,所述预置的判定方法为特征阈值判定,所述系统还包括:第二特征获取单元,用于获取以下至少一种特征: 由同一网页通过不同的跳转路径上到达同一下载链接时,由该网页到达该下载链接的平均路径长度; 跳转路径上一网页到达下载链接,该下载链接被下载的下载次数; 由一网页到达一下载链接,该下载链接被下载的下载次数,与由该网页到达的所有下载链接并进行下载的总的下载次数的下载次数比; 由一网页开始跳转而进行资源下载的次数,与由该网页开始的不区分目的的所有跳转的跳转次数比; 由一网页跳转到达一下载链接,访问该下载链接是否需要提供用户认证信息; 通过网页跳转到达一下载链接,该下载链接对应文件的文件类型; 所述过滤单元,具体用于: 对各所述用于判定的特征分别设置预置对应的特征阈值;当获取到的下载链接对应的特征符合对应的特征阈值要求时,将该下载链接确定为过滤后得到的下载链接;其中,当使用至少两个所述用于判定的特征时,在所有特征同时符合对应的特征阈值时,将该下载链接确定为过滤后得到的下载链接; 或, 根据至少一种所述用于判定的特征,计算所述跳转路径上的下载链接的权值,将所述权值达到预置权值阈值的下载链接确定为过滤后得到的下载链接;其中,当使用至少两个所述用于判定的特征时,计算下载链接的对应于每个特征的权值并进行累计,得到该下载链接权值。
31.根据权利要求30所述的系统,其特征在于,所述预置的判定方法还包括预置模板判定,所述过滤单元,用于: 利用预置的判断模板对所述用户访问网页,以及对应的下载链接的URL进行相关度判断,并产生一判断结果,根据所述判定结果对所述跳转路径上的下载链接进行过滤;其中,所述预置的判断模板·包括:预置的判断用户访问网页和下载链接的URL相关度的正则表达式模板。
32.根据权利要求29所述的系统,其特征在于,所述过滤单元,包括: 有效性检测子单元,用于对所述下载链接进行有效性检测,如果检测所述下载链接为有效链接,则将该下载链接确定为过滤后得到的下载链接。
33.根据权利要求18-32任一项所述的系统,其特征在于,还包括: 链接类型检测单元,用于检测所述下载链接的链接类型,所述链接类型用于指示所述下载链接是否为特定下载工具的专用链接; 所述链接获取及显示单元,用于: 如果检测到所述下载链接类型为所述专用链接,则在将所述跳转路径上的下载链接呈现给用户的同时,显示该链接的链接类型。
34.根据权利要求18-32任一项所述的系统,其特征在于,所述链接获取及显示单元,用于: 将所述跳转路径上的下载链接以操作系统弹出窗口、或浏览器弹出子窗口、或系统托盘弹出窗口、或浏览器窗口内的抽屉式弹窗的方式呈现给用户。
【文档编号】G06F17/30GK103530365SQ201310476120
【公开日】2014年1月22日 申请日期:2013年10月12日 优先权日:2013年10月12日
【发明者】田乐逍, 胡又欢, 肖镜辉 申请人:北京搜狗信息服务有限公司, 北京搜狗科技发展有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1