抓取目标图片的方法及装置的制造方法_3

文档序号:9687554阅读:来源:国知局
户端的目标图片显示页。具体地,当前页面如果为详细页,则使用1*1像素的图片替代所述目标图片,如果当前页面为列表页,则使用列表固定大小的默认图片替代所述目标图片。此处下载目标图片失败时使用替代图片的处理,本领域技术人员可以理解,在此不做详述。
[0079]在具体实施中,在向目标图片需显示的页面加载所述目标图片之前,为了适应当前页面的图片显示尺寸需要,需要对当前下载的所述目标图片进行处理。例如下载的图片尺寸为600*450,当前页面的图片显示尺寸要求400*600,那么应该做相应的裁剪。
[0080]本发明实施例采用的技术方案在根据访问链接中的路径信息访问目标图片失败时触发http 404错误页信息以获得错误资源参数,根据所述错误资源参数获得所述目标图片的源地址,再通过已获取的源地址从目标站点服务器下载所述目标图片,因此本发明实施例采用的技术方案避免了图片的不必要抓取和重复抓取,从而节省了网络资源和存储资源。通过按照所述路径信息存储目标图片,可再次根据访问链接中的路径信息访问到所述目标图片,不再重复抓取,从而节省系统资源。
[0081]图3是本发明实施例中的一种抓取目标图片的装置的结构示意图。如图所示的抓取目标图片的装置30,可以包括:错误资源参数获取单元301,源地址获取单元302和目标图片下载单元303;
[0082]错误资源参数获取单元301,适于当用户在客户端打开图片显示页访问本地目标图片时,若根据所述目标图片的加载链接包含的本地图片路径无法加载所述目标图片,则获取错误资源参数;
[0083]源地址获取单元302,适于参照所述错误资源参数从图片源地址表中获得所述目标图片的源地址;其中,所述图片源地址表存储了所述错误资源参数以及对应的所述目标图片的源地址;
[0084]目标图片下载单元303,适于根据所述目标图片的源地址从目标站点服务器下载所述目标图片,并按所述本地图片路径存储当前下载的目标图片。
[0085]在具体实施中,所述图片源地址表通过以下单元获得:
[0086]源地址解析单元,适于从目标站点服务器返回的页面信息中提取所述目标图片的源地址;
[0087]图片路径预设单元,适于预设所述目标图片的本地图片路径;
[0088]图片源地址表形成单元,适于建立所述错误资源参数,以及所述错误资源参数与所述目标图片的源地址的对应关系,形成所述图片源地址表。
[0089]在具体实施中,所述获取错误资源参数可以是通过配置所述目标图片的http404错误页信息传递错误资源参数来获取。
[0090]在具体实施中,所述错误资源参数可以包括所述目标图片的标识码。
[0091]在具体实施中,所述源地址获取单元302,适于根据所述目标图片的标识码从所述图片源地址表中查找对应的所述目标图片的源地址。
[0092]本发明实施例采用的技术方案在用户访问目标图片失败时获取错误资源参数,根据所述错误资源参数获得所述目标图片的源地址,再通过已获取的源地址从目标站点服务器下载所述目标图片,因此本发明实施例采用的技术方案避免了图片的不必要抓取和重复抓取,从而节省了网络资源和存储资源。
[0093]本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于以计算机可读存储介质中,存储介质可以包括:R0M、RAM、磁盘或光盘等。
[0094]虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。
【主权项】
1.一种抓取目标图片的方法,其特征在于,包括: 当用户在客户端打开图片显示页访问本地目标图片时,若根据所述目标图片的加载链接包含的本地图片路径无法加载所述目标图片,则获取错误资源参数; 参照所述错误资源参数从图片源地址表中获得所述目标图片的源地址;其中,所述图片源地址表存储了所述错误资源参数以及对应的所述目标图片的源地址; 根据所述目标图片的源地址从目标站点服务器下载所述目标图片,并按所述本地图片路径存储当前下载的目标图片。2.根据权利要求1所述的抓取目标图片的方法,其特征在于,所述获取错误资源参数,包括: 配置所述目标图片的http 404错误页信息以获取所述错误资源参数。3.根据权利要求1所述的抓取目标图片的方法,其特征在于,所述图片源地址表通过以下方式获得: 从目标站点服务器返回的页面信息中提取所述目标图片的源地址; 预设所述目标图片的本地图片路径; 建立所述错误资源参数,以及所述错误资源参数与所述目标图片的源地址的对应关系,形成所述图片源地址表。4.根据权利要求1至3任一项所述的抓取目标图片的方法,其特征在于,所述错误资源参数包括所述目标图片的标识码。5.根据权利要求4所述的抓取目标图片的方法,其特征在于,所述参照所述错误资源参数从图片源地址表中获得所述目标图片的源地址,包括: 根据所述目标图片的标识码从所述图片源地址表中查找对应的所述目标图片的源地址。6.一种抓取目标图片的装置,其特征在于,包括: 错误资源参数获取单元,适于当用户在客户端打开图片显示页访问本地目标图片时,若根据所述目标图片的加载链接包含的本地图片路径无法加载所述目标图片,则获取错误资源参数; 源地址获取单元,适于参照所述错误资源参数从图片源地址表中获得所述目标图片的源地址;其中,所述图片源地址表存储了所述错误资源参数以及对应的所述目标图片的源地址; 目标图片下载单元,适于根据所述目标图片的源地址从目标站点服务器下载所述目标图片,并按所述本地图片路径存储当前下载的目标图片。7.根据权利要求6所述的抓取目标图片的装置,其特征在于,所述错误资源参数获取单元,适于当用户在客户端打开图片显示页访问本地目标图片时,若根据所述目标图片的加载链接包含的本地图片路径无法加载所述目标图片,配置所述目标图片的http 404错误页信息以获取错误资源参数。8.根据权利要求6所述的抓取目标图片的装置,其特征在于,所述图片源地址表通过以下单元获得: 源地址解析单元,适于从目标站点服务器返回的页面信息中提取所述目标图片的源地址; 图片路径预设单元,适于预设所述目标图片的本地图片路径; 所述图片源地址表形成单元,适于建立所述错误资源参数,以及所述错误资源参数与所述目标图片的源地址的对应关系,形成所述图片源地址表。9.根据权利要求6至8任一项所述的抓取目标图片的装置,其特征在于,所述错误资源参数包括所述目标图片的标识码。10.根据权利要求9所述的抓取目标图片的装置,其特征在于,所述源地址获取单元,适于根据所述目标图片的标识码从所述图片源地址表中查找对应的所述目标图片的源地址。
【专利摘要】抓取目标图片的方法及装置,所述方法包括:当用户在客户端打开图片显示页访问本地目标图片时,若根据所述目标图片的加载链接包含的本地图片路径无法加载所述目标图片,则获取错误资源参数;参照所述错误资源参数从图片源地址表中获得所述目标图片的源地址;其中,所述图片源地址表存储了所述错误资源参数以及对应的所述目标图片的源地址;根据所述目标图片的源地址从目标站点服务器下载所述目标图片,并按所述本地图片路径存储当前下载的目标图片。上述方案可节省网络资源和存储资源。
【IPC分类】G06F17/30
【公开号】CN105447093
【申请号】CN201510756249
【发明人】汤奇峰, 王万宝
【申请人】上海晶赞科技发展有限公司
【公开日】2016年3月30日
【申请日】2015年11月9日
当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1