搜索结果页面的图片适应性处理的方法、装置和服务器的制造方法_6

文档序号:9818305阅读:来源:国知局
即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0242]另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
[0243]所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(R0M,Read-0nly Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0244]以上所述,仅为本发明的【具体实施方式】,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围以所述权利要求的保护范围为准。
【主权项】
1.一种搜索结果页面的图片适应性处理的方法,其特征在于,包括: 获取搜索结果的页面数据,所述搜索结果的页面数据是根据用户在特定应用发出的搜索请求所获取的; 根据预设的抓取规则,从所述搜索结果的页面数据中确定与所述特定应用对应的目标图片,并获取所述目标图片的链接信息; 根据所述目标图片的链接信息,抓取所述目标图片; 根据所述目标图片的链接信息中记录的所述目标图片的缩略尺寸和图片剪裁方式,对所述目标图片进行缩略剪裁操作,得到与所述特定应用的页面显示相适应的缩略图。2.根据权利要求1所述的方法,其特征在于,根据预设的抓取规则,从所述搜索结果的页面数据中确定与所述搜索结果对应的目标图片,包括: 从所述搜索结果的页面数据中提取各个图片的尺寸信息和所述图片在搜索结果页面的位置信息; 确定所述图片尺寸信息符合预设尺寸范围且所述图片在搜索结果页面的位置信息在预设网页位置的图片为待抓取图片; 将预设的过滤图片列表中未记录的所述待抓取图片确定为目标图片。3.根据权利要求1或者2所述的方法,其特征在于,在根据预设的抓取规则,从所述搜索结果的页面数据中确定与所述特定应用对应的目标图片,并获取所述目标图片的链接信息之后,所述方法还包括: 根据所述链接信息中携带的公钥,确定与所述公钥对应的私钥; 通过确定的所述私钥对所述链接信息中携带的所述目标图片的地址信息进行加密操作,生成签名验证信息; 当生成的所述签名验证信息与所述目标图片携带的数字签名相一致时,执行抓取所述目标图片步骤。4.根据权利要求1所述的方法,其特征在于,根据目标图片的链接信息,抓取所述目标图片,包括: 根据目标图片的链接信息中携带的地址信息,判断在预设抓取时间长度内是否有相同的所述目标图片已经进行了抓取操作; 如果否,则通过网络爬虫抓取所述目标图片。5.根据权利要求1或者4所述的方法,其特征在于,根据目标图片的链接信息,抓取所述目标图片,包括: 当所述目标图片抓取失败时,判断距离最近一次抓取所述目标图片的时长是否达到预设时间长度; 如果是,则当抓取失败的所述目标图片的重复抓取次数未达到预设阈值时,从预设的代理标识列表中获取代理标识,代理标识用于指示代理服务器或者代理进程; 利用网络爬虫,通过获取到的代理标识对应的代理服务器或者代理进程,对抓取失败的所述目标图片进行重新抓取。6.根据权利要求1所述的方法,其特征在于,在根据目标图片的链接信息,抓取所述目标图片之后,所述方法还包括: 当通过网络爬虫抓取到所述目标图片时,获取当前各个存储服务器的负载信息; 根据所述各个存储服务器的负载信息,从所述各个存储服务器中确定出负载最小的存储服务器; 将抓取到的所述目标图片发送到所述负载最小的存储服务器进行存储。7.根据权利要求6所述的方法,其特征在于,当通过网络爬虫抓取到目标图片时,获取当前存储服务器集群中各个存储服务器的负载信息,包括: 获取所述网络爬虫抓取到的所述目标图片; 对抓取到的所述目标图片的图片地址进行哈希计算,得到图片链接哈希值; 生成所述目标图片和对应图片链接哈希值的对应关系,并将生成的目标图片和对应图片链接哈希值的对应关系存储到过滤图片列表中。8.根据权利要求1或7所述的方法,其特征在于,所述方法还包括: 获取预设清理图片时长内被访问过的图片链接哈希值; 将获取到的图片链接哈希值与所述过滤图片列表中记录的图片链接哈希值进行对比,得到预设清理图片时长内未被访问过的图片链接哈希值; 通过所述目标图片和对应图片链接哈希值的对应关系和所述未被访问过的图片链接哈希值,查找出预设清理图片时长内未被访问过的图片链接哈希值对应的图片进行删除。9.一种搜索结果页面的图片适应性处理的装置,其特征在于,包括: 数据获取模块,用于获取搜索结果的页面数据,所述搜索结果的页面数据是根据用户在特定应用发出的搜索请求所获取的; 目标图片确定模块,用于根据预设的抓取规则,从所述搜索结果的页面数据中确定与所述特定应用对应的目标图片,并获取所述目标图片的链接信息; 抓取模块,用于根据所述目标图片的链接信息,抓取所述目标图片; 缩略裁剪模块,用于根据所述目标图片的链接信息中记录的所述目标图片的缩略尺寸和图片剪裁方式,对所述目标图片进行缩略剪裁操作,得到与所述特定应用的页面显示相适应的缩略图。10.根据权利要求9所述的装置,其特征在于,所述目标图片确定模块,包括: 图片信息提取单元,用于从所述搜索结果的页面数据中提取各个图片的尺寸信息和所述图片在搜索结果页面的位置信息; 确定单元,用于确定所述图片尺寸信息符合预设尺寸范围且所述图片在搜索结果页面的位置信息在预设网页位置的图片为待抓取图片; 图片过滤单元,用于将预设的过滤图片列表中未记录的所述待抓取图片确定为目标图片。11.根据权利要求9或者10所述的装置,其特征在于,所述装置还包括: 私钥确定单元,用于根据所述链接信息中携带的公钥,确定与所述公钥对应的私钥; 加密单元,用于通过确定的所述私钥对所述链接信息中携带的所述目标图片的地址信息进行加密操作,生成签名验证信息; 执行单元,用于当生成的所述签名验证信息与所述目标图片携带的数字签名相一致时,触发抓取模块抓取所述目标图片。12.根据权利要求9所述的装置,其特征在于,所述抓取模块,包括: 第一判断单元,用于根据目标图片的链接信息中携带的地址信息,判断在预设抓取时间长度内是否有相同的所述目标图片已经进行了抓取操作; 抓取单元,用于当第一判断单元得到的判断结果为否时,则通过网络爬虫抓取所述目标图片。13.根据权利要求9或者12所述的装置,其特征在于,所述抓取模块,还包括: 第二判断单元,用于当所述目标图片抓取失败时,判断距离最近一次抓取所述目标图片的时长是否达到预设时间长度; 代理获取单元,用于当第二判断单元得到的判断结果为是时,当抓取失败的所述目标图片的重复抓取次数未达到预设阈值时,从预设的代理标识列表中获取代理标识,代理标识用于指示代理服务器或者代理进程; 重抓单元,用于利用所述网络爬虫,通过获取到的代理标识对应的代理服务器或者代理进程,对抓取失败的所述目标图片进行重新抓取。14.根据权利要求9所述的装置,其特征在于,所述装置还包括: 负载信息获取模块,用于当通过网络爬虫抓取到所述目标图片时,获取当前各个存储服务器的负载信息; 存储服务器确定模块,用于根据所述各个存储服务器的负载信息,从所述各个存储服务器中确定出负载最小的存储服务器; 存储模块,用于将抓取到的所述目标图片发送到所述负载最小的存储服务器进行存储。15.根据权利要求14所述的装置,其特征在于,所述负载信息获取模块,包括: 图片获取单元,用于获取所述网络爬虫抓取到的所述目标图片; 计算单元,用于对抓取到的所述目标图片的图片地址进行哈希计算,得到图片链接哈希值; 存储单元,用于生成所述目标图片和对应图片链接哈希值的对应关系,并将生成的目标图片和对应图片链接哈希值的对应关系存储到过滤图片列表中。16.根据权利要求9或15所述的装置,其特征在于,所述装置还包括: 图片哈希值获取模块,用于获取预设清理图片时长内被访问过的图片链接哈希值; 对比模块,用于将获取到的图片链接哈希值与所述过滤图片列表中记录的图片链接哈希值进行对比,得到预设清理图片时长内未被访问过的图片链接哈希值; 未访问图片删除模块,用于通过所述目标图片和对应图片链接哈希值的对应关系和所述未被访问过的图片链接哈希值,查找出预设清理图片时长内未被访问过的图片链接哈希值对应的图片进行删除。17.一种服务器,其特征在于,所述服务器包括:处理器和接收器; 所述接收器,用于接收搜索结果的页面数据,所述搜索结果的页面数据是根据用户在特定应用发出的搜索请求所获取的; 所述处理器,用于根据预设的抓取规则,从所述搜索结果的页面数据中确定与所述特定应用对应的目标图片,并获取所述目标图片的链接信息;根据所述目标图片的链接信息,抓取所述目标图片;根据所述目标图片的链接信息中记录的所述目标图片的缩略尺寸和图片剪裁方式,对所述目标图片进行缩略剪裁操作,得到与所述特定应用的页面显示相适应的缩略图。
【专利摘要】本发明提供了一种搜索结果页面的图片适应性处理的方法、装置和服务器,所述方法包括:获取搜索结果的页面数据,所述搜索结果的页面数据是根据用户在特定应用发出的搜索请求所获取的;根据预设的抓取规则,从搜索结果的页面数据中确定与特定应用对应的目标图片,并获取目标图片的链接信息;根据目标图片的链接信息,抓取目标图片;根据目标图片的链接信息中记录的目标图片的缩略尺寸和图片剪裁方式,对目标图片进行缩略剪裁操作,得到与特定应用的页面显示相适应的缩略图。通过本发明,可以抓取适应不同应用的图片展示尺寸的图片并进行展示,提高了图片在不同应用上的展示效果。
【IPC分类】G06F17/30
【公开号】CN105589943
【申请号】CN201510945858
【发明人】卢申朋
【申请人】广州神马移动信息科技有限公司
【公开日】2016年5月18日
【申请日】2015年12月15日
当前第6页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1