一种网页数据的搜集方法以及装置的制造方法

文档序号:9597842阅读:330来源:国知局
一种网页数据的搜集方法以及装置的制造方法
【技术领域】
[0001]本发明涉及互联网技术领域,尤其涉及一种网页数据的搜集方法以及装置。
【背景技术】
[0002]在现有技术中,浏览器通常可以通过cookie或localstorage的方式将网页数据存储在浏览器中,即只有使用该浏览器时,才能访问所存储的网页数据。但是,由于浏览器所请求的网页的网页制作人员可以是任何人,包括恶意攻击者。所以,一旦用户在不知情的情况下请求了恶意攻击者所制作的网页时,就有可能被恶意攻击者利用嵌入在网页中的客户端脚本去访问接口,威胁到用户的数据安全。所以,为了保护用户的数据安全,浏览器必须与设备之间相对独立。也因为如此,通过cookie或localstorage的方式存储的数据只能存储在本浏览器中。当用户重装了浏览器或者使用另一个浏览器时,例如使用其他设备上安装的浏览器时,原来存储的数据都无法进行访问,给用户带来使用的不便。

【发明内容】

[0003]本发明实施例所要解决的技术问题在于,提供一种网页数据的搜集方法以及装置,实现了所搜集的特定数据信息能够在重装了浏览器或者通过另一个浏览器登录时都能进行访问。
[0004]第一方面,本发明实施例提供了一种网页数据的搜集方法,所述方法应用于浏览器,所述方法包括:确定所述浏览器当前正在访问的网页是否需要进行数据搜集;如果是,在所述当前正在访问的网页脚本中插入数据搜集脚本,以通过运行所述数据搜集脚本获取当前正在访问的网页的特定数据信息;接收所述数据搜集脚本获取的所述特定数据信息,调用上传接口将所述特定数据信息同步到服务器中或者调用本地读写接口将所述特定数据信息存储在本地。
[0005]可选地,所述浏览器中设置有数据扩展;在所述确定所述浏览器当前正在访问的网页是否需要进行数据搜集前,所述方法还包括:运行所述浏览器中设置的所述数据扩展,从而通过所述数据扩展执行所述确定所述浏览器当前正在访问的网页是否需要进行数据搜集,如果是,在所述当前正在访问的网页脚本中插入数据搜集脚本,以通过运行所述数据搜集脚本获取当前正在访问的网页的特定数据信息,接收所述数据搜集脚本获取的所述特定数据信息,调用上传接口将所述特定数据信息同步到服务器中或者调用本地读写接口将所述特定数据信息存储在本地的步骤。
[0006]可选地,所述确定所述浏览器当前正在访问的网页是否需要进行数据搜集的步骤包括:根据预先设定的数据搜集规则对当前正在访问的网页进行匹配,如果匹配,确定需要对当前正在访问的网页进行数据搜集。
[0007]可选地,所述数据搜集规则为:如果当前正在访问的网页的统一资源定位符URL地址包含设定的字符,则对所述浏览器当前正在访问的网页进行数据搜集;或,如果当前正在访问的网页的题目包含设定的关键字,则对所述浏览器当前正在访问的网页进行数据搜集;或,如果当前正在访问的网页的内容包含设定的关键字,则对所述浏览器当前正在访问的网页进行数据搜集。
[0008]可选地,所述特定数据信息包括图片、视频缩略图、网页文本内容、网页关键字、网页标题和超链接中的至少一种。
[0009]可选地,所述调用上传接口将所述特定数据信息同步到服务器中包括:调用上传接口将所述特定数据信息和用户登录所述浏览器的个人账户所使用的账号信息发送给服务器,以使所述服务器关联存储所述特定数据信息和所述用户登录所述浏览器的个人账户所使用的账号信息。
[0010]可选地,所述方法还包括,在用户通过账号信息登录所述浏览器的个人账户时,将所述账号信息发给服务器;接收所述服务器根据所述账号信息查找到的、与所述账号信息关联的特定数据信息。
[0011]第二方面,本发明实施例提供了一种网页数据的搜集装置,所述装置应用于浏览器,包括:确定模块,用于确定所述浏览器当前正在访问的网页是否需要进行数据搜集;收集模块,用于在确定所述浏览器当前正在访问的网页需要进行数据搜集时,在所述当前正在访问的网页脚本中插入数据搜集脚本,以通过运行所述数据搜集脚本获取当前正在访问的网页的特定数据信息;存储模块,用于接收所述数据搜集脚本获取的所述特定数据信息,调用上传接口将所述特定数据信息同步到服务器中或者调用本地读写接口将所述特定数据信息存储在本地。
[0012]可选地,所述装置被设置为安装于所述浏览器中的数据扩展,所述数据扩展包括所述确定模块、所述收集模块和所述存储模块;所述浏览器运行所述数据扩展,从而通过所述数据扩展的所述确定模块确定所述浏览器当前正在访问的网页是否需要进行数据搜集,在所述确定模块确定需要进行数据收集时,所述收集模块在所述当前正在访问的网页脚本中插入数据搜集脚本,以通过运行所述数据搜集脚本获取当前正在访问的网页的特定数据信息,所述存储模块接收所述数据搜集脚本获取的所述特定数据信息,调用上传接口将所述特定数据信息同步到服务器中或者调用本地读写接口将所述特定数据信息存储在本地。
[0013]可选地,所述确定模块具体用于根据预先设定的数据搜集规则对当前正在访问的网页进行匹配,如果匹配,确定需要对当前正在访问的网页进行数据搜集。
[0014]可选地,所述数据搜集规则为:如果当前正在访问的网页的统一资源定位符URL地址包含设定的字符,则对所述浏览器当前正在访问的网页进行数据搜集;或,如果当前正在访问的网页的题目包含设定的关键字,则对所述浏览器当前正在访问的网页进行数据搜集;或,如果当前正在访问的网页的内容包含设定的关键字,则对所述浏览器当前正在访问的网页进行数据搜集。
[0015]可选地,所述特定数据信息包括图片、视频缩略图、网页文本内容、网页关键字、网页标题和超链接中的至少一种。
[0016]可选地,所述存储模块具体用于调用上传接口将所述特定数据信息和用户登录所述浏览器的个人账户所使用的账号信息发送给服务器,以使所述服务器关联存储所述特定数据信息和所述用户登录所述浏览器的个人账户所使用的账号信息。
[0017]可选地,所述装置还包括:发送模块,用于在用户通过账号信息登录所述浏览器的个人账户时,将所述账号信息发给服务器;接收模块,用于接收所述服务器根据所述账号信息查找到的、与所述账号信息关联的特定数据信息。
[0018]本发明实施例在确定浏览器当前正在访问的网页需要进行数据搜集时,通过在正在访问的网页脚本中插入数据搜集脚本以获取当前正在访问的特定数据信息。由于本实施方式中的浏览器能够调用上传接口以及本地接口,所以,能够将数据搜集脚本获取到的特定数据信息通过上传接口同步到服务器中,或者通过本地读写接口将特定数据信息存储在本地中。即使用户重装了浏览器或者通过其他浏览器登录,也能从服务器或本地中读取到特定数据信息。
【附图说明】
[0019]为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0020]图1是本发明网页数据的搜集方法一实施方式的流程图;
[0021]图2是本发明网页数据的搜集方法另一实施方式的流程图;
[0022]图3是本发明网页数据的搜集装置一实施方式的结构示意图;
[0023]图4是本发明网页数据的搜集装置另一实施方式的结构示意图。
【具体实施方式】
[0024]下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0025]需要说明的是,在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
[0026]参见图1,图1是本发明网页数据的搜集方法一实施方式的流程图。本实施方式的网页数据的搜集方法包括:
[0027]110:确定浏览器当前正在访问的网页是否需要进行数据搜集。
[0028]具体地,在本发明的另一个实施例中,本步骤中,可根据预先设定的数据搜集规则对当前正在访问的网页进行匹配,如果匹配,则确定需要对当前正在访问的网页进行数据搜集,如果不匹配,则确定不需要对当前正在访
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1