防止网页跟踪的系统及方法

文档序号:7551720阅读:357来源:国知局
专利名称:防止网页跟踪的系统及方法
技术领域
本发明涉及网络数据安全领域,特别涉及一种防止网页跟踪的系统及方法。
背景技术
目前,很多网站都使用了网页跟踪技术,如在线广告平台(如淘宝联盟)和大型社交网站,通过根据用户的上网行为,记录用户的上网数据,挖掘用户喜好,精确投递广告或提供定制服务。然而用户的隐私数据也在不知不觉中被第三方平台记录,从而留下用户信息被滥用的隐患。尤其对机构而言,如果一个机构(如企业、政府或者军事机构)的上网行为被第三方跟踪记录,从这些数据中就可能分析出该机构在做什么,甚至挖掘出商业机密、军事机密或国家机密,故很多时候用户是不希望被跟踪记录的。目前市场上,一些WEB浏览器提供了 Do Not Track(DNT)的功能,即在用户选择该功能后,会在HTTP的头部增加一个标识,以提示网站方或广告商拒绝被跟踪,然而是否跟踪还是取决于网站方或广告商,有时,网站方及广告商为了获取用户数据的分析,投放精准广告,而选择忽略该功能,如此依然可以继续跟踪用户。

发明内容
本发明要解决的技术问题在于,针对相关技术中的不足,提供一种防止网页跟踪的系统及方法,可有效防止用户的上网数据被跟踪。本发明解决上述技术问题所采用的技术方案是:提供一种防止网页跟踪的系统,该系统包括:一种防止网页跟踪的系统,包括:一设置模块,用于设置识别规则和拦截规则;一识别模块,用于侦测HTTP请求,并根据设置的识别规则,识别HTTP请求中是否包含有网页跟踪信息;一拦截模块,用于对所识别的包含有网页跟踪信息的HTTP请求通过拦截规则进行拦截处理,防止网页跟踪信息被发送至跟踪服务器。还提供一种防止网页跟踪的方法,包括:设置识别规则和拦截规则;侦测HTTP请求;根据设置的识别规则,识别包含有网页跟踪信息的HTTP请求;对所识别的包含有网页跟踪信息的HTTP请求通过拦截规则进行拦截处理,防止网页跟踪信息被发送至跟踪服务器。本发明的有益效果是:通过预设的识别规则确定HTTP请求中是否包含网页跟踪信息,若包含,则拦截该HTTP请求,从而防止该网页跟踪信息被传输至跟踪服务器,有效的防止用户数据被跟踪。


下面将结合附图及实施例对本发明作进一步说明,附图中:
图1为本发明一实施方式中的防止网页跟踪的系统的模块及该系统运行环境示意图;图2为本发明一实施方式中的防止网页跟踪方法的流程图。
具体实施例方式以下结合具体实施例和说明书附图对本发明做进一步详细说明。如图1所示,为本发明一实施方式中的防止网页跟踪的系统I的模块及该系统I运行环境示意图。该系统I包括设置模块11、识别模块12及拦截模块13。该系统I可独立运行于一电子装置2,也可附加于一网络系统,如防火墙。该电子装置2可通过有线或者无线的方式连接至至少一追踪服务器3。该设置模块11设置至少一识别规则及一拦截规则。该识别规则用于识别超文本传输协议(HTTP)请求中是否包含网页跟踪信息。该识别规则包括至少一关键字。本实施方式中,该关键字为超文本传输协议(HTTP)请求中的统一资源定位符(URL)中的特定字符串,该特定字符串用于标识该HTTP请求中具有网页跟踪信息。目前的网页跟踪服务工具,如谷歌的谷歌分析(Google Analytic)及百度的百度统计,可在网站中加入一个收集代码,当用户在访问该网站时,该收集代码在浏览器中执行,动态插入一个脚本文件链接,该链接指向一存储于该跟踪服务器3的脚本文件,浏览器通过该文件链接向跟踪服务器3请求该脚本文件,同时会携带一个用于记录用户关键字(ID)的跟踪Cookie,所请求的脚本文件在该浏览器中 执行,收集用户信息,如当前浏览网页的标题、上一跳网页的URL、当前网页的Cookie等。浏览器将所收集的信息编码到URL中的HTTP参数中,该URL指向跟踪服务器中的一个透明的图片,然后生成一个包括该URL及跟踪Cookie的HTTP请求,该URL中包括的网页跟踪信息及跟踪Cookie中的数据即为该HTTP请求中包含的网页跟踪信息,通过传输该HTTP请求即可将该HTTP请求中记录的网页跟踪信息传输至跟踪服务器3,从而实现对用户数据的收集。在该URL中具有一个标识该URL具有网页跟踪信息的代码,如在 URL “http://xxx.com/a.gif a=x&b=x” 中,前缀“http://xxx.com/a.gif” 即为标识该URL具有网页跟踪信息的关键字。每个跟踪服务器所设置的在URL中标识具有网页跟踪信息的字符串不同,故该设置模块11可预先将不同的跟踪服务工具标识具有网页跟踪信息的字符串收集存储作为关键字。在其他实施方式中,该关键字也可以为该HTTP请求中的cookie信息、头部信息或正文信息中的特定字符串,该特定字符串用于标识该HTTP请求含有网页跟踪信息。该识别模块12用于侦测HTTP请求,并根据设置的识别规则,识别HTTP请求中是否包含有网页跟踪信息。该识别模块12确定与该关键字匹配的HTTP请求为包含有网页跟踪信息的HTTP请求。在该在确定与该关键字匹配的HTTP请求时,可以为关键字的精确匹配,也可为针对该关键字的正则表达式匹配。本实施方式中,该识别模块12可通过确定该URL中是否包括设置的关键字来确定与该关键字匹配的HTTP请求。在其他实施方式中,该识别模块12也可在该HTTP请求的其他部分,如cookie信息、头部信息或正文信息中确定与该关键字匹配的HTTP请求。该拦截模块13对所识别的包含有网页跟踪信息的HTTP请求通过拦截规则进行拦截处理,防止网页跟踪信息被发送至跟踪服务器。该拦截模块13对包含有网页跟踪信息的HTTP请求的拦截的处理方式包括:中止TCP连接、丢弃HTTP请求中的数据包、对HTTP请求中包含的网页跟踪信息进行清洗或替换或回复失败的HTTP应答码。如图2所示,为本发明一实施方式中的防止网页跟踪方法的流程图。在步骤S201中,该设置模块11设置识别规则及拦截规则。在步骤S202中,该识别模块12侦测HTTP请求。在步骤S203中,该识别模块12识别HTTP请求中是否包含有网页跟踪信息,若包含,则执行步骤S204,若不包含,则结束程序。在步骤S204中,该拦截模块13对所识别的包含有网页跟踪信息的HTTP请求通过拦截规则进行拦截处理,防止网页跟踪信息被发送至跟踪服务器3。以上所述仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干个改进和润饰,这些改进和润饰也应视为本发明的保护范围。
权利要求
1.一种防止网页跟踪的系统,包括: 一设置模块,用于设置识别规则和拦截规则; 一识别模块,用于侦测HTTP请求,并根据设置的识别规则,识别HTTP请求中是否包含有网页跟踪信息; 一拦截模块,用于对所识别的包含有网页跟踪信息的HTTP请求通过拦截规则进行拦截处理,防止网页跟踪信息被发送至跟踪服务器。
2.根据权利要求1所述的防止网页跟踪系统,其特征在于,该识别规则包括至少一关键字,该识别模块确定与该关键字匹配的HTTP请求为包含有网页跟踪信息的HTTP请求。
3.根据权利要求2所述的防止网页跟踪系统,其特征在于,该关键字为HTTP请求中的URL地址信息中的特定字符串,该特定字符串用于标识该HTTP请求含有网页跟踪信息,该识别模块侦测到HTTP请求时,若判断该HTTP请求的URL地址信息中包含该关键字,则确定该HTTP请求为与该关键字匹配的HTTP请求。
4.根据权利要求2所述的防止网页跟踪系统,其特征在于,该关键字为该HTTP请求中的cookie信息、头部信息或正文信息中的特定字符串,该特定字符串用于标识该HTTP请求含有网页跟踪信息,该识别模块侦测到HTTP请求时,若判断该HTTP请求的cookie信息、头部信息或正文信息中包含该关键字,则确定该HTTP请求为与该关键字匹配的HTTP请求。
5.根据权利要求1所述的防止网页跟踪系统,其特征在于,该拦截模块通过该拦截规则对包含有网页跟踪信息的HTTP请求的拦截处理方式包括:中止TCP连接、丢弃HTTP请求中的数据包、对HTTP请求中包含的网页跟踪信息进行清洗或替换或回复失败的HTTP应答码。
6.一种防止网页跟踪 的方法,包括: 设置识别规则和拦截规则; 侦测HTTP请求; 根据设置的识别规则,识别包含有网页跟踪信息的HTTP请求; 对所识别的包含有网页跟踪信息的HTTP请求通过拦截规则进行拦截处理,防止网页跟踪信息被发送至跟踪服务器。
7.根据权利要求6所述的防止网页跟踪的方法,其特征在于,该识别规则为预设至少一关键字,在识别包含网页跟踪信息的HTTP请求的步骤中,确定与该关键字匹配的HTTP请求为包含有网页跟踪信息的HTTP请求。
8.根据权利要求7所述的防止网页跟踪方法,其特征在于,该关键字为HTTP请求中的URL地址信息中的特定字符串,该特定字符串用于标识该HTTP请求含有网页跟踪信息,在侦测到HTTP请求时,若判断该HTTP请求的URL地址信息中包含该关键字,则确定该HTTP请求为与该关键字匹配的HTTP请求。
9.根据权利要求7所述的防止网页跟踪方法,其特征在于,该关键字为该HTTP请求中的cookie信息、头部信息或正文信息中的特定字符串,该特定字符串用于标识该HTTP请求含有网页跟踪信息,在侦测到HTTP请求时,若判断该HTTP请求的cookie信息、头部信息或正文信息中包含该关键字,则确定该HTTP请求为与该关键字匹配的HTTP请求。
10.根据权利要求6所述的防止网页跟踪方法,其特征在于,在对包含有网页跟踪信息的HTTP请求的拦截步骤中的拦截方式包括:中止TCP连接、丢弃HTTP请求中的数据包、对HTTP请求中包含的网页 跟踪信息进行清洗或替换或回复失败的HTTP应答码。
全文摘要
本发明涉及一种防止网页跟踪的系统及方法。该防止网页跟踪的系统包括一设置模块,用于设置识别规则和拦截规则;一识别模块,用于侦测HTTP请求,并根据设置的识别规则,识别HTTP请求中是否包含有网页跟踪信息;一拦截模块,用于对所识别的包含有网页跟踪信息的HTTP请求通过拦截规则进行拦截处理,防止网页跟踪信息被发送至跟踪服务器。使用本发明,可防止用户的上网信息被跟踪,从而保护用户的隐私信息。
文档编号H04L29/06GK103118024SQ20131003994
公开日2013年5月22日 申请日期2013年2月1日 优先权日2013年2月1日
发明者刘楠 申请人:深信服网络科技(深圳)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1