均衡第三方应用个性化服务和用户隐私信息安全的方法

文档序号:7817606阅读:241来源:国知局
均衡第三方应用个性化服务和用户隐私信息安全的方法
【专利摘要】本发明公开了一种均衡第三方应用个性化服务和用户隐私信息安全的方法。本方法为:1)用户在本地安装一客户端软件,将设置的个人安全偏好配置信息发送给服务器;2)服务器根据该用户的个人安全偏好配置计算用户类型,并分配用户ID发送给该客户端软件;3)该用户访问网站时,该客户端软件截断该访问中的第三方应用HTTP请求,并将该用户ID、URL发送给服务器;4)服务器查找该Web网站的ID和类型,对应的第三方应用的历史信息,生成一推荐名单返回给该客户端软件;5)该客户端软件根据该用户的设置允许相应的第三方应用HTTP请求通过,访问相应的第三方应用服务器。该方法采取评分机制推荐第三方应用,帮助用户直观地决策。
【专利说明】均衡第三方应用个性化服务和用户隐私信息安全的方法

【技术领域】
[0001] 本发明涉及一种用于在保证用户的隐私信息受到最小威胁的情况下,最大化的使 用第三方应用提供的个性化服务的方法,尤其涉及一种基于Web网站类型与第三方应用类 型构造的推荐方法,属于网络安全【技术领域】。

【背景技术】
[0002] 第三方应用通常以JavaScript脚本、Flash动画等方式存在于Web网站中,并为网 站和用户提供服务。按照所提供服务的内容不同,第三方应用可分为在线广告、分析服务、 社交网络、内容提供商、前端服务、托管平台等。在提供功能服务的同时,一些第三方应用会 搜集该网站用户的浏览历史、指纹标识等信息,从而分析得到用户的位置、兴趣、购买记录、 就业情况、财务状况、医疗状况等用户隐私信息,使得用户无隐私可言。
[0003] 不同类型的第三方应用所造成的隐私威胁程度不同,不同类型的Web网站涉及的 信息敏感程度也不同。普通的网络用户通常具备以下两个特点:首先,用户通常不具备专业 的网络安全知识,来判断网站的敏感程度和第三方应用的隐私威胁程度;其次,不同类型的 用户对隐私保护的需求有所不同。
[0004] 针对第三方应用导致的隐私泄露问题,目前存在的防御机制主要以屏蔽第三方应 用服务为手段,来阻止第三方应用追踪用户的行为,如Do Not Track头部机制、Opt-out Cookies机制、黑名单防御、No Cookie机制等。这些机制在保护用户的隐私信息的同时,却 牺牲了第三方应用的可用性,影响了用户体验。
[0005] 在某些情况下,并不是所有用户都愿意放弃个性化服务来保护自己的隐私信息。 比如,当用户浏览购物类网站时,该用户可能允许在线广告类的第三方应用获取其购买行 为,来为其提供精准的广告推荐。当然也存在某些情况,用户宁愿放弃个性化服务,也不愿 意泄露自己的隐私。例如,当用户浏览健康类网站时,该用户可能不希望被任何类型的第三 方应用对其进行追踪。
[0006] 总之,如何根据不同用户的隐私保护需求,在保证用户的隐私信息受到最小威胁 的情况下,最大化的使用第三方应用提供的个性化服务,是网络安全领域的重要研究内容。


【发明内容】

[0007] 针对现有技术存在的技术问题,本发明的目的是提供一种均衡第三方应用个性化 服务和用户隐私信息安全的方法;本发明基于协同过滤算法和效用算法混合推荐方法,在 保证普通用户的隐私信息受到最小威胁的情况下,最大化的使用第三方应用提供的个性化 服务。本发明的技术方案为:
[0008] -种均衡第三方应用个性化服务可用性和用户隐私信息保密性的方法,分为客户 端和服务器两个部分:1)客户端以浏览器插件的形式存在,用以拦截浏览器向服务器端发 送用户信息的HTTP请求,并根据服务器的第三方应用推荐名单,有选择性的允许用户信息 请求数据包通过;2)服务器则根据用户的个人偏好设置、用户所访问的网站类型以及网站 中第三方应用的类型,为用户提供第三方应用的推荐名单。
[0009] 客户端的工作步骤为:
[0010] 1.用户初始化其个人安全偏好配置信息。
[0011] 2.当用户浏览Web网站时,客户端截断该HTTP请求,并向服务器端发送该网站的 URL和用户个人安全偏好配置信息。
[0012] 3.服务器根据客户端发送的用户信息,通过查询后台数据库,获得该网站的第三 方应用的推荐列表,并返回给客户端。
[0013] 4.客户端允许访问该网站的HTTP请求通过,然后获得该网站的HTML文件。
[0014] 5.浏览器解析该HTML文件,获得一系列发送给第三方应用的HTTP请求包,客户端 拦截这些请求包,并根据服务器返回的推荐名单,允许对应第三方应用的请求通过。对于不 在推荐名单中的第三方应用,则拒绝其请求通过。
[0015] 6.用户浏览器访问推荐名单中的第三方应用的个性化服务器,第三方应用的服务 器将完整的页面发送给浏览器,浏览器解析后呈现给用户。
[0016] 推荐名单的决策过程完全在服务器端执行,服务器端包含网站分类和推荐两大模 块:
[0017] 1)在网站分类模块中,服务器端使用爬虫工具获取网站数据和第三方应用的数 据,使用数据挖掘算法将其自动分类,将网站的类别、第三方应用类别、网站与第三方应用 的对应关系存放在数据库中,以便推荐模块使用。
[0018] 2)在推荐模块中,使用基于协同过滤与基于效用的混合推荐算法,为用户提供推 荐列表。当用户基数较少时,使用基于效用的推荐算法,解决用户通常因为不具备专业的网 络安全知识,对许多网站的敏感程度和第三方应用的隐私威胁程度难以判断的问题。根据 用户访问网站的类型和该网站中第三方应用的类型,采取评分机制评测第三方应用的隐私 威胁程度,帮助用户决策或为用户自动推荐;当用户基数达到一定程度时,使用基于协同过 滤的推荐算法,解决不同类型的用户对隐私保护的需求有所不同的问题,根据与用户类型 相似的用户对第三方应用隐私威胁的打分情况,评测该第三方应用相对于该用户的隐私威 胁分数,帮助用户决策或为用户自动推荐。
[0019] 本发明的积极效果为:
[0020] 本发明首次提出了一种基于推荐系统的用以平衡第三方应用个性化服务及其隐 私威胁的方法。首先,该方法采取评分机制推荐第三方应用,帮助用户直观地决策。其次, 该方法采用基于协同过滤和基于效用的混合推荐方式,既可以帮助普通不具备专业网络安 全知识的用户正确决策,又可以满足不同安全要求的用户的个性化需求。同一网站中的第 三方应用对不同需求的用户的隐私威胁分数不同,真正做到用户对自己的隐私数据完全可 控,填补了当前第三方追踪防御领域中个性化防御的空白。

【专利附图】

【附图说明】
[0021] 图1为本发明方法的服务器端系统框架图。
[0022] 图2为本发明方法的使用流程图。

【具体实施方式】
[0023] 下面结合附图分别详细描述本发明的【具体实施方式】。本方法中服务器端的系统框 架参见图1。
[0024] 服务器端运行流程如下:
[0025] 1.服务器端利用网络爬虫抓取大量的网站,获得这些网站的原始数据以及在这些 网站中相应的第三方应用的原始数据。这些数据包括网站的Title、Meta Keywords、Meta Description、HREF标签值等其它信息。
[0026] 2.对原始数据进行数据清理,顺序如下:翻译非英语数据为英语、转换成小写单 词、分词、去除停用词。
[0027] 3.利用这些数据,使用数据挖掘的分类算法对所获得的网站和第三方应用进行自 动化的分类,得到网站类型和第三方应用的类型,并为这些类型划分隐私威胁严重级别。
[0028] 根据对隐私威胁程度的不同,将网站类型分为如下三个等级(F-Type):
[0029] a)等级A :银行,在线购物,在线付款,健康医疗;
[0030] b)等级B :社交网络,博客,电子邮件;
[0031] c)等级C:其他;
[0032] 其中等级1中的网站类别需要最多的保护,而等级3中的网站类别需要最少的保 护。
[0033] 第三方应用类别分为如下三个等级(T-Type):
[0034] a)等级1 :托管平台,内容提供服务;
[0035] b)等级2 :广告公司,分析服务,前端服务;
[0036] c)等级3 :社交网络;
[0037] 其中等级1的第三方应用类别被认为最安全,而等级3中的第三方应用类别被认 为最有威胁。
[0038] 4.基于每个用户的个人设置,根据用户所访问的网站的类型以及该网站中所包含 的第三方应用的类型,为该用户提供推荐列表。该推荐模块的后台数据库中包含五张表:
[0039] a)网站信息表:记录网站的类型信息。
[0040] b)第三方应用信息表:记录第三方应用的类型信息。
[0041] c)用户隐私偏好表:记录用户的安全等级(U-Type)的设置信息,包括强、中、弱三 个级别。
[0042] d)网站与第三方应用对应关系表:记录网站与第三方应用的对应关系信息,即记 录每个网站中包含哪些第三方应用,并以成对方式记录。如网站F中包含多个第三方应用 Tl,T2, T3,则作为三条记录(f,t),(f,t2),(f,t3)记录在该表中。
[0043] e)用户打分情况表:记录每一用户的为网站与第三方应用关系对(f,t)打分的历 史记录。其中"〇"为阻止,"1"为允许。
[0044] 5.当"用户打分情况表"中对某个"网站与第三方应用关系对"打分的用户数目 |U|小于等于系统设置的阈值Μ时,推荐模块使用基于效用的推荐算法为用户提供推荐列 表。基于效用的推荐算法的计算方法如公式(1)所示:
[0045]

【权利要求】
1. 一种均衡第三方应用个性化服务和用户隐私信息安全的方法,其步骤为: 1) 用户U在本地安装一客户端软件,并通过客户端软件将设置的个人安全偏好配置信 息发送给服务器; 2) 服务器根据该用户u的个人安全偏好配置信息计算用户类型,记作utype,记录在服 务器的用户隐私偏好表中,并为该用户u分配用户ID,记作uid,发送给该客户端软件; 3) 该用户u访问Web网站时,该客户端软件截断该访问中的第三方应用HTTP请求,并 将该用户u的uid、该Web网站的URL发送给服务器; 4) 服务器在其后台数据库中查找该Web网站的网站ID和网站类型,以及所述第三方应 用HTTP请求对应的第三方应用的历史信息;然后根据该用户u的用户类型,该Web网站的 网站类型,以及所述历史信息生成一推荐名单返回给该客户端软件; 5) 该客户端软件根据该用户u的设置允许相应的第三方应用HTTP请求通过,访问相应 的第三方应用服务器。
2. 如权利要求1所述的方法,其特征在于所述后台数据库的建立方法为: 21) 所述服务器利用网络爬虫抓取多个网站的数据及网站中的第三方应用的数据; 22) 对所抓取的数据进行分类,得到网站类型ftype和第三方应用的类型ttype,并将 这些类型划分隐私威胁严重级别,建立记录网站类型的网站信息表,记录第三方应用类型 的第三方应用信息表,以及网站与第三方应用对应关系表; 23) 记录用户为网站与第三方应用关系对打分的历史记录,得到一用户打分情况表。
3. 如权利要求2所述的方法,其特征在于服务器采用基于效用的方法生成所述推荐名 单: 31) 服务器在所述网站和第三方应用对应表中查找该用户u所访问Web网站中的所有 第三方应用,得到该Web网站与其中第三方应用的关系对集合记作S (fid,tid),其中tid为 第三方应用,fid为该Web网站; 32) 服务器在所述用户打分情况表中查找为关系对集合S(fid,tid)打过分的用户集合 U,该用户集合中元素的个数记作|U|,关系对(fid,tid)的打分值记作r (fi4tid),其中,允许访 问对应的打分为1 ;则为关系对打分(fid,tid)为1的用户数量为|U(r(fid,tid) = 1) | ; 33) 根据公式
为关系对集合S(fid,tid)中的每一关系对汴(1,^(1),计算该用户11的推荐值?11^"(1),生成 所述推荐名单。
4. 如权利要求3所述的方法,其特征在于当|U| < Μ时,服务器采用基于效用的方法生 成所述推荐名单;其中,Μ为设定的阈值。
5. 如权利要求2所述的方法,其特征在于服务器采用基于协同过滤的算法生成所述推 荐名单: 51) 服务器在所述网站和第三方应用对应表中查找该用户u所访问Web网站中的所有 第三方应用,得到该Web网站与其中第三方应用的关系对集合记作S (fid,tid),其中tid为 第三方应用,fid为该Web网站; 52) 服务器在所述用户打分情况表中查找该用户u所有的打分记录集合,记作 Ru(ftid, value);其中ftid用来标识关系对(fid, tid),value不为空; 53) 对用户集合U中的每一个用户,记作um,l彡m彡|U|,查找用户^所有的打分记录 集合,记作|U|为关系对集合S(fid,tid)打过分的用户集合U中元素的个 数; 54) 对 Ru(ftid, value)和 Λ~(/?·Μ,νο/Μβ)的 ftid 值求交集 T,记为 Λ ),其中valueu为用户u对关系对ftid的打分值,为用户um对 关系对ftid的打分值; 55) 根据 Λ ,计算:

56) 对于β (//W,vc//weu,vi//i?^)的每个关系对ftid,用户u为ftid的打分值记作 ru, ftid,计算 丨《 和'《?、侃 57) 计算对用户集合U中的每一个用户um与用户u的相关系数corr(u,um); 58) 为关系对集合S(fid,tid)中的每一关系对(fid,tid),计算为用户u的推荐值
fe成所述推荐名单。
6. 如权利要求5所述的方法,其特征在于所述相关系数的计算公式为:
7. 如权利要求5所述的方法,其特征在于当|U| > Μ时,服务器采用基于协同过滤的算 法生成所述推荐名单;其中,Μ为设定的阈值。
8. 如权利要求1所述的方法,其特征在于所述客户端软件为一浏览器插件。
9. 如权利要求1所述的方法,其特征在于用户在本地主机设置保护模式:自动保护模 式或手动保护模式;当保护模式为自动保护模式时,如果第三方应用HTTP请求对应的第三 方应用的推荐值大于设定值,则该客户端软件直接允许该第三方应用HTTP请求通过;如果 保护模式为手动保护模式,则由用户判断是否允许相应的第三方应用HTTP请求通过。
【文档编号】H04L29/06GK104301323SQ201410574968
【公开日】2015年1月21日 申请日期:2014年10月23日 优先权日:2014年10月23日
【发明者】刘奇旭, 武倩如, 张玉清 申请人:中国科学院大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1