均衡第三方应用个性化服务和用户隐私信息安全的方法

文档序号：7817606阅读：241来源：国知局

均衡第三方应用个性化服务和用户隐私信息安全的方法
【专利摘要】本发明公开了一种均衡第三方应用个性化服务和用户隐私信息安全的方法。本方法为：1)用户在本地安装一客户端软件，将设置的个人安全偏好配置信息发送给服务器；2)服务器根据该用户的个人安全偏好配置计算用户类型，并分配用户ID发送给该客户端软件；3)该用户访问网站时，该客户端软件截断该访问中的第三方应用HTTP请求，并将该用户ID、URL发送给服务器；4)服务器查找该Web网站的ID和类型，对应的第三方应用的历史信息，生成一推荐名单返回给该客户端软件；5)该客户端软件根据该用户的设置允许相应的第三方应用HTTP请求通过，访问相应的第三方应用服务器。该方法采取评分机制推荐第三方应用，帮助用户直观地决策。
【专利说明】均衡第三方应用个性化服务和用户隐私信息安全的方法

【技术领域】
[0001] 本发明涉及一种用于在保证用户的隐私信息受到最小威胁的情况下，最大化的使用第三方应用提供的个性化服务的方法，尤其涉及一种基于Web网站类型与第三方应用类型构造的推荐方法，属于网络安全【技术领域】。

【背景技术】
[0002] 第三方应用通常以JavaScript脚本、Flash动画等方式存在于Web网站中，并为网站和用户提供服务。按照所提供服务的内容不同，第三方应用可分为在线广告、分析服务、社交网络、内容提供商、前端服务、托管平台等。在提供功能服务的同时，一些第三方应用会搜集该网站用户的浏览历史、指纹标识等信息，从而分析得到用户的位置、兴趣、购买记录、就业情况、财务状况、医疗状况等用户隐私信息，使得用户无隐私可言。
[0003] 不同类型的第三方应用所造成的隐私威胁程度不同，不同类型的Web网站涉及的信息敏感程度也不同。普通的网络用户通常具备以下两个特点：首先，用户通常不具备专业的网络安全知识，来判断网站的敏感程度和第三方应用的隐私威胁程度；其次，不同类型的用户对隐私保护的需求有所不同。
[0004] 针对第三方应用导致的隐私泄露问题，目前存在的防御机制主要以屏蔽第三方应用服务为手段，来阻止第三方应用追踪用户的行为，如Do Not Track头部机制、Opt-out Cookies机制、黑名单防御、No Cookie机制等。这些机制在保护用户的隐私信息的同时，却牺牲了第三方应用的可用性，影响了用户体验。
[0005] 在某些情况下，并不是所有用户都愿意放弃个性化服务来保护自己的隐私信息。比如，当用户浏览购物类网站时，该用户可能允许在线广告类的第三方应用获取其购买行为，来为其提供精准的广告推荐。当然也存在某些情况，用户宁愿放弃个性化服务，也不愿意泄露自己的隐私。例如，当用户浏览健康类网站时，该用户可能不希望被任何类型的第三方应用对其进行追踪。
[0006] 总之，如何根据不同用户的隐私保护需求，在保证用户的隐私信息受到最小威胁的情况下，最大化的使用第三方应用提供的个性化服务，是网络安全领域的重要研究内容。

【发明内容】

[0007] 针对现有技术存在的技术问题，本发明的目的是提供一种均衡第三方应用个性化服务和用户隐私信息安全的方法；本发明基于协同过滤算法和效用算法混合推荐方法，在保证普通用户的隐私信息受到最小威胁的情况下，最大化的使用第三方应用提供的个性化服务。本发明的技术方案为：
[0008] -种均衡第三方应用个性化服务可用性和用户隐私信息保密性的方法，分为客户端和服务器两个部分：1)客户端以浏览器插件的形式存在，用以拦截浏览器向服务器端发送用户信息的HTTP请求，并根据服务器的第三方应用推荐名单，有选择性的允许用户信息请求数据包通过；2)服务器则根据用户的个人偏好设置、用户所访问的网站类型以及网站中第三方应用的类型，为用户提供第三方应用的推荐名单。
[0009] 客户端的工作步骤为：
[0010] 1.用户初始化其个人安全偏好配置信息。
[0011] 2.当用户浏览Web网站时，客户端截断该HTTP请求，并向服务器端发送该网站的 URL和用户个人安全偏好配置信息。
[0012] 3.服务器根据客户端发送的用户信息，通过查询后台数据库，获得该网站的第三方应用的推荐列表，并返回给客户端。
[0013] 4.客户端允许访问该网站的HTTP请求通过，然后获得该网站的HTML文件。
[0014] 5.浏览器解析该HTML文件，获得一系列发送给第三方应用的HTTP请求包，客户端拦截这些请求包，并根据服务器返回的推荐名单，允许对应第三方应用的请求通过。对于不在推荐名单中的第三方应用，则拒绝其请求通过。
[0015] 6.用户浏览器访问推荐名单中的第三方应用的个性化服务器，第三方应用的服务器将完整的页面发送给浏览器，浏览器解析后呈现给用户。
[0016] 推荐名单的决策过程完全在服务器端执行，服务器端包含网站分类和推荐两大模块：
[0017] 1)在网站分类模块中，服务器端使用爬虫工具获取网站数据和第三方应用的数据，使用数据挖掘算法将其自动分类，将网站的类别、第三方应用类别、网站与第三方应用的对应关系存放在数据库中，以便推荐模块使用。
[0018] 2)在推荐模块中，使用基于协同过滤与基于效用的混合推荐算法，为用户提供推荐列表。当用户基数较少时，使用基于效用的推荐算法，解决用户通常因为不具备专业的网络安全知识，对许多网站的敏感程度和第三方应用的隐私威胁程度难以判断的问题。根据用户访问网站的类型和该网站中第三方应用的类型，采取评分机制评测第三方应用的隐私威胁程度，帮助用户决策或为用户自动推荐；当用户基数达到一定程度时，使用基于协同过滤的推荐算法，解决不同类型的用户对隐私保护的需求有所不同的问题，根据与用户类型相似的用户对第三方应用隐私威胁的打分情况，评测该第三方应用相对于该用户的隐私威胁分数，帮助用户决策或为用户自动推荐。
[0019] 本发明的积极效果为：
[0020] 本发明首次提出了一种基于推荐系统的用以平衡第三方应用个性化服务及其隐私威胁的方法。首先，该方法采取评分机制推荐第三方应用，帮助用户直观地决策。其次，该方法采用基于协同过滤和基于效用的混合推荐方式，既可以帮助普通不具备专业网络安全知识的用户正确决策，又可以满足不同安全要求的用户的个性化需求。同一网站中的第三方应用对不同需求的用户的隐私威胁分数不同，真正做到用户对自己的隐私数据完全可控，填补了当前第三方追踪防御领域中个性化防御的空白。

【专利附图】

【附图说明】
[0021] 图1为本发明方法的服务器端系统框架图。
[0022] 图2为本发明方法的使用流程图。

【具体实施方式】
[0023] 下面结合附图分别详细描述本发明的【具体实施方式】。本方法中服务器端的系统框架参见图1。
[0024] 服务器端运行流程如下：
[0025] 1.服务器端利用网络爬虫抓取大量的网站，获得这些网站的原始数据以及在这些网站中相应的第三方应用的原始数据。这些数据包括网站的Title、Meta Keywords、Meta Description、HREF标签值等其它信息。
[0026] 2.对原始数据进行数据清理，顺序如下：翻译非英语数据为英语、转换成小写单词、分词、去除停用词。
[0027] 3.利用这些数据，使用数据挖掘的分类算法对所获得的网站和第三方应用进行自动化的分类，得到网站类型和第三方应用的类型，并为这些类型划分隐私威胁严重级别。
[0028] 根据对隐私威胁程度的不同，将网站类型分为如下三个等级（F-Type):
[0029] a)等级A :银行，在线购物，在线付款，健康医疗；
[0030] b)等级B :社交网络，博客，电子邮件；
[0031] c)等级C:其他；
[0032] 其中等级1中的网站类别需要最多的保护，而等级3中的网站类别需要最少的保护。
[0033] 第三方应用类别分为如下三个等级（T-Type):
[0034] a)等级1 :托管平台，内容提供服务；
[0035] b)等级2 :广告公司，分析服务，前端服务；
[0036] c)等级3 :社交网络；
[0037] 其中等级1的第三方应用类别被认为最安全，而等级3中的第三方应用类别被认为最有威胁。
[0038] 4.基于每个用户的个人设置，根据用户所访问的网站的类型以及该网站中所包含的第三方应用的类型，为该用户提供推荐列表。该推荐模块的后台数据库中包含五张表：
[0039] a)网站信息表：记录网站的类型信息。
[0040] b)第三方应用信息表：记录第三方应用的类型信息。
[0041] c)用户隐私偏好表：记录用户的安全等级（U-Type)的设置信息，包括强、中、弱三个级别。
[0042] d)网站与第三方应用对应关系表：记录网站与第三方应用的对应关系信息，即记录每个网站中包含哪些第三方应用，并以成对方式记录。如网站F中包含多个第三方应用 Tl，T2, T3,则作为三条记录（f，t)，（f，t2)，（f，t3)记录在该表中。
[0043] e)用户打分情况表：记录每一用户的为网站与第三方应用关系对（f，t)打分的历史记录。其中"〇"为阻止，"1"为允许。
[0044] 5.当"用户打分情况表"中对某个"网站与第三方应用关系对"打分的用户数目 |U|小于等于系统设置的阈值Μ时，推荐模块使用基于效用的推荐算法为用户提供推荐列表。基于效用的推荐算法的计算方法如公式（1)所示：
[0045]

【权利要求】
1. 一种均衡第三方应用个性化服务和用户隐私信息安全的方法，其步骤为： 1) 用户U在本地安装一客户端软件，并通过客户端软件将设置的个人安全偏好配置信息发送给服务器； 2) 服务器根据该用户u的个人安全偏好配置信息计算用户类型，记作utype，记录在服务器的用户隐私偏好表中，并为该用户u分配用户ID，记作uid，发送给该客户端软件； 3) 该用户u访问Web网站时，该客户端软件截断该访问中的第三方应用HTTP请求，并将该用户u的uid、该Web网站的URL发送给服务器； 4) 服务器在其后台数据库中查找该Web网站的网站ID和网站类型，以及所述第三方应用HTTP请求对应的第三方应用的历史信息；然后根据该用户u的用户类型，该Web网站的网站类型，以及所述历史信息生成一推荐名单返回给该客户端软件； 5) 该客户端软件根据该用户u的设置允许相应的第三方应用HTTP请求通过，访问相应的第三方应用服务器。
2. 如权利要求1所述的方法，其特征在于所述后台数据库的建立方法为： 21) 所述服务器利用网络爬虫抓取多个网站的数据及网站中的第三方应用的数据； 22) 对所抓取的数据进行分类，得到网站类型ftype和第三方应用的类型ttype，并将这些类型划分隐私威胁严重级别，建立记录网站类型的网站信息表，记录第三方应用类型的第三方应用信息表，以及网站与第三方应用对应关系表； 23) 记录用户为网站与第三方应用关系对打分的历史记录，得到一用户打分情况表。
3. 如权利要求2所述的方法，其特征在于服务器采用基于效用的方法生成所述推荐名单： 31) 服务器在所述网站和第三方应用对应表中查找该用户u所访问Web网站中的所有第三方应用，得到该Web网站与其中第三方应用的关系对集合记作S (fid，tid)，其中tid为第三方应用，fid为该Web网站； 32) 服务器在所述用户打分情况表中查找为关系对集合S(fid，tid)打过分的用户集合 U，该用户集合中元素的个数记作|U|，关系对（fid，tid)的打分值记作r (fi4tid)，其中，允许访问对应的打分为1 ;则为关系对打分（fid，tid)为1的用户数量为|U(r(fid，tid) = 1) | ; 33) 根据公式
为关系对集合S(fid，tid)中的每一关系对汴(1，^(1)，计算该用户11的推荐值？11^"(1)，生成所述推荐名单。
4. 如权利要求3所述的方法，其特征在于当|U| < Μ时，服务器采用基于效用的方法生成所述推荐名单；其中，Μ为设定的阈值。
5. 如权利要求2所述的方法，其特征在于服务器采用基于协同过滤的算法生成所述推荐名单： 51) 服务器在所述网站和第三方应用对应表中查找该用户u所访问Web网站中的所有第三方应用，得到该Web网站与其中第三方应用的关系对集合记作S (fid，tid)，其中tid为第三方应用，fid为该Web网站； 52) 服务器在所述用户打分情况表中查找该用户u所有的打分记录集合，记作 Ru(ftid, value);其中ftid用来标识关系对（fid, tid)，value不为空； 53) 对用户集合U中的每一个用户，记作um，l彡m彡|U|，查找用户^所有的打分记录集合，记作|U|为关系对集合S(fid，tid)打过分的用户集合U中元素的个数； 54) 对 Ru(ftid, value)和 Λ~(/?·Μ,νο/Μβ)的 ftid 值求交集 T，记为 Λ )，其中valueu为用户u对关系对ftid的打分值，为用户um对关系对ftid的打分值； 55) 根据 Λ ，计算：

56) 对于β (//W,vc//weu，vi//i?^)的每个关系对ftid,用户u为ftid的打分值记作 ru, ftid，计算丨《和'《?、侃 57) 计算对用户集合U中的每一个用户um与用户u的相关系数corr(u，um); 58) 为关系对集合S(fid，tid)中的每一关系对（fid，tid)，计算为用户u的推荐值
fe成所述推荐名单。
6. 如权利要求5所述的方法，其特征在于所述相关系数的计算公式为：
7. 如权利要求5所述的方法，其特征在于当|U| > Μ时，服务器采用基于协同过滤的算法生成所述推荐名单；其中，Μ为设定的阈值。
8. 如权利要求1所述的方法，其特征在于所述客户端软件为一浏览器插件。
9. 如权利要求1所述的方法，其特征在于用户在本地主机设置保护模式：自动保护模式或手动保护模式；当保护模式为自动保护模式时，如果第三方应用HTTP请求对应的第三方应用的推荐值大于设定值，则该客户端软件直接允许该第三方应用HTTP请求通过；如果保护模式为手动保护模式，则由用户判断是否允许相应的第三方应用HTTP请求通过。
【文档编号】H04L29/06GK104301323SQ201410574968
【公开日】2015年1月21日申请日期:2014年10月23日优先权日:2014年10月23日
【发明者】刘奇旭, 武倩如, 张玉清申请人:中国科学院大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘奇旭;武倩如;张玉清
技术所有人：中国科学院大学
我是此专利的发明人

上一篇：一种载波排序和均衡的方法和装置制造方法
上一篇：一种230频段中fdd-lte窄带化及采样频率降低的方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。