一种追踪隐私信息泄露的方法

文档序号:6599632阅读:245来源:国知局

专利名称::一种追踪隐私信息泄露的方法
技术领域
:本发明涉及一种在网络环境下,追踪隐私信息泄露的方法。本发明成果可以用于互联网中隐私信息泄露的追踪,属于计算机网络安全领域。
背景技术
:Web技术的发展和广泛应用为用户共享信息和使用各种服务提供了方便,但是由此带来了隐私信息保护的问题。用户在享用Web站点提供的服务之前,往往需要在站点注册,注册过程中站点一般要求用户提交一些包含个人隐私的信息,如用户名、电子邮箱地址等。隐私信息包含个人的敏感信息,如果被泄露会造成个人名誉损失、经济损失和精神伤害。虽然站点一般都声称不会泄露用户的隐私信息,但是有的站点为了其商业利益而将用户隐私信息泄露给第三方。之后,用户会经常收到一些广告性质的垃圾邮件。现有的针对Web服务的隐私信息保护方法通过一些技术手段或者站点的隐私策略来对用户隐私信息进行保护,但是存在以下的缺点第一,现有的技术方法如使用匿名技术在一定程度上阻断了用户隐私信息与其身份之间的联系,但是如果用户身份信息被泄露,用户的所有相关信息也就都泄露了。此外,由于各种因素如背景信息等的存在,使得匿名破解非常容易。第二,现有隐私策略和隐私保护方法虽然能够对隐私信息进行一定的保护,但是一旦站点违背隐私策略,用户的隐私信息还是会被泄露出去。
发明内容本发明的目的是提供一种追踪隐私信息泄露的方法,针对Web服务站点泄露用户隐私信息给第三方后,用户经常收到带有广告性质的垃圾邮件的问题。使用本发明的方法可以追踪到泄露用户隐私信息的网站,使得用户可以改变对隐私信息泄露站点的信任或交互模式,甚至诉诸于法律,从而达到对用户隐私信息的保护。本发明采用一个分析中心,当用户收到垃圾邮件以后向分析中心举报垃圾邮件,并告知分析中心最近注册过的网站的信息,如果分析不成功,则分析中心要求用户进一步提交最近交互过的网站的信息。其中,“最近”在实际应用中可以具体确定实际期限,如两周、一个月等,在此不做特殊规定。分析中心根据分析算法对泄露用户隐私信息的网站进行分析和追踪,并将结果告知用户。本发明的应用框架结构如图1所示。站点泄露的用户的隐私信息分为两类一是注册信息(其中可能包括用户名、电子邮件地址、兴趣等),二是通过用户和站点的历史交互行为,站点分析出的用户行为信息。本发明采取如下的技术方案。追踪隐私信息泄露的方法,实现本方法的整个框架包括用户、隐私信息泄露站点、得到用户隐私信息的第三方(以下简称第三方)和分析中心,其中分析中心的分析算法包括邮件分类模块、站点分类模块和分析模块。追踪隐私信息泄露的方法,其特征在于,包括以下步骤1.用户收到垃圾邮件后,向分析中心举报,该分析中心为包括邮件分类模块、站点分类模块和分析模块三个软件的服务器1.1)用户在分析中心注册一个账号,该注册过程只需提交用户名(用户自己选定的名称)和密码(供用户登录分析中心使用),不需提交其他任何信息,最大限度的保护用户的隐私;1.2)用户登录分析中心,将自己要举报的垃圾邮件和最近注册过的站点的网址提交分析中心;2.分析中心收到用户的举报后,做如下处理(分析流程如图3,分析流程图所示)2.1)调用邮件分类模块对用户举报的垃圾邮件做分类处理,邮件分类模块中使用一个邮件分类软件对邮件进行分类处理,其实现的步骤包括2.1.1)删除邮件正文中出现频率很高但与邮件特征无关的词(如连接词、语气助词等),其中“特征”是指能够把一个邮件内容与其他邮件内容区分开来的信息;2.1.2)在词典(包括中文词典、英文词典等词典,根据邮件中出现的语言类型选择相应的词典)的支持下,把邮件文本分成有意义的词条;2.1.3)对2.1.2)中切分好的有意义的词条,通过提取语义的方法确定该邮件的类型,即该邮件是为哪一种或哪几种商品或服务做广告,用集合Ie1,e2,....ej(me(1,2,....))表示,其中m表示一个邮件类型的总个数。比如,一个邮件为化妆品和服装作广告,该邮件的类型表示为{e1;e2},其中el表示“化妆品”,e2表示“服装”,则m=2。其中“提取语义的方法”在实际应用中是采用机器学习的方法实现。2.2)调用站点分类模块对用户提交的站点进行分类,站点分类模块中使用一个站点分类软件对用户提交的站点进行分类处理,站点分类软件采用机器学习的方法对这些站点(如是提供学习交流的站点或是提供电子商务服务的站点类型等)以及站点通过和用户的交互可能收集到的用户的信息进行分类,分类结果记为站点类型,用集合Ic1,C2,....cj(ne(1,2,....))表示,其中η表示站点类型的总个数。比如,一个销售电子产品的电子商务网站类型表示为Ic1,C2,c3},其中C1表示“手机”,C2表示“电脑”,C3表示“移动硬盘”,则η=3。2.3)调用分析模块分析泄露用户隐私信息的网站,分析模块中使用一个分析软件来分析泄露用户隐私信息的网站,其实现步骤包括2.3.1)把一个时间区间之内的(如一个小时之内、一天之内等,实际应用中可以根据具体情况而确定)、垃圾邮件内容相同的每一条用户举报,表示成一个举报条目,其中举报条目包括用户提交的站点名称、该站点的类型、垃圾邮件的类型。将这些垃圾邮件内容相同的举报条目组织成一个表,记为分析表,如图2所示;2.3.2)扫描分析表中的每一个举报条目,如果举报条目满足以下的条件eig(Cl,c2,....cn)(eie(ei,e2,····em),me(1,2,····),ie(1,2,····m)),即经过分析的垃圾邮件的类型不属于注册站点的类型,则删除该站点。这是因为,垃圾邮件类型不属于站点类型,表示站点不能获得用户与垃圾邮件广告目的相关的信息,因此将其删除。其中,“属于”表示包含与被包含的关系;2.3.3)扫描分析表,记录每个站点出现的频率,按照出现频率的高低对注册站点排序,记录在一张排序表中;2.3.4)对于排序表,记录前ρ个站点,删除后q个的站点(其中P、q的取值根据举报的总数选定);2.3.5)在下一个时间区间之内接收垃圾邮件内容相同的用户举报,重复2.3.1)-2.3.4),直到对于内容相同的垃圾邮件,不再接收到用户举报或超过设定的时间门限(如8个小时、两天等,根据实际应用选择时间门限);2.3.6)对于2.3.5)形成的每个排序表中记录的前ρ个站点,取前t个(t为整数,且t<ρ)作为隐私泄露候选站点,记为{k1;k2,....kx}(1e(1,2,....)),其中1表示选择的隐私泄露候选站点的总个数。如果一共有Hr为大于0的整数)张排序表,则隐私泄露站点的候选者数量是rXt。其中的t的具体取值根据排序表的情况选定,在此不做特殊要求;2.4)对于候选的隐私泄露站点{k1;k2,....Ic1)(1e(1,2,....)),分析中心对这些站点用不同的邮箱分别进行注册和交互,如果在注册和交互之后,测试邮箱很快开始收到垃圾邮件,则确定该站点为泄露用户隐私信息的网站,转向3.1)。如果对于所有的候选站点进行测试注册后,测试邮箱没有收到垃圾邮件,则转向2.5);2.5)分析中心要求用户把最近交互的站点和最近注册的站点一起提交到分析中心,做2.1)-2.4),如果成功转向3.1),否则分析失败转向3.2);3.分析中心告知用户分析结果,其中包括3.1)成功找到泄露用户隐私信息的网站;3.2)分析失败。本发明提出一种追踪隐私信息泄露的方法,该方法针对Web服务站点泄露用户隐私信息给第三方后,用户经常收到带有广告性质的垃圾邮件的问题。通过分析中心对用户举报的垃圾邮件的分析,能够找出泄露用户隐私信息的站点并通知用户。用户在分析中心注册时只需提交其自由设定的用户名和密码,以及开始只需向分析中心提交最近注册的站点名称,分析不成功才需向分析中心提交最近交互的站点,最大限度的保护了用户的隐私fn息ο图1本发明的应用框架结构2本发明的分析算法中的分析表结构3本发明的分析过程流程图具体实施例方式本发明的具体实施方式以一个电子商务网站泄露用户的购买倾向的隐私信息为例,说明本发明的追踪隐私信息泄露的方法。用户A于本月之中在电子商务网站S1浏览化妆品、服装的购买信息,S1是用户A两个月以前注册的站点。该电子商务网站通过分析用户A的浏览历史,把用户对服装和化妆品感兴趣的隐私信息与A的电子邮件地址泄露给第三方P,第三方P开始给A发送一些广告化妆品的垃圾邮件。A常常收到关于化妆品的垃圾邮件,于是A在分析中心注册一个账号,并把收到的垃圾邮件E以及A在一个月之内注册过的网站{S2,S3,S4,SJ向分析中心举报。分析收到用户A的举报,对A举报的垃圾邮件E做分类处理(通过机器学习的方法,提取邮件内容的语义),得出该邮件类型是{化妆品},即该垃圾邮件的广告目的是为化妆品做广告。分析中心对A提交的网站做分类处理(通过机器学习的方法,对站点类型做分析),得到结果如下<table>tableseeoriginaldocumentpage7</column></row><table>因此A的举报条目为<table>tableseeoriginaldocumentpage7</column></row><table>对于一天之内,举报内容和A相同的垃圾邮件,经过邮件分类和站点分类处理,组织成一个分析表如下<table>tableseeoriginaldocumentpage7</column></row><table>将站点类别不包含垃圾邮件类别“化妆品”的站点删除,因此删除S2和S7,将分析表中剩下的站点排序,取频率最高的前2个S2,S3,删除频率最低的一个S6。等待下一个时间区间,即下一天的举报,但是没有出现的该内容的垃圾邮件新的举报。取t=2,即把选出来的频率最高的2个站点都作为候选站点,进行测试。测试中心使用两个邮箱在S2,S3分别注册,但是注册后没有收到垃圾邮件。因此,分析中心要求A把一个月之内注册和交互的过的站点作为报告站点,告知分析中心。分析中心通过用户A新提交的站点(包括本月注册、交互的站点)分类,形成了A的新的举报条目<table>tableseeoriginaldocumentpage8</column></row><table>根据该新的举报条目,形成新的分析表,用同样的方法作分析。得出频率最高的站点是S1S2,因为S2经过测试已经排除是泄露隐私信息的站点,因此分析中心对站点S1做测试。分析中心用测试邮箱在站点S1注册后,站点S1很快收到了广告化妆品的垃圾邮件,于是分析中心告知用户Aj1泄露其隐私信息。于是用户A可以采取改变对站点S1的信任等,出站点S1泄露隐私信息对出响应。采用本发明可以追踪到泄露用户隐私信息的网站,使得用户可以改变对隐私信息泄露站点的信任或交互模式,甚至诉诸于法律,从而达到对用户隐私信息的保护。权利要求一种追踪隐私信息泄露的方法,其特征在于,包括以下步骤1.)用户收到垃圾邮件后,向分析中心举报,该分析中心为包括邮件分类模块、站点分类模块和分析模块三个软件的服务器1.1)用户在分析中心注册一个账号,该注册过程只需提交一个自己选定的用户名和供用户登录分析中心使用的密码;1.2)用户登录分析中心,将自己要举报的垃圾邮件和最近注册过的站点的网址提交分析中心;2.)分析中心收到用户的举报后,做如下处理2.1)调用邮件分类模块对用户举报的垃圾邮件做分类处理,邮件分类模块中使用一个邮件分类软件对邮件进行分类处理,其实现的步骤包括2.1.1)删除邮件正文中出现频率很高但与邮件特征无关的词,特征是能够把一个邮件内容与其他邮件内容区分开来的信息;2.1.2)在词典的支持下,把邮件文本分成有意义的词条;2.1.3)对2.1.2)中切分好的有意义的词条,通过提取语义的方法确定该邮件的类型,用集合{e1,e2,....em}(m∈(1,2,....))表示,m表示一个邮件类型的总个数;;2.2)调用站点分类模块对用户提交的站点进行分类,站点分类模块中使用一个站点分类软件对用户提交的站点进行分类处理;站点分类软件对这些站点以及站点通过和用户的交互可能收集到的用户的信息进行分类,分类结果记为站点类型,用集合{c1,c2,....cn}(n∈(1,2,....))表示,n是站点类型的总个数;2.3)调用分析模块分析泄露用户隐私信息的网站,分析模块中使用一个分析软件来分析泄露用户隐私信息的网站,其实现步骤包括2.3.1)把一个时间区间之内的、垃圾邮件内容相同的每一条用户举报,表示成一个举报条目,举报条目包括用户提交的站点名称、该站点的类型、垃圾邮件的类型;将这些垃圾邮件内容相同的举报条目组织成一个表,记为分析表;2.3.2)扫描分析表中的每一个举报条目,如果举报条目满足以下的条件即经过分析的垃圾邮件的类型不属于注册站点的类型,则删除该站点;属于表示包含与被包含的关系;2.3.3)扫描分析表,记录每个站点出现的频率,按照出现频率的高低对注册站点排序,记录在一张排序表中;2.3.4)对于排序表,记录前p个站点,删除后q个的站点,p、q的取值根据举报的总数选定;2.3.5)在下一个时间区间之内接收垃圾邮件内容相同的用户举报,重复2.3.1)-2.3.4),直到对于内容相同的垃圾邮件,不再接收到用户举报或超过设定的时间门限;2.3.6)对于2.3.5)形成的每个排序表中记录的前p个站点,取前t个,t为整数,且t<p,作为隐私泄露候选站点,记为{k1,k2,....kl}(l∈(1,2,....)),l是选择的隐私泄露候选站点的总个数;如果一共有r张排序表,r为大于0的整数,则隐私泄露站点的候选者数量是r×t;2.4)对于候选的隐私泄露站点{k1,k2,....kl}(l∈(1,2,....)),分析中心对这些站点用不同的邮箱分别进行注册和交互,如果在注册和交互之后,测试邮箱很快开始收到垃圾邮件,则确定该站点为泄露用户隐私信息的网站,转向3.1);如果对于所有的候选站点进行测试注册后,测试邮箱没有收到垃圾邮件,则转向2.5);2.5)分析中心要求用户把最近交互的站点和最近注册的站点一起提交到分析中心,做2.1)-2.4),如果成功转向3.1),否则分析失败转向3.2);3.)分析中心告知用户分析结果,其中包括3.1)成功找到泄露用户隐私信息的网站;3.2)分析失败。FSA00000060013900011.tif全文摘要一种追踪隐私信息泄露的方法,属于计算机网络安全领域,用于网络环境中隐私信息泄露的追踪。本发明的目的是提供一种追踪隐私信息泄露的方法。针对Web服务站点泄露用户隐私信息给第三方后,用户经常收到带有广告性质的垃圾邮件的问题。本发明采用一个分析中心,当用户收到垃圾邮件以后向分析中心举报垃圾邮件,通过分析中心的分析方法找到隐私信息泄露的网站,告知用户。使用本发明的方法可以追踪到泄露用户隐私信息的网站,使得用户可以改变对隐私信息泄露站点的信任或交互模式,甚至诉诸于法律,从而达到对用户隐私信息的保护。文档编号G06F21/00GK101819616SQ201010130590公开日2010年9月1日申请日期2010年3月22日优先权日2010年3月22日发明者何泾沙,吴旭,高枫申请人:北京工业大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1