基于社交媒体的用户隐私意识评估方法和系统与流程

文档序号:16973502发布日期:2019-02-26 18:46阅读:261来源:国知局
基于社交媒体的用户隐私意识评估方法和系统与流程

本发明属于隐私保护领域,特别涉及一种用户隐私意识评估方法。



背景技术:

目前社交网站已然发展到了主要特征是实名制的第三阶段。实名制社交网站指的是用户在注册该网站的账户时,必需填写用户个人的真实信息。国内许多社交网站在努力推行实名制的社交,如知乎、人人网、微博等。

实名制社交网站是以实际生活中的人际关系进行连接的社交网站。社交网站上用户提供的个人信息是真实的,所以现实生活中的人际关系可以在虚拟的社交网络上进行复制。更进一步,用户可通过社交网站提供的一些虚拟的互动操作,如评论或点赞等,加强用户在现实生活中的人际关系。用户在实名制的社交网站上可以快速找到熟人,用户之间也可以通过个人信息配对快速地找到相同特征属性的人。除此之外,通过好友推荐的方式,用户可以进一步地发展自己的朋友圈,因此,具有相同兴趣爱好的用户能够通过这样的信息传播方式联系到一起。

然而,实名制社交网站在为用户带来方便的社交平台的同时,也会带来个人信息泄露的风险。社交网络进行身份实名制,会给大量用户的个人信息带来被暴露的风险,这包括用户不想被部分朋友,或者是一些陌生人所知道的敏感信息。

实名制社交网站带来的隐私泄露风险,使得用户的个人隐私信息保护成为了一个迫在眉睫的难题。新浪微博平台考虑到个人信息页面可能带来隐私泄露的风险,为用户的部分重要信息提供了隐私保护设置功能,用户可以将这些极为敏感的重要信息设置为所有人可见、部分人可见、仅自己可见等隐私保护设置。通过这些隐私保护设置,可以评估用户的隐私保护意识。

用户隐私保护意识的评估对于用户隐私保护问题的研究具有重要意义。经过调查研究,在现有的技术中,还没有成熟的社交媒体用户隐私意识评估相关方法,是隐私保护领域的一大空白。



技术实现要素:

为解决上述问题,本发明提出了一种用户隐私意识评估方法,通过社交媒体,提取社交用户的信息项,构建初始社交用户信息集,获取并分析该社交用户的该信息项,量化该信息项的隐私意识值并获取该信息项的评估指标权重,通过对该信息项的隐私意识值和评估指标权重加权求和,得到该社交用户的隐私意识值。

具体来说,本发明涉及一种基于社交媒体的用户隐私意识评估方法,包括:

初始社交用户信息集构建步骤,基于社交媒体平台,获取社交用户的信息项,构建该初始社交用户集;

隐私意识评估指标选取和量化步骤,分析该信息项,获取该社交用户的隐私意识评估指标,并对该信息项进行量化处理,得到该信息项的隐私意识值;

评估指标权重计算步骤,获取该信息项的评估指标权重;

社交用户隐私意识值计算和评估步骤,通过对该信息项的隐私意识值和评估指标权重,得到该社交用户的隐私意识值;以该隐私意识值对该社交用户的隐私意识进行评估。

本发明所述的基于社交媒体的用户隐私意识评估方法,其初始社交用户信息集构建步骤具体包括:基于社交媒体平台,选取种子用户,获取该种子用户的社交关系路径上的该社交用户,以网络爬虫爬取该社交用户的信息页面;从该信息页面使用正则表达式提取关键字段,形成该社交用户的信息项,构建该初始社交用户集。

本发明所述的基于社交媒体的用户隐私意识评估方法,其隐私意识评估指标选取和量化步骤具体包括:分析该初始社交用户集内的信息项,抽取n个该信息项作为隐私意识评估指标,其中n为正整数;将网络爬虫可以爬取到的该信息项的隐私意识值设置为1,网络爬虫爬取不到的该信息项的隐私意识值设置为0,作为该信息项的隐私意识值。

本发明所述的基于社交媒体的用户隐私意识评估方法,其评估指标权重计算步骤具体包括:分析该社交用户对其社交关系路径上的其他社交用户的信息项的公开程度,得到该信息项的不可见率,作为该信息项的评估指标权重。

本发明所述的基于社交媒体的用户隐私意识评估方法,其社交用户隐私意识值计算和评估步骤包括:对该社交用户信息项的隐私意识值通过该评估指标权重进行加权并求和,得到该社交用户的隐私意识值;该隐私意识值越大,则该用户个人信息的可见率越高,用户的隐私意识越弱;该隐私意识值越小,则该用户的个人信息可见率越低,用户的隐私意识越强。

本发明还涉及一种基于社交媒体的用户隐私意识评估系统,该系统包括:

初始社交用户信息集构建模块,用于选取种子用户,获取该种子用户的社交关系路径上的该社交用户,以网络爬虫爬取该社交用户的信息页面;从该信息页面使用正则表达式提取关键字段,形成该社交用户的信息项,构建该初始社交用户集;

隐私意识评估指标选取和量化模块,用于选取该社交用户的信息项成为隐私意识评估指标,并将网络爬虫可以爬取到的该信息项的隐私意识值设置为1,网络爬虫爬取不到的该信息项的隐私意识值设置为0,作为该信息项的隐私意识值;

评估指标权重计算模块,用于分析该社交用户对其社交关系路径上的其他社交用户的信息项的公开程度,得到该信息项的不可见率,作为该信息项的评估指标权重;

社交用户隐私意识值计算和评估模块,社交用户隐私意识值计算和评估模块,用于对该社交用户信息项的隐私意识值,通过该评估指标权重进行加权并求和,得到该社交用户的隐私意识值;并通过该隐私意识值对该社交用户的隐私意识进行评估。

本发明的方法有效地利用社交媒体用户可访问的个人页面信息,快捷方便地计算社交用户的隐私保护意识,对于进一步的用户隐私保护具有重要意义。

附图说明

图1用户隐私意识评估流程图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明的一种基于社交媒体的用户隐私意识评估方法进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。

一、初始社交用户集构建

社交媒体平台提供用户展示个人信息的页面。例如,新浪微博平台的个人信息页面可以显示用户已填的个人信息,包括用户昵称、用户的真实姓名、性别、所在地、性取向、感情状况、生日、血型、简介、联系信息、教育信息、职业信息、个人标签、个性域名和收货地址,共15项。其中,针对真实姓名、性取向、感情状况、血型、联系信息、教育信息和职业信息这7项,用户可以设置为:我关注的人可见、所有人可见、仅自己可见;针对生日这1项,用户可设置为:公开完整显示、只显示星座、只显示月日、保密。其他用户访问该用户主页时,新浪微博平台将根据这些隐私保护设置展示该用户的个人信息。

本发明随机选择了一个种子用户,从该用户出发,按照粉丝关系爬取该用户最近的三层粉丝的个人信息页面和所有微博。经过数据预处理和关键信息提取,最终获取到大量用户的个人信息,构建为初始社交用户集。

二、隐私意识评估指标选取和量化

基于初始社交用户集,通过分析各个信息项的可设置特性,可知并不是每项信息都是对外可见的。社交用户的个人信息页面包括若干项个人信息项,过滤掉本身完全不可见的信息项,抽取出其中n项信息作为用户的隐私意识评估指标。

通过网络爬虫能够获取用户的某项个人信息,即个人信息对网络爬虫可见,说明用户并未对个人信息进行隐私保护设置,即隐私意识薄弱。因此,对于某项个人信息,如果该项个人信息对网络爬虫可见,则该项信息的隐私意识值为1;如果该项个人信息对网络爬虫不可见,则该项信息的隐私意识值为0。

在新浪微博社交平台上,针对社交用户的12项隐私意识评估指标和量化定义如下:

用户填写的真实姓名;

用户填写的性取向;

用户填写的感情状况;

用户填写的血型;

用户填写的联系信息;

用户填写的教育信息;

用户填写的职业信息;

用户填写的生日;

用户填写的所在地;

用户填写的简介;

用户填写的个人标签;

用户填写的个性域名。

其中,对于第i项评估指标,如果评估指标对网络爬虫可见,该指标的隐私意识值pi=1;否则值pi=0。

三、评估指标权重计算

观察初始社交用户集中每个用户的n项个人信息,可知不同用户的个人信息可见率不同,有些人的所有个人信息完全可见,有些人部分可见,有些人几乎不可见。进一步经过数据统计即可发现,不同个人信息项的对外不可见率差异较大。例如,在新浪微博数据集上,用户真实姓名的对外不可见率最小,其次是血型、性取向、联系信息、感情状况等。

可见,用户对不同的个人信息的敏感度不同,即各个隐私意识评估指标的重要性不同。因此,基于初始社交用户集,计算n个信息项的对外不可见率,作为该项信息对应的评估指标的权重wi,以得到更为客观的用户隐私意识值。

举个例子,对于某项个人信息,如果用户集中有80%的人设置了对外不可见,即信息项的对外不可见率为0.8,而用户a设置信息项为对外可见,那么评估该用户隐私意识时该项信息对应的评估指标的权重wi为0.8,隐含表示了用户在该项信息上比80%的用户隐私意识弱。

四、社交用户隐私意识值计算和评估

基于不同个人信息项的指标权重,通过加权求和的方法,由n项个人信息的隐私意识值计算得到社交用户的最终隐私意识值p-score。

具体来说,使用公式计算用户的隐私意识值。

由计算公式可知,社交用户的隐私意识值p-score∈[0,1],p-score值越大,说明该用户个人信息的可见率越高,用户的隐私意识越弱;p-score值越小,说明该用户的个人信息可见率越低,则用户的隐私意识越强。

具体来说,本发明涉及一种基于社交媒体的用户隐私意识评估方法,包括:

初始社交用户信息集构建步骤,基于社交媒体平台,获取社交用户的信息项,构建该初始社交用户集;

隐私意识评估指标选取和量化步骤,分析该信息项,获取该社交用户的隐私意识评估指标,并对该信息项进行量化处理,得到该信息项的隐私意识值;

评估指标权重计算步骤,获取该信息项的评估指标权重;

社交用户隐私意识值计算和评估步骤,通过对该信息项的隐私意识值和评估指标权重,得到该社交用户的隐私意识值;以该隐私意识值对该社交用户的隐私意识进行评估。

本发明所述的基于社交媒体的用户隐私意识评估方法,其初始社交用户信息集构建步骤具体包括:基于社交媒体平台,选取种子用户,获取该种子用户的社交关系路径上的该社交用户,以网络爬虫爬取该社交用户的信息页面;从该信息页面使用正则表达式提取关键字段,形成该社交用户的信息项,构建该初始社交用户集。

本发明所述的基于社交媒体的用户隐私意识评估方法,其隐私意识评估指标选取和量化步骤具体包括:分析该初始社交用户集内的信息项,抽取n个该信息项作为隐私意识评估指标,其中n为正整数;将网络爬虫可以爬取到的该信息项的隐私意识值设置为1,网络爬虫爬取不到的该信息项的隐私意识值设置为0,作为该信息项的隐私意识值。

本发明所述的基于社交媒体的用户隐私意识评估方法,其评估指标权重计算步骤具体包括:分析该社交用户对其社交关系路径上的其他社交用户的信息项的公开程度,得到该信息项的不可见率,作为该信息项的评估指标权重。

本发明所述的基于社交媒体的用户隐私意识评估方法,其社交用户隐私意识值计算和评估步骤包括:对该社交用户信息项的隐私意识值通过该评估指标权重进行加权并求和,得到该社交用户的隐私意识值;该隐私意识值越大,则该用户个人信息的可见率越高,用户的隐私意识越弱;该隐私意识值越小,则该用户的个人信息可见率越低,用户的隐私意识越强。

本发明还涉及一种基于社交媒体的用户隐私意识评估系统,该系统包括:

初始社交用户信息集构建模块,用于选取种子用户,获取该种子用户的社交关系路径上的该社交用户,以网络爬虫爬取该社交用户的信息页面;从该信息页面使用正则表达式提取关键字段,形成该社交用户的信息项,构建该初始社交用户集;

隐私意识评估指标选取和量化模块,用于选取该社交用户的信息项成为隐私意识评估指标,并将网络爬虫可以爬取到的该信息项的隐私意识值设置为1,网络爬虫爬取不到的该信息项的隐私意识值设置为0,作为该信息项的隐私意识值;

评估指标权重计算模块,用于分析该社交用户对其社交关系路径上的其他社交用户的信息项的公开程度,得到该信息项的不可见率,作为该信息项的评估指标权重;

社交用户隐私意识值计算和评估模块,社交用户隐私意识值计算和评估模块,用于对该社交用户信息项的隐私意识值,通过该评估指标权重进行加权并求和,得到该社交用户的隐私意识值;并通过该隐私意识值对该社交用户的隐私意识进行评估。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1