一种基于用户终端的隐私风险排查方法与流程

文档序号:24986419发布日期:2021-05-07 23:04阅读:99来源:国知局
一种基于用户终端的隐私风险排查方法与流程

本发明涉及计算机安全技术领域,尤其涉及一种基于用户终端的隐私风险排查方法。



背景技术:

虽然应用程序商店(如googleplay)会定期删除异常的或者劣质的app,但是这些应用商店并没有注意到涉及隐私侵犯的app。他们被下载到移动设备上,如果移动用户使用它们,则私人信息可能会被应用泄露。对于不同的功能,不同类型的私人信息会被泄露。例如,基于位置的服务需要获取用户的实时位置信息,而这可能会是用户不希望暴露的家庭或者工作场所;社交感知服务需要提取用户的联系人信息,这同样侵犯了用户的个人生活。事实上,据报道,用户在使用app时越来越关注自己的隐私。

用户在移动设备上使用各移动应用程序(mobileapplication,以下简称app)时,现有的隐私风险评估通常是对操作系统或app本身的隐私风险进行分析,而很少有研究对用户在使用移动应用程序时面临的隐私风险进行评估。如早在2012年sarma等人就依赖权限及权限对的使用率刻画app风险,2013年droidrisk方法使用权限的恶意软件发生概率和敏感度计算app的恶意软件风险。hamed等在2016年基于权限敏感程度和重要程度参数提出一个动态隐私打分模型。国内研究者张贤贤等人使用众包和机器学习方法,基于敏感权限和权限意图等其他静态特征创建了app隐私评级模型。以上各方法均评估的是app本身的隐私风险,而不考虑使用app的用户其本身面临的隐私风险。

idg新闻最近的一项调查显示,超过30%的移动用户更倾向于在了解app所收集的私人信息之后卸载这些app。为了发现app的异常,人们提出了一些关注隐私的app检测和推荐机制。但是,这些机制要么关注服务提供者这边,让应用商店推荐那些较少隐私忧虑的app,要么靶向于开发者这边,对app内部进行调查,发现恶意代码后限制app的访问权限。但是,这些工作需要与服务提供者或者app开发者进行合作,难以在实践中实现。而一些app常常请求并拥有与完成其功能无关或者关联度非常低的权限,造成了严重的隐私泄露风险。如游戏类、地图类的app拥有读取通信录、通话记录的权限,将严重泄露用户隐私。还有一家厂商开发的多个不同app被相同用户安装,因不同app拥有智能终端的不同权限,导致用户的更多隐私泄露给同一家厂商。不同的app拥有用户的不同隐私权限,其对用户的隐私泄露影响不相同,现有的智能终端在安装/运行app时,仅提示用户将要申请用户的什么权限,并未给出所申请的权限的将要引发隐私泄露风险,也未给用户合理的高隐私风险权限的阻断或推荐操作建议。

现有技术一般采用的风险评估的方式或者是权限管理,在隐私风险问题应用中,通常采用针对隐私权限列表中存在风险的隐私权限,向用户提示风险信息,供用户选择允许或禁止通过;对于不存在风险的隐私权限可以默认通过的方式,然而,通过上述方法在保证隐私安全的情况下,用户也丧失了对风险应用继续无障碍使用的可能。



技术实现要素:

本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明公开了一种基于用户终端的隐私风险排查方法,实时监控用户在不同应用的不同输入信息,并在网络中进行查询,当检测到与用户输入的信息相匹配的内容时,查询该信息对应的应用程序的数据访问权限,判断所述权限是否能造成用户输入信息泄露,若所述权限可能导致用户的输入信息泄露,则限制该应用的权限并提醒用户该应用的风险。

更进一步地,拦截对于风险应用的输入信息,通过相应数据处理方式对输入信息进行转换,并提交转换后的数据代替用户输入的信息。

更进一步地,当用户需要获取输入的信息内容时,通过中间转换再将用户输入的信息转换回用户原来输入的信息。

本发明还公开了一种基于用户终端的隐私风险排查方法,包括如下步骤:

步骤1,用户在执行用户信息输入时,对客户输入的所述数据进行预处理,获取用户输入的隐私数据及输入的应用平台,其中,所述隐私信息包括用户的身份信息、密码信息;

步骤2,在用户输入的隐私数据中增加标注并记录用户输入所述隐私数据对应的应用平台和标注内容,其中,所述标注为根据第一预设模板对隐私数据进行修改,以保证修改后的用户隐私数据的可读性和非正确性;

步骤3,将增加标注后的隐私信息通过隐私泄露模块进行查询和匹配,当检测到标注信息或者对应的隐私数据时,判断应用平台存在泄密风险;

步骤4,在所述步骤3判断应用平台存在风险后,根据标注信息判断泄露信息的相似程度,当检测到任一隐私数据的相似度达到第一相似度时,通过所述应用平台根据第二预设模板继续输入第一数量的与标注后的隐私信息相近似的虚拟用户隐私数据;

步骤5,将所述步骤4生成的虚拟用户隐私数据再通过所述隐私泄露模块进行查询和匹配,当检测到虚拟用户隐私数据或者检测到的信息相似度大于第二相似度时,通过应用平台注入第二数量的虚拟用户隐私数据以稀释用户可能的正确隐私信息的被检索几率。

更进一步地,所述第一预设模板为将用户在同一应用平台按时间倒序顺序将用户的输入行为特征进行排序,组成一个用户输入信息矩阵,当检测到用户输入信息中存在的敏感关键词时,对用户的敏感信息进行标注,所述标注的信息为根据预设词库匹配的插入信息;构建神经网络训练模型,通过所述的神经网络训练模型对标注信息和对应的用户输入信息进行可读性训练,在完成训练后得到可信度高的预设模板,将得到的用户输入信息矩阵输入到神经网络训练模型中进行处理,得到用户全部输入信息的信息副本。

更进一步地,所述神经网络训练模型进一步包括:输入层、嵌入层、乘积层、递归层以及输出层;所述输入层的输入由n个输入域组成,每个所述输入域都与所述嵌入层中相连接,其中,嵌入层具有不同的嵌入向量;所述乘积层通过计算不同嵌入向量之间的向量乘积或者向量点乘得到相关向量。

更进一步地,所述隐私泄露模块进一步包括:设置并行信息检索引擎,以标注后的的隐私信息作为检索输入信息,并行检索相近的隐私信息,在检索到任一所述标注后的的隐私信息后,查询相邻并行检索的结果,若相邻距离小于设定值则判断达到第一相似度。

更进一步地,所述第一数量为10,通过风险应用输入生成10份相应的虚拟用户隐私信息,在将10份虚拟用户隐私数据作为测试数据判断该应用的风险等级。

更进一步地,所述第二数量为255,当通过检测到的虚拟用户隐私数据判断应用的风险等级高时,则通过该存在风险的应用生成与用户隐私数据相近的大量虚拟隐私数据,稀释用户可能的正确隐私信息的被检索几率。

更进一步地,所述第二预设模板进一步包括:所述第二预设模板不考虑输入的虚拟信息的可读性,直接通过预设词库生成相近的用户虚拟信息。

本发明与现有技术相比,在检测到应用程序存在隐私泄密的风险时,用户依然可以使用该风险程序,本发明通过改变输入信息、限制权限、模糊用户的泄密信息等方式降低泄密应用的风险等级,通过采用神经网络学习的方式,将隐私数据进行替换转码,即影响他人的阅读也保护了使用者的隐私。

附图说明

从以下结合附图的描述可以进一步理解本发明。图中的部件不一定按比例绘制,而是将重点放在示出实施例的原理上。在图中,在不同的视图中,相同的附图标记指定对应的部分。

图1为本发明的一种基于用户终端的隐私风险排查方法的流程图。

具体实施方式

实施例一

在本实施中,提供了一种基于用户终端的隐私风险排查方法,实时监控用户在不同应用的不同输入信息,并在网络中进行查询,当检测到与用户输入的信息相匹配的内容时,查询该信息对应的应用程序的数据访问权限,判断所述权限是否能造成用户输入信息泄露,若所述权限可能导致用户的输入信息泄露,则限制该应用的权限并提醒用户该应用的风险。

更进一步地,拦截对于风险应用的输入信息,通过相应数据处理方式对输入信息进行转换,并提交转换后的数据代替用户输入的信息。

更进一步地,当用户需要获取输入的信息内容时,通过中间转换再将用户输入的信息转换回用户原来输入的信息。

实施例二

如图1所示,本实施例公开了一种基于用户终端的隐私风险排查方法,包括如下步骤:

步骤1,用户在执行用户信息输入时,对客户输入的所述数据进行预处理,获取用户输入的隐私数据及输入的应用平台,其中,所述隐私信息包括用户的身份信息、密码信息;

在步骤1中,通过信息抓取函数抓取用户在输入窗口中输入的信息,本发明涉及了两种信息获取方法,其一,通过设备自身的例如钩子函数或者是应用接受数据的函数获取用户输入的信息,并根据用户输入的信息建立数据列表,其中,数据列表包括了用户输入的信息分类,用户使用的应用情况、应用的权限信息等;

步骤2,在用户输入的隐私数据中增加标注并记录用户输入所述隐私数据对应的应用平台和标注内容,其中,所述标注为根据第一预设模板对隐私数据进行修改,以保证修改后的用户隐私数据的可读性和非正确性;

在步骤2中,标注的内容可以是信息的相近替代,例如用户输入的姓名信息为“张三”,则标注信息可以根据关联词库中的“张三李四”将“张三”替换为“李四”,又或者将“李先生”替换为“木子先生”等,又或者将用户的特征作为关联替换,例如“李先生”在关联库中记录为非常喜欢吃玉米,则可以将“木子爱玉米”作为用户名替换,在此不做更多的举例,而基于此,其他用户可以通过上述替换,依然可以根据对使用者的熟悉程度了解到该替换名称表征了该用户,同时,标注信息需要具有检索特征,例如通过尾缀或者前缀的形式标识用户的信息,例如用户输入的信息为“我的密码为123456”,则通过标注插入前缀(我的密码“keyid”123456)或者尾缀(我的密码123456“keyid”)的形式改变输入信息。

步骤3,将增加标注后的隐私信息通过隐私泄露模块进行查询和匹配,当检测到标注信息或者对应的隐私数据时,判断应用平台存在泄密风险;

步骤4,在所述步骤3判断应用平台存在风险后,根据标注信息判断泄露信息的相似程度,当检测到任一隐私数据的相似度达到第一相似度时,通过所述应用平台根据第二预设模板继续输入第一数量的与标注后的隐私信息相近似的虚拟用户隐私数据;

步骤5,将所述步骤4生成的虚拟用户隐私数据再通过所述隐私泄露模块进行查询和匹配,当检测到虚拟用户隐私数据或者检测到的信息相似度大于第二相似度时,通过应用平台注入第二数量的虚拟用户隐私数据以稀释用户可能的正确隐私信息的被检索几率。

通过与泄密应用相同的方式注入大量无用的、与用户信息相近似的虚拟隐私数据,例如用户输入的信息为“我的名字叫吴东南,今年24岁”,在风险应用平台中输入例如“我的名字叫吴问题,今年28岁”此类的大量数据,可以采用应用分身等形式,同时并行输入虚拟信息,并改变输入的时序,将真实的信息藏匿于虚假的数据中。

更进一步地,所述第一预设模板为将用户在同一应用平台按时间倒序顺序将用户的输入行为特征进行排序,组成一个用户输入信息矩阵,当检测到用户输入信息中存在的敏感关键词时,对用户的敏感信息进行标注,所述标注的信息为根据预设词库匹配的插入信息;构建神经网络训练模型,通过所述的神经网络训练模型对标注信息和对应的用户输入信息进行可读性训练,在完成训练后得到可信度高的预设模板,将得到的用户输入信息矩阵输入到神经网络训练模型中进行处理,得到用户全部输入信息的信息副本。

在此步骤中,系统可以通过生成输入信息的替换页的形式获取用户的输入内容,例如程序1弹窗需要输入用户名及密码,则系统生成与弹窗界面相似的用户名密码输入界面,用户在输入信息后,经过神经网络学习后,生成信息副本并将生成的信息副本输入。

更进一步地,所述神经网络训练模型进一步包括:输入层、嵌入层、乘积层、递归层以及输出层;所述输入层的输入由n个输入域组成,每个所述输入域都与所述嵌入层中相连接,其中,嵌入层具有不同的嵌入向量;所述乘积层通过计算不同嵌入向量之间的向量乘积或者向量点乘得到相关向量。

更进一步地,所述隐私泄露模块进一步包括:设置并行信息检索引擎,以标注后的的隐私信息作为检索输入信息,并行检索相近的隐私信息,在检索到任一所述标注后的的隐私信息后,查询相邻并行检索的结果,若相邻距离小于设定值则判断达到第一相似度。

更进一步地,所述第一数量为10,通过风险应用输入生成10份相应的虚拟用户隐私信息,在将10份虚拟用户隐私数据作为测试数据判断该应用的风险等级。

更进一步地,所述第二数量为255,当通过检测到的虚拟用户隐私数据判断应用的风险等级高时,则通过该存在风险的应用生成与用户隐私数据相近的大量虚拟隐私数据,稀释用户可能的正确隐私信息的被检索几率。

更进一步地,所述第二预设模板进一步包括:所述第二预设模板不考虑输入的虚拟信息的可读性,直接通过预设词库生成相近的用户虚拟信息

还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

虽然上面已经参考各种实施例描述了本发明,但是应当理解,在不脱离本发明的范围的情况下,可以进行许多改变和修改。因此,其旨在上述详细描述被认为是例示性的而非限制性的,并且应当理解,以下权利要求(包括所有等同物)旨在限定本发明的精神和范围。以上这些实施例应理解为仅用于说明本发明而不用于限制本发明的保护范围。在阅读了本发明的记载的内容之后,技术人员可以对本发明作各种改动或修改,这些等效变化和修饰同样落入本发明权利要求所限定的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1