一种应用软件的隐私政策自动提取方法与流程

文档序号:34860088发布日期:2023-07-23 06:22阅读:43来源:国知局
一种应用软件的隐私政策自动提取方法与流程

本发明涉及安卓应用,尤其是涉及一种应用软件的隐私政策自动提取方法。


背景技术:

1、安卓平台通过权限机制控制应用程序对设备中敏感资源的使用,只有当应用程序具有某一权限时,系统才会允许其访问相应资源。例如当应用程序需要获取设备位置信息时,应用程序应首先在其配置文件中声明使用位置权限,然后在其运行过程中请求用户授权,方可获取设备位置信息。

2、安卓的权限机制无疑保护了设备的敏感资源、用户的隐私数据,然而,移动平台中用户隐私数据泄露事件依然频出。可见,目前的应用软件权限机制仅能控制应用程序能否获取相应敏感资源,但无法控制应用程序在获取资源后如何使用。

3、应用程序对权限的恶意使用从技术手段上难以限制,因为从系统的角度来看,无论是恶意使用还是正常使用,其均属于建立在权限机制之上正常行为。在此背景下,面临用户日益增长的个人隐私数据保护需求,国家出台了《中华人民共和国个人信息保护法》,其中明确规定应用程序必须制定其《隐私政策》,并且在应用中以适当的方式呈现。《隐私政策》中最主要的编写内容即应用如何使用权限,这一规定的目的就是为了将应用程序对信息的收集范围限制于实现处理目的最小范围。

4、隐私政策作为应用收集、处理个人信息的标准,其对应用恶意行为的判定提供了重要法律依据,因此,隐私政策逐渐成为应用分析过程中的关键文件。但是,隐私政策文件并未像应用其他文件(如配置文件、资源文件等)被打包进应用安装包中,而是以外部链接的形式存在于应用中。现有的隐私政策提取技术,通常采用对应用安装包进行反编译的方式提取应用软件包括的网络地址(url)链接,提取效率较低,且容易出现漏提取网络地址的情况,进而降低了隐私政策的提取效率及提取准确率。


技术实现思路

1、有鉴于此,本发明的目的在于提供一种应用软件的隐私政策自动提取方法,能够提高网络地址的提取效率,避免出现漏提取网络地址链接的情况,提升了隐私政策的提取效率及提取准确率。

2、为了实现上述目的,本发明实施例采用的技术方案如下:

3、第一方面,本发明实施例提供了一种应用软件的隐私政策自动提取方法,包括:静态提取应用软件代码文件中网络地址链接,得到第一网络地址集合;动态提取所述应用软件测试运行期间相关联的网络地址链接,得到第二网络地址集合;获取所述第一网络地址集合与所述第二网络地址集合的并集,得到目标网络地址集合;遍历提取所述目标网络地址集合内各网络地址中的文本内容,基于训练后的文本分类模型检测所述目标网络地址集合中类型为隐私政策的文本内容。

4、进一步,本发明实施例提供了第一方面的第一种可能的实施方式,其中,所述静态提取应用软件代码文件中网络地址链接,得到第一网络地址集合的步骤,包括:解压所述应用软件的安装包,从解压后的所述安装包中获取源码编译形成的可执行文件;基于网络地址的正则表达式提取所述可执行文件中所包含的网络地址链接,将各个所述可执行文件中包含的网络地址链接取并集,得到所述第一网络地址集合。

5、进一步,本发明实施例提供了第一方面的第二种可能的实施方式,其中,所述可执行文件包括基于java源码编译形成的第一可执行文件,所述基于网络地址的正则表达式提取所述可执行文件中所包含的网络地址链接的步骤,包括:基于所述第一可执行文件中存储的字符串信息,截取并保存所述第一可执行文件中的字符串表数据区;其中,所述字符串信息包括字符串长度和偏移量;基于网络地址的正则表达式匹配出所述字符串表的数据区中所包括的网络地址链接。

6、进一步,本发明实施例提供了第一方面的第三种可能的实施方式,其中,所述可执行文件包括基于本地源码编译形成的第二可执行文件,所述基于网络地址的正则表达式提取所述可执行文件中所包含的网络地址链接的步骤,包括:截取并保存所述第二可执行文件中的字符串表;其中,所述字符串表存储有所述本地源码使用的全部字符串;基于网络地址的正则表达式从所述字符串表中匹配出符合网络地址格式的字符串,得到所述可执行文件中所包含的网络地址链接。

7、进一步,本发明实施例提供了第一方面的第四种可能的实施方式,其中,所述动态提取所述应用软件测试运行期间相关联的网络地址链接,得到第二网络地址集合的步骤,包括:在测试设备上部署拦截操作所需的环境框架,并安装所述应用软件;对文本超链接的构造函数进行所述拦截操作,并将所述构造函数的输入参数存储至所述第二网络地址集合中;控制所述应用软件自动运行,以得到所述应用软件运行期间使用的全部网络地址链接。

8、进一步,本发明实施例提供了第一方面的第五种可能的实施方式,其中,所述在测试设备上部署拦截操作所需的环境框架,并安装所述应用软件的步骤,包括:基于预设的调试工具将所述环境框架的服务文件推送进安卓设备公共存储目录,将所述环境框架的服务文件的权限修改为预设权限;其中,所述预设权限包括读取操作、写入操作和执行操作;基于预设调试指令将所述应用软件安装在所述测试设备上。

9、进一步,本发明实施例提供了第一方面的第六种可能的实施方式,其中,所述控制所述应用软件自动运行,以得到所述应用软件运行期间使用的全部网络地址链接的步骤,包括:从应用主界面启动所述应用软件,记录当前深度为0;遍历当前页面结构的全部按钮组件,并对各所述按钮组件自动执行点击操作;当页面发生跳转时,控制所述当前深度加1;当所述当前深度为1时,控制所述应用软件执行返回操作。

10、进一步,本发明实施例提供了第一方面的第七种可能的实施方式,其中,所述应用软件的隐私政策自动提取方法还包括:获取所述文本分类模型的训练文本;截取所述训练文本中的预设数量字符,或者,将所述训练文本扩充至所述预设数量字符,得到训练样本;其中,所述训练样本包括正样本和负样本,所述正样本包括隐私政策文本,所述负样本包括新闻文章;基于所述训练样本及预设训练工具对所述文本分类模型进行训练,得到训练后的文本分类模型。

11、第二方面,本发明实施例还提供了一种电子设备,包括:处理器和存储装置;所述存储装置上存储有计算机程序,所述计算机程序在被所述处理器运行时执行如第一方面任一项所述的方法。

12、第三方面,本发明实施例提供了一种存储介质,所述存储介质中存储有多条指令;所述多条指令,用于由处理器加载并执行如第一方面任一所述的方法。

13、本发明实施例提供了一种应用软件的隐私政策自动提取方法,该方法包括:静态提取应用软件代码文件中网络地址链接,得到第一网络地址集合;动态提取应用软件测试运行期间相关联的网络地址链接,得到第二网络地址集合;获取第一网络地址集合与第二网络地址集合的并集,得到目标网络地址集合;遍历提取目标网络地址集合内各网络地址中的文本内容,基于训练后的文本分类模型检测目标网络地址集合中类型为隐私政策的文本内容。本发明通过采用静态提取的方式,提取应用软件代码文件中的网络地址,无需对应用软件进行反编译,提高了网络地址的提取效率,进而提升了隐私政策的提取效率,通过采用动态提取的方式,提取应用软件运行期间所涉及的网络地址,可以将应用软件运行过程中待跳转的网络地址提取出来,取第一网络地址集合与第二网络地址集合的并集,可以得到应用软件对应的全部网络地址链接,避免出现漏提取网络地址的情况,进而提升了隐私政策的提取准确率。

14、本发明实施例的其他特征和优点将在随后的说明书中阐述,或者,部分特征和优点可以从说明书推知或毫无疑义地确定,或者通过实施本发明实施例的上述技术即可得知。

15、为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1