一种计算机应用识别方法、装置及存储介质

文档序号:26050943发布日期:2021-07-27 15:26阅读:来源:国知局

技术特征:

1.一种计算机应用识别方法,其特征在于:包括以下步骤:

s1:请求信息识别:终端在进行应用下载前,向应用识别系统发送应用识别的请求,应用识别系统在接收到请求消息后,通过数据流获取终端的属性信息,以及确定出与所述应用识别的请求对应的待识别的应用的文件路径信息,根据所述文件路径信息获取相应的待识别的应用的标识信息;

s2:应用信息识别:通过多条数据流提取待识别的应用标识信息的切词特征、流表和域名表,所述流表包括多个流表项,多个所述流表中的每个流表项包括匹配字段、优先级、计数器、指令、超时时间、cookie以及流起始时间,所述域名表包括多个域名表项,多个所述域名表项中的每个域名表项包括源互联网协议ip地址、目的域名、目的ip地址和域名类型,通过对所述流表和所述域名表进行特征分析后,得到多个应用类型的标签,所述标签信息用于识别所述终端属性信息进行数据流匹配;

s3:应用特征模拟:在上述步骤s2以及获取了待识别的应用标识信息的切词特征以及与所述终端属性信息进行数据流匹配后,对所提取的切词特征进行均值编码,从而得到均值编码特征,接着将得到的均值编码特征发送至模拟学习系统中,进行模拟学习预测,在模拟学习预测完毕后,得到预测值;

s4:应用识别判断:在上述步骤s3中得到预测值的情况下,将预测值发送至智能识别系统中进行智能识别判断,若预测值大于均衡值,则判断待识别的应用存在缺陷或病毒,若预测值小于均衡值,则判断待识别的应用合格,接着将判断信息发送至终端,终端对应用进行下载。

2.根据权利要求1所述的一种计算机应用识别方法,其特征在于:所述步骤s2中,应用类型的标签的获取过程为:首先通过所述流表进行流行为特征分析,从而获得由ip地址和端口标识构成的多个服务,每个服务至少包括一个ip地址和一个端口标识,接着通过所述流表和所述域名表的特征,对所述多个服务进行聚类,得到多个应用类型,最后确定所述多个应用类型中每个应用类型对应的标签。

3.根据权利要求1所述的一种计算机应用识别方法,其特征在于:所述步骤s3中,均值编码特征的编辑基于category-encoders库、bayesian-target-encoding目标编码方法、weight-of-evidence自变因变管理函数以及nonlinear-pca分类量化方法。

4.根据权利要求1所述的一种计算机应用识别方法,其特征在于:所述步骤s3中,模拟学习系统为基于逻辑回归模型的函数模拟系统,所述逻辑回归模型包括二项逻辑回归函数、多元逻辑回归函数以及随机逻辑回归函数。

5.根据权利要求1所述的一种计算机应用识别方法,其特征在于:所述步骤s4中,均衡值的获取办法为:从缺陷或病毒应用样本以及常规应用样本中的样本集中提取样本值标记和应用标识信息的样本切词特征,对所述样本切词特征进行均值编码得到均值编码特征,基于提取的样本值标记和样本均值编码特征对逻辑回归模型进行模拟训练,以得到均衡值函数。

6.一种计算机应用识别装置,其特征在于:包括:

信息接收单元:所述信息接收单元用于接收终端发送的请求消息,并根据此消息获取终端的属性信息,以及确定出与所述应用识别的请求对应的待识别的应用的文件路径信息;

特征提取单元:所述特征提取单元用于通过多条数据流提取待识别的应用标识信息的切词特征、流表和域名表,所述流表包括多个流表项,多个所述流表中的每个流表项包括匹配字段、优先级、计数器、指令、超时时间、cookie以及流起始时间;

分析确定单元:所述分析确定单元用于通过所述流表进行流行为特征分析,从而获得由ip地址和端口标识构成的多个服务,每个服务至少包括一个ip地址和一个端口标识,接着通过所述流表和所述域名表的特征,对所述多个服务进行聚类,得到多个应用类型,最后确定所述多个应用类型中每个应用类型对应的标签,所述标签信息用于识别所述终端属性信息进行数据流匹配;

编码预测单元:所述编码预测单元用于对所提取的切词特征进行均值编码,从而得到均值编码特征,接着将得到的均值编码特征发送至模拟学习系统中,进行模拟学习预测;

识别判断单元:所述识别判断单元用于比较预测值和均衡值数据大小,从而判断待识别的应用合格与否。

7.根据权利要求6所述的一种计算机应用识别装置,其特征在于:所述特征提取单元包括待识别的应用特征提取模块和样本特征提取模块,所述特征提取模块包括样本值标记提取模块、样本切词特征提取模块、样本独热编码模块以及模型训练模块。

8.根据权利要求7所述的一种计算机应用识别装置,其特征在于:所述待识别的应用特征提取模块和所述样本特征提取模块为相互独立的两个模块。

9.一种计算机应用识别存储介质,其特征在于:所述存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1至5中任一所述的方法的步骤。


技术总结
本发明涉及计算机通信安全技术领域,且公开了一种计算机应用识别方法;本计算机应用识别方法包括以下步骤:S1:请求信息识别;S2:应用信息识别;S3:应用特征模拟;S4:应用识别判断,本发明通过对流表和域名表进行特征分析后,得到多个应用类型的标签,标签信息用于识别终端属性信息进行数据流匹配流行为特征识别应用,不需流量特征数据库的支持,可在新应用出现时,快速进行识别,从而提高了计算机对应用的识别效率,且可在计算机进行应用安装时,对应用进行有效的安全分析,避免存在缺陷或病毒的应用被下载安装,提高了计算机应用安装的安全性,同时保护了用户的信息安全。

技术研发人员:于倩;王晓蓓;姜晓刚;赵雪峰;成乐
受保护的技术使用者:滨州职业学院
技术研发日:2021.05.21
技术公布日:2021.07.27
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1