一种分析待处理数据的方法、装置、介质及电子设备与流程

文档序号:37372741发布日期:2024-03-22 10:25阅读:9来源:国知局
一种分析待处理数据的方法、装置、介质及电子设备与流程

本申请涉及数据分析领域,具体而言本申请实施例涉及一种分析待处理数据的方法、装置、介质及电子设备。


背景技术:

1、网络技术给人类生活带来便利的同时,也给数据安全领域带来新的安全隐患。例如,如何有效跟踪向特定区域发送的机密信息,即如何实现对敏感数据进行应用跟踪防止泄密,及时上报风险信息成了亟待解决的技术问题。


技术实现思路

1、本申请实施例的目的在于提供一种分析待处理数据的方法、装置、介质及电子设备,采用本申请实施例提供了一种对待处理数据(即发往目的区域(例如,敏感对象所在的区域)数据)的应用流量分析及分布统计的方法,可以实现对待处理数据的应用类型识别归类及应用访问流量统计。

2、第一方面,本申请实施例提供一种分析待处理数据的方法,所述方法包括:根据被分析ip地址的地域属性得到待处理数据;识别所述待处理数据的应用类型,其中,所述应用类型包括:商务服务、社交娱乐、通用类应用或者互联网访问;对所述应用类型的数据流量进行统计,得到与所述应用类型对应的访问特征,其中,所述访问特征用于表征所述应用类型对目的区域网站或者目的区域系统的访问属性。

3、本申请的一些实施例对通过识别待处理数据的应用类型并对各类型进行访问特征统计,可以方便后续即时识别出潜在风险访问,提升待处理数据的安全性。

4、在一些实施例中,所述根据被分析ip地址的地域属性得到待处理数据,包括:获取流量数据,提取ip地址信息;利用ip地域信息库并调用ip地址地域信息查询接口,获取所述ip地址信息的ip属地信息;判断所述ip地址信息表征的地址属于第一区域还是所述目的区域,对于访问所述目的区域的数据,进行标识得到所述待处理数据。

5、本申请的一些实施例通过ip地址的属地信息识别出目的区域数据,提升待处理数据识别的准确性。

6、在一些实施例中,所述识别所述待处理数据的应用类型,包括:对所述待处理数据的上下文内容以及结构特征进行分析,得到待匹配特征;通过将所述待匹配特征和已确定应用类型的特征进行匹配,得到所述待处理数据的应用标识号;根据所述应用标识号以及聚类算法得到所述待处理数据的所述应用类型。

7、本申请的一些实施例通过待处理数据的上下文内容和结构特征获取待处理数据的应用类型,提升应用类型判定的准确性。

8、在一些实施例中,所述待处理数据是当缓存空间或者缓存请求和响应条目数达到设置阈值后的目的区域流量数据。

9、本申请的一些实施例通过缓存的方式收集尽可能多的待处理数据以对这些数据进行统计分析。

10、在一些实施例中,所述根据所述应用标识号以及聚类算法得到所述待处理数据的所述应用类型,包括:根据应用功能的不同以及应用聚类模型,分别创建所述商务服务、所述社交娱乐、所述通用类应用和所述互联网访问共四种应用类型;从所述四种应用类型中获取与所述应用标识号对应的应用类型。

11、本申请的实施例通过构建四类应用类型,并识别待处理数据所属的应用类型。

12、在一些实施例中,所述对所述应用类型的数据流量进行统计,得到与所述应用类型对应的访问特征,包括:根据应用功能的相似性,建立所述应用类型的子类聚类,得到所述访问特征,其中,所述访问特征用于表征所述应用类型的所有应用对所述目的区域网站或者所述目的区域系统的访问属性。

13、本申请的一些实施例可以获取各个应用类型对应的访问特征,以便后续根据这些统计特征识别潜在的网络安全风险。

14、在一些实施例中,所述目的区域网站包括:目的区域医院网站、目的区域银行网站、目的区域社交网站以及目的区域视频网站,所述目的区域系统包括:目的区域文件服务系统或目的区域数据库系统。

15、在一些实施例中,与所述商务应用对应的访问属性包括:访问数据库类型、访问邮箱类型、访问企业类型以及与各类型分别对应的连接数和字节数。

16、在一些实施例中,与所述社交娱乐对应的访问属性包括:访问游戏名称、访问社交网站类型、访问媒体类型以及与各相应类型对应的连接数和字节数。

17、在一些实施例中,所述方法还包括:提供web展示界面,对所述各应用类型以及所述访问属性包括的连接数和数据字节数进行展示。

18、第二方面,本申请的一些实施例提供一种分析待处理数据的装置,所述装置包括:待处理数据获取模块,被配置为根据被分析ip地址的地域属性得到待处理数据,其中,所述待处理数据属于访问目的区域的数据;应用类型识别模块,被配置为识别所述待处理数据的应用类型,其中,所述应用类型包括:商务服务、社交娱乐、通用类应用或者互联网访问;访问特征统计模块,被配置为对所述应用类型的数据流量进行统计,得到与所述应用类型对应的访问特征,其中,所述访问特征用于表征所述应用类型对目的区域网站或者目的区域系统的访问属性。

19、第三方面,本申请的一些实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时可实现如第一方面任意一个实施例所述的方法。

20、第四方面,本申请的一些实施例提供一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其中,所述处理器执行所述程序时可实现如第一方面任意一个实施例所述的方法。



技术特征:

1.一种分析待处理数据的方法,其特征在于,所述方法包括:

2.如权利要求1所述的方法,其特征在于,所述根据被分析ip地址的地域属性得到待处理数据,包括:

3.如权利要求1所述的方法,其特征在于,所述识别所述待处理数据的应用类型,包括:

4.如权利要求3所述的方法,其特征在于,所述待处理数据是当缓存空间或者缓存请求和响应条目数达到设置阈值后的目的区域流量数据。

5.如权利要求3所述的方法,其特征在于,所述根据所述应用标识号以及聚类算法得到所述待处理数据的所述应用类型,包括:

6.如权利要求5所述的方法,其特征在于,所述对所述应用类型的数据流量进行统计,得到与所述应用类型对应的访问特征,包括:

7.如权利要求6所述的方法,其特征在于,所述目的区域网站包括:目的区域医院网站、目的区域银行网站、目的区域社交网站以及目的区域视频网站,所述目的区域系统包括:目的区域文件服务系统或目的区域数据库系统。

8.如权利要求7所述的方法,其特征在于,

9.如权利要求7所述的方法,其特征在于,

10.如权利要求9所述的方法,其特征在于,所述方法还包括:

11.一种分析待处理数据的装置,其特征在于,所述装置包括:

12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时可实现如权利要求1-10中任意一项权利要求所述的方法。

13.一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其中,所述处理器执行所述程序时可实现如权利要求1-10中任意一项权利要求所述的方法。


技术总结
本申请实施例提供一种分析待处理数据的方法、装置、介质及电子设备,所述方法包括:根据被分析IP地址的地域属性得到待处理数据;识别所述待处理数据的应用类型,其中,所述应用类型包括:商务服务、社交娱乐、通用类应用或者互联网访问;对所述应用类型的数据流量进行统计,得到与所述应用类型对应的访问特征,其中,所述访问特征用于表征所述应用类型对目的区域网站或者目的区域系统的访问属性。采用本申请实施例提供了一种对待处理数据的应用流量分析及分布统计的方法,可以实现对待处理数据的应用类型识别归类及应用访问流量统计。

技术研发人员:李猛,黄兵华
受保护的技术使用者:湖北天融信网络安全技术有限公司
技术研发日:
技术公布日:2024/3/21
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1