一种大数据网络安全防护方法及系统与流程

文档序号：36321618发布日期：2023-12-08 22:41阅读：49来源：国知局

本发明涉及保险数据网络安全，具体涉及一种大数据网络安全防护方法及系统。

背景技术：

1、随着大数据和互联网技术的快速发展，网络安全问题日益突出。保险行业企业作为金融领域的重要组成部分，对网络安全的需求尤为迫切。传统的网络安全防护方法已经无法满足现今复杂多变的网络攻击手段。随着互联网技术的迅速发展和大数据时代的到来，网络安全问题日益凸显。传统的网络安全防护方法往往依赖于固定的规则和已知的恶意特征，难以应对日益复杂和多样化的网络攻击手段。因此，研究和开发一种能够自适应识别和防御未知威胁的网络安全防护方法变得至关重要。

2、simhash算法是一种广泛应用于文本相似度计算的方法。通过将文本内容转换为数值型指纹，并计算指纹之间的汉明距离，simhash能够快速评估文本的相似度。然而，传统的simhash算法主要用于一般文本处理，缺乏针对网络安全场景的特定优化。且现有技术中，simhash对恶意内容的识别能力较差，没有结合保险数据特点以及网络安全因子相结合进行判断的方法，导致异常识别率较低，且不能够准确识别多种类型的网络攻击行为。

技术实现思路

1、针对现有技术中提到的上述问题，为解决上述技术问题，本发明提供了一种大数据网络安全防护方法及系统，该方法通过采用采用改进的simhash算法识别恶意内容，包括使用鲸鱼算法优化安全权重因子进行网络安全的判断，通过基本权重以及安全权重因子，计算调整后的权重，实现了保险网络安全的自动化判断准确性，大大增强了保险网络数据交易的安全性。

2、本发明的一种大数据网络安全防护方法，包括步骤：

3、s1：数据收集模块：收集网络流量参数、用户行为参数、设备信息；

4、s2：预处理模块：对收集的数据进行清洗和格式化；

5、s3：采用改进的simhash算法识别恶意内容，包括使用鲸鱼算法优化安全权重因子；

6、s31：对预处理后的数据网络内容进行分词，计算词的基本权重；

7、

8、s32：计算安全权重因子：对于每个词，计算其安全权重因子,并使用鲸鱼算法确定和

9、

10、其中，是第i个词，是权重系数，阈值，是一个函数，表示词与恶意内容的关联度；

11、s321：初始化鲸鱼群体：每个鲸鱼代表一组参数{,}；

12、s322：定义适应度函数：适应度函数可以基于准确率、召回率指标，评估每组参数的效果；

13、表示基于参数α和β计算的被识别为恶意内容中实际恶意内容的比例，表示基于参数α和β计算的正确识别恶意内容的比例；

14、s323：模拟鲸鱼捕食行为：通过模拟鲸鱼的捕食行为，不断更新鲸鱼的位置，寻找最佳的参数组合；

15、

16、

17、s324：找到最优解：当算法收敛时，找到的最优鲸鱼代表了最佳的和;

18、s33：计算调整后的权重:

19、

20、s34：计算哈希值；

21、

22、s35：计算simhash指纹：结合调整后的权重和哈希值，计算网络内容的simhash指纹：

23、

24、s36：与已知恶意攻击参数比较：将计算出的simhash参数与已知恶意内容的参数进行比较，如果相似度超过设定阈值，则标记为异常；

25、s4：结束。

26、优选地，所述网络流量参数包括：ip地址、端口号、协议类型、传输速率、会话开始时间、会话结束时间，所述用户行为参数包括：用户名、登录时间、登录地点、访问的网址、停留时间、点击行为、搜索关键词、搜索结果、上传或下载的文件类型、大小、时间；所述设备信息包括：设备类型、操作系统、浏览器版本。

27、优选地，所述预处理模块：对收集的数据进行清洗和格式化，清洗包括同一用户的同一操作被多次记录删除重复的条目，格式化包括采用z-score对数据进行规范化。

28、优选地，所述是一个函数，表示词与恶意内容的关联度，

29、。

30、本技术还提供一种大数据网络安全防护系统，包括：

31、数据收集模块：收集网络流量参数、用户行为参数、设备信息；

32、预处理模块：对收集的数据进行清洗和格式化；

33、改进的simhash算法识别恶意内容模块，包括使用鲸鱼算法优化安全权重因子；

34、首先，对预处理后的数据网络内容进行分词，计算词的基本权重；

35、

36、其次，计算安全权重因子：对于每个词，计算其安全权重因子,并使用鲸鱼算法确定和

37、

38、其中，是第i个词，是权重系数，阈值，是一个函数，表示词与恶意内容的关联度；

39、初始化鲸鱼群体：每个鲸鱼代表一组参数{,}；

40、定义适应度函数：适应度函数可以基于准确率、召回率指标，评估每组参数的效果；

41、表示基于参数α和β计算的被识别为恶意内容中实际恶意内容的比例，表示基于参数α和β计算的正确识别恶意内容的比例；

42、模拟鲸鱼捕食行为：通过模拟鲸鱼的捕食行为，不断更新鲸鱼的位置，寻找最佳的参数组合；

43、

44、

45、找到最优解：当算法收敛时，找到的最优鲸鱼代表了最佳的和;

46、计算调整后的权重:

47、

48、计算哈希值；

49、

50、计算simhash指纹：结合调整后的权重和哈希值，计算网络内容的simhash指纹：

51、

52、与已知指纹恶意攻击参数比较模块：将计算出的simhash与已知恶意攻击参数进行比较，如果相似度超过设定阈值，则标记为异常；

53、s4：结束。

54、优选地，所述网络流量参数包括：ip地址、端口号、协议类型、传输速率、会话开始时间、会话结束时间，所述用户行为参数包括：用户名、登录时间、登录地点、访问的网址、停留时间、点击行为、搜索关键词、搜索结果、上传或下载的文件类型、大小、时间；所述设备信息包括：设备类型、操作系统、浏览器版本。

55、优选地，所述预处理模块：对收集的数据进行清洗和格式化，清洗包括同一用户的同一操作被多次记录删除重复的条目，格式化包括采用z-score对数据进行规范化。

56、优选地，所述是一个函数，表示词与恶意内容的关联度，

57、。

58、本发明提供了一种大数据网络安全防护方法及系统，所能实现的有益技术效果如下：

59、1、本技术通过采用改进的simhash算法识别恶意内容，包括使用鲸鱼算法优化安全权重因子进行网络安全的判断，将simhash算法与鲸鱼算法相结合并应用于保险网络案件判断方面，结合保险数据网络交互特点，对网络安全进行识别判断，大大增强了保险网络异常攻击的判断准确度，提高了安全性。

60、2、本发明通过基本权重以及安全权重因子，计算调整后的权重，计算调整后的权重:，综合考虑多个方面的权重因素，实现了保险网络安全的自动化判断准确性，大大增强了保险网络数据交易的安全性，提高了影响因素的参与计算以及网络攻击行为的判断准确度。

61、3、本发明通过采用鲸鱼算法，对，是权重系数，阈值进行寻优，找到最优质，使得系数准确性大幅提升，，其中，是第i个词，是权重系数，阈值，是一个函数，表示词与恶意内容的关联度；通过上述技术以及鲸鱼算法的优化，安全权重因子的准确性大幅提升，进而对保险网络攻击行为的判断准确度大幅提升。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：徐志华高云姚磊
技术所有人：国任财产保险股份有限公司
我是此专利的发明人

上一篇：一种节能型环保设备协同同步控制系统及方法与流程
上一篇：一种认证方法和装置与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。