本发明涉及智能识别领域,特别是一种基于安全产品风险威胁的智能识别方法及系统。
背景技术:
1、随着互联网的飞速发展,信息技术和网络应用的广泛应用,安全产品应用作为当前业务系统使用最为广泛的形式,已经深入各行各业,特别是在安全产品 2.0的技术趋势下,安全产品业务平台已在各类信息和业务平台广泛应用,如政府、金融、电子商务、互联网业务等各行业。然而绝大多数的网站都存在着不同程度的安全问题。网站安全风险主要包括以下方面:风险不能事先发现;缺乏有效的防御体系;缺乏检测和响应能力。因此如何降低网站安全管理风险是现阶段丞待解决的问题。
技术实现思路
1、本发明的目的是为了解决上述问题,设计了一种基于安全产品风险威胁的智能识别方法及系统。
2、实现上述目的本发明的技术方案为,进一步,在上述安全产品风险威胁的智能识别方法中,该所述智能识别方法包括以下步骤:
3、获取安全产品应用系统中的运行代码数据和历史网络攻击数据;
4、建立网络安全状态模型,并利用数据挖掘算法对所述运行代码数据和所述历史网络攻击数据进行特征参数挖掘;
5、利用入侵检测方法提取所述特征参数中的自适应特征参数和历史特征参数,得到复杂高频敏感信息流;
6、通过优化后的 fcm方法对所述复杂高频敏感信息流进行分类,并收集所有分类好的目标复杂敏感高频信息;
7、利用相似度计算方法判断实时网络信息数据与所述目标复杂敏感高频信息的相似度;若所述目标复杂敏感高频信息的相似度高于设定的阈值,则判定为高风险威胁信息。
8、进一步,在上述智能识别方法中,所述所述获取安全产品应用系统中的运行代码数据和历史网络攻击数据包括:
9、建立多进程的架构设计数据采集模块;
10、通过所述多进程的架构设计数据采集模块采集安全产品应用系统中的运行代码数据和历史网络攻击数据。
11、进一步,在上述智能识别方法中,所述建立网络安全状态模型包括,包括:
12、利用强化学习(rl)搭建网络安全状态模型,所述rl基于实际场景进行学习;
13、获取所述运行代码数据和所述历史网络攻击数据,建立数据样本集;随机选择所述样本集中的新样本,针对分类器的预期目标进行奖励;
14、根据学习目标对算法进行初始化,通过环境提高分类器的预测难度;得到对所述新样本发起攻击概率;
15、判断所述攻击概率,当所述攻击概率为0时,则表示攻击无法获益;当所述攻击概率为1时,表示攻击行为可以获益。
16、进一步,在上述智能识别方法中,所述并利用数据挖掘算法对所述运行代码数据和所述历史网络攻击数据进行特征参数挖掘,包括:
17、对所述运行代码数据和所述历史网络攻击数据进行数据预处理,得到特征候选参数;
18、使用特征融合方法组合特征增量tf-idf方法计算所述特征候选参数;
19、令词频(tf)=特征候选参数在所述历史网络攻击数据的出现次数;
20、令逆文档频率(idf)=log(历史网络攻击数据总数/(特征候选参数出现次数+1));
21、计算:tf-idf=词频(tf)x逆文档频率(idf),得到特征参数。
22、进一步,在上述智能识别方法中,所述利用入侵检测方法提取自适应特征参数和历史特征参数,得到复杂高频敏感信息流,包括:
23、获取所述特征参数,利用入侵检测方法计算所述特征参数;
24、收集所述特征参数中的用户活动的状态和行为参数、系统和网络日志文件参数、网络流量参数、非正常的目录和文件参数、非正常的程序执行参数;
25、对所述用户活动的状态和行为参数、系统和网络日志文件参数、网络流量参数、非正常的目录和文件参数、非正常的程序执行参数进行参数模式匹配、参数统计和参数完整性分析;得到自适应特征参数和历史特征参数。
26、进一步,在上述智能识别方法中,所述利用入侵检测方法提取自适应特征参数和历史特征参数,得到复杂高频敏感信息流,还包括:
27、获取所述自适应特征参数和历史特征参数,通过使用数据聚类约束一般分析方法,对所述自适应特征参数和历史特征参数的调幅信号进行检验;
28、将所述自适应特征参数和历史特征参数的两个交叉点所涉及的范围设置为匹配范围,并引入特征自相关变量s;
29、采用数据聚类对提取所述自适应特征参数和历史特征参数进行自关联检验,得到复杂高频敏感信息流。
30、进一步,在上述智能识别方法中,所述通过优化后的fcm方法对所述复杂高频敏感信息流进行分类,并收集所有分类好的目标复杂敏感高频信息,包括:
31、获取所述复杂高频敏感信息流;利用fcm算法聚类算法对所述复杂高频敏感信息流进行分类;
32、从所有复杂高频敏感信息流中任取c个点作为聚类中心,选点使得价值函数(目标函数)达到最小;
33、每次簇的均值作为新的中心,迭代直到簇中的复杂高频敏感信息流的分布不再变化,得到欧几里德距离;欧氏距离越小,相似度就越大,欧氏距离越大,相似度就越小;
34、将相似度大的复杂高频敏感信息流进行收集整理,得到目标复杂敏感高频信息。
35、进一步,在上述智能识别方法中,所述利用相似度计算方法判断实时网络信息数据与所述目标复杂敏感高频信息的相似度,若目标复杂敏感高频信息的相似度高于设定的阈值,则判定为高风险威胁信息,包括:
36、获取实时网络信息数据;利用相似度计算方法计算所述实时网络信息数据与所述目标复杂敏感高频信息的相似度;
37、若目标复杂敏感高频信息的相似度高于设定的阈值,则判定为高风险威胁信息;
38、若目标复杂敏感高频信息的相似度低于设定的阈值,则判定为无风险信息。
39、实现上述目的本发明的技术方案为,进一步,在上述一种基于安全产品风险威胁的智能识别系统中,所述智能识别系统,包括:
40、数据获取模块,用于获取安全产品应用系统中的运行代码数据和历史网络攻击数据;
41、数据挖掘模块,用于建立网络安全状态模型,并利用数据挖掘算法对所述运行代码数据和所述历史网络攻击数据进行特征参数挖掘;
42、数据检测模块,用于利用入侵检测方法提取所述特征参数中的自适应特征参数和历史特征参数,得到复杂高频敏感信息流;
43、数据分类模块,用于通过优化后的 fcm方法对所述复杂高频敏感信息流进行分类,并收集所有分类好的目标复杂敏感高频信息;
44、相似度判断模块,用于利用相似度计算方法判断实时网络信息数据与所述目标复杂敏感高频信息的相似度;若所述目标复杂敏感高频信息的相似度高于设定的阈值,则判定为高风险威胁信息。
45、进一步,在上述一种基于安全产品风险威胁的智能识别系统中,所述数据分类模块,包括:
46、获取子模块,用于获取所述复杂高频敏感信息流;利用fcm算法聚类算法对所述复杂高频敏感信息流进行分类;
47、聚类子模块,用于从所有复杂高频敏感信息流中任取c个点作为聚类中心,选点使得价值函数(目标函数)达到最小;
48、迭代子模块,用于将每次簇的均值作为新的中心,迭代直到簇中的复杂高频敏感信息流的分布不再变化,得到欧几里德距离;欧氏距离越小,相似度就越大,欧氏距离越大,相似度就越小;
49、整理子模块,用于将相似度大的复杂高频敏感信息流进行收集整理,得到目标复杂敏感高频信息。
50、其有益效果在于,通过获取安全产品应用系统中的运行代码数据和历史网络攻击数据;建立网络安全状态模型,并利用数据挖掘算法对所述运行代码数据和所述历史网络攻击数据进行特征参数挖掘;利用入侵检测方法提取所述特征参数中的自适应特征参数和历史特征参数,得到复杂高频敏感信息流;通过优化后的 fcm方法对所述复杂高频敏感信息流进行分类,并收集所有分类好的目标复杂敏感高频信息;利用相似度计算方法判断实时网络信息数据与所述目标复杂敏感高频信息的相似度;若所述目标复杂敏感高频信息的相似度高于设定的阈值,则判定为高风险威胁信息。可以有效的防止因黑客攻击而造成的用户网站被恶意篡改、恶意仿冒、敏感信息被泄露、网站被远程控制、被信息安全主管单位漏洞通报等安全事件的发生;客户可以对自身网站安全情况了然于胸,提升用户对自身网站安全防护的信心。