一种身份认证平台安全防护方法与流程

文档序号:36420667发布日期:2023-12-20 09:42阅读:65来源:国知局
一种身份认证平台安全防护方法与流程

本发明涉及数据处理,具体涉及一种身份认证平台安全防护方法。


背景技术:

1、在数字化、网络化的现代生活中,身份认证在各个领域都有着广泛应用,从银行账户登录、电子邮件访问到社交媒体应用等。有效的身份认证能够确保只有合法用户可以访问和操作他们的个人信息,从而保护他们免受不当使用、数据泄露等风险。然而,随着黑客攻击手段的日益熟练和复杂,身份认证平台面临越来越大的安全威胁。网络入侵者可能通过伪造或窃取用户信息,以非法用户的身份申请身份认证,从而进行诈骗活动,甚至进行更大规模的网络攻击。

2、孤立森林(isolation forest)算法通过构建一种称为孤立树(isolation tree)的数据结构,使得异常点能够在较少的分割下就被孤立出来。通过对孤立森林模型进行训练和优化,可以使其在处理大量申请数据时具有高效性,并且可以识别出各种不同类型的异常申请,从而提供强大的安全防护。同时,由于孤立森林算法对数据分布没有假设,因此也适用于处理具有复杂或未知分布的数据。但是在网络入侵过程中,会不断的增加异常数据,使得异常数据的规模不断变大,进而影响到孤立森林的检测效率,对应到会影响到网络入侵检测结果。


技术实现思路

1、为了解决上述问题,本发明提供一种身份认证平台安全防护方法,所述方法包括:

2、获取若干次检测过程的数据,包括当前检测过程的数据;

3、获取每次检测过程中的数据的整体数据分布;获取每次检测过程中的数据的偏移方向;

4、获取每次检测过程中的累积参数值;根据每次检测过程中的数据的整体数据分布和偏移方向以及每次检测过程中的累积参数值,获取当前检测过程中的数据的偏离程度;

5、获取当前检测过程中的数据中每个维度的敏感度;根据当前检测过程中的累积参数值和数据中每个维度的敏感度,获取当前检测过程中的数据中每个维度的调整后的敏感度;根据当前检测过程中的数据中每个维度的调整后的敏感度和当前检测过程中的数据的偏离程度,获取当前检测过程中的数据中每个维度的插值程度;

6、根据当前检测过程中的数据中每个维度的插值程度进行数据插值,对插值后当前检测过程的数据进行孤立森林分析,得到网络入侵检测结果。

7、优选的,所述获取每次检测过程中的数据的整体数据分布,包括的具体方法为:

8、每次检测过程的数据对应一个多维数据向量;将第次检测过程的数据以及第次之前的所有次检测过程的数据对应的多维数据向量构成第次检测过程的向量空间;将第次检测过程的向量空间中所有相邻多维数据向量之间的欧式距离的均值与所有相邻多维数据向量之间的欧式距离的标准差的比值,作为第次检测过程的数据的整体数据分布。

9、优选的,所述获取每次检测过程中的数据的偏移方向,包括的具体方法为:

10、获取第次检测过程的向量空间中每个多维数据向量与其他所有多维数据向量之间的欧式距离的均值,将均值最小的多维数据向量记为第次检测过程的最中心的向量;获取第次检测过程的向量空间中每个多维数据向量与其他所有多维数据向量之间的欧式距离的均值,将均值最小的多维数据向量记为第次检测过程的最中心的向量;将第次检测过程的最中心的向量与第次检测过程的最中心的向量的方向差异,作为第次检测过程的数据的偏移方向。

11、优选的,所述获取每次检测过程中的累积参数值的具体公式为:

12、

13、式中,表示第次检测过程中的累积参数值;表示第次检测过程的整体斜率;表示第次检测过程的整体斜率;表示当前检测次数;表示取绝对值。

14、优选的,所述第次检测过程的整体斜率的获取方法为:

15、对于第次检测过程的数据,将第次检测过程的数据以及第次之前的所有次检测过程的数据作为横坐标,将每次检测过程中的数据的整体数据分布作为纵坐标,进而构建第次检测过程的整体数据分布变化曲线;将第次检测过程的整体数据分布变化曲线上的所有数据点的斜率的均值,记为第次检测过程的第一均值,将第次检测过程的第一均值以及第次之前的所有次检测过程的第一均值的平均值作为第次检测过程的整体斜率。

16、优选的,所述根据每次检测过程中的数据的整体数据分布和偏移方向以及每次检测过程中的累积参数值,获取当前检测过程中的数据的偏离程度,包括的具体方法为:

17、将当前检测过程的数据记为第次检测过程的数据,则第次检测过程的数据的偏移程度的计算表达式为:

18、

19、式中,表示第次检测过程的数据的偏移程度;表示第次之前的所有次检测过程的数据的偏移方向的方差值;表示第次检测过程中的累积参数值;表示第次检测过程的数据的整体数据分布;表示第次检测过程的数据的整体数据分布;表示当前检测次数;表示取绝对值。

20、优选的,所述获取当前检测过程中的数据中每个维度的敏感度的具体公式为:

21、

22、式中,表示第次检测过程中的数据中第个维度的敏感度;表示第次检测过程中的累积参数值;表示第次检测过程的新增多维数据向量集中新增多维数据向量的总数量;表示第次检测过程的新增多维数据向量集中第个新增多维数据向量与第次检测过程的目标数据向量之间的余弦相似度;表示第次检测过程的新增多维数据向量集中第个新增多维数据向量去除去掉第个维度后与第次检测过程的目标数据向量之间的余弦相似度;表示当前检测次数;表示取绝对值;表示线性归一化函数。

23、优选的,所述第次检测过程的新增多维数据向量集的获取方法为:

24、获取第次检测过程的向量空间中每个多维数据向量与其他所有多维数据向量之间的余弦相似度的均值,将均值最小的多维数据向量记为第次检测过程的目标数据向量;将第次检测过程的向量空间相对于第次检测过程的向量空间中新增的若干个多维数据向量,记为第次检测过程的新增多维数据向量集。

25、优选的,所述根据获取当前检测过程中的数据中每个维度的敏感度,获取当前检测过程中的数据中每个维度的调整后的敏感度,包括的具体方法为:

26、对于当前检测过程中的数据中任意一个维度,将所述维度的数据序号作为横坐标,将所述维度的数据值作为纵坐标,由此构建所述维度的数据变化曲线;若所述维度的数据变化曲线与第个维度的数据变化曲线之间的皮尔逊相关系数大于预设阈值,则将所述维度作为与第个维度相互影响的维度;则第次检测过程中的数据中第个维度的调整后的敏感度的计算表达式为:

27、

28、式中,表示第次检测过程中的数据中第个维度的调整后的敏感度;表示第次检测过程中的数据中第个维度的数据的方差;表示第次检测过程中的数据中所有与第个维度相互影响的维度的数据的方差均值;表示第次检测过程中的数据中第个维度的敏感度;表示第次检测过程中的累积参数值。

29、优选的,所述根据当前检测过程中的数据中每个维度的调整后的敏感度和当前检测过程中的数据的偏离程度,获取当前检测过程中的数据中每个维度的插值程度,包括的具体方法为:

30、对于第次检测过程中的数据中第个维度,通过线性归一化函数对第次检测过程中的数据中第个维度的调整后的敏感度进行线性归一化后,得到归一化后的第个维度的调整后的敏感度,将归一化后的第个维度的调整后的敏感度与第次检测过程的数据的偏移程度的乘积,作为第次检测过程中的数据中第个维度的插值程度。

31、本发明的技术方案的有益效果是:针对在网络入侵过程中,不断的增加异常数据,使得异常数据的规模不断变大,进而影响到孤立森林的检测效率,对应会影响到网络入侵检测结果;本发明通过计算每次检测过程中数据的偏移程度来获取插值程度,并结合每个维度数据的特征程度,获取各个维度数据的插值程度,进行自适应插值。其中在向量空间中根据当前检测过程中的所有数据的向量获取整体数据的分布,根据不同检测过程中整体数据分布的变化以及偏移方向获取第一插值程度,并分析每个维度的数据变化来获取特征程度,并结合获取的当前检测过程的数据偏移程度,获取各个维度的第二插值程度,进行自适应插值。避免了传统的孤立森林在检测网络入侵数据的过程中,由于不断增加异常数据使得异常数据的规模过大,造成错误识别的问题,保证了网络入侵数据检测结果的准确性。

32、需要说明的是,本技术中所有获取信号、信息或数据的动作都是在遵照所在地国家相应的数据保护法规政策的前提下,并获得由相应装置所有者给予授权的情况下进行的。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1