基于AI的白名单生成方法、装置、电子设备、可读介质与流程

文档序号：25991907发布日期：2021-07-23 21:04阅读：来源：国知局

技术特征：

1.一种基于ai的白名单生成方法，其特征在于，该方法具体为：

1)获取目标网站的流量数据；该流量数据包含所述目标网站下多个网页的统一资源定位符url；

2)针对每一个所述url，提取url的路径部分，并对所述url的路径部分进行泛化替换，得到url的第一泛化路径信息；所述url的第一泛化路径信息用于表征url的初始模式；

3)将所述初始模式相似的url的第一泛化路径信息进行合并处理，得到url的第二泛化路径信息；所述url的第二泛化路径信息用于表征url的最终模式；

4)根据第一泛化路径信息、第二泛化路径信息，进行变量解析，获得变量参数；

5)获取变量参数对应的ai模型，ai模型为基于人工智能学习的表征变量安全的模型；

6)对变量参数进行判断，判断变量参数是否符合ai模型；

7)若变量参数符合ai模型，基于所述url的第二泛化路径信息生成与目标网站对应的白名单；

8)若变量参数不符合ai模型，基于该检测结果对相应的web数据进行防护。

2.如权利要求1所述的基于ai的白名单生成方法，其特征在于，对所述url的路径部分进行泛化替换，得到url的第一泛化路径信息，包括：计算所述url的路径部分的相似度；若所述相似度大于或等于预设阈值，则基于预设泛化规则对所述url的路径部分进行泛化替换，得到所述url的第一泛化路径信息。

3.如权利要求1所述的基于ai的白名单生成方法，其特征在于，计算所述url的路径部分的相似度，包括：将所述url的路径部分解析为多层级的目录；记录所述目录的总层数和最长公共层数；基于所述目录的总层数和所述最长公共层数，计算所述url的路径部分的相似度。

4.如权利要求1所述的基于ai的白名单生成方法，其特征在于，基于预设泛化规则对所述url的路径部分进行泛化替换，得到所述url的第一泛化路径信息，包括：确定所述url的路径部分中的待泛化目录；所述待泛化目录为所述url的路径部分中的任一层级的目录；基于预设泛化规则对所述url的路径部分中的待泛化目录进行泛化处理，得到所述url的第一泛化路径信息。

5.如权利要求1所述的基于ai的白名单生成方法，其特征在于，将所述初始模式相似的url的第一泛化路径信息进行合并处理，得到url的第二泛化路径信息，包括：基于所述相似度，判断多个url的初始模式是否相似；若相似，则将所述初始模式相似的所述多个url的第一泛化路径信息进行合并处理，得到url的第二泛化路径信息。

6.如权利要求1所述的基于ai的白名单生成方法，其特征在于，所述步骤5)中，所述基于人工智能学习的表征变量安全的模型，具体为：获取已知安全网站对应的白名单的第一泛化路径信息、第二泛化路径信息，对该已知的第一泛化路径信息、第二泛化路径信息进行变量解析，得到实时变量参数；将实时变量参数输入至预先训练的机器学习模型；获取所述机器学习模型基于所述实时变量输出的ai模型。

7.如权利要求1所述的基于ai的白名单生成方法，其特征在于，所述变量参数包括参数类型、参数关键词、参数名、关键词编码、请求参数值、路径信息。

8.一种基于ai的白名单生成装置，其特征在于，该装置包括：

获取单元，用于获取目标网站的流量数据；其中，流量数据包含目标网站下多个网页的统一资源定位符url；

泛化替换单元，用于针对每一个url，提取url的路径部分，并对url的路径部分进行泛化替换，得到url的第一泛化路径信息；其中，url的第一泛化路径信息用于表征url的初始模式；

合并处理单元，用于将初始模式相似的url的第一泛化路径信息进行合并处理，得到url的第二泛化路径信息；其中，url的第二泛化路径信息用于表征url的最终模式；

变量解析单元，根据第一泛化路径信息、第二泛化路径信息，进行变量解析，获得变量参数；

ai模型，通过变量参数对应的ai模型，对变量参数进行判断，判断变量参数是否符合ai模型；

生成单元，若变量参数符合ai模型，用于基于url的第二泛化路径信息生成与目标网站对应的白名单。若变量参数不符合ai模型，基于该检测结果对相应的web数据进行防护。

9.一种电子设备，其特征在于，包括存储器、处理器，所述存储器中存储有可在所述处理器上运行的计算机程序，其特征在于，处理器执行计算机程序时实现如权利要求1至7任一项所述的方法。

10.一种可读介质，其特征在于，具体为具有处理器可执行的非易失的程序代码的计算机可读介质，所述程序代码使所述处理器执行如权利要求1至7任一项所述的方法。

技术总结
本发明公开了一种基于AI的白名单生成方法、装置、电子设备、可读介质，本发明可以实现对获取的目标网站的流量数据进行泛化替换和合并处理，该方式能够自动生成白名单，关键在上述生成白名单的程序中增加了AI模型判断的过程，大大的提高了白名单的准确性，可及时应用于Web应用防火墙，因此本发明实施例具有准确性高、成本低，时效性强的有益效果。

技术研发人员：马囡囡;泮晓波;陈树华
受保护的技术使用者：北京顶象技术有限公司
技术研发日：2021.03.10
技术公布日：2021.07.23

完整全部详细技术资料下载

当前第2页1 2