本技术涉及网络安全,特别是涉及一种诈骗网址识别预警方法、装置、设备及存储介质。
背景技术:
1、
2、现有技术中,诈骗网址识别方法主要是采用基于内容的匹配技术,通过从网址对应网站抓取网页内容的文本关键词进行匹配,或者通过对应网址抓取的网页图片进行构建深度学习模型进行图片分类来进行识别诈骗网址,但是,该识别方法模式单一,识别效率和准确率较低,容易出现漏报、误报等情况,以致无法对受骗者进行高效预警。因此,如何高效准确地对各涉诈网址进行识别并进行及时预警,是一个亟需解决的问题。
技术实现思路
1、基于此,有必要针对上述技术问题,提供一种诈骗网址识别预警方法、装置、设备和存储介质。
2、一方面,提供一种诈骗网址识别预警方法,所述方法包括:
3、收集并归档现有诈骗网址数据,基于所述现有诈骗网址数据,构建诈骗网址数据库;
4、获取用户端的实时互联网访问数据,抓取访问网址数据特征,对所述访问网址数据特征进行预处理,得到第一特征数据;
5、基于所述诈骗网址数据库,对所述第一特征数据进行初步检测;
6、响应于检测到所述诈骗网址数据库中不包含所述第一特征数据时,对所述访问网址数据特征进行二次处理,得到第二特征数据;
7、将所述第二特征数据输入至预设的诈骗网址识别模型,根据输出结果判断所述访问网址数据特征对应的网址是否为诈骗网址;
8、若是,则对目标网址进行拦截,并向用户端发送预警信息。
9、在其中一个实施例中,还包括:所述收集并归档现有诈骗网址数据,基于所述现有诈骗网址数据,构建诈骗网址数据库包括:
10、获取所述现有诈骗网址数据的属性信息,所述属性信息包括服务器地址、诈骗信息类别和文本非法关键词数量;
11、基于所述属性信息对所述诈骗网址数据进行分类分级,对分级分类结果进行标记;
12、将标记后的分级分类结果存储于源数据库中,生成所述诈骗网址数据库。
13、在其中一个实施例中,还包括:所述获取用户端的实时互联网访问数据,抓取访问网址数据特征,对所述访问网址数据特征进行预处理,得到第一特征数据包括:
14、识别所述访问网址数据特征中的文本非法关键词,并统计所述文本非法关键词的数量;
15、获取所述访问网址数据特征的服务器地址;
16、基于所述文本非法关键词的数量和所述服务器地址,对所述访问网址数据特征进行分类标记,得到所述第一特征数据。
17、在其中一个实施例中,还包括:所述基于所述诈骗网址数据库,对所述第一特征数据进行初步检测包括:
18、基于所述分类标记,选取诈骗网址数据库中同规格分级分类结果对应的数据;
19、将目标数据与所述分类标记对应的文本非法关键词的数量和服务器地址分别进行比对;
20、响应于比对成功结果,则对所述第一特征数据对应的网址进行拦截,并向所述用户端发送预警信息;
21、响应于比对不成功结果,判断所述诈骗网址数据库中不包含所述第一特征数据。
22、在其中一个实施例中,还包括:所述响应于检测到所述诈骗网址数据库中不包含所述第一特征数据时,对所述访问网址数据特征进行二次处理,得到第二特征数据包括:
23、定义访问网址数据特征对应的状态集合为,每个状态构成诈骗网址的概率为,且,则构建所述访问网址数据特征对应的风险预测模型包括:
24、
25、
26、
27、其中,表示风险预测值,表示比例常数,表示拟合值,表示拟合函数,表示常数系数,表示域名混乱程度,表示域名总长度,域名数量,表示非标端口数量,表示文本非法关键词数量,表示icp备案结果,有备案,则,无备案,则,则表示初步检测相似度;
28、定义所述风险预测值为第二特征数据。
29、在其中一个实施例中,还包括:所述预设的诈骗网址识别模型包括:
30、
31、其中,表示输出值,表示修正系数,为向上取整数,表示访问网址数据特征统计量,表示网址对应文本特征统计函数,表示动态参数。
32、在其中一个实施例中,还包括:所述根据输出结果判断所述访问网址数据特征对应的网址是否为诈骗网址包括:
33、响应于检测到所述输出值大于第一预设值、小于或等于第二预设值时,判断所述访问网址数据特征对应的网址为诈骗网址,且为压降类型诈骗;
34、响应于检测到所述输出值大于第二预设值时,判断所述访问网址数据特征对应的网址为诈骗网址,且为长期存在且高发类型诈骗;
35、响应于检测到所述输出值小于或等于第一预设值时,判断所述访问网址数据特征对应的网址为非诈骗网址。
36、另一方面,提供了一种诈骗网址识别预警装置,所述装置包括:
37、数据库构建模块,用于收集并归档现有诈骗网址数据,基于所述现有诈骗网址数据,构建诈骗网址数据库;
38、第一特征数据获取模块,用于获取用户端的实时互联网访问数据,抓取访问网址数据特征,对所述访问网址数据特征进行预处理,得到第一特征数据;
39、检测模块,用于基于所述诈骗网址数据库,对所述第一特征数据进行初步检测;
40、第二特征数据获取模块,用于响应于检测到所述诈骗网址数据库中不包含所述第一特征数据时,对所述访问网址数据特征进行二次处理,得到第二特征数据;
41、判断模块,用于将所述第二特征数据输入至预设的诈骗网址识别模型,根据输出结果判断所述访问网址数据特征对应的网址是否为诈骗网址;
42、预警信息发送模块,用于在所述访问网址数据特征对应的网址为诈骗网址时,对目标网址进行拦截,并向用户端发送预警信息。
43、再一方面,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
44、收集并归档现有诈骗网址数据,基于所述现有诈骗网址数据,构建诈骗网址数据库;
45、获取用户端的实时互联网访问数据,抓取访问网址数据特征,对所述访问网址数据特征进行预处理,得到第一特征数据;
46、基于所述诈骗网址数据库,对所述第一特征数据进行初步检测;
47、响应于检测到所述诈骗网址数据库中不包含所述第一特征数据时,对所述访问网址数据特征进行二次处理,得到第二特征数据;
48、将所述第二特征数据输入至预设的诈骗网址识别模型,根据输出结果判断所述访问网址数据特征对应的网址是否为诈骗网址;
49、若是,则对目标网址进行拦截,并向用户端发送预警信息。
50、又一方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
51、收集并归档现有诈骗网址数据,基于所述现有诈骗网址数据,构建诈骗网址数据库;
52、获取用户端的实时互联网访问数据,抓取访问网址数据特征,对所述访问网址数据特征进行预处理,得到第一特征数据;
53、基于所述诈骗网址数据库,对所述第一特征数据进行初步检测;
54、响应于检测到所述诈骗网址数据库中不包含所述第一特征数据时,对所述访问网址数据特征进行二次处理,得到第二特征数据;
55、将所述第二特征数据输入至预设的诈骗网址识别模型,根据输出结果判断所述访问网址数据特征对应的网址是否为诈骗网址;
56、若是,则对目标网址进行拦截,并向用户端发送预警信息。
57、上述的诈骗网址识别预警方法、装置、设备及存储介质,所述方法包括:收集并归档现有诈骗网址数据,基于所述现有诈骗网址数据,构建诈骗网址数据库;获取用户端的实时互联网访问数据,抓取访问网址数据特征,对所述访问网址数据特征进行预处理,得到第一特征数据;基于所述诈骗网址数据库,对所述第一特征数据进行初步检测;响应于检测到所述诈骗网址数据库中不包含所述第一特征数据时,对所述访问网址数据特征进行二次处理,得到第二特征数据;将所述第二特征数据输入至预设的诈骗网址识别模型,根据输出结果判断所述访问网址数据特征对应的网址是否为诈骗网址;若是,则对目标网址进行拦截,并向用户端发送预警信息,本技术可以准确、高效地对各涉诈网址进行识别,能够对受骗者进行及时预警。