一种基于开源数据的网络用户行为监测分析方法与流程

文档序号:33537539发布日期:2023-03-22 08:45阅读:40来源:国知局

1.本发明涉及网络用户行为监测分析领域,具体涉及一种基于开源数据的网络用户行为监测分析方法。


背景技术:

2.在大数量的网络行为中存在着较难辨别且易产生风险的网络用户操作,而这些操作与危害网站或不文明网络流言等有着密不可分的联系,由于网络用户多,操作量大,如何准确的分辨哪些是正常操作,哪些是存在问题风险的操作成为亟需解决的难题,同时,要结合实际情况,利用开源数据对网络用户的风险行为进行预测分析,也逐渐成为摆在面前的难题之一。


技术实现要素:

3.针对现有技术的不足,本发明提供了一种基于开源数据的网络用户行为监测分析方法,通过开源数据的采集积累,形成了一套针对性强,适用范围广的网络用户行为监测方法,大幅提升了监测的准确性与识别效率。
4.为实现上述目的,本发明提供了一种基于开源数据的网络用户行为监测分析方法,包括:基于开源数据得到网络用户历史正常行为数据与网络用户历史异常行为数据;利用所述网络用户历史正常行为数据与网络用户历史异常行为数据进行网络用户行为匹配处理得到网络用户行为待监测初始结果;利用所述网络用户行为待监测初始结果得到网络用户行为监测分析结果。
5.优选的,基于开源数据得到网络用户历史正常行为数据与网络用户历史异常行为数据包括:获取开源数据中网络用户历史正常行为数据;获取开源数据中网络用户历史疑似异常行为数据与网络用户历史确定异常行为数据作为网络用户历史异常行为数据;其中,行为数据包括网络用户浏览数据与网络用户言论数据。
6.优选的,利用所述网络用户历史正常行为数据与网络用户历史异常行为数据进行网络用户行为匹配处理得到网络用户行为待监测初始结果包括:利用网络用户行为待监测数据根据所述网络用户历史正常行为数据与网络用户历史异常行为数据得到网络用户行为待监测相关性数据;利用所述网络用户行为待监测相关性数据得到网络用户行为待监测初始结果。
7.进一步的,所述利用网络用户行为待监测数据根据所述网络用户历史正常行为数据与网络用户历史异常行为数据得到网络用户行为待监测相关性数据包括:利用所述网络用户历史正常行为数据与网络用户历史异常行为数据的网络用户历史疑似异常行为数据获取网络用户行为待监测相关性阈值;
利用网络用户行为待监测数据的网络用户言论数据进行语义分析处理后,根据所述网络用户行为待监测相关性阈值得到网络用户行为待监测相关性初始数据;判断所述网络用户行为待监测相关性初始数据是否存在风险,若是,则利用所述网络用户行为待监测数据的网络用户浏览数据得到网络用户行为待监测相关性数据,否则,利用所述网络用户行为待监测相关性初始数据作为网络用户行为待监测相关性数据。
8.进一步的,利用所述网络用户历史正常行为数据与网络用户历史异常行为数据的网络用户历史疑似异常行为数据获取网络用户行为待监测相关性阈值包括:利用所述网络用户历史异常行为数据的网络用户历史疑似异常行为数据获取网络用户历史疑似异常特征数据;利用所述网络用户历史疑似异常特征数据与网络用户历史正常行为数据获取网络用户行为待监测相关性阈值。
9.进一步的,利用所述网络用户历史异常行为数据的网络用户历史疑似异常行为数据获取网络用户历史疑似异常特征数据包括:利用所述网络用户历史疑似异常行为数据的网络用户言论数据基于语义分析算法得到网络用户言论词汇特征数据;利用所述网络用户历史疑似异常行为数据的网络用户浏览数据基于恶意网站名单得到网络用户浏览网址特征数据;利用所述网络用户言论词汇特征数据与网络用户浏览网址特征数据作为网络用户历史疑似异常特征数据。
10.进一步的,利用所述网络用户历史疑似异常特征数据与网络用户历史正常行为数据获取网络用户行为待监测相关性阈值包括:利用网络用户历史疑似异常特征数据的网络用户言论词汇特征数据与网络用户历史正常行为数据的网络用户言论数据计算网络用户言论数据相似度值的计算式如下:其中,d1为网络用户言论数据相似度值,x
p
为网络用户历史疑似异常特征数据的网络用户言论词汇特征数据,y
p
为网络用户历史正常行为数据的网络用户言论数据;利用网络用户历史疑似异常特征数据的网络用户浏览网址特征数据与网络用户历史正常行为数据的网络用户浏览数据计算网络用户浏览数据相似度值的计算式如下:其中,d2为网络用户浏览数据相似度值,m
p
为网络用户历史疑似异常特征数据的网络用户浏览网址特征数据,n
p
为网络用户历史正常行为数据的网络用户浏览数据;当存在网络用户历史疑似异常特征数据的网络用户言论词汇特征数据时,利用所述网络用户浏览数据相似度值作为网络用户行为待监测相关性阈值;当存在网络用户历史疑似异常特征数据的网络用户浏览网址特征数据时,利用所述网络用户言论数据相似度值作为网络用户行为待监测相关性阈值。
11.进一步的,根据所述网络用户行为待监测相关性阈值得到网络用户行为待监测相关性初始数据包括:当网络用户行为待监测相关性初始数据均大于网络用户行为待监测相关性阈值时,所述网络用户行为待监测相关性初始数据为高风险;当网络用户行为待监测相关性初始数据任一大于网络用户行为待监测相关性阈值时,所述网络用户行为待监测相关性初始数据为低风险;当网络用户行为待监测相关性初始数据均小于网络用户行为待监测相关性阈值时,所述网络用户行为待监测相关性初始数据为无风险;其中,网络用户行为待监测相关性初始数据类型为网络用户浏览数据与网络用户言论数据。
12.进一步的,利用所述网络用户行为待监测相关性数据得到网络用户行为待监测初始结果包括:当网络用户行为待监测相关性数据为网络用户行为待监测数据的网络用户浏览数据时,判断所述网络用户行为待监测数据的网络用户浏览数据中恶意网站的浏览数量是否超过50%,若是,则网络用户行为待监测初始结果为存在风险,否则,所述网络用户行为待监测初始结果为预计风险;当网络用户行为待监测相关性数据为网络用户行为待监测相关性初始数据时,判断所述网络用户行为待监测相关性初始数据的风险变化趋势是否为上升,若是,则网络用户行为待监测初始结果为存在风险,否则,网络用户行为待监测初始结果为暂无风险。
13.优选的,利用所述网络用户行为待监测初始结果得到网络用户行为监测分析结果包括:当所述网络用户行为待监测初始结果存在风险时,判断所述网络用户行为待监测初始结果是否低于相邻上一时刻网络用户行为待监测初始结果,若是,则所述网络用户行为监测分析结果为预计风险,否则,所述网络用户行为监测分析结果为存在风险;当所述网络用户行为待监测初始结果不存在风险时,所述网络用户行为监测分析结果为无风险。
14.与最接近的现有技术相比,本发明具有的有益效果:基于大量开源数据保证了监测分析方法的适用性强,不会脱离实际应用情况,同时对于风险行为操作进行多时刻验证,提升了监测的准确性,避免了单一数据或误操作造成的误差,在多时刻验证的基础上又提出了网络浏览行为与网络言论行为的结合处理,提升了监测分析结果的高度可信性,增强了对于异常网络行为的掌控力度。
附图说明
15.图1是本发明提供的一种基于开源数据的网络用户行为监测分析方法的流程图。
具体实施方式
16.下面结合附图对本发明的具体实施方式作进一步的详细说明。
17.为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是
本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
18.实施例1:本发明提供了一种基于开源数据的网络用户行为监测分析方法,如图1所示,包括:s1、基于开源数据得到网络用户历史正常行为数据与网络用户历史异常行为数据;s2、利用所述网络用户历史正常行为数据与网络用户历史异常行为数据进行网络用户行为匹配处理得到网络用户行为待监测初始结果;s3、利用所述网络用户行为待监测初始结果得到网络用户行为监测分析结果。
19.s1具体包括:s1-1、获取开源数据中网络用户历史正常行为数据;s1-2、获取开源数据中网络用户历史疑似异常行为数据与网络用户历史确定异常行为数据作为网络用户历史异常行为数据;其中,行为数据包括网络用户浏览数据与网络用户言论数据。
20.s2具体包括:s2-1、利用网络用户行为待监测数据根据所述网络用户历史正常行为数据与网络用户历史异常行为数据得到网络用户行为待监测相关性数据;s2-2、利用所述网络用户行为待监测相关性数据得到网络用户行为待监测初始结果。
21.s2-1具体包括:s2-1-1、利用所述网络用户历史正常行为数据与网络用户历史异常行为数据的网络用户历史疑似异常行为数据获取网络用户行为待监测相关性阈值;s2-1-2、利用网络用户行为待监测数据的网络用户言论数据进行语义分析处理后,根据所述网络用户行为待监测相关性阈值得到网络用户行为待监测相关性初始数据;s2-1-3、判断所述网络用户行为待监测相关性初始数据是否存在风险,若是,则利用所述网络用户行为待监测数据的网络用户浏览数据得到网络用户行为待监测相关性数据,否则,利用所述网络用户行为待监测相关性初始数据作为网络用户行为待监测相关性数据。
22.s2-1-1具体包括:s2-1-1-1、利用所述网络用户历史异常行为数据的网络用户历史疑似异常行为数据获取网络用户历史疑似异常特征数据;s2-1-1-2、利用所述网络用户历史疑似异常特征数据与网络用户历史正常行为数据获取网络用户行为待监测相关性阈值。
23.s2-1-1-1具体包括:s2-1-1-1-1、利用所述网络用户历史疑似异常行为数据的网络用户言论数据基于语义分析算法得到网络用户言论词汇特征数据;s2-1-1-1-2、利用所述网络用户历史疑似异常行为数据的网络用户浏览数据基于恶意网站名单得到网络用户浏览网址特征数据;s2-1-1-1-3、利用所述网络用户言论词汇特征数据与网络用户浏览网址特征数据
作为网络用户历史疑似异常特征数据。
24.本实施例中,一种基于开源数据的网络用户行为监测分析方法,所述恶意网站名单、网络用户历史异常行为数据以及网络用户历史疑似异常行为数据均为基于开源数据获取,并作为本方法的基础数据准则。
25.s2-1-1-2具体包括:s2-1-1-2-1、利用网络用户历史疑似异常特征数据的网络用户言论词汇特征数据与网络用户历史正常行为数据的网络用户言论数据计算网络用户言论数据相似度值的计算式如下:其中,d1为网络用户言论数据相似度值,x
p
为网络用户历史疑似异常特征数据的网络用户言论词汇特征数据,y
p
为网络用户历史正常行为数据的网络用户言论数据;s2-1-1-2-2、利用网络用户历史疑似异常特征数据的网络用户浏览网址特征数据与网络用户历史正常行为数据的网络用户浏览数据计算网络用户浏览数据相似度值的计算式如下:其中,d2为网络用户浏览数据相似度值,m
p
为网络用户历史疑似异常特征数据的网络用户浏览网址特征数据,n
p
为网络用户历史正常行为数据的网络用户浏览数据;s2-1-1-2-3、当存在网络用户历史疑似异常特征数据的网络用户言论词汇特征数据时,利用所述网络用户浏览数据相似度值作为网络用户行为待监测相关性阈值;s2-1-1-2-4、当存在网络用户历史疑似异常特征数据的网络用户浏览网址特征数据时,利用所述网络用户言论数据相似度值作为网络用户行为待监测相关性阈值。
26.s2-1-2具体包括:s2-1-2-1、当网络用户行为待监测相关性初始数据均大于网络用户行为待监测相关性阈值时,所述网络用户行为待监测相关性初始数据为高风险;s2-1-2-2、当网络用户行为待监测相关性初始数据任一大于网络用户行为待监测相关性阈值时,所述网络用户行为待监测相关性初始数据为低风险;s2-1-2-3、当网络用户行为待监测相关性初始数据均小于网络用户行为待监测相关性阈值时,所述网络用户行为待监测相关性初始数据为无风险;其中,网络用户行为待监测相关性初始数据类型为网络用户浏览数据与网络用户言论数据。
27.s2-2具体包括:s2-2-1、当网络用户行为待监测相关性数据为网络用户行为待监测数据的网络用户浏览数据时,判断所述网络用户行为待监测数据的网络用户浏览数据中恶意网站的浏览数量是否超过50%,若是,则网络用户行为待监测初始结果为存在风险,否则,所述网络用户行为待监测初始结果为预计风险;s2-2-2、当网络用户行为待监测相关性数据为网络用户行为待监测相关性初始数据时,判断所述网络用户行为待监测相关性初始数据的风险变化趋势是否为上升,若是,则
网络用户行为待监测初始结果为存在风险,否则,网络用户行为待监测初始结果为暂无风险。
28.s3具体包括:s3-1、当所述网络用户行为待监测初始结果存在风险时,判断所述网络用户行为待监测初始结果是否低于相邻上一时刻网络用户行为待监测初始结果,若是,则所述网络用户行为监测分析结果为预计风险,否则,所述网络用户行为监测分析结果为存在风险;s3-2、当所述网络用户行为待监测初始结果不存在风险时,所述网络用户行为监测分析结果为无风险。
29.最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1