一种互联网用户行为分析预警系统及方法

文档序号:7782595阅读:465来源:国知局
一种互联网用户行为分析预警系统及方法
【专利摘要】本发明所述的一种互联网用户行为分析预警系统及方法,数据包采集模块采集完整的网络数据包并存入数据存储服务器中,数据包挖掘模块对数据进行检索和过滤,将过滤得到的数据按不同的类别进行分类,确保分类数据的有效性。检索得到的分类数据与匹配模板所存储的预警条件进行匹配,并可分析用户使用互联网的行为,自动判断用户使用互联网行为的危害性。系统的匹配模板自动生成模块可实现人工结合机器智能更新模板数据库,降低人工成本的同时确保匹配模板的时效性,有别于传统的固定的计算方法来判断用户使用互联网的行为。将用户使用互联网的详细数据在所有类别下的匹配结果汇总反馈,可方便网络监控人员第一时间预警将要发生的网络危害。
【专利说明】—种互联网用户行为分析预警系统及方法
【技术领域】
[0001]本发明涉及一种网络安全系统及方法。具体地说涉及一种互联网用户行为分析预警系统及方法。
【背景技术】
[0002]随着互联网技术的不断发展,不良信息对社会的影响越来越大。网络工具,随着QQ、微博等不断涌现使得信息的传递变得十分迅速,稍有不甚不良信息如谣言便可大规模传播。如何规范引导用户正确上网,控制不良信息的传播是网络管理者所要面对的核心问题。作为预防网络危害的主要手段是对用户网络行为进行监控与分析。传统的网络监控行为通常有以下两种:一种是通过数据包采集记录被监控的网民的上网信息,以把网民的上网行为进行进一步区分,分析用户上网行为;另一种是通过设置关键词或通过用户举报过滤不良网站,阻止用户访问。
[0003]中国专利文献CNIO 2946 319A公开了 一种网络用户行为信息分析系统及分析方法,用于该系统包括:网络用户行为数据获取模块、网络用户行为数据预处理模块、网络用户行为数据存储服务器、网络用户行为数据存储服务器、分析结果显示模块。该分析方法包括以下四个步骤:1.网络用户行为数据获取模块通过基于应用层的网站程序(埋点程序)获取用户数据;2.通过网络用户行为数据预处理模块对网站日志进行识别,筛选出用于用户行为信息分析的用户行为数据;3.通过行为序列分析将提取的用户行为数据转换成行为数据,并存储;4.通过网络用户行为数据分析模块运用系统设定的用户行为模式挖掘方法对用户行为数据进行分析;5.将用户行为信息分析的结果反馈在用户终端显示器界面。埋点程序是基于应用层的网站程序,能够采集用户使用普通网站的信息,若用户通过其它通信软件比如QQ,进行互联网通信时,则该埋点程序无法获取用户使用互联网的完整信息。因此可能遗漏一些重要数据的采集、分析,造成采集的数据不够全面。另外,该专利文献公开的网络用户行为信息分析系统及分析方法采用固定的支持度计算和相关性分析对用户使用互联网行为数据进行挖掘,只能够挖掘已经总结过的已知的用户行为,当用户出现新的行为时,上述专利文献公开的方案就需要通过不断的软件和系统升级定义相应的新行为作为挖掘和分析的内容,因此,上述专利文献公开的网络用户行为信息分析系统及分析方法的挖掘和分析均具有滞后性,无法预警用户新的网络行为存在的潜在危害如减少该滞后则需要提高更新的频率,这样使得成本大大提高。

【发明内容】

[0004]为此,本发明所要解决的技术问题在于现有技术中通过埋点程序无法获取用户使用互联网的详细信息,以及通过固定的计算方法挖掘和分析用户行为带来的无法兼顾低成本和同时解决滞后性,无法预警用户新的网络行为存在的潜在危害。从而提出一种互联网用户行为分析预警系统及方法。
[0005]为解决上述技术问题,本发明采用的技术方案为:[0006]一种互联网用户行为分析预警系统,包括以下模块:
[0007]数据包采集模块,采集被监控设备网络端口上所有的数据包,并将数据包发送至数据存储服务器;
[0008]数据存储服务器,存储采集到的数据包;
[0009]数据包挖掘模块,检索所述数据存储服务器存储的数据包,过滤得到有效的数据并按不同的类别进行分类,将得到的分类数据与匹配模板进行匹配,并根据匹配程度确定用户行为安全等级;
[0010]匹配模板自动生成模块,按设定的分类类别生成匹配模板,在设定周期内自动检索互联网中的热门信息并在过滤后作为预警条件存储,或人工添加预警条件;
[0011]匹配结果反馈模块,反馈所述数据包挖掘模块的匹配结果。
[0012]所述数据包挖掘模块将过滤得到的有效数据按以下类别进行分类:
[0013](I)网站链接,包括用户所访问网站的链接以及网站主要内容概要和标签内容;
[0014](2)用户身份,包括用户输入账户、密码信息;
[0015](3)关键词,包括用户输入频率高的词语、短句。
[0016]所述匹配模板进一步包括以下三个匹配子模板:
[0017](I):特定网站分类子模板,将网站信息实时自动更新存储或人工添加网站信息,将网站主要分为:色情网站、涉密网站、反动网站、诈骗网站、暴力网站;
[0018](2):特定人群分类子模板,与相关安全部门的数据库相连,获取相关特定人群的信息记录或人工添加特定人群的信息记录,将特定人群分为:在逃犯人、嫌疑犯人、具有反动倾向的人、具有暴力倾向的人、具有自杀倾向的人;
[0019](3):特定关键词子模板,设置筛选条件自动将互联网中高频率出现的非法关键词或关键字,以及对所述非法关键词或关键字做智能逻辑组合和变形后的词汇进行截留,得到符合条件的关键词并存储或人工添加特定的关键词并存储。
[0020]所述数据包挖掘模块还包括以下三个子模块:
[0021]网络内容挖掘子模块,读取用户所访问网站的链接与所述特定网站分类子模板存储的预警条件进行匹配并判断所访问网站的安全等级;根据用户输入账户、密码信息确定用户身份,并将所述用户与所述特定人群分类子模板存储的预警条件进行匹配并判断用户的安全等级;读取网站标签内容及检索用户输入频率高的词语和短句,得到用户输入的关键词,将得到的关键词与所述特定关键词子模板进行匹配并判断所输入的关键词的安全等级;
[0022]网络结构挖掘子模块,读取用户所访问网站的链接,通过所述特定网站分类子模板存储的预警条件进行网站归类,判断用户所访问网站间的关系,根据统计用户访问网站的类别,进行用户上网行为动机的归类;
[0023]网络用法挖掘子模块,通过用户访问网站的记录对上网用户进行分类。
[0024]所述匹配结果反馈模块中,匹配结果反馈将数据包挖掘匹配的结果以报表方式进行反馈,并可根据需要设置以下报警方式:声音报警、短信报警、邮件报警、操作界面弹窗。
[0025]一种互联网用户行为分析预警方法,包括以下步骤:
[0026]S1:数据包采集,采集被监控设备网络端口上所有的数据包;
[0027]S2:数据包存储,存储采集到的数据包;[0028]S3:数据包挖掘,检索存储的数据包,过滤得到有效的数据并按不同的类别进行分类,将得到的分类数据与匹配模板进行匹配,并根据匹配程度确定用户行为安全等级;
[0029]S4:匹配模板自动生成,按设定的分类类别生成匹配模板,在设定周期内自动检索互联网中热门信息过滤后作为预警条件存储,或人工添加预警条件;
[0030]S5:匹配结果反馈,反馈匹配结果。
[0031]在步骤S4中,将过滤得到的有效数据按以下类别进行分类:
[0032](I)网站链接,包括用户所访问网站的链接以及网站主要内容概要和标签内容;
[0033](2)用户身份,包括用户输入账户、密码信息;
[0034](3)关键词,包括用户输入频率高的词语、短句。
[0035]所述匹配模板进一步包括以下三个匹配子模板:
[0036](I):特定网站分类子模板,将网站信息实时自动更新存储或人工添加网站信息,将网站主要分为:色情网站、涉密网站、反动网站、诈骗网站、暴力网站;
[0037](2):特定人群分类子模板,与相关安全部门的数据库相连,获取相关特定人群的信息记录或人工添加特定人群的信息记录,将特定人群分为:在逃犯人、嫌疑犯人、具有反动倾向的人、具有暴力倾向的人、具有自杀倾向的人;
[0038](3):特定关键词子模板,设置筛选条件自动将互联网中高频率出现的非法关键词或关键字,以及对所述非法关键词或关键字做智能逻辑组合和变形后的词汇进行截留,得到符合条件的关键词并存储或人工添加特定的关键词并存储。
[0039]在步骤S3中还包括以下三个步骤:
[0040]S31:网络内容挖掘,读取用户所访问网站的链接与所述特定网站分类子模板存储的预警条件进行匹配并判断所访问网站的安全等级;根据用户输入账户、密码信息确定用户身份,并将所述用户与所述特定人群分类子模板存储的预警条件进行匹配并判断用户的安全等级;读取网站标签内容并检索用户输入频率高的词语和短句,得到用户输入的关键词,将得到的关键词与所述特定关键词子模板进行匹配并判断所输入的关键词的安全级别;
[0041]S32:网络结构挖掘,读取用户所访问网站的连接,通过所述特定网站分类子模板存储的预警条件进行网站归类,判断用户所访问网站间的关系,根据统计用户访问网站的类别,进行用户上网行为动机的归类;
[0042]S33:网络用法挖掘,通过用户访问网站的记录对所有上网用户进行分类。
[0043]所述步骤S6中,匹配结果反馈将数据包挖掘匹配的结果以报表方式进行反馈,并可根据需要设置以下报警方式:声音报警、短信报警、邮件报警、操作界面弹窗。
[0044]本发明的上述技术方案相比现有技术具有以下优点:
[0045]1.本发明所述的一种互联网用户行为分析预警系统,数据包采集模块采集完整的网络数据包并存入数据存储服务器中,数据包挖掘模块对数据存储服务器中的海量数据进行检索和过滤,将过滤得到的数据按不同的类别进行分类,确保分类数据的有效性。检索得到的分类数据与匹配模板所存储的预警条件进行匹配,并可分析用户使用互联网的行为,自动判断用户使用互联网行为的危害性。系统的匹配模板自动生成模块可实现人工结合机器智能更新模板数据库,降低人工成本的同时确保匹配模板的时效性。将用户使用互联网的详细数据在所有类别下的匹配结果汇总反馈,可方便网络监控人员第一时间预警将要发生的网络危害。
[0046]2.本发明所述的一种互联网用户行为分析预警系统,数据包挖掘模块将用户使用互联网的详细数据按以下类别进行分类:(I)网站链接,包括用户所访问网站的链接以及网站主要内容概要,可记录用户所有访问网站的地址记录,通过记录网站主要内容概要可判断出网站类型;(2)用户身份,通过用户输入账户、密码信息可确认用户身份,方便系统或监控人员识别用户;(3)关键词,通过记录用户输入频率高的词语、短句可以方便系统进行检索、分析出用户潜在行为。
[0047]3.本发明所述的一种互联网用户行为分析预警系统的模板数据库进一步包括以下匹配子模板:(1)特定网站分类子模板,用于记录不同的网站链接,并可实时更新数据,确保数据的及时性;(2)特定人群分类子模板,可与外部数据库相连接,获取相关特定人群的信息记录,可将特定人群分为不同的类型,使分类更加齐全;(3)特定关键词子模板,存储有指定的词汇,并可设置筛选条件,自动将互联网中高频出现的热门词汇进行过滤,得到符合条件的关键词并存储。模板数据库的匹配子模板数据可自动更新,使得匹配子模板数据能及时自动更新,避免因系统模板因模板陈旧导致新的潜在风险得不到预防。
[0048]4.本发明所述的一种互联网用户行为分析预警系统的数据包挖掘模块进一步包括以下子模块:(1)网络内容挖掘子模块,用于将用户输入的网络链接与所述的特定网站分类子模板存储的预警条件进行匹配,并得到访问网站的安全等级,可自动监控并记录用户每次访问网站的安全等级;根据用户输入的账号密码得出的用户的身份信息,将得到的身份信息与所述特定人群分类子模板进行匹配得到用户身份安全等级,可使系统自动识别用户身份。根据用户所访问网站的网站标签内容及数据结构的文本得到用户所输入的词汇,并与所述特定关键词子模板进行匹配,并得到所输入词语的安全等级,系统可详细记录用户具体输入的词语。(2)网络结构挖掘模块,读取用户所访问网站的链接,通过所述特定网站分类子模板存储的预警条件进行网站归类,可了解用户所访问网站的类别。从而可以对用户上网行为动机的归类。(3)网络用法挖掘子模块,通过用户在使用互联网过程中的访问记录,对上网用户进行分类,方便后台监控人员查阅。
[0049]5.本发明所述的一种互联网用户行为分析预警系统的结果反馈模块可将匹配结果以报表的方式详细反馈,并可根据需要设置多种报警方式方便提醒后台监控人员及时发现网络危险情形。
[0050]6.本发明所述的一种互联网用户行为分析预警方法,采集模块采集完整的网络数据包并存储,对存储的数据包的进行检索和过滤,将过滤得到的数据按不同的类别进行分类,确保分类数据的有效性。检索得到的分类数据与匹配模板所存储的预警条件进行匹配,并可分析用户使用互联网的行为,可自动判断用户使用互联网行为的危害性。系统的匹配模板自动生成模块可实现人工结合机器智能更新模板数据库,降低人工成本的同时确保匹配模板的时效性。将用户使用互联网的详细数据在所有类别下的匹配结果反馈,可方便网络监控人员第一时间预警将要发生的网络危害。
[0051]7.本发明所述的一种互联网用户行为分析预警方法,数据分类的步骤中将用户使用互联网的详细数据按以下类别进行分类:(1)网站链接,包括用户所访问网站的链接以及网站主要内容概要,可记录用户所有访问网站的地址记录,通过记录网站主要内容概要可判断出网站类型;(2)用户身份,通过用户输入账户、密码信息可确认用户身份,方便系统或监控人员识别用户;(3)关键词,通过记录用户输入频率高的词语、短句可以方便系统进行检索、分析出用户潜在行为。
[0052]8.本发明所述的一种互联网用户行为分析预警方法的生成匹配模板的步骤进一步包括以下匹配子模板:(1)特定网站分类子模板,用于记录不同的网站链接,并可实时更新数据,确保数据的及时性;(2)特定人群分类子模板,可与外部数据库相连接,获取相关特定人群的信息记录,可将特定人群分为不同的类型,使分类更加齐全;(3)特定关键词子模板,存储有指定的词汇,并可设置筛选条件,自动将互联网中高频出现的热门词汇进行过滤,得到符合条件的关键词并存储。匹配子模板数据可自动更新,使得匹配子模板数据能及时自动更新,避免因系统模板因模板陈旧导致新的潜在风险得不到预防。
[0053]9.本发明所述的一种互联网用户行为分析预警方法的数据包挖掘步骤进一步包括以下步骤:(I)网络内容挖掘子,用于将用户输入的网络链接与所述的特定网站分类子模板存储的预警条件进行匹配,并得到访问网站的安全等级,可自动监控并记录用户每次访问网站的安全等级;根据用户输入的账号密码得出的用户的身份信息,将得到的身份信息与所述特定人群分类子模板进行匹配得到用户身份安全等级,可使系统自动识别用户身份。根据用户所访问网站的网站标签内容及数据结构的文本得到用户所输入的词汇,并与所述特定关键词子模板进行匹配,并得到所输入词语的安全等级,系统可详细记录用户具体输入的词语。(2)网络结构挖掘,读取用户所访问网站的链接,通过所述特定网站分类子模板存储的预警条件进行网站归类,可了解用户所访问网站的类别。从而可以对用户上网行为动机的归类。(3)网络用法挖掘子,通过用户在使用互联网过程中的访问记录,对上网用户进行分类,方便后台监控人员查阅。
[0054]10.本发明所述的一种互联网用户行为分析预警方法的结果反馈步骤可将匹配结果以报表的方式详细反馈,并可根据需要设置多种报警方式方便提醒后台监控人员及时发现网络危险情形。
【专利附图】

【附图说明】
[0055]为了使本发明的内容更容易被清楚的理解,下面根据本发明的具体实施例并结合附图,对本发明作进一步详细的说明,其中
[0056]图1是本发明一个实施例的一种互联网用户行为分析预警系统的结构框图;
[0057]图2是本发明一个实施例的一种互联网用户行为分析预警方法的流程图。
[0058]图中附图标记表示为:1_数据包采集模块;2_数据存储服务器;3_数据包挖掘模块;4_匹配模板自动生成模块;5_结果反馈模块。
【具体实施方式】
[0059]实施例1
[0060]参见图1所示,为本发明一个实施例的一种互联网用户行为分析预警系统,包括以下模块:
[0061]数据包采集模块1:采集被监控设备网络端口上所有的数据包,并将数据包发送至数据存储服务器2。具体过程为:所述数据包采集模块I通过被监控设备的网卡驱动层基于Libpcap (数据包捕获函数库)进行数据包采集,可采集到如QQ聊天记录、飞信、微信、微博、通过代理服务器登入的网站等数据,并将复制的数据包发送至数据存储服务器2。
[0062]数据存储服务器2,存储采集到的数据包;数据存储服务器2可以是常规的服务器设备。数据存储服务器2可在设定周期到达后,自动删除数据存储服务器2中存储的历史数据。
[0063]数据包挖掘模块3:首先将数据存储服务器2中存储的数据包,进行解析,每一个数据包都带有一个序列号和应答号,数据包挖掘模块3将数据包的序列号和应答号进行拼接,从而还原一个完整的数据即得到用户使用互联网的详细数据。并对获取的详细数据进行检索,过滤得到有效的数据并按不同的类别进行分类;过滤的条件可以是:过滤无有效内容的数据包。将得到的分类数据与匹配模板自动生成模块4中匹配模板中存储的预警条件进行匹配,并根据匹配程度确定用户行为安全等级。例如所述互联网用户行为分析系统(简称系统)通过检索用户输入关键词,采集用户输入关键词(例如可选取30个关键词),关键词类别下设置有关键词匹配模板,系统自动检索互联网信息,在关键词匹配模板生成关键词数据。关键词匹配模板存储有涉及反动、暴力、色情等敏感词汇。将用户输入的关键词(30个)与关键词的匹配模板内存储的关键词进行匹配。计算关键词匹配百分比(用户输入的关键词与关键词匹配模板匹配的词数/用户输入关键词数),根据匹配百分比判断用户危险等级,若用户输入的关键词中有24个与关键词的匹配模板内存储的关键词匹配,则该用户的关键词匹配百分比为:24/30=80%,属于极度危险等级。也可根据需要通过管理员设置相应的关键词风险等级,例如发现用户输入“藏独”、“法轮功”、“疆独”等关键词,将用户行为划分为严重风险级别。所述数据包挖掘模块3对匹配结果进行记录。还例如数据包挖掘模块3通过统计用户访问的网站的链接,通过相应的网站链接匹配模板的网站类型的匹配可分析用户上网行为的动机。
[0064]匹配模板自动生成模块4:按设定的分类类别生成匹配模板,在设定周期内自动检索互联网中的热门信息并在过滤后作为预警条件存储,或人工添加预警条件。可以设置网站链接匹配子模板、用户账户匹配子模板、关键词匹配子模板等子模板,用于设置该类别下的用户使用互联网的数据的预警条件。
[0065]匹配结果反馈模块5:反馈所述数据包挖掘模块的匹配结果。
[0066]本发明所述的一种互联网用户行为分析预警系统,数据包采集模块I采集完整的网络数据包并存入数据存储服务器2中,数据包挖掘模块3对数据存储服务器2中的海量数据进行检索和过滤,将过滤得到的数据按不同的类别进行分类,确保分类数据的有效性。检索得到的分类数据与匹配模板所存储的预警条件进行匹配,并可分析用户使用互联网的行为,可自动判断用户使用互联网行为的危害性。系统的匹配模板自动生成模块可实现人工结合机器智能更新模板数据库,降低人工成本的同时确保匹配模板的时效性。将用户使用互联网的详细数据在所有类别下的匹配结果反馈,可方便网络监控人员第一时间预警将要发生的网络危害。
[0067]实施例2
[0068]作为本发明的一个实施例,在上述实施例1的基础上,所述的一种互联网用户行为分析预警系统中的数据包挖掘模块3将过滤得到的有效数据按以下类别进行分类:
[0069](I)网站链接,包括用户所访问网站的链接以及网站主要内容概要和标签内容(也可以是网站主要标题)。[0070](2)用户身份,包括用户输入账户、密码信息。
[0071](3)关键词,包括用户输入频率高的词语、短句(通过信息检索,记录用户输入频率高的词语、短句)。
[0072]也可根据需要设置其它的类别,同样可实现本发明的目的。
[0073]本发明所述的一种互联网用户行为分析预警系统,数据包挖掘模块3将用户使用互联网的详细数据按以上类别进行分类,通过记录用户输入频率高的词语、短句可以方便系统进行检索、分析出用户潜在行为。
[0074]实施例3
[0075]作为本发明的一个实施例,在上述实施例1或2的基础上,所述匹配模板进一步包括以下三个匹配子模板:
[0076](I):特定网站分类子模板,将网站信息实时自动更新存储或人工添加网站信息,将网站主要分为:色情网站、涉密网站、反动网站、诈骗网站、暴力网站。
[0077](2):特定人群分类子模板,与相关安全部门的数据库相连,获取相关特定人群的信息记录或人工添加特定人群的信息记录,将特定人群分为:在逃犯人、嫌疑犯人、具有反动倾向的人、具有暴力倾向的人、具有自杀倾向的人。
[0078](3):特定关键词子模板,设置筛选条件自动将互联网中高频率出现的非法关键词或关键字,以及对所述非法关键词或关键字做智能逻辑组合和变形后的词汇进行截留,得到符合条件的关键词并存储。特定关键词子模板可智能分析抓取互联网中的敏感关键字,采用模板对比模式(可根据需要设置对应的模板,如关键字死、杀、砍或拼音“sha、kan”等)对比关键字前后内容,支持模糊识别,分析该关键词是否处于非法状态,比如可将读音与常见非法词语一样的词语定性为潜在非法关键词以及对所述非法关键词或关键字做智能逻辑组合和变形后的词汇进行截留,得到符合条件的关键词并存储。也可通过人工添加特定的关键词并存储。
[0079]也可根据需要设置其它类别的子模板,同样可实现本发明的目的。
[0080]本发明所述的一种互联网用户行为分析预警系统的模板数据库进一步包括以上匹配子模板,模板数据库的匹配子模板数据可自动更新,使得匹配子模板数据能及时自动更新,避免因系统模板因模板陈旧导致新的潜在风险得不到预防。
[0081]实施例4
[0082]作为本发明的一个实施例,在上述实施例3的基础上,所述数据包挖掘模块3还包括以下三个子模块:
[0083]网络内容挖掘子模块,读取用户所访问网站的链接与所述特定网站分类子模板存储的预警条件进行匹配并判断所访问网站的安全等级。网站的安全级别也可由管理员进行设置,每种风险级别对应的风险等级不同。根据用户输入账户、密码信息确定用户身份,并将所述用户与所述特定人群分类子模板存储的预警条件进行匹配并判断用户的安全等级。读取网站标签内容及检索用户输入频率高的词语和短句,得到用户输入的关键词,将得到的关键词与所述特定关键词子模板进行匹配并判断所输入的关键词的安全等级。
[0084]网络结构挖掘子模块,读取用户所访问网站的链接,通过所述特定网站分类子模板存储的预警条件进行网站归类,判断用户所访问网站间的关系(如从属、包含、类似等),根据统计用户访问网站的类别,进行用户上网行为动机的归类。[0085]网络用法挖掘子模块,通过用户访问网站的记录(比如使用代理服务器的记录,使用网络交易的记录、使用通信软件的记录及详细内容)对用户进行分类。
[0086]本发明所述的一种互联网用户行为分析预警系统的数据包挖掘模块3进一步包括以上子模块,通过用户在使用互联网过程中的访问记录,对上网用户进行分类,方便后台监控人员查阅。
[0087]实施例5
[0088]作为本发明的一个实施例,在上述1-4任一实施例的基础上,所述匹配结果反馈模块5中,匹配结果反馈将数据包挖掘模块匹配结果以报表方式进行反馈,并可根据需要设置以下报警方式:声音报警、短信报警、邮件报警、操作界面弹窗。也可根据需要设置其它反馈和报警形式,同样可实现本发明的目的。
[0089]本发明所述的一种互联网用户行为分析预警系统的结果反馈模块可将匹配结果以报表的方式详细反馈,并可根据需要设置多种报警方式方便提醒后台监控人员及时发现网络危险情形。
[0090]实施例6
[0091]参加图2所示,为本发明一个实施例的一种互联网用户行为分析预警方法,包括以下步骤:
[0092]S1:数据包采集,采集被监控设备网络端口上所有的数据包。具体过程为:通过被监控设备的网卡驱动层基于Libpcap (数据包捕获函数库)进行数据包采集,可采集到如QQ聊天记录、飞信、微信、微博、通过代理服务器登入的网站等数据。
[0093]S2:数据包存储,存储采集到的数据包。可根据需要设置在规定周期内自动删除存储的历史数据。
[0094]S3:数据包挖掘,由于每一个数据包都带有一个序列号和应答号,首先需对数据包的序列号和应答号进行拼接,得到用户使用互联网的详细数据。检索详细数据,过滤得到有效的数据并按不同的类别进行分类;过滤的条件可以是:过滤无有效内容的数据包。将得到的分类数据与匹配模板进行匹配,并根据匹配程度确定用户行为安全等级。例如所述互联网用户行为分析系统(简称系统)通过检索用户输入关键词,采集用户输入关键词(例如可选取30个关键词),关键词类别下设置有关键词匹配模板,系统自动检索互联网信息,在关键词匹配模板生成关键词数据。关键词匹配模板存储有涉及反动、暴力、色情等敏感词汇。将用户输入的关键词(30个)与关键词的匹配模板内存储的关键词进行匹配。计算关键词匹配百分比(用户输入的关键词与关键词匹配模板匹配的词数/用户输入关键词数),根据匹配百分比判断用户危险等级,若用户输入的关键词中有24个与关键词的匹配模板内存储的关键词匹配,则该用户的关键词匹配百分比为:24/30=80%,属于极度危险等级。也可根据需要通过管理员设置相应的关键词风险等级,例如发现用户输入“藏独”、“法轮功”、“疆独”等关键词,将用户行为划分为严重风险级别。还例如通过统计用户访问的网站的链接,通过相应的网站链接匹配模板的网站类型的匹配可分析用户上网行为的动机。
[0095]S4:匹配模板自动生成,按设定的分类类别生成匹配模板,在设定周期内自动检索互联网中热门信息过滤后作为预警条件存储,或人工添加预警条件。
[0096]S5:匹配结果反馈,反馈匹配结果。
[0097]本发明所述的一种互联网用户行为分析预警方法,采集模块采集完整的网络数据包并存储,对存储的数据包的进行检索和过滤,将过滤得到的数据按不同的类别进行分类,确保分类数据的有效性。检索得到的分类数据与匹配模板所存储的预警条件进行匹配,并可分析用户使用互联网的行为,可自动判断用户使用互联网行为的危害性。系统的匹配模板自动生成模块可实现人工结合机器智能更新模板数据库,降低人工成本的同时确保匹配模板的时效性。将用户使用互联网的详细数据在所有类别下的匹配结果反馈,可方便网络监控人员第一时间预警将要发生的网络危害。
[0098]实施例7
[0099]作为本发明的一个实施例,在上述实施例6的基础上,在所述步骤S4中,将过滤得到的有效数据按以下类别进行分类:
[0100](I)网站链接,包括用户所访问网站的链接以及网站主要内容概要和标签内容(也可以是网站主要标题);
[0101](2)用户身份,包括用户输入账户、密码信息;
[0102](3)关键词,包括用户输入频率高的词语、短句(通过信息检索,记录用户输入频率高的词语、短句)。
[0103]也可根据需要设置其它的类别,同样可实现本发明的目的。
[0104]本发明所述的一种互联网用户行为分析预警方法,数据分类的步骤中将用户使用互联网的详细数据按上述类别进行分类,可以方便系统进行检索、分析出用户潜在行为。
[0105]实施例8
[0106]作为本发明的一个实施例,在上述实施例6或7的基础上,所述匹配模板进一步包括以下三个匹配子模板:
[0107](I):特定网站分类子模板,将网站信息实时自动更新存储或人工添加网站信息,将网站主要分为:色情网站、涉密网站、反动网站、诈骗网站、暴力网站。
[0108](2):特定人群分类子模板,与相关安全部门的数据库相连,获取相关特定人群的信息记录或人工添加特定人群的信息记录,将特定人群分为:在逃犯人、嫌疑犯人、具有反动倾向的人、具有暴力倾向的人、具有自杀倾向的人。
[0109](3):特定关键词子模板,设置筛选条件自动将互联网中高频率出现的非法关键词或关键字,以及对所述非法关键词或关键字做智能逻辑组合和变形后的词汇进行截留,得到符合条件的关键词并存储。特定关键词子模板可智能分析抓取互联网中的敏感关键字,采用模板对比模式(可根据需要设置对应的模板,如关键字死、杀、砍或拼音“sha、kan”等)对比关键字前后内容,支持模糊识别,分析该关键词是否处于非法状态,比如可将读音与常见非法词语一样的词语定性为潜在非法关键词以及对所述非法关键词或关键字做智能逻辑组合和变形后的词汇进行截留,得到符合条件的关键词并存储。也可人工添加特定的关键词并存储。
[0110]也可根据需要设置其它类别的子模板,同样可实现本发明的目的。
[0111]本发明所述的一种互联网用户行为分析预警方法的生成匹配模板的步骤进一步包括以上三种匹配子模板,所述匹配子模板数据可自动更新,使得匹配子模板数据能及时自动更新,避免因系统模板因模板陈旧导致新的潜在风险得不到预防。
[0112]实施例9
[0113]作为本发明的一个实施例,在上述实施例8的基础上,所述步骤S3中还包括以下三个步骤:
[0114]S31:网络内容挖掘,读取用户所访问网站的链接与所述特定网站分类子模板存储的预警条件进行匹配并判断所访问网站的安全等级。网站的安全级别也可由管理员进行设置,每种风险级别对应的风险等级不同。根据用户输入账户、密码信息确定用户身份,并将所述用户与所述特定人群分类子模板存储的预警条件进行匹配并判断用户的安全等级。读取网站标签内容并检索用户输入频率高的词语和短句,得到用户输入的关键词,将得到的关键词与所述特定关键词子模板进行匹配并判断所输入的关键词的安全级别。
[0115]S32:网络结构挖掘,读取用户所访问网站的连接,通过所述特定网站分类子模板存储的预警条件进行网站归类,判断用户所访问网站间的关系(如从属、包含、类似等),根据统计用户访问网站的类别,进行用户上网行为动机的归类。
[0116]S33:网络用法挖掘,通过用户访问网站的记录(如使用代理服务器的记录,使用网络交易的记录、使用通信软件的记录及详细内容)对用户进行分类。
[0117]本发明所述的一种互联网用户行为分析预警方法的数据包挖掘步骤进一步包括以上步骤,通过用户在使用互联网过程中的访问记录,对上网用户进行分类,方便后台监控人员查阅。
[0118]实施例10
[0119]作为本发明的一个实施例,在上述6-9任一实施例的基础上,所述步骤S5中,匹配结果反馈将数据包挖掘匹配的结果以报表方式进行反馈,并可根据需要设置以下报警方式:声音报警、短信报警、邮件报警、操作界面弹窗。也可根据需要设置其它反馈和报警形式,同样可实现本发明的目的。
[0120]本发明所述的一种互联网用户行为分析预警方法的结果反馈步骤可将匹配结果以报表的方式详细反馈,并可根据需要设置多种报警方式方便提醒后台监控人员及时发现网络危险情形。
[0121]显然,上述实施例仅仅是为清楚地说明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明创造的保护范围之中。
【权利要求】
1.一种互联网用户行为分析预警系统,其特征在于,包括以下模块: 数据包采集模块,采集被监控设备网络端口上所有的数据包,并将数据包发送至数据存储服务器; 数据存储服务器,存储采集到的数据包; 数据包挖掘模块,检索所述数据存储服务器存储的数据包,过滤得到有效的数据并按不同的类别进行分类,将得到的分类数据与匹配模板进行匹配,并根据匹配程度确定用户行为安全等级; 匹配模板自动生成模块,按设定的分类类别生成匹配模板,在设定周期内自动检索互联网中的热门信息并在过滤后作为预警条件存储,或人工添加预警条件; 匹配结果反馈模块,反馈所述数据包挖掘模块的匹配结果。
2.根据权利要求1所述的一种互联网用户行为分析预警系统,其特征在于,所述数据包挖掘模块将过滤得到的有效数据按以下类别进行分类: (1)网站链接,包括用户所访问网站的链接以及网站主要内容概要和标签内容; (2)用户身份,包括用户输入账户、密码信息; (3)关键词,包括用户输入频率高的词语、短句。
3.根据权利要求1或2所述的一种互联网用户行为分析预警系统,其特征在于,所述匹配模板进一步包括以下三个匹配子模板: (1):特定网站分类子模板,将网站信息实时自动更新存储或人工添加网站信息,将网站主要分为:色情网站、涉密网站、反动网站、诈骗网站、暴力网站; (2):特定人群分类子模板,与相关安全部门的数据库相连,获取相关特定人群的信息记录或人工添加特定人群的信息记录,将特定人群分为:在逃犯人、嫌疑犯人、具有反动倾向的人、具有暴力倾向的人、具有自杀倾向的人; (3):特定关键词子模板,设置筛选条件自动将互联网中高频率出现的非法关键词或关键字,以及对所述非法关键词或关键字做智能逻辑组合和变形后的词汇进行截留,得到符合条件的关键词并存储或人工添加特定的关键词并存储。
4.根据权利要求3所述的一种互联网用户行为分析预警系统,其特征在于,所述数据包挖掘模块还包括以下三个子模块: 网络内容挖掘子模块,读取用户所访问网站的链接与所述特定网站分类子模板存储的预警条件进行匹配并判断所访问网站的安全等级;根据用户输入账户、密码信息确定用户身份,并将所述用户与所述特定人群分类子模板存储的预警条件进行匹配并判断用户的安全等级;读取网站标签内容及检索用户输入频率高的词语和短句,得到用户输入的关键词,将得到的关键词与所述特定关键词子模板进行匹配并判断所输入的关键词的安全等级; 网络结构挖掘子模块,读取用户所访问网站的链接,通过所述特定网站分类子模板存储的预警条件进行网站归类,判断用户所访问网站间的关系,根据统计用户访问网站的类另U,进行用户上网行为动机的归类; 网络用法挖掘子模块,通过用户访问网站的记录对上网用户进行分类。
5.根据权利要求1-4任一所述的一种互联网用户行为分析预警系统,其特征在于,所述匹配结果反馈模块中,匹配结果反馈将数据包挖掘匹配的结果以报表方式进行反馈,并可根据需要设置以下报警方式:声音报警、短信报警、邮件报警、操作界面弹窗。
6.一种互联网用户行为分析预警方法,其特征在于,包括以下步骤: 51:数据包采集,采集被监控设备网络端口上所有的数据包; 52:数据包存储,存储采集到的数据包; 53:数据包挖掘,检索存储的数据包,过滤得到有效的数据并按不同的类别进行分类,将得到的分类数据与匹配模板进行匹配,并根据匹配程度确定用户行为安全等级; 54:匹配模板自动生成,按设定的分类类别生成匹配模板,在设定周期内自动检索互联网中热门信息过滤后作为预警条件存储,或人工添加预警条件; 55:匹配结果反馈,反馈匹配结果。
7.根据权利要求6所述的一种互联网用户行为分析预警方法,其特征在于,在步骤S4中,将过滤得到的有效数据按以下类别进行分类: (1)网站链接,包括用户所访问网站的链接以及网站主要内容概要和标签内容; (2)用户身份,包括用户输入账户、密码信息; (3)关键词,包括用户输入频率高的词语、短句。
8.根据权利要求6或7所述的一种互联网用户行为分析预警方法,其特征在于,所述匹配模板进一步包括以下三个匹配子模板: (1):特定网站分类子模板,将网站信息实时自动更新存储或人工添加网站信息,将网站主要分为:色情网站、涉密网站、反动网站、诈骗网站、暴力网站; (2):特定人群分类子模板,与相关安全部门的数据库相连,获取相关特定人群的信息记录或人工添加特定人群的信息记录,将特定人群分为:在逃犯人、嫌疑犯人、具有反动倾向的人、具有暴力倾向的人、具有自杀倾向的人; (3):特定关键词子模板,设置筛选条件自动将互联网中高频率出现的非法关键词或关键字,以及对所述非法关键词或关键字做智能逻辑组合和变形后的词汇进行截留,得到符合条件的关键词并存储或人工添加特定的关键词并存储。
9.根据权利要求8所述的一种互联网用户行为分析预警方法,其特征在于,在步骤S3中还包括以下三个步骤: 531:网络内容挖掘,读取用户所访问网站的链接与所述特定网站分类子模板存储的预警条件进行匹配并判断所访问网站的安全等级;根据用户输入账户、密码信息确定用户身份,并将所述用户与所述特定人群分类子模板存储的预警条件进行匹配并判断用户的安全等级;读取网站标签内容并检索用户输入频率高的词语和短句,得到用户输入的关键词,将得到的关键词与所述特定关键词子模板进行匹配并判断所输入的关键词的安全级别; 532:网络结构挖掘,读取用户所访问网站的连接,通过所述特定网站分类子模板存储的预警条件进行网站归类,判断用户所访问网站间的关系,根据用户统计用户访问网站的类别,进行用户上网行为动机的归类; S33:网络用法挖掘,通过用户访问网站的记录对所有上网用户进行分类。
10.根据权利要求6-9任一所述的一种互联网用户行为分析预警方法,其特征在于,所述步骤S6中,匹配结果反馈将数据包挖掘匹配的结果以报表方式进行反馈,并可根据需要设置以下报警方式:声音报警、短信报警、邮件报警、操作界面弹窗。
【文档编号】H04L12/24GK103763124SQ201310739221
【公开日】2014年4月30日 申请日期:2013年12月26日 优先权日:2013年12月26日
【发明者】孙伟力, 杨超 申请人:孙伟力
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1