互联网大数据取证系统的制作方法

文档序号:12271602阅读:492来源:国知局

本发明涉及互联网技术领域,尤其涉及一种互联网大数据取证系统。



背景技术:

随着科技和社会的不断发展,互联网也进入了一个蓬勃发展的时期。但是由于职能部门监管的缺失,执法人员意识滞后,法律法规不健全,互联网也成了滋生各种道德缺失甚至非法行为的乐园,生了多起涉及网络信息的事件,如“表叔”事件、拆迁事件、不雅照事件、暴恐事件等等。在这些事件的网络信息中,尽管某些网络言论的观点是现实的,对事件的发展、问题的解决起到了一定的促进作用。但更多的是情绪化、偏激的、炒作性,贬低、攻击各地方政府所开展的工作,甚至制造谣言,混淆视听,激起网民对政府的不满与愤怒。这对维护网络舆论的平稳产生了巨大的隐患。维护互联网领域秩序、调查还原事件真相成为了互联网时代的一个新课题。

但是由于网络的开放性、不确定性、超越时空性等特点,使得互联网取证异常困难。再加之在互联网中,信息量大,更新速度快,证据的真实性、客观性、有效性和合法性需要仔细判定,这也给互联网取证带来了更大的难题,目前急需一种符合互联网大数据时代的数据取证手段。



技术实现要素:

有鉴于此,本发明提供了一种互联网大数据取证系统,包括:模板配置模块、接口衔接模块、信息聚合模块和系统应用模块;其中,

所述模板配置模块用于配置系统中的各项模板参数;

所述接口衔接模块用于实现与各类互联网数据的对接;

所述信息聚合模块用于采集互联网中的各种有害敏感信息,并对所述信息进行语境分析、数据挖掘,获取各种有害敏感信息并自动取证,以及截取原网页信息和网页快照;

所述系统应用模块用于将处理后的信息发布给用户。

进一步地,所述模板配置模块包括首页配置单元、框架配置单元、页面配置单元和结构配置单元。

进一步地,所述模板配置模块还包括联系人配置单元、联系方式配置单元、站点浏览单元和站点发布单元。

进一步地,所述模板配置模块还包括人员权限配置单元和系统接口配置单元。

进一步地,所述接口衔接模块包括管理数据接口单元、应用系统数据接口单元和索引数据接口单元。

进一步地,所述信息聚合模块包括信息采集单元、信息挖掘单元、信息分类单元和语义分析单元。

进一步地,所述信息聚合模块包括信息聚合单元、数据统计单元、信息处理单元。

进一步地,所述信息聚合模块还包括格式转换单元。

进一步地,所述信息聚合模块还包括信息传输单元。

进一步地,所述信息聚合模块还包括数据封装单元。

实施本发明,具有如下有益效果:

本发明采用了基于云平台的B/S架构方式,结合全球领先的信息采集检索技术和算法,根据自身丰富的专业经验和长期的行业积累经验,对有害敏感信息进行深入挖掘,过滤和屏蔽垃圾信息,全面获得重要的有害敏感信息证据。本发明基于分布式云平台和先进的采集技术具有易扩展、高性能、处理性能高的技术特点。

本发明能通过对互联网海量数据进行超链接HTML分析,以正负面语料信息库为基础,分析互联网海量信息,并对互联网敏感事件/话题的特征向量进行定位到页面快照和原页链接,并对此类信息进行快照处理,同时独立保存起快照和原页截图,保留信息作为后续追查的证据。

本发明通过互联网信息挖掘,抓取下来信息保存在本地数据库中,进行网页分析处理,将其网页的Html代码嵌入已经做好的网页框架中,实现网页自动快照,建立本地存储,并将之与索引部分关联起来,利用索引数据库中的相应字段添加Link地址实现映射关系。

系统利用渲染技术对网页快照中与用户输入的关键字匹配字符进行渲染,以高亮色显示。在将用户在Web Searcher接口输入查询的关键字进行分词处理之后,形成词元序列,在网页快照中进行检索查询,字符串匹配,将对应的关键字设置相应的Html标签,利用Html语句添加色彩显示。

本发明的建立可方便用户直观快速的了解各种重要敏感信息,并形成完整的互联网大数据信息取证体系。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。

图1是本发明的系统的结构框图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。

实施例:

如图1所示,

本发明提供了一种互联网大数据取证系统,包括:模板配置模块、接口衔接模块、信息聚合模块和系统应用模块;其中,

所述模板配置模块用于配置系统中的各项模板参数;

所述接口衔接模块用于实现与各类互联网数据的对接;

所述信息聚合模块用于采集互联网中的各种有害敏感信息,并对所述信息进行语境分析、数据挖掘,获取各种有害敏感信息并自动取证,以及截取原网页信息和网页快照;

所述系统应用模块用于将处理后的信息发布给用户。

进一步地,所述模板配置模块包括首页配置单元、框架配置单元、页面配置单元和结构配置单元。

进一步地,所述模板配置模块还包括联系人配置单元、联系方式配置单元、站点浏览单元和站点发布单元。

进一步地,所述模板配置模块还包括人员权限配置单元和系统接口配置单元。

进一步地,所述接口衔接模块包括管理数据接口单元、应用系统数据接口单元和索引数据接口单元。

进一步地,所述信息聚合模块包括信息采集单元、信息挖掘单元、信息分类单元和语义分析单元。

进一步地,所述信息聚合模块包括信息聚合单元、数据统计单元、信息处理单元。

进一步地,所述信息聚合模块还包括格式转换单元。

进一步地,所述信息聚合模块还包括信息传输单元。

进一步地,所述信息聚合模块还包括数据封装单元。

实施本发明,具有如下有益效果:

本发明采用了基于云平台的B/S架构方式,结合全球领先的信息采集检索技术和算法,根据自身丰富的专业经验和长期的行业积累经验,对有害敏感信息进行深入挖掘,过滤和屏蔽垃圾信息,全面获得重要的有害敏感信息证据。本发明基于分布式云平台和先进的采集技术具有易扩展、高性能、处理性能高的技术特点。

本发明能通过对互联网海量数据进行超链接HTML分析,以正负面语料信息库为基础,分析互联网海量信息,并对互联网敏感事件/话题的特征向量进行定位到页面快照和原页链接,并对此类信息进行快照处理,同时独立保存起快照和原页截图,保留信息作为后续追查的证据。

本发明通过互联网信息挖掘,抓取下来信息保存在本地数据库中,进行网页分析处理,将其网页的Html代码嵌入已经做好的网页框架中,实现网页自动快照,建立本地存储,并将之与索引部分关联起来,利用索引数据库中的相应字段添加Link地址实现映射关系。

系统利用渲染技术对网页快照中与用户输入的关键字匹配字符进行渲染,以高亮色显示。在将用户在Web Searcher接口输入查询的关键字进行分词处理之后,形成词元序列,在网页快照中进行检索查询,字符串匹配,将对应的关键字设置相应的Html标签,利用Html语句添加色彩显示。

本发明的建立可方便用户直观快速的了解各种重要敏感信息,并形成完整的互联网大数据信息取证体系。

以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1