异构信息通用性关联分析系统及其分析方法

文档序号:9217236阅读:347来源:国知局
异构信息通用性关联分析系统及其分析方法
【技术领域】
[0001]本发明属于信息处理技术领域,涉及异构多源信息关联分析系统实现,用于计算机辅助情报分析与决策支持,特别是涉及一种异构信息通用性关联分析方法。
【背景技术】
[0002]计算机网络和信息技术的发展使存贮在各种数据库资源中的信息资源能通过网络互连,形成了巨大的网络信息空间,同时信息资源也愈来愈呈现出异构、海量、动态的分布特点。这些变化为信息集成应用研宄带来了新的挑战,如何实现各种信息资源的整合、综合集成、并为用户提供决策支持就成为现代信息处理系统的关键问题之一。计算机辅助情报分析与决策支持,就是在情报分析的若干环节应用计算机软件分析海量异构信息,辅助情报分析人员作出情报研判。目前,在军事情报和公安警务情报分析过程中,越来越关注对于情报关联性的分析。信息关联分析的主要目标就是实现数据与数据之间的链接,使用户能在数据搜索中找到更多相关的可用的信息,并明确信息之间的关系。例如:通过对某个知名人物的多种手段获取的信息进行关联分析,可得知其爱好、社会关系、著名言论、最近的行为动向等,并通过分析其活动规律预测其下步可能活动,为相关决策提供依据。
[0003]目前在信息关联分析方面已经有一些关键技术研宄和系统建设,但离实用化还有一定的差距,主要体现在:
1)对异构信息关联分析技术支撑能力不够,目前信息关联主要局限于利用关系数据库的实体关系模型进行数据组织,缺乏针对多源异构数据的深度挖掘和模糊信息要素关联方法的研宄,难以解决不同类型源信息之间的复杂交叉关系和信息要素内在本质联系的关联冋题;
2)缺少针对信息关联的智能、通用性方法研宄,长期以来,信息之间的分析工作缺少一种针对异构多源信息的通用关联分析方法,情报分析人员大都基于个人积累的经验和习惯流程进行操作,这种工作方法具有发散性、不确定性和一定的个体创造性,但很难在更大范围内不同人员之间进行信息传递和经验传承。

【发明内容】

[0004]本发明目的是针对现有技术上存在的不足之处,提供一种关联展示方式直观、通用性强且易于理解的异构信息通用性关联分析系统及其分析方法。
[0005]本发明是通过如下技术方案实现的:一种异构信息通用性关联分析系统,包括:信息采集和接收模块、预处理模块、信息关联处理模块、交互可视化模块和面向不同数据源的可配置关联处理框架,其特征在于,通过可配置关联处理框架,信息采集和接收模块装载不同解析算法,连接不同数据源并实现异构数据解析;信息预处理模块装载不同处理算法,将解析后的数据在内存中进行数据结构化处理,并提取关联特征;信息关联处理模块装载不同知识与关联规则,利用实体匹配、关联规则挖掘、路径分析、时间序列分析和集群分析方法,按照信息语义内容进行关联处理,找出信息中隐藏的关联关系;交互可视化模块装载不同可视化模型,利用可视化的图形表达方式,对关联信息之间的关系进行绘制,呈现在用户面前,并根据用户需求进行交互式分析;针对输入信息中关注目标的差异,用可配置关联处理框架进行动态流程定制。
[0006]一种使用权利要求1所述异构信息通用性关联系统的关联分析方法,其特征在于包括处理流程定义阶段和处理流程执行阶段两个步骤,在处理流程定义阶段,用户首先定义信息接收路径与配置参数,即用户指定从分布式数据库或者互联网或者文件系统获取异构信息文件,并设置获取文件所需的网络地址、用户名/密码、目录信息参数;随后定义信息格式与文件解析方法,利用提取原始数据文档的数据内容的方法或工具,加载对应的软件包;定义信息预处理算法,加载对应算法包;按照用户关联输入类型加载定义信息关联知识规则;定义信息可视化模型,装载指定交互可视化模块,利用可视化的图形表达方式对关联信息之间的关系进行绘制;根据上述方法选择最终形成XML形式的流程配置文件,生成关联配置文件;在处理流程执行阶段,异构信息通用性关联系统使用配置文件装载和执行器加载流程配置文件,根据前述定义和选择的方法及工具,从指定的数据库或文件系统获取信息文件,解析及预处理不同格式信息文件,然后按照关联知识规则进行不同源文件的关联,最后按指定可视化模型进行可视化的应用流程。
[0007]本发明与现有技术相比的有益效果:
本发明凭借计算机强大的数据处理能力以及计算机可视化技术,为异构多源信息关联分析的统一实现提供了通用性方法,该方法能充分挖掘隐含在海量数据中的有价值信息,为提高情报分析工作效率,提供先进的技术手段支持。
[0008]本发明通过用相同的信息处理流程和面向不同类型信息处理方法、关联知识规则和可视化模型的可配置关联处理框架,提供异构多源信息关联分析的统一实现方法,使得异构信息在同一系统中完成关联分析,解决了异构多源信息关联分析的通用处理问题。
[0009]本发明提供的通用信息处理流程和面向不同类型信息处理方法、知识规则和可视化模型的可配置关联处理框架,为异构多源信息关联分析的统一实现提供了通用性方法,提供信息关联分析的流程定义和处理流程执行方法,实现异构多源信息的采集、关联处理和可视化流程满足类似系统的设计与实现。
[0010]本发明采用信息采集和接收模块、预处理模块、信息关联处理模块、交互可视化模块和面向不同数据源的可配置关联处理框架构成的智能化研判分析工具支撑平台建设,实现面向不同关联任务的信息处理,帮助用户将大量的、模糊的、低价值信息转化为少量的、尚关联性、尚价值的情报,提尚?目息整体效益。
[0011]本发明采用的关联展示方式直观、易于理解。同原始异构多源信息相比,本发明采用的交互可视化模块使用图形化的方式描述、展现相关的所有信息,无疑更加直观而易于理解。直观的图形能帮助分析人员最简洁、快速地了解到分析信息主题所涉及到的各种人物、时间、空间、事件序列以及关联关系,而不需要花费时间去阅读大量文件或者访问各种不同的应用系统去获得信息,再将这些信息手工联系起来以寻找线索。
[0012]本发明从根本上改变情报研判分析人员传统的人工分析方式,提供情报分析人员一个方便易用,且功能全面的关联信息处理及交互可视化通用流程,并为分析人员提供情报线索挖掘分析的多种方法,充分挖掘隐含在不同业务系统内海量数据中的有价值线索,为提高情报分析工作效率,提供先进的技术手段支持。
【附图说明】
[0013]为了更清楚地理解本发明,现将通过本发明实施方式,同时参照附图,来描述本发明,其中:
图1是本发明异构信息通用性关联分析系统示意图。
[0014]图2是图1异构信息通用性关联分析的配置流程示意图。
[0015]图3是图1异构信息通用性关联分析的执行流程。
【具体实施方式】
[0016]为使本申请的目的、技术方案和优点更加清楚,以下结合附图及具体实施例,对本申请作进一步地详细说明:本实施例在以本发明技术方案为前提下进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下属的实施例。
[0017]参阅图1。本发明提供的异构信息通用性关联分析系统,包括:信息采集和接收、预处理、关联处理、交互可视化和面向不同数据源的可配置关联处理框架;其中,所述信息采集和接收,是指通过网络配置后,连接分布式数据库和其他方式采集(如网络)的异构信息源,如:av1、rmvb、jpg、tiff、txt、pdf、超文本格式网页等文件,进行内容解析后将获取的信息存储于本地数据库内。
[0018]所述信息预处理模块包括格式转换子模块和数据结构化处理子模块,数据结构化处理子模块将解析数据在内存中进行数据结构化处理,格式转换子模块按照信息预处理预先定义的数据格式(如:可指定将文本统一转换为txt或xml格式)进行转换,保存为统一的文件格式,便于后续关联处理。信息预处理模块针对异构文档信息使用不同的信息预处理算法,通过可配置关联处理框架进行加载。信息预处理模块提供数据审核机制,以可视化方式提供给用户,满足复杂数据内容的审核和验证。
[0019]所述信息关联处理模块用实体匹配、关联规则挖掘、路径分析、时间序列分析、集群分析等方法,按照信息语义内容进行关联处理,找出信息中隐藏的关联关系。信息关联处理模块针对不同类型的目标,信息关联处理需要用到不同类型的知识规则,通过可配置关联处理框架进行加载。
[0020]所述信息交互可视化模块利用可视化的图形表达方式,对关联信息之间的关系进行绘制,呈现在用户面前,并根据用户需求进行交互式分析。信息交互可视化模块可根据分析对象和分析任务的不同,通过配置框架自动选择和动态加载可视化图形布局方式,以满足不同用户任务的可视化机制。
[0021]面向不同数据源的可配置关联处理框架包括配置文件编辑器、配置文件装载和执行器等。配置文件编辑器根据任务需要编写异构数据的信息处理方法,有文件格式解析方法定义、文件转格式算法定义、关联算法定义、交互可视化方案定义。配置文件装载和执行器指的是用户定义一个新的处理流程之后,系统读取当前数据源处理的配置文件,获取当前信息关联处理的方法。
[0022]使用上述异构信息通用性关联系统的关联分析方法,具体包括处理流程定义阶段和处理流程执行阶段两个步骤,在处理流程定义阶段,用户首先定义信息接收路径与配置参数,即用户指定从分布式数据库或者互联网或者文件系统获取异构信息文件,并设置获取文件所需的网络地址、用户名/密码、目录信息参数;
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1