事件预测方法

文档序号:9810876阅读:667来源:国知局
事件预测方法
【技术领域】
[0001]本发明实施例涉及情报分析技术领域,尤其涉及一种事件预测方法。
【背景技术】
[0002]一般来说,数据挖掘的任务按功能划分可分为两类:1、预测性任务:因子属性的值需要依据其他属性的值来预测。被预测的属性称为目标变量,而用来做预测的属性则称为说明变量(explanatory variable)或自变量(independent variable)。2、描述性任务:是导出一种模式(相关、聚类、轨迹、趋势和异常)能归纳隐含在数据中某些联系的。实质上,描述性数据挖掘任务一般是探索性的,并且经常要用后处理技术去验证和解释结果。
[0003]数据挖掘的任务按实际作用划分又可分六类:1、分类和预测。分类的目标是利用分类函数或分类模型(泛称分类器)把数据库里的数据项映射到某一个给定类别。预测的目标是为了能预测未来数据而从以往数据的纪录里面导出对给定的数据的描述。2、聚类分析。是将一组数据根据其相似度划归为若干类别。3、关联规则发现。关联规则是以下的二种规则,“在购买牛奶和面包的顾客中80%的顾客同一时间也买了黄油”(牛奶+面包(黄油))。
4、时序模式。是指通过时间的序列而搜索出重复发生的概率偏高的一种模式。5、偏差分析。用于偏差检验的基本办法就是找寻所要观察的结果和参照数据两者之间的区别。很多数据挖掘采取的方法都把离群点(即数据库中一些异常数据,他们与模型里的数据或一般行为不一样)看作噪音或是不正常数据而放弃,其实这些异常数据中蕴藏着许多重要的我们感兴趣的东西。6、数据总结。目标是为了得到紧凑的描述而对大量的数据进行浓缩。
[0004]情报分析是根据因子领域的相关问题和矛盾进行预测和预防,目前,研究基本是通过对大量领域相关信息进行深层次加工和分析研究,找出其形成的根本原因,从根本原因入手找出相关的要素,从而形成有助于问题解决的分析过程。按照分析构成方式可以分成几个要素:①成因要素。②分析方法。③分析环节。④分析结果。⑤结果应用。按照其内容进行划分:①轨迹信息分析:主要是根据信息收集,进行加工,建立字典型、事实型和数值型分析数据库,加上一定的定量和定性分析,该类分析可以分析该领域的发展趋势,了解趋势、发现问题和提出问题。②比对信息分析:比较事件之间的相同点和不同点,在对各个事件通过各方面成因和要素进行比较后,找出导致该事件的根本性原因,从而把握事件之间的内外关系,发现事件的本源。③预测信息分析:根据轨迹信息分析和比对信息分析,通过改变某些参数的输入,推测出未来可能存在的风险和问题。
[0005]目前,大多的情报分析中的事件预测除了应用数据挖据技术和相关算法,比如Apr1ri算法,但其基本数据大都运用网络抓取、搜索引擎、信息碰撞、数据挖掘、信息融合等技术,实现了对待预测事件的快速预测分析。
[0006]存在的缺陷在于:基于现有的统计分析进行事件预测分析,由于难以保证待预测事件的样本空间的有效性,导致预测分析准确度较低,实战中无法进行有效的应用。

【发明内容】

[0007]本发明实施例提供一种事件预测方法,以提高对待预测事件的预测分析的准确度。
[0008]本发明实施例提供了一种事件预测方法,包括:
[0009]采集待预测事件的业务数据和环境数据;
[0010]基于预先建立的数据整合模型,对所述业务数据和所述环境数据进行数据整合,得到所述待预测事件的打标数据;
[0011]根据所述待预测事件的业务应用目标,以及所述待预测事件的打标数据,调整由所述待预测事件所属领域的多维关键因子组成的环境模板的参数,得到所述待预测事件的预测业务环境参数;
[0012]对所述待预测事件所属领域的多维关键因子进行逐层递归扫描,得到各层候选频繁项集和对应的频繁频率;根据所述待预测事件与各层候选频繁项集的包含关系,确定所述待预测事件对应的各层候选频繁项集;根据所述待预测事件的各层候选频繁项集的频繁频率,建立各因子阀值池,并统计各因子阀值池的计数;在因子阀值池的计数小于支持度阀值时,删除该因子阀值池;将剩余的因子阀值池所包含的多维关键因子确定为所述待预测事件的随机样本空间,采用最小支持度搜寻所述随机样本空间中的频繁项集,并计算随机样本空间中的频繁项集所包含的多维关键因子的重复度;
[0013]根据所述随机样本空间中的频繁项集,以及所包含的多维关键因子的重复度,并根据所述待预测事件的打标数据和预测业务环境参数,确定所述待预测事件的因子结构;
[0014]通过预设的场景模型库选择需要预测的业务场景模型,对所述业务场景模型和所述因子结构进行分析,得到所述待预测事件的目标数据;所述目标数据是以业务场景模型所包含的参数作为字段,因子结构的对应数值作为字段的数据值;
[0015]基于预先建立的估算分析模型,对所述目标数据和所述因子结构进行估算分析,得到所述待预测事件的分析结果;
[0016]利用所述因子结构,确定所述待预测事件的分析结果的可信度值。
[0017]本发明实施例提供的事件预测方法,通过采集待预测事件的业务数据和环境数据,保证了数据完整性;由于数据整合模型中包含有各类事件的业务数据、环境数据和各类事件的打标数据之间的映射关系,提高了通过数据整合模型得到的待预测事件的打标数据的准确度;由于待预测事件所属领域的多维关键因子是通过对该领域所有的字典项进行统计性分析、大量的实践和训练得到的,由待预测事件所属领域的多维关键因子组成的环境模板可以涵盖该领域的各种业务应用目标,因此,根据待预测事件的业务应用目标,调整由所述待预测事件所属领域的多维关键因子组成的环境模板的参数,提高了得到的所述待预测事件的预测业务环境参数与待预测事件的业务应用目标之间的匹配度,可以有效应用在实战中;将待预测事件所属领域的多维关键因子作为待预测事件的待关键因子,进行待关键因子数据分析,待关键因子数据分析包括了对待关键因子进行逐层递归扫描、分析待关键因子与待预测事件的包含关系、删除不相关的待关键因子、从待预测事件所属领域的多维关键因子中初步筛选出与待预测事件相关联的因子,作为待预测事件的随机样本空间,优化了待预测事件的随机样本空间,提高了随机样本空间的有效性,还包括了计算随机样本空间中待关键因子的重复度,基于此,在有效的随机样本空间中进一步筛选出对待预测事件的预测结果影响比较大的多维关键因子,进而确定所述待预测事件的因子结构,提高了所述待预测事件的因子结构的准确度;基于此,对待预测事件进行预测、估算分析以及可信度分析,形成了评估和预测之间可信度的衡量体系,提高了对待预测事件的预测分析的准确度。
【附图说明】
[0018]为了更清楚地说明本发明,下面将对本发明中所需要使用的附图做一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0019]图1为本发明实施例提供的一种事件预测方法的流程图;
[0020]图2为本发明实施例提供
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1