交通事故数据智能分析与综合应用系统的制作方法

文档序号:17008594发布日期:2019-03-02 02:08阅读:295来源:国知局
交通事故数据智能分析与综合应用系统的制作方法

本发明涉及一种交通事故数据智能分析与综合应用系统。



背景技术:

传统的交通事故数据应用方式比较单一,大多为定期的数据报表汇报,报表统计维度也较为固定,主要是根据管理经验中确定统计维度。

但事实上,交通事故记录数据包含了事故相关的人、车、路、环境等众多属性数据,除了常用的统计维度以外,还能够从大量数据中提取出更多有价值的信息,其中一点就是对属性特征与事故的关联性的分析,挖掘属性特征中携带的事故相关信息量。从目前的研究成果与应用现状来看,对于事故属性的分析在构建安全评价体系时多有体现,例如中国专利cn201610529822.8《一种基于人-车-路-货多风险源的货运安全评价模型》中采用了事故树方法对重要属性进行了筛选,但这种方法缺乏对属性定量化地标定;中国专利cn201410129672.2《一种道路交通安全评估方法及系统》也未明确事故属性的因子载荷确定方式。

属性因子的重要度是进行有针对性的事故数据分析应用的基础,而当前尚缺乏能够实现定量化属性因子重要度分析的方法;另一方面,在进行交通事故数据管理应用时手段也较为单一,大多忽略了对数据深层特征以及关联结论的挖掘。



技术实现要素:

鉴于上述现状问题,本发明的目的是提供一种交通事故数据智能分析与综合应用系统解决现有技术中存在的当前尚缺乏能够实现定量化属性因子重要度分析的方法,在进行交通事故数据管理应用时手段也较为单一,大多忽略了对数据深层特征以及关联结论的挖掘的问题。

该种交通事故数据智能分析与综合应用系统,实现以数据为驱动的交通事故属性因子重要度提取,引导用户在进行事故数据分析应用时主动关注与事故发生结果密切相关的属性因子并由此展开深度分析,改变传统的固定式数据报表统计的应用模式,为交通安全的治理工作提供更具有针对性的信息与结论。

本发明的技术解决方案是:

一种交通事故数据智能分析与综合应用系统,包括数据对接模块、挖掘处理模块、交互模块、地图模块和数据分析模块,

数据对接模块:从交通事故数据库中提取指定条件的交通事故数据,并将提取的交通事故数据发送给数据对接模块;

挖掘处理模块:依据数据对接模块提取的交通事故数据,由交通事故数据因子重要度分析模型驱动数据处理,得到属性因子集合元素的重要度;

交互模块:接收挖掘处理模块得到的属性因子集合以及重要度,并结合属性因子所属维度以及重要度数值大小进行可视化显示;还包括日期时间选择控件、属性因子选择控件;将已设置的时间传输至数据对接模块,选中的属性因子传输至数据分析模块,并接收数据分析模块的分析结果,以专用控件进行内容展示;

数据分析模块:接收交互模块的属性因子选择结果,以属性因子为数据分析角度,通过事故数据分析方式提供针对性地数据分析结果给交互模块与地图模块;

地图模块:包含地理信息数据,支持地图操作;与交互模块协同实现前端交互操作,并将数据分析模块输出的结果进行可视化呈现;还包括区域自定义工具,通过绘图设置目标区域,并将划定的区域空间坐标范围传输至数据对接模块。

进一步地,挖掘处理模块中,交通事故数据因子重要度分析模型驱动数据处理,得到属性因子集合元素的重要度,具体为,构建交通事故数据属性因子集合,配置缺失信息补全策略,根据属性因子级别以及数据缺失情况对属性因子进行缺失信息估计,在此基础上量化分析并输出属性因子集合元素的重要度。

进一步地,挖掘处理模块中交通事故数据因子重要度分析模型进行数据处理分析具体为:

s1、确定交通事故数据一级属性维度;

s2、根据交通事故数据的具体字段确定一级属性的二级属性集合,该属性集合为交通事故样本数据中二级属性因子全集,集合元素个数为nl(2);对二级属性因子进行三级拆解,获得三级属性因子全集,集合元素个数为nl(3),其中三级拆解根据二级属性因子的具体取值确定,离散属性变量即根据该变量的取值范围确定三级属性因子组成,连续属性则进行离散转换,再确定其三级属性因子组成;

s3、分别对二级属性因子全集、三级属性因子全集进行样本数据的分组合并,获得二级分组数量gn(2)及每组的样本量samplesize(2)、三级分组数量gn-(3)及每组的样本量samplesize(3);对于任一分组g(level)i,其属性因子包括步骤s2中的该级别全部属性以及样本量samplesize(level)i,其中level表征属性因子级别;

s4、检测分组g(level)i属性因子数据是否存在缺失的情况,若不存在则转入步骤s5;否则,配置缺失信息补全策略,根据属性因子级别以及数据缺失情况对属性因子进行缺失信息估计;

s5、基于分组合并数据构建随机森林回归模型,计算属性因子重要度。

进一步地,步骤s4具体为,

s41、序号j=1;

s42、检测属性因子aj是否存在数据缺失的情况,若存在,则计算其数据缺失率rj=mj/gn(level),mi为缺失该属性因子的分组数,level的取值根据aj的属性级别确定,进入步骤s43;否则进入步骤s44;

s43、若ri∈[thl,thu],则通过随机森林方法补充缺失信息,其中thl、thu分别为上下限阈值;

若ri∈[0,thl),则在后续分析中放弃该属性因子;

若ri∈(thu,1],则由统计值m进行缺失估计,统计值m在众数、平均数中选择;

s44、j<nl(level)是否成立?若成立,则j=j+1,回到步骤s42循环处理;若不成立,则检测是否仍存在带有缺失值的属性因子,若是则返回步骤s41循环处理,否则结束缺失估计流程。

进一步地,步骤s43中,通过随机森林方法补充缺失信息,具体为,在不存在缺失的样本分组中划分训练集与测试集,由训练集拟合缺失值属性因子与其他属性因子的关系,根据经由测试集测试通过的随机森林,对该分组后数据进行缺失补全,即将其他属性因子输入随机森林,输出的分类结果作为该属性因子的估计值。

进一步地,步骤s5具体为,随机森林回归模型中的决策树数量为nt,对于每一颗树使用袋外数据计算袋外误差error1;随机对袋外数据所有样本的属性因子at进行噪声干扰,计算袋外误差error2;属性因子at的重要度d(ak)=∑|error1-error2|/nt。

进一步地,数据对接模块中,指定条件指用户通过交互模块设置的时间范围以及通过地图模块设置的空间范围条件。

进一步地,数据分析模块采用的数据分析方式包括因素分析、对应分析、关联分析、定制报表。

进一步地,数据分析模块中,

因素分析:提取含有选中属性因子的所有数据样本,进行时间、空间维度的指标统计;

对应分析:以全部样本进行对应分析处理生成对应分析结论集合,包含对应分析二维散点图、属性因子对应分析结论,并从中提取含有选中属性因子的所有结论;

关联分析:以全部样本进行关联分析处理生成关联分析结论集合,包含关联关系以及提升度;根据接收到的条件属性因子、结果属性因子,提取条件、结果中包含对应属性因子的关联分析结论;

定制报表:根据接收到的若干属性因子,进行数据统计。

本发明的有益效果是:

一、该种交通事故数据智能分析与综合应用系统,基于原始交通事故数据进行属性因子的重要度分析,配置了缺失数据估计策略,能够有效应对交通事故不同数据源提供的属性因子不一致的情况;从而从用户选择的样本数据中提取出带有交通事故重要信息的属性因子,并输出了定量化的重要度指标。

二、该种交通事故数据智能分析与综合应用系统,对原始交通事故记录进行处理,提取出与交通事故发生结果具有较强相关性的属性因子,并提供可量化的属性因子重要度指标,进而向交通安全管理者提供重点关注属性因子信息,在此基础上实现针对性强且多样化的交通事故数据分析,对于实施主动式的交通安全管理具有现实指导意义。

三、该种交通事故数据智能分析与综合应用系统,重要度分析的结果直接应用到系统中,实现了灵活的事故属性因子筛选功能,用户可以属性因子重要度为依据,进行分析维度以及统计属性的筛选,事故数据分析更具针对性。

四、本发明的交通事故数据智能分析与综合应用系统,事故数据分析模块提供了多种数据分析方式,能够提供多种数据分析结论。

附图说明

图1是本发明实施例交通事故数据智能分析与综合应用系统的说明示意图。

图2是实施例交通事故数据因子重要度分析模型的数据处理分析的流程示意图。

具体实施方式

下面结合附图详细说明本发明的优选实施例。

实施例

一种交通事故数据智能分析与综合应用系统,如图1,包含数据对接模块、挖掘处理模块、交互模块、地图模块、数据分析模块。

数据对接模块:从数据库中提取指定条件的交通事故数据;指定条件是指用户通过交互模块设置的时间范围以及通过地图模块设置的空间范围条件。

挖掘处理模块:由交通事故数据因子重要度分析模型驱动数据处理,其处理数据来源于数据对接模块;其中交通事故数据因子重要度分析模型,构建交通事故数据属性因子集合,配置缺失信息补全策略,根据属性因子级别以及数据缺失情况对属性因子进行缺失信息估计,在此基础上量化分析并输出属性因子集合元素的重要度。

交互模块:接收辅助决策处理引擎的属性因子集合以及重要度,并结合属性因子所属维度以及重要度数值大小进行可视化显示;还包括日期时间选择控件、属性因子选择控件;该模块将已设置的时间传输至数据对接模块,选中的属性因子传输至数据分析模块,并接收数据分析模块的分析结果,以专用控件进行内容展示;该模块还接收数据分析模块的分析结果,以专用控件进行内容展示。

数据分析模块:接收属性因子选择结果,以属性因子为数据分析角度,通过多种事故数据分析方式提供针对性地数据分析结果;数据分析方式包括因素分析、对应分析、关联分析、定制报表等。

地图模块:包含地理信息数据,支持地图操作;与交互模块协同实现系统的前端交互操作,并将数据分析模块输出的结果进行可视化呈现;还包括区域自定义工具,通过绘图设置目标区域;该模块并将划定的区域空间坐标范围传输至数据对接模块。

实施例的挖掘处理模块中,交通事故数据因子重要度分析模型的数据处理分析,具体为:

s1、确定交通事故数据一级属性维度:人员维度、车辆维度、道路维度、环境维度。

s2、根据交通事故数据的具体字段确定一级属性的二级属性集合,该属性集合为交通事故样本数据中二级属性因子全集,集合元素个数为nl(2);对二级属性因子进行三级拆解,获得三级属性因子全集,集合元素个数为nl(3),其中三级拆解根据二级属性因子的具体取值确定,离散属性变量即根据该变量的取值范围确定三级属性因子组成,连续属性则进行离散转换,再确定其三级属性因子组成。

在实施例中,一般事故的原始记录中可提取的人员维度对应的二级属性包括性别、年龄、国籍、户口性质、职业、驾龄;简易事故的原始记录中可提取的人员维度对应的二级属性包括性别、年龄。由此确定人员属性的二级属性集合元素为性别、年龄、国籍、户口性质、职业、驾龄。对于性别二级属性,其三级属性因子为男性、女性;年龄二级属性为连续变量,通过分段聚合拆解出三级变量。

s3、分别对二级属性因子全集、三级属性因子全集进行样本数据的分组合并,获得二级分组数量gn(2)及每组的样本量samplesize(2)、三级分组数量gn-(3)及每组的样本量samplesize(3)。

对于任一分组g(level)i,其属性因子包括s2中的该级别全部属性以及样本量samplesize(level)i;其中level表征属性因子级别,取值为2、3。

在实施例中,人员维度下的二级分组合并结果如下表所示:

在分组g(4)、g(6)、g(8)、g(9)、g(11)、g(12)、g(13)、g(14)、g(15)、g(16)、g(17)、g(18)、g(20)中均存在缺失数据的属性因子(△标示)。

s4、检测g(level)i属性因子数据是否存在缺失的情况,若不存在则转入步骤s5,否则,配置缺失信息补全策略,根据属性因子级别以及数据缺失情况对属性因子进行缺失信息估计;具体为:

s41、序号j=1;

s42、检测属性因子aj是否存在数据缺失的情况,若存在,则计算其数据缺失率rj=mj/gn(level),mi为缺失该属性因子的分组数,level的取值根据aj的属性级别确定;否则进入步骤s44;

s43、若ri∈[thl,thu],则通过随机森林方法补充缺失信息,其中thl、thu分别为上下限阈值;具体地,在不存在缺失的样本分组中划分训练集与测试集,由训练集拟合缺失值属性因子与其他属性因子的关系,根据经由测试集测试通过的随机森林,对该分组后数据进行缺失补全,即将其他属性因子输入随机森林,输出的分类结果作为该属性因子的估计值;

若ri∈[0,thl),则在后续分析中放弃该属性因子;

若ri∈(thu,1],则由统计值m进行缺失估计,统计值m在众数、平均数中选择;

s44、j<nl(level)是否成立?若成立,则j=j+1,回到s42循环处理;若不成立,则检测是否仍存在带有缺失值的属性因子,若是则返回s41循环处理,柔则结束缺失估计流程。

s5、基于分组合并数据构建随机森林回归模型,计算属性因子重要度;具体地,随机森林回归模型中的决策树数量为nt,对于每一颗树使用袋外数据计算袋外误差error1;随机对袋外数据所有样本的属性因子at进行噪声干扰,计算袋外误差error2;属性因子at的重要度d(ak)=∑|error1-error2|/nt。

实施例中,人员维度的二级属性因子重要度分析结果如下表:

数据分析模块中的因素分析,提取含有选中属性因子的所有数据样本,进行时间、空间维度的指标统计,其中指标包括事故总数、涉案人数、涉案车辆数、受伤人数、死亡人数、财产损失。

时间维度指标统计即按不同时间间隔长度(日、周、月、季、年)进行指标统计,分析结果由交互模块以统计图、统计报表呈现;空间维度指标统计,以事故发生位置坐标进行指标数据的空间汇集,分析结果由地图模块驱动,通过叠加展示图层呈现,叠加图层包括散点、热力图、聚合图、统计图等。

数据分析模块中的对应分析,以全部样本进行对应分析处理生成对应分析结论集合,包含对应分析二维散点图、属性因子对应分析结论,并从中提取含有选中属性因子的所有结论;输出结果由交互模块调用专用控件进行展示。

数据分析模块中的关联分析,以全部样本进行关联分析处理生成关联分析结论集合,包含关联关系以及提升度;根据接收到的条件属性因子、结果属性因子,提取条件、结果中包含对应属性因子的关联分析结论;输出结果由交互模块调用专用控件进行展示。

若数据分析模块在因素分析时,接收的属性因子为单个,进行单因素分析;若为多个,则进行多因素分析。

数据分析模块中的定制报表,根据接收到的若干属性因子,进行数据统计。

实施例的交互模块中,在展示对应分析结果时,以专用图形、文本控件展示对应分析二维散点图以及对应分析结论;展示关联分析结果时,以专用图形、文本控件展示属性因子的关联关系、提升度数据等;展示定制报表结果时,以表格空间展示事故数据统计结果,表头内容为选定的属性因子。

该种交通事故数据智能分析与综合应用系统的数据处理流程为:

用户通过交互模块的前端界面,在时间选择控件中设置起始日期、结束日期,在地图模块驱动的电子地图前端界面中,可通过绘图工具选定目标区域,也可通过查询筛选插件选择具体的行政区划、道路名、路段名。通过数据对接模块从数据库中调取时间区间以及空间范围内的交通事故原始数据。该模块还设置了默认时空范围,若用户未设置则按默认时空范围进行数据调取。

数据对接模块调取的原始数据通过挖掘处理模块进行处理,挖掘处理模块输出该时空范围内交通事故数据的分析属性因子以及重要度。

交互模块提供的前端界面中,其包含的筛选查询插件中的内容即为挖掘处理模块处理输出的属性因子、重要度指标,属性因子根据人员维度、车辆维度、道路维度、环境维度进行分类,在各类别下属性因子根据重要度指标数值大小进行排序。

用户在前端界面中,可查看各维度下属性因子及重要度指标,并选取一个或多个属性因子进行因素分析、对应分析、关联分析、定制报表统计;并在前端界面中查看分析结果与结论信息;并可将分析结果以.pdf、.doc等文件格式导出系统保存至本地。

实施例的交通事故数据智能分析与综合应用系统,基于原始交通事故数据进行属性因子的重要度分析,配置了缺失数据估计策略,能够有效应对交通事故不同数据源提供的属性因子不一致的情况;从而从用户选择的样本数据中提取出带有交通事故重要信息的属性因子,并输出了定量化的重要度指标。

该种交通事故数据智能分析与综合应用系统,重要度分析的结果直接应用到系统中,实现了灵活的事故属性因子筛选功能,用户可以属性因子重要度为依据,进行分析维度以及统计属性的筛选,事故数据分析更具针对性。

实施例的交通事故数据智能分析与综合应用系统,事故数据分析模块提供了多种数据分析方式,能够提供多种数据分析结论。实施例系统能够提供可量化的交通事故属性因子重要度指标;交通事故数据分析方式与结果呈现方式多样,数据统计报表表头亦可自主灵活定制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1