本发明涉及交通数据分析领域。具体而言是一种公安交管业务异常数据综合研判方法及系统。
背景技术:
随着公安交通管理综合应用平台(简称“综合应用平台”,又称“六合一”)的广泛应用,该系统已经成为各级公安交管部门业务开展的核心平台,对提升各级交管业务部门管理能力和服务水平起到了不可替代的重要作用。但是,由于一线干警在对信息系统的理解和重视程度参差不齐,在信息录入时随意性较大,部分地区录入偏好于“其它”等公用类型,同时伴随实际业务开展逐步完善的系统功能建设也产生大量历史数据等现实问题,导致核心业务数据中仍然大量存在空白字段、身份号码中性别与性别字段不符、关键指标大幅偏离均值等现象,大大降低了这些“种子数据”在综合研判和数据分析中的关键作用,也无法很好地为相关业务数据关联关系的建立发挥“传导介质”作用。一些深层次的业务逻辑问题和异常状态数据的发现还主要依靠分析人员的工作经验,评估效率低、覆盖范围小、难以为业务开展提供很好的指导作用等问题还比较突出。
技术实现要素:
本发明的目的在于提供一种公安交管业务异常数据综合研判方法及系统,以解决上述背景技术中提出的问题。
为实现上述发明目的,本发明采用如下的技术方案:
一种公安交管业务异常数据综合研判方法,其实现步骤如下:
步骤一:数据预处理。
将采集到的数据进行汇总,传入数据库,并做数据清洗、数据转换、数据集成等工作。
步骤二:建立正则表达式库,对数据进行处理。
2.1对步骤一预处理后的业务数据,分析业务数据构成规则,确定业务数据的重点关注字段;
2.2根据重点关注字段的类型和属性,设计各重点关注字段的正则表达式,构建正则表达式库;
2.3根据建立的正则表达式库,分析公安交管业务数据中的异常录入数据,并对异常录入数据进行修正,建立公安交管业务数据库d1。
步骤三:建立异常数据研判模型。
通过apriori算法分析公安交管业务历史数据之间的关联规则,进而通过关联规则对业务异常数据进行分析研判。
3.1针对数据库d1中的数量属性字段,利用极大极小值、线性模型或者确定性的函数关系模型识别异常数据;
3.2整合数据库d1中未建立异常数据识别规则的字段,建立数据库d2,对数据库d2中的数量属性字段进行离散化;
3.3根据apriori算法,生成候选项集ck和频繁项集lk;
3.4当数据库d2增加新的数据集d时,引入参数i(1<i<∞),计算新的频繁项集lk';
3.5计算强关联规则;
3.6根据强关联规则和交管业务历史数据,建立数据异常研判模型。
步骤四:异常数据实时在环检测。
通过软件在环检测技术,实时检测异常数据并对数据进行整合分析,为车管、驾管、违法、事故等业务开展提供数据基础,减少对业务工作正常开展的不利影响。
一种公安交管业务异常数据综合研判系统,包括数据预处理子系统、正则表达子系统、异常数据研判子系统和在环检测子系统。
所述数据预处理子系统,将采集到的数据进行汇总,传入数据库,并做数据清洗、数据转换、数据集成等工作。
所述正则表达子系统,对预处理之后的公安交管业务数据进行分析,包括业务分类、业务关联分析以及业务数据提取。使用正则表达式对数据分析,分析数据的构成规则,凝练跨业务数据正则表达式,构建正则表达式库。
所述异常数据研判子系统,通过apriori算法分析公安交管业务数据之间的关联规则,进而通过关联规则对业务异常数据进行研判。
所述在环检测子系统,通过软件在环检测技术,实时检测异常数据并对数据进行整合分析,并生成分析报告,为车管、驾管、违法、事故等业务开展提供数据基础,减少对业务工作正常开展的不利影响。
与现有技术相比,本发明的有益效果是:
本发明能够快速有效地检测公安交管业务数据中的异常数据,通过在环检测技术,能够在不影响业务系统性能和业务工作开展的前提下,实施数据检测并生成分析报告,为公安交管业务异常数据分析研判的常态化开展提供有效的技术保障。
附图说明
图1为公安交管业务异常数据综合研判方法的流程图
图2为异常数据实时在环检测方法的流程图
图3为公安交管业务异常数据综合研判系统的结构示意图
具体实施方式
下面结合实际过程对本发明做具体的介绍。
本发明提供了一种公安交管业务异常数据综合研判方法,其实现步骤如下:
步骤一:数据预处理。
将采集到的数据进行汇总,传入数据库,并做数据清洗、数据转换、数据集成等工作。
步骤二:构建正则表达式库。
2.1对步骤一预处理后的业务数据,分析业务数据构成规则,确定业务数据的重点关注字段;
2.2根据重点关注字段的类型和属性,设计各重点关注字段的正则表达式,构建正则表达式库;
2.3根据建立的正则表达式库,分析公安交管业务数据中的异常录入数据,并对异常录入数据进行修正,建立公安交管业务数据库d1。
步骤三:建立异常数据研判模型。
通过apriori算法分析公安交管业务历史数据之间的关联规则,进而通过关联规则对业务异常数据进行分析研判。
3.1针对数据库d1中的数量属性字段,利用极大极小值、线性模型或者确定性的函数关系模型识别异常数据;
3.2整合数据库d1中未建立异常数据识别规则的字段,建立数据库d2,对数据库d2中的数量属性字段进行离散化;
3.3根据apriori算法,生成候选项集ck和频繁项集lk;
3.4当数据库d2增加新的数据集d时,引入参数i(1<i<∞),计算新的频繁项集lk';
3.5计算强关联规则;
3.6根据强关联规则和交管业务历史数据,建立数据异常研判模型。
步骤四:异常数据实时在环检测。
通过软件在环检测技术,实时检测异常数据并对数据进行整合分析,为车管、驾管、违法、事故等业务开展提供数据基础,减少对业务工作正常开展的不利影响。
本发明提供的一种公安交管业务异常数据综合研判方法能够快速有效地检测公安交管业务数据中的异常数据,通过在环检测技术,能够在不影响业务系统性能和业务工作开展的前提下,实施数据检测并生成分析报告,为公安交管业务异常数据分析研判的常态化开展提供有效的技术保障。
与上述方法相对应的,本发明还提供了一种公安交管业务异常数据综合研判系统,包括数据预处理子系统、正则表达子系统、异常数据研判子系统和在环检测子系统。
所述数据预处理子系统,将采集到的数据进行汇总,传入数据库,并做数据清洗、数据转换、数据集成等工作。
所述正则表达子系统,对预处理之后的公安交管业务数据进行分析,包括业务分类、业务关联分析以及业务数据提取。使用正则表达式对数据分析,分析数据的构成规则,凝练跨业务数据正则表达式,构建正则表达式库。
所述异常数据研判子系统,通过apriori算法分析公安交管业务数据之间的关联规则,进而通过关联规则对业务异常数据进行研判。
所述在环检测子系统,通过软件在环检测技术,实时检测异常数据并对数据进行整合分析,并生成分析报告,为车管、驾管、违法、事故等业务开展提供数据基础,减少对业务工作正常开展的不利影响。
所述数据预处理子系统,其处理的数据主要包括机动车登记数据、驾驶证管理数据、交通违法处理数据、交通事故处理数据、交警队基础信息、剧毒化学品公路运输数据。
(1)机动车登记数据:全国公安采集的关于已合法登记的机动车数据,包括机动车序号、号牌种类、号牌号码、车辆型号、车辆识别代码、使用性质、机动车所有人等。
(2)驾驶证管理数据:登记在册并经过认可的机动车驾驶员数据,包括其姓名、身份编号(身份证号码)、驾驶证类型、联系方式等。
(3)交通违法处理数据:为交通违法相关信息数据,具体包括交通违法代码、交通违章行为、交通违章地点、处理结果等。
(4)交通事故处理数据:为交通事故相关信息数据,具体包括事故的类型、事故地点、事故事件、事故双方基本信息以及事故责任划分等。
(5)交警队基础信息:大中队基本信息、巡逻执勤信息、宣传台账信息、接处警信息等。
(6)剧毒化学品公路运输数据:剧毒化学品信息、承运单位信息、驾驶人信息、押运人信息、运输路线信息、运输时间信息等。
本发明提供的一种公安交管业务异常数据综合研判系统能够快速有效地检测公安交管业务数据中的异常数据,通过在环检测技术,能够在不影响业务系统性能和业务工作开展的前提下,实施数据检测并生成分析报告,为公安交管业务异常数据分析研判的常态化开展提供有效的技术保障。