顾及案发时间不确定性的公安事件时空同现模式挖掘方法与流程

文档序号:16468510发布日期:2019-01-02 22:55阅读:455来源:国知局
顾及案发时间不确定性的公安事件时空同现模式挖掘方法与流程

本发明涉及本发明涉及时空数据挖掘与时空统计领域,尤其涉及一种顾及案发时间不确定性的公安事件时空同现模式挖掘方法。



背景技术:

探索公安事件与环境因素间的相关性,及各类公安事件间的交互性,是减少各类公安事件出现的重要途径之一。

目前,分析多类公安事件内部及其与外部因素(如社会、经济、地理环境因素)的研究方法主要有三种,即热点分析方法、回归分析方法和关联分析方法。其中热点分析方法首先将公安事件高密度区域识别为时空热点,然后与外部环境因素进行叠置分析。然而热点分析方法只能进行定性分析,难以定量描述公安事件与外部因素的相关性。因此有学者应用传统一元回归模型、多元回归模型量化表达公安事件与外部因素的相关性,由于地理事件在时空中具有异质性、依赖性,因此学者进一步应用空间自回归模型、地理加权回归模型量化公安事件与外部因素关联性。然而该方法在选择回归模型时具有主观性,并且尚缺乏多类公安事件间的内部关联关系识别方面的工作。为解决上述问题,学者们使用灰色关联方法和时空关联模式挖掘方法度量多类公安事件间的时空交互关系。其中灰色关联方法仅从时间维度,根据多类公安事件在时空中发展中发生数量变化的相似性度量其相关性,并未考虑到公安事件的空间位置属性。时空关联方法则充分考虑公安事件发生的时空位置,挖掘存在时空交互的关联模式。时空同现模式挖掘方法是时空关联方法的重要组成部分,旨在发现频繁满足空间邻近关系的地理事件集合,可为识别多类公安事件间的时空关联关系提供理论指导和科学支撑。

以上现有方法均未考虑到公安事件实际案发时间与登记时间存在差异的问题,较大的时间偏差很可能使得挖掘结果中存在误差,导致得到错误结论,从而可能造成相关部门决策失误。现有针对公安事件案发时间具有不确定性的技术工作集中应用于分析公安事件日分布趋势,以识别某类公安事件的发生高峰期和低谷期,而公安事件关联分析中案发时间不确定性的建模仍未引起重视。



技术实现要素:

本发明的目的在于克服现有技术中存在的缺陷,提供一种顾及案发时间不确定性的公安事件时空同现模式挖掘方法,以解决现有时空同现模式挖掘方法难以准确分析公安事件间的交互机制的技术问题。

本发明采用以下技术方案:

一种顾及案发时间不确定性的公安事件时空同现模式挖掘方法,所述方法包括:

s1、确定多类公安事件数据集;

s2、根据所述数据集中的每类公安事件所记录的可能案发时间区间,分析所述每类公安事件在单位时间内的概率分布,为所述每类公安事件案发时间构建概率表达模型,得到所述每类公安事件案发时间的概率分布密度函数;

s3、根据所述每类公安事件案发时间的概率分布密度函数,计算参与候选时空同现模式中公安事件实例间的时空距离,并进一步度量候选时空同现模式频繁度;

s4、根据所述候选时空同现模式频繁度确定所述候选时空同现模式是否为时空同现模式。

进一步,所述步骤s2包括:

s21、使用统一的时间分辨率将单位时间划分为若干时间槽;

s22、统计每类公安事件中的每个实例案发时间区间跨越的时间槽数量;

s23、按照所述时间槽的顺序逐步累加所述每类公安事件的平均发生概率,得到所述每类公安事件的时间概率分布;

s24、对所述每类公安事件的时间概率分布散点进行曲线拟合得到所述每类公安事件的时间概率分布函数,将所述时间概率分布函数进行求导得到所述每类公安事件的时间概率分布密度函数。

进一步,所述步骤s23还包括:

针对所述每个时间槽累加所述每个实例发生在该时间槽的概率,将所述每个时间槽的累加和除以该类公安事件的实例总量,得到该类公安事件的平均发生概率。

进一步,所述步骤s24还包括:

采用最小二乘法对所述公安事件的时间概率分布曲线进行曲线拟合。

进一步,所述步骤s3包括:

s31、计算所述每类公安事件的每个实例在其可能案发时间区间内的均值和方差;

s32、对包含k类公安事件的候选时空同现模式,根据所述均值和方差计算每两类公安事件实例间的时空距离,根据所述每两类公安事件实例间的时空距离确定候选时空同现模式的实例集合;

s33、根据所述候选时空同现模式的实例集合,计算候选时空同现模式的参与指数,根据所述参与指数判定该候选时空同现模式是否为时空同现模式。

进一步,所述步骤s31包括:

对公安事件ei的每个实例ei,计算发生在其可能案发时间区间内的概率,计算公式如下:

其中,fi(t)表示所述实例ei所属的所述公安事件ei的时间概率分布密度函数,tstart表示所述实例ei可能案发时间的起始值,tend表示所述实例ei可能案发时间的终止值;

通过fi(t)/s计算所述实例ei在其可能案发时间区间内的概率分布密度函数,根据所述概率分布密度函数计算所述实例ei在其可能案发时间区间内的均值和方差。

进一步,所述根据所述均值和方差计算每两类公安事件实例间的时空距离,具体包括:

其中,ds(ei,ej)表示实例ei,ej间的空间距离,xi,xj的分别表示实例ei,ej的空间坐标中的x值,yi,yj的分别表示实例ei,ej的空间坐标中的y值;

dt(ei,ej)表示实例ei,ej间的时间距离,分别是实例ei,ej在所述可能案发时间区间下的均值,var(ti),var(tj)分别表示实例ei,ej在所述可能案发时间区间下的方差。

进一步,所述根据所述每两类公安事件实例间的时空距离确定候选时空同现模式的实例集合具体包括:

当ds(ei,ej)小于空间距离阈值θs,并且dt(ei,ej)小于时间距离阈值θt,则所述实例ei,ej满足时空邻近关系,当k类公安事件的k个实例两两互相满足所述时空邻近关系,则称集合i={e1,e2,...,ek}是候选时空同现模式c的一个实例。

进一步,所述候选时空同现模式的参与指数的计算公式如下:

其中,分母表示公安事件ei的实例个数,分子表示所述候选时空同现模式c的实例中公安事件ei的实例个数。

进一步,所述根据所述参与指数判定该候选时空同现模式是否为时空同现模式具体包括:

当cpi(c)大于用户设定的频繁阈值ε,则将所述候选时空同现模式c识别为时空同现模式。

本发明的优点和有益效果在于:

本发明提供一种顾及案发时间不确定性的公安事件时空同现模式挖掘方法,通过为公安事件案发时间建立概率模型,充分考虑公安事件案发时间不确定性,从而提高公安事件时空同现模式挖掘方法识别结果的准确率。

附图说明

图1为本发明的顾及案发时间不确定性的公安事件时空同现模式挖掘方法流程示意图;

图2(a)为本发明扰乱治安的空间分布示意图;

图2(b)为本发明盗窃电动车的空间分布示意图;

图3(a)为本发明扰乱治安概率分布函数示意图;

图3(b)为本发明盗窃电动车概率分布函数示意图;

图4(a)为本发明扰乱治安概率分布密度函数示意图;

图4(b)为本发明盗窃电动车概率分布密度函数示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。

如图1所示,为本发明的顾及案发时间不确定性的公安事件时空同现模式挖掘方法流程示意图。所述方法包括:

s1、确定多类公安事件数据集;

s2、根据所述数据集中的每类公安事件所记录的可能案发时间区间,分析所述每类公安事件在单位时间内的概率分布,为所述每类公安事件案发时间构建概率表达模型,得到所述每类公安事件案发时间的概率分布密度函数;

s3、根据所述每类公安事件案发时间的概率分布密度函数,计算参与候选时空同现模式中公安事件实例间的时空距离,并进一步度量候选时空同现模式频繁度;

s4、根据所述候选时空同现模式频繁度确定所述候选时空同现模式是否为时空同现模式。

所述步骤s2具体包括:

s21、使用统一的时间分辨率将单位时间划分为若干时间槽,如以天为单位,时间分辨率为1小时,则一共包括24个时间槽;

s22、针对某类公安事件ei中的每一个实例ei,其可能案发时间区间为[tstart,tend],统计该实例案发时间区间跨越的时间槽数量tn,然后使用1/tn表示该实例在发生在每个该实例跨越的时间槽的概率。如以天为单位,时间分辨率为1小时,抢劫事件的某个实例ei案发时间区间为[1小时,4小时],则该实例发生在时间槽{1,2,3,4}的概率均为1/4;

s23、针对每一个时间槽spank累加每个实例发生在该时间槽的概率,然后将每个时间槽得到的累加和除以该类公安事件ei实例总量,称为平均发生概率,进而按照时间槽的顺序逐步累加平均发生概率,得到公安事件ei的时间概率分布;

s24、对上述公安事件ei的时间概率分布曲线上的多个点采用最小二乘法进行曲线拟合,得到公安事件ei的时间概率分布函数,该函数是以单位时间为周期的周期函数,进行求导操作,得到公安事件ei的时间概率分布密度函数fi(t),用于描述某类公安事件ei案发时间分布,其中t表示时间,同样的,时间概率分布密度函数也是周期函数。

上述步骤s3包括:

s31、对公安事件ei的每个实例ei,计算发生在其可能案发时间区间内的概率,即公安事件ei时间概率分布密度曲线在实例ei可能案发区间内的线下面积s,计算公式如下:

其中,fi(t)表示实例ei所属的公安事件ei的时间概率分布密度函数,tstart表示实例ei可能案发时间的起始值,tend表示实例ei可能案发时间的终止值;进一步通过fi(t)/s计算实例ei在其可能案发时间区间内的概率分布密度函数,根据得到的概率分布密度函数计算实例ei在其可能案发时间区间内的均值和方差;

s32、对包含k类公安事件的候选时空同现模式,计算每两类公安事件实例间的时空距离(以欧式距离为例),计算公式如下:

其中,ds(ei,ej)表示实例ei,ej间的空间距离,xi,xj的分别表示实例ei,ej的空间坐标中的x值,yi,yj的分别表示实例ei,ej的空间坐标中的y值;

dt(ei,ej)表示实例ei,ej间的时间距离,分别是实例ei,ej在所述可能案发时间区间下的均值,var(ti),var(tj)分别表示实例ei,ej在所述可能案发时间区间下的方差;

当ds(ei,ej)小于空间距离阈值θs,并且dt(ei,ej)小于时间距离阈值θt,则所述实例ei,ej满足时空邻近关系,当k类公安事件的k个实例两两互相满足所述时空邻近关系,则称集合i={e1,e2,...,ek}是候选时空同现模式c的一个实例;

s33、结合候选时空同现模式c的实例集合,计算候选时空同现模式c的参与指数,利用下列公式计算:

其中,分母表示公安事件ei的实例个数,分子表示所述候选时空同现模式c的实例中公安事件ei的实例个数。

当cpi(c)大于用户设定的频繁阈值ε,则将所述候选时空同现模式c识别为时空同现模式。

下面采用我国某市2015年扰乱社会治安、盗窃电动车2类公安事件对本发明的具体实施进行说明,下面将结合此实例具体说明本发明辅助解决公安事件相关问题的具体实施步骤:

1)预处理数据。首先筛出公安事件中,时空位置记录不完整的数据,2类公安事件的空间分布如图2所示。

2)提取公安事件案发时间概率分布。在单位时间为“天”的情况下,以0.5小时为分辨率,将一天划分为48个时间槽。对2类公安事件,均采用步骤s2中方法拟合出每类公安事件的时间概率分布函数,结果如图3所示。

3)计算2类公安事件的时间概率分布密度函数,即上述得到的案发时间概率分布函数的导数,如图4所示。

4)针对2类公安事件,均使用上述步骤s31中的方法计算每个实例在其对应案发时间区间中的均值和方差。

6)将空间距离阈值θs设为1500米,时间距离阈值θt设为3天,判别2类公安事件实例间的时空邻近关系。

7)设置频繁阈值ε=0.15,针对候选时空同现模式c={扰乱社会治安,盗窃电动车},计算参与指数cpi(c)=0.19,大于频繁阈值ε,将时空同现模式c={扰乱社会治安,盗窃电动车}识别为时空同现模式。

本发明提供一种顾及案发时间不确定性的公安事件时空同现模式挖掘方法,通过为公安事件案发时间建立概率模型,充分考虑公安事件案发时间不确定性,从而提高公安事件时空同现模式挖掘方法识别结果的准确率。

以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1