一种基于大数据的城市社区安全预测方法与流程

文档序号:18168046发布日期:2019-07-13 09:44阅读:260来源:国知局
一种基于大数据的城市社区安全预测方法与流程

本发明涉及大数据中的城市计算和数据融合领域,特别涉及一种基于大数据的城市社区安全预测方法。



背景技术:

随着城市化的快速发展,城市面临越来越多的挑战,如环境恶化、交通拥堵和环境安全等。由于安全和日常生活相关,人们非常关心自己所居住环境的安全问题。环境安全和很多因素有关,且与各个因素之间存在潜在的关系。

目前,安全预测已经成为机器学习和深度学习热门的研究课题之一。在现有的研究当中,更多是针对人口统计数据经过机器学习预测城市安全和犯罪数据通过循环神经网络进行下一时刻犯罪的预测。但对于实际情况下的城市社区安全研究,现有的研究方法很难满足预测准确性的需求。

在大数据时代,人们可以收集来自传感器、企业平台和政府机构公开的城市数据集,例如城市异常数据、人类活动数据、兴趣点数据和犯罪数据。通过数据处理和数据挖掘,找出这些数据集如何动态地反映城市的生活规律和数据集之间存在怎样的潜在联系去影响城市社区安全。然而,如何融合这些数据集去预测城市社区安全,已经成为一项亟待解决的关键技术问题。



技术实现要素:

本发明针对如何融合多源数据集去预测城市社区安全的问题,提供了一种基于大数据的城市社区安全预测方法,该方法充分利用城市产生的各类数据,探究各类数据之间存在的潜在联系,并利用潜在的联系去准确预测城市社区所在区域的环境安全。

针对上述技术问题,本发明提供一种基于大数据的城市社区安全预测方法,其技术方案为:挖掘城市数据集之间的潜在关系,融合所述潜在关系去预测城市动态生活的相关方面,包括周边功能区域的影响、犯罪事件的影响和相关因素的影响;

将上述周边功能区域、犯罪事件和相关因素的影响通过每个部分相应的神经网络输出相应影响的概率向量,将这些概率向量通过连接层进行连接,并输入多层感知机,分析这些不同源的影响对城市社区安全的综合评价,在多层感知机的最后,加入一个激活函数来激活此层,此方法选用sigmoid激活函数进行激活,计算出城市社区安全的预测结果,使输出的预测结果在0~1之间,方便对后期安全等级划分的工作。

本方法具体步骤为:

s1、根据城市的主干道和人们的动态生活规律,对需要预测的城市进行栅格化处理,将城市划分为若干个栅格,并对城市的每个栅格进行区域编号。

s2、在划分的栅格里,把城市社区所在的栅格标记为预测目标区域,并对收集到的数据进行预处理,处理成实验所需要的数据类型格式,其中城市异常数据记录异常发生的时间、地点和异常类型,人类活动数据包括城市出租车和共享单车的gps轨迹,兴趣点数据记录城市在每个区域里不同兴趣点的统计个数,犯罪数据记录不同区域不同类型犯罪统计的次数;将预处理后的数据分别映射到对应的栅格中。

s3、根据兴趣点类型的不同,将每个栅格里的兴趣点统计信息组成长度相同的向量,把每个栅格的区域编号进行one-hot编码,将编码后的结果通入嵌入网络学习,生成维度较低的向量,在此学习过程中,兴趣点向量作为约束条件制约one-hot编码在嵌入网络里的学习,以预测目标区域为中心形成包含两层栅格的方形区域,将方形区域中每个栅格学习的低维向量全部组装起来,形成图片像素矩阵的格式,其中图片大小为方形区域长和宽边长上所包含栅格的个数,图片的深度为区域学习到低维向量的维度,图片的每个像素点值为低维向量元素的数值,将上述图片像素矩阵传入卷积神经网络学习出周边功能区域对目标区域环境安全的影响。

s4、将城市社区所在的栅格为中心形成外围包含一层栅格的方形区域,将该方形区域作为预测区域,统计出该预测区域的不同时刻不同类型的犯罪事件形成犯罪事件矩阵,其中每行表示预测区域某一时刻的不同犯罪类型统计信息向量,每列表示预测区域同一犯罪类型的不同时刻统计信息向量,将犯罪事件矩阵输入犯罪事件预测器中,输出下一时刻不同类型犯罪事件发生的概率向量,其中犯罪预测器由若干个卷积长短时间记忆单元构成,任一所述记忆单元的输入为预测器中前一记忆单元隐藏状态的输出和该记忆单元外部信息的输入,外部信息的输入为记忆单元对应时刻的犯罪事件不同类型的信息向量。

犯罪事件预测器中记忆单元的函数表达式如式(1)所示:

ft=σ(wf·[ht-1,xt]+bf)

it=σ(wi·[ht-1,xt]+bi)

ot=σ(wo·[ht-1,xt]+bo)

ht=ot*tanh(ct)(1)

式(1)中,ft为遗忘门限,it为输入门限,为长期状态估计值,ct为长期状态,ot为输出门限,ht为短期状态,σ代表为sigmoid函数,wf、wi、wc和wo分别为需要学习的权重,bf、b、bc和bo分别为需要学习的偏置项,ht-1为前一个记忆单元隐藏状态的输出,xt为第t时刻预测区域的不同类型统计信息的向量。

s5、将社区所在区域发生的异常事件进行统计,形成异常事件向量,把人类活动数据的轨迹映射到相应的城市区域里,计算出目标区域人流的流入和流出向量,把异常事件向量和人流的流入流出向量输入连接层进行连接,然后把连接后的输出向量通过两层全连接层输出区域异常事件发生的概率向量,将多个时刻的异常事件概率向量形成异常事件矩阵并输入异常事件预测器,经过学习输出下一时刻异常事件发生的概率向量,其中异常事件预测器由多层若干长短时间记忆单元连接构成,异常事件预测器和犯罪事件预测器结构单元类似,但结构的参数和结构层数不同。

s6、将周边区域功能影响的向量、犯罪事件预测概率的向量和异常事件预测概率的向量进行连接形成一个综合影响向量,把综合影响向量传入多层感知机学习三者的影响对整个预测区域的综合评估,计算出该社区所在区域的环境安全。

本发明实施例提供的技术方案带来的有益效果是:本发明基于大数据的城市社区安全预测方法利用了静态统计信息、时间序列信息和神经网络融合的思想,挖掘出各类数据之间存在的潜在联系,并分析这些联系的共性进行城市社区安全的预测。本发明的各个步骤具有下述优点:

步骤s3:用嵌入网络学习区域的低维向量,可以将区域编码的稀疏分类向量转换成低维的数值向量,这样可以减少后面计算的复杂度及为输入卷积神经网络提供数值的数据类型,学习的低维向量可以很好的表现出每个栅格的区域功能,并可以很容易找到功能相似的栅格,同时通过卷积神经网络输出一定长度的概率向量,这样可以学习出预测目标周边栅格的区域功能对目标的环境安全影响。

步骤s4:由于社区所在栅格的周边栅格对预测目标有着重要的影响,在本步骤中将其同一形成所需预测的目标区域,将该预测区域过往的犯罪事件矩阵输入循环神经网络去预测下一时刻犯罪事件发生的概率,若干长短时间记忆单元组成的循环神经网络能很好地学习在时间序列数据中存在的潜在联系,学习犯罪事件之间存在的事件分布。

步骤s5:不同时刻目标区域所发生的异常数据存在数据不完整性,可能使得数据比较稀疏或缺少预测的重要信息,这样造成预测准确性的降低,人类活动数据发生的明显的改变,可能和异常事件的发生相关,通过人流的流入流出向量对异常数据进行补充,可以更好的提高异常预测的准确性,异常事件向量和人流的流入流出向量进行连接并输入两层全连接层,输出的结果可以更好的表示人类活动数据和异常事件的关系,最后通过预测器进行预测,输出结果的准确率比单独使用异常事件数据和仅仅连接的效果要提高很多。

附图说明

图1为本发明具体实施例的一种基于大数据的城市社区安全预测方法的流程示意图。

图2为本发明具体实施例的区域功能影响结构示意图。

图3为本发明具体实施例的犯罪预测器结构示意图。

图4为本发明具体实施例的影响因素融合结构示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。当然,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。

需要说明的是,在不冲突的情况下,本发明创造中的实施例及实施例中的特征可以相互组合。

实施例1

参见图1至图4,本发明提供一种基于大数据的城市社区安全预测方法,如图1所示是该方法整个预测流程示意图,在对城市社区安全进行预测时,需要找到能动态地反应城市日常生活规律的相关数据集,对这些数据集进行预处理,再通过数据挖掘和数据融合的方法对这些数据集进行分析,最终得到城市社区安全的预测。具体实施过程如下:

s1,根据城市的主干道和动态的生活规律,对需要预测的城市进行栅格化处理,将城市划分为多个栅格。

s2,在划分的栅格里,标记出社区所在的栅格作为预测目标,并对收集到的数据进行预处理,处理成实验所需要的数据类型格式,其中城市异常数据记录异常发生的时间、地点和异常类型,人类活动数据包括城市出租车和共享单车的gps轨迹,兴趣点数据记录城市在每个区域里不同兴趣点的统计个数,犯罪数据记录不同区域不同类型犯罪统计的次数;将预处理后的数据分别映射到对应的栅格中。

s3,根据兴趣点类型的不同,将每个栅格里的兴趣点统计信息组成长度相同的向量,把每个栅格进行one-hot编码,并将其通入嵌入网络形成维度较低的向量,在此过程中,兴趣点向量作为约束条件制约栅格编码在嵌入网络里的学习,以预测目标为中心形成包含两层栅格的方形区域,将方形区域形成图片像素矩阵的格式,其中图片大小为方形区域长和宽所包含栅格的个数,图片的通道个数为区域学习低维向量的维度,图片的每个像素点值为低维向量的数值,将上述图片传入卷积神经网络学习出周边区域对目标环境安全的影响。

用嵌入网络学习区域的低维向量,可以将区域编码的稀疏分类向量转换成低维的数值向量,这样可以减少后面计算的复杂度及为输入卷积神经网络提供数值的数据类型,学习的低维向量可以很好的表现出每个栅格的区域功能,并可以很容易找到功能相似的栅格,同时通过卷积神经网络输出一定长度的概率向量,这样可以学习出预测目标周边栅格的区域功能对目标的环境安全影响。

s4,以标记出社区的栅格为中心形成包含一层栅格的方形区域,将该方形区域作为预测区域,统计出该预测区域的不同时刻不同类型的犯罪事件形成犯罪事件矩阵,其中每行表示预测区域同一时刻的不同犯罪类型统计信息,每列表示预测区域同一犯罪类型的不同时刻统计信息,将犯罪事件矩阵输入犯罪预测器中输出下一时刻不同类型犯罪事件发生的概率,其中犯罪预测器由若干个卷积长短时间记忆单元构成,任一所述记忆单元的输入为预测器中前一记忆单元隐藏状态的输出和该记忆单元外部信息的输入,外部信息的输入为记忆单元对应时刻的犯罪事件不同类型的信息向量。

犯罪事件预测器中记忆单元的函数表达式如式所示:

ft=σ(wf·[ht-1,xt]+bf)

it=σ(wi·[ht-1,xt]+bi)

ot=σ(wo·[ht-1,xt]+bo)

ht=ot*tanh(ct)

式中,ft为遗忘门限,it为输入门限,为长期状态估计值,ct为长期状态,ot为输出门限,ht为短期状态,σ代表为sigmoid函数,wf、wi、wc和wo分别为需要学习的权重,bf、b、bc和bo分别为需要学习的偏置项,ht-1为前一个记忆单元隐藏状态的输出,xt为第t时刻预测区域的不同类型统计信息的向量。

由于社区所在栅格的周边栅格对预测目标有着重要的影响,在本步骤中将其同一形成所需预测的目标区域,将该预测区域过往的犯罪事件矩阵输入循环神经网络去预测下一时刻犯罪事件发生的概率,若干长短时间记忆单元组成的循环神经网络能很好地学习在时间序列数据中存在的潜在联系,学习犯罪事件之间存在的事件分布。

s5,将发生在社区所在栅格的异常事件进行统计,形成异常事件向量,根据人类活动数据,计算出目标区域人流的流入和流出向量,把异常事件向量和人流的流入流出向量输入连接层,然后连接后的输出向量通过两层全连接层输出预测区域异常事件发生的概率向量,将多个时刻的异常事件发生概率向量输入异常事件预测器,经过学习输出下一时刻异常事件发生的概率向量,其中异常事件预测器由若干长短时间记忆单元连接构成,异常事件预测器和犯罪事件预测器结构类似,但学习到的参数和结构层数不同。

不同时刻目标区域所发生的异常数据存在数据不完整性,可能使得数据比较稀疏或缺少预测的重要信息,这样造成预测准确性的降低,人类活动数据发生的明显的改变,可能和异常事件的发生相关,通过人流的流入流出向量对异常数据进行补充,可以更好的提高异常预测的准确性,异常事件向量和人流的流入流出向量进行连接并输入两层全连接层,输出的结果可以更好的表示人类活动数据和异常事件的关系,最后通过预测器进行预测,输出结果的准确率比单独使用异常事件数据和仅仅连接的效果要提高很多。

s6:将区域功能影响的向量、犯罪事件预测概率的向量和异常事件预测概率的向量进行连接形成一个综合影响向量,把综合影响向量传入多层感知机,计算出该社区所在栅格的环境安全。

以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1