利用手机数据发现城市活动中异常事件的方法

文档序号:6553907阅读:200来源:国知局
专利名称:利用手机数据发现城市活动中异常事件的方法
技术领域
本发明属于城市管理和信息技术领域,涉及一种城市异常事件发现方法。
背景技术
随着城市化步伐的加快,能够理解和预测群体事件对于城市管理者尤其是对大城市的管理者来说是一个严重的挑战。当不能准确地确定参加事件的人数时(例如,从门票收入),传统预测的手段是靠直觉和经验来估计群体性事件的。即使知道了参加事件的准确人数,那么预测事件参与者对城市管理的影响也是很困难的。事件预测可以采用基于人群分析的方法,在人群分析方法中有事件推理和人群建模两个概念。事件推理的目标是在给定数据(例如一个地方和集成通话的图像)情况下检测人群是否存在。事件推理中的事件可能是可预测的,也可能是对应一个实际的公共异常事件;人群建模的任务包括建立人群模式或者人群描述,这些模式或者描述能够预测或者模拟人群行为。一个成功的人群模型考虑到了有效的应用,例如空间的预测,计划的可行性,防止危险情况或以及计划一个应急疏散都是有效的应用。从三个层次对人群建模进行分析微观、宏观、介观。在微观层面上,个人是研究对象,而在宏观层面上的研究对象是群组。介观层次上的建模包括前两者的特性,既要把一个群体看成一个有均一水平的团体又要考虑个体之间的相互作用以及个体的特点。对于人群行为的建模,能够涉及到几个不同的领域。在计算机视觉中,人群建模是通过视觉手段分析人群的视频数据来表现周期性行为。在物理学中,受到流体动力学,群, 元胞自动机的启发发展了许多方法。在过去几年,“普遍计算社区”开发了一些技术,例如 GSM、蓝牙或者无线定位技术;这样一来我们可以利用这些技术大规模地分析人群事件并得到更重要的信息。从数据收集的角度来看,传统的人群分析方法由来自控制点的数据聚合(如售出门票数量;在宾馆的夜晚,每个房间的人数;总人数)以及从随机选择的个人调查组成。在 90年代,从计算机视觉研究带来另外的(非侵入性的)方法,即检测密度(人在空间的数量),地点,速度,和人群形状,通过这些方法提取人群的相关特点。虽然可以对这些属性进行有用的分析,但是可用相机的数量限制了这种研究。随着移动电话的爆发,连同现在的传感器和更先进的通信系统(如GPS、数码相机、蓝牙、WiFi)的出现,使得用中大量的数据来研究群体、个体或者个体与群里的结合成为可能。前述各种技术带来了不同的挑战但是这使得相关事件的推论成为可能。当事件被定位在空间时用传统的方法进行分析是缓慢的、精确的。计算机视觉允许事件的自动推理同时也提供了事件的一些特性,例如上面提到的有限的可视化数据。采用如通信或者GPS 这样的数字足迹跟踪可以有更广阔的区域,但是与前述方法比精度比较低。就细节水平而言,传统的方法在宏观粒度(除非个性化数据收集)上是能胜任的,计算机视觉是适用与任何粒度水平尤其适用与宏观和介观分析,而这种利用手机位置移动数据或者叫数字足迹(这些手机数据是通过手机的计费数据获得)的方法在个人隐私受到很好的保护时能用于任何粒度的分析,即微观水平。当然,这种方法的精度是依靠研究中技术的渗透速率(例如人群中手机用户的数量)决定的。为能够在国家、地区或城市管理的水平上调查异常事件对经济和城市拥塞的影响,从而更有效实现交通规划及交通物流管理就必须清楚地了解的中、大规模的异常事件及其经济影响。其中一个问题是在中大规模事件中了解人群模式的稳定性。如果可以找到人群的规律性,那么就可以开发出基于这种人群模式的服务了,并来完善事件的经验(例如,事件后提供疏散建议);相反的,也可以通过了解居民更愿意参加哪类事件来特征化居民。这就会绘出到每个区域的爱好结构图,反过来在定位系统上增加爱好结构图,那么增加了偏好值的地理信息会变成有关的空间语境信息。如果事件参与者的来源位置和事件类型直接相关,就可以通过参与者的来源信息能够预测事件类型。已经有人确定了事件参与者的来源和事件类型之间存在着关系,那么对于大规模事件就可以通过考虑它的事件类型来推测出是否为异常事件和这个大规模事件额外的需求。例如,可以提供一些关于交通管理决策中的关键信息,增加从某个区域到事件地点的公家车路线的数量等。

发明内容
本发明的目的是提供一种能够快速发现事件参与者的来源和事件类型之间的关系,从事件参与者的来源分布推测出事件类型或者推测是否为异常事件的事件预测方法。 本发明的技术方案如下一种利用手机数据发现城市活动中异常事件的方法,包括下列步骤(1)从某个区域的已知事件中选择符合下列标准的事件;-参与人数应该满足所设定的规模;-在空间上相对于相邻事件是独立的;-事件的场地是明确区域;-在时间上和该区域的任何事件是独立的;-至少持续一段时间;(2)利用手机计费数据对符合上述标准的事件进行参与者的筛选和参与者家庭住址的定位,之后对所有的事件进行计数统计来特征化这些事件,得到标准库的数据集,步骤如下2-1从电信运营商那里获得匿名手机计费数据;2-2将用户每使用一次手机视为发生一次用户事件,对于所搜集到的每个用户的手机计费数据,统计各个用户事件的间隔时间,利用由经度、纬度组成的位置点Pi和时间戳 ti来特征化用户移动行为的个体位置测量数据Hli ;2-3从个体位置测量数据中按照下列方法提取轨迹a.设一个轨迹是一个用户按时间顺序访问过的η个位置序列Traj =
{Pi — P2 — Λ — pj ;b.对轨迹进行分割得到子轨迹;c.设定时间阈值Tth和空间阈值Sth,对每个子轨迹,确定用户停止移动的时间和呼叫停止位置点,用一组连续的呼叫停止位置点来表征用户的停止序列
权利要求
1. 一种利用手机数据发现城市活动中异常事件的方法,包括下列步骤(1)从某个区域的已知事件中选择符合下列标准的事件;-参与人数应该满足所设定的规模;-在空间上相对于相邻事件是独立的;-事件的场地是明确区域;-在时间上和该区域的任何事件是独立的;-至少持续一段时间;(2)利用手机计费数据对符合上述标准的事件进行参与者的筛选和参与者家庭住址的定位,之后对所有的事件进行计数统计来特征化这些事件,得到标准库的数据集,步骤如下1)从电信运营商那里获得匿名手机计费数据;2)将用户每使用一次手机视为发生一次用户事件,对于所搜集到的每个用户的手机计费数据,统计各个用户事件的间隔时间,利用由经度、纬度组成的位置点Pi和时间戳、来特征化用户移动行为的个体位置测量数据Hli ;3)从个体位置测量数据中按照下列方法提取轨迹a.设一个轨迹是一个用户按时间顺序访问过的η个位置序列Traj={Pi — P2 — Λ — pj ;b.对轨迹进行分割得到子轨迹;c.设定时间阈值Tth和空间阈值Sth,对每个子轨迹,确定用户停止移动的时间和呼叫停止位置点,用一组连续的呼叫停止位置点来表征用户的停止序列P = {1)3,?3+1,人,?111},其中 Vs <u^mimaXCdistanCe(PilPj)) 且tm-ts > Tth,序列中的每个呼叫停止位置点称之为用户的停留点;4)用户的家庭位置被认为成在晚上最频繁的停留点,据此推断用户的家庭住址;5)根据下列判据,判断一个用户是否是事件的参与者i)用户在与事件相同的位置单元停留ii)停留时间至少和事件时间有70%的重叠iii)家庭住址和事件位置单元是不同的6)统计各个事件发生的位置单元、参加事件的人数、事件类型,对事件进行计数统计的特征化,建立标准库的数据集;(3)设事件类型数为K,并设定对数据集进行聚类训练的初始类中心,对标准库的数据集里的未经训练的事件数据进行如下的聚类训练1)计算每两个事件之间的距离,并选择最大距离和最小距离;令a=最大距离/K,b = 最小距离/K,进行下一步;2)对数据集中的每个事件做如下操作a.从当前的初始类中心中找到与该事件最近的类中心;b.如果该事件与最近类中心的距离小于a,则该事件被划分到该类,否则,将该事件作为一个新的类中心;3)若类中心的个数大于K个,从各个类中心中选取包含事件个数最多的K个类中心作为初始类中心,否则,选取所有的类中心作为初始类中心;4)重复以下操作,直到每个初始类中心m的距离变化小于b :a.计算每个事件与各个初始类中心的距离,将其划分到最近的类;b.重新计算每个类中心m、半径d和标准差c;(4)对于发生在该区域里并符合步骤(1)列出的标准的待检测的新事件,采用步骤(2) 的方法,对事件进行参与者的筛选和参与者家庭住址的定位,之后对待检测的新事件进行计数统计,得到新的事件数据,再按照步骤(3)的方法聚类训练,并计算待检测的新事件和每个类中心m的距离,从中选择一个最小的距离minD ;如果minD小于(d+3c)则该事件的类型不是异常事件,否则判断该事件可能为异常事件。
2.根据权利要求1所述的利用手机数据发现城市活动中异常事件的方法,其特征在于,在对每个子轨迹,确定用户停止移动的时间和呼叫停止位置点之前,对于轨迹,先利用低通滤波器滤去由于手机计费数据噪音产生的子轨迹噪音。
3.根据权利要求1所述的利用手机数据发现城市活动中异常事件的方法,其特征在于,所述的位置单元即是根据邮编划定的行政区域。
全文摘要
本发明属于城市管理和信息技术领域,涉及一种利用手机数据发现城市活动中异常事件的方法,包括下列步骤(1)从某个区域的已知事件中选择符合标准的事件;(2)利用手机计费数据对符合上述标准的事件进行参与者的筛选和参与者家庭住址的定位,之后对所有的事件进行计数统计来特征化这些事件,得到标准库的数据集;(3)对标准库的数据集里的未经训练的事件数据进行聚类训练;(4)对于发生在该区域里的待检测的新事件,进行计数统计和聚类训练,并判断该事件是否为可能为异常事件。本发明能够快速发现事件参与者的来源和事件类型之间的关系,从事件参与者的来源分布推测出事件类型或者推测是否为异常事件。
文档编号G06Q50/00GK102184512SQ20111011961
公开日2011年9月14日 申请日期2011年5月10日 优先权日2011年5月10日
发明者王文俊, 陈飞 申请人:天津大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1