一种分析人群移动规律的可视化系统的制作方法

文档序号:11545177阅读:286来源:国知局
一种分析人群移动规律的可视化系统的制造方法与工艺

本发明涉及人群移动规律分析技术领域,特别涉及一种分析人群移动规律的可视化系统。



背景技术:

近年来人类行为定量化分析,特别对行为模式的建模是当前复杂性学科的研究热点。人类行为的理解和探索对城市规划、交通流化和信息推荐等方面有至关重要的作用。城市计算的目标是使城市变得更加适宜居住,生活更加便捷。城市计算作为一个新兴领域,为社会各种复杂现象提供了新的视角。在城市规划、交通优化和流行病等领域中,了解和认识人类移动模式变得越来越重要。了解人们的目的地和出行工具反应了人类行为和周围建筑环境的关系,同时也为城市路线规划、灾害预防等提供了参考依据。

由于手机用户的爆发式增长,大量的高精度的手机基站数据使得人类移动行为建模变得更具可靠性,科研人员现在能够以前所未有的角度研究人类移动行为。同时也有越来越多的研究者关注数据驱动人类移动模式的发展。同样也有许多最新工作在研究轨迹数据的可视化分析,但是从城市数据中可视化挖掘移动行为模式仍具有挑战性。

数据挖掘的方法,如动态贝叶斯网络,结果存在非常多的参数,想要整体了解整个城市的移动规律需要对所有参数都有整体的了解,显然这是十分困难的。可视化是解决此类问题的最有效的工具之一,可视化可以提供一个对整体规律的可视化表示,进而快速地帮助人们理解数据里面包含的有效信息。由于数据量较大,我们无法把所有数据一次性读入内存进行可视化分析,我们需要对需要交互索取的数据进行预计算,加快可视化分析的速度。所以我们需要针对数据挖掘的结果设计了一套可视化系统,根据可视化方案将数据以可视化图表的形式呈现给用户,对轨迹数据进行实时的展示、分析和理解。



技术实现要素:

本发明提供了一种分析人群移动规律的可视化系统,根据可视化图像将数据以可视化的形式呈现给用户,可以对个人或者整体的移动轨迹数据进行实时的展示、分析和理解。

一种分析人群移动规律的可视化系统,包括:

数据储存和处理模块,用于存储轨迹记录点信息和轨迹片段分割信息,存储移动行为模式转移图中每个节点和边的权重,每个节点对应的轨迹片段和特征向量分布以及每条轨迹在各个时间点所属的节点数据;

对于轨迹数据,可以使用mongodb数据库存储轨迹记录点信息和轨迹片段分割信息。对于轨迹数据建模后的数据,使用mysql数据存储移动行为模式转移图g=(v,e)中每个节点和边的权重,每个节点对应的轨迹片段和特征向量分布以及每条轨迹在各个时间点所属的节点数据

可视化方案将数据呈现为可视化图表,包括地图、特征分布图、移动行为模式列表和移动模式转移图,用于展示转移的相关的数据,便于用户分析探索,因此,本系统还包括:

可视化图像模块,包括:

特征分布图:每个轨迹片段得到一个多维特征向量,设有平行坐标轴并显示特征向量的各个维度的值;

移动行为图:设置矩阵分布的带有颜色透明度的方块,每一行代表一个移动行为模式,特征向量在多个维度上的平均值可以转化为多个带有颜色透明度的方块;

移动模式转移图:从数据储存和处理模块中读取移动行为模式转移图,并将节点集合转换为等宽的矩形,矩形的高度代表这个时刻属于当前移动行为模式的轨迹片段的数目,即节点权重,同一个时刻上的节点垂直排放为一个堆叠图;边集合用两个连续时刻间的移动行为模式的转移边由曲线表示,曲线连接了前后两个移动行为模式,曲线的宽度代表转移概率的大小,即边的权重。

为了丰富本系统的可视化展示内容,更利于用户分析,优选的,所述可视化图像模块还包括:

地图:轨迹记录点标记为移动点和停留点,连续的移动点构成移动轨迹片段,连续的停留点构成停留轨迹片段,其中移动轨迹片段用曲线表示,停留轨迹片段用点表示。

本发明系统还提供交互式操作,包括选择和追踪、查询人群、时间刷,可以完成多种分析任务,如探索整体的移动模式规律和分析个人或者一类人的移动行为,优选的,所述移动行为模式转移图中,指定节点后,以该节点为中心追踪有相关转移的其他节点,与选中节点无关的其余节点会被淡化。

与节点相关或者无关可以认为设定,例如可以设定在移动行为模式转移图g=(v,e)中,对于某节点如果存在边那么节点之间存在转移,即是相关的。更进一步,如果相关并且相关,则也相关。

时间刷:移动模式转移图显示一个人的移动行为模式时,用户选择一块时间范围,地图则显示相应的时间段内的轨迹。

优选的,所述特征分布图中的维度划分为n级,每个维度上的数值进行分段统计并用矩形透明度值的大小、长度代表数量,令counti代表每一级的统计数目,1≤i≤n,其中i=1表示值最小的一级,i=n表示值最大的一级。透明度定为o=i/n。给定矩阵最大宽度为widthmax,那么每个矩形的宽度w可以通过计算得到:

其中countj是第j级的统计数目,表示的是最大的统计数目。

优选的,所述移动模式转移图中,总高度减去矩形间的空隙为绘制高度heightmax,每个矩形都会根据其包含的轨迹片段数目counti,1≤i≤km,计算得到相应高度h:

节点的颜色透明度用于表示所属轨迹的运动活跃情况,编码轨迹片段的动静比,即移动轨迹片段占所有轨迹片段的比例;

如果动静比的值较低,则意味着这个节点包含大量静止轨迹片段;

同一时刻上的所有节点可以根据动静比的值降序排序,并且根据动静比的值划分为三层,高移动层为:0.9≤动静比≤1,中移动层为:0.1≤动静比<0.9,低移动层为:0≤动静比<0.1;

6、如权利要求1所述的分析人群移动规律的可视化系统,其特征在于,所述移动模式转移图中,曲线变化如下所示:

令曲线的最大宽度和最小宽度为widthmax和widthmin,根据边的转移概率value,曲线的实际宽度为w:

w=value*(widthmax-widthmin)+widthmin。

当移动模式转移图用于展示个人轨迹的情况下,曲线(可以设定颜色,例如蓝色)用于连接每个人在不同时刻下的状态,曲线宽度保持一致,被选中的个人用曲线(可以设定颜色以区别,例如橙色)高亮;

本发明系统用于研究和探索个体以及整体的移动规律:

探索整体移动行为规律:在移动行为模式转移图中选中一个节点后,地图视图会显示相应节点的轨迹,特征分布图显示对应轨迹特征向量的分布情况。同时用户也可以根据连接到的其他节点,分析研究移动行为模式的变化规律。

探索个人的移动行为规律:根据查询功能,用户就能得到一个或者一群人的移动行为随时间变化的曲线,同时可以选定一个用户,用橙色曲线高亮选定用户的曲线,进行使用时间刷或者其他视图深入分析个人轨迹。

本发明的有益效果:

本发明系统可以对大规模的轨迹数据进行处理和分析,通过对数据挖掘模型预计算和可视化,使得用户可以实时交互式分析人群移动的规律,解决了传统方法不能很好地分析大规模轨迹数据的问题。

附图说明

图1为本发明的可视化系统的线框结构图。

图2为本发明的可视化系统的可视化图像模块的显示界面图。

图3为图2中a部分即地图的放大示意图。

图4为图2中b部分即特征分布图的放大示意图。

图5为图2中c部分即移动行为模式列表的放大示意图。

图6为图2中d部分即移动模式转移图的放大示意图。

图7为图6中进行选择和追踪交互操作区域的放大示意图。

图8为图6中进行查询操作部分的放大示意图。

具体实施方式

结合图1,分析人群移动规律的可视化系统包括:

数据储存和处理模块:

对于轨迹数据,使用mongodb数据库存储轨迹记录点信息和轨迹片段分割信息。为了对文本化的轨迹进行快速查询,我们需要把轨迹转换成我们定义的结构化数据,然后使用数据库建立索引,加快查询速度。每个移动对象的轨迹包括他的家庭地址和一系列位置记录点,每个记录点包含了当时的位置信息、时间信息以及这个记录点属于停留还是移动轨迹片段的标记。

对于轨迹数据建模后的数据,使用mysql数据库存储移动行为模式转移图g=(v,e)中每个节点和边的权重,每个节点对应的轨迹片段和特征向量分布,以及每条轨迹在各个时间点所属的节点数据。由于数据规模巨大,无法对每个交互进行实时计算,利用预计算将所有结果存储到数据库中,在交互过程中可以进行实时查询。

行为模式转移图g=(v,e)可以通过以下步骤获取:

1)对一个用户的轨迹r按照移动行为的动态变化进行划分,一条轨迹会被划分为多个轨迹片段:每一个轨迹片段描述了某种行为;

轨迹分割方法如下:

对一个用户的轨迹r={r1,r2,...,rn},ri=(xi,yi,ti)是一个有时间戳的位置记录。轨迹方法首先检测停留轨迹片段,其余属于移动轨迹片段。从第一个记录点向后扫描,当满足以下条件时一系列轨迹记录点构成停留轨迹片段给定时间阈值τ和距离阈值δ,第一个记录点到最后一个记录点的时间应当大于第一个记录点到任意一个记录点的距离要小于δ;是最长的序列:

2)在对轨迹片段聚类前,需要对轨迹片段集合进行自定义的特征抽取,获得一个用来刻画轨迹片段的特征向量fi;

特征选择的方法如下:

对于轨迹片段提取以下8个特征构成10维特征向量:

2-1时间无关熵描述了在不同地点被观察到的概率:

其中p(j)是用户出现在地点j的概率,ij是一个指示函数,当记录点出现在地点j时,否则l是轨迹片段中记录点的总数。

2-2类似于特征2-1,时间相关熵考虑到用户出现在地点j的概率与所停留的时间也有关:

2-3中心位置n是轨迹片段的地理中心经纬度坐标:

2-4回转半径描述了用户移动轨迹的范围大小:

2-5家庭位置是一个用户可能的家庭住址,通过用户在0:00am到6:00am的轨迹位置计算得到:

2-6活动半径是用户离家的平均距离:

其中dis(x,y)是x和y之间的欧式距离。

2-7平均速度是轨迹片段中用户移动的平均速度。

2-8活动距离是轨迹片段总体移动距离:

轨迹片段的特征向量fi由上述8个特征组成:fi=(sunc,stc,clx,cly,rg,rlx,cly,ra,savg,ma)。

3)利用k-means算法把所有用户的所有轨迹片段的特征向量进行聚类,把相似行为的轨迹片段组成一个移动行为模式,最终得到km个移动行为模式。通过计算每个轨迹片段和km个移动行为模式的相似性,得到描述轨迹片段属于各个移动行为模式概率的移动模式描述向量;

计算方法将轨迹片段用移动行为模式描述向量来表达:

通过对所有用户的所有轨迹片段的特征向量的k-means聚类,得到km个聚类移动行为模式及他们的聚类中心

对于每个轨迹片段,计算和km个移动行为模式的相似性,得到描述轨迹片段属于各个移动行为模式概率的移动模式描述向量其中f(x)是一个高斯权重函数,c是中心,w是高斯核的宽度。

4)针对步骤3)中计算得到的移动行为模式和移动模式描述向量,可以采用一个移动行为模式转移图g=(v,e)来刻画所有人的移动行为模式及其转移。移动行为模式转移图中的结点集合v是不同时间点上的移动行为模式,边集合e表示移动行为模式间转移的概率,通过动态贝叶斯网络计算得到转移概率;

构造移动行为模式转移图g=(v,e)的方法:

移动行为模式转移图中的结点集合v是不同时间点上的移动行为模式,通过对轨迹片段的均匀重采样,可以得到在时间点ti上属于第j个移动行为模式的轨迹片段的数目,作为结点的大小:

其中,是一个指示函数,当时间点ti在轨迹片段fk的时间间隔中且轨迹片段fk属于第j个移动行为模式时,否则

利用动态贝叶斯网络对移动行为模式的转移进行建模,通过求解一下方程,得到任意时刻的转移概率,构成边集合e:

其中d代表转移矩阵的第d行,转移矩阵中的每一个元素代表结点中轨迹片段转移到结点中轨迹片段的概率,l是总人数,ll是每个人的轨迹片段数目,λ是控制转移矩阵系数度的参数。是权重系数,当移动行为模式的转移发生的时间越靠近正在计算的时间t权重越高:

其中h是高斯分布的方差。

移动行为模式转移图中节点v的信息包含了权重和当前节点包含轨迹片段所属的用户轨迹,用于地图视图绘制用户轨迹。移动行为模式转移图中每条边的权重由matlab根据动态贝叶斯网络进行计算得到,计算结果存到csv文件中,记录了多个时刻下的移动模式之间两两的转移概率。

移动行为模式转移图中节点对应轨迹片段的特征向量的分布也被存储在数据库中。特征向量的每一个维度归一化后在[0,1]被划分为10级,同时统计了值域范围内轨迹片段的数目。

为了能够根据特征节点查询轨迹,轨迹所经过的节点也需要被存储在数据库中。每个用户的轨迹在每个时候都属于某一个移动行为模式。

可视化图像模块,包括:地图、特征分布图、移动行为模式列表和移动模式转移图,用于展示转移的相关的数据,便于用户分析,如图2所示。

地图:轨迹记录点标记为移动点和停留点,连续的移动点构成移动轨迹片段,连续的停留点构成停留轨迹片段。对于移动轨迹片段,每个记录点的地理位置由黄色曲线依次连接构成。对于停留轨迹片段,在每个记录点的地理位置上用红色的圆表示停留,如图3所示。

特征分布图:每个轨迹片段都能计算出一个10维特征向量,可以在平行坐标轴中展示特征向量各个维度的值。为了展示所有特征向量值的分布,我们把每个维度上的数值进行分段统计并用矩形透明度编码值的大小、长度编码数量,如图4所示。每个维度划分为10级,每一级都有相应的统计数目。令counti代表每一级的统计数目,1≤i≤10,其中i=1表示值最小的一级,i=10表示值最大的一级。透明度定为o=i/10。给定矩阵最大宽度为widthmax,那么每个矩形的宽度w可以通过计算得到:

其中countj是第j级的统计数目,表示的是最大的统计数目。

移动行为模式列表:列表中的每一行代表一个移动行为模式,其中特征向量在10个维度上的平均值可以编码为10个带有红色透明度的正方形,如图5所示。每一个移动行为模式都包括了一个相似轨迹片段的集合,把所有特征向量在各个维度上的值归一化后取平均值value∈[0,1],编码为透明度o=value。

移动模式转移图:移动行为模式编码为从数据库中读取的移动行为模式转移图g=(v,e)中的节点集合v编码为等宽的矩形,矩形的高度代表这个时刻属于当前移动行为模式的轨迹片段的数目(节点权重),同一个时刻上的节点垂直排放为一个堆叠图,如图6所示,个人的移动模式是由曲线2连接节点1构成,被选中的个体的曲线3会高亮显示。在整个绘制空间中,总高度减去矩形间的空隙就是可用绘制高度heightmax,每个矩形都会根据其包含的轨迹片段数目counti1≤i≤km,计算得到相应高度h:

节点的颜色透明度用于表示所属轨迹的运动活跃情况,编码轨迹片段的动静比,即移动轨迹片段占所有轨迹片段的比例。如果动静比的值较低,则意味着这个节点包含大量静止轨迹片段。同一时刻上的所有节点可以根据动静比的值降序排序,并且根据动静比的值划分为三层,高移动层0.9≤动静比≤1,中移动层(0.1≤动静比<0.9),低移动层(0≤动静比<0.1)。

对于移动行为模式转移图g=(v,e)中的边集合e,其中两个连续时刻间的移动行为模式的转移由蓝色曲线表示,曲线连接了前后两个移动行为模式,曲线的宽度编码了转移概率的大小(边的权重)。令曲线的最大宽度和最小宽度为widthmax和widthmin,则根据边的转移概率value,曲线的实际宽度为w:

w=value*(widthmax-widthmin)+widthmin

当移动模式转移图用于展示个人轨迹的情况下,蓝色的曲线用于连接每个人在不同时刻下的状态,曲线宽度保持一致,被选中的个人用橙色并加粗的曲线高亮显示。

本实施例的可视化分析系统还提供了一系列交互式操作,包括选择和追踪、查询人群、时间刷,可以完成多种分析任务,如探索整体的移动模式规律和分析个人或者一类人的移动行为。

基于web的前后端之间的协作:本实施例中,前端是一个基于javascript和d3.js制作的界面,在处理每个用户交互动作时,前端都会根据实际操作的内容,生成相应的查询语句,向后端发送数据请求。后端是基于node.js的处理模块,接受并处理前端的数据请求,对每个请求都向数据库发送相应的查询语句。这些请求都是通过ajax异步地进行的,当后端数据查询完成的时候,前端就把交互结果显示在屏幕上适当地位置,呈现给用户。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1