一种可视化分析城市公共自行车系统借还模式的方法与流程

文档序号:12366669阅读:404来源:国知局
一种可视化分析城市公共自行车系统借还模式的方法与流程

本发明属于信息技术领域,具体涉及一种可视化分析城市公共自行车系统借还模式的方法。



背景技术:

城市公共自行车系统提供了共享的自行车租赁服务,是一种新型、绿色的公共交通出行模式。近10年来,世界各大城市,如巴黎、纽约、巴塞罗那等都建立了公共自行车系统。

在一个拥有公共自行车系统的城市中,遍布着公共自行车站点。每个站点中有多个锁止器,用于停放车量。用户通过IC卡从离出发地较近的站点借车,并将车辆归还到离目的地较近的站点。利用先进的网络技术,车辆的租借信息可以被跟踪并存储在数据库中,这些信息包含了用户在城市空间中运动的数字足迹,是用于理解系统运营、辅助交通决策的重要依据。

由于用户使用该系统时,可以基于每天不同的出行需求,随意选取借还路径和时间,导致车辆借还轨迹包含高度的可变性。交通管理人员通常不具有专业的数据分析和数据库操作知识,无法直观地理解系统中车辆的借还模式,进行管理和决策。采用可视化分析的方法能挖掘公共自行车数据集合中蕴藏的规律。现有的可视分析方法使用简单的柱状图、折线图等展示数据的时空属性,不仅没有针对数据的固有特点设计相适应的可视化表示,而且缺乏对影响车辆借还多重因素(如天气状况、节假日等)的综合分析。

因此,需要结合时间、空间和多维属性的视角设计可视化视图,让用户通过易于理解的图形表示直观地分析数据规律,支持以用户为驱动对城市公共自行车系统借还模式进行交互式探索,从而帮助交通工作人员更好地管理系统和调度车辆,缓解城市交通压力,同时也可以为市民骑车出行提供建议。



技术实现要素:

本发明的目的是针对动态、多元的公共自行车数据集合,提出一种可视化分析城市公共自行车系统借还模式的方法。本发明设计多个可视化视图展现数据集在时间、空间和多维属性上的特点,帮助管理部门理解站点运营的主要功能,挖掘某时间段内车辆移动的主流方向,分析多种因素对借还数量的影响。

本发明采用的技术方案如下包括如下步骤:

步骤1:收集公共自行车数据,并对数据进行预处理。

步骤2:基于空间视角,设计地理视图,通过地理视图直观展示站点的地理位置分布,同时提供空间过滤功能,帮助分析者交互式地选取站点或站点集合。

步骤3:基于时间视角,设计单站点借还时域热度视图。采用类似表格的可视编码方式,展示某个站点在不同时间段内借还量的变化和差异,发现长期车辆短缺的站点和时间段,更好地辅助车辆调度。

步骤4:基于空间视角,设计站点借还关联视图,展示多对多的站点借还关系。

步骤5:设计多属性视图,主要分析在不同天气状况、日期属性等多个因素作用下,对车辆的借还数量有何种影响。

所述步骤1包括:

步骤1.1:获取近3个月的自行车租借数据集合。其中自行车租借数据表存储了所有用户租车出行的相关信息。一条租借记录如下表示:

hire_r=[uID,bikeID,cardNo,leaseStat,leaseTime,returnStat,returnTime]

分别表示用户ID、车辆ID、用户卡号、借车站点、借车时间、还车站点和还车时间。

站点信息表存储了自行车站点相关的信息,一条站点记录表示如下:

statInfo_r=[statID,statName,statAddr,lng,lat,serviceTime]

分别表示站点ID、站点名称、站点地址、经度和纬度、服务时间。

步骤1.2:对数据进行预处理,删除无用的租借记录。

无用的租借记录包括3类:(1)还车的站点为空值(returnStat=null),这表明车辆可能遗失。(2)借车时间大于还车时间(leaseTime>returnTime),这表明数据记录有误。(3)借车时间和还车时间间隔小于3分钟(returnTime-leaseTime<3min),这表明用户并没有真正借车,有可能是因为车辆有故障导致无法骑行,从而将车迅速归还。

所述步骤2包括:

步骤2.1:使用百度地图接口,基于站点的经度和纬度,在地图上用图标代表站点。当用户点击站点图标时,弹出站点相关的信息。

步骤2.2:提供站点或站点集合选择的接口。支持在地图上点击选取单个或多个站点;提供区域套锁工具,让分析者在地图上绘制一个圆形区域,得到区域中的所有站点。

所述步骤3包括:

步骤3.1:设计借还量热度子视图。其中表格行的数量为待分析日期的数量。表格列的数量为16列,对应于公共自行车从早上6点到晚上9点的开放时间。每一行代表用户选定的一天。行标签的颜色用于区分不同类别的日期,黑色表示工作日,蓝色为周末,红色为小长假。每个单元格同时展示某天某小时的借车量和还车量,左边为借车量,右边为还车量。单元格的颜色与借还量成比例。橙色越深,表示数值越大。通过获取所有满足条件的小时中的借车量和还车量,找到最大值和最小值,然后将每个值归一化,映射到颜色尺度上。

步骤3.2:设计借还差异热度子视图。此时,表格中每个单元格表示某日某小时中借车量和还车量的差值,该差值被映射到一个红-白-蓝的颜色尺度下。单元格颜色越红,表示借车量远远大于还车量,即站点中有很多空车位,用户可能无车可借。单元格颜色越蓝,表示还车量远远大于借车量,即站点中停满了车辆,用户可能无法还车。当借车量和还车量趋于相等,单位格颜色为白色。

所述步骤4包括:

步骤4.1:设计车辆空间走向子视图,展示站点在地理空间上的联系。当用户选择一个中心站点时,该视图基于指定时间段内的租借量,计算出前N个与中心站点关联最密切的站点,同时在地图上用弧线连接相关站点。每条弧线的中心有一个小箭头,指明借还方向。弧线的粗细和透明度与相应的借/还量相关。线越粗,越不透明,表示数量越大。当用户选择多个站点时,同样基于借还量在地图上用弧线绘制多个站点间的关联。

步骤4.2:设计多站点流量关联子视图,采用和弦图可视化编码多个站点间的借还数量。一条弧对应于一个站点。弧的长度正比于该站点指定时间段内的借还量总和。一条弦编码了两个站点间的借还量差异。假设一条弦从弧A出发,去往弧B。该弦在弧A上占的长度表示从站点A借车,还到站点B的自行车数量。相应的,该弦在弧B上占的长度表示从站点B借车还到站点A的自行车数量。如果一条弦在两端弧上的长度差异很大,表示两个站点间的双向流量有很大差别。对于一个特定站点来说,如果借车量很大,而还车量很小,表明很多人从那个站点出发。反之,如果很多人还车到该站点,而很少有人从该站点借车,表明这是一个目的地站点。当分析者用鼠标移动到某条弧上时,仅与该弧相关的弦被显示。

所述步骤5包括:

步骤5.1:生成一个多影响因素数据表,存储给定分析时间段内每一天的日期属性和天气状况。其中日期属性(is_holiday)有三个属性值:工作日、周末、小长假。从互联网上抓取天气状况,存储到数据表中。包括平均温度属性(avgTemp)、天气属性(weather)和风速属性(wind)。天气属性有七个属性值:晴天、多云、阵雨、小雨、中雨、大雨、下雪。风速属性有四个属性值:风力小于3级,风力3-4级,风力4-5级,风力大于5级。分析上述属性对借车量(bikeNum)的影响,将借车量也看做为一个属性。这些属性可以分为两类:数值属性(avgTemp,bikeNum)和类别属性(is_holiday,weather,wind)。类别属性的属性值是离散的,仅包括某些特定值,而数值属性的属性值是连续的。

步骤5.2:设计一种新的基于线和集合的平行坐标组件,同时展示具有类别和数值属性的多元数据集的特征。

步骤5.2.1:基于属性特点,绘制坐标轴,从左到右分别对应于五个属性:avgTemp,bikeNum,weather,isHoliday,wind。绘制五个相互平行且垂直于水平面的坐标轴。前两个轴代表数值属性,用一条直线表示,直线上有相应的坐标,用直线连接表示坐标轴之间的关联。后三个轴代表类别属性,用一个长方形表示,每个属性值分别占长方形的一小段,称之为轴柱。轴柱的颜色用于区分不同的属性值,轴柱的数量为所有属性值的取值数。一个轴柱再根据某个站点所占的当前属性值的比例,被继续划分为子轴柱。用四边形连接两个子轴柱。

对于两个相平行的类别属性轴,为了计算轴柱的高度和四边形的宽度。首先对于给定的站点statID,检索生成包含影响租车量多个因素的记录,其中date表示某一天的日期:

multiFac_rec=[statID,date,avgTemp,bikeNum,weather,isHoliday,wind]

{multiFac_rec}statID表示statID站点的多影响因素记录集合。从{multiFac_rec}statID中检索得到符合条件的有效数据项的数量fk,i,j,其中k对应于站点ID,i为左边轴上的某个属性值,j为右边轴上的某个属性值。假设左边轴代表weather,而右边轴代表isHoliday。当属性值(i)=“晴天”,属性值(j)=“工作日”,则fk,i,j表示在{multiFac_rec}statID中,满足statID=k,weather=“晴天”,isHoliday=“工作日”的数据项数量。连接两个子轴柱的四边形宽度由freqk,i,j所决定,左边轴上每个轴柱的长度与sum_lAxis_freq成正比,代表每个属性值出现的频率,类似的,右边轴上每个轴柱的长度与sum_rAxis_freq成正比,站点名字的图例显示在上方,底部是轴柱颜色的图例。

当两个相邻的轴分别代表数值属性和类别属性时,从数值属性出发的线条都汇聚到类别属性轴柱的中心点。

步骤5.2.2:由于直接展示所有的数据项看起来很杂乱,为了能更清晰地挖掘多个影响因素间的关联,提供与组件交互的方式,帮助分析者过滤数据。当鼠标移动到连接两个数值属性的线条上时,该线被强化,同时弹出和该线相关联所有属性取值的提示框。当分析者选择一个四边形时,所有相关的连接都被显示,而不相关的连接被隐藏。

步骤2、步骤3、步骤4、步骤5中的四个视图是相互关联的。当时间和空间的过滤条件变化后,相关的视图会自动更新。若用户希望挖掘一个站点的特征,单站点借还时域热度视图、站点借还关联视图中的车辆空间走向子视图、多属性视图被更新,此时多属性视图中的分析站点数为1。当用户希望比较多个站点时,站点借还关联视图中的两个子图、多属性视图被更新。

本发明相对现有技术而言所具有的优点和效果如下:

本发明的方法的特色和创新在于,提出一种新的探测公共自行车动态借还模式的方法,通过综合空间、时间、多维属性视角,针对数据固有特点设计相适应的可视化表示,呈现数据中隐藏的特征;提出了一种新的可视化表示方式“基于线和集合的平行坐标”,同时展示具有类别属性和数值属性的多元数据集的特征,支持分析者交互式地挖掘不同异质因素对租车量的影响。该发明能够有效地提高交通管理人员对于公共自行车系统运营情况的认知,提高数据分析效率,为站点管理、车辆调度提供辅助决策。

附图说明

下面结合附图对本发明作进一步说明。

图1为本发明所述可视化分析方法的流程图。

图2为对单个站点“求知小学”进行分析的过程图。

图3为分析特定时间段内车辆运动主流方向的过程图。

图4为分析多个站点多因素对租借量影响的过程图。

具体实施方式

下面结合附图和实施例对本发明做进一步说明。

如图1为本发明所述可视化分析方法的流程图。用户首先选择分析时间段,然后指定分析单个站点还是站点集合。当用户在地理视图中选定一个站点后,单站点借还时域热度视图、站点借还关联视图中的车辆空间走向子视图和多属性视图同步更新,综合用于分析该站点的特征。当用户选定多个站点后,站点借还关联视图的两个子视图和多属性视图被同步更新,展示多个站点间的关联和差异。

如图2给出了单个站点“求知小学”的分析过程图。图2(a)为一周内站点借还量热度子视图。从图中可以发现,该站点在工作日的早晚高峰有很大的借/还车量,具体时间集中于早上7点到8点,傍晚4点到5点,对应于学生的上学和放学时间。图2(b)为对应时间段的借还差异热度子视图。从中可以看出,在早高峰期间,有较多深红色的单元格,表明很多人从这里借车。而在晚高峰期间,有较多深蓝色的单元格,表明在傍晚很多人还车到这里。图2(c)给出了以该站点(五角星图标表示)为中心的车辆空间走向子视图。通过点击关联站点的图标,查看具体的站点信息,发现与该站点关联紧密的站点主要包括公交车站、居民区和工厂。综合上述分析结果,可以总结认为该站点主要用于通勤,建议管理人员关注该站点早晚高峰段内车辆的移除和补充。

如图3给出了分析特定时间段内车辆运动主流方向的过程图。为了发现市民在节假日期间浏览西湖景区的主流方向,分析者首先在地理视图上选定西湖景区周边的多个站点,并选择小长假中的一天4月5日,查看多站点流量关联子视图(图3(a))。当鼠标移动到代表“少年宫”站点的弧上时,从该站点借车的相关信息被显示。从弧的长度可以看出,少年宫拥有最大的借还车数量。从“少年宫”借车,大多数车还到了“平湖秋月”,接下来是“曲院风荷北”和“杭州花圃”,并且从弦两端的长度看出,这些站点之间的流量差异明显。这表明“少年宫”是一个很大的出发站点。然后将鼠标移动到代表“平湖秋月”站点的弧上,发现从该站点借车,大多数车还往“苏堤南口”。继续移动鼠标到“苏堤南口”的弧上,发现最大的还车关联站点为“长桥”。从而可以推断出西湖边一条主流的浏览路径:“少年宫”→“平湖秋月”→“苏堤南口”→“长桥”。图3(b)给出了该路径在地理位置上的标识,是从西湖北线前往南线的方向。

如图4给出了多个站点多因素对租借量影响的过程图。分析者首先选定四个站点:“金秋大厦”、“平湖秋月”、“少年宫”、“求知小学”。图4(a)为生成的基于线和集合的平行坐标组件概览图,从中发现,租借量最高的记录是由“少年宫”站点在周末和节假日产生的。“金秋大厦”具有相对较高的平均租借量,从bikeNum轴中绿色线处于相对较高的位置可以得知。“求知小学”的借车量相对较小。当鼠标移动到一条线上时,可以查看相关属性取值。图4(b)给出了平湖秋月站点,查看weather为“多云”,isHoliday为“周末”时的交互结果,从中发现,用户在天气情况较好的周末借车出行量较大。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1