本发明涉及一种数据分析方法,具体是一种分析大型会展综合体客流总量及来源的方法。
背景技术:
大型会展综合体是建立在大城市交通枢纽附近,能够辐射本市及周边省市,满足市场经济以及工商业发展需要,提供至少20万平米、可容纳数万人以上的大型展馆,可以提供融合综合商品会展、商业零售、商务办公、酒店餐饮、综合娱乐等的单体建筑或建筑群。比如上海国家会展中心,国家会展项目总建筑面积147万平方米,拥有40万平方米的室内展厅和10万平方米的室外展场,配套15万平方米商业中心、18万平方米办公设施和6万平方米五星级酒店。定位于建成世界上最具规模、最具水平、最具竞争力的会展综合体。
国家会展中心(上海)有限责任公司将顺应世界会展业发展和转移趋势,立足长三角,服务全国,面向世界,积极促进上海和中国会展业的发展,以国家会展项目的一流硬件为重要依托,以服务为本,专业高效,规范有序的职业精神,为完善我国新时期商务事业发展战略布局、促进上海"四个中心"建设贡献力量。
这样的场馆会定期或不定期举办综合性或大型专业会展,每次会展参展方希望了解或预测本次会展吸引到的观众的人数以及他们来自哪里,这些数据并不能从观众安检或现有数据采集手段进行有效获取。
随着21世纪个人智能终端的普及,出行群体中手机拥有率和使用率已经达到相当高的比例,人们越来越认识到手机是一种较为理想的交通(客流)探测器。手机数据为居民出行信息分析提供了很好的技术选择,可作为现有交通数据采集技术的重要补充之一,通过对长时间的手机信令数据进行跟踪,研究手机用户活动轨迹的识别方法,分析手机用户的有规律的空间分布和出行特征参数。结合展会期间会场周边移动基站覆盖情况,通过收集该时段的移动运营商手机信令数据,就可以挖掘出会展吸引到的客流总量及来源时空分布情况。
技术实现要素:
本发明的目的在于提供一种分析大型会展综合体客流总量及来源的方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种基于手机信令数据分析大型会展综合体客流总量及来源的方法,具体步骤如下:
a、在指定时间段内,以固定时间间隔t从手机通信运营商获取该时间间隔内所有手机终端活动产生的信令数据;
b、对获取到的信令数据进行质量甄别和etl清洗,保留有效移动终端信令的数据,形成通道客流基础数据表;
c、将移动通信网络数据与道路交通网络进行映射匹配,将步骤2得到的有效移动终端信令通过空间叠加和自然邻点插值法操作,把这离散的数据按用户和时间进行排序,基于gis形成用户的电子轨迹以及相应的停留点;
d、根据会展区域(场馆及周边)的预设缓冲带值k,按照基站在地理位置分布以x轴正值方向构造基站匹配队列;
e、逐个读取用户轨迹记录数据,依次执行筛选条件并计入展会客流流量及来源地;
f、汇总每个有效移动终端信令的每次通过值,以到达时间所在时间片当作展会客流计数时间片。
作为本发明进一步的方案:所述基站匹配队列包括正向及反向队列,这两个队列分别对应展会客流汇聚和离场的两个方向。
作为本发明进一步的方案:所述步骤e中依次执行筛选条件并计入会展客流流量及方向包括:判定是否进入展馆、判定是否离开展馆、判定是否计入展馆客流流量以及判定进场和离场的方向是否和匹配队列的方向一致。
作为本发明进一步的方案:所述的判定是否离开场馆的方法包括非位置更新状态下连续四次信令对应的轨迹记录数据不在队列中、位置更新状态下连续两次信令对应的轨迹记录数据不在队列中。
作为本发明再进一步的方案:所述的判定是否计入通道流量的方法是判断跨位置区码、进出场馆的时间间隔是否不超过0.5h。
与现有技术相比,本发明的有益效果是:本发明充分依托现有的移动通信网络资源,利用已有手机大数据分析挖掘,高效地计算会展期间的客流量,从而优化大型会展综合体的运营规划与展会信息投放管理等。
具体实施方式
下面将对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
一种基于手机信令数据的大型会展综合体客流来源统计方法,其步骤为:
步骤a、采集建立会展场馆及周边基站网络基础信息;
步骤b、以固定时间间隔t从手机网络获取该时间间隔内所有手机发出的实时信号数据;
步骤c、对获取到的数据进行预处理,包括删除无效的数据,处理因为基站漂移产生的数据,分析处理长时间没有产生信号的手机数据;
步骤d、从所有用户中,建立与会展场馆目标区相关的用户子集;
步骤e、根据第i个用户的电子脚印,计算第i个用户在每个地点的停留时间,设定停留时间大于设定阈值t1的为一个停留点,判断得出第i个用户的所有停留点,按时间排序的第j个停留点和第j+1个停留点形成一次出行;
步骤f、回溯第j个停留点和第j+1个停留点在电子脚印中的轨迹情况,计算这条轨迹的总长度与第j个停留点和第j+1个停留点的直线距离的比值k,根据k的值判断出行链是否需要打断,即将该次出行是否需要被分成两次出行。
步骤g、根据步骤6的结果,第j个停留点和第j+1个停留点间的出行的旅行时间为对应信号发生时间的差值,即旅行时间t=tj+1-tj,式中,tj+1为第j+1个停留点第i部手机信号发生的时间,tj为第j个停留点第i部手机信号发生的时间;
步骤h、第j个停留点和第j+1个停留点间的出行的距离,首先计算停留点间的直线距离lj,按照起讫点进行类型的划分(如展会入场,展会散场等),对不同类型出行根据路网特点与基站覆盖特点扩样至最短路径出行,扩样系数为α1,最后根据不同类型出行将最短路径出行扩样至全出行,扩样系数为α2,则最终的出行距离lj=lj*α1*α2;
步骤i、汇总与展馆及周边有关的每个手机的每次出行,获取到最终的客流来源,以及相关的出行参数。
本发明的工作原理是:本发明充分依托现有的移动通信网络资源,利用已有手机大数据分析挖掘,高效地计算会展期间的客流量,从而优化大型会展综合体的运营规划与展会信息投放管理等。