一种基于手机数据测算城际人信综合联系强度的方法与流程

文档序号:11207618阅读:450来源:国知局
一种基于手机数据测算城际人信综合联系强度的方法与流程
本发明属于数据测算
技术领域
,具体涉及一种基于手机数据测算城际人信综合联系强度的方法。
背景技术
:近年来,随着我国城市化高速发展,全国的城市化率已经超过了50%。由于现代交通和通讯的便利条件,城市群越来越多,城市之间的联系越来越密切,这种密切联系尤其反映在城际之间的人流、通讯流的总量不断增加。因此,如何衡量城市之间的联系密切情况,就需要使用联系强度的概念,而这一概念一直得不到准确的衡量和测算。在区域城市发展研究、城市规划、交通规划以及城市管理中,迫切需要衡量与测算出城际联系强度,并且这种强度测算最好不是单一指标,既要有客流联系的考量,也要有通讯流联系的考量。由此,引入了“城际人信综合联系强度”的概念,具体是指综合测算两城市之间的双向客流量和交互通讯量。技术实现要素:本发明的目的是根据上述现有技术的不足之处,提供一种基于手机数据测算城际人信综合联系强度的方法,该方法根据两城市之间的交互通讯量和双向客流量,识别其与手机网络总用户量的比值,并根据工作日与休息日的不同情况赋予不同的权重,进而综合测算得出两城之间的人信综合联系强度,即综合考量了工作日、周末、双向客流量、交互通讯量四种不同因素。本发明目的实现由以下技术方案完成:一种基于手机数据测算城际人信综合联系强度的方法,其特征在于所述方法包括以下步骤:(1)获取任一手机运营商分别在城市a和b中连续n天的手机信令数据,n≥28,识别测算所述手机信令数据中的每日有效用户总量,将城市a和b在n天内的各工作日有效用户总量分别拼接成数列{a(1)}、{b(1)},将城市a和b在n天内的各休息日有效用户总量aj(0)、bj(0)分别拼接成数列{a(0)}、{b(0)};其中,i表示n天内的第i个工作日,j表示n天内的第j个休息日;(2)获取所述手机运营商分别在城市a和b中连续n天的通讯数据,n≥28,识别测算所述通讯数据中的每日有效用户总量,将城市a和b在n天内的各工作日有效用户总量分别拼接成数列{a(1)}、{b(1)},将城市a和b在n天内的各休息日有效用户总量aj(0)、bj(0)分别拼接成数列{a(0)}、{b(0)};其中,i表示n天内的第i个工作日,j表示n天内的第j个休息日;(3)对所述手机信令数据在n天内的有效用户总量的稳定性进行检验,剔除其中不符合稳定性条件的日期;对所述通讯数据在n天内的有效用户总量的稳定性进行检验,剔除其中不符合稳定性条件的日期;经过稳定性检验、剔除不符合稳定性条件的日期后,从剩下的日期中挑选,挑选条件必须满足:a、b两城日期同步、日期连续、天数大于等于7天的数据,舍弃其余不连续日期的所有数据,整理得到如下各组数据:aj(0)、bj(0)、aj(0)、bj(0);其中,i≥5,j≥2,并且i和j在日历表上连续;(4)根据步骤(1)和(3),识别、测算城市a和b之间基于所述手机信令数据的工作日和休息日的双向客流量客流量以人次计;(5)根据步骤(2)和(3),识别、测算城市a和b之间基于所述通讯数据的工作日和休息日的交互通讯量交互通讯量以人次计;(6)基于步骤(4)和(5)所获得的数据,进行突发性检查:当城市a和b同为工作日或同为休息日时的双向客流量相差大于10%时,或是当城市a和b同为工作日或同为休息日时的双向交互通讯量相差大于15%时,剔除对应该日期的所有数据;之后,从剩下的天数中挑选,条件须满足城市a和b时期同步、日期连续、天数等于7天的数据,舍弃其余日期的所有数据,整理得到如下各组数据:aj(0)、bj(0)、aj(0)、bj(0)、其中,i=1~5,j=1~2,并且i和j在日历表上连续;(7)根据步骤(6),整理城际人信综合联系强度测算的基础数据,包括信令数据有效用户总量均值通讯数据有效用户总量均值两城双向客流量均值两城交互通讯量均值其中,分别表示城市a工作日、休息日信令数据有效用户总量均值;分别表示城市b工作日、休息日信令数据有效用户总量均值;分别表示城市a工作日、休息日的通讯数据有效用户总量均值;分别表示城市b工作日、休息日的通讯数据有效用户总量均值;分别表示工作日、休息日的两城双向客流量均值;分别表示工作日、休息日的两城交互通讯量均值;(8)根据步骤(7),利用信令数据有效用户总量均值和两城双向客流量均值分别计算获得工作日和休息日的城际客流联系强度;利用通讯数据有效用户总量均值和两城交互通讯量均值分别计算工作日和休息日的城际通讯流联系强度;依此,计算城际人信综合联系强度。步骤(1)中,识别测算所述手机信令数据中的每日有效用户总量的方法为:所述手机信令数据中的每个用户记录须满足驻留时长可靠性条件,才可识别为当天所在城市的有效用户,所述可靠性条件为:tzs-tzr≥120分钟其中,tzs是指在一天计时周期内,用户于所在城市的尾记录的时间;tzr是指在一天计时周期内,用户于所在城市的首记录的时间。步骤(2)中,识别测算所述通讯数据中的每日有效用户总量的方法为:在一天的计时周期内,任意用户在所在城市的所述通讯数据中显示有“打电话、接电话、发送短信、接收短信”中的任何一个数据记录,才可识别为当天所在城市的有效用户。步骤(3)中,对所述手机信令数据在n天内的有效用户总量的稳定性进行检验的方法为:基于步骤(1),分别对工作日与休息日的四组数据{a(1)}、{b(1)}、{a(0)}、{b(0)}做环比2日移动平均:当表明城市a的工作日数据不稳定,剔除第i+1天城市a和b的所有数据;当表明城市b的工作日数据不稳定,剔除第i+1天城市a和b的所有数据;当表明城市a的休息日数据不稳定,剔除第j+1天城市a和b的所有数据;当表明城市b的休息日数据不稳定,剔除第j+1天城市a和b的所有数据;对所述通讯数据在n天内的有效用户总量的稳定性进行检验的方法为:基于步骤(2),分别对工作日与休息日四组数据aj(0)、bj(0)做环比2日移动平均:当表明城市a的工作日数据不稳定,剔除第i+1天城市a和b的所有数据;当表明城市b的工作日数据不稳定,剔除第i+1天城市a和b的所有数据;当表明城市a的休息日数据不稳定,剔除第j+1天城市a和b的所有数据;当表明城市b的休息日数据不稳定,剔除第j+1天城市a和b的所有数据。步骤(4)中所述双向客流量的测算方法为:在一天的计时周期内,同一个手机用户在城市a和b中的所述手机信令数据中均有记录,且每次在城市a或b中的驻留时间均超过1小时以上,则识别该手机用户为有效停留;手机用户在城市a和b中停留时间的先后顺序分为如下情况,均识别为双向客流量的有效计次:计为1次的:a→b,或b→a;计为2次的:a→b→a,或b→a→b;…;计为2n-1次的:a→b→…→b,或b→a→…→a;计为2n次的:a→b→…→a,或b→a→…→b;基于上述有效计次,分别测算工作日和休息日每天城市a与城市b之间的双向客流总量:工作日每天双向客流量(工作日每天符合有效停留的有效计次);休息日每天双向客流量(休息日每天符合有效停留的有效计次)。步骤(5)中所述交互通讯量的测算方法为:在满足打电话双方或是收发短信的双方分别在城市a和城市b内的情况下,进行城市a和b之间交互通讯的有效计次,有效计次包括如下情况:城市a和城市b内的所有手机呼出电话次数,包括城市a内手机呼城市b内手机或座机,城市b内手机呼城市a内手机或座机;城市a和城市b内的所有接收非手机打来音讯电话次数;城市a和城市b内所有发出短信的次数;基于上述有效计次,分别测算工作日和休息日每天城市a和b之间的交互通讯总量:工作日每天交互通讯量(工作日每天符合交互通讯的有效计次);休息日每天交互通讯量(休息日每天符合交互通讯的有效计次)。步骤(6)中的所述突发性检查分为双向客流量的突发性检查和交互通讯量的突发性检查;所述双向客流量的突发性检查的方法为:分别对工作日与休息日两组数据{f(1)}、{f(0)}做环比2日移动平均:当表明城市a和b的工作日双向客流量通不过所述双向客流量的突发性检查,剔除第i+1天城市a和b的所有数据;当表明城市a和b的休息日双向客流量通不过所述双向客流量的突发性检查,剔除第j+1天城市a和b的所有数据;所述交互通讯量的突发性检查的方法为:分别对工作日与休息日两组数据{f(1)}、{f(0)}做环比2日移动平均:当表明城市a和b的工作日交互通讯量通不过所述交互通讯量的突发性检查,剔除第i+1天城市a和b的所有数据;当表明城市a和b的休息日交互通讯量通不过所述交互通讯量的突发性检查,剔除第j+1天城市a和b的所有数据。步骤(7)中,所述信令数据有效用户总量均值的计算方法如下:所述通讯数据有效用户总量均值的计算方法如下:所述两城双向客流量均值的计算方法如下:所述两城交互通讯量均值的计算方法如下:步骤(8)中城际人信综合联系强度的计算方法如下:(8.1)分别计算工作日和休息日的城际客流联系强度:工作日城市a对于城市b的客流联系强度休息日城市a对于城市b的客流联系强度工作日城市b对于城市a的客流联系强度休息日城市b对于城市a的客流联系强度(8.2)分别计算工作日和休息日的城际通讯流强度:工作日城市a对于城市b的城际通讯流强度休息日城市a对于城市b的城际通讯流强度工作日城市b对于城市a的城际通讯流强度休息日城市b对于城市a的城际通讯流强度(8.3)计算城际客流联系强度:城市a对于城市b的客流联系强度城市b对于城市a的客流联系强度(8.4)计算城际通讯流强度:城市a对于城市b的城际通讯流强度城市b对于城市a的城际通讯流强度(8.5)分别计算工作日和休息日城际人信综合联系强度:工作日城市a对于城市b的人信综合联系强度休息日城市a对于城市b的人信综合联系强度工作日城市b对于城市a的人信综合联系强度休息日城市b对于城市a的人信综合联系强度(8.6)计算城际人信综合联系强度:城市a对于城市b人信综合联系强度ia~b=ifa~b*80%+ifa~b*20%;城市b对于城市a人信综合联系强度ib~a=ifb~a*80%+ifb~a*20%。本发明的优点是,充分依托现有的无线通信网络信息资源,利用已有手机网络中的时间、空间数据,通过对工作日、休息日、两城市双向客流量、两城市交互通讯量等各种维度的综合测算,取得城际人信综合联系强度,实现低成本、高采样、低误测、高实效地获取城际人信综合联系强度,其测算结果具有可比性、科学性、实用性和综合性。附图说明图1为本发明中基于手机数据测算城际人信综合联系强度的方法流程框图。具体实施方式以下结合附图通过实施例对本发明的特征及其它相关特征作进一步详细说明,以便于同行业技术人员的理解:实施例:如图1所示,本实施例具体涉及一种基于手机数据测算城际人信综合联系强度的方法,该方法需要确定两个待研究的城市,即城市a和b,以测算这两个城市的人信综合联系强度,具体包括如下步骤:【步骤1】获取一家手机网络运营商分别在城市a和b的手机信令数据(简称信令数据),对于信令数据的条件要求为:a)时期相同,连续n天,n≥28,连续n天的数据,必然包含至少20个工作日、4个周六、4个周日;b)信令数据必须包含手机用户id、时间戳、位置戳等字段信息,并包括开关机、接打电话、收发短信、切换基站、上网下网、基站定时唤醒等事件类型。(步骤1.1)选取同期数据、分组:将两个城市n天的数据分别分成两组,一组为工作日(周一至周五)的数据a(1)、b(1),另一组为休息日(周六、日)的数据a(0)、b(0)。例如:城市a获取数据起始日期为2016-11-19、最后日期为2016-12-22;城市b获取数据起始日期为2016-11-18、最后日期为2016-12-20。首先,选取城市a与城市b同期的数据,即取ab两城日期同为2016-11-19至2016-12-20共32天的数据。然后将工作日与休息日的数据分组,分别整理如下:工作日城市a的数据日期为:(2016-11-21为周一)a11-21到a11-25、a11-28到a12-02、a12-05到a12-09、a12-12到a12-16、a12-19、a12-20(共22天);工作日城市b的数据日期为:b11-21到b11-25、b11-28到b12-02、b12-05到b12-11、b12-14到b12-18;休息日城市a的数据日期为:(2016-11-19为周六)a11-19、a11-20、a11-26、a11-27、a12-03、a12-04、a12-10、a12-11、a12-17、a12-18(共10天);休息日城市b的数据日期为:b11-19、b11-20、b11-26、b11-27、b12-03、b12-04、b12-10、b12-11、b12-17、b12-18。(步骤1.2)识别信令数据有效用户:信令数据中的每个用户记录须满足驻留时长可靠性条件,才可识别为当天所在城市的有效用户,该可靠性条件为:tzs-tzr≥120分钟其中,tzs是指在一天计时周期内,用户于所在城市的尾记录的时间;tzr是指在一天计时周期内,用户于所在城市的首记录的时间;例如:日期2016-11-30,这一天为周三,是工作日,计算时间从该日凌晨00:00:00到夜里24:00:00。城市a的四个手机用户分别为路人甲、乙、丙、丁,他们在城市a留下的信令数据记录如下表:表(1):信令数据城市a用户首尾记录上表中,路人甲、路人乙和路人丁的tzs-tzr均大于或等于120分钟,被识别为有效用户,记录到当天有效用户总量中,而路人丙的tzs-tzr由于小于120分钟,故不被记录到当天有效用户总量中。计算城市a当日有效用户总量=∑(所有被识别为有效用户的数量)=2389541。(步骤1.3)对每天的信令数据有效用户总量分别按工作日和休息日拼接成数列:对22个工作日城市a每天的有效用户总量数据将其拼接成数列{a(1)},按日期进行先后的排列,如下表所示:i=1~22日期星期{a(1)}i=012016-11-21一2408223i=022016-11-22二2397954i=032016-11-23三1851336……i=082016-11-30三2389541……i=222016-12-20二2375648表(2):信令数据工作日城市a每天用户总量同样地,对10个休息日城市a每天的有效用户总量数据aj(0),将其拼接成连续数列{a(0)},按日期先后进行排列,如下表所示:j=1~10日期星期{a(0)}j=012016-11-19六2356678j=022016-11-20日2349924j=032016-11-26六1691376……j=102016-12-18日2275483表(3):信令数据休息日城市a每天用户总量同样地,将工作日和休息日城市b的有效用户每天总量也按上述步骤一一整理排序,组成连续数列{b(1)}、{b(0)}。【步骤2】获取该家手机网络运营商分别在城市a和b的通讯数据,对于通讯数据的条件要求为:a)与步骤1获取的信令数据的时期相同,连续n天,n≥28,连续n天的数,必然包含至少20个工作日、4个周六、4个周日;b)通讯数据必须包含手机用户id、时间戳、位置戳等字段信息,并包括打电话、接电话、发送短信、接收短信等事件类型。(步骤2.1)选取同期数据、分组:将两个城市n天的数据分别分成两组,一组为工作日(周一至周五)的数据a(1)、b(1),另一组为休息日(周六、日)的数据a(0)、b(0)。例如:城市a获取数据起始日期为2016-11-15、最后日期为2016-12-28;城市b获取数据起始日期为2016-11-14、最后日期为2016-12-21。对照步骤1.1信令数据的日期,选取同期的数据,即取ab两城日期同为2016-11-19至2016-12-20共32天的数据。其中工作日22个,休息日10个。然后将工作日与休息日的数据分组,分别整理如下:工作日城市a的数据日期为:(2016-11-21为周一)a11-21到a11-25、a11-28到a12-02、a12-05到a12-09、a12-12到a12-16、a12-19、a12-20(共22天);工作日城市b的数据日期为:b11-21到b11-25、b11-28到b12-02、b12-05到b12-11、b12-14到b12-18。休息日城市a的数据日期为:(2016-11-19为周六)a11-19、a11-20、a11-26、a11-27、a12-03、a12-04、a12-10、a12-11、a12-17、a12-18(共10天);休息日城市b的数据日期为:b11-19、b11-20、b11-26、b11-27、b12-03、b12-04、b12-10、b12-11、b12-17、b12-18。(步骤2.2)识别通讯数据有效用户通讯数据中的有效用户必须满足通讯活跃性条件,即一个用户在某一天某个城市的通讯数据显示有“打电话、接电话、发送短信、接收短信”其中的任何一个数据记录,才识别为当天该城市的有效用户。例如:日期2016-12-17,这一天为周六,是休息日,计算时间从该日凌晨00:00:00到夜里24:00:00。城市b的四个手机用户分别为路人#1、#2、#3、#4,他们在城市b留下的通讯数据记录如下表:表(4):通讯数据城市b用户记录上表中,路人#1、路人#3和路人#4当天有符合条件的通讯数据记录,被识别为有效用户,记录到当天有效用户总量b(0)中。路人#2由于没有任何记录,故不被记录到当天用户总量。计算城市b当日有效用户总量=∑(所有被识别为有效用户的数量)=1253216。(步骤2.3)对每天的通讯数据有效用户总量分别按工作日和休息日拼接成数列:对10个休息日城市b每天的有效用户总量bj(0),将其拼接成连续数列{b(0)},按日期先后进行排列,如下表所示:j=1~10日期星期{b(0)}j=012016-11-19六1262283j=022016-11-20日1260305j=032016-11-26六1257495j=042016-11-27日651373……j=092016-12-17六1253216j=102016-12-18日1251638表(5):通讯数据休息日城市b每天用户总量同样地,对22个工作日城市b每天的有效用户总量数据将其拼接成连续数列{b(1)},按日期先后进行排列,如下表所示:i=1~22日期星期{b(1)}1=012016-11-21一1356656i=022016-11-22二1349938……i=072016-11-29二891344……i=222016-12-20二1375664表(6):通讯数据工作日城市b每天用户总量同样地,将城市a的有效用户每天总量也按上述步骤一一整理排序,组成连续数列{a(1)}、{a(0)}。【步骤3】经过步骤1、步骤2获取、识别和测算所得到的数据,必须检测手机数据的稳定性和连续性。(步骤3.1)信令数据有效用户总量的稳定性检验:基于步骤1,分别对工作日与休息日的四组数据{a(1)}、{b(1)}、{a(0)}、{b(0)}做环比2日移动平均:当表明城市a的工作日数据不稳定,剔除第i+1天城市a和b的所有数据;当表明城市b的工作日数据不稳定,剔除第i+1天城市a和b的所有数据;当表明城市a的休息日数据不稳定,剔除第j+1天城市a和b的所有数据;当表明城市b的休息日数据不稳定,剔除第j+1天城市a和b的所有数据;由表(2),经检测:表明城市a的11月23日(工作日i=3对应日期)的数据不稳定,因此,对应11月23日整天的数据应当剔除。由表(3),经检测:表明城市a的11月26日(休息日j=3对应日期)的数据不稳定,因此,对应11月26日整天的数据应当剔除。同理,由于城市b的11月30日、12月17日的数据都不符合稳定性检测,应当剔除。(布置3.2)通讯数据有效用户总量的稳定性检验:基于步骤2,分别对工作日与休息日四组数据aj(0)、bj(0)做环比2日移动平均:当表明城市a的工作日数据不稳定,剔除第i+1天城市a和b的所有数据;当表明城市b的工作日数据不稳定,剔除第i+1天城市a和b的所有数据;当表明城市a的休息日数据不稳定,剔除第j+1天城市a和b的所有数据;当表明城市b的休息日数据不稳定,剔除第j+1天城市a和b的所有数据。由表(5),经检测:表明城市b的11月27日(休息日j=4对应日期)的数据不稳定,因此,对应11月27日整天的数据应当剔除。由表(6),经检测:表明城市b的11月29日(工作日j=7对应日期)的数据不稳定,因此,对应11月29日整天的数据应当剔除。同理,按以上方法经检测、由于城市a的12月13日、15日的数据都不符合稳定性检测,应当剔除。(步骤3.3)连续性检验:经过稳定性检验、剔除不符合条件的日期后,从剩下的天数中挑选,挑选条件必须满足:ab两城时期同步、日期连续、天数大于等于7天的数据(舍弃其余不连续日期的所有数据)。经过步骤3.1和步骤3.2的稳定性检验,日期2016-11-23、26、27、29、30和2016-12-13、15、17的数据被剔除,剩下的日期中2016-11-19、20、21、22和2016-12-14、18、19、20的数据虽然通过了稳定性检验,但是日期连续都不超过7天,应当舍弃。最后仅有日期2016-12-01到12-12连续12天数据是符合要求的,整理得到如下各组数据:aj(0)、bj(0)、aj(0)、bj(0);其中,i≥5,j≥2,并且i和j在日历表上是连续的,这种连续可以从一周的任何一天开始,并保证连续7天以上,工作日、休息日与对应日期连续排列,详见下表:i=1~8日期星期i=12016-12-01四i=22016-12-02五i=32016-12-05一……i=72016-12-09五i=82016-12-12一表(7):工作日与对应日期连续排列表j=1~4日期星期j=12016-12-03六j=22016-12-04日j=32016-12-10六j=42016-12-11日表(8):休息日与对应日期连续排列表表(7)和表(8)分别是通过有效性、连续性检测后得到的工作日和休息日的连续12天的数据,其中,工作日有8个,休息日有4个,且从2016-12-01至2016-12-12日的日期是连续的。【步骤4】在步骤1、步骤3的基础上,进一步识别、测算城市a和城市b之间的(基于信令数据的)工作日和休息日的双向客流量客流量以人次计;其步骤如下:(步骤4.1)识别有效停留:在一天中,同一个手机用户在城市a和城市b的信令数据中均有记录(表示该手机用户去过ab两城),并且每次在城市a或者城市b的驻留时间均超过1小时以上,才识别为有效停留。对于每一用户的有效停留条件为:tls-tlr≥60分钟tls:在一次停留城市内,一个用户的尾记录的时间;tlr:在一次停留城市内,一个用户的首记录的时间;例如:日期2016-12-06(工作日),某些手机用户有甲、丁,他们分别在城市a和城市b留下的数据记录如下表:表(9):2016-12-06用户甲在ab两城的有效停留表表(10):2016-12-06用户丁在ab两城的有效停留表(步骤4.2)识别双向客流量的有效计次:满足上述条件情况,用户甲和丁被识别为该手机用户在城市a或b有效停留。按照一个手机用户在城市a与城市b中停留时间的先后顺序有如下排列情况,均识别为双向客流量的有效计次:计为1次的:a→b,或b→a;计为2次的:a→b→a,或b→a→b;…;计为2n-1次的:a→b→…→b,或b→a→…→a;计为2n次的:a→b→…→a,或b→a→…→b;n≥2;1、2n-1为奇数次停留计次,2、2n为偶数次停留计次。因此上述排列情况已经涵盖了所有可能发生的有效计次,没有遗漏。)根据表(9)和表(10),按照上述方法,测算出用户甲的有效计次为3次、用户丁的有效计次为2次。(步骤4.3)测算每天ab两城双向客流总量:基于上述有效计次,分别测算工作日和休息日每天城市a与城市b之间的双向客流总量:工作日每天双向客流量(工作日每天符合有效停留的有效计次)休息日每天双向客流量(休息日每天符合有效停留的有效计次)经过测算工作日、休息日ab两城双向客流每天总量如下两表:表(11):工作日与对应日期双向客流量测算表表(12):休息日与对应日期双向客流量测算表【步骤5】在步骤2、步骤3的基础上,识别、测算城市a和城市b之间的(基于通讯数据的)工作日和休息日的交互通讯量交互通讯量以人次计。(步骤5.1)识别交互通讯:ab两城之间,每次交互通讯必须满足以下识别条件:打电话的双方必须分别在城市a和城市b两地(包含双方都是手机用户或者其中一方是手机用户的情况),并且每次通话时间在6秒钟(包含)以上,或者收发短信的双方必须分别在城市a和城市b两地。tch≥6秒钟,其中,tch为通话时长。例如:日期2016-12-10(休息日),某些手机用户有#1、#4,在与另一个城市进行点对点通讯留下的通讯数据记录分别如下表:表(13):2016-12-10用户#1在ab两城的通讯数据记录表(14):2016-12-10用户#4在ab两城的通讯数据记录(步骤5.2)识别有效计次:满足上述条件情况下,在识别有效计次时应当剔除重复计次也不能减漏计次,具体做法是根据通讯数据记录,对如下情形,均为识别为有效计次:城市a+城市b的所有手机呼出电话次数(包括a城手机呼b城手机或座机,b城手机呼a城手机或座机);城市a+城市b的所有接收非手机打来音讯电话次数;城市a+城市b的所有发出短信次数。(“城市a+城市b的所有接收手机打来电话次数”和“城市a+城市b的所有接收短信次数”与前者统计重复,所以不再计次)根据表(13)和表(14),识别有效计次如下表:表(15):2016-12-10用户#1在ab两城的通讯数据的有效记录表(16):2016-12-10用户#4在ab两城的通讯数据的有效记录根据表(15)和表(16),按照上述方法,测算出用户#1的有效计次为3次、用户#4的有效计次为1次。步骤(5.3)测算每天ab两城交互通讯总量:工作日每天交互通讯量(工作日每天符合交互通讯的有效计次);休息日每天交互通讯量(休息日每天符合交互通讯的有效计次)。经过测算工作日休息日ab两城交互通讯每天总量如下两表:i=1~8日期星期fi(1)i=12016-12-01四72453i=22016-12-02五72756i=32016-12-05一68351……i=72016-12-09五72376i=82016-12-12一112656表(17):工作日与对应日期交互通讯量测算表j=1~4日期星期fj(0)j=12016-12-03六66436j=22016-12-04日65376j=32016-12-10六65516j=42016-12-11日65890表(18):休息日与对应日期交互通讯量测算表【步骤6】双向客流量和交互通讯量的突发性检测:当ab两城或其中一个城市发生重大事件(如国际会议、全国比赛等等),数据量出现反常,会干扰双向客流量和交互通讯量的最后结果。因此要进行突发性检验。当同为工作日或同为休息日的双向客流量相差大于10%,或者当同为工作日或同为休息日的交互通讯量相差大于15%,表明数据不稳定、或者有突发事件干扰,剔除对应这一天的所有数据。基于步骤4、步骤5获取、识别和测算所得到的数据,进行突发性检验,具体步骤如下:(步骤6.1)双向客流量的突发性检测:基于步骤4,分别对工作日与休息日两组数据{f(1)}、{f(0)}做环比2日移动平均:当表明城市a和b的工作日双向客流量通不过所述双向客流量的突发性检查,剔除第i+1天城市a和b的所有数据;当表明城市a和b的休息日双向客流量通不过所述双向客流量的突发性检查,剔除第j+1天城市a和b的所有数据。由表(11)、表(12),经检测:表明ab两城市12月2日(工作日第i=2天对应日期)的双向客流量通不过数据突发性检验,剔除12月2日a、b两城的所有数据。(步骤6.2)交互通讯量的突发性检验:基于步骤5,分别对工作日与休息日两组数据{f(1)}、{f(0)}做环比2日移动平均:当表明城市a和b的工作日交互通讯量通不过所述交互通讯量的突发性检查,剔除第i+1天城市a和b的所有数据;当表明城市a和b的休息日交互通讯量通不过所述交互通讯量的突发性检查,剔除第j+1天城市a和b的所有数据。由表(17)、表(18),经检测:表明ab两城市12月12日(工作日第i=8天对应日期)的交互通讯量通不过数据突发性检验,剔除12月12日(工作日第i=8天)a、b两城的所有数据。(步骤6.3)连续性检验和数据整理:经过突发性检验、剔除不符合条件日期的数据后,从剩下的天数中挑选,条件必须满足:ab两城时期同步、日期连续、天数等于7天的数据(舍弃其余日期的所有数据),整理得到如下各组数据:aj(0)、bj(0)、aj(0)、bj(0)、其中,i=1~5,j=1~2,并且i和j在日历表上是连续的7天(5个工作日和2个休息日,也称为全周期)。经过步骤6.1和步骤6.2,现有符合条件的连续数据的共有9天,即2016-12-03至2016-12-11,其中日期12-03、12-04、12-10、12-11为周六、周日,其余为工作日。因此,我们选定2016-12-03至2016-12-09这7天的数据做样本(符合5个工作日和2个休息日,并且7天日期是连续的要求),也称为全周期。现将7天的数据整理成下表:表(19):突发性检测和连续性检测后的7天数据【步骤7】整理城际人信综合联系强度测算的基础数据,包括信令数据有效用户总量均值通讯数据有效用户总量均值两城双向客流量均值两城交互通讯量均值(步骤7.1)计算整理ab两城的信令数据有效用户总量均值:根据步骤1、3、4、6,分别测算城市a和城市b的工作日和休息日的信令数据有效用户总量均值具体如下:(式01)城市a工作日用户总量均值(式02)城市a休息日用户总量均值a(0)(式03)城市b工作日用户总量均值(式04)城市b休息日用户总量均值(步骤7.2)计算整理ab两城的通讯数据有效用户总量均值:根据步骤2、3、5、6,分别测算城市a和城市b的工作日和休息日的通讯数据有效用户总量均值具体如下:(式05)城市a工作日用户总量均值(式06)城市a休息日用户总量均值(式07)城市b工作日用户总量均值(式08)城市b休息日用户总量均值(步骤7.3)计算整理ab两城的双向客流量均值:根据步骤1、3、4、6,分别测算工作日和休息日的两城双向客流量均值具体如下:(式09)工作日双向客流量均值(式10)休息日双向客流量均值(步骤7.4)计算整理ab两城的交互通讯量均值:根据步骤2、3、5、6,分别测算工作日和休息日的两城交互通讯量均值具体如下:(式11)工作日交互通讯量均值(式12)休息日交互通讯量均值【步骤8】根据步骤7,计算各种城际人信综合联系强度,分别如下:(步骤8.1)工作日和休息日的客流联系强度:考虑到城际联系的复杂性、研究使用的广泛性,我们从单一因子的城际联系强度到多因子城际联系强度,作了详细计算。并且,多因子城际联系强度更能综合地、真实地反映城市之间联系的密切性如何。单一因子是指仅考虑工作日或者休息日某一种“流”的大小,例如工作日城市a对于城市b的客流联系强度,又例如休息日城市b对于城市a的通讯量联系强度等等,都是指单一因子的城际联系强度。多因子联系强度是指综合考虑工作日与休息日以后的联系强度,还有综合考虑双向客流与交互通讯流以后的联系强度,以及考虑工作日、休息日、双向客流、交互通讯流所有因子的城际联系强度。根据(式01)~(式04)、(式09)、(式10),分别计算工作日和休息日城际客流联系强度,如下:(式13)工作日城市a对于城市b的客流联系强度(式14)休息日城市a对于城市b的客流联系强度(式15)工作日城市b对于城市a的客流联系强度(式16)休息日城市b对于城市a的客流联系强度(步骤8.2)根据(式05)~(式08)、(式11)、(式12),分别计算工作日和休息日城际通讯流联系强度,即工作日和休息日的通讯流联系强度单独计算,如下:(式17)工作日城市a对于城市b的通讯流联系强度(式18)休息日城市a对于城市b的通讯流联系强度(式19)工作日城市b对于城市a的通讯流联系强度(式20)休息日城市b对于城市a的通讯流联系强度步骤8.1和8.2所计算的城际联系强度,是区分了工作日和休息日以后的单一联系强度,因此还有必要综合考虑工作日与休息日合并起来后的城际联系强度。(步骤8.3)工作日和休息日合并在一起计算客流联系强度:根据(式13)~(式16),计算城际客流联系强度,如下:(式21)城市a对于城市b的客流联系强度ifa~b(式22)城市b对于城市a的客流联系强度ifb~a(步骤8.4)工作日和休息日合并在一起计算通讯流联系强度:根据(式17)~(式20),计算城际通讯流联系强度,如下:(式23)城市a对于城市b的通讯流联系强度ifa~b(式24)城市b对于城市a的通讯流联系强度ifb~a(步骤8.5)单独计算工作日和休息日的客流与通讯流综合联系强度:根据(式13)~(式20)式,分别计算工作日和休息日城际人信综合联系强度,如下:(式25)工作日城市a对于城市b的人信综合联系强度(式26)休息日城市a对于城市b的人信综合联系强度(式27)工作日城市b对于城市a的人信综合联系强度(式28)休息日城市b对于城市a的人信综合联系强度(步骤8.6)根据(式21)~(式24),计算城际人信综合联系强度,如下:(式29)城市a对于城市b人信综合联系强度ia~b=ifa~b*80%+ifa~b*20%=0.03636*80%+0.03193*20%=0.0355(式30)城市b对于城市a人信综合联系强度ib~a=ifb~a*80%+ifb~a*20%=0.05756*80%+0.05161*20%=0.0564其中,(式29)就是综合考虑了工作日、休息日、双向客流、交互通讯流四个因子的城市a对于城市b的人信综合联系强度。(式30)就是综合考虑了工作日、休息日、双向客流、交互通讯流四个因子的城市b对于城市a的人信综合联系强度。联系强度越大,表示两个城市之间的联系越紧密。随着现代城市经济的发展,城际联系是不可或略的研究热点,通过对城际联系强度的描述,研究者可以轻松把握城市之间的联系密切性,从而了解城际发展的内在联系。有了强度,就可以建立联系标准的分类,进而可以帮助研究城际联系强度大小数值的分类标准,例如:0<i<0.01为微弱联系,0.01≤i<0.03为一般联系,0.03≤i<0.06为紧密联系,i≥0.06以上为同城化联系,等等。i为两城之间的人信综合联系强度,例如:ia~b=0.028,ib~a=0.056,表明对于城市a来讲,两城的联系紧密性为一般联系,对于城市b来讲,两城的联系紧密性为紧密联系,也就是城市b更加依附于城市a。不同性质的城市,表现出的城际联系强度特征也不一样。例如旅游城市的休息日联系强度会大于工作日的联系强度,此时可以用单一因子联系强度更有助于分析旅游城市的城际联系特征。由于工作日与周末是两种不同的时期,城际的客流与通讯流会有不同的特征,上述各种强度分别表征了在不同时期的城际客流与通讯流,并依据这种特点对城际联系强度进行综合考量,最后测算出城际人信综合联系强度。过程中还包括了基于工作日、周末、两城市双向客流量、两城市交互通讯量等四种不同角度测算城际联系强度,使得这些强度更广泛地适用于各种不同领域对城际联系的研究。其中,(式13)~(式16)为单因子客流联系强度,(式17)~(式20)为单因子通讯流联系强度;(式21)、(式22)为全周期客流联系强度,(式23)、(式24)为全周期通讯流联系强度;(式25)~(式28)为区分工作日、休息日的城际人信综合联系强度;(式29)为城市a对于城市b人信综合联系强度,(式30)为城市b对于城市a人信综合联系强度。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1