蜂窝网络中呼叫模式与资源利用的网络大数据分析方法与流程

文档序号:12133733阅读:402来源:国知局
蜂窝网络中呼叫模式与资源利用的网络大数据分析方法与流程

本发明涉及大数据分析技术领域,尤其涉及一种蜂窝网络中呼叫模式与资源利用的网络大数据分析方法。



背景技术:

随着移动互联网技术的成功应用,智能手机和其他移动设备日益普及并广泛使用,从而导致了移动蜂窝网络通信业务量的迅猛增长,并对蜂窝网络基础设施提出了新的需求和挑战,如蜂窝基站的上下行链路资源、网络带宽、网络延时、网络回传效率等;同时,相关的应用产生了海量的网络数据,如移动用户(移动设备)呼叫数据、网络访问数据、信道(基站)切换数据等。所有这些网络大数据信息,描述了蜂窝网络用户活动和网络资源利用情况,但如何有效进行刻画和建模是当前蜂窝网络面临的重要问题。然而,移动蜂窝网络大数据,可以利用大数据理论和分析方法进行分析,从而进一步描述移动蜂窝网络用户呼叫模式和网络资源利用情况。当前大数据的应用越来越广泛,大数据指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产越来越深入地了解蜂窝使用模式,以及它们是如何受到用户行为的影响和对于蜂窝网络资源有效管理至关重要的移动性,以满足用户的体验期望的质量。最初的设计是为了计费的目的,由蜂窝网络管理员收集的呼叫详细记录(CDRs)为洞察网络的使用模式和用户行为提供了一种有用的、丰富的数据源。由于在任何一对源呼叫塔和目的呼叫塔(当主叫和被叫属于相同的蜂窝服务提供商)之间,对呼叫塔级(细粒度)的蜂窝网络使用模式有了更详细的研究。同时,由于CDRs不大量存储而且通常通过蜂窝网络设备较长时间存储(计费等原因),使用CDRs也可以在一个较长的时间跨度进行呼叫使用模式的研究。

从技术上看,大数据与云计算的关系就像一枚硬币的正反面一样密不可分。大数据必然无法用单台的计算机进行处理,必须采用分布式架构。它的特色在于对海量数据进行分布式数据挖掘。但它必须依托云计算的分布式处理、分布式数据库和云存储、虚拟化技术。

随着云时代的来临,大数据也吸引了越来越多的关注。分析师团队认为,大数据通常用来形容一个公司创造的大量非结构化数据和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱。大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要像MapReduce一样的框架来向数十、数百或甚至数千的电脑分配工作。

大数据需要特殊的技术,以有效地处理大量经过时间内的数据。适用于大数据的技术,包括大规模并行处理(MPP)数据库、数据挖掘电网、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。

尽管许多研究已经利用CDRs和流量数据来研究各种蜂窝网络相关的问题,如用户的移动性,用户行为分析,应用使用的地理受欢迎度,动态频谱接入和流量动态和空间资源的使用,现有技术中对流量使用和空间资源使用的研究,使用的CDRs或流量数据都是从单一蜂窝网络短时间(三周或一周)内收集的,不能通过在呼叫塔的长时间分析CDRs,因此就不能利用CDRs研究全网络范围蜂窝呼叫使用模式。



技术实现要素:

针对现有技术的缺陷,本发明提供一种蜂窝网络中呼叫模式与资源利用的网络大数据分析方法,通过长时间构建呼叫塔流量矩阵,利用CDRs研究全网络范围蜂窝呼叫使用模式,能有效地减少呼叫下降,呼叫保持更好的可预测性,更好地估计网络资源的效用,并能提高移动互联网的速度和提高用户的体验,节约能源。

一种蜂窝网络中呼叫模式与资源利用的网络大数据分析方法,包括以下步骤:

步骤1、获取数据集合,采集蜂窝网络中一定数量移动用户的CDRs,存入数据库的数据表中,CDRs数据包括时间戳、源发射塔地址(即ID)、目的发射塔ID、电话号码和持续时间;

步骤2、根据步骤1采集的CDRs数据创建数据矩阵,包括塔对(源目的塔构成塔对)呼叫流量矩阵、塔对时间间隔矩阵、塔对DEC(Duration of Each Call,每次通话时长,简称DEC矩阵;

步骤2.1、创建塔对呼叫流量矩阵Acall,表示指定发射塔之间的所有的呼叫数,如式(1)所示;

Acall={acall(i,j,t)}n×n×s (1)

其中,acall(i,j,t)表示在时刻t第i源呼叫塔与第j个目的呼叫塔之间的呼叫数,t表示时间,以小时为单位,s为观测的时间间隔,n为自然数;

步骤2.2、创建塔对DEC矩阵Adec,表示指定发射塔之间每次网络资源呼叫的时长,如式(2)所示;

Adec={adec(i,j,t)}n×n×s (2)

其中,adec(i,j,t)表示在时刻t第i源呼叫塔ID与第j个目的塔ID之间的呼叫时长,adec(i,j,t)=adura(i,j,t)/acall(i,j,t),并且如果acall(i,j,t)=0,则adec(i,j,t)=0;adura(i,j,t)表示在时刻t第i源呼叫塔ID与第j个目的塔ID之间的呼叫时间间隔;

步骤2.3、创建发射塔矩阵,包括流入目的呼叫塔的呼叫数矩阵Dcall、源呼叫塔产生的呼叫数矩阵Ocall和流入和流出发射塔的呼叫数矩阵Rcall,分别如式(3)、式(4)和式(5)所示;

Dcall={dcall(j,t)}n×s (3)

Ocall={ocall(i,t)}n×s (4)

Rcall={rcall(v,t)}n×s (5)

其中,表示在时刻t第j个目的呼叫塔的呼叫数;表示在时刻t第i个源呼叫塔产生的呼叫数;分别表示在时刻t流入和流出第v个发射塔的呼叫数,v表示发射塔ID;

Ddure={ddure(j,t)}n×s、Odure={odure(i,t)}n×s、Rdure={rdure(v,t)}n×s分别表示源呼叫塔流入的呼叫数时间间隔矩阵、流出呼叫数时间间隔矩阵、全部呼叫时间间隔矩阵;

步骤2.4、创建发射塔的DEC矩阵,矩阵中包括时间戳、源发射塔地址(即ID)、目的发射塔ID、电话号码和持续时间;

Ddec={ddec(j,t)}n×s、Odec={odec(i,t)}n×s、Rdec={rdec(v,t)}n×s分别为流入呼叫时长矩阵、流出呼叫时长矩阵、塔对时长矩阵;

步骤3、分析呼叫使用模式,包括呼叫分布、时间模型、地理受欢迎度、呼叫的发射塔活跃性和呼叫与发射塔活跃性的关系,具体方法为:

步骤3.1、根据每个塔对和每个发射塔呼叫数的累积分布函数对呼叫分布进行分析,通过将每个塔对和每个发射塔的呼叫数在空间上聚合,对比由塔对产生的呼叫数与发射塔产生的呼叫数目;

步骤3.2、根据每个塔对和每个发射塔呼叫数的时间分布函数对时间模型特性进行分析,包含塔对和发射塔的总呼叫数、前三个塔对和发射塔塔的呼叫数、典型的的塔对和发射塔的呼叫数,并分析典型的塔对产生突发呼叫流量随时间连续的特性;

步骤3.3、根据每个塔对和每个发射塔呼叫的地理分布对呼叫地理受欢迎度进行分析,按时间的推移,将塔对的所有呼叫聚合起来,并对最大呼叫聚合进行归一化处理,呼叫流量矩阵的行和列描述了部署在不同地方发射塔IDs的起点和终点;

根据步骤2中的数据矩阵,进一步分析呼叫地理位置的受欢迎性,计算发射塔的总呼叫,如式(6)所示;

其中,Pcall表示发射塔之间的总呼叫流量矩阵;

步骤3.4、根据每个塔对和每个发射塔呼叫的活跃特性对发射塔的活跃性特征模型进行分析,在连续数小时内,分析大多数塔对产生的呼叫数,分析大多数发射塔是否活跃,以及在分析的时间段内他们没有产生呼叫;

步骤3.5、根据每个塔对和每个发射塔呼叫的活动与相应呼叫的关系对发射塔活动与呼叫关系进行分析,根据发射塔产生呼叫的时间数目,分析产生的相应呼叫数目;

步骤4、分析网络资源使用情况,包括持续时间的分布、网络资源使用的多样性、网络资源使用的强度、网络资源使用的受欢迎度和呼叫,具体方法为:

步骤4.1、根据每个塔对和发射塔的呼叫发生次数,利用累积分布函数对呼叫持续时间的分布进行分析;

步骤4.2、根据步骤4.1中的持续时间分布特性,分析塔对的呼叫时间聚合和持续时间聚合的关系,利用塔对的时间熵理论来建立网络资源的使用多样性数学模型,如式(7)所示;

步骤4.3、利用累积分布函数绘制网络资源的使用分布情况,结合步骤4.2中的分析结果,对网络资源的使用强度进行分析并将其结果应用于蜂窝网络的设计;

步骤4.4、根据步骤4.3中分析出的网络资源使用分布情况,将总呼叫数中塔对和发射塔的呼叫数从大到小进行排序,分析塔对和发射塔的使用受欢迎度并将其用于蜂窝网络的优化。

由上述技术方案可知,本发明的有益效果在于:本发明提供的一种蜂窝网络中呼叫模式与资源利用的网络大数据分析方法,从数据的数量、范围和时间等方面全面地、认知地考虑发射塔级的流量矩阵,采用了一种新的度量,即每次呼叫的时间间隔(DEC),能更准确地描述网络的效用,更全面符合实际。通过长时间构建呼叫塔级的流量矩阵,利用CDRs研究整个网络范围蜂窝呼叫使用模式并对呼叫塔以及塔对的行为进行刻画,使呼叫发起与保持具有更好的可预测性,并能提高移动互联网的速度和提高用户的体验,指导运营商对蜂窝网络进行设计和优化。

附图说明:

图1为本发明实施例提供的一种蜂窝网络中呼叫模式与资源利用的网络大数据分析方法流程图;

图2为本发明实施例提供的塔对、流入呼叫、流出呼叫、总呼叫数的平均呼叫数示意图;

图3为本发明实施例提供的平均呼叫的CDF随X参数变化示意图;

图4为本发明实施例提供的源发射塔、目的发射塔的正常呼叫数示意图;

图5为本发明实施例提供的发射塔间差值的CDF示意图;

图6为本发明实施例提供的呼叫数随时间的分布概率示意图;

图7为本发明实施例提供的产生呼叫数随时间变化的比率示意图;

图8为本发明实施例提供的产生呼叫比率的CDF示意图;

图9为本发明实施例提供的塔对、流入呼叫、流出呼叫、总呼叫数产生呼叫的时间CDF示意图;

图10为本发明实施例提供的塔对、流入呼叫、流出呼叫、总呼叫数产生的呼叫的平均时间CDF示意图;

图11为本发明实施例提供的塔对、流入呼叫、流出呼叫、总呼叫数以天为单位产生的呼叫的时间CDF示意图;

图12为本发明实施例提供的塔对、流入呼叫、流出呼叫、总呼叫数以天为单位产生的呼叫的平均时间CDF示意图;

图13为本发明实施例提供的塔对、流入呼叫、流出呼叫、总呼叫数随时间变化产生的正常呼叫数目示意图;

图14为本发明实施例提供的塔对、流入呼叫、流出呼叫、总呼叫数随平均时间变化产生的正常呼叫数目示意图;

图15为本发明实施例提供的塔对、流入呼叫、流出呼叫、总呼叫数随以天为单位的时间变化产生的正常呼叫数目示意图;

图16为本发明实施例提供的塔对、流入呼叫、流出呼叫、总呼叫数随以天为单位的平均时间变化产生的正常呼叫数目示意图;

图17为本发明实施例提供的随以天为单位的时间变化塔对的CDF示意图;

图18为本发明实施例提供的随以天为单位的平均时间变化塔对的CDF示意图;

图19为本发明实施例提供的随时间变化塔对的CDF示意图;

图20为本发明实施例提供的随平均时间变化塔对的CDF示意图;

图21为本发明实施例提供的随着产生呼叫数的塔对、流入呼叫、流出呼叫、总呼叫随产生呼叫数目变化的CDF示意图;

图22为本发明实施例提供的随着产生呼叫数的塔对、流入呼叫、流出呼叫、总呼叫随X的概率变化的CDF示意图;

图23为本发明实施例提供的塔对随时间变化产生呼叫的瞬态值;

图24为本发明实施例提供的流入呼叫随时间变化产生呼叫的瞬态值;

图25为本发明实施例提供的流出呼叫随时间变化产生呼叫的瞬态值;

图26为本发明实施例提供的总呼叫随时间变化产生呼叫的瞬态值;

图27为本发明实施例提供的每天网络资源使用情况分布示意图。

具体实施方式:

下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。

一种蜂窝网络中呼叫模式与资源利用的网络大数据分析方法,首先根据OpenFlow协议搭建一个测量平台,然后通过配置网络参数,在低网络开销的情况下,计算当前时刻网络的吞吐量、丢包率、延时的测量模型,如图1所示,具体方法为:

步骤1、获取数据集合,采集蜂窝网络中一定数量移动用户的CDRs,存入数据库的数据表中。

本实施例所分析的移动呼叫数据集来自由商业电信公司收集的真实全国蜂窝网络数据,采集2011年和2012年连续5个月的呼叫数据,包含了一个全国网络中500万个匿名移动用户的CDRs,其以小时为单位收集电话呼叫,该数据集合的每一行是由时间戳,源发射塔地址(即,ID),目的发射塔ID,电话号码和持续时间的数量组成,总共有几百万条记录。本实施例使用具有几千个发射塔的CDRs数据集合分析所有塔对(源目的塔构成塔对)的特性和使用模式,及发射塔和网络资源使用的呼叫行为模型,而且是全国范围内的蜂窝网络发射塔。

步骤2、根据步骤1采集的CDRs数据创建数据矩阵,包括塔对呼叫流量矩阵、塔对时间间隔矩阵、塔对DEC(Duration of Each Call,每次通话时长,简称DEC)矩阵、发射塔矩阵、蜂窝塔DEC矩阵,利用矩阵的观点来描述分析的数据,该数据集合描述了从源呼叫塔到目的呼叫塔的5个月呼叫记录。

为了方便构建,指定发射塔之间的呼叫称为paircall,那些流入某个特定发射塔的呼叫数称为incall,那些离开某个特定发射塔的呼叫数称为outcall,某个特定发射塔中总呼叫数包括incalls和outcalls。incalls和outcalls分别聚合在所有paircalls的某个特定发射塔的流入和流出。allcall聚合在所有产生和流入某个发射塔的paircalls中。同样的,得到以下参数:pairdura,indura,outdura和alldura分别是塔对时间间隔、流入呼叫时间间隔、流出呼叫时间间隔、全部呼叫时间间隔。

步骤2.1、创建塔对呼叫流量矩阵Acall,表示指定发射塔之间的所有的呼叫数,如式(1)所示;

Acall={acall(i,j,t)}n×n×s (1)

其中,acall(i,j,t)表示在时刻t第i源呼叫塔与第j个目的呼叫塔之间的呼叫数,t表示时间,以小时为单位,s为观测的时间间隔,n为自然数。

步骤2.2、创建塔对DEC矩阵Adec,表示指定发射塔之间每次网络资源呼叫的时长,如式(2)所示;

Adec={adec(i,j,t)}n×n×s (2)

其中,adec(i,j,t)表示在时刻t第i源呼叫塔ID与第j个目的塔ID之间的呼叫时长,adec(i,j,t)=adura(i,j,t)/acall(i,j,t),并且如果acall(i,j,t)=0,则adec(i,j,t)=0;adura(i,j,t)表示在时刻t第i源呼叫塔ID与第j个目的塔ID之间的呼叫时间间隔。

DEC能够描述每个呼叫的网络资源使用效率,与持续时间相反,DEC更精确地给出了每小时呼叫的平均持续时间。为了描述蜂窝网络中的发射塔的行为模式,将在分析的时间间隔内不产生任何呼叫的发射塔删除。

步骤2.3、创建发射塔矩阵,包括流入目的呼叫塔的呼叫数矩阵Dcall、源呼叫塔产生的呼叫数矩阵Ocall和流入和流出发射塔的呼叫数矩阵Rcall,分别如式(3)、式(4)和式(5)所示;

Dcall={dcall(j,t)}n×s (3)

Ocall={ocall(i,t)}n×s (4)

Rcall={rcall(v,t)}n×s (5)

其中,表示在时刻t第j个目的呼叫塔的呼叫数;表示在时刻t第i个源分蜂窝塔产生的呼叫数;表示在时刻t流入和流出第v个发射塔的呼叫数,v表示发射塔ID;

Ddure={ddure(j,t)}n×s、Odure={odure(i,t)}n×s、Rdure={rdure(v,t)}n×s分别表示源呼叫塔流入的呼叫数时间间隔矩阵、流出呼叫数时间间隔矩阵、全部呼叫时间间隔矩阵。

步骤2.4、创建发射塔的DEC矩阵,矩阵中包括时间戳、源发射塔地址(即ID)、目的发射塔ID、电话号码和持续时间;

Ddec={ddec(j,t)}n×s、Odec={odec(i,t)}n×s、Rdec={rdec(v,t)}n×s分别为流入呼叫时长矩阵、流出呼叫时长矩阵、塔对时长矩阵。

步骤3、分析呼叫使用模式,包括呼叫分布、时间模型、地理受欢迎度、呼叫的发射塔活跃性和呼叫与发射塔活跃性的关系,具体方法为:

步骤3.1、根据每个塔对和每个发射塔呼叫数的累积分布函数对呼叫分布进行分析,通过将每个塔对和每个发射塔的呼叫数在空间上聚合,对比由塔对产生的呼叫数与发射塔产生的呼叫数目。图2描述了每个塔对和每个塔呼叫数的累积分布函数(CDF)。由塔对产生的呼叫数比发射塔的少很多。蜂窝塔的incalls和outcalls相同,而呼叫流量(呼叫数或呼叫受欢迎度)低于allcalls的流量。一个典型的的塔对产生23个呼叫,而一个典型的蜂窝塔产生incalls、outcalls和allcalls分别为2.8×105、2.8×107和4.7×105。很明显,在5个月的时间里,塔对呼叫流量非常低。大约16%的塔对只有一个呼叫,5%的塔对产生超过700个呼叫,75%蜂窝塔产生incalls和outcall的数量在2×105~2×106之间,这说明网络资料使用的效用是非常低的。

为了进一步理解呼叫的分布,图3展现了塔对和蜂窝塔之间的关系,其中,‘X’表示塔对或蜂窝塔。从图中可知,10%的塔对产生总呼叫的85%以上,1%的呼叫对应整体呼叫的60%,这是很不正常的。相反,蜂窝塔的incalls、outcalls和allcalls的百分比具有相同的分布。10%的蜂窝塔产生30%的incalls、outcalls和allcalls,而1%的蜂窝塔产生5%的incalls、outcalls和allcalls。这表明与蜂窝塔相比,塔对间的呼叫不平衡使得较少的塔对使用更多的网络资源。图2和图3指明了塔对和蜂窝塔呼叫分布是不同的,因此,它们具有不同的网络资源使用模型。

步骤3.2、根据每个塔对和每个发射塔呼叫数的时间分布函数对时间模型特性进行分析,包含塔对和蜂窝塔的总呼叫数、前三个塔对和蜂窝塔的呼叫数、典型的塔对和蜂窝塔的呼叫数,并分析典型的塔对产生突发呼叫流量随时间连续的特性。

在许多时间点上,大部分塔对保持沉默,并且仅仅在几个时间点上创建一个突发呼叫。这将进一步说明网络资源不能满足塔对的需求。与塔对不同,蜂窝塔的总呼叫,前3个蜂窝塔的总呼叫和典型的的蜂窝塔显示连续的特点。虽然outcalls与incalls存在着相同的时间分布,但是由于空间的限制,不能绘制出来。除了典型的的塔对之外,其他ACF系数显示出很强的周期性并且周期仅仅为24,这与一天的24小时完全一致。两个重要发现是:(1)塔对呼叫的时间模型与蜂窝塔呼叫的时间模型是不同的;(2)当许多蜂窝塔呼叫展现出很强的周期性时,塔对呼叫是不可预测的。这个显著的不同说明应该从不同的角度充分考虑网络规划和资源调度,例如针对蜂窝塔,有着不同的优化目标。

步骤3.3、根据每个塔对和每个发射塔呼叫的地理分布对呼叫地理受欢迎度进行分析,按时间的推移,将塔对的所有呼叫聚合起来,并对最大呼叫聚合进行归一化处理,呼叫流量矩阵的行和列描述了部署在不同地方蜂窝塔IDs的起点和终点。

呼叫地理受欢迎度显示了不同时刻塔地理位置的相关性。随着时间的推移,将塔对的所有呼叫聚合起来并且对最大呼叫聚合进行归一化处理。图4为塔对呼叫聚合地理分布。塔对呼叫流量矩阵的斜线显示在相同的蜂窝塔中呼叫源和目的的使用率情况。塔对的呼叫包含很强的位置性:在相同的蜂窝塔控制下的源和目的的呼叫。这说明受支配的本地呼叫占用大部分网络资源。

为了进一步分析呼叫地理位置的受欢迎性,根据步骤2计算蜂窝塔的总呼叫,并且不考虑呼叫的方向问题,如式(6)所示。

其中,Pcall表示蜂窝塔之间的总呼叫流量矩阵。

图5为塔对呼叫和距离间的相关性,比率代表给定距离的总呼叫与网络总呼叫的比值。从图中可知,(1)塔本身产生和流入塔的呼叫占网络总呼叫的38.5%;(2)当塔产生总呼叫的75%时,塔对10%的距离是小于30千米的,并且小于95千米的塔对中的20%占总呼叫的85%。这进一步说明了塔对的呼叫拥有很强的位置性。

在相同的蜂窝塔中,进一步分析源和目的塔呼叫的位置行为。尽管聚合的信息能够展现出塔对呼叫的位置,但是它不能清楚地阐明在不同时刻,不同蜂窝塔产生的位置特征。为此,图6描述相同蜂窝塔下源到目的的总的呼叫与整个网络不同时刻总的呼叫比例,从图中可知,塔对自身呼叫与塔对总的呼叫数目的比例仅仅达到8.223684×e-4,并且接近0,在不同时刻呼叫比例的波动间隔在0.2到0.4之间,并且保持在一个稳定的变化区间。这说明在不同时间,蜂窝塔有着很强的位置性。这个局部性也展示稳定的波动性质。这个时间局部性对于有效地设计和配置蜂窝网络是有用的。

为了描述这个位置的波动情况,在图7中,分析了24个小时内(即每天)蜂窝塔的位置属性。在24小时内,paircalls和selfcalls分别聚合,并且他们的比例被计算出来。在5点、8点和23点拥有3个峰值,在7点和17点拥有2个低谷,在5点存在最大值并且在17点存在最小值。从比值曲线可以看出,在白天非自身呼叫比晚上产生更多的流量,并且在4点和23点附近产生较少的呼叫流量。说明在每天不同时刻,蜂窝塔位置状态是不同的,并且这将指导我们来建设更加节能的蜂窝网络。

为了研究这个波动模型,进一步分析图6的比值CDF。一个典型的时刻的比值大约等于0.265并且96%时刻的比值在0.2和0.4之间。这说明在大多数时刻,位置的变化是相当稳定的。这种分发用于指导网络操作者来提高网络性能更加有效。

步骤3.4、根据每个塔对和每个发射塔呼叫的活跃特性对发射塔的活跃性特征模型进行分析,在连续数小时内,分析大多数塔对产生的呼叫数,而大多数蜂窝塔却活跃,但是在分析的时间段内他们没有产生呼叫。

在5个月观察期间,描述蜂窝塔的活动模型。在图6至图8中,分析paircalls、incalls、outcalls和allcalls。在图9中,一个典型的的塔对仅仅用22小时来产生呼叫,并且仅仅6%的塔对使用大于500小时来产生呼叫。与5个月相比,这是非常不正常的。一个典型的蜂窝塔分别产生incalls、outcalls和allcalls的小时数目为2545、2774和2842,这说明大多数蜂窝塔在大部分时间是活动的。

为了更好地理解活动的特征,在图10中,分析蜂窝塔的连续活动模型,分别产生paircalls、incalls、outcalls和allcalls连续几个小时的73.6%、13.1%、12.5%和11.5%的数目仅仅是1,产生paircalls的连续小时典型的数目是1,但是对于incalls、outcalls和allcalls是19。这说明在连续数小时内,大多数塔对不能产生呼叫,而大多数蜂窝塔却活跃,但是在连续24小时内他们没有产生呼叫。因此,这存在许多没有呼叫的连续时间。这些连续的非呼叫活动对于蜂窝塔节能是有帮助的。

同时也分析一天的蜂窝塔的活动情况,在图11,对于一个典型的的塔对和蜂窝塔,产生paircalls、incalls、outcalls和allcalls的天数分别为16、122、138和138,图12,连续天数的数目分别为1、9、20和21。这也进一步说明当蜂窝塔活动时,塔对是不活动的。图9和图11,在incalls和outcalls之间,从2200小时到3000小时和从116天和138天存在差距。这说明大部分塔呼叫坐落在不同的位置,并且这些塔消耗更多的网络资源。这对于网络规划和配置是非常重要的。

步骤3.5、根据每个塔对和每个发射塔呼叫的活动与相应呼叫的关系对发射塔活动与呼叫关系进行分析。根据发射塔产生呼叫的时间数目,分析产生相应的呼叫数目。

图9至图12为相应的呼叫被蜂窝网络的总的呼叫标准化。发射塔和蜂窝塔产生呼叫的时间数目越多,产生相应的呼叫就越大,如图13和图15所示。产生呼叫的数目上,存在一些呼叫流量的峰值。这意味着当规划一个蜂窝网络时,不但考虑产生呼叫时,塔对和蜂窝塔时间数目比较大,而且还要考虑比较小的值而不是峰值。对于产生呼叫的连续时间数目,呼叫流的许多峰值出现时间数目,如图14和图16所示。从图14中,能够清楚地发现产生呼叫连续时间数目,(1)塔对花费2和19小时来产生比较大的呼叫峰值,并且花费2小时达到这个呼叫的最大值;(2)蜂窝塔花费19小时来创建最大的incalls、outcalls和allcalls。从图16中可知,对于产生呼叫连续时间的数目,paircalls和incalls花费108天和139天创建呼叫峰值,并且花费139天达到最大的呼叫,而outcalls和allcalls花费139天时间来形成最大呼叫峰值。这表明,对于峰值点,蜂窝塔能够创建更多的呼叫和消耗更多的网络资源。因此,当优化网络时,这些位置应特别考虑。

步骤4、分析网络资源使用情况,包括持续时间的分布、网络资源使用的多样性、网络资源使用的强度、网络资源使用的受欢迎度和呼叫,具体方法为:

步骤4.1、根据每个塔对和蜂窝塔的呼叫发生次数,利用累积分布函数对呼叫持续时间的分布进行分析。

在数据集中,持续时间是非常重要的,它表示每个小时呼叫的持续时间。在图17至图20中,分析持续时间的分布。持续时间的分布与图2的呼叫分布是相似的。在图17中,当蜂窝塔的呼叫存在更长的持续时间时,10%的塔对呼叫仅仅持续1秒。当一个典型的蜂窝塔创建incalls、outcalls和allcalls分别持续3×107、3×107和6×107秒时,其产生呼叫持续5×103秒。与5个月的观察对比,这个持续时间是非常低的。这说明大部分时间蜂窝塔是空闲的,并且网络资源没有充分使用。在图18中,针对incalls、outcalls和allcalls,20%的蜂窝塔有相同的持续时间时,2%的塔对拥有持续时间的50%。这是非常清楚的,超过塔对和蜂窝塔的比例,pairduras分布是无法理解的,而induras、outduras和allduras是一致的。

步骤4.2、根据步骤4.1中的持续时间分布特性,分析塔对的呼叫时间聚合和持续时间聚合的关系,利用塔对的时间熵理论来建立网络资源的使用多样性数学模型,如式(7)所示。

为了描述使用的多样性,在图21中,分析时间的呼叫聚合和对应的持续时间聚合的关系。能够清楚地发现聚合呼叫与间隔存在线性关系。每个塔对用这些呼叫来预测网络管理的持续时间是有益的。熵可以用来描述一个变量的多样性,使用每一个塔对的时间熵来描述网络资源的使用的多样性。

随着时间的推移,每一个塔对的呼叫和持续时间越大,时间熵就越大(x轴和y轴是log坐标)。较大的时间熵表示分布在更多时刻的呼叫和持续时间,反之亦然。随着时间的推移聚集的呼叫和持续时间表现出与他们的相应的时间熵的关系。更重要的是,呼叫的时间熵和持续时间的时间熵之间存在一个较强的关系。进一步分析蜂窝塔的incalls、outcalls和allcalls后,发现相似的描述。这表明,可以使用的呼叫的时间熵来预测持续时间。这种可预测性对于估计网络资源的使用是非常有帮助的。

在图21和图22中,selfdecs和pairdecs在24小时内展现相似的强度。可以看到,在6点、16点和24点,有3个峰值。在5点、10点和19点,有3个低谷。当其他时间的值比较大时,从8点到22点的值则比较小。特别是,在午夜拥有最高点。这表明,在夜间,一些用户花更多的时间通过呼叫来通话。这可能是因为有一个诱惑的呼叫价格。更重要的是,可以清楚的发现,selfcalls、selfduras、paircalls和pairduras体现较强的昼夜模式。从8点到17点,他们的价值是非常大的。接近21点时,他们表现出了另一个更大的价值。在凌晨4点,拥有最低的限度。selfcalls在10点和20点到达峰值,然而paircalls在11点,17点和20点达到峰值。这表明,在蜂窝网络中,selfcalls的强度是不同于塔对的。selfduras的峰值在10点、13点和21点,而pairduras的峰值在13点、17点和21点。很明显,23点之后,paircalls和selfcalls都减少,而pairduras和selfduras都增加。这些重要的分布特征可以用来指导如何更有效地设计蜂窝网络。

步骤4.3、利用累积分布函数绘制网络资源的使用分布情况,结合步骤4.2中的分析结果,对网络资源的使用强度进行分析并将其结果应用于蜂窝网络的设计。

图23至图27绘制每天网络资源使用分布的情况,selfcalls、selfduras、selfdecs、paircalls、pairduras和pairdecs聚集在24小时内,并且被对应的最大值标准化。进一步分析发现,alldecs、outdecs、indecs和pairdecs保持相似的性质,induras、outduras、allduras、和pairduras具有相似的分布,并且incalls、outcalls、allcalls和paircalls表现出相似的特征。由于空间的限制并清楚地显示,仅绘制selfcalls、selfduras、selfdecs、paircalls、pairduras和pairdecs的曲线。这些分析结果也适用于其余的情况。

步骤4.4、根据步骤4.3中分析出的网络资源使用分布情况,将总呼叫数中塔对和蜂窝塔的呼叫数从大到小进行排序,分析塔对和蜂窝塔的使用受欢迎度并将其用于蜂窝网络的优化。

根据总呼叫,对塔对和蜂窝塔的呼叫从大到小排序,发现较多呼叫的塔对可以保持较低时间出现的数目。对于蜂窝塔,incalls、outcalls和allcalls也表现出相似的特征。很显然,拥有很多受欢迎的的塔对和蜂窝塔不总是花更多的时间来使用网络资源,也就是说,他们是受欢迎的,但没有必要显著地活动。这一发现对于网络优化是非常重要的。

具体实施中,还可以进一步分析呼叫、持续时间和DECS受欢迎度的关系。但是,比较受欢迎的呼叫可能保持较低的持续时间并且反之亦然。当呼叫减少时,pairdecs显示增加的趋势。对于蜂窝塔,induras、outduras和allduras体现出类似的分布。此外,虽然随着时间的推移出现波动,当塔呼叫变得比较低时,induras、outduras和allduras逐渐减少。然而,indecs、outdecs和alldecs并不表明较强呼叫受欢迎度的相关性。进一步表明,不受欢迎呼叫的塔对和蜂窝塔可能消耗更多的网络资源。

大多数当前的移动蜂窝网络都是专为提供高质量服务的移动用户设计的。在空闲时间内,例如午夜后,可以出租无线资源给其他用户和移动服务提供商。此外,还可以调整目前的定价计划,以激励更多的用户在非高峰时期使用蜂窝网络,例如午夜附近。特别是,让用户花更多的时间来谈论,而不仅仅为工作,他们应该在空闲时刻通过吸引的价格鼓励使用蜂窝网络。通过这样的方式,可以提高网络资源的利用和提高网络的性能。在任何时候,承载大部分网络呼叫的塔对应该更具体地观察,因为只有一小部分的塔对产生相当大的呼叫。当规划和制作负载平衡时,应该首先考虑到这些关键的塔对。

随着时间的推移,塔对总的呼叫是可以被预测的,这种可预测性可以用来估计在不同时间(细粒度)的蜂窝网络中的蜂窝网络的呼叫。因此,可以有效地减少呼叫下降。此外,对于大多数的蜂窝塔,相对于塔对,呼叫保持更好的可预测性。因此对于每个蜂窝塔,可以充分利用这一特性来估计网络资源的效用。更重要的是,虽然大多数塔对不能有效地预测自己产生的呼叫,前1%的塔对,尤其是总的呼叫能够进行有效和准确的呼叫评估。这表明,这些关键的塔对可以通过适当地呼叫估计来优化。对于移动用户,语音呼叫是必要的,以满足实时性的要求,然而数据服务拥有较低的实时需求。虽然网络资源没有充分利用,在白天,塔对和蜂窝塔创建峰值呼叫,在当前的蜂窝网络中,可以利用呼叫预测方法和活动模式来更加有效地进行流量卸载策略。因此,可以提高移动互联网的速度和提高用户的体验。事实上,大多数的塔对保持空闲状态,一个蜂窝塔可以让一部分的蜂窝塔睡眠来节约能源。此外,根据塔对和蜂窝塔的活动模型,一个蜂窝塔可以执行高效节能的网络设计。

蜂窝网络中呼叫的位置特征可以被用来优化网络部署。更重要的是,当规划和优化时,在相同塔对的起始和终止的呼叫应该考虑。然后在一定的阈值距离如30km塔对之间的呼叫也应该更认真地考虑。使用相同塔对或塔呼叫和持续时间之间的关系来预测呼叫的持续时间。使用这种预测的持续时间,可以更好地估计网络资源的效用。然后,可以更有效地做出相应的决定。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明权利要求所限定的范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1