基于大数据统计模型的无线网络话务量预测方法

文档序号:7805124阅读:215来源:国知局
基于大数据统计模型的无线网络话务量预测方法
【专利摘要】本发明公开了一种基于大数据统计模型的无线网络话务量预测方法,在无线网络中给定的一个小区中,无线网络话务量的预测可以通过将每一个话务测量值根据网络话务特征和移动用户行为特征分解为相应的趋势分量T(t)、季节性分量S(t)、突发分量B以及随机误差分量R,对各自分量的内在特征进行解析,各自预测后,最后通过公式X(t)=(1+B(t))×(T(t)+S(t)+R(t))重新组合还原成整体的预测值。本发明利用大数据的真实样本剖析出每个话务测量值的组成部分,将传统话务预测的测量值进行了更小粒度的分解,从而揭示了每个话务历史测量值分解过后的子特征,利用大数据技术,将海量历史数据利用合适的数据挖掘和机器学习算法,挖掘出无线网络的话务特征,从而为网络话务评估和预测提供了一整套系统化,准确率高的解决方案体系。
【专利说明】基于大数据统计模型的无线网络话务量预测方法
【技术领域】
[0001]本发明属于移动通讯领域,特别涉及一种基于大数据统计模型的无线网络话务量预测方法。
【背景技术】
[0002]移动数据业务和智能终端的指数增长给移动运营商带来了大量的新用户和收入。然而,众所周知的是,无线网络容量是一种有限的资源,其面临着流量和服务需求增长两大挑战。如今,数据海嘯和信令风暴正以压倒性地趋势吞噬着无线网络资源。为了防止资源被无限制的消耗,这就需要运营商适当地调整容量管理策略来满足不断增加的网络容量需求。无线网络的容量是指满足所有的语音、数据和信令流量的各种资源。无线网络容量管理是一种保证无线网络被正确地分配从而满足流量需求和尽可能的以一种最有效的方式来利用网络资源的过程。网络容量管理需要考虑现有和未来的需求,如网络运营商的商业运营目标、网络KP1、服务质量,及最终网络提供的应用和服务的盈利能力。
[0003]由于移动数据海嘯,在过去几年中移动运营商在不同程度上都出现了网络负荷过载的现象。然而,移动运营商不可能无限投资去扩大网络规模。传统的基于业务流量增长的网络资源规划方法,并没有解决扩大网络容量和资本支出之间的矛盾。在智能手机出现之前,网络应用只有语音和简单的数据服务,设备运行在一个相对单一的模式下。在这单一的服务模式下,网络在一段时间内是稳定的。在预测网络容量时,移动运营商通常专注于无线网络中的总流量,同时也考虑覆盖和干扰的问题。尽管如此,智能终端带来了大量无法预测的变化,如无法简单量化的信令流量、并发连接进行的各种新的应用或每一个数据应用连接所产生的数据流量变化。
[0004]传统的无线容量规划方法只考虑到一个主要因素——用户数量。用一个通用的函数来表示的话,就是未来需求的容量=目前容量+正比于用户增长产生的容量。由于多元化业务模式的智能手机和用户行为,未来需求的容量需考虑增加用户识别和服务多样性等因素。因此,引进一种新维度的公式,未来需求的容量=目前容量+正比于用户增长产生的容量+多元化的智能手机行为和业务增长的容量。
[0005]因此,运营商需要一个科学的方法来预测网络资源和规划网络容量。该方法需要考虑到流量模型中的动态变化,即用户数量变化、智能手机用户行为和服务模式。本文介绍了一种基于业务测量和服务趋势的数据分析和建模评估LTE网络容量的系统方法。该方法目的在于解决两个主要问题:
首先,这种方法能够预测流量模型中由于多元化的服务模式和用户行为引起的动态变化。这种动态变化会引起网络流量变化,最终影响网络容量。此外,容量在端到端的网络设备资源支持下,其物理阈值(上限和下限)是由不同业务多样化的服务和设备有效利用网络软、硬件的能力所决定的。基于相关参数的流量模型可以代表网络流量的统计特征和网络资源。智能手机上多种服务给流量模型带来了动态变化,这将最终影响3G和LTE网络容量评估的精确性。如果不能准确计算的网络阈值可能会导致网络中断或服务性能下降。[0006]第二,该方法能以自动调优的办法来计算网络容量,反映业务模型中的动态变化。该方法应该是一个持续循环式的学习过程,以识别网络容量管理的弊端,并执行精确的网络规划。该模型基本上回答了两个问题:什么时候网络容量需要被增加?如何用节约成本的方式实现扩容?
无线网络性能、服务质量和容量管理在学术界和工业界已被许多人做了研究。2G、3G或LTE网络的现有研究都是由各种模拟方法执行的。
[0007]基于模拟的方法研究3GUMTS网络性能和服务质量在学术界得到了公认。Shiao-LiTsaoet.Al.(2002)利用模拟的方法设计和评估了三种可能的UMTS-WLAN互通策略。即移动IP方法、网关方法和基于当前UMTS、WLAN和移动IP规格的模拟方法。SZlovencsak(2002)提出了一个类树型的UMTS地面网,他们开发了两种类型的启发式算法,以确保在这种网络拓扑中较低的流量损失。其中一个算法通过修改树的拓扑结构解决了这个问题,而另一个通过插入额外链接拓展网络。他们的方法展示了如何在现实网络场景中找到一个折衷的方法来实现拓扑结构优化和网络扩展。Khan et.al.(2012)提出了一种新的用于低比特率和分辨率(QCIF)的H.264编码的视频,这种基于内容的、非侵入式的质量体验预测模型,同样适应UMTS网络。他们认为视频应用在UMTS网络下的成功很大程度上取决于满足用户的QoE要求。因此用它来预测并控制视频质量来满足用户的QoE要求是非常可取的。在研究中,他们通过NS2进行了仿真验证了该自适应方案的有效性,特别是在UMTS接入网络中,这是一个瓶颈。Navaie, K.和Sharafat,A.(2003)进行了一种在上行和下行空中接口容量的分析。他们定义一个服务的最大并发用户数为公认容量,并以此和并发用户数定义出网络总负荷的函数。大量案例研究将上述方案输出的结果和网络仿真的结果进行了比较,比较结果证明了在网络设计和规划中此方案的准确性和实用性。
[0008]从UMTS到LTE,模拟仿真被认为是最典型的研究网络性能、质量和容量相关问题的平滑过渡的方法。下 面是一些基于仿真的算法和工具来探讨LTE网络性能、服务质量和容量使用的研究。例如,Ikuno J.C.et Al。(2010)进行了系统级LTE网络仿真。LTE系统级模拟器在Matlab中提供了评估LTE SISO下行共享信道,和使用了开环空间复用的MMO网络以及传输多样性模式。Ouyang, Ye (2012)在LTE网络的SI接口上进行仿真分析研究了吞吐量的行为,其网络结构和拓扑是通过Opnet连接的。一些不同的流量场景被仿真去探索SI接口的流量行为。Engels,A.(2013)提出了一个关于LTE多层网络优化的自适应权衡性能指标的方法。其引入低干扰近似模型,这些相关优化问题被编码成混合整型线性程序并嵌入到一个自组织网络操作和优化框架中。这个优化过程考虑了时变优化参数自动适应对网络的变化。基于代表性仿真的研究论证了我们整体概念的适应性和潜在价值。Amzallag, D.et.al.(2013)研究LTE小区选择流程来确定小区向每个移动台提供服务。他们提出了两种不同的小区选择的算法,第一个算法给出(Ι-r)近似解,一个移动台可以被多个基站同时覆盖。第二个算法给出了 l_r / 2 近似解,而每一个移动台最多被一个基站覆盖。仿真结果表明,相比当前小区选择算法,该算法提升近20%的网络使用能力。
[0009]据上所述,事实证明,这一领域大多采用仿真建模进行研究分析。然而,由于大数据方法变得可用,它提供了一个机会从另一个方面去研究这个问题,而不再是模拟仿真。
[0010]首先仿真建模在无线网络问题分析,大数据分析至少有两大优势。
[0011]大数据分析利用真实的测量数据而不是模拟仿真数据或假设场景来研究无线网络的一个特定的问题。测量数据从网络侧或用户侧真实量化反映了网络和用户的行为,一旦有个合适的分析算法能够描述这个抽象的网络现象,我们就有理由相信这个分析结果更加可靠和值得信赖。这些测量的数据中还隐藏着许多未知的无线网络问题。电信大数据数据分析的目标是挖掘无线网络的数据关系,揭示隐藏的数据背后的事实。
[0012]大数据分析通常是监督学习(也可以非监督式)或后学习过程,使用实测数据来推断数据背后的某种模式,以合理的方式来揭示出未见过情况。大数据分析方法与传统仿真方法相比,最大区别是大数据分析方法采用真实数据来揭示无线网络隐藏的问题,而不是假设场景模拟。我们也承认有时模拟仿真也应用真实数据来分析抽象网络问题,但这并不能完全替代上述大数据分析方法在研究网络性能、容量、服务质量问题中的两大优势。

【发明内容】

[0013]本发明的目的是提供一种基于大数据统计模型的无线网络话务量预测方法。
[0014]为了实现上述目的,本发明采用以下技术方案:一种基于大数据统计模型的无线网络话务量预测方法,在无线网络中给定的一个小区中,无线网络话务量的预测方法包括以下步骤:
1)趋势分量T(t)的预测:
11)建立趋势分量T(t)预测模型:
将获取的无线网络话务量历史数据的测量时间序列分成m份,每段长度为η天,取置信度为95%,如果趋势分量历史数据呈现正态分布,确定其边界为u-2o和u + 2σ,来排除离群异常值;分段考虑每段上的数据,将每一段的起始无线网络话务量历史数据Xk和斜率Slopek拟合为一条直线,在拟合过程中,保证每相邻两条拟合曲线首尾连续,将无线网络话务量历史数据作为训练样本进行建模,获得趋势分量T (t)预测模型:
_ =(I);
12)斜率Slopek的修正:
如果最近连续N个斜率不小于零,那么第Ν+1的斜率不应小于零,修正后斜率由下式表示:
K = Max\Kr+i , y min (Aj.,Aj-_2, ^y-λ'+ιΒ (2),
其中Z是可调节的,直到一个最佳常数时候使得真实值与拟合值的差距达到最小;
13)趋势分量的预测:
采用趋势分量的预测模型获得趋势分量的预测值;
2)季节性分量S(t)的预测:
21)确定周期长度1:
设L是获取的无线网络话务量历史数据的时间序列长度,周期长度i=l~L/2,i分为j份,对于i=l,2...L/2,按下式计算出各i值下关于j的方差和值:
σ? m麵=53(3);
M
对于i=l,2,3…L/2,假设P为i内每段的采样点数目,定义p=L/i,构建P个样本数据集,每个样本数据集包含P中相同位置q上的所有样本,按下式计算出每个P的方差的和:
【权利要求】
1.一种基于大数据统计模型的无线网络话务量预测方法,其特征在于在无线网络中给定的一个小区中,无线网络话务量的预测方法包括以下步骤: 1)趋势分量T(t)的预测: 11)建立趋势分量T(t)预测模型: 将获取的无线网络话务量历史数据的测量时间序列分成m份,每段长度为η天,取置信度为95%,如果趋势分量历史数据呈现正态分布,确定其边界为u-2o和u + 2σ,来排除离群异常值;分段考虑每段上的数据,将每一段的起始无线网络话务量历史数据Xk和斜率Slopek拟合为一条直线,在拟合过程中,保证每相邻两条拟合曲线首尾连续,将无线网络话务量历史数据作为训练样本进行建模,获得趋势分量T (t)预测模型:
2.根据权利要求1所述的基于大数据统计模型的无线网络话务量预测方法,其特征在于:所述建立趋势分量T (t)预测模型中异常值的排除,首先判断历史数据样本集是否呈现正态分布,如果通过正态分布的检验,采用正态分布的边界来排除异常值;如果时间序列不符合正态分布,采用四分位差法排除异常值。
【文档编号】H04W16/22GK103987056SQ201410238066
【公开日】2014年8月13日 申请日期:2014年5月30日 优先权日:2014年5月30日
【发明者】吴冬华, 程艳云, 闫兴秀 申请人:南京华苏科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1