基于arma-arch模型族的gsm通信系统gprs数据业务的预测方法

文档序号:7861131阅读:763来源:国知局
专利名称:基于arma-arch模型族的gsm通信系统gprs数据业务的预测方法
技术领域
本发明涉及GSM通信,尤其是通信系统中GPRS数据业务流量的预测技术领域。
背景技术
纵观无线移动通信市场的发展趋势,近年来呈现的一个明显特征是用户对于移动数据业务的需求不断上升。尤其是近几年随着移动通信市场竞争加剧,移动话务业务的资费已呈现下降趋势,而与话务业务收入持续下降形成鲜明对比的是数据业务正在形成新的收入增长点,而且这一新的收益源还将保持持续增长态势。飞速增长的数据业务固然带来了无限商机,但也给移动通信运营商的网络容量和优化带来了新的挑战。GPRS网络作为目前移动通信运营商提供数据业务的主要承载网络,其网络质量的好坏直接影响了用户对移动数据业务使用的满意度。对通信过程中用于描述当前网络运行状态、性能的参数进行分析是无线通信网规划扩容、维护和优化的重要参考手段。提前预测网络的数据流量变化趋势,有计划的做好网络扩容和优化,对网络高质量和低成本运营至关重要,是一种任何国家的运营商都优先选择的统筹方案。从已有的文献和专利检索结果来看,围绕时间序列预测问题已经取得了很多研究成果,有大量可以采用的成熟算法,比如ARMA模型、灰色系统理论、神经网络和支持向量机,这些算法和研究成果成为提升预测有效性的重要保障。但是针对GPRS数据业务的相关预测研究较少,但话务业务的相关预测研究则较成熟,对数据业务预测有参考作用。目前研究话务业务数据预测的方法中,无论是线性模型还是智能模型,大都是从数据本身值的大小考虑预测模型的建立,很少涉及从数据的波动性即方差角度来进行数据预测。
1982 年,恩格尔[R. F. Engle, “Autoregressive conditionalheteroscedasticity with estimates of the variance of United Kingdom inflation”,Econometrica, vol. 50,no. 4,pp. 987-1007,1982]首次提出自回归条件异方差模型(ARCH)就是从波动性角度进行数据预测,在处理呈现波动聚集性序列时有着很好的解释和描述能力,并成功应用于解决英国通货膨胀指数波动性研究。为解决有时ARCH模型阶数过高的问题,波勒斯勒夫[T. Bollerslev, “Generalized autoregressive conditionalheteroskedasticity,,,Journal of Econometrics, vol. 31, no. 3, pp. 307-327,1986]于1986年提出了广义自回归条件异方差模型(GARCH)。另外,在对ARCH模型的理论研究和应用中,人们发现时间序列的条件方差只依赖于有限个历史值,给ARCH模型带来了局限性,而GARCH模型就很好地解决了这个问题,使方差依赖全部历史值。对于数据业务的分析及预测,国内外很少有学者做出研究,但是可以借助于分析话务量及其预测的方法,结合数据业务自身的特点,建立适合数据业务的预测模型,当然首先要分析数据业务和话务业务数据的异同点I)数据分布都依赖于一天中某些时间段虽然近几年数据业务得到了极大的发展,但是人们对数据业务的使用远不及对话务业务的使用,话务业务已经深入到绝大多数人们的生活和工作中,可以说现代社会是离不开话务业务的,尤其是在工作中话务业务起着巨大作用。数据业务的普及率是远远不如话务业务的,虽然数据业务也开始应用在人们的工作中,但是大多数的应用来自人们的娱乐,比如浏览网页、手机QQ、在线小说、在线视频观看、网络游戏等。这就决定了数据的业务的分布与话务业务数据分布是不同的。推测数据业务的高峰将出现在人们不工作,休息的时间;而话务业务将在工作时间和休息时间都可能出现高峰。图1(a)和(b)分别所示为一天24小时的话务量和数据分布曲线。从图I我们可以发现,话务量具有以天为周期的特性。一天中有两个峰值,分别是上午的10 00 11 00和夜间的19 00 20 00,结合人们的实际生活习惯很容易理解。而数据流量的高峰来自20 00 22 00,这个时间段是大多数人休息的时刻了,另外在工作时间10 00和14 00左右数据流量也可以达到一个小高峰,说明数据业务也一定程度被应用在人们工作中。可见,无论是话务量还是数据流量,它们的大小和它所在 的时间点息息相关。也就是说,这两种数据都依赖于一天中的某些时间段。2)数据流量呈现以月为周期的季节性分析数据可知,话务量和数据流量依赖于一天中的时间段,但是否也会依赖于一个月内的时间段呢?通过分析数据,得到图2(a)和(b),分别代表以天为单位的话务量曲线和数据流量曲线。从图2(a)中我们可以看出,话务量曲线在绝大多数天内,波动不大,只是在某几天出现很大的波动,推测估计波动大的点处于节假日期间;而从数据流量曲线图2(b)可分析出数据大致呈现周期性,一个周期的天数大概为31日。说明话务曲线不呈现以月或者周为单位的季节性,而GPRS数据业务曲线大致呈现以月为周期的季节性。中国发明专利200710028126. X( 智能化话务预测方法”,·Q5.22)采用的方法因素分析法和时间序列模型,对于序列的趋势性采用一元回归进行提取,而对于平稳数据采用的基于自相关系数的自回归模型;中国发明专利200910135918. 6 (“基于支持向量机的数据预测方法和设备”,2009. 05. 06)采用支持向量机对数据进行预测,并通过合理构造输入因子,以解决数据本身存在的季节性、趋势性等;中国发明专利200910265969. O ( “实现业务数据预测的实时处理平台及预测方法”,2009. 12. 22)采用的是自回归模型进行数据预测,也只是从数据本身大小角度出发建立模型,没有考虑数据的波动性。从目前的专利或者相关学术研究来看,没有相关研究是从波动性角度来做数据业务的预测,这极大浪费了数据所包含的信息量,换个角度说,没有充分挖掘出数据的信息,对数据认识是不够清晰的,必然不会出现最佳的预测效果;相关研究更没有在使用ARCH模型前对数据进行必要的预处理提取数据自身的长期自相关性和应用ARMA模型提取数据自身的短期自相关性的步骤。本发明从数据的长期、短期自相关性和波动性角度出发对GPRS数据业务数据进行预测,得到了比较理想的预测效果。

发明内容
鉴于现有技术的不足及缺乏对数据业务行之有效的预测方法,本发明的目的是研究一种基于ARMA-ARCH模型族的GSM通信系统GPRS数据业务预测方法,使之克服现有技术的以上缺点,且具有较高的预测精度和良好的推广性。本发明是通过如下手段实现的
I)预处理GPRS数据业务所述GPRS数据业务的预处理,使该序列变成平稳而非纯随机性序列,预处理步骤依次为A、确定季节性周期设原始GPRS数据业务序列为{y(t),t = 1,2,…,N},其中N为观测数据样本个数,对该序列作快速离散傅里叶变换I ("、= Eioi "(O ('xI) { - jX!i = 0,1,…,N -I,并计算对应功率谱函数,通过谱分析得到序列的季节性周期T ;B、In 缩小化
为避免高数量级原始序列数据的末几位在处理过程中被舍掉,影响数据精度,利用对数变换进行缩小化处理z (t) = In y (t);C、去季节性对B步骤得到的缩小化序列{z(t),t = 1,2,…,N},用同期平均法提取其季节因子{k(i), i = I, 2, ···, T},继而进行去季节性处理,即s (t) = z (t)/k(i),其中,当t modT关O时,i = t mod T,否则i = T,得到非季节性数据序列{s(t), t = 1,2, ···, N};D、去趋势性虽然经过C步骤去除了季节性,但依然不能保证数据平稳,数据可能存在趋势性,通过对序列ls(t),t = 1,2,-,N}作m阶差分实现去除趋势性,得到差分平稳序列{d(t),t = 1,2,…,N-m};2)利用ARMA-ARCH模型族对I)预处理后的GPRS数据业务进行预测,模型参数根据实时数据的拟合进行测算。ARMA-ARCH模型族的一般表达形式如下设|x(t),t = 1,2,…,N}为模型的输入序列,= 1.2.…,为ARMA部分的输出序列,ARMA模型定义为x(t) = 00 + φ\χ{ — I) + ‘ · ■ + φρΧ[t' — p) + ε⑴ + θιε( — I) + · * · + (/ — q)其中,i= 1,2,…,ρ}为 AR 部分的参数,{ θ i7 i = 1,2, “.,q}为 MA 部分的参数,{ ε (t)}是随机误差项。那么ARMA过程的残差序列为{u(t),t = 1,2,…,N},即u(t) = x(t) — x(t)J- = 1,2.···,N。 对u (t)建立ARCH模型如下u(t) = hL^(t)f{t)h (t) = α + a jU2 (t—I) +... + a ru2 (t—r) + β jh (t—I) +... + β h (t— u )其中,{ a i; i=1,2, ···,!■}和 Wi, i = 1,2,…,v}分别为 ARCH 和 GARCH 部分的参数,{ ε (t)}服从i.i.d.正态分布N(0,1),且与{u(t-l),u(t-2),···}独立,h(t)为u(t)序列的方差。采用如上的方法,对预处理后数据建立ARMA-ARCH模型,从数据本身长期、短期自相关性和数据波动性角度出发进行数据预测,使用的模型为ARMA-ARCH模型族,可为a) ARMA模型包括各阶AR模型、MA模型和ARMA模型;b) ARCH模型包括各阶ARCH模型、GARCH模型以及扩展的各阶ARCH模型和GARCH模型,例如E (G) ARCH、T (G) ARCH、(G) ARCH-M、Power-ARCH、FIGARCH 等。3)预处理后的数据经Daniel (丹尼尔)检测判断应为平稳。
4)预处理后的数据{d(t),t = 1,2,…,N-m}建立ARMA-ARCH模型族时,模型参数根据实时数据的拟合进行测算。5)根据对{d(t),t = 1,2,-,N-m}所建立的ARMA-ARCH模型作一步或迭代L步预测得+ I)、{d(N — m + I); d(N — m + 2),…,d(N — m + L)}。通过预处理的逆过程得到最终预测结果识+ 1)或{卵)J = N + l,N + 2.r·· ,N + i},并输出至网规网优中心作分析处理以指导实际网络的动态优化和长期规划。采用本发明方法具有以下有益效果I、在进行GPRS数据业务数据预测之前,根据数据的性质和拟使用模型的需要对数据进行了预处理,包括季节因子的提取、平稳化处理等,提高了数据与所选模型的拟合度;2、采用了 ARMA-ARCH联合模型族对数据业务数据进行预测。ARMA模型主要从数据 本身值的角度进行预测,利用信息为数据的短期自相关性;而ARCH模型是从数据的波动性即方差角度进行数据预测,ARMA模型和ARCH模型相结合从数值和波动两方面考虑可以提高数据的精度。


图I (a)和I (b)分别为一天24小时的话务量和数据业务曲线,数据量统计单位为I小时。图2(a)是以天为单位的话务量,图2(b)是从某市移动提取的以天为单位的GPRS数据业务。图3是对原始GPRS数据业务进行的整体系统图。图4是本法对原始GPRS数据业务进行预测的整体流程。图5是图4中预处理过程的详细步骤示意图,包括In缩小数据处理、去季节性、和去趋势性处理。图6是图4中建立ARMA-ARCH模型的详细操作步骤示意图。图7是本发明对图2(b)数据业务序列的预测结果。
具体实施例方式下面参照附图描述本发明的实施例。应当理解,在此描述的本发明实施例仅是为了更好地解释本发明的原理和概念,而不是要限制本发明。在阅读这样的描述之后,本领域技术人员很容易构造其他修改或替换,这样的修改或替换应被理解为落入本发明的范围中。图3示出本发明对原始GPRS数据业务进行的整体系统图,GSM基站子系统100通过网络将数据业务相关指标参数实时传送到GPRS数据业务预测系统200中的历史数据库210进行归档存放;然后数据处理单元220根据实际预测需求,动态或定期从历史数据库中获取指定时间颗粒度、指定长度的历史数据,经分析数据特性处理后,进行以下步骤处理,完成处理后的结果数据输出至网规网优中心230以指导实际网络的动态优化和长期规划。图4示出本发明实施例的数据预测方法流程图。具体实施包含以下关键步骤I)根据数据特性分析的结果,对GPRS数据业务观察值序列进行预处理,图5示出预处理过程的详细步骤,具体如下A、确定季节性周期设原始GPRS数据业务序列为{y(t),t = 1,2,…,N},其中N为观测数据样本个数,对该序列作快速离散傅里叶变换
权利要求
1.一种基于ARMA-ARCH模型族的GSM通信系统GPRS数据业务的预测方法,其步骤分为两步 1)预处理GPRS数据业务 所述GPRS数据业务的预处理,使该序列变成平稳而非纯随机性序列,预处理步骤依次为 A、确定季节性周期 设原始GPRS数据业务序列为{y(t),t = 1,2,…,N},其中N为观测数据样本个数,对该序列作快速离散傅里叶变换 } I") = Ef=JfizWexP{_./%"}·η = O,1,···,#-1, 并计算对应功率谱函数,通过谱分析得到序列的季节性周期T ; B、In缩小化 为避免高数量级原始序列数据的末几位在处理过程中被舍掉,影响数据精度,利用对数变换进行缩小化处理z (t) = Iny (t); C、去季节性 对B步骤得到的缩小化序列{z (t),t = 1,2,…,N},用同期平均法提取其季节因子{k(i), i = 1,2, ,继而进行去季节性处理,即s (t) =z (t)/k(i),其中,当t mod T古O时,i = t mod T,否则i = T,得到非季节性数据序列{s (t), t = 1,2, ...,N}; D、去趋势性 虽然经过C步骤去除了季节性,但依然不能保证数据平稳,数据可能存在趋势性,通过对序列{s(t),t = 1,2,…,N}作m阶差分实现去除趋势性,得到差分平稳序列{d(t),t =1,2, ... , N-m}; 2)利用ARMA-ARCH模型族对I)预处理后的GPRS数据业务进行预测,模型参数根据实时数据的拟合进行测算,ARMA-ARCH模型族的一般表达形式如下设|x(t),t = 1,2,…,N}为模型的输入序列,丨印).〖=1.2.··· j丨为ARMA部分的输出序列,ARMA模型定义为 x(t') = <^0 + φ\χ( — I) + · · · + ψρχ( —ρ) + ε( ) + 0\o{i — I) + ■ · · + θηε(1 — q) 其中,{Φ ,i = 1,2,…,ρ}为AR部分的参数,{ θ i7 i = 1,2, “.,q}为MA部分的参数,{ ε⑴}是随机误差项,ARMA过程的残差序列为|u(t),t = 1,2,…,N},即 u(t) = x(t) — x(t), = 1,2. · · * , N; 对u (t)建立ARCH模型如下 u(t) = Λ1/2( )£( ) h (t) = α 0+ α jU2 (t~l) +··· + α ru2 (t~r) + β ^ (t~l) +··· + β h (t- υ ) 其中,{α ρ i = 1,2,…,r}和{βρ i = 1,2,…,u }分别为ARCH和GARCH部分的参数,{ e⑴}服从i. i. d.正态分布N(0,I),且与{u (t-1),u (t-2),...}独立,h (t)为u(t)序列的方差。
2.根据权利要求I所述之基于ARMA-ARCH模型族的GSM通信系统GPRS数据业务的预测方法,其特征在于,所述ARMA模型包括各阶AR模型、MA模型和ARMA模型,所述ARCH模型包括各阶ARCH模型、GARCH模型以及扩展的各阶ARCH模型和GARCH模型。
3.根据权利要求I所述之基于ARMA-ARCH模型族的GSM通信系统GPRS数据业务的预测方法,其特征在于,所述预处理后的数据经Daniel检测判断应为平稳。
4.根据权利要求I所述之基于ARMA-ARCH模型族的GSM通信系统GPRS数据业务的预测方法,其特征在于,所述预处理后的数据{d(t),t = 1,2,…,N-m}建立ARMA-ARCH模型族时,模型参数{p,q, r, υ , Φ = 1^ρ, θ i = 1^q, α i = 1^r, β i = 1 }根据实时数据的拟合进行测算。
5.根据权利要求4所述之基于ARMA-ARCH模型族的GSM通信系统GPRS数据业务的预测方法,其特征在于,根据对{d(t),t = 1,2,…,N-m}所建立的ARMA-ARCH模型作一步预测得- m + 1);还可将一步预测结果与{d(t)}形成新的数据集,继续用ARMA-ARCH模型迭代预测下一个时间点数据,直至实现预期的L步预测,得{ /(ΛΓ - m+ l).d(N — m -Μ). ·, · .d(N — rn + 1)丨,并通过预处理的逆过程得到最终预测结果沉# + 1)或{获的』二汉+ 1,1 + 2,···,iV + i},输出至网规网优中心作分析处理以指导实际网络的动态优化和长期规划。
全文摘要
本发明公开了一种基于ARMA-ARCH模型族的GSM通信系统GPRS数据业务的预测方法。本发明方法的关键步骤为GPRS数据业务的预处理,包括季节性周期确定、ln缩小化、去季节性和趋势性处理;利用ARMA-ARCH模型族对预处理后的GPRS数据进行预测。采用本发明方法可对GPRS数据业务进行有效的预测,为运营商对通信过程中描述当前网络运行的状态、性能参数进行分析和对无线通信网规划扩容、维护及优化提供重要的参考手段,可提前预测网络的数据流量变化趋势,有计划的做好网络扩容和优化,直接或间接地带来可观的经济效益。
文档编号H04W24/06GK102869033SQ201210355608
公开日2013年1月9日 申请日期2012年9月21日 优先权日2012年9月21日
发明者李恒超, 姜承飞 申请人:西南交通大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1