一种基于流向预测的资源预留方法及系统、移动通信系统与流程

文档序号:15359803发布日期:2018-09-05 00:31阅读:211来源:国知局

本发明属于中央资源管理;资源协商技术领域,尤其涉及一种基于流向预测的资源预留方法及系统、移动通信系统。



背景技术:

目前,业内常用的现有技术是这样的:一是在移动节点进行切换后进行资源预留,该技术存在的问题是资源预留过程需要一定的时间,切换之后一段时间内,用户体验得不到良好的保证。二是在用户切换前进行完全的资源预留,该技术带来的问题是资源利用率不高。三是基于预测的资源预留,如采用了一个频谱池来管理空闲频谱资源,通过传输速率来预测下一阶段用户需求的带宽资源;然而由于传输速率预测模型的时延较大,带宽分配的实时性难以保证,只能适用于小规模的网络中;基于马尔科夫链的方法,通过马尔科夫转移函数预测下一时刻负载的状况,该方法对于非平稳序列无法达到较高的预测准确度,以及在大数据情况下对于小区间的切换数来说需要建立多维的马尔科夫状态转移图,无法实现计算时间短,模型简单的效果;运用小波神经网络模型预测未来一小时内各个区域的业务量,虽然可以实现较高的预测精度,但是不能根据网络特性做出实时性的改变。

综上所述,现有技术存在的问题是:

(1)常规的资源预留技术无法实现高的资源利用率。

(2)基于预测的资源预留技术虽然可以提高资源利用率,但是对于单一模型来说,由于网络环境较为复杂,无法保证模型的鲁棒性,因此就不能根据网络特性进行实时性的改变。

(3)当预留资源超过本小区所能提供的资源总数时,现有算法为了防止切换用户掉话让切换用户随机接入附近的一个邻区,没有考虑到周围邻区的资源占用情况,会影响邻区的用户体验。

解决上述技术问题的难度和意义:

(1)难度有两个:一是模型的选择,模型的好坏直接影响了预测结果的准确率。如果模型没有选择恰当,预测结果就会有很大的误差,从而导致网络根据预测结果进行资源预留时,产生资源预留过多或过少的现象,影响到资源利用率。二是因为网络环境比较复杂,如何让模型根据网络的特性进行实时性的修正也是上述技术问题的难点。

(2)意义:通过设计一种有效的基于预测的资源预留技术,不但可以防止切换用户产生掉话,而且对于提升网络资源利用率也会有很大的帮助。



技术实现要素:

针对现有技术存在的问题,本发明提供了一种基于流向预测的资源预留方法及系统、移动通信系统。

本发明是这样实现的,一种基于流向预测的资源预留方法,所述基于流向预测的资源预留方法获取小区间流向的历史数据;将数据进行分析和预处理;对处理后的数据集合进行划分与特征提取;选择不同的模型进行训练,调整参数使模型预测精度达到最高;对两个模型预测的结果进行实时性的融合;网络根据预测结果进行资源预留;通过判断预留资源数与本小区所能提供的资源总数的关系,决定是否需要进行空间流向操作。

进一步,所述基于流向预测的资源预留方法包括以下步骤:

步骤一,获取流向的历史数据;

步骤二,基于特征选择和实际操作经验选择数据的模型:包括基于线性回归理论构建的岭回归模型和基于时间序列模型构建的arima+garch模型;

步骤三,岭回归模型预测结果与时间序列模型预测结果融合;

步骤四,根据模型融合后的预测结果,计算出所需的预留资源;根据预留资源与本小区所能提供的资源总数之间的关系,判断是否需要进行空间流向操作。

进一步,所述岭回归建模的算法具体包括:

(1)认识数据:根据历史数据信息,观察数据的变化情况:波动性、缺损值等信息;以及数据整体的分布情况,数据的规律性统计情况;

(2)数据预处理:通过统计数据信息,可能会存在下面两种情况:一是有的基站在某些时间段上的数据是缺失的,即缺损值;二是数据整体分布呈现周期形式,对应某些时间段上的数据却呈现突发,即异常值;

(3)数据划分与特征提取:将处理后的数据集合划分成两部分:一部分作为训练集,用于提取特征;一部分作为测试集,以验证模型预测的准确性;即从小区流向历史数据中选取前n天的流向数据来预测第n+1天的流向数据;所提特征主要基于历史流向数据信息,特征构造基于历史信息与待预测信息之间的相关性,相关性较高的历史时刻的值将对预测起到更大的作用;经过皮尔森系数的检验,模型所用特征具体包括:选取每个小区对每一天每个时刻对应的前4小时的流向数据的切出、每个小区对每一天每个时刻对应的前一小时的在线用户数,以及每个小区对每一天对应前一天的切出;

(4)模型构建:采用ridge岭回归模型。如果所给数据时长较长或数据属性较多,选用较复杂的模型;

(5)模型预测与评定结果:将前n天的数据特征作为训练集输入到模型中进行训练学习;将第n+1天的预测结果与真实值进行比较,以相对误差作为评价模型好坏的判决指标。

进一步,所述(2)具体包括:

1)如遇到缺损值,采用在原数据集合上用对应基站历史时刻的数据均值对缺失的部分进行填充;如遇到异常值,则直接在原数据集合上将其舍弃;

2)在选取数据集合时,以源小区为中心点,统计以该小区为源小区的不同时刻所有邻小区的切出总值;

3)计算与该小区相关的各个邻小区的不同时刻的切出值与不同时刻的切出总值的比值;

4)将比值大于某一阈值的数据集合作为最终的训练数据集。阈值的选择可通过多次尝试进行选定;按照如下公式进行计算:

其中,i表示源小区编号,j表示邻小区编号,all_cell表示以源小区为中心,与之相关联的所有邻小区,succ_outi,j表示小区i中的用户向小区j流动的用户个数,pi,j表示切出比例。

进一步,所述时间序列模型构建arima+garch模型建模的算法具体包括:

(1)根据时间序列的散点图、自相关函数和偏自相关函数图以adf单位根检验其方差、趋势及其季节性变化规律,对序列的平稳性进行识别,判断其是否为平稳序列,如果是平稳序列,则跳转到步骤(3);如果是非平稳序列,则跳转到步骤(2);

(2)对非平稳序列进行平稳化处理,采用的方法为差分处理,时间序列最常用来剔除周期性因素的方法是差分,主要是对等周期间隔的数据进行线性求减;

(3)使用statsmodels库函数里面自带的seasonal_decompose周期分解函数对时间序列进行分解,将时序数据分离成长期趋势、季节趋势和残差分量。statsmodels支持两类分解模型,加法模型和乘法模型;采用加法模型,三部分分量值相加即为原数据值;

1)分解趋势项,采用中心化移动平均值来计算趋势项;

当f为奇数时,计算:

当f为偶数时,计算:

其中tt为趋势项,xt表示时序序列,f为时间序列频率,l为时间序列长度;

2)计算季节项,采用将原始时间序列减去趋势项st=xt-tt,将各个周期内相同频率下的值平均化,得到季节项figure,周期性季节项的计算则为将figure扩展至长度为l的序列;

seasonalt=figuret%%f其中%%为取余运算;

3)计算残余项,residual=xt-tt-seasonalt;

(4)对不同的分量建立arima模型,根据前n天的小区流向数据来预测第n+1天的流向数据;

(5)进行假设检验,诊断残差序列是否为白噪声,若有残差效应,即arch效应,则使用garch模型进行修正;

(6)利用已通过检验的模型进行预测,根据模型的predict函数得到第n+1天的预测结果;将三部分分量的预测结果相加求和作为最终的预测结果值;将预测值与真实值进行比较,计算相对误差,判断模型的准确率。

进一步,所述将岭回归模型与时间序列模型的预测结果进行融合按照如下公式进行计算:

resultt=αtfridge,t+(1-αt)farima,t0≤αt≤1;

其中,resultt为不同时刻模型融合后的最终结果,at为调整因子,范围在[0,1]之间,fridge,t为不同时刻岭回归模型预测的结果,farima,t为不同时刻时间序列模型预测的结果;通过at参数的调节,根据不同时刻不同模型的预测精度来进行适时的调节。

进一步,所述步骤四具体包括:

(1)各个基站在进行资源分配时需要对接入的用户进行分类,如果基站服务的用户只有一类,即属于本地基站的用户;如果基站处于低负载甚至是空闲状态时,即有别的基站的用户接入,此时需要将接入该基站的用户分为两类:一类是本地用户,一类是切换用户,根据用户所属的源基站信息对基站的资源进行分配;

(2)根据融合后的预测结果,与资源映射表进行对应,计算出每个小区应该预留的资源数;

(3)将预留资源数和本小区的用户所需的资源数相加求和与本小区所能提供的资源总数进行比较;

1)如果小于资源总数,则在保证本小区用户使用资源的前提下,剩下的资源可以根据预测结果预留出对应的资源供切换用户使用;

2)如果大于资源总数,则说明下一时刻本小区将出现过载情况,此时需要触发空间流向操作;

(4)根据模型预测出来的结果与资源映射表对应的关系,网络知道除本小区外其所有邻小区的资源预留情况;

(5)依次计算邻小区预留资源数和邻小区的本地用户所需的资源数之和与该邻小区所能提供的资源总数的差值;

1)如果小于资源总数,则将该邻小区纳入候选小区集合中;

2)如果大于资源总数,则进入(4);

(6)对备选网络集合中的所有邻小区进行判断;

1)如果备选网络集合为空,则只能在此时刻放弃该切换用户的接入;

2)如果备选网络集合不为空,则根据集合中的所有小区的空闲资源进行排序;

3)挑选网络资源空闲最多的小区作为本小区中切换用户二次转移的目的小区。

本发明的另一目的在于提供一种应用所述基于流向预测的资源预留方法的移动通信系统。

综上所述,本发明的优点及积极效果为:本发明利用机器学习相关算法对小区间的流向进行预测,比普通的预测算法或简单的模型融合预测精度更高,且能根据网络特性进行实时性的改变。本发明根据流向预测结果可以提前预知网络中各个小区的资源预留情况,避免用户在移动时因为随机接入,影响接入网络中的用户体验。本发明根据空间流向操作可以避免切换用户掉话。

本发明提供了一种超密集网络中基于流向预测的资源预留方法,其是在机器学习算法的基础上设计的,从而可以实现较高的预测精度。根据预测结果,一方面能提前预知网络中的流向信息,根据流向信息为切换用户预留资源。另一方面,在保证主用户在本小区的资源占用情况的前提下,当本小区所能提供的预留资源数不足以支持切换用户的使用时,通过流向预测信息,将本小区的切换用户转移到本小区的邻区中进行业务支持。

附图说明

图1是本发明实施例提供的基于流向预测的资源预留方法流程图。

图2是本发明实施例提供的使用的超密集网络场景示意图。

图3是本发明实施例提供的使用的小区流向示意图。

图4是本发明实施例提供的基于流向预测的资源预留方法整体流程图。

图5是本发明实施例提供的岭回归模型预测流程图。

图6是本发明实施例提供的arima+garch模型预测流程图。

图7是本发明实施例提供的空间流向操作流程图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

本发明提出一种基于流向预测的资源预留算法,一方面能根据网络的特性对模型预测的结果进行实时性的修正;另一方面,根据流向预测结果可以提前预知网络中各个小区的资源预留情况,避免用户在移动时因为随机接入,影响接入网络中的用户体验。同时,根据预测结果,可以使无法接入本小区的切换用户选择资源空闲最多的小区接入。

如图1所示,本发明实施例提供的基于流向预测的资源预留方法包括以下步骤:

s101:获取流向的历史数据;

s102:基于特征选择和实际操作经验选择数据的模型:包括基于线性回归理论构建的岭回归模型和基于时间序列模型构建的arima+garch模型;

s103:岭回归模型预测结果与时间序列模型预测结果融合;

s104:根据模型融合后的预测结果,计算出所需的预留资源。根据预留资源与本小区所能提供的资源总数之间的关系,判断是否需要进行空间流向操作。

下面结合附图对本发明的应用原理作进一步的描述。

图2为本发明的超密集网络架构示意图。超密集网络由大量小小区(smallcell)部署,小小区是低功率无线接入节点,工作在授权的频谱上,覆盖范围在10到200m,而宏基站的覆盖范围可达数公里。如图2中的bs为宏基站,sc为小小区基站。当基站数量变多时,可能存在用户处于两个基站的重叠范围内,就会出现用户在这一时刻接入其中一个小区,下一时刻可能接入另一个小区,即小区流向现象。例如,对于用户1来说可能在某一时刻接入的是小区1中的基站,下一时刻可能接入的是小区2中的基站。因为在超密集网络中,基站数量较多,基站的覆盖范围难免会出现重叠区域,因此这种小区间的流向问题可能会随时出现。因此,设计一种良好的流向预测方法,对资源预留问题有很好的帮助效果。

图3表示的是某一小区在线用户的流向示意图。中心小区为源小区,各个箭头的粗细代表的是不同程度的转移用户数。粗箭头代表源小区中大部分的用户下一时刻都接入了邻小区6,邻小区5次之,依次类推。通过对小区间流向数值的分析,可以判断出用户的大致流向信息,从而为选择合理的数据集合作准备。

根据机器学习中的岭回归模型和时间序列模型对小区间的流向进行预测。图4是本发明基于一个实施例的流向预测方法流程图。该方法包括以下步骤:

1)获取流向的历史数据;

2)基于特征选择和实际操作经验选择数据的模型;

在数值预测问题上分为两大类:1.分类问题:以离散值作为预测目标;2.回归问题:以连续值作为预测目标;例如:对某区域某时刻是否会发生堵车的预测即为分类问题,其预测目标为堵车或者不堵车,可以用0和1来表示该预测目标;该区域某个时刻有多少用户的预测即为回归问题,预测目标存在数值上的大小关系,为连续值。因此,本发明属于回归问题。

因为不同小区之间的数据是不共享的,因此需要对每个小区进行建模。经观察得到所有小区的流向数据变化情况呈现出以天为周期的特性,所以每天对应时刻的数据相比其他时刻的数据规律性更强。考虑到不同时刻的波动性较大,因此不同时刻的数据与特征可能呈现出的规律也不相同,因此需要对不同时刻的小区分别建立预测模型。

1基于线性回归构建岭回归模型

基于岭回归建模的算法步骤具体如下:

(a)认识数据:根据历史数据信息,观察数据的变化情况:波动性、缺损值等信息。以及数据整体的分布情况,即数据的规律性统计情况。

(b)数据预处理:一方面,通过统计数据信息,如果发现有的基站在某些时间段上的数据是缺失的,即缺损值;或者是数据整体分布呈现周期形式,但是对应某些时间段上的数据却呈现突发,即异常值。

(b.1)如遇到缺损值,本发明采用在原数据集合上用对应基站历史时刻的数据均值对缺失的部分进行填充;如遇到异常值,则直接在原数据集合上将其舍弃。

(b.2)在选取数据集合时,以源小区为中心点,统计以该小区为源小区的不同时刻所有邻小区的切出总值。

(b.3)计算与该小区相关的各个邻小区的不同时刻的切出值与不同时刻的切出总值的比值。

(b.4)将比值大于某一阈值的数据集合作为最终的训练数据集。阈值的选择可通过多次尝试进行选定。

即,按照如下公式进行计算:

其中,i表示源小区编号,j表示邻小区编号,all_cell表示以源小区为中心,与之相关联的所有邻小区,succ_outi,j表示小区i中的用户向小区j流动的用户个数,pi,j表示切出比例。

(c)数据划分与特征提取:将步骤(b)处理后的数据集合划分成两部分:一部分作为训练集,用于提取特征;一部分作为测试集,以验证模型预测的准确性。即从小区流向历史数据中选取前n天的流向数据来预测第n+1天的流向数据。所提特征主要基于历史流向数据信息,特征构造基于历史信息与待预测信息之间的相关性,相关性较高的历史时刻的值将对预测起到更大的作用。因此,在特征提取方面遵循相关系数原则,即,使用皮尔森系数作为相关系数计算的依据,以验证所提特征的有效性。经过皮尔森系数的检验,模型所用特征具体包括:选取每个小区对每一天每个时刻对应的前4小时的流向数据的切出、每个小区对每一天每个时刻对应的前一小时的在线用户数,以及每个小区对每一天对应前一天的切出。

(d)模型构建:因为不同小区之间的数据是不共享的,因此需要对每个小区进行建模。经步骤(a)观察得到所有小区的流向数据变化情况呈现出以天为周期的特性,所以每天对应时刻的数据相比其他时刻的数据规律性更强。考虑到不同时刻的波动性较大,因此不同时刻的数据与特征可能呈现出的规律也不相同,所以在模型构建时需要对不同时刻的小区分别建立预测模型。因为当前使用的数据时长较短,在对不同时刻建模的情况下单个模型可供训练的数据量较小,所以不宜使用基于集成树的模型或神经网络模型。目前考虑采用ridge岭回归模型。如果所给数据时长较长或数据属性较多,可以选用较复杂的模型。

(e)模型预测与评定结果:将前n天的数据特征作为训练集输入到模型中进行训练学习,从而使模型具有一定的泛化性,进而根据模型的predict函数得到第n+1天的预测结果。将第n+1天的预测结果与真实值进行比较,以相对误差作为评价模型好坏的判决指标。通过调节模型中的参数,来使模型预测的准确率更高。

2基于时间序列模型构建arima+garch模型

由经验可知,由于小区流向为时间序列数据,具有时序性,前序流向数据对后序流向数据具有影响,故采用了时间序列模型中比较常见的arima模型。在arima模型的基础上又加上garch模型进行修正,从而提高模型的泛化性和预测准确度。

基于时间序列模型建模的算法步骤具体如下:

(a)根据时间序列的散点图、自相关函数和偏自相关函数图以adf单位根检验其方差、趋势及其季节性变化规律,对序列的平稳性进行识别,判断其是否为平稳序列,如果是平稳序列,则跳转到步骤(c);如果是非平稳序列,则跳转到步骤(b)。

(b)对非平稳序列进行平稳化处理。采用的方法为差分处理,因为时间序列最常用来剔除周期性因素的方法是差分,它主要是对等周期间隔的数据进行线性求减。

(c)使用statsmodels库函数里面自带的seasonal_decompose周期分解函数对时间序列进行分解,它主要将时序数据分离成长期趋势、季节趋势和残差分量。statsmodels支持两类分解模型,加法模型和乘法模型。本发明采用加法模型,即三部分分量值相加即为原数据值。

(c1)分解趋势项,采用中心化移动平均值来计算趋势项;

当f为奇数时,采用下述方法计算:

当f为偶数时,采用下述方法计算:

其中tt为趋势项,xt表示时序序列,f为时间序列频率,l为时间序列长度。

(c2)计算季节项,采用将原始时间序列减去趋势项st=xt-tt,将各个周期内相同频率下的值平均化,得到季节项figure,周期性季节项的计算则为将figure扩展至长度为l的序列。

seasonalt=figuret%%f其中%%为取余运算;

(c3)计算残余项,residual=xt-tt-seasonalt;

(d)对不同的分量建立arima模型,根据小区间流向历史数据前n天的流向数据的时间序列趋势来预测第n+1天的流向数据。

(e)进行假设检验,诊断残差序列是否为白噪声。若有残差效应,即arch效应,则使用garch模型进行修正。

(f)利用已通过检验的模型进行预测。根据模型的predict函数得到第n+1天的预测结果。将三部分分量的预测结果相加求和作为最终的预测结果值。将预测值与真实值进行比较,计算相对误差,判断模型的准确率。

3)将岭回归模型与时间序列模型的预测结果进行融合。

将两个模型预测的结果按照如下公式进行计算:

resultt=αtfridge,t+(1-αt)farima,t0≤αt≤1;

其中,resultt为不同时刻模型融合后的最终结果,at为调整因子,范围在[0,1]之间,fridge,t为不同时刻岭回归模型预测的结果,farima,t为不同时刻时间序列模型预测的结果。通过at参数的调节,可以根据上一时刻不同模型的预测精度来进行实时性的调节。即当预测t时刻的切换数时,可以通过t-1时刻的预测精度对at进行调整,当ridge模型的预测精度高时,则at系数大,反之,则小。比常规的采用求取均值或按照比例进行计算的方式更灵活、更可靠。

4)根据模型融合后的预测结果,计算出所需的预留资源。根据预留资源与本小区所能提供的资源总数之间的关系,判断是否需要进行空间流向操作。图7为本发明的空间流向操作流程图。

4.1各个基站在进行资源分配时需要对接入的用户进行分类,如果基站服务的用户只有一类,即属于本地基站的用户;如果基站处于低负载甚至是空闲状态时,即有别的基站的用户接入,此时需要将接入该基站的用户分为两类:一类是本地用户,一类是切换用户,根据用户所属的源基站信息对基站的资源进行分配。

4.2根据步骤3)中融合后的预测结果,与资源映射表进行对应,计算出每个小区应该预留的资源数。

4.3将预留资源数和本小区的用户所需的资源数相加求和与本小区所能提供的资源总数进行比较。

4.3.1如果小于资源总数,则在保证本小区用户使用资源的前提下,剩下的资源可以根据预测结果预留出对应的资源供切换用户使用。

4.3.2如果大于资源总数,则说明下一时刻本小区将出现过载情况,此时需要触发空间流向操作。

4.4根据模型预测出来的结果与资源映射表对应的关系,网络可以知道除本小区外其所有邻小区的资源预留情况。

4.5依次计算邻小区预留资源数和邻小区的本地用户所需的资源数之和与该邻小区所能提供的资源总数的差值。

4.5.1如果小于资源总数,则将该邻小区纳入候选小区集合中。

4.5.2如果大于资源总数,则进入步骤4.4。

4.6对备选网络集合中的所有邻小区进行判断。

4.6.1如果备选网络集合为空,则只能在此时刻放弃该切换用户的接入。

4.6.2如果备选网络集合不为空,则根据集合中的所有小区的空闲资源进行排序。

4.6.3挑选网络资源空闲最多的小区作为本小区中切换用户二次转移的目的小区。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1