一种基于接入用户数变化预测的超密集网络资源分配方法与流程

文档序号:13287544阅读:271来源:国知局

本发明属于网络通信技术领域,涉及网络资源分配方法,更为具体的说,是涉及无线通信系统中一种基于接入用户数变化预测的超密集网络资源分配方法。



背景技术:

在宏站覆盖范围内同频密集部署低功率小站的超密集异构网络是一种提升第五代移动通信(5g)网络频谱利用率和网络容量的有效方法。然而现有基站的实际利用率还很低,这是因为网络在不同时段的负载不平衡,并且每个基站的容量固定,不同基站之间也不能共享处理能力。

移动网络的一个固有特性就是其用户处于运动状态,在通信过程中经常会从一个地点移动到另一个地点。通过对实际运营网络的观察发现,用户的移动呈现出很强的时间规律性。例如在上班时间段,大量的用户从居住地移动到办公区;而当工作时间结束后,大量用户又从办公区返回到居住地。随着这些用户的移动,移动网络的负载也呈现出随着时间而在网络中迁徙的现象,即所谓的“潮汐效应”。在传统的无线接入网中,每个基站的处理能力只能被其服务的小区内的用户使用。当小区内的用户离开后,基站的处理能力无法转移,只能处于浪费状态。由于运营商要每时每刻保持着网络的覆盖,使得这些空载或者零星负载的基站必须和那些高负载的基站消耗一样的功率。更严重的是,当负载较高时,基站往往满负荷运转,其需要的处理能力远高于平均水平。这样一来,某些时段某些基站就存在处理能力的浪费,而某些时段某些基站又存在处理能力的不足。



技术实现要素:

为解决上述问题,本发明提出了一种基于接入基站用户数变化预测的超密集异构网络多小区资源分配方法。本发明以提高资源利用率同时最大化系统中接入用户公平度为目标,根据不同小站对资源的需求在不同时刻各不相同的特点,提出在超密集异构网下,大站可以根据预测得到小站在未来短时间内的资源需求,动态、合理地给小站分配资源,有效提高资源的利用率。

本发明联合调整所有小站的发送功率,解决超密集异构网中的干扰协调问题。首先通过半监督分类识别典型“潮汐”模式;然后预测基站接入用户数的变化,将随机森林特征的袋外误差作为衡量特征重要性的指标对输入的特征进行排序筛选,得到的特征进行支持向量机回归预测;最后按比例动态调节小站的资源,实现小站之间的资源迁移,提高系统用户的公平度以及平均吞吐量。

为了达到上述目的,本发明提供如下技术方案:

一种基于接入用户数变化预测的超密集网络资源分配方法,包括如下步骤:

步骤一:半监督分类,识别基站的“潮汐”效应场景:

首先,对每个基站接入人数数据半小时采样一次,得到基站一天的用户数随时间变化的序列,所述序列为一个48维的向量,记为xi=(xi(1),xi(2),...,xi(48)),用户数序列根据不同的变化规律,可对应三种不同的典型“潮汐”效应场景;

对于同一大站下的n个小站,随机选择nr个小站,再分别通过对其中每个基站抽取近若干天数的用户数序列xa,xb,xc,xd,xe,令为基站一天在第j个时刻采样得到的接入用户数,得到序列根据上述规律,标注序列xi所对应的“潮汐”效应场景ei∈{1,2,3},同时放入已标注样本集合l={(xi,ei)},i={(xi,ei)},其它的样本放入未标注样本集合u={(xj)};其中xi为基站接入用户数的序列,yi为不同“潮汐”效应场景的分类标号,已标注样本集合l,i是半监督分类的初始化;

接着,选择余弦相似来度量不同基站接入用户数的序列xi,xj(i,j=1,2,...,n,i≠j)之间的距离distance(xi,xj),公式如下:

最后,对样本进行自训练半监督分类如下:

5)用已标注样本集合l生成分类策略f:对于任意一个输入xj,确定其中xl∈l,则输入xj对应的分类为xl所对应的分类el,即f(xj)=el;

6)选择xu=argmindistance(xu,xl),其中xu∈u,xl∈l;

7)用f对于xu分类,并且把(xu,f(xu))加入到l中;

8)重复上述步骤直到未标注样本集合u为空集;

对于任意基站a,通过上述分类方法得到所对应的”潮汐”效应场景e;

步骤二,构造高维输入特征:

在时刻t,预测目标基站a在时刻t+1的接入用户数ya,t,其中基站a所对应的”潮汐”效应场景为e,用于预测的输入包含以下两个方面:

3)对于上述步骤一中通过半监督学习初始化得到的集合i={(xi,yi)},构造新的集合inew={xi|ei=e,(xi,ei)∈i},inew的容量为inew,其中的元素均为48维的向量得到其中mod(a,b)表示a对b取模;由此得到的新的inew个向量,构成新的48inew维向量

4)同一个大站覆盖下的所有小站为的前ts个时刻点的接入用户数序列为b为同一大站下小站的个数,对于每一个小站接入用户数序列均为ts维的向量,故这些向量一共构成新的bts维向量

由此,在时刻t预测目标基站a在时刻t+1的接入人数ya,t,则构造对应48inew+bts维输入

步骤三,由步骤二得到的输入为包含高维特征的向量xa′,t,其对应输出ya,t为目标基站a下一时刻t+1的接入用户数,这里分别记为其中n=bts+48inew,构成初始训练集{(xt,yt)},利用随机森林进行特征筛选:

首先,对样本容量为m的初始训练集{(xt,yt)},进行有放回随机抽样m次,得到1个样本容量为m的采样集;初始训练集有的样本在新得到的采样集中从未出现,称为袋外数据oob;依此采样得到t个样本容量为m的采样集;

然后,基于上述得到的每个采样集分别独立训练一个基学习器—分类回归决策树cart,给定训练集d={(x1,y1),(x2,y2),...,(xm,ym)},其中xi=(xi(1),xi(2),...,xi(n))与yi分别为包含高维特征的输入和一维输出;在训练数据集所在的输入空间,递归地基于一个特征xi(j)将每个区域划分为两个子区域r1,r2,并给定每个子区域上的输出值,构建二叉决策树:

4)根据下式选择最优切分特征j与切分点s:

遍历特征j,对于固定的切分特征j扫描切分点s,选择使(2)达到最小值的(j,s);

5)用选定的(j,s)划分区域并决定相应的输出其中avg(a)表示对集合a中的元素取均值:

r1(j,s)={xi|xi(j)≤s},r2(j,s)={xi|xi(j)>s}

对于区域rt上相应的输出是rt上所有输入样本xi所对应输出yi的均值;

6)继续对两个子区域r1,r2调用步骤1)和2)生成决策树;

接着,计算每一个特征xj(i)的重要性importance(i):对于这些已经训练好的每一个cart选择相应的oob计算袋外数据误差,记为erroob1;随机对oob所有样本的特征xj(i)加入噪声干扰再次计算袋外数据误差,记为erroob2;随机森林中有t棵树,则特征xj(i)的重要性为importance(i)=∑(erroob2-erroob1)/t;

最后,将特征根据得到的特征重要性importance(i)降序排序,选取前k个特征,构造新的输入xj′,对应输出仍为yj;

步骤四,据随机森林特征筛选得到新的包含k维特征的输入xj′记为xj,使用svr预测下一时刻接入目标基站用户数量yj,具体如下:

训练集d={(x1,y1),(x2,y2),...,(xm,ym)},其中xj=(xj(1),xj(2),...xj(k))为高维输入,即为特征筛选后特定基站在特定时刻的接入用户数,yj为输出的标量即所要预测基站在下一时刻的接入用户数,训练集的样本容量为m;希望学习到一个回归决策函数f(x)=wtφ(x)+b,其中x为函数自变量,φ(x)为输入的待确定的非线性映射,w和b是待确定的模型参数;假设能容忍f(xi)与yi之间最多有ε的偏差,即仅当偏差大于ε时才计算损失;引入松弛变量ξi+,ξi-,svr问题形式为:

其中c为正则化常数,引入拉格朗日乘子α,μ,得到拉格朗日函数:

对w,b,ξi-的偏导为零得到:

c=αi+μi

svr的解形如

其中核函数k(xi,x)=φ(xi)tφ(x)表示经过非线性映射时候的点积,最后构造回归决策函数

步骤五,对相邻小区的频带自行按各相邻小区预测得到接入用户数的比例进行调节;

步骤六,对于接入同一小区的用户按现有的资源分配方法进行资源分配。

进一步的,所述步骤一中三种场景具体包括:

场景一:用户在工作时间段接入,在非工作时间段切出;

场景二:用户在早晚高峰的时刻接入再切出;

场景三:用户在非工作时间段接入,在工作时间段切出。

进一步的,所述步骤四中选择径向基rbf核函数

其中σ2表示rbf核的宽度,x,z为函数自变量。

进一步的,所述步骤五中相邻小区总的频带资源取值由运营商根据网络运行情况确定。进一步的,所述步骤六中采用比例公平的调度方法分配资源,具体如下:当前小区共有k个接入用户,在当前时隙每个用户反馈一个当前信道质量所能支持的行道速率rk(t),基站记录每个用户刚过去的时间窗内tc内的平均吞吐量在时隙t,基站按照如下规则选择用户k*分配资源:一次调度完成之后,平均吞吐量按照如下方式进行更新:

与现有技术相比,本发明具有如下优点和有益效果:

本发明基于半监督分类为支持向量机回归svr(supportvectorregression)的预测提供了人数变化的历史规律信息,同时得益于随机森林的特征选择,在不降低准确性的情况下降低了svr预测的计算复杂度。本发明根据预测的用户数,实现动态调整基站资源,提高用户公平度以及平均吞吐量。

附图说明

图1为本发明提供的基于接入基站用户数变化预测的超密集网络资源分配方法流程图。

具体实施方式

以下将结合具体实施例对本发明提供的技术方案进行详细说明,应理解下述具体实施方式仅用于说明本发明而不用于限制本发明的范围。

本发明提供的一种基于接入基站用户数变化预测的超密集异构网络多小区资源分配方法,相应的用户数预测计算以及多小区之间的动态资源分配在大站中完成。如图1所示,本发明方法包括如下步骤:

步骤一:半监督分类,识别基站的“潮汐”效应场景:

首先,对每个基站接入人数数据半小时采样一次,得到基站一天的用户数随时间变化的序列。该序列为一个48维的向量,记为xi=(xi(1),xi(2),...,xi(48))。用户数序列根据不同的变化规律,可对应三种不同的典型“潮汐”效应场景,具体如下:

场景一:用户在工作时间段接入,在非工作时间段切出。如商业工作区、校园教学区,该场景主要特点为:用户数量在每天的9点至17点高于其它时间段;

场景二:用户在早晚高峰的时刻接入再切出。如高速公路,该场景主要特点为:接入用户数量在每天的7点至9点以及17点至19点高于其它时间段;

场景三:用户在非工作时间段接入,在工作时间段切出。如大型住宅小区、校园宿舍区,该场景主要特点为:接入用户数量在每日19点至次日7点高于其它时间段。

对于同一大站下的n个小站,随机选择nr个小站,再分别通过对其中每个基站抽取近5天(具体天数可以根据需要修改)的用户数序列xa,xb,xc,xd,xe。令为基站一天在第j个时刻采样得到的接入用户数,得到序列根据上述规律,标注序列xi所对应的“潮汐”效应场景ei∈{1,2,3},同时放入已标注样本集合l={(xi,ei)},i={(xi,ei)},其它的样本放入未标注样本集合u={(xj)}。其中xi为基站接入用户数的序列,ei为不同“潮汐”效应场景的分类标号。这里已标注样本集合l,i是半监督分类的初始化。

接着,选择余弦相似来度量不同基站接入用户数的序列xi,xj(i,j=1,2,...,n,i≠j)之间的距离distance(xi,xj),即单位化的向量点积的倒数:

最后,对样本进行自训练(self-training)半监督分类:

1)用已标注样本集合l生成分类策略f:对于任意一个输入xj,确定其中xl∈l,则输入xj对应的分类为xl所对应的分类el,即f(xj)=el;

2)选择xu=argmindistance(xu,xl),其中xu∈u,xl∈l;

3)用f对于xu分类,并且把(xu,f(xu))加入到l中;

4)重复上述步骤直到未标注样本集合u为空集。

故对于任意基站a,通过上述分类方法,可得到所对应的”潮汐”效应场景e。

步骤二,构造高维输入特征:

在时刻t,预测目标基站a在时刻t+1的接入用户数ya,t,其中基站a所对应的”潮汐”效应场景为e。用于预测的输入包含以下两个方面:

1)上述步骤一中,对于通过半监督学习初始化得到集合i={(xi,ei)},构造新的集合inew={xi|ei=e,(xi,ei)∈i}。inew的容量为inew,其中的元素均为48维的向量得到其中mod(a,b)表示a对b取模。由此得到的新的inew个向量,构成新的48inew维向量

2)同一个大站覆盖下的所有小站为的前ts个时刻点的接入用户数序列为b为同一大站下小站的个数,对于每一个小站接入用户数序列均为ts维的向量,故这些向量一共构成新的bts维向量

由此,在时刻t预测目标基站a在时刻t+1的接入人数ya,t,则构造对应48inew+bts维输入(这里的xa′,t为用于预测接入人数ya,t的输入,其中包含相邻小站短时间的变化状态,也包含潮汐场景的变化规律)

步骤三,由步骤二得到的输入为包含高维特征的向量x′a,t,其对应输出ya,t为目标基站a下一时刻t+1的接入用户数,这里分别记为其中n=bts+48inew,构成初始训练集{(xt,yt)}。利用随机森林进行特征筛选:

首先,对样本容量为m的初始训练集{(xt,yt)},进行有放回随机抽样m次,得到1个样本容量为m的采样集;初始训练集有的样本在新得到的采样集中从未出现,将这些从未出现过的样本称为袋外数据oob(outofbag);依此采样得到t个样本容量为m的采样集。

然后,基于上述得到的每个采样集分别独立训练一个基学习器—分类回归决策树cart(classificationandregressiontree)。给定训练集d={(x1,y1),(x2,y2),...,(xm,ym)},其中xi=(xi(1),xi(2),...,xi(n))与yi分别为包含高维特征的输入和一维输出,yi表示预测的输出,即为下一个时刻的接入用户数。在训练数据集所在的输入空间,递归地基于一个特征xi(j)将每个区域划分为两个子区域r1,r2,并给定每个子区域上的输出值,构建二叉决策树:

1)根据下式选择最优切分特征j与切分点s:

遍历特征j,对于固定的切分特征j扫描切分点s,选择使(2)达到最小值的(j,s)。

2)用选定的(j,s)划分区域并决定相应的输出其中avg(a)表示对集合a中的元素取

均值:

r1(j,s)={xi|xi(j)≤s},r2(j,s)={xi|xi(j)>s}

对于区域rt上相应的输出是rt上所有输入样本xi所对应输出yi的均值。

3)继续对两个子区域r1,r2调用步骤1)和2)生成决策树。

接着,计算每一个特征xj(i)的重要性importance(i):对于这些已经训练好的每一个cart选择相应的oob计算袋外数据误差,记为erroob1;随机对oob所有样本的特征xj(i)加入噪声干扰再次计算袋外数据误差,记为erroob2;随机森林中有t棵树,则特征xj(i)的重要性为importance(i)=∑(erroob2-erroob1)/t。

最后,将特征根据得到的特征重要性importance(i)降序排序,选取前k个特征,构造新的输入x′j,对应输出仍为yj。

步骤四:根据随机森林特征筛选得到新的包含k维特征的输入x′j记为xj,使用svr预测下一时刻接入目标基站用户数量yj。具体如下:

训练集d={(x1,y1),(x2,y2),...,(xm,ym)},其中xj=(xj(1),xj(2),...xj(k))为高维输入,即为特征筛选后特定基站在特定时刻的接入用户数,yj为输出的标量即所要预测基站在下一时刻的接入用户数,训练集的样本容量为m。希望学习到一个回归决策函数f(x)=wtφ(x)+b,其中x为函数自变量,φ(x)为输入的待确定的非线性映射,w和b是待确定的模型参数。假设能容忍f(xi)与yi之间最多有ε的偏差,即仅当偏差大于ε时才计算损失;引入松弛变量ξi+,ξi-,svr问题形式为:

其中c为正则化常数,引入拉格朗日乘子α,μ,得到拉格朗日函数:

对w,b,ξi-的偏导为零得到:

c=αi+μi

svr的解形如

其中核函数k(xi,x)=φ(xi)tφ(x)表示经过非线性映射时候的点积,这里选择径向基rbf(radialbasisfunction)核函数,该核函数可以映射到无穷维空间,而其他核函数如线性核、多项式核只能映射到有限维空间)

其中σ2表示rbf核的宽度,x,z为函数自变量。最后构造回归决策函数

步骤五,对相邻小区的频带自行按各相邻小区预测得到接入用户数的比例进行调节,相邻小区总的频带资源取值可由运营商根据网络运行情况自行确定。

步骤六,对于接入同一小区的用户按现有的资源分配方法(步骤五)进行资源分配,例如比例公平的调度方法分配资源,具体如下:当前小区共有k个接入用户,在当前时隙每个用户反馈一个当前信道质量所能支持的行道速率rk(t),基站记录每个用户刚过去的时间窗内tc内的平均吞吐量在时隙t,基站按照如下规则选择用户k*分配资源:一次调度完成之后,平均吞吐量按照如下方式进行更新:

本发明方案所公开的技术手段不仅限于上述实施方式所公开的技术手段,还包括由以上技术特征任意组合所组成的技术方案。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1