本发明属于网络通信技术领域,涉及基于大数据分析的小基站开关控制方法。
背景技术:
在宏站覆盖范围内同频密集部署低功率小站的超密集异构网络是一种提升无线网络频谱利用率和网络容量的有效方法。但由于待服务的终端在空间上分布不均,在某一时刻,一个地区内的某些小基站满负荷运转,而有些小基站空载,这造成了处理资源的浪费。另一方面,小区中的用户分布存在潮汐效应。所以,如果能事先预测出小基站未来的服务人数,就可以适时地开启/关闭小基站,从而达到,节能、减少基站间干扰等目的。当前现有技术还无法实现这一点。
技术实现要素:
为解决上述问题,本发明公开了一种基于大数据分析的小基站开关控制方法,能够预测小基站未来服务人数,并据此开启/关闭小基站。在一些特殊场景,如飞机场、火车站等场景下,人流的潮汐效应更加明显:在火车/飞机到来前,站台往往汇聚大量服务人群,而离去时往往带离大量服务人群。和一般场景不同的是,在飞机场、火车站场景下,由于飞机/火车到达和离开的时刻是由时刻表预先规定好的,所以人群的到来和离去的大体情况也是可以预先获知的。本发明即可利用特殊场景下时刻表以及小基站接入人数的历史记录,建立数学模型,预测未来小基站内的待服务人数,根据待服务人数去控制小基站的开关。
为了达到上述目的,本发明提供如下技术方案:
基于大数据分析的小基站开关控制方法,包括如下步骤:
步骤1:采集场景信息
所述场景信息包括两部分的信息:
第一部分信息是小基站内接入人数的信息,定期采样一次,记录各个时刻的基站接入人数,放入样本集合l={(xi,yi)},其中xi为记录数据的时刻,yi为xi时刻小基站接入的人数;
第二部分是场景中时刻表所记录的人群到来的时刻和人数,放入样本集合m={(ti,pi)},其中ti为人群到来的时刻,pi为到来的人数;
步骤2:数据预处理
去除集合l和m中的重复数据、异常值和空值;
步骤3:提取特征
为每个样本提取12个特征,将结合集合l和集合m,生成一个新的集合g={(fi,n,li)},其中,fi,n表示集合g中的第i个样本的第n个特征,1≤n≤12,对应着模型的输入,li表示集合g中第i个样本的标签,取值为1或0,1代表基站开启,0代表基站关闭,对应着模型的输出;
计算集合g中的fi,n:
首先,在集合l中选取第i个样本(xi,yi),然后在集合m中生成样本子集msub={(tm,pm)},其中tm满足tm-xi>(n-1)t且tm-xi<nt,t为设定好的时间间隔,最后,fi,n由式
计算集合g中li:
在集合l中选取第i个样本(xi,yi):
上式中,k是控制基站开关的阈值,将集合g={(fi,n,li)}统一用g={(fi,li)}表示,其中fi集合g中fi,n的向量形式;
步骤4:选择并训练模型
选择二项逻辑斯蒂回归模型,二项逻辑斯蒂回归模型是如下的条件概率分布:
p(yout=0|xin)=1-p(yout=1|xin)(3)
上式中,xin是输入,是集合g中样本的特征,yout是输出,是模型预测的小基站的开关状态,1代表基站开启,0代表基站关闭,w∈rn和b∈r是参数,w称为权值向量,b称为偏置,w·xin为w和xin的內积;给定一个样本特征xin,按照式(2)和式(3)可以求得p(yout=1|xin)和p(yout=0|xin);逻辑斯蒂回归比较两个条件概率值的大小,将特征xin分到概率较大的那一类;
训练模型,利用集合g中的数据得到模型中参数w和b的值;
步骤5:预测
搜集时刻表的数据样本m,再按照步骤3,生成该时刻的特征,将生成的特征输入模型,即可预测时刻t的基站开关状态。
进一步的,所述步骤2中去除异常值的过程如下:
在集合l中,若yi<0或yi>pmax1,pmax1表示正常情况下,采样得到的人数的最大值,,则该样本属于异常值,应从集合l中去除样本(xi,yi);集合m中,若pi<0或pi>pmax2,pmax2表示正常情况下,即将到来的人群的最大人数,则该样本属于异常值,应从集合m中去除样本(ti,pi)。
进一步的,所述步骤4中选择极大似然估计法估计模型参数,步骤如下:
步骤4-1,设:
p(yout=1|xin=fi)=h(fi)(4)
p(yout=0|xin=fi)=1-h(fi)(5)
则整个样本集g的似然函数为:
步骤4-2,整个样本集g的对数似然函数为:
步骤4-3,将式(2)、(3)、(4)、(5)代入式(7)中可得:
步骤4-4,求得参数w,b:
步骤4-5,使用随机梯度下降法求得式(9)的解。
与现有技术相比,本发明具有如下优点和有益效果:
本发明能够事先预测出小基站未来的服务人数,从而能够适时地开启/关闭小基站,达到节能、减少基站间干扰的目的。在建立数学模型的过程中,本方法结合数据挖掘和机器学习,提高了预测的准确率和系统的实用性。
附图说明
图1为本发明提供的基于大数据分析的小基站开关控制方法流程图。
具体实施方式
以下将结合具体实施例对本发明提供的技术方案进行详细说明,应理解下述具体实施方式仅用于说明本发明而不用于限制本发明的范围。
本发明提供的基于大数据分析的小基站开关控制方法,如图1所示,包括如下步骤:
步骤1:采集场景信息。场景信息主要包括两部分的信息:第一部分信息是小基站内接入人数的信息,每一分钟采样一次(采样频率可根据需要改变),记录各个时刻的基站接入人数,放入样本集合l={(xi,yi)},其中xi为记录数据的时刻,时刻精确到分钟,yi为xi时刻小基站接入的人数。第二部分是场景中时刻表所记录的人群到来的时刻和人数,放入样本集合m={(ti,pi)},其中ti为人群到来的时刻,时刻精确到分钟,pi为到来的人数。
步骤2:数据预处理。数据中往往会有数据空值、异常值、数据重复等问题,这些问题会降低模型的精确度,因此,需要进行必要的处理,以保证数据的可靠性,从而建立出精确的模型。
处理方法如下:
1、对重复数据的处理。在集合l中,若xi=xj,yi=yj,则在l中去除样本(xj,yj),保留(xi,yi)。同理,在集合m中,若ti=tj,pi=pj,则在m中去除样本(ti,pi),保留(ti,pi)。
2、对异常值的处理。在集合l中,若yi<0或yi>pmax1(pmax1表示正常情况下,采样得到的人数的最大值,该值可由运营商根据网络运行情况自行确定),则该样本属于异常值,应从集合l中去除样本(xi,yi);集合m中,若pi<0或pi>pmax2(pmax2表示正常情况下,即将到来的人群的最大人数,该值可由运营商根据网络运行情况自行确定),则该样本属于异常值,应从集合m中去除样本(ti,pi)。
3、对空值的处理。在集合l和m中,若发现某一样本中任意数值为空,即从集合中去除该样本。
步骤3:提取特征。提取特征是利用机器学习方法建模的最关键一步。我们为每个样本提取12个特征,这些特征的提取直接关系到最后结果的好坏。在本步骤中,我们将结合集合l和集合m,生成一个新的集合g={(fi,n,li)}。其中,fi,n表示集合g中的第i个样本的第n个特征(模型共有12个特征,所以1≤n≤12),对应着模型的输入,li表示集合g中第i个样本的标签,取值为1或0,1代表基站开启,0代表基站关闭,对应着模型的输出。
计算集合g中的fi,n的步骤如下:
首先,在集合l中选取第i个样本(xi,yi)。然后在集合m中生成样本子集msub={(tm,pm)},其中tm满足tm-xi>(n-1)t且tm-xi<nt(t为设定好的时间间隔,该值可由运营商根据网络运行情况自行确定)。最后,fi,n由式
计算集合g中li的步骤如下:
在集合l中选取第i个样本(xi,yi)。
k是控制基站开关的阈值,该值可由运营商根据网络运行情况自行确定。为方便表示,下文中集合g={(fi,n,li)}统一用g={(fi,li)}表示,其中fi集合g中fi,n的向量形式。
步骤4:选择并训练模型。可采用二项逻辑斯蒂回归模型作为本方法的模型。二项逻辑斯蒂回归模型是如下的条件概率分布:
p(yout=0|xin)=1-p(yout=1|xin)(3)
这里xin是输入,是集合g中样本的特征,yout是输出,是模型预测的小基站的开关状态(1代表基站开启,0代表基站关闭),w∈rn和b∈r是参数,w称为权值向量,b称为偏置,w·xin为w和xin的內积。给定一个样本特征xin,按照式(2)和式(3)可以求得p(yout=1|xin)和p(yout=0|xin)。逻辑斯蒂回归比较两个条件概率值的大小,将特征xin分到概率较大的那一类。整个模型的作用即通过输入特征值,预测小基站的开关状态。
训练模型就是要利用集合g中的数据得到模型中参数w和b的值,可选择极大似然估计法来估计模型参数。步骤如下:
1.设:
p(yout=1|xin=fi)=h(fi)(4)
p(yout=0|xin=fi)=1-h(fi)(5)
则整个样本集g的似然函数为:
2.整个样本集g的对数似然函数为:
3.将式(2)、(3)、(4)、(5)代入式(7)中可得:
4.求得参数w,b:
5.使用随机梯度下降法求得式(9)的解。
步骤5:预测。若需要预测时刻t的基站开关状态,只需按照步骤1,搜集时刻表的数据样本m,再按照步骤3,生成该时刻的特征,将生成的特征输入模型,即可得到结果。
本发明方案所公开的技术手段不仅限于上述实施方式所公开的技术手段,还包括由以上技术特征任意组合所组成的技术方案。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。