本发明属于异构蜂窝网络技术领域,涉及一种异构蜂窝网络中基于半马尔科夫决策过程(semi-markovdecisionprocess,smdp)的家庭基站休眠方法。
背景技术:
近年来,信息和通信技术(informationandcommunicationstechnology,ict)的飞速发展,人们的生活发生了巨大的变化。移动通信技术已由曾经的1g、2g、3g发展到现在成熟的4g技术,而且全新的5g技术就在未来。移动通信的业务类型也在不断变化,由过去低速率的语音、短消息业务演变到现在各种各样高速率的移动数据业务。此外,随着智能手机、平板电脑和其他多媒体设备爆炸性增长,这使得通信网络的高容量化面临着巨大的挑战。同时,物联网、虚拟现实等应用的快速发展也迫切需要移动通信系统提供差异化服务。在现有的移动网络中,通过在传统宏蜂窝(macrocell)的基础上部署大量低能耗节点,如:微小区(microcell)、微微小区(picocell)、家庭基站(femtocell)等,使得网络的覆盖无处不在,这种异构蜂窝网络(heterogeneouscellularnetworks,hcns)成为了一种缓解高容量压力的有效方案。hcns在一定程度上解决了网络覆盖问题,可以为人们带来更优质的服务,然而由于大量低功率节点被大规模的引入,诸如城市大型商场、超市等地方,白天人流密集,负载量大;当夜间时,如00:00——06:00,这部分时间所有小基站的负载都较少,但是全部的基站仍然处于工作状态,消耗着大部分的能量,所以在非高峰时段我们采取休眠策略可以节省很大一部分能耗。
现有的基站休眠技术研究中,大多数是一种固定的休眠机制,如定时休眠、将没有用户或资源利用率最小的基站关闭等,而且是在一段时间内业务状况确定的情况下做的研究,并没有考虑到业务动态变化对系统状态、以及休眠机制带来的影响。此外,家庭基站休眠后,直接将其用户交于宏基站(macrobasestation,mbs),这样不仅没有充分利用家庭基站的资源,而且增大了宏基站的负载压力,并没有考虑这些用户不仅可以重新关联mbs,也可以关联剩余的处于工作状态的家庭基站的问题。
技术实现要素:
基于此,本发明的目的在于针对传统的基站休眠方法很难适应实际中基站负载动态变化的缺点,提出了一种异构蜂窝网络中基于smdp的家庭基站动态休眠方法,将家庭基站的动态开关过程建模成smdp。此外,本发明还制定了用户与基站的关联(userassociation,ua)机制,在fbs的动态休眠过程中,实时地将休眠fbs所服务的用户重新关联至可连接的fbs或mbs,有效的缓解了mbs负载压力,也进一步地降低了系统能耗。最后采用动态规划方法求取了使该smdp模型的系统收益函数最大时的休眠策略。本发明同时考虑了负载的动态变化和ua问题,相比于传统的基站休眠方法更符合实际中基站负载的动态变化的情况,也比传统的直接将休眠基站的用户关联至mbs更进一步地节省了系统能耗,缓解了mbs的负载压力。
本发明采用的技术方案是:针对大量部署热点的异构蜂窝网络,在其非高峰时段,确定ua机制,构建smdp模型,包括:定义系统状态空间
s1、制定用户关联机制,建立系统能耗模型;
s2、根据用户关联机制,建立半马尔科夫决策过程smdp模型,包括建立系统状态空间以及系统动作空间;
s3、根据系统状态空间中的当前系统状态,调整系统动作空间中的动作;得到转移后的系统状态;
s4、根据所述当前系统状态和所述转移后的系统状态以及用户关联机制,计算半马尔科夫决策过程smdp模型的系统转移概率;
s5、计算当前系统状态的系统能耗;根据所述半马尔科夫决策过程smdp模型的系统转移概率,得到转移后的系统状态的系统能耗,以两者的系统能耗之差作为系统的收益函数;
s6、当所述收益函数的值最大时,确定转移后的系统状态,从而确定系统动作空间中的动作,所述动作即为最优休眠决策。
进一步的,所述用户关联机制包括:新到达用户的关联以及家庭基站休眠后用户的关联具体包括:
所述新到达用户的关联包括:
当第j个家庭基站服务的用户数小于
所述家庭基站休眠后的用户的关联包括:
若第j个家庭基站进入了休眠模式,则将第j个家庭基站正在服务的n个用户un={u1,u2,...,un}关联到宏基站;或将第j个家庭基站正在关联的用户un={u1,u2,...,un}重新关联至覆盖un的家庭基站,若覆盖用户uq的第p个家庭基站的关联用户数没有达到负载上限,则用户uq关联至第p个家庭基站,否则用户uq关联至宏基站,uq表示第q个用户,p∈{1,2,...,k}且p≠j;q∈{1,2,...,n};k表示家庭基站总数;n表示用户总数。
进一步的,系统能耗模型包括:
其中,ptotal表示系统能耗,n0表示宏基站服务的用户数;
进一步的,建立半马尔科夫决策过程smdp模型包括:定义smdp的系统状态空间
进一步的,所述系统状态空间
s=[su,sb]
sv=[svu,svb]
其中,s表示当前系统状态;sv表示转移后的系统状态,也即是第v种转移后的系统状态;v∈{1,2,...,q};q表示可能存在的转移后的系统状态种类数。
su表示基站与用户间的当前关联状态,sb表示家庭基站的当前状态;svu表示基站与用户间的转移后关联状态;svb表示家庭基站的转移后状态;
所述su包括:su=[n0,n1,…,nj,…,nk];
所述sb包括:sb=[b1,…,bj,…,bk];
所述svu包括:svu=[nv0,nv1,…,nvj,…,nvk];
所述svb包括:sb=[bv1,…,bvj,…,bvk];
n0为宏基站当前关联的用户数;nj为第j个家庭基站当前关联的用户数,且
nv0为宏基站转移后关联的用户数;nvj为第j个家庭基站转移后关联的用户数,且
bj表示第j个家庭基站的当前状态,bj=0表示第j个家庭基站当前处于休眠状态,bj=1表示第j个家庭基站当前处于工作状态;
bvj表示第j个家庭基站转移后的状态,bvj=0表示第j个家庭基站转移后处于休眠状态,bvj=1表示第j个家庭基站转移后处于工作状态;k表示家庭基站总数。
可以理解的是,sv也可以表示当前系统状态,相应的,
进一步的,所述系统动作空间
其中,a表示动作;aj表示第j个家庭基站的动作,aj=-1表示第j个家庭基站进入休眠模式,aj=0表示第j个家庭基站保持状态不变,aj=1表示第j个家庭基站进入工作状态;如果第j个家庭基站当前处于休眠状态,即bj=0,那么第j个家庭基站不能再次进入休眠模式,此时aj≠-1;如果第j个家庭基站当前处于工作状态,即bj=1,那么第j个家庭基站不能再次进入工作模式,此时aj≠1;j∈{1,2,...,k}。
进一步的,所述系统转移概率p包括:
其中,p(sv|s,a)表示在当前系统状态s下采取动作a时的转移后的系统状态sv的概率;λi表示基站i的到达率;f(s(sb,a)=svb)表示当s(sb,a)=svb为真时,f(s(sb,a)=svb)的值为1,当s(sb,a)=svb为假时,f(s(sb,a)=svb)的值为0,也即是只有当家庭基站处于状态sb,并对家庭基站采取动作a,家庭基站的状态转移至svb,这个命题为真时,式f(s(sb,a)=svb)的值为1,否则为0;μi表示基站i的服务率;ni表示基站i关联的用户数;nu表示用户采用用户关联机制进行重关联后可能形成的关联状态的所有情况数;ei∈{0,1}k+1表示一个k+1维的单位向量,所述单位向量除了第i个元素为1外,其余都为0;u表示是所有进入睡眠的基站对应用户重新关联的向量统计;nvj=0|aj=-1表示第j个家庭基站进入休眠模式下第j个家庭基站状态转移后的关联用户数为0;i∈{0,1,...,k};基站0表示宏基站,基站1到基站k分别表示第1个家庭基站到第k个家庭基站;τ(s,a)表示在当前系统状态s下采取动作a时的平均驻留时间。
进一步的,所述在当前系统状态s下采取动作a时的平均驻留时间包括:
其中,λ0表示宏基站的到达率;μ0表示宏基站的服务率;λj表示第j个家庭基站的到达率;lj表示aj和bj的状态函数,bj=0且aj=1时或者bj=1且aj=0时,lj=1;bj=0且aj=0时或者bj=1且aj=-1时,lj=0。
进一步的,所述系统的收益函数r表示为:
其中,r(s,a)表示在当前系统状态s下采取动作a时的系统的收益函数;δp(s,a)表示在当前系统状态s下采取动作a的系统总收益;
进一步的,所述s6求解最优休眠决策包括:根据动态规划方法求取所述系统的收益函数最大的策略πt*(s),获得家庭基站的最优休眠策略;
所述收益函数最大的策略πt*(s)包括:
其中,
本发明的有益效果:本发明不仅考虑了基站业务随时间的动态变化特性,使家庭基站的开关决策根据实时业务的状态变化,不拘泥于固定模式的静态休眠方法;同时对基站休眠后的用户采用基于本发明的用户关联机制,相比于传统的基站休眠方法更符合实际中基站负载的动态变化的情况,不仅充分利用了家庭基站的资源,缓解了宏基站的负载压力,同时也更好地降低了系统能耗。
附图说明
图1为本发明的两层macro-femto异构网络环境模型图;
图2为本发明异构蜂窝网络中基于smdp的家庭基站休眠方法流程图;
图3为本发明的值迭代算法流程图;
图4为本发明的系统的收益函数分析图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图和具体实例对本发明的实施作具体描述。
本发明的实施例采用的是macro-femto异构网络;首先建立的macro-femto异构网络,如图1所示,区域中心部署着一个mbs,本发明研究的系统区域a内部署着k个fbs。规定mbs一直处于工作模式(activemode),以便有效的覆盖。而每个fbs有两种模式:工作模式和休眠模式(sleepmode)。所有的fbs均处于开放接入控制(openaccess),即当fbs处于工作模式时,它服务范围内的移动用户均可接入。所有的基站由一个管理中心(managementcentre,mc)通过有线宽带连接进行控制管理。mc控制用户关联,并对所有的fbs进行休眠管理。用下脚标“0”代表对mbs的索引,对k个不同的fbs的索引集合设为
本发明的采用的方案包括以下步骤,如图2所示:
s1、制定用户关联机制,建立系统能耗模型;
s2、根据用户关联机制,建立半马尔科夫决策过程smdp模型,包括建立系统状态空间以及系统动作空间;
s3、根据系统状态空间中的当前系统状态,调整系统动作空间中的动作;得到转移后的系统状态;
s4、根据所述当前系统状态和所述转移后的系统状态以及用户关联机制,计算半马尔科夫决策过程smdp模型的系统转移概率;
s5、计算当前系统状态的系统能耗;根据所述半马尔科夫决策过程smdp模型的系统转移概率,得到转移后的系统状态的系统能耗,以两者的系统能耗之差作为系统的收益函数;
s6、当所述收益函数的值最大时,确定转移后的系统状态,从而确定系统动作空间中的动作,所述动作即为最优休眠决策。
本实施例制定的系统用户关联机制:
本发明的用户关联(userassociated,ua)分为两种情形:
a)新到达用户的关联
本发明中,考虑到基站业务随时间变化的动态特性,假设每个基站用户的到达和离开均服从泊松分布,则对于宏基站服务的用户,到达率为λ0,离开率为μ0。对于第j个家庭基站服务的用户,到达率为λj,离开率为μj。由于家庭基站有一定的容量限制且家庭基站的状态不唯一,当第j个家庭基站服务的用户数小于
b)家庭基站休眠后其用户的关联
若设第j个家庭基站进入了休眠模式,则第j个家庭基站原来正在服务的un个用户(为方便描述,其集合设为un={u1,u2,...,un})可以关联到宏基站,也可以将第j个家庭基站正在关联的用户un={u1,u2,...,un}重新关联至覆盖un的家庭基站。对于un中的某个用户uq,覆盖其的第q个家庭基站的服务用户数没有达到负载上限,则用户uq关联至第q个家庭基站,否则用户uq关联至宏基站;q∈{1,2,...,k}且q≠j;k表示家庭基站总数。
进而确定整个系统能耗。由于宏基站一直处于工作模式,所以宏基站的能耗设定如下:
则系统的能耗计算如下:
s2、根据用户关联机制,建立半马尔科夫决策过程smdp模型,包括建立系统状态空间以及系统动作空间:
1、定义smdp的系统状态空间
对于整个异构蜂窝网络,当前的用户的状态可以表示如下:
su=[n0,n1,…,nj,…,nk](4)
su基站与用户间的当前关联状态;n0为宏基站当前关联的用户数,也即是宏基站当前服务的用户数;nj为第j个家庭基站当前关联的用户数,且
此外,bj表示第j个家庭基站的当前状态,bj=0表示第j个家庭基站当前处于休眠状态,bj=1表示第j个家庭基站当前处于工作状态,则系统空间中所有家庭基站的当前状态表示为:
sb=[b1,…,bj,…,bk](5)
其中,sb表示家庭基站的当前状态;当前系统状态可以表示为公式(6):
s=[su,sb](6)
同理,转移后的系统状态表示为:sv=[svu,svb];
svu表示基站与用户间的转移后关联状态;svb表示家庭基站的转移后状态;所述svu包括:svu=[nv0,nv1,…,nvj,…,nvk];所述svb包括:sb=[bv1,…,bvj,…,bvk];
n0为宏基站当前关联的用户数;nj为第j个家庭基站当前关联的用户数,且
nv0为宏基站转移后关联的用户数;nvj为第j个家庭基站转移后关联的用户数,且
bj表示第j个家庭基站的当前状态,bj=0表示第j个家庭基站当前处于休眠状态,bj=1表示第j个家庭基站当前处于工作状态;
bvj表示第j个家庭基站转移后的状态,bvj=0表示第j个家庭基站转移后处于休眠状态,bvj=1表示第j个家庭基站转移后处于工作状态;k表示家庭基站总数。
因此,本发明的系统状态空间
其中,s表示当前系统状态;sv表示转移后的系统状态,也即是第v种转移后的系统状态;v∈{1,2,...,q};q表示可能存在的转移后的系统状态种类数。
2、定义smdp的系统动作空间
当系统中有用户到达或离开的时刻(设为t也即是当前时刻),当前系统状态s就会发生变化,需要在时刻t采取行动a,随后系统状态发生变化,变成转移后的系统状态sv。而后的时段(t,t+1),系统状态保持不变,直到有用户到达或离开发生时刻(设为t+1),再采取新的行动。
因此,在时刻t采取的行动a,定义为对家庭基站的状态控制决策,包括休眠家庭基站,唤醒家庭基站,以及维持家庭基站状态,具体如下:
a=[a1,…,aj,…,ak]∈{-1,0,1}k(8)
其中任意的aj,表示对第j个家庭基站的行为控制决策,其取值含义为:aj=-1表示第j个家庭基站进入休眠模式;aj=0表示第j个家庭基站保持状态不变;aj=1表示第j个家庭基站进入工作状态。
所以对于当前系统状态s,
其中,aj表示j个家庭基站的动作,aj=-1表示第j个家庭基站进入休眠模式,aj=0表示第j个家庭基站保持状态不变,aj=1表示第j个家庭基站进入工作状态;如果第j个家庭基站当前处于休眠状态,即bj=0,那么第j个家庭基站不能再次进入休眠模式,此时aj≠-1;如果第j个家庭基站当前处于工作状态,即bj=1,那么第j个家庭基站不能再次进入工作模式,此时aj≠1;j∈{1,2,...,m}。
3、获取smdp的系统转移概率p
对于本发明的系统状态空间而言,当任意某基站有用户到达或离开的时候都会引起基站与用户的状态发生改变,因此当前系统状态的平均驻留时间为:
其中lj是关于aj和bj的函数,具体如式(9):
当第j个家庭基站处于休眠模式时,第j个家庭基站不能再关联新用户,也没有服务任何用户,因此第j个家庭基站所对应的用户的到达率和离开率均为零。从上两式可以看出τ(s,a)都是在网络某一时刻的状态
根据本发明的网络环境,综合用户的到达离开、逗留时间、休眠决策、用户的重关联等参数,可得到系统的系统转移概率p(sv|s,a)∈p如公式(12):
系统状态的变化不仅包括网络中用户状态的和家庭基站状态的变化两部分,因此加入式f(s(sb,a)=svb)才能体现整个网络的变化过程。f(q)表示当q为真时,f(q)的值为1;当q为假时,f(q)的值为0。所以,只有当家庭基站处于状态sb,并对家庭基站采取行为a,家庭基站的状态转移至svb,这个命题为真时,式f(s(sb,a)=svb)的值为1,否则为0。式中ei∈{0,1}k+1表示一个k+1维的单位向量,该向量除了第i个元素为1外,其余都为0。
家庭基站进入休眠后,对该家庭基站的用户采用本发明的ua机制,可以得到用户进行重新关联后的情况,通过统计可得到:
因为用户的到达离开不可能在相同的时刻发生,且在很短的时间内不能同时到达两个及以上的用户,所以在某一时刻系统转移概率p(sv|s,a)只能是式中的一种。
4、获取系统的收益函数r
根据网络环境,本发明把由当前状态s采取动作a直到转移到另一状态sv这段时间内所能节省的系统能耗作为本发明的系统的收益函数。
对于宏基站而言,因为宏基站一直处于工作模式,而由于某些家庭基站可能被关闭,则家庭基站中的部分用户可能会转移至宏基站中进行服务,因此这部分收益为负值,且可定义如下式,其中n0为在当前系统状态s时mbs服务的用户数,nv0表示当前系统状态s时采取动作a转移到sv时宏基站服务的用户数:
其中,
1)aj=1,即第j个家庭基站由休眠模式进入工作模式,则对于这些家庭基站带来的收益定义如下:
2)aj=0,即第j个家庭基站保持状态不变,若其在状态s时已处于休眠模式,则采取动作aj=0后,其不会产生能耗差;若其在状态s时是处于工作模式的,则采取动作aj=0后,可能由于某些家庭基站的关闭导致部分用户转移到该基站上,因此这部分收益定义如下:
3)aj=-1,即第j个家庭基站由工作模式进入休眠模式,则对于这些家庭基站带来的收益定义如下:
所以在状态s下采取动作a的系统总收益为:δp=δp0+δp1+δp2+δp3。为获得连续时间下的收益模型,本发明中,两个决策点之间(当前系统状态与转移后系统状态分别对应的时间点,也即是t时刻与t+1时刻)的驻留时间是服从参数为γ(s,a)=τ(s,a)-1的指数分布的,即f(t|s,a)=1-e-γ(s,a)t,t>0,由于在两个决策点之间的基站与用户的状态不会改变,所以可获得连续时间下的折扣收益模型为:
其中,α是连续时间下的折扣收益因子,运用马尔可夫决策过程的折扣收益模型,那么状态s下的最大长期收益为:
其中η为折扣收益因子,
其中,
至此,本发明中该实例的整个smdp模型构建完毕。再采用如图3所示的值迭代算法可以求解得到最优休眠策略πt*(s),可以看出根据smdp模型的系统系统状态空间
为了进一步说明本发明所述方法的有效性,图4为matlab环境下本发明与现有技术系统收益随着到达率变化的对比仿真图。仿真主要参数设置如下,系统有两个家庭基站处于宏基站覆盖范围下,
本发明充分考虑了基站端业务量的动态变化,使用smdp模型建模成动态fbs休眠策略,相比模式固定的静态休眠方法更实用有效;此外,对于基站休眠后用户的重关联问题采用本发明的ua机制进行处理,使之充分利用fbs的资源,减轻mbs负载压力,降低系统能耗。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:rom、ram、磁盘或光盘等。
以上所举实施例,对本发明的目的、技术方案和优点进行了进一步的详细说明,所应理解的是,以上所举实施例仅为本发明的优选实施方式而已,并不用以限制本发明,凡在本发明的精神和原则之内对本发明所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。