一种基于用户群体聚集行为模型进行节能的方法与流程

文档序号:20840693发布日期:2020-05-22 17:27阅读:273来源:国知局
一种基于用户群体聚集行为模型进行节能的方法与流程

本发明涉及一种基于用户群体聚集行为模型进行节能的方法。



背景技术:

蜂窝网络又叫移动网络,蜂窝网络主要是以以下三部分组成:移动站,基站子系统,网络子系统。复杂的业务特性和用户移动行为在时域、空域和时空分布都有着以群体聚集的特征。以往资源的分配方式主要是以静态、孤岛的方式进行网络资源配置,这样会造成极大的能源和资源的浪费。在研究用户群体聚集行为的前提首先基于对实际运营的蜂窝移动通信系统的数据进行采集和测量,然后对数据从多维度多方面的进行深入的研究,得到基站流量在时域、空域和时-空分布的规律,得到基站流量在空-时分布模型,该模型的准确度可以达到93%以上。

业务以及用户行为的分布规律研究:

(1)针对时间维度上的研究。业务在时间维度上呈现出自相似性,即观察任意一段时间内到达的业务所得到的规律与观察所有时间所得到的总体规律一致。即业务的长相关性。业务的长尾分布。业务的不均匀性在业务概率的分布是不均匀的,呈现长尾概率分布,长尾概率分布是描述不均匀分布的一种经典分布,长尾分布主要是指分布函数以自变量的负数次幂速率衰减。提出了weibull分布来刻画业务的分布。

(2)空间维度模型研究。得出在移动蜂窝网络中,业务量在空间上呈正态分布性,能够体现出业务在空间上具有分布相关性。研究业务在空间的不均匀性,首次对空间进行大致的划分,然后对划分出来的空间进行二次划分。每次划分都是进行等面积的划分,停止划分的前条件为每个区域的业务量都小于某个门限值。划分结果为业务量越高的区域,划出的小方格就越多,面积越小,划分完成后,所有这些区域的中心点都定义为业务量的需求点。通过实际的测量,可以得到固定面积区域内业务量的需求点个数是呈正太分布规律的。

(3)目前,对于网络流量的预测方法。一类是以回归预测法、队员统计方法为代表的传统时间序列预测方法。二类是以神经网络为基础的预测方法,如小波bp神经网络预测模型。

现存问题有:

(1)传统的预测模型对于线性的数据表现出很好的预测效果,但是对于非线性的网络流量数据,预测结果并不好,以神经网络为基础的预测方法,虽然预测精度比较高,但是收敛速度慢,容易陷入局部极小的缺点。

(2)在研究中对业务的不均匀性缺乏一个统一的建模方式,也没有衡量的标准对业务的各个维度上的不均匀性进行定量描述,在用户的聚集行为上也不能够定量的描述。



技术实现要素:

本发明的目的是提供一种基于用户群体聚集行为模型进行节能的方法。

为实现上述目的,本发明采用如下的技术方案:

一种基于用户群体聚集行为模型进行节能的方法,包括以下步骤:

1)划分格子;

2)利用空-时联合分布模型对格子中的单基站预测流量,根据预测的结果计算不同格子中各基站的负载总和;

3)根据不同格子中各基站的负载总和,在满足开关次数最小化,且满足基站的覆盖范围和基站的容量门限的条件下,激活基站。

本发明进一步的改进在于,步骤1)的具体过程如下:假设存在基站i和基站j,当满足下式(1)时,认为基站i和基站j被划分在同一个格子中,能够相互替代服务彼此的用户:

ri+d(i,j)≤rj,rj+d(i,j)≤ri(1)

其中,d(i,j)代表两个基站之间的距离,ri为基站i的正常通信范围,rj为基站j的正常通信范围,ri代表基站i最大的传输距离,rj代表基站j最大的传输距离;

若存在某基站不属于当前的格子,则认为属于该基站的另一个格子,并以该基站为起点,构建新的格子。

本发明进一步的改进在于,步骤2)中,空-时联合分布模型通过以下过程得到:

(1)针对空域聚类模型中峰值时刻的区域,利用时域维度聚集模型计算t时刻的平均流量m(t);

上述公式中,ak和分别代表空域聚类模型对应的幅值及相位值;a0为初始模型对应的幅值,k为时域维度聚集模型的个数;

(2)取空域聚类模型中峰值时刻的区域的经验值参数σ,根据时域维度聚集模型计算得到的t时刻的平均流量m(t),得出空-时联合分布模型参数μ(t)如下式:

其中,σ为经验值参数;

(3)根据步骤(2)中的空-时联合分布模型参数μ(t),得到基站i在t时刻的流量vi(t);

本发明进一步的改进在于,步骤(1)中,时域维度聚集模型如下:

上述公式中,其中,vi(t)为业务量,t为时刻,μ(t)为空-时联合分布模型参数,σ为经验值参数。

本发明进一步的改进在于,步骤(2)中,空域聚类模型为:

其中μ和ω分别是变量对数的平均值和标准差。

本发明进一步的改进在于,步骤2)中,对于格子gi,格子gi在某时刻t的流量vgi(t)为:

vgi(t)=v1(t)+v2(t)+...+vn(t)

其中,vn(t)代表格子gi的第n个基站在时刻t的流量值;v1(t)为表示格子gi的第1个基站在时刻t的流量值,v2(t)为格子gi的第2个基站在时刻t的流量值,vn(t)为格子gi的第n个基站在t时刻的流量值。

本发明进一步的改进在于,步骤3)中,激活基站的具体过程如下:

根据峰值时刻激活基站选择法,峰值时刻激活基站;根据空闲时刻激活基站选择法,空闲时刻激活基站;根据剩余时刻激活基站选择法,激活剩余时刻基站;其中,剩余时刻为除去峰值时刻和空闲时刻后的时刻。

本发明进一步的改进在于,根据峰值时刻激活基站选择法,峰值时刻激活基站的具体过程如下:

(1)初始化:激活基站集合

(2)对于每个格子gi执行步骤(3)~步骤(5);

(3)按照降序对格子gi中所有基站的容量进行降序排列;

(4)找到给定的格子gi对应的峰值时刻负载vmax;

(5)按照降序排列后的容量,当基站的容量c(bs1)<vmax时,按照基站容量选择激活基站,直到满足峰值时刻激活基站集合bsmax={bs1,bs2,...,bsk}。

本发明进一步的改进在于,根据空闲时刻激活基站选择法,空闲时刻激活基站的具体过程如下:

(1)初始化:bsmax;

(2)对每个格子gi执行步骤(3)~步骤(4);

(3)在24小时内,找到格子gi对应的空闲时刻的负载vmin;

(4)当基站的容量c(bs1)<vmin时,按照基站容量选择激活基站,直到满足空闲时刻激活基站集合bsmin={bs1,bs2,...,bsk}。

本发明进一步的改进在于,根据剩余时刻激活基站选择法,激活剩余时刻基站的具体过程如下:

(1)对于剩余时刻t执行步骤(2)~步骤(3);

(2)对于激活基站集合bst-1,如果满足激活基站集合bst-1中基站总的负载容量则剩余时刻t的激活集合为bst-1;其中,vt为剩余时刻容量负载;

(3)否则按照基站容量降序排序,并继续添加激活基站,直到满足得到剩余时刻t对应的激活基站集合bst,其中,k为此时激活基站集合包含的基站数目。

与现有技术相比,本发明具有的有益效果:

1.采用空-时联合分布模型可以对单基站流量进行预测,预测的效果相比传统方法更加准确。

2.由于空-时联合分布模型在各个维度上对不均匀性进行定量描述,在用户的聚集行为商业进行了定量描述,有利于得到用户聚集行为的规律,从而方便流量的预测以及基站的休眠。

3.在蜂窝网络中,采用本发明的基于单基站的流量预测利用格状基站机制建立与流量父子相匹配的机制,提高网络的能效。

进一步的,本发明通过对用户的行为以及业务的特征分别对时域、空域进行深入的研究得出空-时分布规律以及用户行为的模型,可以精准的对基站流量进行预测。

进一步的,低负载与高负载的时间点,在此基础上动态的调整基站的数,利用格状基站机能机制建立起与流量负载相匹配的运行机制,从而提高整体网络的能效。

附图说明

图1为典型场景业务空间分布模型。其中,(a)为广域覆盖场景,(b)为办公区场景,(c)为密集住宅场景,(d)为地铁场景,(e)为高速场景,(f)为体育场景。

图2为业务的量变化的周期性。

图3为不同城市不同网络制式下基站流量频域分析及时域拟合图。其中,(a)为南京,(b)为香港,(c)为江苏。

图4为公园、商业区和学校预测结果。其中,(a)为公园,(b)为商业区,(c)为学校。

图5为基站相互重叠的部署示意图。

图6为格子划分示意图。

图7为激活基站选择基本框架图。

图8为基于流量预测的格状动态基站机能机制流程图。

具体实施方式

下面结合附图对本发明进行详细描述。

本发明包括以下步骤:

1.数据源和数据预处理

数据集从2015年1月到2015年9月结束,通过对原数据集进行采集分析、处理并剔除掉无效的信息,有助于对数据分析预测。

(1).数据集的来源

数据集从2015年1月到2015年9月结束;采集的数据集包括基站基础信息和站点每日业务量,站点每日业务量包括站点名称、小区标识、经纬度和站点属性;站点每日业务量为站点名称、小区标识、时间以及下行信道资源利用率。

具体的,数据集包括两个表格,一个为基站基础信息表,表中的属性为:站点名称、小区标识、经纬度和站点属性。另一个表格为站点每日业务量表,表中的属性为站点名称、小区标识、时间(某日某小时)以及下行信道资源利用率。如表1所示。

表1数据源以及数据分析

(2).数据的异常处理

数据在采集过程中出现偏差和失误,需要对这些数据进行删除处理,有些数据存在着缺失的情况,需要对缺失的数据进行补充。将缺失的数据集补齐,可能会引入大量的噪声。而对于存在较少缺失的数据集,可与采用平均数、拉格郎日插值法来补齐这些数据。

(3).数据的归一化

数据归一化是数据挖掘的一项基础工作,通过归一化工作可以使数据处理更加敏捷。采用的归一化放法是线性归一化方法。归一化的公式为:

在基站基础信息中,各个基站的经纬度取值范围差异比较大,可以对经纬度分别进行归一处理使得属性落在[0,1]的取值范围内。

2.数据特征分析

需要从历史流量数据提取出流量特征,为流量预测做准备,流量数据呈现出一定的周期性,其中,周宇周之间的数据呈现出一定的相似性,工作日的流量高于周末的流量,这是符合商务取的人员流动规律,流量以24小时为单位的时间尺度导航呈现出一定的周期性。除此外,工业区流量同样呈现以天为单位的周期性变化规律,工作日和周末的流量存在这巨大的差距,工作日的流量接近周末的2倍,这与用户的活动规律即移动行为息息相关,会呈现出双峰特征,在上午和下午会出现两个流量高峰,流量低负载对应午休和上下班时刻呈现下降趋势。

实际蜂窝网络中的流量随时间呈现周期变化,呈现出时间分布不均匀的规律,在现有的蜂窝网络中,基站是按照峰值流量进行部署的,为基站的节能机制提供了可靠性。通过动态调整基站的工作状态,在负载较低的情况下关闭或者进如休眠的状态,从而大达到降低能耗的目的。

3.流量预测过程:

基于数据特征分析对基站的流量变化时间特性的初步研究,不同地区的流量,虽然在流量整体范围、高负载出现时刻等方面呈现不同的规律,但是整体上呈现周期性规律。然而目前蜂窝网络业务流量变化规律比较复杂,存在多个维度上的周期震荡的现象,比如会出现上班业务高峰、消遣业务高峰(如图4)等。传统的单正弦模型已经无法准确地刻画出流量的变化规律。在本发明中,利用基于正弦波叠加的空时联合分布模型来刻画流量变化规律,通过对不同基站的流量特征进行建模,更加精准地体现网络流量的变化规律。具体包括以下步骤:

3.1建立空域聚类模型

地理位置的影响,不同区域的用户会表现出不同的行为特点,导致流量在空间维度上的不均匀分布,用户的流量分布能够反应用户的行为特征。蜂窝网络的空间不均匀性可以用对数正太分布来实现。建立空域聚类模型,即标准正态分布密度函数公式:

其中μ和ω分别是变量对数的平均值和标准差。

正态曲线呈钟型,两头低,中间高,左右对称因其曲线呈钟形,因此人们又经常称之为钟形曲线。若随机变量x服从一个数学期望为μ、方差为ω^2的正态分布,记为n(μ,ω^2)。其概率密度函数为正态分布的期望值μ决定了其位置,其标准差ω决定了分布的幅度。当μ=0,ω=1时的正态分布是标准正态分布。在不同的场景下,对其业务流量进行了研究其典型值的表示如图1所示。

3.2建立时域维度聚集模型

业务的变化规律很复杂,上班业务时间高峰、休闲业务高峰和工作日高峰,因此需要对业务在不同的时间段呈现出的规律性进行建模分析。每天的业务量呈现出明显的周期现象,常用的理想正弦模型和类正弦模型均无法表达出曲线的双峰特征。所以需要对这一天的数据进行快速fourier变换,提取长主要的品店进行拟合,业务的量变化的周期性如图2所示。所以,在建模过程中要保证选取的频点使得系数在0.8以上,最终拟合得到的业务量vi(t)即时域维度聚集模型表示如下:

上述公式中,t为时刻,μ(t)为空-时联合分布模型参数,σ为经验值参数。

验证模型的准确性,选择不同的城市,不同网络制式下的基站业务流量数据用所提出的正弦波叠加模型进行分析和拟合,通过正弦波流量的拟合证明了拟合方法的准确性,图3为不同城市下的基站流量时域模型,测试证明,模型的准确性达到90%。

3.3建立空-时联合分布模型

空-时联合分布模型是为了更好地描述单基站流量的变化情况,变化的规律性,在基站的时域和空域可以分析出,多基站业务流量叠加后在时域上具有明显的周期性而单基站流量在时域上并没有明显的变化规律,它是随机的,传统的模型不能反应这种随机性,其准确性不高。对于空-时联合分布模型建模的过程如下:

(1)针对空域聚类模型中峰值时刻的区域,利用时域维度聚集模型计算t时刻的平均流量m(t);

上述公式中,ak和分别代表空域聚类模型对应的幅值及相位值,a0为初始模型对应的幅值,k为时域维度聚集模型的个数,具体取1,2,3,……。

(2)取空域聚类模型中峰值时刻的区域的经验值参数σ(长期实验验证的结果,具有一定的规律性,一般为2),根据时域维度聚集模型计算得到的t时刻的平均流量m(t),得出空-时联合分布模型参数μ(t)如下式:

其中,σ为经验值参数。

(3)根据步骤(2)中计算所得的空-时联合分布模型参数μ(t),得到基站i在t时刻的流量vi(t);

验证不同区域实际流量与模型产生的流量之间的差异。主要是公园、商业区和学校的预测,预测结果如图4所示。

根据图4的预测精度比较,可以证明空-时联合分布模型可以很好地对流量进行预测。因此,设计了基于流量预测的基站节能机制,在流量进行预测后,既保证高负载时的基站覆盖情况,又保证了低负载下关闭某些“激活基站”,以达到降低能效的同时又保证了服务质量的目的。

4.基于流量预测进行基站休眠,包括以下步骤:

4.1优化问题:

基于空-时联合分布模型对基站流量预测后,对该基站进行优化提出优化问题以及相关算法。基站优化满足以下几点:

1)、满足基站的容量,保证流量转移之后不超过基站的承载能力。

2)、满足基站的覆盖范围,不能超过基站的最大范围

3)、尽量减少基站的状态切换次数,避免经常开/关基站。

4.2进行基于流量预测的动态基站节能

基站部署如图5所示,将网络划分为不同的格子,分配在同一格子中的基站是可以相互取代,并且服务于彼此的用户。根据格子划分的结果,基于流量的预测,可以对基站不同时刻的负载情况进行激活基站的选择。参见图8,基于流量预测的动态基站节能主要分为3个过程:

1)格子的划分,格子划分的前提是不能超过基站的最大覆盖范围。具体格子划分的过程如下:

假设存在基站i和基站j,当满足下述条件即公式(1)时,可以认为基站i和基站j被划分在同一个格子中,能够相互替代服务彼此的用户:

ri+d(i,j)≤rj,rj+d(i,j)≤ri(1)

其中,d(i,j)代表两个基站之间的距离,ri为基站i的正常通信范围,rj为基站j的正常通信范围,ri代表基站i最大的传输距离,rj代表基站j最大的传输距离。

从坐标的西北角的基站开始,按照从上到下,从左到右的顺序根据公式(1)构建格子。若存在某基站不属于当前的格子,则认为属于该基站的另一个格子,并以该基站为起点,构建新的格子。

如果构建格子的顺序和方向不同,会导致最后基站划分的结果出现不同,但是不影响最终基站节能的效果。本质是因为利用了格子内部各基站的相似性。本发明中的格子的划分如图6所示。

通过合理的划分,相同格子中的基站可以相互替代,能够服务从临近基站转移来的用户,利用基站的地理位置信息和传输范围划分格子。

2)利用空-时联合分布模型对格子中的单基站进行预测,根据预测的结果计算不同格子中各基站的负载(即流量)总和;具体过程如下:

根据空-时联合分布模型对单基站进行流量预测,然后将不同格子中单基站流量预测的结果叠加,格子gi在某时刻t的流量为:

vgi(t)=v1(t)+v2(t)+...+vn(t)

上述公式中,vn(t)代表格子gi的第n个基站在时刻t的流量值;v1(t)为表示格子gi的第1个基站在时刻t的流量值,v2(t)为格子gi的第2个基站在时刻t的流量值,vn(t)为格子gi的第n个基站在t时刻的流量值。

3)根据不同格子中各基站的负载总和,进行基站激活。激活需要满足两个条件:一是开关次数最小化,二是满足基站的覆盖范围和基站的容量门限。具体过程如下:

在满足上述两个条件下,进行基站激活的具体过程如下:

根据峰值时刻激活基站选择法,峰值时刻激活基站;根据空闲时刻激活基站选择法,空闲时刻激活基站;根据剩余时刻激活基站选择法,激活剩余时刻基站;其中,剩余时刻为除去峰值时刻和空闲时刻后的时刻,剩余时刻如图7所示。

根据峰值时刻激活基站选择法,峰值时刻激活基站,具体过程如下:

(1)初始化:激活基站集合

(2)对于每个格子gi执行步骤(3)~步骤(5);

(3)按照降序对格子gi中所有基站的容量进行降序排列;

(4)找到给定的格子gi对应的峰值时刻负载vmax;

(5)按照降序排列后的容量,当基站的容量c(bs1)<vmax时,按照基站容量选择激活基站,直到满足激活基站集合bsmax={bs1,bs2,...,bsk}。

(6)输出:峰值时刻激活基站集合bsmax。

通过上述过程得到不同格子峰值对应的激活基站的集合,从而对应不同格子在峰值时刻基站消耗的功率。

根据空闲时刻激活基站选择法,空闲时刻激活基站,具体过程如下:

(1)初始化:bsmax;

(2)对每个格子gi执行步骤(3)~步骤(4);

(3)在24小时内,找到给定格子gi对应的空闲时刻的负载vmin;

(4)当基站的容量c(bs1)<vmin时,按照基站容量选择激活基站,直到满足激活激活基站集合bsmin={bs1,bs2,...,bsk}。

(5)输出:空闲时刻激活基站集合bsmin。

通过上述过程可以得到空闲时刻激活基站集合为峰值时刻基站集合的子集。

根据剩余时刻激活基站选择法,激活剩余时刻基站;其中,剩余时刻为除去峰值时刻和空闲时刻后的时刻;具体过程如下:

(1)对于剩余时刻t执行步骤(2)~步骤(3)。

(2)对于激活基站集合bst-1,如果满足激活基站集合bst-1中基站总的负载容量则剩余时刻t的激活集合为bst-1;其中,vt为剩余时刻容量负载;

(3)否则按照基站容量降序排序继续添加激活基站,直到满足k为此时激活基站集合包含的基站数目。

(4)输出:剩余时刻t对应的激活基站集合bst。

在不同的时刻可以选择上述不同的算法进行计算流量的变化。根据所得到的激活基站集合进行选择性的关闭和开启基站,完成从空闲时刻到峰值时刻流量的变化过程。

从流量先增加再减少再增加到峰值的过程,剩余时刻激站选择算法虽然不是最优的解决方案,但是考虑到尽可能的减少基站状态切换次数的限制,暂时不考虑部分基站利用不充分造成的能量消耗增加的问题。图8为基于流量预测的格状动态基站节能机制的流程图。

基于流量预测的节能机制研究是基于蜂窝网络场景下的,首先对历史流量数据进行分析,利用基于正弦波模型的空-时联合分布模型对流量进行预测。该模型能够很好的拟合流量的变化规律。又基于流量的预测,对不同基站进行格状划分,采用激活基站选择算法,前提是尽可能减少基站状态的切换次数的基础上实现了不同基站激活和休眠状态的一个过渡,从而实现节能的效果。大约可以节约66.5%的功率消耗。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1