突发负荷的预测方法及装置、存储介质、电子装置与流程

文档序号:21405799发布日期:2020-07-07 14:39阅读:184来源:国知局
突发负荷的预测方法及装置、存储介质、电子装置与流程

本发明涉及通信领域,具体而言,涉及一种突发负荷的预测方法及装置、存储介质、电子装置。



背景技术:

服务网络通常资源有限,接入节点或全网的负荷逼近甚至达到上限通常有几种情形。一种是中长期逐渐逼近容量上限,一种是中短期周期性负荷冲高,还有一种是实时突发性激增。其中,小时以上粒度的短期到长期负荷预测,一般以时间序列模型为主。而突发性负荷激增通常主要由网络用户随机行为决定,只和距发生时刻很近的时段有关,由此引起的拥塞是公开难题。

以蜂窝通信网络为例,小区负荷超过一定程度时,将会降低小区中用户的业务性能(例如出现延迟、卡顿),严重时产生拥塞导致系统基础指标急剧恶化以致用户业务无法正常进行。尤其用户密度较高的场景下,例如体育比赛、演唱会、大型集会时,如何缓解乃至避免实时拥塞,是运营商与用户的痛点。

传统方案主要有三种实现方式:

(1)按照拥塞时刻对应的用户容量进行区域规划与布置。这样在普通时段会严重降低频谱利用率并极大提高网络成本;(2)把区域内小区参数固定到“最高接入数”档位,仅保证用户的基础连接。这样会牺牲用户速率与业务种类;(3)为兼顾频谱利用率与用户体验,在用户密度很高(或称为高话务)的场景发生时,人工监控各项网络指标,根据指标是否超过预定门限来不停手动调整网络参数,然而这样的技术方案需要在现场布置很多运维人员,极大增加人工成本。

针对相关技术中,对于突发性负荷激增引起的实时拥塞,传统技术方案存在成本高等问题,尚未提出有效的技术方案。



技术实现要素:

本发明实施例提供了一种突发负荷的预测方法及装置、存储介质、电子装置,以至少解决相关技术中对于突发性负荷激增引起的实时拥塞,传统技术方案存在成本高等问题。

根据本发明的一个实施例,还提供了一种突发负荷的预测方法,包括:

采集指定区域的负载指标数据,其中,所述负载指标数据用于表征所述指定区域的负载情况;使用突发负荷模型对所述负载指标数据进行分析,预测突发负荷的发生情况,其中,所述突发负荷模型为使用多组数据通过机器学习训练出的。

根据本发明的另一个实施例,还提供了一种突发负荷的预测装置,包括:采集模块,用于采集指定区域的负载指标数据,其中,所述负载指标数据用于表征所述指定区域的负载情况;预测模块,用于使用突发负荷模型对所述负载指标数据进行分析,预测突发负荷的发生情况,其中,所述突发负荷模型为使用多组数据通过机器学习训练出的。

根据本发明的另一个实施例,还提供了一种存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行所述任一项中所述的突发负荷的预测方法。

根据本发明的另一个实施例,还提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行所述任一项中所述的突发负荷的预测方法。

通过本发明,采集指定区域的负载指标数据,其中,所述负载指标数据用于表征所述指定区域的负载情况;使用突发负荷模型对所述负载指标数据进行分析,预测突发负荷的发生情况,其中,所述突发负荷模型为使用多组数据通过机器学习训练出的,采用上述技术方案,解决了相关技术中,对于突发性负荷激增引起的实时拥塞,传统技术方案存在成本高等问题,进而能够对突发性负荷激增引起的拥塞进行处理,降低了人工成本。

附图说明

此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:

图1为根据本发明实施例的突发负荷的预测方法的流程图;

图2是根据本发明实施例的突发负荷的预测装置的结构框图;

图3是根据本发明实施例的突发负荷的预测装置的另一结构框图;

图4是根据本发明实施例的电子装置的结构框图;

图5是根据本发明实施例的系统框图;

图6为根据本发明优选实施例的整体流程图;

图7是根据本发明实施例的序列对齐搜索示意图;

图8是根据本发明实施例的边界参数示意图;

图9是根据本发明实施例的筛选等效评价指标业务的示意图;

图10是根据本发明实施例的实时拥塞自动标注的决策树方法。

具体实施方式

下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。

需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。

实施例1

本发明实施例提供了一种突发负荷的预测方法,图1为根据本发明实施例的突发负荷的预测方法的流程图,如图1所示,包括:

步骤s102,采集指定区域的负载指标数据,其中,所述负载指标数据用于表征所述指定区域的负载情况;

步骤s104,使用突发负荷模型对所述负载指标数据进行分析,预测突发负荷的发生情况,其中,所述突发负荷模型为使用多组数据通过机器学习训练出的。

通过上述步骤,采集指定区域的负载指标数据,其中,所述负载指标数据用于表征所述指定区域的负载情况;使用突发负荷模型对所述负载指标数据进行分析,预测突发负荷的发生情况,其中,所述突发负荷模型为使用多组数据通过机器学习训练出的,采用上述技术方案,解决了相关技术中,对于突发性负荷激增引起的实时拥塞,传统技术方案存在成本高等问题,进而能够对突发性负荷激增引起的拥塞进行处理,降低了人工成本。

需要说明的是,突发负荷的发生情况可以指的是突发负荷的发生时刻,突发负荷的发生时长等等和突发负荷相关的技术方案。

在本发明实施例中,使用突发负荷模型对所述负载指标数据进行分析之前,所述方法还包括:从多个突发负荷模型中选择适合所述指定区域的突发负荷模型。

在本发明实施例中,从多个突发负荷模型中选择适合所述指定区域的突发负荷模型之前,所述方法还包括:

获取基站处采集的历史数据;对所述历史数据进行预处理,得到区域全体小区数据集;从所述区域全体小区数据集中按照指定规则选择出拥塞数据集;对所述拥塞数据集进行标注,得到多个所述突发负荷模型。

在本发明实施例中,所述历史数据至少包括以下之一:负载指标数据,网络关键性能指标数据,关键服务质量指标数据,用户行为指示数据。

在本发明实施例中,所述区域全体小区数据集包括:自变量数据,因变量数据,至少通过以下方式获取所述区域全体小区数据集:获取满足预设条件的自变量数据和因变量数据,其中,所述自变量数据包括:负荷类数据,所述因变量数据与所述自变量数据存在指定函数关系。

在本发明实施例中,从所述区域全体小区数据集中按照指定规则选择出拥塞数据集,包括:根据对比检测方法对所述因变量数据与所述自变量数据进行分析;将对比检测次数满足预设次数的因变量数据作为拥塞指示指标数据;将与所述拥塞指示指标数据的关联度满足预设值的n个自变量指标数据作为所述拥塞数据集,其中,n为正整数。

更具体地,上述拥塞数据集可以通过以下方式获取:确定自变量(负荷类指标)和因变量(感知累指标);以“存在客户投诉或运维人员明确标注存在拥塞时段的场次,或全体场次中负荷指标均值、标准差都在前20%的数据。”进行学习,先确定自变量的高负荷,再通过对比检测方法,找出相关性较高的因变量指标,继而确定因变量的门限(感知指标的门限);排除总体都是低负荷、感知差时间短的小区,得到拥塞数据集。

在本发明实施例中,将与所述拥塞指示指标数据的关联度满足预设值的n个自变量指标数据作为所述拥塞数据集之后,所述方法还包括:用梯度提升决策树gbdt方法对所述第二负载指标数据进行标注,得到标注结果,其中,所述标注结果包括:第一突发等级,第二突发等级。

需要说明的是,上述突发负荷模型至少包括以下之一信息:(1)输入数据长度(或者叫观察时间窗,即基于这段时间的数据来匹配突发负荷模型,匹配上之后得到具体模型),(2)提前量,(3)突发负荷宽度(或者叫突发负荷持续时间),(4)突发负荷等级。其中,突发负荷等级至少包括:第一突发等级,第二突发等级。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。

实施例2

在本实施例中还提供了一种突发负荷的预测装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。

图2是根据本发明实施例的突发负荷的预测装置的结构框图,如图2所示,该装置包括:

采集模块20,用于采集指定区域的负载指标数据,其中,所述负载指标数据用于表征所述指定区域的负载情况;

预测模块22,用于使用突发负荷模型对所述负载指标数据进行分析,预测突发负荷的发生情况,其中,所述突发负荷模型为使用多组数据通过机器学习训练出的。

通过本发明,采集指定区域的负载指标数据,其中,所述负载指标数据用于表征所述指定区域的负载情况;使用突发负荷模型对所述负载指标数据进行分析,预测突发负荷的发生情况,其中,所述突发负荷模型为使用多组数据通过机器学习训练出的,采用上述技术方案,解决了相关技术中,对于突发性负荷激增引起的实时拥塞,传统技术方案存在成本高等问题,进而能够对突发性负荷激增引起的拥塞进行处理,降低了人工成本。

如图3所示,在本发明实施例中,所述装置还包括:选择模块24,用于从多个突发负荷模型中选择适合所述指定区域的突发负荷模型。

需要说明的是,突发负荷的发生情况可以指的是突发负荷的发生时刻,突发负荷的发生时长等等和突发负荷相关的技术方案。

在本发明实施例中,采集模块20,用于获取基站处采集的历史数据;对所述历史数据进行预处理,得到区域全体小区数据集;从所述区域全体小区数据集中按照指定规则选择出拥塞数据集;对所述拥塞数据集进行标注,得到多个所述突发负荷模型。

在本发明实施例中,所述历史数据至少包括以下之一:负载指标数据,网络关键性能指标数据,关键服务质量指标数据,用户行为指示数据。

在本发明实施例中,所述区域全体小区数据集包括:自变量数据,因变量数据,采集模块20,用于获取满足预设条件的自变量数据和因变量数据,其中,所述自变量数据包括:负荷类数据,所述因变量数据与所述自变量数据存在指定函数关系。

在本发明实施例中,选择模块24,还用于根据对比检测方法对所述因变量数据与所述自变量数据进行分析;将对比检测次数满足预设次数的因变量数据作为拥塞指示指标数据;将与所述拥塞指示指标数据的关联度满足预设值的n个自变量指标数据作为所述拥塞数据集。

更具体地,上述拥塞数据集可以通过以下方式获取:确定自变量(负荷类指标)和因变量(感知累指标);以“存在客户投诉或运维人员明确标注存在拥塞时段的场次,或全体场次中负荷指标均值、标准差都在前20%的数据。”进行学习,先确定自变量的高负荷,再通过对比检测方法,找出相关性较高的因变量指标,继而确定因变量的门限(感知指标的门限);排除总体都是低负荷、感知差时间短的小区,得到拥塞数据集。

在本发明实施例中,将与所述拥塞指示指标数据的关联度满足预设值的n个自变量指标数据作为所述拥塞数据集之后,选择模块24,还用于梯度提升决策树gbdt方法对所述第二负载指标数据进行标注,得到标注结果,其中,所述标注结果包括:第一突发等级,第二突发等级。

采用上述技术方案,克服了以下技术问题:不能自动识别拥塞高发区域、拥塞标识特征与拥塞主要原因;拥塞预测依赖于预测实时流量值,而实时流量预测与用户随机行为强相关难以准确预测或代价巨大;没有准确标注数据的方法。

实施例3

本发明实施例还提供了一种电子装置,如图4所示,包括存储器40和处理器42,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行所述任一项中所述的突发负荷的预测方法。

需要说明的是,上述实施例1-实施例3的技术方案可以结合使用,也可以单独使用,本发明实施例对此不作限定。

以下结合优选实施例对上述技术方案进行说明,但不用于限定本发明实施例的技术方案。

优选实施例1-2的技术方案主要应用于如图5所示的结构场景中,图5以长期演进(longtermevolved,简称为lte)系统为例,omc表示网管,演进型nodeb(evolvednodeb,简称为enb)表示基站,ue表示用户设备(手机、平板等);还包括:

边缘计算中心(edgecalculationunit,简称为ecu)。连接所有enb,可单独存在也可使用现有enb单板承担;负责场馆内的实时计算处理,例如在线推理、实时计数器收集、音视频辅助信息识别。

外部数据源采集单元(externalsourceunit,简称为esu)。例如摄像头、无人机、温湿度传感器等。这些外部数据若能获取,可改进场馆保障算法性能。esu单元为本发明可选项,不影响核心功能。

优选实施例1

图6为根据本发明优选实施例的整体流程图,如图6所示,包括以下步骤:

步骤s402,历史数据收集与集成,其中的实时数据(来自enb计数器)的粒度为5~15秒,本发明优选实施例中为10秒。

收集包含负荷、容量指标的数据或数据集,以及相关的系统关键性能指标用于生成评价准则。数据来源包括:网管性能统计数据、告警数据,基站实时上报的测量、计数器数据,非结构化数据(日志文件、现场监控图片视频等)。本发明中,最终用于量化处理的负荷/容量以及网络关键性能指标(keyperformanceindicator,简称为kpi)、关键服务质量指标(keyqualityindicator,简称为kqi)、用户行为指示(ubi)属于结构化的数值型数据,需要从非结构化数据中提取出负荷/容量相关的字段并转为结构化形式。其中涉及的独立子步骤(之间没有顺序要求)有:

1)无线侧前台历史数据的采集。

2)非通信系统数据的采集,例如比赛期间的看台监控视频(用于实时识别观众手机操作密度)。

步骤s404,数据健康度检验与数据规约。

对历史原始数据字段进行检验、剔除异常、补全、转换、合并、拆分、衍生等操作,生成适合量化挖掘评估体系的“特征(feature)”字段。本步骤包含系统内部数据与esu数据两方面,两者可并行没有前后顺序关系。本步骤完成后,输出预处理后的场馆全体小区数据集{celldataorigin}。

系统内部数据,本发明实施例主要使用:用户连接数、物理资源块利用率、流量字节数、邻区对切换数、无线侧传输时延、mcs等级指示、核心客户关注kpi。

外部数据(可选)。用于结合内部数据提高突发负荷或拥塞判定准确率。音视频主要用于提取观众兴奋时刻与高密度手机操作时刻信息。

步骤s406,拥塞场景自适应识别与拥塞指示指标确定方法。

输入数据集为步骤s404输出的区域全体小区数据集{celldataorigin}。核心思想描述为:用户突发性大量连接/数据业务出现,因系统设备的接纳/切换能力限制,延后一定时间才会出现某些对应网络kpi恶化。因此构成一种因果关系,自变量是负荷类指标(例如连接数、流量字节数、硬件负载率等),因变量是某些系统或网络的kpi。本步骤通过序列对比检测的方式,自变量已知的前提下可确定对应因变量,同时根据历史数据包含的信息确定延后时间的置信度范围。

拥塞体现例如:用户无法接入/收发数据,或收发速率很慢。

拥塞特征识别。引起客户体验下降的负荷突升才能算突发负荷。使用无线侧数据:存在客户投诉或运维人员明确标注存在拥塞时段的场次,或全体场次中负荷指标均值、标准差都在前20%的数据。使用序列对比检测方法。

若场馆(相当于上述实施例的指定区域)主要覆盖enb对应版本的接纳控制、负荷均衡策略算法与门限若存在重大差异,需要分成不同类别处理。

负荷类指标作为自变量组,进行归一离散化处理:高于80分位数的记录离散化为1,其余为0。

时延、信干噪比类指标作为因变量组,统计均值与标准差,将高于(均值+3*标准差)的记录离散化为1,其余为0。

对齐时间轴,对比检测自变量组与因变量组。统计因变量相对自变量延迟1~2个时间粒度、且持续超过2个粒度的次数。

选出对比检测次数最高的两个因变量指标作为无线侧拥塞指示指标。根据4),选出与拥塞指示指标差分关联最高的2个自变量负荷指标作为拥塞负荷指标。

统计所有拥塞场次的拥塞指标,将其(均值+2*标准差)定义为拥塞识别门限th_congestion。

全体历史数据拥塞场景判决。若某个场馆某场比赛小区负荷都很低(例如观众很少),则该场数据需要从训练集中排除。

可选地,无线资源控制(radioresourcecontrol,简称为rrc)连接数、物理资源块(physicalresourceblock,简称为prb)利用率、字节流量均值都低于预设门限。不同运营商对此可能有不同要求。

根据上述判决出的拥塞指标门限th_congestion,扫描全场拥塞指标门限,若拥塞总时间不到60秒,判为无拥塞场次,然后从训练数据中剔除。

得到并保存所有存在拥塞的场次历史数据{celldatacongestion}。

步骤s408,历史数据自适应标注。使用数据集为{celldatacongestion}。其中,基站软硬件版本基本一致的场馆分开进行本步骤。

根据th_congestion扫描并标注数据集中所有小区的拥塞指示指标。

记录“无线侧前台历史数据的采集”标注出的拥塞时段,对拥塞负荷指标一阶差分序列进行搜索区间个粒度内的区间扫描。只有当负荷指标处于上升趋势时才能判为突发负荷。搜索区间含义参考图8与步骤s406中对延后时间的描述。搜索区间的搜索范围根据历史数据的统计信息判定,例如95%概率落入5~35秒。

基于“非通信系统数据的采集”确定拥塞负荷指标开始上升的时刻ta。

拥塞时段的分割整理,根据场景、业务意义与历史数据统计特征确定。例如图7中,每个格子代表一个时间粒度,其中带“c”深色时段表示拥塞期。当两段拥塞间隔为1个时间粒度,将该粒度标记为拥塞,即只间隔一个时间粒度的两段拥塞认为是同一段;当两段拥塞间隔为2个或以上时间粒度时,认为是两段独立的拥塞。本子步骤可令后续的数据标注阶段更清晰,令拥塞识别率更高。

步骤s410,最佳模型参数组合自适应搜索。

模型训练的最佳边界条件需要通过自适应搜索来确定,该最佳边界组合用于逼近数据集蕴含的拥塞预测识别率的上限。基本原理为拥塞识别率上限由数据集本身蕴含的信息决定:拥塞识别率=边界条件限制下的模型函数(输入特征矩阵)。

本步骤用简单的近似方法,搜索出拥塞识别率近似上限以及对应的最佳参数组{边界条件1,边界条件2,……,边界条件n};

如图8所示,突发负荷预测模型的边界条件有4个:输入数据记录的条数(时间维度边界),突发负荷的提前量,突发负荷宽度,突发负荷等级。

通过对这4个边界参数进行穷搜或寻优,找到最适合当前业务(该业务的突发负荷或拥塞识别效果最优,等价于拥塞预测准确度最高)的边界参数组合。

步骤s412,实时拥塞识别模型训练。

输入数据为步骤s408得到的<完成标注>数据,边界参数为步骤s410得到的最优参数组合。若没有步骤s406-步骤s410,本步骤面对的情形可以理解为一个超参众多的复杂网络,运算量巨大且很难找到最优/近似最优拥塞识别率。第步骤s406-步骤s410相当于从数据空间中分离出相对独立的超参子空间(第步骤s406-步骤s408),单独寻优求解(步骤s410)。这样,本步骤只需要面对相对简单的数据空间,方便进行求解与模型训练;例如实施例1中,本步骤面对的问题已被分解为可用线性支持向量机(supportvectormachine,简称为svm)求解的简单模型。

可选地,以交叉验证方式,分割训练集与验证集,并进行模型评估与最优模型判决。突发负荷预测模型的准则(优选):结构化风险最小;对应的,模型超参主要考虑方面:收敛条件与惩罚参数,以提高泛化能力。

通过模型评估,从候选模型中选出最适合当前区域、当前业务的突发负荷预测模型,作为实时计算的应用模型。

步骤s414,实时拥塞识别模型发布。

模型训练与模型在线应用可在同一个计算节点进行,也可在不同节点进行。因此模型训练与模型应用在逻辑功能上分开,步骤s412,训练得到的模型以通用或专用格式保存,并发布/传递到在线应用的节点(ecu)。

步骤s416,实时拥塞识别模型在线应用。

将第7步得到的模型投入在线实际应用,运行在ecu。

步骤s418,实时拥塞识别在线性能监测评估。

检测在线模型对突发负荷的错判率、漏判率等,同时综合现场其他指标判断是模型原因、用户行为模式突变还是其他原因。通常,突发负荷预测还会与其他保障措施同时运行,作为网络动态参数配置的参考依据。

步骤s420,维持/关闭/重新计算。

根据步骤s418的评估结果,判决当前预测与预优化策略的维持(良好生效中)或关闭(失败)。突发负荷预测属于实时策略,需要定期纳入最新数据重新训练并评估模型。

在例如体育比赛、演唱会、大型集会期间,存在小区负荷突然激增并导致用户速率下降甚至连接中断的情形。为保障话务质量,一种解决方案为基于突发负荷预测进行执行节点的参数动态调整,在负荷到来前采取措施避免或减缓。

优选实施例2

本优选实施例2可以理解为是优选实施例1的进一步的详细技术方案。

步骤1:区域历史实时数据采集。

由网络统一运维管理中心下发采集任务到策略集中控制节点,策略集中控制节点在规定时间收集enb上报的数据,并以约定方式发送给网络统一运维管理中心。数据包括:负荷类指标、小区服务质量评价指标、基站硬件资源占用率三大类,粒度为5~20秒。本实施例的时间粒度为10秒。

步骤2:数据健康度检验与数据规约。该步骤根据规则(可结合专家接口)自动执行。

在网络统一运维管理中心进行。由于可能出现有关模块临时失效,数据传递链路拥塞、通讯失灵、解码错误等事件,所以采集到的小区级数据可能出现若干健康度问题需要根据规则库进行检验和预处理。之后根据特征生成规则,从原始数据字段产生用于后续计算的特征。

步骤3:发掘定义突发负荷的原则。

本实施例中,在网络统一运维管理中心进行。业务目标定义为:解决或缓解用户数据业务严重卡顿。表示节点负荷的数据字段有多个,而卡顿现象也与多个网络kpi/kqi有关。因此,需要找出与业务目标关系最密切的负荷指标与网络kpi/kqi。

结合现场维护优化人员的经验,生成最可能体现卡顿/下载低的等效评价指标,与每种负荷指标时序对齐后,利用关联算法(优选)检测负荷指标突增与等效评价指标变化的一致性。例如,连接数、prb利用率、流量字节数的变化趋势与趋势起止时刻对齐,可以都归为自变量。

去除业务体现不显著的负荷指标后,对剩余负荷类指标进行共线性分析,例如分层聚类(优选)、相关系数。若业务体现一般且与强业务体现负荷指标共线性,则去除这些负荷指标。本实施例中,负荷类的指标有:总流量数、数据字节数、最大rrc连接数、平均rrc连接数、单板cpu占用率、单板内存占用率、prb占用率……最终分析比较后,只需要使用rrc最大连接数、下行prb利用率作为自变量,即主成分只有2个。

在主要负荷指标突然增高或持续高峰时段,检验等效评价指标的变化一致性。如图9所示,等效卡顿/下载速率低的恶化指标作为因变量,上升尖峰需要比负荷类的自变量上升尖峰有所延迟。

本实施例中,在运营商需求区域内,经过数据分析最终用于定义突发负荷的负荷指标为:下行prb利用率为主,rrc连接数为辅(仅当rrc连接数很高);对应的小区等效评价指标为:下行pdcp包平均归一化时延,下行qpsk编码比例。

步骤4:对历史数据进行突发负荷自动标注。

在网络统一运维管理中心进行。在步骤3阶段,有部分可确认为导致小区用户感觉卡顿的“突发负荷”数据得到了标注,并分为突发等级1和突发等级2。本实施例中,结合现有门限、现有保障策略流程与人工经验,用gbdt(优选)的方式来逐步确定图10中的各门限。图10中,ddr表示下行pdcp平均时延相对比值,dpr表示下行prb利用率,rur表示rrc连接用户数占比。ddr对应指示拥塞的因变量,dpr与rur对应负荷类自变量。

最终得到的不可分数据部分为:用户数过低的小区,ca策略不合理的小区,以及enb单板超负荷的小区。

步骤5:最佳模型参数组合自适应搜索。

本实施例中,在网络统一运维管理中心进行。突发负荷预测的有效性由以下时间窗长度的组合决定:

输入数据记录的条数(时间长度);

在标注的突发负荷前多久进行预测(提前量);

标注的突发负荷持续多久;

突发负荷等级已在步骤4中结合业务规范指定,此处不再作为参数。

对于历史数据,使用svm多分类算法(优选)的分类精度评估参数组合效果,可选方法为决策树、神经网络。输入分类器的数据采集粒度为10秒间隔,时间跨度搜索范围:10秒~100秒,提前量搜索范围:10秒~60秒,突发负荷持续长度搜索范围:10秒~200秒,以输入数据的采集粒度为步长(本实施例中为10秒),突发负荷相对等级范围:30%~60%。

对于当前系统设备、当前区域,得到的最优时间窗组合为:

{输入时间跨度40秒,提前量10秒,突发负荷持续长度60秒zuo}。

步骤6:突发负荷预测模型离线训练。

选择某体育馆历史比赛期间的数据,以步骤5得到的参数组合、结构性风险最小原则进行离线模型训练。算法选择3分类支持向量分类器(supportvectorclassifier,简称为svc)(优选),主要考虑现网基站单板运算能力限制,在线模型必须消耗较少资源。使用近一个月的数据,输入数据有:本小区与主要邻区的负荷及等效评价指标数据(来自步骤3)。

最终得到的模型,precision约0.8,recall约0.7,f1-measure约0.75。

步骤7:模型下发。

在该体育馆下一场比赛开始前,网络统一运维管理中心将步骤6训练出来的模型下发到策略集中控制节点。

步骤8:突发负荷预测与预优化在线执行。

本实施例中,在线模型的实时运算,以及预测出突发负荷即将到来时的对应调整策略判决,都在策略集中控制节点进行,避免消耗enb的计算能力。策略集中控制节点判决出的实时调整策略立刻下发给enb进行执行,同时监测并记录突发负荷预测错判、漏判的详细信息。

本实施例中,后续的处理措施有(优选):集中式负荷均衡、高话务参数自动调整。

步骤9:评估与后续处理。

本实施例中,评估准则有:区域频谱效率、平均时延、用户投诉率(运营商指标)。根据评估准则,综合判断突发负荷预测及后续配套措施的有效性,并以此调整优化模型训练的超参数。

综上所述,采用本发明的技术方案,达到的有益效果如下:体系架构部署灵活,资源消耗较少,兼顾现有系统与下一代网络的硬件能力;在数据与业务规则探索过程中得到的中间结果,可用于支持相同系统架构下的其他业务;可作为智能运维的整体框架,方案作为一个实施子集。本发明方案可与其他智能方法共存、共享架构且联合优化。

实施例3

本发明的实施例还提供了一种存储介质,该存储介质包括存储的程序,其中,上述程序运行时执行上述任一项的方法。

可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的程序代码:

s1,采集指定区域的负载指标数据,其中,所述负载指标数据用于表征所述指定区域的负载情况;

s2,使用突发负荷模型对所述负载指标数据进行分析,预测突发负荷的发生情况,其中,所述突发负荷模型为使用多组数据通过机器学习训练出的。

可选地,在本实施例中,上述存储介质可以包括但不限于:u盘、只读存储器(read-onlymemory,简称为rom)、随机存取存储器(randomaccessmemory,简称为ram)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

可选地,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。

显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。

以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1