基于多图卷积网络的基站KPI预测的制作方法

文档序号:33269777发布日期:2023-02-24 16:56阅读:74来源:国知局
基于多图卷积网络的基站KPI预测的制作方法
基于多图卷积网络的基站kpi预测
技术领域
1.本公开总体上涉及移动通信领域与人工智能领域,更具体地,涉及基于多图卷积网络的基站kpi预测方法、装置、存储介质以及计算机程序产品。


背景技术:

2.随着5g技术的发展,5g基站得到广泛部署,但是5g基站的能耗相比4g更大,因此对于节能的需求更为迫切。人工智能已经越来越多地被应用以实现全自动节能。
3.当前5g还在使用初期,一方面,用户数量处于逐步增长的过程,因此一部分5g基站会出现大量空闲时间,可节能的空间很大;另一方面,发展初期的基站整体利用率偏低,各种关键性能指标(kpi)容易出现陡增、陡降的现象,因此大部分5g基站相较于4g基站在kpi的规律性和周期性方面较差,导致仅用历史kpi数据预测未来kpi数据时效果较差,无法处理数据突发性增大或减少的情况。
4.如图1所示,当前主流的预测方法基本是使用历史时序kpi数据进行特征工程,利用提取的特征训练模型,然而使用训练后的模型预测未来kpi。也有少数预测方法考虑到了空间特征,但它们提取空间特征的方式较为简单,是将需要预测的区域划分为一个个栅格,以栅格为单位预测用户的流入流出,这样的方法具体到基站时会产生较大误差,并且以栅格为单位做的用户流动信息也比较依赖于用户流动的规律性与周期性,这恰好是5g发展初期所缺乏的。


技术实现要素:

5.针对上述问题,本公开提出基于多图卷积网络的机制kpi预测模型,旨在解决5g发展初期,5g基站普遍利用率较低、各种kpi数据的规律性和周期性差,导致主要依赖于历史时序kpi数据的传统预测模型效果较差的问题。
6.本公开的一个方面提供了一种用于预测基站kpi的方法,包括:基于基站的历史kpi数据,生成该基站的初始kpi数据;将所述初始kpi数据输入到基于邻近图的图卷积网络、基于相似图的图卷积网络、基于互通图的图卷积网络,以分别提取邻域特征、场景特征、流动性特征,其中所述邻近图、相似图和互通图分别指示包括所述基站在内的一组基站之间的邻近关系、场景相似性、互通性;通过融合所提取的邻域特征、场景特征、流动性特征,获得融合特征;以及基于所述融合特征,计算kpi的预测值。
7.本公开的另一个方面提供了一种用于训练图卷积网络的方法,包括:基于一组基站的历史kpi数据,生成每个基站的kpi训练数据;基于所述一组基站的空间信息,构建分别指示该组基站的邻近关系、场景相似性、互通性的邻近图、相似图、互通图;将所述kpi训练数据输入到基于所述邻近图的图卷积网络、基于所述相似图的图卷积网络、基于所述互通图的图卷积网络,以分别提取邻域特征、场景特征、流动性特征;通过融合所提取的邻域特征、场景特征、流动性特征,获得融合特征;基于所述融合特征,计算kpi的预测值;以及计算所述kpi的预测值和真实值之间的误,并基于所计算的误差来更新所述图卷积网络的参数。
8.本公开的另一个方面提供了一种系统,包括:处理器;以及存储器,被配置为存储可执行指令,其中所述可执行指令在由处理器执行时使得所述处理器执行上面所述的方法。
9.本公开的另一个方面还提供了一种体现可执行指令的计算机可读存储介质和计算机程序产品,所述可执行指令在由处理器执行时使得所述处理器执行上面所述的方法。
附图说明
10.本公开可以通过参考下文中结合附图所给出的详细描述而得到更好的理解。所有附图连同下面的详细说明一起包含在本说明书中并形成说明书的一部分,用来进一步举例说明本公开的实施例和解释本公开的原理和优点。所包括的附图用于说明性目的而非限制性目的。
11.其中:
12.图1示出了传统的基站kpi预测模型;
13.图2示出了根据本公开的实施例的基站kpi预测模型;
14.图3是示出了根据本公开的实施例的基站kpi预测方法的流程图;
15.图4是示出了根据本公开的实施例的图卷积网络的训练方法的流程图;
16.图5示出了可以用于实现根据本公开的实施例的各种方法的计算设备的示例性硬件配置。
17.根据参照附图的以下描述,本公开的其它特性和优点将变得清晰。
具体实施方式
18.在下文中将参照附图来详细描述本公开的各种示例性实施例。为了清楚和简明起见,在本说明书中并未描述实施例的所有特征。然而应注意,在实现本公开的实施例时可以根据特定需求做出很多特定于实现方式的设置,以便实现开发人员的具体目标,例如,符合与系统设备及业务相关的限制条件,并且这些限制条件可能会随着实现方式的不同而有所改变。此外,还应该了解,虽然开发工作有可能是较复杂和费事的,但对得益于本公开的本领域技术人员来说,这种开发工作仅仅是例行的任务。
19.此外,还应注意,为了避免因不必要的细节而模糊了本公开,在附图中仅仅示出了与至少根据本公开的技术方案密切相关的处理步骤和/或设备配置,而省略了与本公开关系不大的其他细节。以下对于示例性实施例的描述仅仅是说明性的,不意在作为对本公开及其应用的任何限制。
20.如前面所提到的,在图1示出的传统基站kpi预测模型中,当基站kpi的规律性和周期性较差时,仅使用历史时序数据作为模型输入可能导致预测效果不理想,并且即使考虑了邻近基站的空间特征,也多依赖于用户流动的规律性和周期性,对于预测效果的提升作用有限。
21.有鉴于此,本公开提出了一种基于多图卷积网络的基站kpi预测模型。图2示出了根据本公开的实施例的新颖预测模型的总体框架。除去历史时序数据外,本公开的预测模型以基站为单位,将基站的空间结构纳入考虑,从而获取基站间有效的时空关系,弥补只有时序特征的不足。
22.如图2中所示,本公开的预测模型从基站空间数据中构建多种拓扑图,以此获取基站间的空间关系。在下面描述的实施例中,主要考虑构建三种拓扑图:邻近图、相似图和互通图,但是这并不意味着本公开的实施例仅限于这三种图,本领域技术人员可以想到提取并使用任何可能的图。
23.三种拓扑图中的节点都是需要预测区域的全体基站。其中邻近图是将基站间距离小于r米的基站用边相连后形成的拓扑图,邻近图主要考虑了邻近基站所处的环境大致相同,基站kpi指标趋势大致相同。相似图是将所处场景相同的基站之间用边互连后形成的拓扑图,相似图主要考虑的是所处位置场景相似的基站可能会具有相同的特性或规律,例如某两栋写字楼周围的基站可能都是早晨8点左右使用人数陡增,到下午六点出现陡降情形。互通图是将交通主干路上的基站间用边互连后形成的拓扑图,互通图主要考虑了基于道路互通的基站间用户的流动性关系,当下在当前基站的用户可能在下一时刻移动到了下面基站,所以基站间的流动信息对预测也有很大帮助。
24.在图2中所示的预测模型中,基站的历史时序kpi信息作为初始特征,被输入到基于不同图的图卷积网络(gcn)中,以提取不同的时空特征。例如,作为初始特征的历史时序数据被输入到从邻近图构建的gcn,以提取含有基站间的邻近关系信息的邻近特征;被输入到从相似图构建的gcn,以提取含有基站间的相似性关系信息的相似特征;被输入到从互通图构建的gcn,以提取含有基站间的互通性信息的流动性特征。所提取的特征可以通过某种融合方法融合在一起,以得到揉合了各种时空信息的特征,下文中称之为“融合特征”。所得到的融合特征可以通过全连接层利用简单的回归方法得到预测结果。
25.相对于现有的预测模型,本公开的预测模型具备以下优点:1)利用从基站空间数据构建的多种拓扑图,以此获取基站间有效的空间结构关系,弥补只有时序特征的不足;2)使用图卷积网络获取基站间的关系并使用图融合算法,能更好的提取时空特征。此外,本公开使用的图卷积网络可以通过训练来建立或更新,从而即使基站部署、外部环境、整体利用率等发生改变,也可以适应这种改变。
26.下面将详细介绍本公开的基站kpi预测方法以及所使用的图卷积网络的训练方法的实施例。
27.图3示出了根据本公开的实施例的基站kpi预测方法的流程图。该基站kpi预测方法可以用于预测特定区域内的一组基站中的每个基站或多个基站未来时段的kpi,例如未来一个小时、未来几个小时、未来一天、未来几天等的kpi。预测方法可以由要执行预测的基站执行,或者可以由核心网内的网络功能(nf)实体执行,也就是说,本公开的基站kpi预测装置可以包括基站设备或者核心网设备。根据本公开的实施例的方法和操作可以体现为计算机可执行指令,存储在非暂时性计算机可读存储介质中,并可以由各种基站或核心网设备执行以实现本文所述的一个或多个功能。根据本公开的实施例的技术可以制成各个计算机程序产品,被用于各种基站或核心网设备以实现本文所述的一个或多个功能。
28.本公开中讨论的kpi可以包括基站处可测量或收集的各种指标,包括但不限于:最大rrc连接数、平均rrc连接数、上行数据流量、下行数据流量、上行prb数、下行prb数,等等。
29.参照图3,本公开的预测可以包括以下几个步骤:
30.生成时序特征
31.基站的时序特征指的是历史时序kpi特征。考虑到时延问题,一般预测当天的kpi
数据能使用的历史数据可以从两天前开始,一直到一星期前。举例来说,为了预测星期二的kpi,可以使用从上个星期一到上个星期日的历史数据。以星期为周期是有利的,因为基站的kpi数据通常表现出这种周期性。当然,采用更段周期或更长周期的历史数据,例如一天、两天、两个星期、三个星期、四个星期等,也是可能的,但是一般而言,所选择的周期应当兼顾数据的规律性和实效性。
32.每个基站可以加基于其收集并记录的历史时序kpi数据来生成初始特征xi,其中i是基站的编号。例如,初始特征xi可以包括最大rrc连接数、平均rrc连接数、上行数据流量、下行数据流量、上行prb数、下行prb数等中的一个或多个。取决于需要,特征的粒度可以是按天、按上下午、按小时,等等。
33.提取图特征
34.图特征是基站的初始特征经过图卷积网络后得到的特征。本公开采用基于频域的图卷积方式,具体计算公式如下:
[0035][0036]
其中h
(l)
是第1层的隐藏层结果,当l=0时,h
(0)
指的是输入数据,即,每个基站的初始特征xi;σ是激活函数,一般选用relu或tanh激活函数;w
(l)
是第l层的权重矩阵。和是为了简化图卷积计算量使用的一个技巧,计算方式如下:
[0037][0038][0039]
其中a是图的矩阵表示,i、j是矩阵中的元素的下标,in是n阶单位矩阵。从公式(3)可以看出,是一个对角阵,其非零元素是矩阵的各行元素之和。
[0040]
根据本公开的实施例,可以分别使用基于邻近图的图卷积网络gcnn、基于相似图的图卷积网络gcnw、基于邻近图的图卷积网络gcnh,以分别提取基站的邻域特征hn、相似特征hw、流动性特征hh。图卷积网络gcnn、gcnw、gcnh都是已经训练好的图卷积神经网络,训练方法将在下面描述。
[0041]
根据本公开的实施例,图卷积网络gcnn、gcnw、gcnh可以是一层的图卷积网络,即,仅包含一个卷积层。经过相应的图卷积网络提取的特征向量hn、hw、hh分别对应于从基站空间数据构建的邻近图、相似图和互通图,并含有相应的时空信息。
[0042]
融合图特征
[0043]
图融合是将三种图特征信息融合在一起,计算公式如下:
[0044]
h=f(hn,hw,hh),
ꢀꢀꢀ
(4)
[0045]
其中f表示选用的融合方法。根据本公开的实施例,融合方法可以是求和,即,计算三个图特征向量之和作为融合特征h;也可以是求平均值,即,计算三个图特征向量的平均作为融合特征h。
[0046]
作为替代,融合方法可以是基于注意力机制的融合方法,相当于神经网络中具有
利用“注意力机制”对各个特征向量进行不同加权的隐藏层。在这种情况下,权重可以通过训练(例如下面将介绍的训练方法)来调整。
[0047]
计算预测值
[0048]
在得到融合特征h后,可以通过一些简单的网络层得到最终的kpi预测值。
[0049]
根据本公开的实施例,可以采用一个简单的全连接层,即
[0050]
y=σ(wdh+bd)
ꢀꢀꢀ
(5)
[0051]
其中wd是全连接层的权重矩阵,bd是全连接层的偏置向量,σ是relu激活函数,y是最后的预测值。
[0052]
虽然上面利用简单的回归方法来从融合特征h计算kpi预测值,但是应理解,本公开不限于此。
[0053]
此外,虽然上面分步骤描述了图特征的提取和融合、以及预测值的计算,但是这些步骤可以通过一个完整的神经网络来实现,其中不同的网络层实现不同的步骤,也就是说,当将每个基站的初始特征xi输入到事先训练好的神经网络时,可以直接输出该基站的kpi预测值,由此简化了预测模型的框架,并且这个神经网络也可以通过下面将描述的训练方法来整体地训练。
[0054]
图4是示出了根据本公开的实施例的图卷积网络的训练方法的流程图。图4中的流程图与图3中的流程图部分相同,下面着重介绍不同的部分。
[0055]
如图4中所示,本公开的训练方法包括基于基站的空间信息构建多个拓扑图,诸如邻近图an、相似图aw、互通图ah。每个图的节点都是需要预测的全量基站,例如待预测区域的所有基站或者待预测的多个基站。
[0056]
邻近图:邻近图的构建需要用到一张共覆盖表,这张表记录了基站间是否共同覆盖了一个地方,当两个基站间存在共覆盖关系,且基站距离小于设定的预定阈值r时,就认为这两个基站存在邻近关系。邻近图是一个无向无权图,构建完成后会得到邻接矩阵an,假设基站的数量为m,则邻接矩阵an是m
×
m的矩阵,其中,当基站i、j之间具有邻近关系时,矩阵元素a
n(i,j)
=1。
[0057]
相似图:相似图的构建主要用到了场景表,场景表中为基站对应的小区打上了各种场景标签,诸如办公区、住宅区、校园等,拥有相同标签的基站之间具有场景相似性,表现为相似图中存在边。相似图也是一张无向无权图,构建完成后会的到相似矩阵aw。对于m个基站,相似矩阵aw是m
×
m的矩阵,其中,当基站i、j之间具有场景相似关系时,矩阵元素a
w(i,j)
=1。
[0058]
互通图:互通图的构建需要借助在地图上打点,在地图上处于同一条道路附近的基站之间基于互通性,表现为在互通图中存在边。互通图ah也是无向无权图,构建完成后会得到互通矩阵ah。对于m个基站,互通矩阵ah是m
×
m的矩阵,其中,当基站i、j之间有道路互通时,矩阵元素a
h(i,j)
=1。
[0059]
基于构建的各种拓扑图,诸如邻近图、相似图、互通图,可以生成相应的图卷积网络gcnn、gcnw、gcnh,每个图的卷积层计算可以采用上面所述的公式(1)至(3),其中矩阵a分别代入邻接矩阵an、相似矩阵aw、互通矩阵ah。
[0060]
此外,如图4中所示,可以基于所有待预测基站的历史时序kpi数据生成时序特征作为训练数据,生成方式如上所述,这种不再重复。可以针对多个时段进行kpi的预测,以扩
充训练数据的量,并且可以获得这些时段的kpi真实值作为参考。
[0061]
所生成的训练数据被分别输入到图卷积网络gcnn、gcnw、gcnh,从而分别提取出邻域特征hn、相似特征hw、流动性特征hh。然后,按照某种融合方法,诸如求和、求平均、基于注意力机制的融合,将所提取的特征向量融合成融合特征h,并且通过全连接层从融合特征h导出kpi预测值。
[0062]
根据本公开的实施例,训练方法采用有监督的训练,通过上面步骤得到预测结果后要对比真实结果计算误差。例如,可以采用平均绝对误差(mae)作为模型误差,然后通过神经网络的反向传播,更新各个网络层的参数,得到最终训练好的模型。在一个例子中,可以仅更新图卷积网络gcnn、gcnw、gcnh各层的权重矩阵。在另一个例子中,如果采用的是基于注意力机制的融合方法,还可以更新注意力机制的权重系数。在另一个例子中,还可以更新全连接层中的权重矩阵。
[0063]
最后,训练好的神经网络模型可以投入实际使用,例如利用上面参照图3描述的预测方法来预测基站未来时段(例如,每个小时、每一天,等等)的kpi值。
[0064]
下面参照图5描述可以用于实现根据本公开的实施例的基站kpi预测方法和图卷积网络训练方法的计算设备800的示例性硬件配置。计算设备800可以是被配置为执行处理和/或计算的任何机器。计算设备800可以包括但不限于工作站、服务器。
[0065]
如图5中所示,计算设备800可以包括可能经由一个或多个接口与总线820连接或通信的一个或多个元件。总线802可以包括但不限于,工业标准架构(industry standard architecture,isa)总线、微通道架构(micro channel architecture,mca)总线、增强isa(eisa)总线、视频电子标准协会(vesa)局部总线、以及外设组件互连(pci)总线等。计算设备800可以包括例如一个或多个处理器804、一个或多个输入设备806、以及一个或多个输出设备808。一个或多个处理器804可以是任何种类的处理器,并且可以包括但不限于一个或多个通用处理器或专用处理器(诸如专用处理芯片)。输入设备806可以是能够向计算设备输入信息的任何类型的输入设备,并且可以包括但不限于鼠标、键盘、触摸屏、麦克风和/或远程控制器。输出设备808可以是能够呈现信息的任何类型的设备,并且可以包括但不限于显示器、扬声器、视频/音频输出终端、振动器和/或打印机。
[0066]
计算设备800还可以包括或被连接至非暂态存储设备814,该非暂态存储设备814可以是任何非暂态的并且可以实现数据存储的存储设备,其中可以存储可执行计算机指令,这些可执行计算机指令当被运行时使得处理器804执行上面参照图3描述的基站kpi预测方法或参照图4描述的训练方法。非暂态存储设备814并且可以包括但不限于盘驱动器、光存储设备、固态存储器、软盘、柔性盘、硬盘、磁带或任何其他磁性介质、压缩盘或任何其他光学介质、缓存存储器和/或任何其他存储芯片或模块、和/或计算机可以从其中读取数据、指令和/或代码的其他任何介质。计算设备800还可以包括随机存取存储器(ram)810和只读存储器(rom)812。rom 812可以以非易失性方式存储待执行的程序、实用程序或进程。ram 810可提供易失性数据存储,并存储与计算设备800的操作相关的指令。计算设备800还可包括耦接至数据链路818的网络/总线接口816。网络/总线接口816可以是能够启用与外部装置和/或网络通信的任何种类的设备或系统,并且可以包括但不限于调制解调器、网络卡、红外线通信设备、无线通信设备和/或芯片集(诸如蓝牙
tm
设备、1302.11设备、wifi设备、wimax设备、蜂窝通信设施等)。
[0067]
应当理解,上述实施例中描述的资源排序装置100的各个单元仅是根据其所实现的具体功能划分的逻辑模块,而不是用于限制具体的实现方式。在实际实现时,上述各单元可被实现为独立的物理实体,或者也可以由单个实体(例如,处理器(cpu或dsp等)、集成电路等)来实现。
[0068]
可单独地或以任何组合方式来使用前述实施方案的各个方面、实施方案、具体实施或特征。可由软件、硬件或硬件与软件的组合来实现前述实施方案的各个方面。
[0069]
例如,前述实施方案可体现为计算机可读介质上的计算机可读代码。计算机可读介质为可存储数据的任何数据存储设备,所述数据其后可由计算机系统读取。计算机可读介质的示例包括只读存储器、随机存取存储器、cd-rom、dvd、磁带、硬盘驱动器、固态驱动器和光学数据存储设备。计算机可读介质还可分布在网络耦接的计算机系统中使得计算机可读代码以分布式方式来存储和执行。
[0070]
例如,前述实施方案可采用硬件电路的形式。硬件电路可以包括组合式逻辑电路、时钟存储设备(诸如软盘、触发器、锁存器等)、有限状态机、诸如静态随机存取存储器或嵌入式动态随机存取存储器的存储器、定制设计电路、可编程逻辑阵列等的任意组合。
[0071]
在一个实施方案中,可以通过用诸如verilog或vhdl的硬件描述语言(hdl)编码电路描述来实现根据本公开的硬件电路。可以针对给定集成电路制造技术设计的单元库合成hdl描述,并可以出于定时、功率和其他原因修改,以获得最终的设计数据库,可以将最终的设计数据库传输到工厂以通过半导体制造系统生产集成电路。半导体制造系统可通过(例如在可包括掩膜的晶片上)沉积半导体材料、移除材料、改变所沉积材料的形状、(例如通过掺杂材料或利用紫外处理修改介电常数)对材料改性等等来生产集成电路。集成电路可以包括晶体管并还可以包括其他电路元件(例如,诸如电容器、电阻器、电感器等无源元件)以及晶体管和电路元件之间的互连。一些实施方案可以实现耦接在一起的多个集成电路,以实现硬件电路,和/或可以在一些实施方案中使用离散元件。
[0072]
虽然已通过示例详细展示了本公开的一些具体实施例,但是本领域技术人员应当理解,上述示例仅意图是说明性的而不限制本公开的范围。本领域技术人员应该理解,上述实施例可以在不脱离本公开的范围和实质的情况下被修改。本公开的范围是通过所附的权利要求限定的。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1