网络话务量预测方法及装置与流程

文档序号:14914901发布日期:2018-07-11 00:27阅读:165来源:国知局

本发明涉及移动通讯领域,特别涉及一种网络话务量预测方法及装置。



背景技术:

随着通信产业的高速发展,电信网络承载的业务量迅猛增长,为了掌握电信网络运营的发展态势,需要能够准确地预测电信网络业务的承载状况,电信网络业务的承载状况即为话务负荷,而话务量是其中最重要的测量话务负荷的指标之一。

话务量是指在单位时间内呼叫次数与每次呼叫平均占用时间的乘积。准确预测话务量,可以及时规避风险,在预测话务量高峰到来之前准备好一系列的应对措施,这对于提高电信网络的运营质量有着重要意义。

由于话务量是动态、随时间变化的,因此如何对话务量进行准确的预测成为亟待解决的问题。



技术实现要素:

为了解决相关技术的问题,本发明实施例提供了一种网络话务量预测方法及装置。所述技术方案如下:

第一方面,提供了一种网络话务量预测方法,所述方法包括:获取对应目标小区的多个不同时段的时段状态信息,并获取对应目标小区的待进行话务量预测的第一时段的第一时段状态信息;在所述多个不同时段的时段状态信息中,确定与所述第一时段状态信息满足预设匹配度条件的至少一个时段状态信息;确定所述至少一个时段状态信息分别对应的每个时段,根据在所述每个时段检测的所述目标小区的话务量计算参数,预测在所述目标小区中所述第一时段的话务量计算参数,根据所述第一时段的话务量计算参数,确定在所述目标小区中所述第一时段的网络话务量。

本发明实施例提供的网络话务量预测方法,通过获取与第一时段状态信息满足预设匹配度条件的至少一个时段状态信息分别对应的每个时段,根据在每个时段检测的目标小区的话务量计算参数,预测目标小区在第一时段的话务量计算参数,来确定第一时段的网络话务量,由于两个时段状态信息满足预设匹配度条件,表明这两个时段状态信息对应时段的影响网络话务量的因素相似,利用时段状态信息相似的已知的话务量计算参数来预测未知的话务量计算参数,预测出的网络话务量更加准确,解决了难以对网络话务量进行准确的预测的问题;达到了对网络话务量进行准确的预测的效果。

结合第一方面,在第一方面的第一种可能的实施方式中,由于当时段状态信息在时空(i,t)上呈阳性时,该时段状态信息的时间范围与t时段存在交集,且该时段信息的地理范围与区域i存在交集,当时段状态信息在时空(i,t)上呈阴性时,该时段状态信息的时间范围与t时段不存在交集,且该时段信息的地理范围会与区域i不存在交集,因此所述确定与所述第一时段状态信息满足预设匹配度条件的至少一个时段状态信息,包括:根据相似度计算公式,分别计算所述多个不同时段的时段状态信息中每个时段状态信息与所述第一时段时段状态信息的相似度;确定与所述第一时段状态信息的相似度大于或等于预定数值的至少一个时段状态信息;其中,所述相似度计算公式为:ρ(tp,tm)=Corr(MU(tp),MU(tm));其中,所述ρ(tp,tm)为所述多个不同时段的时段状态信息中第m个时段的时段状态信息与所述第一时段状态信息的相似度,所述MU(tp)为所述第一时段状态信息,所述MU(tm)为所述多个不同时段的时段状态信息中第m个时段的时段状态信息,所述m为自然数。两个特征向量之间的相似度即为用该两个特征向量之间的相关系数,因此,本实施例中可通过计算 MU(i1,t1)与MU(i2,t2)的相关系数来得到MU(i1,t1)与MU(i2,t2)的相似度。

结合第一方面或者第一方面的第一种可能的实施方式,在第二种可能的实施方式中,由于两个时段状态信息的相似度越大,说明两个时段状态信息越相似。为了保证预测网络话务量的准确性,将与第一时段状态信息的相似度大于或等于预定数值的时段状态信息确定为与该第一时段状态信息满足预设匹配度条件的时段状态信息。因此所述确定与所述第一时段状态信息的相似度大于或等于预定数值的至少一个时段状态信息,包括:所述确定与所述第一时段状态信息的相似度大于或等于预定数值且相似度最高的第二时段状态信息;所述确定所述至少一个时段状态信息分别对应的每个时段,根据在所述每个时段检测的所述目标小区的话务量计算参数,预测所述第一时段的话务量计算参数,包括:确定所述第二时段状态信息对应的第二时段;确定早于所述第一时段预设时长的第三时段,并确定早于所述第二时段所述预设时长的第四时段;获取分别在第二时段、第三时段、第四时段检测的所述目标小区的话务量计算参数;根据第二时段的话务量计算参数、第三时段的话务量计算参数和第四时段的话务量计算参数,以及所述第二时段状态信息与所述第一时段状态信息的相似度,计算所述第一时段的话务量计算参数。由于两个时段状态信息的相似度越大,说明两个时段状态信息越相似,因此第二时段状态信息为与第一时段状态信息的最为相似的状态信息;由于网络话务量除了受到已知的时段状态信息影响还可能收到未知信息影响,也就是说,在实际应用中,即使两个时段的时段状态信息完全相同,改两个时段的网络话务量也可能不相同,因此与第一时段之间的时间差最小的第二时段可以视作与第一时段的未知信息最为相似的时段。

结合第一方面、第一方面的第一种可能的实现或者第一方面的第二种可能的实现,在第一方面的第三种可能的实现中,假设短时间内时段状态信息的变化曲线为直线,根据多个话务量计算参数计算出第一时段的话务量计算参数。所述根据第二时段的话务量计算参数、第三时段的话务量计算参数和第四时段的话务量计算参数,以及所述第二时段状态信息与所述第一时段状态信息的相似度,计算所述第一时段的话务量计算参数,包括:根据话务量计算参数计算公式、第二时段的话务量计算参数、第三时段的话务量计算参数和第四时段的话务量计算参数,以及所述第二时段状态信息与所述第一时段状态信息的相似度,计算所述第一时段的话务量计算参数;其中,所述话务量计算参数计算公式为:

其中,所述Parameter(t)为所述第一时段的话务量计算参数,所述Parameter(t-1) 为所述第三时段的话务量计算参数,所述Parameter(ts)为所述第二时段的话务量计算参数,所述Parameter(ts-1)为所述第四时段的话务量计算参数,所述ρ(t,ts)为所述第一时段时段状态信息与所述第二时段时段状态信息的相似度。

结合第一方面、第一方面的第一种至第三种可能的实现,在第一方面的第四种可能的实现中,所述根据在所述每个时段检测的所述目标小区的话务量计算参数,预测所述第一时段的话务量计算参数,包括:获取所述每个时段检测的所述目标小区的话务量计算参数,根据所述每个时段的话务计算参数和所述每个话务计算参数对应的时段,拟合得到话务量计算参数与时段的关系函数;根据所述话务量计算参数与时段的关系函数,计算所述第一时段的话务量计算参数。

结合第一方面、第一方面的第一种至第四种可能的实现,在第一方面的第五种可能的实现中,所述话务量计算参数包括用户数和用户活跃度,所述根据所述第一时段的话务量计算参数,确定所述第一时段的网络话务量,包括:将所述第一时段的用户数与所述第一时段的用户活跃度相乘,得到所述第一时段的网络话务量。除了分别预测第一时段的用户数和第一时段的用户活跃度仅为一种可能的方式,还可以采用同时预测用户数和用户活跃度作为话务计算参数的方式。

结合第一方面、第一方面的第一种至第五种可能的实现,在第一方面的第六种可能的实现中,所述时段状态信息包括至少一个状态参数的参数值,所述至少一个状态参数包括以下参数中的至少一个:天气参数、温度参数、节假日参数。

第二方面,提供了一种网络设备,所述网络设备包括处理器、与处理器相连的存储器和网络接口,所述处理器用于实现上述第一方面的网络话务量预测方法。

第三方面,提供了一种网络话务量预测装置,所述网络话务量预测装置包括至少一个单元,该至少一个单元分别用于实现上述第一方面的网络话务量预测方法所涉及的相应步骤。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明一个示例性实施例提供的网络设备的结构示意图;

图2是本发明一个示例性实施例提供的网络话务量预测方法的流程图;

图3A是本发明另一个示例性实施例提供的网络话务量预测方法的流程图;

图3B是本发明再一个示例性实施例提供的网络话务量预测方法的流程图;

图4是本发明一个实施例提供的网络设备中的网络话务量预测装置的结构示意图;

图5是本发明一个实施例提供的网络话务量预测装置的框图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。

在本文提及的“模块”是指存储在存储器中的能够实现某些功能的程序或指令;在本文中提及的“单元”是指按照逻辑划分的功能性结构,该“单元”可以由纯硬件实现,或者,软硬件的结合实现。

话务量预测指获得电信网中、长期发展规划或近期调整各个中继电路群组织所必需的基础资料的数学方法。预测内容话务量预测可以分为总量预测与流量流向预测两部分,其中,总量预测是根据不同要求对一个局、一个城市、一个省(区)、或全国的话务总量与预测;流量流向预测是预测从某发话局流向某收话局的话务量,有方向性,因此是预测各局之间话务量的分布情况。

请参考图1,其示出了本发明一个示例性实施例提供的网络设备的结构示意图。该网络设备包括:处理器11、网络接口12、高速缓存器13、存储器14和总线15。

处理器11包括一个或者一个以上处理核心,处理器11通过运行软件程序以及模块,从而执行各种功能应用以及数据处理。

网络接口12用于供网络设备分别与第三方设备和电子设备进行通信。

存储器14与高速缓存器13分别通过总线15与处理器11相连。

存储器14可用于存储软件程序以及模块。

存储器14可以存储至少一个功能所需的应用程序模块16,应用程序模块 16至少包括执行模块161。

获取模块161用于获取对应目标小区的多个不同时段的时段状态信息,并获取对应目标小区的待进行话务量预测的第一时段的第一时段状态信息;以及获取每个时段检测的目标小区的话务量计算参数,根据每个时段的话务计算参数和每个话务计算参数对应的时段,拟合得到话务量计算参数与时段的关系函数;以及获取分别在第二时段、第三时段、第四时段检测的目标小区的话务量计算参数。

确定模块162用于在多个不同时段的时段状态信息中,确定与第一时段状态信息满足预设匹配度条件的至少一个时段状态信息;以及确定与第一时段状态信息的相似度大于或等于预定数值且相似度最高的第二时段状态信息;以及根据相似度计算公式,分别计算多个不同时段的时段状态信息中每个时段状态信息与第一时段时段状态信息的相似度,确定与第一时段状态信息的相似度大于或等于预定数值的至少一个时段状态信息;以及确定第二时段状态信息对应的第二时段;确定早于第一时段预设时长的第三时段,并确定早于第二时段预设时长的第四时段;

计算模块163用于确定至少一个时段状态信息分别对应的每个时段,根据在每个时段检测的目标小区的话务量计算参数,预测在目标小区中第一时段的话务量计算参数,根据第一时段的话务量计算参数,确定在目标小区中第一时段的网络话务量;根据第二时段的话务量计算参数、第三时段的话务量计算参数和第四时段的话务量计算参数,以及第二时段状态信息与第一时段状态信息的相似度,计算第一时段的话务量计算参数;以及根据话务量计算参数计算公式、第二时段的话务量计算参数、第三时段的话务量计算参数和第四时段的话务量计算参数,以及第二时段状态信息与第一时段状态信息的相似度,计算第一时段的话务量计算参数;根据话务量计算参数与时段的关系函数,计算第一时段的话务量计算参数;以及将第一时段的用户数与第一时段的用户活跃度相乘,得到第一时段的网络话务量。

存储器14可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。

本领域技术人员可以理解,图1中所示出的网络设备的结构并不构成对网络设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

请参考图2,其示出了本发明一个示例性实施例提供的网络话务量预测方法的流程图。本实施例以该方法用于如图1所示的网络话务量预测系统中来举例说明,由如图1所示的网络设备的处理器11执行下述步骤,该方法包括以下几个步骤:

步骤201,获取对应目标小区的多个不同时段的时段状态信息,并获取对应目标小区的待进行话务量预测的第一时段的第一时段状态信息。

可选的,目标小区为基站所监管的监管小区或者监管小区中的某个子小区。

可选的,按照预定规则将监管小区划分成n个小区域(n为自然数),该目标小区为n个小区域中的一个区域。其中,预定规则可以为等面积划分,也可以为根据网络拓扑情况进行非等面积划分。

时段可以为n分钟、n小时、n天、n月、n年等(n为自然数),比如当时段为1天时,一个时段即为1天。

通常网络设备每隔1分钟采集监管小区的话务数据,当设定目标小区为监管小区所划分的n个子小区中第i个子小区时,网络设备需要将所采集到的监管小区的话务数据中,第i个子小区的话务数据划分到目标小区的话务数据中,获取该目标小区检测的各个时段状态信息。当时段设定为1天时,网络设备需要将所采集的目标小区的话务数据中,年月日相同的话务数据划到同一时段,获取对该目标小区检测的该时段的时段状态信息。

当网络设备将话务数据按照时间和/或空间(即子小区)划分后,可继续获取对应目标小区的多个不同时段的时段状态信息。

本实施例中将影响每个时段的网络话务量的基本因素定义为时段状态信息,时段状态信息包括至少一个状态参数的参数值,至少一个状态参数包括以下参数中的至少一个:天气参数、温度参数、节假日参数,状态参数的参数值为该状态参数的具体参数值,比如状态参数“节假日参数”的参数值为“春节”。

每个时段状态信息的状态参数有时间范围、地理范围、影响类型范围等属性,不同的时段状态信息有不同的属性。其中,时间范围表示状态参数存在的时间范围,比如状态参数“节假日”在于2016年11月中的5号、6号、12号、13 号、19号、20号、26号和27号;地理范围表示时段状态信息所影响的地理范围,比如状态参数“暑假”会影响目标小区中的学校,再比如状态参数“节假日”会影响整个目标小区;影响类型范围表示状态参数影响网络话务量的话务量计算参数,该话务量计算参数包括用户数和用户活跃度,话务量计算参数包括至少一个话务量计算参数的参数值,话务量计算参数的参数值由影响该话务量计算参数的时段状态信息的状态参数的参数值构成,同一个时段状态信息影响至少一个话务量计算参数,比如,状态参数“节假日参数”影响用户活跃度,“自然灾害参数”影响用户数和用户活跃度。

可选的,时段状态信息的状态参数有标识信息属性,标识信息可以为名字、代码、数字等信息,不同的标识信息代表不同的状态参数,比如状态参数“节假日”的标识信息为“001”或者“abc”。

时段状态信息的状态参数的属性可以通过工作人员输入或者从第三方设备导入网络设备进行设置,也可以对历史话务数据的进行聚类分析,由网络设备自动或半自动发现。下面是时段状态信息自动或半自动发现的几种可能的实现方式:

方法一,网络设备监听网络拓扑结构变化情况,自动发现监控小区或者监控小区的子小区的增加和删除,根据监控小区或者监控小区的子小区参数情况识别监控小区或者监控小区的子小区删除后所影响的区域,从而动态修改各个状态参数已经状态参数信息对应的参数值。

方法二:网络设备与第三方设备对接,将天气数据导入状态参数中,例如根据明天会在某区域i下大雪的天气预报信息导入时段状态信息“大雪天气”的状态参数中(修改状态参数的时间范围)。

方法三:日期特征的自动发现

获取某区域i过去的用户数的时空分布UserCount(i,t),将t时段分解为日期 d和时间短编号q的形式表达为UserCount(i,d,q),以30分钟的时段长度为例, t时段为2006年11月11日00:00~2006年11月11日00:30可以分解成d=2006 年11月11日,q=1。t时段为2006年11月11日01:00~2006年11月11日01:30 可以分解成d=2006年11月11日,q=3。

网络设备将区域i多天(即不同d)的用户数分布UserCount(i,d,q)做聚类分析,记录UserCount(i,d,q)集中度比较高的d的集合dk(k=1,2,…,n),采用函数 f(k)(k=1,2,…,n)拟合dk(k=1,2,…,n),f(k)即为该时段状态信息时间范围的描述函数,其中n为自然数。

本实施例中,状态参数用NetworkGenicid表示,id代表该状态参数的标识信息;时段状态信息用表示,G代表该时段状态信息所包括的状态参数的个数,G为自然数,可以用向量表示为

本实施例中例举出三种确定时段状态信息的影响程度的方法。

第一种方法,在网络设备中静态设置好各个状态参数对应的参数值。比如,设时段为一年,时段状态信息a的时间范围为周三,若状态参数影响网络话务量的时间范围以一年进行设置,一年内总共52个周三,那么时段状态信息a的影响程度为的365/52,再比如时段状态信息b为教师节,一年内总共1个端午节,那么时段状态信息a的影响程度为的365/1。

第二种方法,网络设备将各个时段的时段状态信息与时段状态信息对应的同一个话务量计算参数进行拟合。

以用户活跃度为例,设时段状态信息均为构成用户活跃度的信息,时段状态信息的影响程度为aid(id=1,2,…,G)。

那么,在目标小区i的第t个时段上中状态信息的存在性为eid(i,t),其中id=1,2,...,G,那么eid(i,t)可以用0和1来表示:

本实施例中,若某一时段状态信息的存在性为1,则称该时段状态信息呈阳性,若某一时段状态信息的存在性为0,则称该时段状态信息呈阴性。

将该目标小区i被划分为G个子小区,目标小区i的时段状态信息则会受N 个子小区的时段状态信息所影响,若用a1e1(i1,t1)来表示目标小区i中的第1个子小区在多个不同时段中的第1时段的第1个时段信息,那么用序列S表示目标小区i在各个时段的时段状态信息为:

需要说明的是,为了方便说明,本实施例中默认目标小区i在各个时段的时段状态信息可相加,但本实施例不限定目标小区i在各个时段的时段状态信息之间的计算关系。

若用ActivityDegree(i1,t1)来表示目标小区i中的第1个子小区在多个不同时段中的第1时段的用户活跃度,那么用序列Y表示目标小区i在各个时段的用户活跃度为:

那么,序列S和序列Y间的相关系数为Corr(S,Y),Corr(S,Y)>0。

采用遗传算法、粒子群等算法均可以求出上述方程组的aid。

特别的,设Fun函数为Fun(a1,a2,…,aG)=1-Corr(S,Y),其中, Fun(a1,a2,…,aG)可作为对时段状态信息的影响程度的误差衡量,当 Fun(a1,a2,…,aG)的值最小时,时段状态信息的影响程度越准确。

由于Fun(a1,a2,…,aG)可作为对时段状态信息的影响程度的误差衡量,因此 1-Fun(a1,a2,…,aG)可作为时段状态信息完整度评价算法,1-Fun(a1,a2,…,aG)越接近1表示时段状态信息的完整度越高。

在一种可能实现的方式中,当调整了网络设备中存储的时段状态信息的状态参数和影响程度之后,为了知道调整后的时段状态信息是否比调整前的时段状态信息更加准确,可以通过时段状态信息调整前后优劣比较算法来判断:

设调整前的时段状态信息为时段状态信息的影响程度为aid(id=1,2,…,G);调整后的时段状态信息为时段状态信息的影响程度为a′id′(id=1,2,…,G)。

根据确定时段状态信息的影响程度的第二种方法,得到调整前的时段状态信息的Fun函数为Fun(a1,a2,…,aG)与调整后的时段状态信息的Fun函数为 Fun(a′1′,a′2′,…,a′G′)。

比较Fun(a1,a2,…,aG)与Fun(a′1′,a′2′,…,a′G′)的大小,若Fun(a1,a2,…,aG)大于 Fun(a′1′,a′2′,…,a′G′),则表明调整后的时段状态信息比调整前的时段状态信息更加准确。

需要说明的是,各个时段状态信息的展现方式包括但不限于以下几种方式:

第一种方式,利用各个时段状态信息具备的地理特征,在地理信息系统(英文:Geographic Information System,简称:GIS)地图上呈现各个时段状态信息。

第二种方式,通过列表展示各个时段状态信息。

第三种方式,根据各个时段状态信息完整度评价算法呈现不同时间的时段状态信息的完整程度。

第四种方式,分析各个时段状态信息之间的相关性,尽量确保各个时段状态信息之间的正交特性,通过各个时段状态信息之间的相关性展现各个时段状态信息。

需要说明的是,本实施例中待进行话务量预测的第一时段可以为未获取到话务量的时段也可以为已经获取到话务量的时段。

步骤202,在多个不同时段的时段状态信息中,确定与第一时段状态信息满足预设匹配度条件的至少一个时段状态信息。

由于时段状态信息的更新并不频繁,因此即使无论第一时段是否为已经获取话务量的时段,网络设备均可以预测出该第一时段的话务量,比如:时段“2017 年1月1日”的时段状态信息为参数值为“元旦”的状态参数“节假日参数”、参数值为“非舒适温度”的状态参数“温度”等。

可选的,当在多个不同时段的时段状态信息中,当时段a的时段状态信息与第一时段状态信息的相似度大于或等于预定数值,判定时段a的时段状态信息为与第一时段状态信息满足预设匹配度条件的时段状态信息,该相似度包括时段状态信息的状态参数和状态值的相似度。

步骤203,确定至少一个时段状态信息分别对应的每个时段,根据在每个时段检测的目标小区的话务量计算参数,预测在目标小区中第一时段的话务量计算参数,根据第一时段的话务量计算参数,确定在目标小区中第一时段的网络话务量。

由于目标小区中第一时段的网络话务量与该目标小区中第一时段的话务量计算参数相关,因此在确定在目标小区中第一时段的网络话务量之前,需要预测在目标小区中第一时段的话务量计算参数,该第一时段的话务量计算参数可通过与该第一时段状态信息满足预设匹配度条件的,至少一个时段状态信息分别对应的每个时段的目标小区的话务量计算参数来预测。

综上所述,本发明实施例提供的网络话务量预测方法,通过获取与第一时段状态信息满足预设匹配度条件的至少一个时段状态信息分别对应的每个时段,根据在每个时段检测的目标小区的话务量计算参数,预测目标小区在第一时段的话务量计算参数,来确定第一时段的网络话务量,由两个时段状态信息满足预设匹配度条件,表明这两个时段状态信息对应时段的影响网络话务量的因素相似,利用时段状态信息相似的已知的话务量计算参数来预测未知的话务量计算参数,预测出的网络话务量更加准确,解决了难以对网络话务量进行准确的预测的问题;达到了对网络话务量进行准确的预测的效果。

在实际应用中,由于话务量是动态、随时间变化的,因此难以对话务量进行准确的预测,本实施例中网络设备获取与第一时段状态信息满足预设匹配度条件的至少一个时段状态信息分别对应的每个时段,根据在每个时段检测的目标小区的话务量计算参数,预测目标小区在第一时段的话务量计算参数,来确定第一时段的网络话务量,来对话务量进行准确的预测。下面结合图3A和图 3B对网络话务量预测方法进行描述。

请参考图3A,其示出了本发明另一个示例性实施例提供的网络话务量预测方法的流程图。本实施例以该方法运用于如图1所示的网络话务量预测系统中来举例说明,该方法包括以下几个步骤:

步骤301,获取对应目标小区的多个不同时段的时段状态信息,并获取对应目标小区的待进行话务量预测的第一时段的第一时段状态信息。

步骤302,在多个不同时段的时段状态信息中,根据相似度计算公式,分别计算多个不同时段的时段状态信息中每个时段状态信息与第一时段时段状态信息的相似度。

当时段状态信息在时空(i,t)上呈阳性时,该时段状态信息的时间范围与t时段存在交集,且该时段信息的地理范围与区域i存在交集,当时段状态信息在时空(i,t)上呈阴性时,该时段状态信息的时间范围与t时段不存在交集,且该时段信息的地理范围会与区域i不存在交集。

也就是说,是在时空(i,t)上呈阳性的各个时段状态信息的集合,简称DNA(i,t)。记向量μid为时段状态信息NetworkGenicid在DNA(i,t)的参数值为AffectDegreeid,那么μid的值为:

从而可采用列向量MU(i,t)=[μ1(i,t),μ2(i,t),…,μG(i,t)]T来表示各个时段状态信息的参数值特征向量。

由此可知,计算两个不同时段的时段状态信息之间的相似度(DNA(i1,t1)与 DNA(i2,t2)的相似度),即为计算MU(i1,t1)与MU(i2,t2)的相似度。

两个特征向量之间的相似度即为用该两个特征向量之间的相关系数,因此,本实施例中可通过计算MU(i1,t1)与MU(i2,t2)的相关系数来得到MU(i1,t1)与 MU(i2,t2)的相似度。其中,相似度计算公式为:

ρ((t1,t1)(t2,t2))=Corr(MU(t1,t1),MU(t2,t2))

其中,Corr为相关系数运算函数。

特别的,对于本实施例中分别计算目标小区中多个不同时段的时段状态信息中每个时段状态信息与第一时段时段状态信息的相似度时,由于i1=i2,因此相关度计算公式可以标示为:

ρ(tp,tm)=Corr(MU(tp),MU(tm))

其中,ρ(tp,tm)为多个不同时段的时段状态信息中第m个时段的时段状态信息与第一时段状态信息的相似度,MU(tp)为第一时段状态信息,MU(tm)为多个不同时段的时段状态信息中第m个时段的时段状态信息,m为自然数。

步骤303,确定与第一时段状态信息的相似度大于或等于预定数值的至少一个时段状态信息。

两个时段状态信息的相似度越大,说明两个时段状态信息越相似。为了保证预测网络话务量的准确性,将与第一时段状态信息的相似度大于或等于预定数值的时段状态信息确定为与该第一时段状态信息满足预设匹配度条件的时段状态信息。

计算第一时段的网络话务量的方式有多种,本实施例中例举出两种可能的计算方式。当采用第一种计算方式计算第一时段的网络话务量时,步骤302可以被为步骤S1或者步骤S2替换。

步骤S1,确定与第一时段状态信息的相似度大于或等于预定数值且相似度最高的第二时段状态信息。

由于两个时段状态信息的相似度越大,说明两个时段状态信息越相似,因此第二时段状态信息为与第一时段状态信息的最为相似的状态信息,相比利用其他时段状态,利用第二时段状态信息预测的第一时段状态信息更为准确。

步骤S2,确定与第一时段状态信息的相似度大于或等于预定数值且与第一时段之间的时间差最小的第二时段的第二时段状态信息。

两个时段之间的时间差越小,说明两个时段越接近。网络话务量除了受到已知的时段状态信息影响还可能收到未知信息影响,也就是说,在实际应用中,即使两个时段的时段状态信息完全相同,改两个时段的网络话务量也可能不相同。因此与第一时段之间的时间差最小的第二时段可以视作与第一时段的未知信息最为相似的时段,相比利用其他时段状态,利用第二时段状态信息预测的第一时段状态信息更为准确。

步骤304,确定第二时段状态信息对应的第二时段。

步骤305,确定早于第一时段预设时长的第三时段,并确定早于第二时段预设时长的第四时段。

需要说明的是,预设时长可以为1天、一个月、一年等,本实施例中并不限定预定时长的具体时长。

步骤306,获取分别在第二时段、第三时段、第四时段检测的目标小区的话务量计算参数。

本实施例中,话务量计算参数包括用户数和用户活跃度。

运营商所获取的用户的用户状态分为两种:空闲态和非空闲态,当用户所持有的电子设备处于通话状态、上网状态等状态时,该用户的用户转投台为非空闲态,当用户所持有的电子设备处于待机状态、关机状态、飞行模式状态等状态时,该用户的用户转投台为空闲态。

本实施例中,全部用户数是空闲态的用户数和非空闲态的用户数之和,当空闲态的用户数无法获取,可将非空闲态的用户数作为全部用户数,区域i在t 时段的用户数可以表示:

UserCount(i,t)=IdelUserCount(i,t)+ActiviteUserCount(i,t)

其中,UserCount(i,t)为区域i在t时段上的用户数,IdelUserCount(i,t)为区域i 在t时段上的空闲用户数,ActiviteUserCount(i,t)为区域i在t时段上的非空闲用户数。

可选的,用户数可以由网络设备从第三方设备获取,比如网络设备从核心网网络设备中采集,或者从第三方应用库中导出。

用户活跃度指在一定区域内,一定时间范围,平均每单位用户对网络设备的使用程度(即平均每单位用户的网络话务量)。

若网络设备无法在区域i上获取到用户活跃度的相关数据,该网络设备可以利用区域i邻近的多个区域的用户活跃度的平均值作为区域i的用户活跃度,公式如下:

其中,i为区域编号;t为某个时段;NC为区域i的邻近区域(包括i区域) 的区域数;Di为区域i邻近区域(包括i区域)的区域编号集合;Di[j]为区域i的第 j个邻区域的编号;IN为衡量话务量的指标数;TrafficFeature(k,Di[j],t)为第k个衡量话务量的指标在Di[j]区域中在t时段上的值,TrafficFeature(k,Di[j],t)可以为一个对的运算公式。比如4G网络中,TrafficFeature(k,Di[j],t) 既可以是MRCount(Di[j],t),可以是的吞吐量的统计,也可以是MRCount(Di[j],t)与的并集;bk为话务指标加权系数;cj为邻近区域话务量的加权系数。

步骤307,根据第二时段的话务量计算参数、第三时段的话务量计算参数和第四时段的话务量计算参数,以及第二时段状态信息与第一时段状态信息的相似度,计算第一时段的话务量计算参数。

本实施例中话务量计算参数包括用户数和用户活跃度。

话务量计算参数的预测方式有多种,本实施例中例举出三种可能的预测方式:

第一种,从第三方设备中获取的影响话务量计算参数的数据对第一时段的话务量计算参数进行预测,比如通过从第三方设备中获取实时的交通数据来预测用户数。

第二种,根据第一时段的时段状态信息来预测第一时段的话务量计算参数,比如根据影响用户进行移动的时段状态信息来预测用户在时空上分布情况。

第三种,假设短时间内时段状态信息的变化曲线为直线,根据多个话务量计算参数计算出第一时段的话务量计算参数。

比如,记区域i的第一时段(i,t)上与某一话务量计算参数相关的第一时段状态信息为DNA(i,t)。

先确定出区域i的第一时段状态信息DNA(i,t)的相关度满足预定数值且相关度最高或者距离第一时段(i,t)最近的第二时段(i,ts),以及第一时段时段状态信息 DNA(i,t)与第二时段时段状态信息DNA(i,ts)的相关度ρ(t,ts)。

再确定出早于第一时段(i,t)预设时长n的第三时段(i,t-n),早于第二时段(i,ts) 预设时长n的第四时段(i,ts-n),并获取第二时段的目标小区的话务量计算参数 Parameter(i,ts)、第三时段的目标小区的话务量计算参数Parameter(i,t-n)、第四时段检测的目标小区的话务量计算参数Parameter(i,ts-n)。

最后,根据话务量计算参数计算公式、第二时段的话务量计算参数 Parameter(i,ts)、第三时段的话务量计算参数Parameter(i,t-n)和第四时段的话务量计算参数Parameter(i,ts-n),以及第二时段状态信息DNA(i,ts)与第一时段状态信息 DNA(i,t)的相似度ρ(t,ts),计算第一时段的话务量计算参数Parameter(i,t)。

其中,话务量计算参数计算公式为:

需要说明的是,当与第一时段状态信息满足预设匹配度条件的第二时段状态信息为多个时,第二时段的话务量计算参数也为多个,相应的,第三时段的话务量计算参数和第四时段的话务量计算参数也为多个,此时可用下述公式计算第一时段的话务量计算参数:

公式一,

公式二,

其中,a为自然数。

以话务量计算参数为用户数为例,计算目标小区在第一时段的用户数的公式为:

其中,UserCount(t)为目标小区在第一时段的用户数,UserCount(t-n)为目标小区在第三时段的用户数,UserCount(ts)为目标小区在第二时段的用户数, UserCount(ts-n)为第四时段的用户数,ρ(t,ts)为目标小区在第一时段时段状态信息与目标小区在第二时段时段状态信息的相似度。

特别地,当目标小区在第四时段的用户数UserCount(ts-n)等于0或不存在时,可令UserCount(t)=UserCount(ts-n)或者令UserCount(t)=UserCount(t-n)进行计算。

以话务量计算参数为用户活跃度为例,计算目标小区在第一时段的用户活跃度的公式为:

其中,ActivityDegree(t)为目标小区在第一时段的用户活跃度, ActivityDegree(t-n)为目标小区在第三时段的用户活跃度,ActivityDegree(ts)为目标小区在第二时段的用户活跃度,ActivityDegree(ts-n)为第四时段的用户活跃度,ρ(t,ts) 为目标小区在第一时段时段状态信息与目标小区在第二时段时段状态信息的相似度。

设(i,t)受(i,t-n)影响,实际应用中,若t的间隔大于预定数值时,可令 ActivityDegree(t)=ActivityDegree(ts-n)。

特别地,当目标小区在第四时段的用户数ActivityDegree(ts-n)等于0或不存在时,可令ActivityDegree(t)=ActivityDegree(ts-n)或者令 ActivityDegree(t)=ActivityDegree(t-n)进行计算。

需要说明的是,本实施例中分别预测第一时段的用户数和第一时段的用户活跃度仅为一种可能的方式,还可以采用同时预测用户数和用户活跃度作为话务计算参数的方式,本实施例并不限定预测第一时段的用户数和第一时段的用户活跃度的方式。

步骤308,将第一时段的用户数与第一时段的用户活跃度相乘,得到第一时段的网络话务量。

记区域i第一t时段的第一时段的话务需求为TrafficRequire(i,t),区域i第一时段的用户数为UserCount(i,t),区域i第一时段的用户活跃度为AcitivityDegree(i,t),区域i第一时段的话务需求量TrafficRequire(t)的计算公式为:

TrafficRequire(i,t)=UserCount(i,t)×AcitivityDegree(i,t)

本实施例中,将第一时段的话务需求确定为第一时段的网络话务量,因此目标小区的网络话务量为TrafficRequire(t)=UserCount(t)×AcitivityDegree(t),其中, TrafficRequire(i,t)为目标区域第一时段的话务量,UserCount(i,t)为目标区域第一时段的用户数,AcitivityDegree(i,t)为目标区域第一时段的用户活跃度。

需要说明的是,步骤301与步骤201相似,本实施例不再对步骤301赘述说明。

综上所述,本发明实施例提供的网络话务量预测方法,通过获取与第一时段状态信息满足预设匹配度条件的至少一个时段状态信息分别对应的每个时段,根据在每个时段检测的目标小区的话务量计算参数,预测目标小区在第一时段的话务量计算参数,来确定第一时段的网络话务量,由两个时段状态信息满足预设匹配度条件,表明这两个时段状态信息对应时段的影响网络话务量的因素相似,利用时段状态信息相似的已知的话务量计算参数来预测未知的话务量计算参数,预测出的网络话务量更加准确,解决了难以对网络话务量进行准确的预测的问题;达到了对网络话务量进行准确的预测的效果。

请参考图3B,其示出了本发明再一个示例性实施例提供的网络话务量预测方法的流程图。在一种可能实现的方式中,在步骤303之后,当采用第一种计算方式计算第一时段的网络话务量时,步骤303之后可执行步骤309至步骤311。

步骤309,确定至少一个时段状态信息分别对应的每个时段,获取每个时段检测的目标小区的话务量计算参数,根据每个时段的话务计算参数和每个话务计算参数对应的时段,拟合得到话务量计算参数与时段的关系函数。

本实施例中假设时段状态信息与时段的关系为一次函数,设时段x和话务量计算参数y之间的函数关系为:y=a+bx,其中,参数a代表截距,参数b代表斜率。对于等时段获取的N组数据(xi,yi)(i=1,2……,N),其中时段 xi的值是准确的,所有的误差只与话务计算参数yi相关。下面利用最小二乘法把观测数据拟合为直线。

用最小二乘法估计参数时,要求话务计算参数yi的偏差的加权平方和为最小。对于等时段获取的话务计算参数的直线拟合来说,需使下式的值最小:

将上式中的a、b分别偏导得到:

整理后得到方程组为:

对上述方程组解方程,可得到参数a和参数b的最佳估计值。

特别的,利用最小二乘法处理数据得出参数a和参数b的最佳估计值外,还得到x与y之间的函数关系与线性的符合程度,即相关系数r,r可以通过下式来表达:

其中其中r∈[-1,1]。

当|r|→1时,说明x与y之间线性关系好,当|r|→0,说明x与y之间无线性关系,拟合无意义。

步骤310,根据话务量计算参数与时段的关系函数,计算第一时段的话务量计算参数。

当得到参数a和参数b的最佳估计值后,可确定出时段x和话务量计算参数y的关系函数,将第一时段代入该关系函数后,即可计算出第一时段的话务量计算参数。

步骤311,根据第一时段的话务量计算参数,确定在目标小区中第一时段的网络话务量。

由于话务计量参数包括用户数和用户活跃度,因此分别求出时段与用户数的第一关系函数和时段与用户活跃度的第二关系函数后,将第一时段分别代入第一关系函数和第二关系函数后可以得到第一时段的用户数和第一时段的用户活跃度,将第一时段的用户数与第一时段的用户活跃度相乘,即得到第一时段的网络话务量。

综上所述,本发明实施例提供的网络话务量预测方法,通过获取与第一时段状态信息满足预设匹配度条件的至少一个时段状态信息分别对应的每个时段,根据在每个时段检测的目标小区的话务量计算参数,预测目标小区在第一时段的话务量计算参数,来确定第一时段的网络话务量,由两个时段状态信息满足预设匹配度条件,表明这两个时段状态信息对应时段的影响网络话务量的因素相似,利用时段状态信息相似的已知的话务量计算参数来预测未知的话务量计算参数,预测出的网络话务量更加准确,解决了难以对网络话务量进行准确的预测的问题;达到了对网络话务量进行准确的预测的效果。

在一种可能实现的方式中,话务量计算参数还包括网络信号,该网络信号用于反映目标小区内的网络信号的时空分布。当话务量计算参数为“网络信号”时,网络信号的时段状态信息可以为天气参数、基站个数参数,比如天气为雨天与天气为晴天下的网络信号的情况不一样,再比如增加或是删除基站会影响网络信号的分布。

将测量报告(英文:Measurement Report,简称:MR)数据的地理位置定位信息映射到网格上。记区域i在t时段的MR测量集合为根据可得到区域i在t时段的网络信号分布情况。

记网络信号分布为SignalDist(i,t),设一预定数值,当网络设备存储的运算资源大于或等于该预定数值时,令当网络设备存储的运算资源小于该预定数值时,提取的特征将压缩成SignalDist(i,t),当需要使用时将 SignalDist(i,t)还原成在还原的过程中允许一定范围内的精度丢失。

本实施例中例举出一种基于均匀采样的网络信号分布特征提取的方法:

提取过程:网络设备先将按照信号大小排序,将排序后的序列为记为SortedMR(i,t),然后根据采样比 N,每N条数据保留一条,将采样后的序列记为SampledMR(i,t),最后将采样后的结果SampledMR(i,t)与采样比例N一起保留,作为SampledDist(i,t)。

还原过程:网络设备将SampledMR(i,t)中的元素复制成N份,记为即该近似为

将SignalDist(i,t)还原成的绝对误差为:

其中,p代表某信号特征的在时空(i,t)上的发生概率。

将SignalDist(i,t)还原成的相对误差为:

根据相对误差公式,可根据实际采集的数据条数与误差要求来决定如何采样。

特别地,设一预定数值,当MRCount(i,t)的数量小于该预定数值时,利用来描述时空(i,t)上的网络信号的分布SignalDist(i,t)的误差越大。

优选的,在步骤308和步骤311之后,网络设备可对网络信号进行预测。

比如,记区域i的第一时段(i,t)上与网络信号相关的第一时段状态信息为 DNA(i,t)。

先确定出区域i的第一时段状态信息DNA(i,t)的相关度满足预定数值且相关度最高或者距离第一时段(i,t)最近的第二时段(i,ts),以及第一时段时段状态信息DNA(i,t)与第二时段时段状态信息DNA(i,ts)的相关度ρ(t,ts)。

再确定出早于第一时段(i,t)预设时长n的第三时段(i,t-n),并获取第二时段的目标小区的网络信号SignalDist(i,t)、第三时段的目标小区的网络信号 SignalDist(i,t-n)。

最后,根据网络信号计算公式、第二时段的网络信号SignalDist(i,ts)和第三时段的网络信号SignalDist(i,t-n),以及第二时段状态信息DNA(i,ts)与第一时段状态信息DNA(i,t)的相似度ρ(t,ts),计算第一时段的网络信号SignalDist(i,t)。

其中,网络信号计算公式为:

SignalDist(i,t)=(1-ρi(t,ts))×SignalDist(i,t-n)+ρi(t,ts)×SignalDist(i,ts)。

需要说明的是,SignalDist(i,t)在实际采样的过程中会产生误差。

设预定间距值、预定话务量和预定数值,若t的间距小于预定间距值或网络话务量小于预定话务量时,MRCount(i,t)个数会普遍较少,当MRCount(i,t)个数少于预定数值时,用来表示(i,t)上的网络信号的分布 SignalDist(i,t)的误差越大。

特别地,当MRCount(i,t)个数少于预定数值时,记时空(i,t)的上的网络信号相关的时段状态信息为DNA(i,ts),确定出区域i的第一时段状态信息DNA(i,t)的相关度满足预定数值的M个时段状态信息,其中s=1,2,...,M,将作为时空(i,t)的上的网络信号SignalDist(i,t)的数据源,由于SignalDist(i,t)的数据源的MR数量由MRCount(i,t)变成了 MR数量数量增加,对应的SignalDist(i,t)的误差降低。

记MRGenerator(i,t,n)表示在时空(i,t)上生成n条MR测量数据,根据MR信号分布情况SignalDist(i,t)的分布情况生成MR。例如:当SignalDist(i,t)为MR数据的集合时,MRGenerator(i,t,n)随机从SignalDist(i,t)中复制n条MR数据。

网络话务时空分布是指每单位网络话务量对应的网络信号的情况。

记时空(i,t)上的因为网络话务产生的MR测量集合为MRList(i,t),根据预测的时空(i,t)上的MR信号分布情况SignalDist(i,t)、时空(i,t)上的话务需求量为 TrafficRequire(t)和MR信号分布情况生成MRList(i,t)。例如:当AcitivityDegree(i,t)为每单位用户的MR个数,TrafficRequire(i,t)为时空(i,t)上的MR测量个数时, MRList(i,t)可以表示为:MRList(i,t)=MRGenerator(i,t,TrafficRequire(i,t))。

请参考图4,其示出了本发明一个实施例提供的网络设备中的网络话务量预测装置的结构示意图。该网络话务量预测装置包括:数据采集与预处理模块、网络配置监控模块、时段状态信息管理模块、存储模块和、数据预测模块、问题发现模块、优化解决模块、评估回退模块以及网络参数调整模块。

数据采集与预处理模块,用于将采集的网络话务数据按照用户数、用户活跃度、网络信号提取特征存储。不排除将用户数、用户活跃度合并成话务需求。用户数的时空分布数据和分布预测数据既可以通过第三方设备采集,也可以通过相关方法计算。

网络配置监控模块,用于监控网络设备的变化情况,网络设备的变化情况包括但不限于网络设备的变更(例如基站属凉凉的变化、天线方位角的变化等)、网络告警(例如基站段服告警等)。

时段状态信息管理模块,用于管理时段状态信息的输入和编辑,时段状态信息的展现,各个时段状态信息的对比评价,第三方时段状态信息的对接等。

存储模块,用于将网络话务量对应的网络的话务数据分成用户数时空分布数据、用户活跃度时空分布数据、网络信号时空分布数据分别存储(不排除将用户数时空分布数据、用户活跃度时空分布数据统一成话务需求时空分布数据统一存储),用户数时空分布数据、用户活跃度时空分布数据、网络信号时空分布数据在时间上的存储期限可以不相同。通过采用长时间存储期限的用户话务需求数据(用户数、用户活跃度)与短时间期限的网络信号时空分布数据的存储方式降低网络话务数据的存储空间消耗。

数据预测模块,用于利用时段状态信息的相似度来预测用户话务需求数据 (用户数、用户活跃度)与网络信号分布,进而预测网络话务量的时空分布和项目管理(英文:Project Management,简称:PM)话统数据,将预测结果的对外呈现。

问题发现模块,用于发现当前的网络问题,以及利用预测出的网络话务量来发现未来的网络问题。

优化解决模块,用于利用已获取的多个时段的网络话务量来决定如何调整网络,更是利用预测出的网络话务量来决定如何调整网络。

评估回退模块,用于将调整前的网络话务量与调整后的实际上报的网络话务量进行对比决定是否回退、收益多少,更是利用预测出的网络话务量与调整后的实际上报的网络话务量进行对比判断是否回退、收益多少。

网络参数调整模块,用于将优化建议或回退建议下发给网络设备的网络配置监控模块(或时段状态信息管理模块),使网络配置监控模块动态调整时段状态信息。

请参考图5,其示出了本发明一个实施例提供的网络话务量预测装置的框图。该网络话务量预测装置可以通过软件、硬件或者两者的结合实现成为网络设备的全部或者一部分。该网络话务量预测装置可以包括:执行单元501。

获取单元501,用于实现上述步骤201的功能。

确定单元502,用于实现上述步骤202的功能。

计算单元503,用于实现上述步骤203的功能。

相关细节可结合参考上述方法实施例。

在另一个可选的实施例中,上述获取单元501,用于实现步骤301、步骤306 中至少一个步骤的功能。

上述确定单元502,用于实现步骤303至步骤305、步骤309中至少一个步骤的功能。

上述计算单元503,用于实现步骤302、步骤307至步骤308、步骤310至步骤311中至少一个步骤的功能。

需要说明的是,上述获取单元501、确定单元502计算单元503和可以通过网络设备的处理器执行存储器中的接收模块来实现。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。

以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1