KQI的问题定位方法及装置与流程

文档序号:15845235发布日期:2018-11-07 08:56阅读:570来源:国知局
KQI的问题定位方法及装置与流程

本公开涉及网络技术领域,特别涉及一种关键质量指示(keyqualityindicator,kqi)的问题定位方法及装置。

背景技术

kqi是一种衡量业务的用户体验的指标,例如视频业务的kqi可以为下载速率、初缓时延、卡顿次数和播放成功率等。随着用户对kqi的要求与日俱增,kqi成为运营商比拼的核心,为此需要结合网络数据,对kqi的问题进行定位,即,找出引起kqi出现问题的原因,分析网络中需要优化的网络特征,以便对这些网络特征进行优化,进而提升kqi。

以kqi为视频的下载速率为例,目前会由专家根据经验,总结下载速率达标时,各种网络特征会符合的取值,作为每种网络特征的问题定位阈值,在计算机设备中存储每种网络特征的问题定位阈值。当计算机设备得到待分析的网络数据后,计算机设备会获取网络数据中每种网络特征的取值,判断每种网络特征的取值是否低于对应的问题定位阈值,若某一种网络特征的取值低于问题定位阈值,则定位该网络数据为异常网络数据问题,并输出该低于问题定位阈值的网络特征,作为问题定位结果。

在实现本公开的过程中,发明人发现相关技术至少存在以下问题:

通过专家设置网络特征的问题定位阈值的方式效率太低,导致问题定位的效率太低。



技术实现要素:

本公开实施例提供了一种kqi的问题定位方法及装置,能够解决相关技术中问题定位的效率过低的技术问题,所述技术方案如下:

第一方面,提供了一种kqi的问题定位方法,应用于计算机设备中,所述方法包括:

获取多个样本网络数据,每个样本网络数据包括业务的kqi的取值以及处理所述业务时网络的至少一种网络特征的取值;

基于所述多个样本网络数据,从所述至少一种网络特征中选取所述kqi对应的网络特征,得到至少一种目标网络特征;

对所述多个样本网络数据以及所述至少一种目标网络特征进行分析,生成所述至少一种目标网络特征的问题定位阈值;

当接收到网络数据时,基于所述至少一种目标网络特征的问题定位阈值以及所述网络数据,输出所述kqi的问题定位结果。

本实施例提供的方法,通过对大量样本网络数据进行数据挖掘,自动发现出与kqi具有相关性的目标网络特征,还自动生成了每种目标网络特征的问题定位阈值,极大地提高了确定问题定位阈值的效率,同时加快了确定问题定位阈值的速度,同时极大地提高了目标网络特征的问题定位阈值的精确性,能够高效、快速地、精准地定位kqi的问题。

在一种可能的实现中,所述对所述多个样本网络数据以及所述至少一种目标网络特征进行分析,生成所述至少一种目标网络特征的问题定位阈值,包括:

基于所述多个样本网络数据,对所述kqi以及所述至少一种目标网络特征进行关联分析,得到kqi与网络特征之间的关联规则,所述关联规则包括kqi的至少一种取值以及对应的至少一种目标网络特征的问题定位阈值;

根据所述kqi的目标取值,查询所述关联规则,得到所述目标取值对应的至少一个问题定位阈值。

在一种可能的实现中,所述对所述kqi以及所述至少一种目标网络特征进行关联分析,得到kqi与网络特征之间的关联规则,得到kqi与网络特征之间的关联规则,包括:

采用关联规则挖掘算法,对所述多个样本网络数据进行计算,得到至少一个频繁项集,每个频繁项集包括kqi的一种取值以及网络特征的一种取值;

根据所述多个样本网络数据,获取每个频繁项集的置信度,频繁项集的置信度是指在kqi为所述频繁项集中的取值的条件下,多个样本网络数据中网络特征取所述频繁项集中的取值的概率;

根据每个频繁项集的置信度,从所述至少一个频繁项集中选取关联规则。

在一种可能的实现中,所述基于所述多个样本网络数据,从所述至少一种网络特征中选取所述kqi对应的网络特征,得到至少一种目标网络特征,包括:

基于所述多个样本网络数据,获取所述至少一种网络特征的重要度,所述重要度用于指示对应网络特征的取值与kqi的取值之间的相关程度;

基于所述至少一种网络特征的重要度,从所述至少一种网络特征中选取所述kqi对应的网络特征。

本实现中,重要度能够度量网络特征的重要性,用于指示对应网络特征的取值与kqi的取值之间的相关程度,例如重要度越高,对应网络特征的取值与kqi的取值之间越相关,即对应网络特征的取值对kqi的取值的影响越大。

在一种可能的实现中,计算机设备可以采用机器学习算法,获取网络特征的重要度。

在一种可能的实现中,所述基于所述多个样本网络数据,获取所述至少一种网络特征的重要度,包括:

根据所述多个样本网络数据,训练得到随机森林模型,所述随机森林模型用于根据输入的至少一种网络特征的取值,输出kqi的取值;

根据至少一个验证数据,获取所述随机森林模型的第一误差率;

对于所述至少一种网络特征中的任一网络特征,对所述至少一个验证数据中所述网络特征的取值进行干扰;

根据干扰后的至少一个验证数据,获取所述随机森林模型的第二误差率;

根据所述第一误差率与第二误差率之间的差距,得到所述网络特征的重要度。

在一种可能的实现中,所述基于所述多个样本网络数据,获取所述至少一种网络特征的重要度,包括:

对所述至少一种网络特征进行划分,得到多个网络特征集合,每个网络特征集合中的网络特征对应于通信网络中的同一层;

对于每个网络特征集合,基于所述多个样本网络数据,获取所述网络特征集合中至少一种网络特征的重要度。

在一种可能的实现中,所述基于所述至少一种目标网络特征的问题定位阈值以及所述网络数据,输出所述kqi的问题定位结果,包括:

获取所述网络数据所属的类;

基于所述类对应的至少一种目标网络特征的问题定位阈值以及所述网络数据,输出所述kqi的问题定位结果。

在一种可能的实现中,所述对所述多个样本网络数据以及所述至少一种目标网络特征进行分析,生成所述至少一种目标网络特征的问题定位阈值:包括:

对所述多个样本网络数据进行聚类,得到多个类;或,按照预设分类条件,对所述多个样本网络数据进行分类,得到多个类;

对于所述多个类中的每个类,对所述类中的样本网络数据以及所述至少一种目标网络特征进行分析,生成所述类的至少一种目标网络特征的问题定位阈值。

在一种可能的实现中,所述基于所述至少一种目标网络特征的问题定位阈值以及所述网络数据,输出所述kqi的问题定位结果,包括:

获取所述网络数据中所述至少一种目标网络特征的取值,得到至少一个取值;

对所述至少一个取值与对应的问题定位阈值进行差距分析,得到至少一种待优化网络特征,所述待优化网络特征是指取值未达到问题定位阈值的网络特征;

根据所述至少一种待优化网络特征,得到所述kqi的问题定位结果。

在一种可能的实现中,所述获取多个样本网络数据,包括:

获取多个历史业务数据以及多个历史网络数据,每个历史业务数据包括业务的kqi的取值,每个历史网络数据包括历史处理所述业务时网络的至少一种网络特征的取值;

根据每个历史业务数据的记录时间以及每个历史网络数据的记录时间,对记录时间属于同一记录时间段的历史业务数据以及历史网络数据进行拼接,得到样本网络数据。

第二方面,提供了一种kqi的问题定位装置,应用于计算机设备中,所述装置包括多个功能模块,以实现上述第一方面以及第一方面的任一种可能实现的kqi的问题定位方法。

第三方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令,所述指令由所述处理器加载并执行以实现上述第一方面以及第一方面的任一种可能实现的kqi的问题定位方法。

第四方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令,所述指令由处理器加载并执行以实现上述第一方面以及第一方面的任一种可能实现的kqi的问题定位方法。

附图说明

图1是本公开实施例提供的一种实施环境的示意图;

图2是本公开实施例提供的一种计算机设备的结构示意图;

图3是本公开实施例提供的一种kqi的问题定位方法的流程图;

图4是本公开实施例提供的一种网络特征的重要度的示意图;

图5是本公开实施例提供的一种kqi的问题定位的效果示意图;

图6是本公开实施例提供的一种kqi的问题定位方法的原理示意图;

图7是本公开实施例提供的一种kqi的问题定位方法的系统架构图;

图8是本公开实施例提供的一种kqi的问题定位装置的结构示意图。

具体实施方式

为使本公开的目的、技术方案和优点更加清楚,下面将结合附图对本公开实施方式作进一步地详细描述。

图1是本公开实施例提供的一种实施环境的示意图。该实施环境包括多个计算机设备101以及多个终端102。该多个计算机设备101通过无线或有线网络和多个终端102连接,每个计算机设备101可以为是一台服务器,或者由若干台服务器组成的服务器集群,或者是一个云计算服务中心,或者为个人电脑,每个终端102可以为个人电脑、智能手机、平板电脑或者其他电子设备。

在对kqi进行问题定位的过程中,计算机设备101使用的大量样本网络数据可以来自终端102,计算机设备101可以对大量样本网络数据进行分析,生成用于定位kqi问题的问题定位阈值。在定位kqi问题的过程中,终端102可以向计算机设备101提供网络数据,计算机设备101可以基于网络数据以及问题定位阈值,输出kqi的问题定位结果。可选地,计算机设备101还可以具有至少一种数据库,用于存储终端102提供的网络数据。

图2是本公开实施例提供的一种计算机设备的结构示意图,该计算机设备200可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(centralprocessingunits,cpu)201和一个或一个以上的存储器202,其中,该存储器202中存储有至少一条指令,该至少一条指令由该处理器201加载并执行以实现下述方法实施例提供的kqi的问题定位方法。当然,该计算机设备还可以具有有线或无线网络接口以及输入输出接口等部件,以便进行输入输出,该计算机设备还可以包括其他用于实现设备功能的部件,在此不做赘述。

在示例性实施例中,还提供了一种存储有计算机程序的计算机可读存储介质,例如存储有计算机程序的存储器,上述计算机程序被处理执行时实现下述实施例中所示的kqi的问题定位方法。例如,上述计算机可读存储介质可以是只读内存(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、只读光盘(compactdiscread-onlymemory,cd-rom)、磁带、软盘和光数据存储设备等。

图3是本公开实施例提供的一种kqi的问题定位方法,该方法的执行主体为计算机设备,参见图3,该方法包括:

301、计算机设备获取多个样本网络数据。

样本网络数据:包括业务的kqi的取值以及处理业务时网络的至少一种网络特征的取值,样本网络数据用于供计算机设备分析kqi相关的目标网络特征以及每种目标网络特征的问题定位阈值。

关于样本网络数据对应的业务,该业务可以为任一种向用户提供数据的业务,包括而不限于流媒体业务、浏览网页、下载文件、收发邮件、网络电话(voiceoverinternetprotocol,voip)、超文本传输协议(hypertexttransferprotocol,http)业务、即时通讯(instantmessaging,im)业务、文件传输协议(filetransferprotocol、ftp)业务、对等网络(peertopeer,p2p)业务等。其中,流媒体业务包括而不限于播放和/或下载视频、播放和/或下载音乐、视频直播等。

业务的kqi为针对不同业务提出的贴近用户感受的业务的质量参数,可以根据业务的类型确定,以业务为播放和/或下载视频为例,业务的kqi主要包括下载速率、初缓时延、卡顿次数和播放成功率等,以业务为http业务为例,业务的kqi可以包括首包时延、页面打开时延、剩余电量、页面大小、是否成功状态、页面请求响应时长、业务登录失败等,以业务为ftp业务为例,业务的kqi可以包括上/下行峰值速率、上/下行平均速率等,以业务为im业务为例,业务的kqi可以包括发送尝试次数、发送成功次数、接收成功次数、消息类型等。

关于样本网络数据中的网络特征,该网络特征可以用于指示网络通信的质量,网络特征包括而不限于参考信号接收功率(referencesignalreceivingpower,rsrp)、信道质量信息(channelqualityinformation,cqi)、信号干扰噪声比(signaltointerferenceplusnoiseratio,sinr)、无线链路承载(radiobear,rb)、调制与编码策略(modulationandcodingscheme,mcs)、参考信号接收质量(referencesignalreceivingquality,rsrq)、下行参考信号接收质量(downlinkreferencesignalreceivingquality,dlrsrq)、下行误块率(downlinkblockerrorrate,dlbler)、下行传输带宽(downlinktransmissionbandwidth,dlrb)、用户设备功率余量报告(userequipmentpowerheadroom,uephr)、时间提前量(timingadvance,ta)、下行调制与编码策略(downlinkmodulationandcodingscheme,dlmcs)、主服务小区的电平强度、激活用户数、覆盖、干扰、吞吐量、物理资源块(physicalresourceblock,prb)利用率等。

网络特征可以适用于各种无线网络制式,包括而不限于全球移动通信系统(globalsystemformobilecommunication,gsm)、通用移动通信系统(universalmobiletelecommunicationssystem,umts),码分多址(codedivisionmultipleaccess,cdma)、长期演进(longtermevolution,lte)、5g等。

本公开实施例中,计算机设备可以获取多个样本网络数据,以便根据样本网络数据分析出kqi关联的目标网络特征以及目标网络特征的问题定位阈值。

在一种可能的实现方式中,获取样本网络数据的过程可以包括以下步骤一至步骤二:

步骤一、计算机设备获取多个历史业务数据。

历史业务数据包括业务的kqi的取值,历史业务数据可以为历史时间段内处理业务时生成的记录,该历史时间段可以为以当前时间点为结束点、时长为预设时长的时间点,例如为最近一个月、最近一周等。

可选地,历史业务数据可以为接口(xdr)数据,xdr数据是指基于控制面的全量信令数据以及用户面的全量业务数据进行处理后,生成的供应用系统使用的信令以及业务的详细记录。另外,历史业务数据也可以为话统数据、工参数据等。以业务为下载视频的业务为例,历史业务数据可以为视频业务的话单。

关于计算机设备获取历史业务数据的方式,计算机设备可以从提供业务的服务方拉取多个历史业务数据,也可以接收其他设备发送的多个历史业务数据,也可以检测输入操作,得到输入的历史业务数据等,本实施例对此不做限定。

可选地,当得到多个历史业务数据后,计算机设备可以对多个历史业务数据进行预处理,根据预设筛选条件,从多个历史业务数据中筛选出符合预设筛选条件的历史业务数据,以便后续根据筛选出的历史业务数据进行处理。以历史业务数据为视频业务的话单为例,预设筛选条件可以包括:话单中的有效标识=1,话单的结束时间与开始时间之前的时间差大于预设阈值。其中,该有效标识可以表示为flag,该时间差可以表示为valid_duration_threshold。

步骤二、计算机设备获取多个历史网络数据。

历史网络数据包括历史处理业务时网络的至少一种网络特征的取值,历史网络数据可以为历史时间段内对网络的测量报告,例如为终端反馈给接入网设备的无线网络信息,比如可以用于上报主服务小区的电平强度,信道质量,rb等信息。

可选地,历史业务数据可以包括呼叫记录系统(callhistoryrecord,chr)、测量报告(measurementresult,mr)、接入网设备的配置文件等,该接入网设备可以包括演进型nodeb(evolvednodeb,enodeb)、基站、无线访问接入点(wirelessaccesspoint,ap)等。

步骤三、计算机设备根据每个历史业务数据的记录时间以及每个历史网络数据的记录时间,对记录时间属于同一记录时间段的历史业务数据以及历史网络数据进行拼接,得到样本网络数据。

记录时间段为记录时间所处的时间段,可以根据记录时间以及预设时长确定,例如记录时间段的起始点可为以记录时间之前预设时长的时间点,记录时间段的结束点可以为记录时间之后预设时长的时间点。比如记录时间为4月24日,记录时间段可以为4月23日至4月25日。

计算机设备可以获取每个历史业务数据的记录时间以及每个历史网络数据的记录时间,对于每个历史业务数据以及每个历史网络数据,当两种数据的记录时间属于同一历史时间段时,对两种数据进行拼接,将拼接后的数据作为样本网络数据。那么,样本网络数据可以看作历史业务数据和历史网络数据的合并,既包括记录时间段内业务的kqi的取值,又包括记录时间段内处理业务时网络的至少一种网络特征的取值。

在一种可能的实现中,对于多个历史业务数据中的每个历史业务数据,计算机设备可以获取该历史业务数据的记录时间,根据该记录时间以及预设时长,确定该记录时间所处的记录时间段,再从多个历史网络数据中,选取出记录时间属于该记录时间段的历史网络数据,对得到的历史网络数据与该历史业务数据分别进行拼接。以历史业务数据为xdr话单、历史网络数据为chr数据为例,可以根据xdr话单的记录时间以及拼接的过程,将xdr话单与记录时间段内的所有chr数据关联起来。

可选地,当得到历史业务数据和历史网络数据后,可以根据历史业务数据和历史网络数据中找出要研究的网络特征。例如,可以根据历史业务数据中每个字段的标识,从大量网络特征中选择业务相关的网络特征,又如,可以根据历史网络数据中每个字段的含义,从历史网络数据中提取出含义为网络特征的字段,从而从字段中提取网络特征的取值。

需要说明的是,上述仅是以通过拼接历史网络数据和历史业务数据,得到样本网络数据为例进行说明,在一个可能的实施例中,计算机设备也可以通过其他方式得到样本网络数据,例如可以从数据库、服务器、网站中下载样本网络数据,或接收输入的样本网络数据,或从存储设备中读取样本网络数据等。

可选地,当得到多个样本网络数据后,可以先对样本网络数据进行数据清洗,得到清洗后的样本网络数据,以便根据清洗后的样本网络数据选取目标网络特征。通过进行数据清洗,可以清洗掉无用的样本网络数据,从而提高样本网络数据的质量,进而提高后续生成的问题定位阈值的准确性。同时,可以让样本网络数据更好地适应后续数据挖掘的过程。

针对数据清洗的具体实现方式,数据清洗可以包括噪声数据清洗、异常数据清洗等,噪声数据清洗可以为从样本网络数据中清洗出空值数据、从样本网络数据中清洗出错误值或偏离期望的孤立点值等,以免噪声数据导致错误的数据分析结果。异常数据清洗可以包括过滤掉距中心点较远的异常样本网络数据、剔除超出业务的实际取值的样本网络数据等。

302、计算机设备基于多个样本网络数据,从至少一种网络特征中选取kqi对应的网络特征,得到至少一种目标网络特征。

本实施例以kqi相关的网络特征称为目标网络特征为例进行描述,目标网络特征的取值与kqi的取值之间强相关,即,目标网络特征的取值会对kqi的取值产生较大的影响,可以将目标网络特征看作所有网络特征中比较重要的网络特征。

计算机设备可以通过特征选择,得到目标网络特征。具体来说,在得到多个样本网络数据后,计算机设备可以对多个样本网络数据进行分析,从多个样本网络数据中包含所有的网络特征中,选取kqi对应的网络特征作为目标网络特征,以便后续针对目标网络特征进行关联分析。

在一种可能的实现中,选取目标网络特征的过程可以包括以下步骤一至步骤二:

步骤一、基于多个样本网络数据,获取至少一种网络特征的重要度。

重要度能够度量网络特征的重要性,用于指示对应网络特征的取值与kqi的取值之间的相关程度,例如重要度越高,对应网络特征的取值与kqi的取值之间越相关,即对应网络特征的取值对kqi的取值的影响越大。

关于获取网络特征的重要度的具体实现,计算机设备可以采用机器学习算法,获取网络特征的重要度。具体来说,可以采用多个样本网络数据进行模型训练,得到机器学习模型,该机器学习模型用于根据输入的至少一种网络特征的取值预测kqi的取值,可以根据网络特征的取值对机器学习模型的性能的影响,输出网络特征的重要度,其中若网络特征的取值对机器学习模型的性能的影响越高,则重要度越高。

其中,该机器学习模型可以为随机森林模型、支持向量机(supportvectormachine,svm)、adaboost、梯度提升决策树(gradientboostdecisiontree,gbdt)算法等等。考虑到网络特征与kqi之间的关系通常是非线性的,可以采用基于树的机器学习模型,例如随机森林模型,来获取网络特征的重要度。

以采用随机森林算法进行特征选择为例,特征选择的具体过程可以包括以下步骤(1)至(5):

(1)根据多个样本网络数据,训练得到随机森林模型。

计算机设备可以根据多个样本网络数据,采用随机森林算法进行模型训练,得到随机森林模型,随机森林模型用于根据输入的至少一种网络特征的取值,输出kqi的取值,其中,随机森林模型可以包括多个决策树,每个决策树为一个分类器,能够根据网络特征的取值输出kqi的预测取值,随机森林模型可以根据多颗决策树的kqi的预测取值,投票选取出kqi的最终取值。

(2)根据至少一个验证数据,获取随机森林模型的第一误差率。

验证数据是指用来验证已训练的随机森林模型性能的网络数据,针对获取验证数据的过程,计算机设备可以预先从样本网络数据中预留出部分网络数据,作为验证数据,采用除了验证数据以外的网络数据,训练得到随机森林模型,在得到随机森林模型后,可以根据预留的验证数据得到第一误差率。

示例性地,结合随机森林模型,验证数据可以为袋外数据(outofbag,oob)。针对oob的具体含义,在训练随机森林模型的过程中,每次建立决策树时,会通过重复抽样,将抽样的数据训练决策树,而还有大约1/3的数据没有被使用,未参与决策树的建立,这些未使用的数据即为oob,可以用于对随机森林模型的性能进行评估,得到随机森林模型中每颗决策树预测错误的概率,即第一误差率。

关于获取第一误差率的过程,对于该至少一个验证数据中的每个验证数据,可以获取验证数据中至少一种网络特征的取值,将至少一种网络特征的取值输入至随机森林模型,随机森林模型会输出kqi的预测取值,可以根据kqi的预测取值与验证数据中kqi的取值,判断随机森林模型是否预测错误,当遍历了至少一个验证数据后,可以根据随机森林模型预测错误的验证数据的数量以及验证数据的总数量,得到第一误差率。

其中,第一误差率是指随机森林模型对加扰前的验证数据的误差率,第一误差率用于指示随机森林模型根据加扰前的验证数据中的网络特征的取值,预测kqi的取值的误差程度,可以为加扰前的验证数据中预测错误的验证数据的数量与加扰前的验证数据的总数量之间的比值。第一误差率可以称为袋外数据误差,可以记为error1。

(3)对于至少一种网络特征中的每个网络特征,对至少一个验证数据中网络特征的取值进行干扰。

关于对网络特征的取值进行干扰的具体过程,对于每个网络特征,可以改变至少一个验证数据中该网络特征的取值,例如将该网络特征的取值置为随机值,这一过程可以看作对网络特征加入了随机噪声,通过对网络特征加入噪声,可以通过观测随机森林模型性能的改变,分析网络特征的重要度。

(4)根据干扰后的至少一个验证数据,获取随机森林模型的第二误差率。

第二误差率是指随机森林模型对加扰后的验证数据的误差率,第二误差率用于指示随机森林模型根据加扰后的验证数据中的网络特征的取值,预测kqi的取值的误差程度,可以为加扰后的验证数据中预测错误的验证数据的数量与加扰后的验证数据的总数量之间的比值。第二误差率也可以称为袋外数据误差,可以记为erroob2。获取第二误差率的过程与上述获取第一误差率的过程同理,在此不做赘述。

(5)根据第一误差率与第二误差率之间的差距,得到网络特征的重要度。

当得到第一误差率和第二误差率以后,可以获取第一误差率与第二误差率之间的差距,根据第一误差率与第二误差率之间的差距,得到网络特征的重要度。例如,可以获取随机森林模型中决策树的总数量,计算差距与该总数量的比值,将该比值作为网络特征的重要度。

通过上述(1)-(5),得到的重要度可以准确地度量网络特征的重要性:若给任一个网络特征随机加入噪声之后,随机森林模型的误差率大幅度升高,表明这个网络特征对于样本网络数据的分类结果的影响很大,因此能够证明该网络特征的重要性比较强,也即是,误差率的差距能够直观反映网络特征的重要程度。

步骤二、基于至少一种网络特征的重要度,从至少一种网络特征中选取kqi相关的网络特征。

本步骤二可以包括以下两种实现方式:

实现一、可以设置重要度阈值,当得到每种网络特征的重要度以后,判断每种网络特征的重要度是否超过该重要度阈值,当网络特征的重要度超过该重要度阈值,认为该网络特征与kqi相关,则选取该网络特征作为目标网络特征,从而将至少一种网络特征中重要度超过重要度阈值的网络特征均筛选出来。其中,该重要度阈值可以根据人为设定或根据经验设定。

实现二、可以设置目标网络特征的数目,当得到每种网络特征的重要度以后,对至少一种网络特征按照重要度从高到低的顺序排序,从至少一种网络特征中选取重要度排在前目标网络特征的数目的网络特征,作为kqi相关的目标网络特征。其中,该目标网络特征的数目可以根据人为设定或根据经验设定。

示例性地,请参见图3,以kqi为视频的下载速率为例,某局点的样本网络数据中包含几十个网络特征,通过对样本网络数据进行分析后,得到各种网络特征的重要度如图3所示,可以直观地看出,dlrb、dlmcs、cqi、dlbler的重要度排在前几位,则可以认为dlrb、dlmcs、cqi、dlbler是kqi的主要影响因素,则从几十个网络特征中将dlrb、dlmcs、cqi、dlbler筛选出来,作为目标网络特征。

通过执行上述特征选择的过程,可以达到以下技术效果:

在样本网络数据中,网络特征的数量往往较多,其中可能存在与kqi不相关的网络特征,这些不相关的网络特征可以看作为噪声,会对后续数据分析的过程产生干扰,影响问题定位阈值的准确性。而本公开实施例中,通过筛选出kqi相关的目标网络特征,根据目标网络特征进行数据分析,过滤掉了不相关的网络特征,避免了不相关的网络特征造成的干扰,提高了问题定位阈值的准确性。另外,由于网络特征的个数越多,数据分析所需的时间也就越长,通过剔除了不相关的、亢余的网络特征,减少了所需分析的网络特征的个数,减少了分析时间,同时简化了关联规则,提升了关联规则的解释性。

可选地,在进行特征选择的过程中还可以对特征进行分层,分别分析每个层中的不同特征之间的重要度,从而提高网络特征重要度的准确性。具体来说,对特征分层的过程可以包括以下步骤一至步骤二:

步骤一、对至少一种网络特征进行划分,得到多个网络特征集合,每个网络特征集合中的网络特征对应于通信网络中的同一层。

通信网络中通常采用层次式结构,包括多个层,例如包括应用层、表示层、会话层、传输层、网络层、数据链路层、物理层等,不同层实现不同的功能,具有不同的网络特征。

本实施例中,可以结合通信网络中层的概念,由计算机设备确定每个网络特征对应的层,将同一层对应的网络特征划分为一个网络特征集合,例如将网络层的所有网络特征划分为网络特征集合1,将数据链路层的所有网络特征划分为网络特征集合2等,则对至少一种网络特征进行划分后,可以得到多个网络特征集合。

步骤二、对于每个网络特征集合,基于多个样本网络数据,获取网络特征集合中至少一种网络特征的重要度。

计算机设备可以对每个网络特征集合分别执行特征选择的步骤,其中对于每个网络特征集合来说,获取该网络特征集合中网络特征的重要度的步骤与上述特征选择的步骤(1)至(5)同理,在此不做赘述。

303、计算机设备对多个样本网络数据以及至少一种目标网络特征进行分析,生成至少一种目标网络特征的问题定位阈值。

计算机设备选择出至少一种目标网络特征后,可以通过对多个样本网络数据以及至少一种目标网络特征进行分析,自动地生成每种目标网络特征的问题定位阈值。其中,问题定位阈值用于指示网络数据中目标网络特征未出现问题时的临界取值,当目标网络特征的取值未达到问题定位阈值时,即认为目标网络特征方面出现了问题,例如对于取值越大越好的网络特征来说,网络特征的问题定位阈值可以用于指示该网络特征的最低取值。

本实施例中,通过计算机设备自动生成问题定位阈值,而无需专家人工总结问题定位阈值,极大地加快了确定目标网络特征的问题定位阈值的速度,提高了确定目标网络特征的问题定位阈值的效率,同时保证了目标网络特征的问题定位阈值的精确性。

在一种可能的实现中,生成问题定位阈值的具体过程可以包括以下步骤一至步骤二:

步骤一、计算机设备基于多个样本网络数据,对kqi以及至少一种目标网络特征进行关联分析,得到kqi与目标网络特征之间的关联规则。

关联分析是指根据大量数据分析不同数据之间的关联性的过程,关联规则是关联分析的结果,用于描述不同数据之间的关联性,刻画不同数据同时出现的规律。示例性地,关联规则可以为形如a->b的表达式,含义为由于a的发生会引起b的发生。

本实施例中,可以采用关联分析的方法,对kqi与目标网络特征之间进行关联分析,挖掘出kqi与目标网络特征之间的联系,从而生成kqi与目标网络特征之间的关联规则,该关联规则包括kqi的至少一种取值以及对应的至少一种目标网络特征的问题定位阈值。该关联规则中kqi取不同取值时,目标网络特征的问题定位阈值可以不同,该关联规则能够指示在kqi取任一取值的条件下,每种网络特征的问题定位阈值。其中,关联规则可以包括多个条目,每个条目包括kqi的一种取值以及对应的至少一种目标网络特征的问题定位阈值。

示例性地,以kqi为视频的下载速率,视频的下载速率对应的目标网络特征包括dlbler、cqi、dlrsrq、dlrb、dlmcs、uephr、ta为例,下载速率与目标网络特征之间的关联规则可以如下表1所示,该关联规则中kqi的取值包括14、23、34、57,其中kqi取14时,dlbler的问题定位阈值为16.8%,cqi的问题定位阈值为8,不同取值的kqi对应的目标网络特征的问题定位阈值不同。

表1

针对关联分析的具体实现方式,示例性地,可以通过以下(1)至(3)实现:

(1)采用关联规则挖掘算法,对多个样本网络数据进行计算,得到至少一个频繁项集。

首先结合关联分析的原理以及本公开实施例的应用场景,对本步骤(1)涉及的一些术语进行解释,以便读者理解。

项目:数据库中的一个字段,在本公开实施例中,项目可以为一种网络特征,例如项目可以为cqi、dlrb,另外项目也可以为kqi的一种取值,例如为14。

项集:一次事务中若干项目组成的集合,在本公开实施例中,项集可以为样本网络数据中的目标网络特征的取值以及kqi的取值组成的集合,例如为{kqi(14)、cqi(8)、dlrb(15)、dlrsrq(-110)}。

k项集:包含k个项目的项集称为k-项集,例如{cqi}可以称为1-项集,{cqi,dlrb}可以称为2-项集。

支持度:项集{3,y}在总项集中出现的概率,在本公开实施例中,支持度可以为某一项集在所有样本网络数据中出现的概率。

频繁项集:支持度大于支持度阈值的项集。

本实施例中,计算机设备可以调用关联规则挖掘算法,对多个样本网络特征进行计算,得到频繁项集。其中,该关联规则挖掘算法可以包括apriori算法、fp-growth算法等。

以apriori算法为例,apriori算法采用逐层搜索的迭代方法,先找出候选的频繁1-项集,通过候选的频繁1-项集找出候选的频繁2-项集,再通过候选的频繁2-项集找出候选的频繁3-项集,以此类推,直至无法找到候选的频繁k-项集为止。之后,对找出的所有候选的频繁项集进行剪枝,即,获取每个候选的频繁项集的支持度,根据每个候选的频繁项集的支持度,删除支持度低于支持度阈值的候选的频繁项集,最终得到所有支持度符合要求的频繁项集,将。而fp-growth算法会将所有的候选频繁项集压缩到一颗频繁模式树中,从树形结构中直接得到频繁项集。

(2)根据多个样本网络数据,获取每个频繁项集的置信度。

频繁项集{x->y}的置信度是指在x发生的条件下,发生y的条件概率。本公开实施例中,频繁项集的置信度可以为在kqi为频繁项集中的取值的条件下,样本网络数据中网络特征取频繁项集中的取值的概率。

举例来说,假设某频繁项集为{kqi(14)、cqi(8)、dlrb(15)},该频繁项集的置信度可以为kqi取14的条件下,所有样本网络数据中cqi取8,dlrb取15的概率。

关于获取频繁项集的置信度的过程,计算机设备在找到至少一个频繁项集后,对于该至少一个频繁项集中的每个频繁项集,可以获取该频繁项集中kqi的取值以及网络特征的取值,根据频繁项集中kqi的取值以及网络特征的取值,获取频繁项集的置信度。示例性地,以kqi的取值为a,网络特征的取值为b为例,可以获取所有样本网络数据同时包含a、b的数量与包含a的数量之间的比例,将该比例作为频繁项集的置信度。以置信度表示为confidence为例,置信度的计算公式可以为:confidence(a->b)=(a∪b)/a。

(3)根据每个频繁项集的置信度,从至少一个频繁项集中选取关联规则。

当得到每个频繁项集的置信度后,可以根据每个频繁项集的置信度,从至少一个频繁项集中选取置信度较高的频繁项集,作为关联规则。

例如,可以设置置信度阈值,从至少一个频繁项集中选取置信度高于该置信度阈值的频繁项集,将该频繁项集作为关联规则。又如,可以对至少一个频繁项集按照置信度从高到低的顺序排序,从至少一个频繁项集中选取置信度排在前预设数目的频繁项集,将这些频繁项集作为关联规则。

可选地,当选取出关联规则后,可以使用验证数据对关联规则进行验证,从而基于验证结果剔除关联规则中不满足条件的条目。举例来说,对于关联规则中的任一条目,可以根据验证数据中kqi的取值以及网络特征的取值,判断验证数据是否符合该条目,统计符合条目的验证数据的总数量,当该总数量未达到预设阈值时,从关联规则中删除该条目,当该总数量达到预设阈值时,保留该条目。

步骤二、计算机设备根据kqi的目标取值,查询关联规则,得到目标取值对应的至少一个问题定位阈值。

计算机设备可以获取kqi的目标取值,根据kqi的目标取值查询关联规则,从关联规则中得到该kqi的目标取值对应的至少一个问题定位阈值,以便根据该至少一个问题定位阈值定位kqi的问题。例如,假设kqi的目标取值为14,关联规则如上表1,则计算机设备查询关联规则后,可以得到dlbler的问题定位阈值为16.8%,cqi的问题定位阈值为8,dlrsrq的问题定位阈值为-110,dlrb的问题定位阈值为13.6等。

关于kqi的目标取值的确定方式,kqi的目标取值可以根据实际业务需求确定,例如可以根据网络布设的地理区域、业务的类型确定,比如北京市区的kqi的目标取值可以较高,偏远山区的kqi的目标取值可以较低等。关于获取kqi的目标取值的过程,可选地,计算机设备可以接收kqi的目标取值,例如计算机设备可以检测输入操作,得到用户输入的kqi的目标取值。

可选地,在上述生成问题定位阈值的方式的基础上,考虑到网络环境以及业务的复杂多变,可以将大量的样本网络数据划分为不同的类(cluster),为每个类的样本网络数据生成对应的问题定位阈值,如此,可以保证问题定位阈值更加针对性,精确性更高,另外不同场景下网络数据的问题定位阈值可以不同,从而实现网络场景的差异化。

关于将样本网络数据划分为类的具体过程,在此提供以下两种示例性实现方式:

方式一、计算机设备可以采用聚类的方式,对多个样本网络数据进行聚类,得到多个类,每个类包括至少一个样本网络数据。

具体来说,计算机设备可以获取预设聚类数目,根据该预设聚类数目对多个样本网络数据进行聚类,聚类后会得到多个类,该多个类的总数目为该预设聚类数目,每个类中不同的网络数据的相似性较高,不同类中网络数据的相似度较小。

以采用k-means算法对多个样本网络数据进行聚类为例,假设预设聚类数目为k,采用k-means算法进行聚类的过程,可以包括以下(1)至(5):

(1)从所有样本网络数据中,任选k个样本网络数据,作为k个初始化的类。

(2)将剩余的每个样本网络数据分别与k个初始化的类一一比较,计算每个样本网络数据与k个初始化的类之间的距离。

(3)对于剩余的每个样本网络数据,基于该样本网络数据与k个初始化的类之间的距离,对k个距离按照距离大小的顺序排序,从k个初始化的类中选取最小的距离对应的初始化的类,将该剩余的样本网络数据归入到该初始化的类中,从而将所有样本网络数据分成k个类。

(4)对于每个类,对该类中包括的所有样本网络数据进行平均值计算,得到类的平均值,作为类的中心值。

(5)将k个类对应的中心值作为新的比较对象,获取所有样本网络数据与k个中心值的距离,循环执行在所有样本网络数据中分出k个类,并计算类的中心值的步骤,直到循环次数大于预设的循环次数为止。

通过(1)至(5),可以得到k个类,该k个类即为对所有样本网络数据进行聚类后,得到的聚类结果。

本方式一中,计算机设备采用了无监督学习的方式得到了多个类,即,计算机设备可以无需获知样本网络数据中存在哪些类,每个样本网络数据无需带有类别标记,可以通过聚类的方式,根据不同样本网络数据之间的距离,自动地将相似的样本网络数据聚成一类。

方式二、计算机设备可以采用分类的方式,按照预设分类条件,对多个样本网络数据进行分类,得到多个类。

计算机设备可以获取预设分类条件,按照预设分类条件,识别每个样本网络数据的类,从而将多个样本网络数据分为多个类。举例来说,聚类的方式可以包括以下示例一至示例四:

示例一、按照每个样本网络数据来自的局点,对多个样本网络数据进行分类。

本示例中,预设分类条件可以为将局点相同的样本网络数据分为一个类。

计算机设备获取的不同的样本网络数据可以来自于不同的局点,由不同的局点生成和提供,例如样本网络数据a来自于北京市的局点,样本网络数据b来自于廊坊市的局点等,每个样本网络数据中可以标记其来自的局点,计算机设备可以识别每个样本网络数据的局点,按照每个样本网络数据来自的局点,对多个样本网络数据进行聚类,从而将同一局点提供的样本网络数据聚成一个类,不同局点提供的样本网络数据聚成不同的类。

示例二、按照每个样本网络数据所属的小区,对多个样本网络数据进行聚类。

本示例中,预设分类条件可以为将小区相同的样本网络数据分为一个类。

计算机设备获取的不同的样本网络数据可以属于不同的小区,每个样本网络数据中可以标记其来自的局点,计算机设备可以识别每个样本网络数据所属的小区,按照每个样本网络数据所属的小区,对多个样本网络数据进行聚类,从而将同一小区对应的样本网络数据聚成一个类,不同小区提供的样本网络数据聚成不同的类。

示例三、按照每个样本网络数据中kqi的类型,对多个样本网络数据进行聚类。

本示例中,预设分类条件可以为将kqi的类型相同的样本网络数据分为一个类。

计算机设备获取的不同的样本网络数据的kqi的类型可以不同,例如样本网络数据a的kqi的类型为视频下载速率,样本网络数据b的kqi的类型为页面打开时延等,每个样本网络数据中可以标记其对应的kqi的类型,例如样本网络数据可以包括kqi名称字段,该kqi名称字段携带了kqi的类型。计算机设备可以识别每个样本网络数据中kqi的类型,按照每个样本网络数据中kqi的类型,对多个样本网络数据进行聚类,从而将同一类型的kqi对应的样本网络数据聚成一个类,不同类型的kqi对应的样本网络数据聚成不同的类。

示例四、按照每个样本网络数据中业务的类型,对多个样本网络数据进行聚类。

本示例中,预设分类条件可以为将业务的类型相同的样本网络数据分为一个类。

计算机设备获取的不同的样本网络数据的业务的类型可以不同,例如样本网络数据a的业务的类型为下载视频,样本网络数据b的业务的类型为网络电话等,每个样本网络数据中可以标记其业务的类型,计算机设备可以识别每个样本网络数据中业务的类型,按照每个样本网络数据中业务的类型,对多个样本网络数据进行聚类,从而将同一类业务的样本网络数据聚成一个类,不同类业务的样本网络数据聚成不同的类。

步骤二、生成每个类对应的至少一种目标网络特征的问题定位阈值。

本步骤可以包括以下步骤(1)至步骤(2):

(1)对于聚类后得到的每个类,基于类中的多个样本网络数据,对kqi以及至少一种目标网络特征进行关联分析,得到kqi与目标网络特征之间的关联规则,作为该类的关联规则。

通过对每个类进行关联分析,可以分别得到每个类的关联规则,从而得到多个类对应的关联规则,以便可以结合网络数据所属的类,针对性的定位kqi出现的问题。示例性地,假设聚类得到了两个类,分别为类1和类2,则kqi与目标网络特征之间的关联规则可以如下表2所示。

表2

(2)根据类的kqi的目标取值,查询关联规则,得到目标取值对应的至少一个问题定位阈值。

计算机设备可以获取类的kqi的目标取值,根据kqi的目标取值查询关联规则,从关联规则中得到该kqi的目标取值对应的至少一个问题定位阈值,以便根据该至少一个问题定位阈值定位kqi的问题。例如,假设kqi的目标取值为14,类为类1,关联规则如上表1,则计算机设备查询关联规则后,可以得到dlbler的问题定位阈值为16.8%,cqi的问题定位阈值为8,dlrsrq的问题定位阈值为-110,dlrb的问题定位阈值为13.6等。

需要说明的第一点是,可选地,计算机设备在生成目标定位阈值之前,还可以对样本网络数据进行归一化处理,即,对于至少一种目标网络特征中的每种目标网络特征,可以将多个样本网络数据中该目标网络特征的取值范围均映射到预设取值范围内,则至少一种目标网络特征的值域相同,均为该预设取值范围,从而避免不同网络特征的值域的差异对聚类结果的影响。其中,该预设取值范围可以根据人工或经验设置,例如为(0,1)。

需要说明的第二点是,可选地,计算机设备在生成目标定位阈值之前,还可以对样本网络数据进行离散化处理,即,对于至少一种目标网络特征中的每种目标网络特征,可以获取该目标网络特征的多个特征分位值,将每个样本网络数据中该目标网络特征的取值映射为对应的特征分位值,则目标网络特征的取值会离散化,减少了计算量。其中,特征分位值可以根据实际需求或经验设置,可以为取值范围中的几个等分的点,例如为取值范围的中位数、四分位数、百分位数等。

304、计算机设备接收网络数据。

该网络数据可以为当前的网络数据,即现网数据,也可以为其他需要分析的网络数据。计算机设备可以检测输入操作,接收用户输入的网络数据。

305、计算机设备基于至少一种目标网络特征的问题定位阈值以及网络数据,输出kqi的问题定位结果。

计算机设备可以应用已生成的问题定位阈值,分析网络数据中网络特征的取值与目标kqi对应的问题定位阈值之间的差距,从而定位kqi的问题。

具体来说,本步骤可以包括以下步骤一至步骤三:

步骤一、计算机设备获取网络数据中至少一种目标网络特征的取值。

对于该至少一种目标网络特征中的每种目标网络特征,计算机设备可以从网络数据中提取该目标网络特征的取值,例如从网络数据中提取出cqi为7,通过遍历至少一种目标网络特征,可以得到网络数据中至少一种目标网络特征的取值。

步骤二、计算机设备对至少一个取值与对应的问题定位阈值进行差距分析,得到至少一种待优化网络特征。

差距分析(gapanalysis)又称缺口分析、差异分析,是指对设置的目标与实际的结果进行比较,分析两者之间的差距。本实施例中,计算机设备可以通过对网络数据中每种目标网络特征的取值与对应的问题定位阈值进行差距分析,得到至少一种待优化网络特征。

其中,待优化网络特征是指取值未达到问题定位阈值的网络特征,待优化网络特征的取值未达标,因此可以认为网络在该待优化网络特征方面存在问题,需要进行优化。

关于确定待优化网络特征的具体过程,对于每种目标网络特征,可以判断网络数据中该目标网络特征的取值是否达到目标网络特征的问题定位阈值,当网络数据中该目标网络特征的取值未达到目标网络特征的问题定位阈值时,将该目标网络特征作为待优化网络特征,当网络数据中该目标网络特征的取值已达到目标网络特征的问题定位阈值时,则继续判断下一个目标网络特,如此,可以得到至少一种待优化网络特征。

步骤三、计算机设备根据至少一种待优化网络特征,输出kqi的问题定位结果。

关于输出问题定位结果的具体过程,本实施例提供以下实现一至实现四:

实现一、计算机设备得到至少一种待优化网络特征后,可以直接将该至少一种待优化网络特征作为kqi的问题定位结果,输出至少一种待优化网络特征,以便技术人员根据待优化网络特征,分析造成差距的原因从而减少差距。

关于输出至少一种待优化网络特征的方式,可以根据每种待优化网络特征的取值与对应问题定位阈值之间的差距,按照差距从大到小的顺序,输出至少一种待优化网络特征。可选地,可以对每种待优化网络特征的差距进行归一化,得到归一化的差距,按照归一化的差距从大到小的顺序,输出至少一种待优化网络特征

其中,待优化网络特征的取值与问题定位阈值之间的差距越大,可以认为待优化网络特征的问题越严重,该待优化网络特征方面的问题的应当优先解决,通过按照差距从大到小的顺序输出至少一种待优化特征,能够区分问题严重程度不同的网络特征,让问题严重的网络特征先输出,从而得以优先优化。

实现二、计算机设备也可以将至少一种待优化网络特征以及每种待优化网络特征的取值,均作为kqi的问题定位结果,输出kqi的问题定位结果。

实现三、计算机设备也可以将至少一种待优化网络特征以及每种待优化网络特征与问题定位阈值之间的差距,均作为kqi的问题定位结果,输出kqi的问题定位结果。

实现四、计算机设备根据每种待优化网络特征的取值,对该至少一种待优化网络特征进行分析,将分析的结果作为kqi的问题定位结果。

计算机设备可以调用分析应用,将每种待优化网络特征的取值、对应的问题定位阈值输入至分析应用中,由分析应用对该至少一种待优化网络特征进行分析,输出kqi的问题定位结果。示例性地,分析应用输出的问题定位结果可以如图3所示,分析图3可知,1和2扇区存在导频污染,3扇区存在上行干扰,为此给出的优化建议可以为:排查3扇区上行干扰,勘察1和2扇区的覆盖区域,增大俯仰角的覆盖。

可选地,结合分类的过程,计算机设备可以通过以下步骤一至步骤二,输出kqi的问题定位结果:

步骤一、计算机设备获取网络数据所属的类。

若计算机设备预先采用聚类的方式将样本网络数据划分为多个类,可以获取网络数据与每个类之间的距离,从多个类中选取距离最小的类,作为网络数据所属的类。

若计算机设备预先采用按照预设分类条件进行分类的方式将样本网络数据划分为多个类,可以按照该预设分类条件,识别网络数据所属的类,例如结合上述分类过程的示例一,计算机设备可以识别网络数据来自的局点,将该局点对应的类作为网络数据所属的类。

步骤二、计算机设备基于类对应的至少一种目标网络特征的问题定位阈值以及网络数据,输出kqi的问题定位结果。

计算机设备可以获取网络数据中至少一种目标网络特征的取值,得到至少一个取值,对该至少一个取值以及类对应的至少一种目标网络特征的问题定位阈值进行差距分析,输出kqi的问题定位结果。其中,差距分析的过程与上述过程同理,在此不做赘述。

综上所述,请参见图6和图7,图6示出了本公开实施例提供的kqi的问题定位方法的原理图,本实施例可以包括数据预处理、数据清洗、特征选择、阈值生成、问题定位等多个步骤,通过依次执行每个步骤,可以实现多维质差定位。图7示出了本公开实施例提供的kqi的问题定位方法的系统架构图,可以基于该系统架构图设计实现问题定位方法的各个模块。

本发明实施例提供的问题定位方法至少具有以下几个突出的效果:

相关技术中,视频下载速率的问题定界算法通常根据专家经验总结而来,问题定位阈值单一,有较大的局限性,主要表现在:

第一,问题定位阈值无法自适应:当前的问题定位阈值都是固定的,不同的局点、不同的kqi标准对于定界门限的要求是不一致的,这就要求网优工程师要根据场景来配置门限,对于网优工程师的要求比较高,也给批量交付带来了不便。

第二,规则单一:当前的定界规则都是采用对单一网络特征设置严格的问题定位阈值的形式,只有当网络特征的取值很差时,才会定位到。这会导致部分异常话单由于达不到严格的问题定位阈值而未被定界。但这部分话单可能是由于多个异常的网络特征共同引起的,而这些网络特征只是相对较差,并没有达到很差的程度,导致无法被定界规则包含。

第三,无法给出影响程度:有多个网络特征异常时,当前的定界规则没法给出每个网络特征的影响程度,进而无法指导优化优先级。

而本发明实施例中,基于kqi与各个无线网络特征之间的逻辑关系,采用随机森林算法对影响下载速率的无线网络特征进行重要度的排序,根据所选择的目标网络特征,通过k-means方法实现不同场景下的聚类,针对每类样本网络数据,实现下载速率与网络特征的关联规则的挖掘,输出视频下载速率与无线网络特征的问题定位阈值,从而实现视频下载速率的多维质差定位。采用本发明实施例提供的方法,至少可以解决以下问题:

第一,得到了影响视频下载速率的关键网络特征:根据历史网络数据以及随机森林算法选取影响视频下载速率的网络特征,包括rb,cqi,rsrp,sinr等。

第二,得到了下载速率与关键网络特征间的量化关系:通过k-means方法实现差异化场景的样本聚类,针对每类数据,挖掘视频下载速率与网络无线侧特征(覆盖,干扰,rb,cqi,rsrp,sinr,激活用户等网络特征)之间的关联规则,基于关联规则生成不同下载速率的多维的问题定位阈值。

第三,问题定位阈值能够自适应:能够根据特定的局点提供的样本网络数据挖掘出问题定位阈值,使得问题定位阈值能够适用于分析该局点的网络数据,同时为不同的kqi的取值挖掘出了不同的问题定位阈值,能够根据特定的kqi标准确定匹配的问题定位阈值。

第四,规则多样化:本发明实施例提供的关联规则可以具有多个维度,即对应多种网络特征,每种网络特征可以具有匹配的问题定位阈值,可以结合多个网络特征的问题定位阈值,定位异常话单,从而保证对异常话单定界的全面性、准确性。

第五,能够给出影响程度:能够按照网络特征与问题定位阈值的差距降序输出,让问题严重的网络特征优先输出,从而直观地提示每个网络特征的影响程度,帮助指导各个网络特征的优化优先级。

本实施例提供的方法,通过对大量样本网络数据进行数据挖掘,自动发现出与kqi具有相关性的目标网络特征,还自动生成了每种目标网络特征的问题定位阈值,极大地提高了确定问题定位阈值的效率,同时加快了确定问题定位阈值的速度,同时极大地提高了目标网络特征的问题定位阈值的精确性,能够高效、快速地、精准地定位kqi的问题。

图8是本公开实施例提供的一种kqi的问题定位装置的结构示意图,应用于计算机设备中,如图8所示,该装置包括:获取模块801、选取模块802、生成模块803和输出模块804。

获取模块801,用于执行上述步骤301;

选取模块802,用于执行上述步骤302;

生成模块803,用于执行上述步骤303;

输出模块804,用于执行上述步骤304。

在一种可能的实现方式中,该生成模块803,包括:

分析子模块,用于进行关联分析;

查询子模块,用于查询该关联规则。

在一种可能的实现方式中,该分析子模块,包括:

计算子单元,用于计算得到至少一个频繁项集;

获取子单元,用于获取每个频繁项集的置信度;

选取子单元,用于选取关联规则。

在一种可能的实现方式中,该选取模块802,包括:

获取子单元,用于获取至少一种网络特征的重要度;

选取子单元,用于选取kqi对应的网络特征。

在一种可能的实现方式中,该输出模块804,包括:

获取子模块,用于获取网络数据所属的类;

输出子模块,用于输出kqi的问题定位结果。

在一种可能的实现方式中,该生成模块803,包括:

分类子模块,用于进行聚类或分类,得到多个类;

分析子模块,用于对样本网络数据以及目标网络特征进行分析。

在一种可能的实现方式中,该输出模块804,包括:

获取子单元,用于获取该网络数据中该至少一种目标网络特征的取值;

分析子单元,用于进行差距分析,得到至少一种待优化网络特征;

该获取子单元,用于得到该kqi的问题定位结果。

在一种可能的实现方式中,该获取模块801,包括:

获取子模块,用于获取多个历史业务数据以及多个历史网络数据;

拼接子模块,用于对历史业务数据以及历史网络数据进行拼接,得到样本网络数据。

需要说明的是:上述实施例提供kqi的问题定位装置在对kqi进行问题定位时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将问题定位装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的kqi的问题定位装置与kqi的问题定位的方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。

上述所有可选技术方案,可以采用任意结合形成本公开的可选实施例,在此不再一一赘述。

在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机程序指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机程序指令可以从一个网站站点、计算机、服务器或数据中心通过有线或无线方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如软盘、硬盘、磁带)、光介质(例如,数字视频光盘(digitalvideodisc,dvd)、或者半导体介质(例如固态硬盘)等。

以上所述仅为本申请的可选实施例,并不用以限制本申请,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1