一种基于不同维度指标发现视频彩铃聚类问题的方法与流程

文档序号:33346547发布日期:2023-03-04 03:46阅读:来源:国知局

技术特征:
1.一种基于不同维度指标发现视频彩铃聚类问题的方法,其特征在于包含以下步骤:步骤一:原始数据获取:使用元数据编排工具中的指标管理模块,基于xdr创建指标公式和指标名称,使用元数据编排工具中基础表管理模块创建bkpi表,勾选配置的指标名称,勾选公共维度:用户、地市、小区、核心网元和终端品牌;从底层xdr单据cdr_ims_call_delay获取用户、地市、小区、核心网元和终端品牌维度下时延指标和阶段时延指标,从cdr_volte_voice_quality获取用户、地市、小区、核心网元和终端品牌维度下的丢包率指标、mos值指标,从cdr_ims_mo_call_leg_sip和 cdr_ims_mt_call_leg_sip获取用户、地市、小区、核心网元和终端品牌维度下的接通指标,编排流程调度,选择imc-hdfs
ꢀ‑
bkpi
ꢀ‑
15分钟粒度,不存储,根据勾选指标的指标公式、勾选的维度、调度,生成bkpi表,打包安装到环境后,imc模块每隔15分钟自动关联指标公式和维度字段从对应xdr获取指标和维度对应的字段,按照时间、用户、地市、小区、核心网元、终端品牌、时延指标、阶段时延指标、丢包率指标、mos值指标和接通指标自动生成按15分钟一统计一输出的bkpi表1,并把数据推送到hdfs中;步骤二:数据清洗:基于bkpi表1,首先剔除空值;基于bkpi表1数据样本条数及数据的分布情况,采用3σ原则识别异常值,再利用盖帽法替换超出(μ-3σ,μ+3σ)这个范围的数据;步骤三:聚类阈值统计:bkpi表1中的异常值会对阈值分析有影响,造成阈值的偏差,所以使用基于步骤二中清洗后的bkpi表1数据,每天凌晨两点定时利用otsu法计算每个指标的阈值;步骤四:统计影响用户数:基于bkpi表1,根据步骤三中的每个指标的阈值,统计小区维度下的、终端品牌维度下的、核心网元维度下的、地市维度下的影响用户数,用户的vrbt视频rtcp丢包率大于步骤四输出的vrbt视频rtcp丢包率阈值,那么算为vrbt视频rtcp丢包率影响用户,所有的vrbt视频rtcp丢包率大于步骤四输出的vrbt视频rtcp丢包率阈值的用户过滤去重累计,结果就是vrbt视频rtcp丢包率影响用户数;用户的vrbt视频rtp丢包率大于步骤四输出的vrbt视频rtp丢包率阈值,那么算为vrbt视频rtp丢包率影响用户,所有的vrbt视频rtp丢包率大于步骤四输出的vrbt视频rtp丢包率阈值的用户过滤去重累计,结果就是vrbt视频rtp丢包率影响用户数;用户的vrbt视频ip mos小于步骤四输出的vrbt视频ip mos阈值,那么算为vrbt视频ip mos影响用户,所有的vrbt视频ip mos小于步骤四输出的vrbt视频ip mos阈值的用户过滤去重累计,结果就是vrbt视频ip mos影响用户数;其余指标影响用户数统计规则一样,再分别按照小区、终端品牌、核心网、地市维度生成bkpi表2、bkpi表3、bkpi表4和bkpi表5,输出到hdfs,供步骤六使用;步骤五:统计综合得分:基于步骤二数据清洗后的bkpi表1,统计小区维度下的、终端品牌维度下的、核心网元维度下的、地市维度下的综合得分,按照对应的规则分别输出bkpi表6:字段包含时间、小区和综合得分,bkpi表7:字段包含时间、终端品牌和综合得分,bkpi表8:字段包含时间、核心网元和综合得分,bkpi表9:字段包含时间、地市和综合得分;步骤六:输出聚类sdr:将步骤一、步骤四和步骤五按照如下规则合并,并且按照如下条件输出聚类sdr:1)基于bkpi表2,过滤单小区的影响用户数累加值大于聚类小区用户数阈值或聚类终端用户数阈值,其中用户数累计值为所有指标的影响用户数,聚类小区用户数阈值能够动态调整,得到时间、小区、小区的影响用户数;基于bkpi表3,过滤单终端品牌的影响用户数
累加值大于聚类终端用户数阈值,其中用户数累计值为所有指标的影响用户数,同时聚类终端用户数阈值能够动态调整,得到时间、终端品牌的影响用户数;基于bkpi表4,过滤单核心网的影响用户数累加值大于聚类核心网元用户数阈值,其中用户数累计值为所有指标的影响用户数,同时核心网元用户数阈值能够动态调整,得到时间、核心网、核心网的影响用户数;基于bkpi表5,过滤单地市的影响用户数累加值大于聚类地市用户数阈值,其中用户数累计值为所有指标的影响用户数,同时聚类地市用户数阈值能够动态调整,得到时间、地市、地市的影响用户数;2)基于bkpi表2过滤单小区的影响用户数累加值/所有小区的影响用户数累加值*100>小区的影响用户数占比阈值,其中小区的影响用户数占比阈值能够动态调整,得到时间、小区、小区的影响用户数占比;基于bkpi表3过滤单终端品牌的影响用户数累加值/所有终端品牌的影响用户数累加值*100>终端品牌的影响用户数占比阈值,其中终端品牌的影响用户数占比阈值能够动态调整,得到时间、终端品牌、终端品牌的影响用户数占比;基于bkpi表4过滤单核心网的影响用户数累加值/所有核心网的影响用户数累加值*100>核心网的影响用户数占比阈值,其中核心网的影响用户数占比阈值能够动态调整,得到时间、核心网、核心网的影响用户数占比;基于bkpi表5过滤单地市的影响用户数累加值/所有地市的影响用户数累加值*100>地市影响用户数占比阈值,其中地市影响用户数占比阈值能够动态调整,得到时间、地市、地市的影响用户数占比;3)基于bkpi表6过滤单小区的综合打分小于小区的综合打分阈值,其中小区的综合打分阈值能够动态调整,得到时间、小区、小区的综合打分;输出同时满足1)、2)、3)条件的小区,同时小区左关联bkpi表1中的小区,输出对应的指标字段,小区左关联bkpi表2中小区,输出小区影响用户数,小区左关联bkpi表6,输出小区综合打分;输出同时满足1)、2)、3)条件的终端品牌,同时终端品牌左关联bkpi表1中的终端品牌,输出对应的指标字段,终端品牌左关联bkpi表3中终端品牌,输出终端品牌影响用户数,终端品牌左关联bkpi表7,输出终端品牌的综合打分;输出同时满足1)、2)、3)条件的核心网,同时核心网左关联bkpi表1中的核心网,输出对应的指标字段,核心网左关联bkpi表4中核心网,输出核心网影响用户数,核心网左关联bkpi表8,输出核心网的综合打分;输出同时满足1)、2)、3)条件的地市,同时地市左关联bkpi表1中的地市,输出对应的指标字段,地市左关联bkpi表5中地市,输出地市影响用户数,地市左关联bkpi表9,输出地市的综合打分;步骤七:界面呈现聚类问题:通过javascript、css语言完成前台界面开发,包含聚类小区个数柱状图、聚类终端个数柱状图、聚类核心网元个数柱状图、聚类地市个数柱状图,聚类小区清单表格、聚类终端清单表格、聚类核心网元清单表格、聚类地市清单表格,页面通过中间件查询数据库中的sdr1、sdr2、sdr3和sdr4,分别获取聚类小区个数、聚类终端个数、聚类核心网元个数、聚类地市个数填充到聚类小区个数、聚类终端个数、聚类核心网元个数、聚类地市个数柱状图和聚类小区清单、聚类终端清单、聚类核心网元清单、聚类地市清单,聚类小区个数、聚类终端个数、聚类核心网元个数、聚类地市个数分别通过sdr1、sdr2、sdr3和sdr4表中是否聚类为字段是的小区、终端品牌、核心网和地市过滤去重累计获取最
终的个数,聚类清单表格则分别呈现sdr1、sdr2、sdr3和sdr4表中是否聚类字段为是的所有字段数据;图形化的呈现帮助客户快速、直观的定位vrbt视频彩铃聚类问题所在,帮助客户解决vrbt视频彩铃聚类问题。2.根据权利要求1所述的一种基于不同维度指标发现视频彩铃聚类问题的方法,其特征在于所述3σ原则:数值分布在(μ-σ,μ+σ)中的概率为0.6827,数值分布在(μ-2σ,μ+2σ)中的概率为0.9545,数值分布在(μ-3σ,μ+3σ)中的概率为0.9973,其中,μ为平均值,σ为标准差,一般认为,数据y的取值几乎全部集中在(μ-3σ,μ+3σ)区间内,超出(μ-3σ,μ+3σ)范围的可能性仅占不到0.3%,这些超出该范围的数据认为是异常值。3.根据权利要求1所述的一种基于不同维度指标发现视频彩铃聚类问题的方法,其特征在于所述盖帽法是将(μ-3σ)左边的数据替换为-3σ的值,将(μ+3σ)替换为+3σ的值。4.根据权利要求1所述的一种基于不同维度指标发现视频彩铃聚类问题的方法,其特征在于所述步骤三中阈值的计算方法如下:将指标值制图,y轴为指标值,x轴为行数,任意选取一个阈值t将图像分为两部分:前景和背景,前景点占图像的比例为w0、均值为u0,背景点占图像的比例为w1、均值为u1,图像整体的均值为u=w0*u0+w1*u1,建立目标函数g(t)=w0*(u0-u)^2+w1*(u1-u)^2,g(t)即为当分割阈值为t时的类间方差;遍历指标最小值到指标最大值,g(t)最大时所对应的t作为步骤四的阈值,输出各个指标的阈值到内存中,供步骤四使用。5.根据权利要求1所述的一种基于不同维度指标发现视频彩铃聚类问题的方法,其特征在于所述小区综合得分计算规则:基于bkpi表1按时间将小区每个指标分别排序:mos值和接通率指标升序,时延和丢包率降序,得到小区各个指标的排名,除小区+用户的总记录数得到每个指标的占比,每个指标的占比分别乘100再分别乘对应指标的权重值,最后将小区的所有指标累加后乘总权重得到每个小区的综合得分。6.根据权利要求1所述的一种基于不同维度指标发现视频彩铃聚类问题的方法,其特征在于所述终端品牌得分计算规则:基于bkpi表1按时间将终端品牌每个指标分别排序:mos值和接通率指标升序,时延和丢包率降序,得到终端品牌各个指标的排名,除小区+用户的总记录数得到每个指标的占比,每个指标的占比分别乘100再分别乘对应指标的权重值,最后将小区的所有指标累加后乘总权重得到每个终端品牌的综合得分。7.根据权利要求1所述的一种基于不同维度指标发现视频彩铃聚类问题的方法,其特征在于所述核心网元得分计算规则:基于bkpi表1按时间将核心网元每个指标分别排序:mos值和接通率指标升序,时延和丢包率降序,得到核心网元各个指标的排名,除核心网元+用户的总记录数得到每个指标的占比,每个指标的占比分别乘100再分别乘对应指标的权重值,最后将核心网元的所有指标累加后乘总权重得到每个小区的综合得分。8.根据权利要求1所述的一种基于不同维度指标发现视频彩铃聚类问题的方法,其特征在于所述地市得分计算规则:基于bkpi表1按时间将地市每个指标分别排序:mos值和接通率指标升序,时延和丢包率降序,得到地市各个指标的排名,除地市+用户的总记录数得到每个指标的占比,每个指标的占比分别乘100再分别乘对应指标的权重值,权重值能够动态调整,最后将小区的所有指标累加后乘总权重得到每个地市的综合得分。

技术总结
本发明涉及一种vRBT视频彩铃的质量分析方法,本发明涉及一种基于不同维度指标发现视频彩铃聚类问题的方法。包括:步骤一:原始数据获取,步骤二:数据清洗,步骤三:聚类阈值统计,步骤四:统计影响用户数,步骤五:统计综合打分,步骤六:输出聚类SDR,步骤七:界面呈现聚类问题。本发明基于客户实际业务诉求,参考中国移动通信集团规范,采用大数据技术,自动化计算并输出vRBT视频彩铃的聚类小区、聚类终端品牌、聚类核心网和聚类地市清单,同时利用界面图形化的呈现,帮助客户快速发现、定位vRBT视频彩铃的聚类问题所在,有效降低成本并提高工作效率。作效率。作效率。


技术研发人员:郭仕涛 卢斌 王庆权 吴培培 严龙
受保护的技术使用者:杭州东信网络技术有限公司
技术研发日:2022.11.18
技术公布日:2023/3/3
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1