高精度定位差分数据互联网播发平台的监控分析方法与流程

文档序号:12729285阅读:267来源:国知局
本发明涉及一种差分数据的监控分析方法,尤其涉及一种高精度定位差分数据互联网播发平台的监控分析方法。
背景技术
:在“全国一张网”系统上推送的观测数据在数据差分时大规模故障,无法将解算数据正确推送,或数据始终是浮动(float)状态,无法固定(fix)时,无法短时间内找到整条链路上真正故障根源所在,而且需要大量各个技术点的技术人员分头排查,花费大量时间去排查非自身根源导致的自身故障。常见的告警收敛规则,都是基于告警频次去进行判断分析,但是没有基于上下游关联关系进行的方式。现在没有基于地基增强系统相关的告警关联检索并且收敛的方式,只有基于网络等的报警收敛方式,而且这些方式基本都是基于告警频次去进行判断分析,对于上下游的判断和告警依赖考虑较少,无法满足地基增强系统需求。技术实现要素:针对上述问题,本发明提出一种高精度定位差分数据互联网播发平台的监控分析方法,主要针对地基增强系统的业务特性,并且结合对于地理观测数据的解算方式,来进行报警点的关系关联。一种高精度定位差分数据互联网播发平台的监控分析方法,包括:后台接收报警数据,报警数据来自于:网格模块的报警:通过ons接收,播发层面提供事件开始及事件结束通知;接收模块的报警:通过ons接收,播发层面提供事件开始及事件结束通知;以及基础的报警:通过zabbix生成日志收集,监控层提供事件开始及事件结束通知。将相邻的3个基站组成三角网,各组三角网形成组网单元。对报警进行关联,包括:抽取:每个周期时间(如:5分钟),收取一次该周期时间(如:5分钟)之内发出的所有报警(如:网格模块的报警、接收模块的报警和基础的报警),以及收敛,包括:过滤网格模块的报警:获取网格模块的报警后,根据周期时间的基站名,进行收敛,相同的基站名,认定为同一个网格报警事件,在该网格报警事件上增加一个网格监控事件标识(ID),将收敛后的网格报警事件进行整合;和对应接收模块报警:把网格上的事件根据基站名,同接收模块报警进行关联,若有相同基站也有接收模块报警,将单个基站剥离成单条新的模块报警事件,给这条模块报警事件标记一个模块监控事件标识(ID);若没有关联到接收模块报警的,保持原有格式;和对应基础报警:将网格报警事件和模块报警事件再次和基础监控进行关联;若有相同基站也有基础报警,且属于来自网格模块的报警,则将单个基站剥离成单条新的报警事件,给这条报警事件一个基础监控事件标识(ID);若有相同基站也有基础报警,且属于来自接收模块的报警,就把基础报警类型增加到报警事件里;和若有相同基站也有基础报警,且属于是网格模块和接收模块关联后的报警,就把基础报警类型增加到报警事件里;和若没有和其他模块关联到的报警,对于网格模块的报警,即将根据周期时间的基站名,进行收敛,相同的基站名,认定为一个报警事件,直接给一个监控事件标识;和对应汇聚点报警:当有汇聚点报警产生时,若本周期时间(如:5分钟)与本周期时间上一个周期时间(如:5分钟)正在发生的该汇聚点下的基站超过50%发生报警,则将这些报警合并在汇聚点报警下;当没有汇聚点报警产生,但是单一汇聚点下有超过50%的基站发生报警,则生成一个新的事件。报警恢复:将网格模块的报警、接收模块的报警和基础的报警设置报警恢复通知,这些报警恢复通知与各个报警事件标识(ID)相对应。对可用性时间及故障状态变化进行记录,如:单独记录每个网格的故障时间,恢复时间,及当前状态;和单独记录每个基础报警的故障时间,恢复时间,及当前状态;和单独记录每个接收报警的故障时间,恢复时间,及当前状态;和单独记录每个汇聚点报警的故障时间,恢复时间,及当前状态。本发明技术方案实现的有益效果:地基增强定位系统从数据生成,到最后的用户接收到数据,链路非常长。在整条链路上会不定期的出现大量的故障事件,而且上下游的故障间有很强的关联性,通过本发明方法来明确故障的根本发生点,将相关联的故障合并,形成单一运维事件,进行快速处理。本发明的方法实现了用户接收到播发的定位数据时,一旦出现故障,则根据当前的异常情况,及多个技术层面进行检索是否在同一链路层面是否有其他故障,包括“全国一张网”平台,位置算法平台和播发平台等,再根据故障的服务间的关联关系,获取故障关联关系,明确最根本的故障点,生成运维事件。附图说明图1是本发明收敛方法一实施例的参考流程图。具体实施方式下面结合附图和具体实施例,进一步阐述本发明,本发明实施例仅用以说明本发明的技术方案而非限制本发明的保护范围。本实施例一种高精度定位差分数据互联网播发平台的监控分析方法,包括:1、后台接收报警数据,报警数据来自于:网格模块的报警:通过ons接收,播发层面提供事件开始及事件结束通知;接收模块的报警:通过ons接收,播发层面提供事件开始及事件结束通知;以及基础的报警:通过zabbix生成日志收集,监控层提供事件开始及事件结束通知。2、将相邻的3个基站组成三角网,各组三角网形成组网单元。具体的,随机选择一个基站,找到与其相邻的两个基站,并与之组成一个三角网,同时,所选择的该基站,也是另一个三角网的一部分。3、对告警进行关联,包括:抽取:每个周期时间(如:5分钟),收取一次该周期时间(如:5分钟)之内发出的所有报警(如:网格模块的报警、接收模块的报警和基础的报警),以及收敛,包括:过滤网格模块的报警:获取网格模块的报警后,根据周期时间的基站名,进行收敛,相同的基站名,认定为同一个网格报警事件,在该网格报警事件上增加一个网格监控事件标识(ID),将收敛后的网格报警事件进行整合;和对应接收模块报警:把网格上的事件根据基站名,同接收模块报警进行关联,若有相同基站也有接收模块报警,将单个基站剥离成单条新的模块报警事件,给这条模块报警事件标记一个模块监控事件标识(ID);若没有关联到接收模块报警的,保持原有格式;和对应基础报警:将网格报警事件和模块报警事件再次和基础监控进行关联;若有相同基站也有基础报警,且属于来自网格模块的报警,则将单个基站剥离成单条新的报警事件,给这条报警事件一个基础监控事件标识(ID);若有相同基站也有基础报警,且属于来自接收模块的报警,就把基础报警类型增加到报警事件里;和若有相同基站也有基础报警,且属于是网格模块和接收模块关联后的报警,就把基础报警类型增加到报警事件里;和若没有和其他模块关联到的报警,对于网格模块的报警,即将根据周期时间的基站名,进行收敛,相同的基站名,认定为一个报警事件,直接给一个监控事件标识;和对应汇聚点报警:当有汇聚点报警产生时,若本周期时间(如:5分钟)与本周期时间上一个周期时间(如:5分钟)正在发生的该汇聚点下的基站超过50%发生报警,则将这些报警合并在汇聚点报警下;当没有汇聚点报警产生,但是单一汇聚点下有超过50%的基站发生报警,则生成一个新的事件。收敛方法的流程参见图1所示,报警类型如下表1所示。表1汇聚点报警基础报警接收模块报警网格模块报警4、报警恢复:将网格模块的报警、接收模块的报警和基础的报警设置报警恢复通知,这些报警恢复通知与各个报警事件标识(ID)相对应。对于单个报警恢复信息,只表明相应报警事件标识(ID)有关的报警事件得到恢复。5、对可用性时间及故障状态变化进行记录,如:单独记录每个网格的故障时间,恢复时间,及当前状态;和单独记录每个基础报警的故障时间,恢复时间,及当前状态;和单独记录每个接收报警的故障时间,恢复时间,及当前状态;和单独记录每个汇聚点报警的故障时间,恢复时间,及当前状态。记录的方式参见一下表2所示表2为实施本实施例的方案,尤其优选使用ELK及MQ作为运维的关键组件。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1