一种可视化的分布式系统实时监控运维方法及装置与流程

文档序号:13804689阅读:332来源:国知局
一种可视化的分布式系统实时监控运维方法及装置与流程

本发明涉及一种可视化的分布式系统实时监控运维方法及装置。



背景技术:

随着技术的不断进步,it的发展已由普遍建设向普遍运维转型,面对电信行业多级、分域、面向社会服务的特性,电信互联网化分布式应用可视化项目,为中国电信的互联网分布式的运维提供了从it可用到服务可用的保障性解决方案,助力it企业服务型组织的快速转型。

传统的ssh架构在分布式应用架构的转换过程中,运维的技术特点和业务特点都发生了极大的改变,现有的一系列运维工具和流程已不适应新的架构,因此,需要有一套运维体系来支撑it系统的日常运行维护。下面让我们来看看在分布式架构下,分布式系统存在有哪些问题呢?

系统部署架构不可见:在传统的运维工作流程中,企业建设的各类it系统运行在分散的主机上,维护人员对需要维护的系统没有一个直观的概念,无法了解系统的部署架构,从而对运维的质量和效率带来了极大的影响;

系统健康状态不可知:经过长期的企业信息系统建设,企业采购的系统硬件(cpu\内存\磁盘\网卡\中间件等)、机房的环境、硬件物理特性的老化等,必然导致硬件出现各种健康状况,现有的it系统没有定期的巡检机制或者是依靠传统的人力进行相关的巡检,不仅工作量大、周期长,流程较固化,投入产出比低;

应用性能不可控:传统系统建设,重功能,轻维护,这样的it建设模式,注定了随着应用功能的越来越多,代码逻辑的逐步堆积,所消耗的中间件内存、数据库和系统相关资源越来越大,必然会导致系统的性能急剧下降,以系统订单提交环节为例,上线初为8秒/笔,而上线运行5年后是120秒/笔。而这还不是最可怕的,更可怕的是开发者还无法直观的了解到“时间去哪儿了”,想要优化都无从入手,到最后只能是推倒重来;

业务发展不直观:传统的营销活动的流程是业务部门根据后期的大数据分析,结合咨询公司的业界了解和自身业务的特点来判断和制定相关的营销策略、套餐,并定价推向市场,然后就坐等最终的营销结果统计和后评估。这使得业务部门无法实时了解营销活动的执行情况,无法及时根据营销过程中的一些业务特点和变化来调整营销策略及方案,以达到更好的营销效果;

应用接口调用不可见:it系统的接口众多,根据梳理出来的情况,多达1000+接口,涉及的支撑厂商在数十个以上,数量庞大且在后台执行的接口在执行调用的过程中,存在接入安全审计、调用数据暴增、异常定位困难等问题,不利于维护工作开展;

应用轮询调度不可见:后台的轮询调度程序,往往因为长期运行,极容易存在假死、挂起、占用内存过高等情况,系统无视图可以查看轮询的执行情况,就无法实时对假死挂起的轮询进行监控和告警;

it硬件投资决策难:在电信的企业it系统建设中,存在业务系统多,硬件投资成本高等特点,在传统的硬件投资中,主要靠主观判断来决定哪些系统的哪些硬件需要升级,哪些硬件需要更新换代、淘汰等,没有故障数据、体检数据、运行数据为硬件投资决策提供数据支持;

运维工作量大:由于在建的系统为分布式业务系统,虽然在逻辑上实现了业务数据的统一处理,但是在物理上,是由后端几百台的pc机支撑,任何一次系统配置文件的修改、数据脚本的执行,都需要确保内容的一致性、事务的一致性。此时依靠人力逐一核查,维护工作量无比巨大;

基于以上情况,需要有一套完整的、体系化的应用可视化项目,来支撑系统的日常运维工作,以极大的降低分布式系统的运维难度,提升分布式应用的运维效率,为系统的建设、部署、运行、维护、升级改造等过程提供强有力的保障。



技术实现要素:

本发明要解决的技术问题之一,在于提供一种可视化的分布式系统实时监控运维方法,通过该方法来实现分布式系统应用的可视化管理,可极大的降低分布式系统的运维难度,提升分布式应用的运维效率,为系统的建设、部署、运行、维护、升级改造等过程提供强有力的保障。

本发明是这样实现技术问题之一的:一种可视化的分布式系统实时监控运维方法,所述方法包括如下步骤:

步骤1、在各个应用系统上进行无侵入式埋点,采集各个应用系统的日志信息;在应用的操作系统上部署开源插件,采集操作系统的硬件运行信息和操作日志信息;

步骤2、将采集到的各种数据信息通过消息中间件集群传递给流式计算框架集群,流式计算框架集群将接收到的数据信息存储成hbase或者hdfs格式的文件;

步骤3、在elk框架中的kibana框架的基础上,结合业界的报表插件来实现在web页面中展示各种视图,包括获取存储的数据信息,并根据数据信息以及数据层中的cmdb配置库信息来进行业务发展视图、应用性能视图、应用部署视图、后台轮询调度视图、应用接口调用视图、用户体验视图或者应用监控视图的展示;同时通过分布式缓存来实时推送更新各种视图中的数据。

进一步地,所述步骤1具体为:

使用各类钩子脚本在各个应用系统上进行无侵入式埋点,通过各类钩子脚本来拦截各个应用系统中的应用程序或者内部组件的传递参数,以实现获取各个应用系统的日志信息;

在应用的操作系统上部署开源的flume插件,并通过该flume插件来采集操作系统上的各种硬件运行信息;同时,在应用的操作系统上部署开源的logstash或fluentd插件,并通过该logstash或fluentd插件来采集操作系统上的操作日志信息。

进一步地,所述步骤2具体为:

将采集到的各种数据信息通过socket异步抛给消息中间件集群,并由消息中间件集群将各种数据信息传递给流式计算框架集群;

流式计算框架集群将接收到的数据信息直接分类并存储成hbase或者hdfs格式的文件;或者流式计算框架集群先采用storm技术对接收到的数据信息进行流式计算,以根据预先配置在流式计算库中的拦截规则来对数据信息进行过滤和清洗,然后将过滤和清洗后的数据信息分类并存储成hbase或者hdfs格式的文件。

进一步地,在所述步骤3中,所述“根据数据信息以及数据层中的cmdb配置库信息来进行业务发展视图、应用性能视图、应用部署视图、后台轮询调度视图、应用接口调用视图、用户体验视图或者应用监控视图的展示”具体为:

通过基于复杂事件处理的事件流引擎来对数据信息中的业务发展数据进行复杂事件计算,并根据计算结果以及配置的相关业务规则来进行业务发展视图的展示;

根据数据信息中的相关应用的性能数据来实时计算api耗时,并根据计算结果来进行应用性能视图的展示;

根据数据层中的cmdb配置库信息并结合设备间的拓扑关系来进行应用部署视图的展示;

根据cmdb配置库中的拓扑关系信息得到设备在应用中所承担的角色,同时提取角色作为轮询调度主机列表,完成对后台轮询调度任务的分析和统计,并根据统计结果来进行后台轮询调度视图的展示;

根据数据信息中的接口服务调用数据来分析和统计应用接口的调用情况,且根据应用接口的调用情况来进行应用接口调用视图的展示;

根据数据信息中的用户操作行为数据来分析和统计用户的体验情况,并根据用户的体验情况来进行用户体验视图的展示;

通过基于复杂事件处理的事件流引擎来对数据信息中的告警信息进行复杂事件计算,并根据计算结果来进行应用监控视图的展示;同时,在数据层中设置告警阈值,当出现计算结果超过告警阈值的情况时,自动向相关人员发送告警信息。

本发明要解决的技术问题之二,在于提供一种可视化的分布式系统实时监控运维装置,通过该装置来实现分布式系统应用的可视化管理,可极大的降低分布式系统的运维难度,提升分布式应用的运维效率,为系统的建设、部署、运行、维护、升级改造等过程提供强有力的保障。

本发明是这样实现技术问题之二的:一种可视化的分布式系统实时监控运维装置,所述装置包括日志采集模块、数据传递存储模块以及视图展示模块;

所述日志采集模块,用于在各个应用系统上进行无侵入式埋点,采集各个应用系统的日志信息;在应用的操作系统上部署开源插件,采集操作系统的硬件运行信息和操作日志信息;

所述数据传递存储模块,用于将采集到的各种数据信息通过消息中间件集群传递给流式计算框架集群,流式计算框架集群将接收到的数据信息存储成hbase或者hdfs格式的文件;

所述视图展示模块,用于在elk框架中的kibana框架的基础上,结合业界的报表插件来实现在web页面中展示各种视图,包括获取存储的数据信息,并根据数据信息以及数据层中的cmdb配置库信息来进行业务发展视图、应用性能视图、应用部署视图、后台轮询调度视图、应用接口调用视图、用户体验视图或者应用监控视图的展示;同时通过分布式缓存来实时推送更新各种视图中的数据。

进一步地,所述日志采集模块具体为:

使用各类钩子脚本在各个应用系统上进行无侵入式埋点,通过各类钩子脚本来拦截各个应用系统中的应用程序或者内部组件的传递参数,以实现获取各个应用系统的日志信息;

在应用的操作系统上部署开源的flume插件,并通过该flume插件来采集操作系统上的各种硬件运行信息;同时,在应用的操作系统上部署开源的logstash或fluentd插件,并通过该logstash或fluentd插件来采集操作系统上的操作日志信息。

进一步地,所述数据传递存储模块具体为:

将采集到的各种数据信息通过socket异步抛给消息中间件集群,并由消息中间件集群将各种数据信息传递给流式计算框架集群;

流式计算框架集群将接收到的数据信息直接分类并存储成hbase或者hdfs格式的文件;或者流式计算框架集群先采用storm技术对接收到的数据信息进行流式计算,以根据预先配置在流式计算库中的拦截规则来对数据信息进行过滤和清洗,然后将过滤和清洗后的数据信息分类并存储成hbase或者hdfs格式的文件。

进一步地,在所述视图展示模块中,所述“根据数据信息以及数据层中的cmdb配置库信息来进行业务发展视图、应用性能视图、应用部署视图、后台轮询调度视图、应用接口调用视图、用户体验视图或者应用监控视图的展示”具体为:

通过基于复杂事件处理的事件流引擎来对数据信息中的业务发展数据进行复杂事件计算,并根据计算结果以及配置的相关业务规则来进行业务发展视图的展示;

根据数据信息中的相关应用的性能数据来实时计算api耗时,并根据计算结果来进行应用性能视图的展示;

根据数据层中的cmdb配置库信息并结合设备间的拓扑关系来进行应用部署视图的展示;

根据cmdb配置库中的拓扑关系信息得到设备在应用中所承担的角色,同时提取角色作为轮询调度主机列表,完成对后台轮询调度任务的分析和统计,并根据统计结果来进行后台轮询调度视图的展示;

根据数据信息中的接口服务调用数据来分析和统计应用接口的调用情况,且根据应用接口的调用情况来进行应用接口调用视图的展示;

根据数据信息中的用户操作行为数据来分析和统计用户的体验情况,并根据用户的体验情况来进行用户体验视图的展示;

通过基于复杂事件处理的事件流引擎来对数据信息中的告警信息进行复杂事件计算,并根据计算结果来进行应用监控视图的展示;同时,在数据层中设置告警阈值,当出现计算结果超过告警阈值的情况时,自动向相关人员发送告警信息。

本发明具有如下优点:

1、通过对企业资产配置库(cmdb)同应用的关系梳理,结合应用服务器的相关特点,真实的提供各个应用系统的adv(应用部署视图),一方面可方便运维人员直观了解系统架构,快速熟悉运维工作流程,另一方面在出现故障或问题的时候,能够按图索骥快速分析和定位故障,缩短系统故障的处理时间,使系统的可用性得到提升。

2、通过基于cep的esper技术,提供一个amv(应用监控视图),可向用户直观的展示应用系统的各个监控与告警视图,确保应用得到全方位的监控,并对超过预设告警阈值的指标给出及时的告警,可确保问题得到及时有效的跟踪处理。

3、采用aop、servlet、httpclient等各类钩子脚本和flume代理组件技术,提供一个可视化的系统应用性能管理apv平台,可有效解决软件产品的性能诊断难问题,提升软件产品的性能管理效率,对软件产品的性能问题实现预分析,避免软件的性能问题到测试和生产环节才发现,可提升产品的可用性,从而提升客户满意度。

4、通过各类无侵入式的js等钩子脚本,采集客户的体验情况,确保用户体验的可视化展示uev(用户体验视图),进而实现uem(用户体验管理),节省了客户调研和产品优化的时间,有助于提升工作效率和提升用户满意度。

5、采用基于cep的esper技术结合ogg和binlog日志解析技术,提供实时bdv(业务发展视图),向业务部门、企业经营管理者实时展示业务发展量及趋势判断,为企业营销策略的调优和业务的发展做出可量化、实时可视化的视图,助力企业的业务发展。

6、向用户提供一个后台调度任务的tspv(任务调度平台视图),将原先隐藏在应用后台运行的轮询展示在前台界面,使得应用维护人员能够及时了解到调度程序当前的运行情况,并能够在界面上直接做相关的操作处理;可确保任务调度的可用性,降低应用维护人员的工作难度,提升其工作效率。

7、采用esper技术结合接口调用日志异步采集分析技术,提供aiiv(应用接口调用视图),实时展示应用接口的调用情况,针对无授权访问的应用接口进行审计、爆增的应用调用进行限流,确保应用接口的安全、健康的运行。

附图说明

下面参照附图结合实施例对本发明作进一步的说明。

图1为本发明一种可视化的分布式系统实时监控运维方法的执行流程图。

图2为本发明一种可视化的分布式系统实时监控运维装置的原理框图。

具体实施方式

请参照图1所示,本发明一种可视化的分布式系统实时监控运维方法的较佳实施例,所述方法包括如下步骤:

步骤1、在各个应用系统上进行无侵入式埋点,采集各个应用系统的日志信息;在应用的操作系统上部署开源插件,采集操作系统的硬件运行信息和操作日志信息;

步骤2、将采集到的各种数据信息通过消息中间件集群传递给流式计算框架集群,流式计算框架集群将接收到的数据信息存储成hbase或者hdfs格式的文件;

步骤3、在elk框架中的kibana框架的基础上,结合业界的报表插件echart来实现在web页面中展示各种视图,包括获取存储的数据信息,并根据数据信息以及数据层中的cmdb配置库信息来进行业务发展视图(bdv)、应用性能视图(apv)、应用部署视图(adv)、后台轮询调度视图(tspv)、应用接口调用视图(aiiv)、用户体验视图(uev)或者应用监控视图(amv)的展示;同时通过分布式缓存redis来实时推送更新各种视图中的数据。

所述步骤1具体为:

使用各类钩子脚本(即鹰眼-agent)在各个应用系统上进行无侵入式埋点,通过各类钩子脚本来拦截各个应用系统中的应用程序或者内部组件的传递参数,以实现获取各个应用系统的日志信息;例如,在具体实施时,可通过埋入到各个应用系统上的servlet、js、aop、httpclient等钩子脚本来拦截各种传递参数,如可拦截入参、出参、异常进入时间、离开时间等各类参数信息,从而实现获取各个应用系统的日志信息,该日志信息包含应用程序运行信息、应用操作日志、业务日志等各种日志信息。

在应用的操作系统上部署开源的flume插件,并通过该flume插件来采集操作系统上的各种硬件运行信息,包括cpu、内存、网络、磁盘、jvm等的运行信息和日志信息;同时,在应用的操作系统上部署开源的logstash或fluentd插件,并通过该logstash或fluentd插件来采集操作系统上的操作日志信息(如syslog等)。

所述步骤2具体为:

将采集到的各种数据信息通过socket异步抛给消息中间件集群(mqcluster),并由消息中间件集群将各种数据信息传递给流式计算框架集群;由于拦截的各类日志信息具有并发量大、总量多等特点,因此,通过将各类日志信息异步抛给消息中间件集群进行统一处理,可极大的提高日志信息的处理效率和降低对应用的影响。

流式计算框架集群将接收到的数据信息直接分类并存储成hbase或者hdfs格式的文件;或者流式计算框架集群先采用storm技术对接收到的数据信息进行流式计算,以根据预先配置在流式计算库中的拦截规则来对数据信息进行过滤和清洗,例如,可设置仅捕捉前端的http请求日志,同时对于http请求日志,还可通过编写程序使其仅采集发起地址、发起方、发起时间以及响应时间信息,然后将过滤和清洗后的数据信息分类并存储成hbase或者hdfs格式的文件,例如,可将与性能数据相关的数据信息存储在同一类当中,将与业务数据相关的数据信息存储在同一类当中等等。其中,存储成hbase格式的文件主要用于详单信息的查询,存储成hdfs格式的文件主要用于增量分析日志信息,以形成性能监控的各个指标。

在所述步骤3中,所述“根据数据信息以及数据层中的cmdb配置库信息来进行业务发展视图(bdv)、应用性能视图(apv)、应用部署视图(adv)、后台轮询调度视图(tspv)、应用接口调用视图(aiiv)、用户体验视图(uev)或者应用监控视图(amv)的展示”具体为:

通过基于复杂事件处理(cep)的事件流引擎esper来对数据信息中的业务发展数据进行复杂事件计算,并根据计算结果以及配置的相关业务规则来进行业务发展视图(bdv)的展示;例如,通过对业务发展数据进行复杂事件计算后,就可以得出业务订单的受理情况,具体可包括未派发订单量、已派发订单量、单日甩单量、已完成订单量、订单受理率、订单完成率、各地区处理的订单量等各种订单受理情况,并将各种的订单受理情况以图、表相结合的方式展现出来。

根据数据信息中的相关应用的性能数据来实时计算api耗时,并根据计算结果来进行应用性能视图(apv)的展示;例如,针对每个api的进入时间和离开时间的时间差,可实时计算出api耗时,并得出应用api的变化历史和当前top等相关信息,并将这些相关信息以图、表相结合的方式展现出来。

根据数据层中的cmdb配置库信息并结合设备间的拓扑关系来进行应用部署视图(adv)的展示;例如,可将部署的服务器台数、服务器之间的主从关系、服务器之间的连接关系、每台服务器的cpu负荷、服务器处理的事务总量、每秒的sql、各服务器的状态、各服务器分配的事务等相关应用部署情况都以图、表相结合的方式展现出来。

根据cmdb配置库中的拓扑关系信息得到设备在应用中所承担的角色,同时提取角色作为轮询调度主机列表,完成对后台轮询调度任务的分析和统计,并根据统计结果来进行后台轮询调度视图(tspv)的展示;例如,可统计某一个应用执行的后台轮询调度任务的次数、执行成功率、执行失败率等相关信息,并将这些信息以图、表相结合的方式展现出来。

根据数据信息中的接口服务调用数据来分析和统计应用接口的调用情况,且根据应用接口的调用情况来进行应用接口调用视图(aiiv)的展示;例如,可分析和统计各应用接口的调用方ip地址、授权信息、请求时间、响应时间、入参、出参、调用结果等相关信息,从而得出各应用接口的调用成功率、调用次数、授权率等信息,并将这些信息以图、表相结合的方式展现出来,同时,通过分析和统计还可实现对应用接口进行实时监控和趋势预判,并对出现暴增、非法侵入等进行鉴权和告警。

根据数据信息中的用户操作行为数据来分析和统计用户的体验情况,并根据用户的体验情况来进行用户体验视图(uev)的展示;例如,通过前台页面植入的js脚本,可采集用户打开的菜单、点击的屏幕区域、点击的按钮等信息,通过统计和分析用户的操作行为信息,可得到用户喜欢的业务类型、订单处理的耗时、订单异常量等各种信息,并将这些信息以图、表相结合的方式展现出来,通过对用户体验视图的实时展示,可方便相关人员第一时间掌握用户的体验情况,并有针对性的进行优化。

通过基于复杂事件处理的事件流引擎来对数据信息中的告警信息进行复杂事件计算,并根据计算结果来进行应用监控视图(amv)的展示,例如,通过对告警信息进行复杂事件计算后,可得出各个模块在一某一时间段内出现的告警次数、告警级别、模块性能等信息,并将这些信息以图、表相结合的方式展现出来;同时,在数据层中设置告警阈值,当出现计算结果超过告警阈值的情况时,自动向相关人员发送告警信息,例如,当某个模块在一设定的时间内出现的告警次数超过了设置的告警阈值,此时就通过短信、邮件等方式向相关人员发送告警信息。

当然,在具体实施时,对于应用的数据库相关指标、应用服务器的相关指标等,则可通过数据库的相关视图来进行展示,如:可对数据库sql语句耗时top10、数据库存储空间、数据库当前使用cpu等信息进行统计和分析,并以图、表相结合的方式展示出来。对于部分特殊的统计报表,则需要通过编写基于h5+css3编写程序来实现页面展现,通过对存储在日志分析服务器上的数据进行统计和分析,并将统计和分析结果以图、表相结合的方式展示在页面上,以方便维护人员、研发人员、领导等进行查看。

请参照图2所示,本发明一种可视化的分布式系统实时监控运维装置的较佳实施例,所述装置包括日志采集模块、数据传递存储模块以及视图展示模块;

所述日志采集模块,用于在各个应用系统上进行无侵入式埋点,采集各个应用系统的日志信息;在应用的操作系统上部署开源插件,采集操作系统的硬件运行信息和操作日志信息;

所述数据传递存储模块,用于将采集到的各种数据信息通过消息中间件集群传递给流式计算框架集群,流式计算框架集群将接收到的数据信息存储成hbase或者hdfs格式的文件;

所述视图展示模块,用于在elk框架中的kibana框架的基础上,结合业界的报表插件echart来实现在web页面中展示各种视图,包括获取存储的数据信息,并根据数据信息以及数据层中的cmdb配置库信息来进行业务发展视图(bdv)、应用性能视图(apv)、应用部署视图(adv)、后台轮询调度视图(tspv)、应用接口调用视图(aiiv)、用户体验视图(uev)或者应用监控视图(amv)的展示;同时通过分布式缓存redis来实时推送更新各种视图中的数据。

所述日志采集模块具体为:

使用各类钩子脚本(即鹰眼-agent)在各个应用系统上进行无侵入式埋点,通过各类钩子脚本来拦截各个应用系统中的应用程序或者内部组件的传递参数,以实现获取各个应用系统的日志信息;例如,在具体实施时,可通过埋入到各个应用系统上的servlet、js、aop、httpclient等钩子脚本来拦截各种传递参数,如可拦截入参、出参、异常进入时间、离开时间等各类参数信息,从而实现获取各个应用系统的日志信息,该日志信息包含应用程序运行信息、应用操作日志、业务日志等各种日志信息。

在应用的操作系统上部署开源的flume插件,并通过该flume插件来采集操作系统上的各种硬件运行信息,包括cpu、内存、网络、磁盘、jvm等的运行信息和日志信息;同时,在应用的操作系统上部署开源的logstash或fluentd插件,并通过该logstash或fluentd插件来采集操作系统上的操作日志信息(如syslog等)。

所述数据传递存储模块具体为:

将采集到的各种数据信息通过socket异步抛给消息中间件集群(mqcluster),并由消息中间件集群将各种数据信息传递给流式计算框架集群;由于拦截的各类日志信息具有并发量大、总量多等特点,因此,通过将各类日志信息异步抛给消息中间件集群进行统一处理,可极大的提高日志信息的处理效率和降低对应用的影响。

流式计算框架集群将接收到的数据信息直接分类并存储成hbase或者hdfs格式的文件;或者流式计算框架集群先采用storm技术对接收到的数据信息进行流式计算,以根据预先配置在流式计算库中的拦截规则来对数据信息进行过滤和清洗,例如,可设置仅捕捉前端的http请求日志,同时对于http请求日志,还可通过编写程序使其仅采集发起地址、发起方、发起时间以及响应时间信息,然后将过滤和清洗后的数据信息分类并存储成hbase或者hdfs格式的文件,例如,可将与性能数据相关的数据信息存储在同一类当中,将与业务数据相关的数据信息存储在同一类当中等等。其中,存储成hbase格式的文件主要用于详单信息的查询,存储成hdfs格式的文件主要用于增量分析日志信息,以形成性能监控的各个指标。

在所述视图展示模块中,所述“根据数据信息以及数据层中的cmdb配置库信息来进行业务发展视图(bdv)、应用性能视图(apv)、应用部署视图(adv)、后台轮询调度视图(tspv)、应用接口调用视图(aiiv)、用户体验视图(uev)或者应用监控视图(amv)的展示”具体为:

通过基于复杂事件处理(cep)的事件流引擎esper来对数据信息中的业务发展数据进行复杂事件计算,并根据计算结果以及配置的相关业务规则来进行业务发展视图(bdv)的展示;例如,通过对业务发展数据进行复杂事件计算后,就可以得出业务订单的受理情况,具体可包括未派发订单量、已派发订单量、单日甩单量、已完成订单量、订单受理率、订单完成率、各地区处理的订单量等各种订单受理情况,并将各种的订单受理情况以图、表相结合的方式展现出来。

根据数据信息中的相关应用的性能数据来实时计算api耗时,并根据计算结果来进行应用性能视图(apv)的展示;例如,针对每个api的进入时间和离开时间的时间差,可实时计算出api耗时,并得出应用api的变化历史和当前top等相关信息,并将这些相关信息以图、表相结合的方式展现出来。

根据数据层中的cmdb配置库信息并结合设备间的拓扑关系来进行应用部署视图(adv)的展示;例如,可将部署的服务器台数、服务器之间的主从关系、服务器之间的连接关系、每台服务器的cpu负荷、服务器处理的事务总量、每秒的sql、各服务器的状态、各服务器分配的事务等相关应用部署情况都以图、表相结合的方式展现出来。

根据cmdb配置库中的拓扑关系信息得到设备在应用中所承担的角色,同时提取角色作为轮询调度主机列表,完成对后台轮询调度任务的分析和统计,并根据统计结果来进行后台轮询调度视图(tspv)的展示;例如,可统计某一个应用执行的后台轮询调度任务的次数、执行成功率、执行失败率等相关信息,并将这些信息以图、表相结合的方式展现出来。

根据数据信息中的接口服务调用数据来分析和统计应用接口的调用情况,且根据应用接口的调用情况来进行应用接口调用视图(aiiv)的展示;例如,可分析和统计各应用接口的调用方ip地址、授权信息、请求时间、响应时间、入参、出参、调用结果等相关信息,从而得出各应用接口的调用成功率、调用次数、授权率等信息,并将这些信息以图、表相结合的方式展现出来,同时,通过分析和统计还可实现对应用接口进行实时监控和趋势预判,并对出现暴增、非法侵入等进行鉴权和告警。

根据数据信息中的用户操作行为数据来分析和统计用户的体验情况,并根据用户的体验情况来进行用户体验视图(uev)的展示;例如,通过前台页面植入的js脚本,可采集用户打开的菜单、点击的屏幕区域、点击的按钮等信息,通过统计和分析用户的操作行为信息,可得到用户喜欢的业务类型、订单处理的耗时、订单异常量等各种信息,并将这些信息以图、表相结合的方式展现出来,通过对用户体验视图的实时展示,可方便相关人员第一时间掌握用户的体验情况,并有针对性的进行优化。

通过基于复杂事件处理的事件流引擎来对数据信息中的告警信息进行复杂事件计算,并根据计算结果来进行应用监控视图(amv)的展示,例如,通过对告警信息进行复杂事件计算后,可得出各个模块在一某一时间段内出现的告警次数、告警级别、模块性能等信息,并将这些信息以图、表相结合的方式展现出来;同时,在数据层中设置告警阈值,当出现计算结果超过告警阈值的情况时,自动向相关人员发送告警信息,例如,当某个模块在一设定的时间内出现的告警次数超过了设置的告警阈值,此时就通过短信、邮件等方式向相关人员发送告警信息。

当然,在具体实施时,对于应用的数据库相关指标、应用服务器的相关指标等,则可通过数据库的相关视图来进行展示,如:可对数据库sql语句耗时top10、数据库存储空间、数据库当前使用cpu等信息进行统计和分析,并以图、表相结合的方式展示出来。对于部分特殊的统计报表,则需要通过编写基于h5+css3编写程序来实现页面展现,通过对存储在日志分析服务器上的数据进行统计和分析,并将统计和分析结果以图、表相结合的方式展示在页面上,以方便维护人员、研发人员、领导等进行查看。

综上所述,本发明具有如下优点:

1、通过对企业资产配置库(cmdb)同应用的关系梳理,结合应用服务器的相关特点,真实的提供各个应用系统的adv(应用部署视图),一方面可方便运维人员直观了解系统架构,快速熟悉运维工作流程,另一方面在出现故障或问题的时候,能够按图索骥快速分析和定位故障,缩短系统故障的处理时间,使系统的可用性得到提升。

2、通过基于cep的esper技术,提供一个amv(应用监控视图),可向用户直观的展示应用系统的各个监控与告警视图,确保应用得到全方位的监控,并对超过预设告警阈值的指标给出及时的告警,可确保问题得到及时有效的跟踪处理。

3、采用aop、servlet、httpclient等各类钩子脚本和flume代理组件技术,提供一个可视化的系统应用性能管理apv平台,可有效解决软件产品的性能诊断难问题,提升软件产品的性能管理效率,对软件产品的性能问题实现预分析,避免软件的性能问题到测试和生产环节才发现,可提升产品的可用性,从而提升客户满意度。

4、通过各类无侵入式的js等钩子脚本,采集客户的体验情况,确保用户体验的可视化展示uev(用户体验视图),进而实现uem(用户体验管理),节省了客户调研和产品优化的时间,有助于提升工作效率和提升用户满意度。

5、采用基于cep的esper技术结合ogg和binlog日志解析技术,提供实时bdv(业务发展视图),向业务部门、企业经营管理者实时展示业务发展量及趋势判断,为企业营销策略的调优和业务的发展做出可量化、实时可视化的视图,助力企业的业务发展。

6、向用户提供一个后台调度任务的tspv(任务调度平台视图),将原先隐藏在应用后台运行的轮询展示在前台界面,使得应用维护人员能够及时了解到调度程序当前的运行情况,并能够在界面上直接做相关的操作处理;可确保任务调度的可用性,降低应用维护人员的工作难度,提升其工作效率。

7、采用esper技术结合接口调用日志异步采集分析技术,提供aiiv(应用接口调用视图),实时展示应用接口的调用情况,针对无授权访问的应用接口进行审计、爆增的应用调用进行限流,确保应用接口的安全、健康的运行。

虽然以上描述了本发明的具体实施方式,但是熟悉本技术领域的技术人员应当理解,我们所描述的具体的实施例只是说明性的,而不是用于对本发明的范围的限定,熟悉本领域的技术人员在依照本发明的精神所作的等效的修饰以及变化,都应当涵盖在本发明的权利要求所保护的范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1