一种基于业务的性能监控和故障定位的方法与流程

文档序号:11147687阅读:398来源:国知局

本发明涉及一种计算机网络领域的监控方法,特别是指一种维护运营网络系统的安全、可靠的监管方法。



背景技术:

随着计算机技术和网络技术的发展,公司或企业的管理、运行越来越依赖于网络的安全运行和管理,传统的网络管理是通过SNMP协议管理网络设备、主机等系统,主要关注设备流量、CPU使用率和内存使用等情况,或是通过收集安全系统的日志来综合分析网络系统存在的安全问题,还有就是独立定制开发的业务系统管理软件,主要针对特定系统的管理维护软件。上述三种方法虽然可以在一定程度或小范围内解决部分的网络系统的安全运行和管理,但随着技术的发展,网络系统的攻击越来越多,且企业规模的增加使企业的网络系统十分复杂和规模化,网络系统出现各种异常、攻击和故障的概率大幅增加,对企业自身的运行造成很大的损失。因此,现已出现针对企业用户的APM(Application Performance Monitoring),此类技术需要嵌入代码、安装代理程序、在线,且会对业务系统有干扰,仍不能有效满足现有企业的要求.企业的网络系统运行时,故障、异常或攻击随时可能发生,且可能发生在终端用户设备、任意的网络结点、或任意的应用程序系统架构中,关键是即使企业的运行维护人员知道存在问题,但无法快速方便地确认问题的性质、确认故障或问题的位置,而解决上述问题需要调用企业内的多个部门、各设备厂商和软件开发商的各种资源来协调确认问题和解决问题,不仅费时费力,关键是效率低下而无法保证企业的业务系统的正常运行,造成重大损失。如何解决现有技术存在的不足并满足企业的网络系统有效运行和维护的高要求,不仅提高企业的整体运行效率,关键是提高安全性,这对企业十分重要,具有非常高的经济价值和良好的社会效益。



技术实现要素:

本发明的发明目的是公开一种对网络系统的基于业务的性能进行监控和对故障定位的方法。

实现本发明的技术解决方案如下:

a.定义业务参数:业务参数由至少一个服务端主机的定义参数或/和至少一个端口的定义参数的设定构成,将业务参数发送到步骤b;

b.网络数据采集:在网络中指定节点的交换机旁路连接探测探针,收集交换机发送过来的镜像网络数据,将镜像网络数据按业务参数的要求筛选后得到的业务数据传送到步骤c;

c.数据统计:根据网络协议将业务数据进行解析形成与业务相关的具体的参数信息,对参数信息进行各种KPI指标的统计得到业务统计数据;再发送到步骤d;

d.数据存储:接收步骤c的业务统计数据,提取业务统计数据的关键词并建立索引,按索引存入数据仓库;

e.关联分析:接收到监管中心的特定业务要求的业务参数,从数据仓库中提取业务统计数据,根据预设的分析模型对业务统计数据进行分析得到要求的分析结果;

f.结果呈现:将步骤e得到的分析结果按界面要求显示。

步骤a中的业务参数的定义参数还包括至少一个客户端主机的定义参数或/和应用协议的定义参数。

上述的探测探针和/或交换机均设定相应的定义参数。

网络系统中的应用系统设定相应的定义参数。

所述的探测探针包括性能探针、流量探针、WEB攻击安全探针、系统漏洞安全探针、DDOS检测安全探针和业务定义定制模块探针的任意组合。

步骤c中所述的参数信息包括:源地址、源端口、目的地址、目的端口、应用协议、请求类型、请求内容、请求内容数据长度、响应内容、响应码、响应时间、响应内容长度。

步骤c中所述的业务统计数据包括:TCP建立连接时间、服务器响应时间、数据传输时间、网络重传时间、平均响应时间、峰值响应时间、TCP会话数量、流量、上行流量、下行流量、突发流量、上下行网络报文总包数、丢包数量、丢包率、应用请求次数、响应次数、成功响应次数、响应率、响应码、成功率。

在步骤c中得到业务统计数据后,对其进行过滤,滤去不完整的杂质数据,形成合规的业务统计数据。

在得到与业务相关的具体参数信息后,对设定的至少一个时间周期Tn内的参数进行各种KPI指标的统计,得到对应时间周期Tn的专业统计数据。

所述的时间周期Tn设定为一分钟、三分钟和五分钟。

本发明利用在网络系统中旁路连接入探测探针获取指定节点的交换机的镜像网络数据,同时基于网络中的服务端主机或/和端口、或/和客户端主机、或/和应用协议、或/和探测探针、交换机与应用系统的定义参数来设定所谓业务的定义的业务参数,基于业务参数的限定而获得与业务相关联的业务数据,对业务数据进行处理形成与业务相关联的具体参数信息,再进行KPI指标的统计而得到业务统计数据,再按关键词建立索引并储存,在得到特定指示后从储存的数据中提取指定的数据再按预存的分析模型进行数据的处理得到特定指示要求的分析结果,并可按多种方式呈现分析结果。从上述的分析结果可直接得到网络中传输的信息流或数据流中存在的各种状态的参数或结果,上述的状态参数或结果可使运行维护人员明确获得所关心的业务的状态、状态出现的位置和时间,解决了现有技术存在的缺陷。本发明还可按给定的指示对整个系统进行自动检索,发现网络系统的数据流动出现异常而自动报警,并可对网络系统中的状态进行跟踪回溯和/或定位,解决了对企业的与业务相关联的系统的管理、运行和维护,对企业的整体效率的提高和安全性有极为明显的益处。

具体实施方式:

下面给出本发明的具体实施方式,需说明的是本发明的具体实施方式的详细描述是为了对本发明的全面的理解,而不应视为是对本发明的权利要求的保护范围的限制。

本发明的具体实施例的技术方案所涉及的方法的步骤如下:

步骤a为定义业务参数,业务参数由至少一个服务端主机的定义参数或/和至少一个端口的定义参数的设定构成,将业务参数发送到步骤b,此处的业务的概念是一个相对宽泛的概念,可以是指一个服务端的主机或主机组或多个服务端的主机组、或一个端口、或多个端口,这里的服务端的主机或多个主机和多个服务端为一个IP地址所限定,数量不受限制,上述的企业的网络系统的信息流入端被监控,也即限定了所谓企业的网络系统的范围,这样即构成了本方法所涉及监控的范围和关注的对象,例如一个大型的、跨地区的企业的网络系统就需涉及多个服务端主机或多个端口;步骤a所定义的业务参数传送到步骤b,步骤b为网络数据采集,在上述的网络系统中指定节点的交换机旁路连接探测探针,收集交换机发送过来的镜像网络数据,这样对网络系统不会产生干扰,信息流动的数据更为接近于真实,将镜像网络数据按业务参数的要求处理后得到的业务数据传送到步骤c,这实质是将镜像网络数据中的各种信息、数据按业务参数的定义有选择地取得对应的业务数据;步骤c为数据统计,根据网络协议将业务数据进行解析形成与业务相关的具体的参数信息,对参数信息进行各种KPI(Key Performance Indicator)指标的统计得到具体的业务统计数据,再发送到步骤d,上述的业务统计数据为反映业务性能的数据或进一步按要求计算或分析的基础数据;步骤d为数据存储,收到步骤c传递的业务统计数据后,提取业务统计数据的关键词并建立索引,按索引存入数据仓库,以备随时调用;步骤e为关联分析,当收到监管中心或客户的特定业务要求的业务参数,从上述的数据仓库中提取相关联的业务统计数据,根据预设的分析模型对业务统计数据进行分析,得到特定业务要求的分析结果,上述的特定业务要求一般是指上述的网络系统出现问题时有针对性的提出的要求,而得到的分析结果即为对应特定业务要求的网络系统中的信息流动的异常;步骤f为结果呈现,即将步骤e得到的分析结果按界面要求显示,结果的呈现为多种形式,如数据表格、数据曲线或直观的图形等形式。本发明通过特定的业务参数的定义或业务参数的组合定义确定了一个特定的网络系统,并对特定的业务参数或组合相关的网络系统中的信息流在不干扰的情况下进行采集和网络数据的处理与分析,一旦上述的网络系统中的信息流动出现任何地点、时间上的异常,本发明的方法可快速进行异常情况的定位与提供业务相关的异常性质,以方便网络系统维护运行人员及时发现问题、解决问题,特别是本方法可随时监控相关业务的信息流动的情况,可预先设置监控的重点业务,任何异常情况均可提前告警且还具有回溯功能,以查询任意时间的业务参数的性能。

前面已详细描述了本发明的方法的可实施的具体的实施方式,并给出了业务参数的设定要求和由此确定的本发明的方法监管的网络系统的范围,由于服务端主机和端口的数量的可拓展性,本方法可监管的网络系统亦具有范围的可扩大能力,这完全视企业的规模和需要而定,另一方面为进一步提高本方法对网络系统监管能力,所述的步骤a中的业务参数的定义参数还包括至少一个客户端主机的定义参数或/和应用协议的定义参数,这样所述的网络系统进一步扩大并使客户端与服务端之间形成多个信息流动的路径,网络系统更为完整,并且本方法对网络系统的监管点和路径大为拓展,形成严密的监管体系,应用协议的定义参数的引入,使整个被监管网络系统的监管内容更为丰富,对业务性能的监管大为拓展。在上述的步骤b中所述的探测探针为性能探针、流量探针、WEB攻击安全探针、系统漏洞安全探针、DDOS检测安全探针和业务定义定制模块探针的任意组合,上述的探测探针和/或交换机均设定相应的定义参数,由此每一探测探针获得的数据均有一特定的获取位置,通过上述的各种探测探针可主动或被动的方式采集网络系统的通过特定节点或节点间各种数据,一方面通过业务参数、特定节点将整个网络系统有机地划分为细分网格,另一方面通过上述采集的各种网络数据对细分网格中各方向的信息流动进行监管;通过不同类型的探针或探针的组合区分各种信息的性质,如通过系统漏洞安全探针以主动扫描的方式获知各服务器的系统漏洞信息,通过DDOS检测安全探针从上述的镜象信息流量中检测DDOS攻击,通过与WEB应用服务器的交换机旁路连接的WEB攻击安全探针检索WEB攻击数据,上述检测的各类数据为基础数据,经处理传递到步骤c。为进一步构建更为完善的监控性能,将上述中的网络系统中的应用系统设定相应的定义参数,这样不仅能对网络系统进行监管,还可对网络系统中应用系统如网站、办公自动化系统、财务报销系统等进行监管。

在步骤c中得到的与业务相关的具体的参数信息包括:源地址、源端口、目的地址、目的端口、应用协议、请求类型、请求内容、请求内容数据长度、响应内容、响应码、响应时间、响应内容长度等,通过上述的具体的参数可以得到在上述的网络系统中数据信息流动的来源、去向、路径、数据信息自身的与业务相关的信息和网络系统对信息的响应信息,对上述的参数信息进行各种KPI指标统计得到业务统计数据,这些KPI指标亦与指定的业务关联,反映业务的状态信息;上述的业务统计数据包括:TCP建立连接时间、服务器响应时间、数据传输时间、网络重传时间、平均响应时间、峰值响应时间、TCP会话数量、流量、上行流量、下行流量、突发流量、上下行网络报文总包数、丢包数量、丢包率、应用请求次数、响应次数、响应码、成功响应次数、响应率、成功率等,得到的上述的业务统计数据是本发明的方法取得的关键数据,且是网络系统中与业务相关的数据,通过这些反映网络系统中的信息流动的数据就可进行分析而得到网络系统中的各种问题。上述的业务统计数据还有数据的一个平均值,该平均值是随时间的推移而不断计算而更新,该平均值是反映网络系统中的上述数据的正常状态的值,也是进行数据比较的一个可随时间变化而更新的比较参数值。

由于网络系统中的业务统计数据相当庞大,且会含有部分不完整的数据,故在得到步骤c的业务统计数据后,对其进行过滤,滤去不完整的杂质数据,形成符合规定的业务统计数据,这可进一步提高对未来的分析结果的精度和可靠性;在上述的步骤c得到与业务相关的具体参数信息后,在进行各种KPI指标统计时,为使得到的业务统计数据更为精确、更具有时间指向性和随后对分析结果的时间上的回溯与了解,将上述的各种KPI指标的统计在时间上设定至少一个时间周期Tn进行统计,一个大的时间段被分隔为多个Tn的组合,这便于指定某一时间周期Tn进行分析评估,上述的时间周期Tn可设定为一分钟或三分钟或/和五分钟,当然还可以设定为更长时间的时间周期,则可对任意的时间的网络系统中与业务有关联的信息进行分析而得到实际状态的了解。

在得到上述的精确的业务统计数据后,提取业务统计数据的关键词并建立索引,以便指定特定要求而获得相关的业务统计数据,将上述的业务统计数据按索引存入数据仓库而形成一个可随时调用相关数据的数据库,该数据库可按现有技术的任一种构成,亦可用云技术形成。

当接收到监管中心的特定业务要求的业务数据,从上述的数据仓库中提取业务统计数据,根据预设的分析模型对业务统计数据进行分析可得到要求的分析结果,上述的分析结果与前述的业务统计数据中的与业务相关联的数据可得出网络系统中的信息流动的状态,该状态是广义的,其包括了网络系统中的某一点、或某一区间出现超出常规状态的问题,网络系统中出现某一种信息或信息流,从而可判断出网络系统在何时、何地点出现什么性质的异常,从而实现对网络系统的监管和故障定位,可快速对网络系统采取相应的问题排除建议或措施,极大地提高了对网络系统的维护、管理的效率,以减小网络故障对企业造成的损失。

在上述的各类数据中,与网络系统中出现异常的故障定位相关的数据是:TCP建立连接时间、服务器响应时间、数据传输时间、网络重传时间、平均响应时间、峰值用户响应时间、TCP会话数量、流量、上行流量、下行流量、突发流量、上下行网络报文总包数、丢包数量、丢包率、应用请求次数、响应次数、响应码、成功响应次数、响应率和成功率;通过对上述数据的确认与统计,可有效地得到网络系统中出现异常问题的位置和问题的类型。而与网络系统中的性能相关的数据是:TCP建立连接时间、服务器响应时间、数据传输时间、网络重传时间、平均响应时间、峰值用户响应时间、TCP会话数量、上下行网络报文总包数、丢包数量、丢包率、应用请求次数、应用响应次数、成功响应次数、响应率和成功率;通过上述数据可进行了解或确认网络系统中的与业务相关的性能状态。上述的各类数据的确定使本发明对一个网络系统的状态有完整清晰的实时了解,网络系统出现各类异常时可迅速确认异常出现的位置与问题的类型或性质,对网络系统的维护与管理提供了一个极好的手段,可大为提高对网络系统的管理效率和减小网络系统出现问题而导致的损失,这对企业的现代化管理极为有效,特别是对大型企业、跨地区性的企业的网络系统的管理极有帮助。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1