互连网端到端性能监测方法及其系统的制作方法

文档序号:7925750阅读:228来源:国知局
专利名称:互连网端到端性能监测方法及其系统的制作方法
技术领域
本发明涉及一种监测互连网性能的方法及其系统。
背景技术
评定互连网性能无论对网络工程中的网络性能测试,还是对网络的日常运营维护,甚至对互连网用户的应用都很重要。现有的互连网测试主要是通过由专用硬件和软件实体构成的仪器进行的,该测试仪通常具有测量精度较高和功能项专业的特点,但存在着价格昂贵、操作复杂和体积较大的缺点。此外,这些测试仪器主要用于测试网络互连设备如路由器、交换机等性能,测试指标通常包括吞吐量(Throughput)、时延(Latency)、丢包率(Packet loss rate)、背靠背帧数(Back-to-back frame)、系统恢复时间(Systemrecovery)和系统复位(Reset)[1],而对互连网性能的测试和监测仅有一个框架[2],而没有公认的参数和方法。
端到端(end-to-end)测量方法由于不要求在被测路径中接入测量仪器而易于实施,有些测量方法甚至可利用现有互连网设备的对某些特定包的反射特性(如ICMP的echo特性),而只需要在测试路径的一端放置测试设备即可,如Ping、Tracerout等。这些软件工具具有简单易行、价格低廉的特点,可用于测试互连网的连通性和路由等网络情况。但它们具有功能单一和测试结果无法有效利用的缺点。
现有网络管理系统如HP公司的Open View等,一般是通过SNMP等网络管理协议对网元级设备进行管理,而不直接提供互连网端到端性能监测、评价等方面的功能。
由于目前存在着描述互连网性能参数不统一、收集网络性能数据方法和系统复杂多样以及需要人工频繁干预等问题,还没有一种科学、定量、客观和简单易行的方法可供监测、评价和管理互连网性能使用,也缺乏对互连网端到端性能进行有效监测的系统。

发明内容
本发明的目的就是为了解决上述问题,提出一种科学、定量、客观和简单易行的互连网端到端性能监测方法及其系统。
本发明的技术解决方案一种互连网端到端性能监测方法,其特征在于(1)、确定测量包发射点,并在该点放置测量包收发装置,选择发射点的原则是,使其到被监测点的路径要经过或大部分经过主要基准路径;(2)、根据被监测网络范围来确定一批测量包反射点及其要监测的网络性能参数,为使监测系统能够准确地反映该网络或部分网络的性能水平,这些反射点一般应位于该网络逻辑边界,并为这些反射点定制测试条件;(3)、选择不同的测量时机策略,由测量包收发装置在发射点向反射点发送具有不同测量机制的测量包;(4)、反射点具有对不同测量包反射自动应答的特性,这些被反射的包带有测量信息,并返回给发射点;(5)、发射点接收到反射回来的测试包,提取有关测量参数,进行相关处理后存储,测量参数的主要处理方法可以包括a.按发送的序号接收反射Ping包,对重复序号的包,从第二个包起丢弃;b.对同一批ICMP反射包的样本值按算术平均法计算RTT、丢包率、不可达性、非忙率和不可预测性,如果该RTT值>阈值,则启动路由测量程;如果路由测量的结果与基准路径不一致,则需要报警;c.当对某测量反射点丢包率为100%时,对该路径进行阻断告警处理;d.形成定量的性能评价报告,并对测试的重要事件给出详细列表;e.形成性能评价曲线并显示出来,以表格形式列出测试记录并可按测试条件查询;f.或从Tracerout消息中得到网络拓扑信息,显示在网络拓扑图上。
一种互连网端到端性能监测系统,其特征在于它是由位于测量包发射点的监测服务器和位于测量包反射点的被测对象两部分组成,被测对象通常由互连网设备充当,构成本监测系统实际只有一台集中式或多台分布式监测服务器构成;如果监测系统以集中式方式工作,则只需要配有一台监测服务器;如果监测系统以分布式方式工作,则可能需要配有两台或多台监测服务器以及一台安全认证服务器,监测服务器通过10/100Mb/s的以太网卡直接或间接与被监测的互连网相连。
本发明具有如下优点
1)本网络性能监测方法操作简单,便于实现自动化。在初始配置后,就开始提取网络全局性能参数、分析处理性能数据、显示数据曲线和做出监测报告等过程。
2)能测量多种广为接受的网络性能参数;根据多种端到端网络测量技术的特点,综合利用之,降低了系统开销,提高了网络测量效率和节省网络资源。这些方法包括利用不同网络测量机制得到的网络性能参数之间(可能)具有的相关性,尽可能使用较低开销的Ping测量过程;用Ping测量参数处理的异常结果来触发测量开销较大的其他机制;能对某些网络故障进行预测和提示。
3)按本监测方法实现的系统成本经济和便于实施。只须在网络某一端放置一个测量装置,该测量装置的硬件可以使用一台具有通用以太网卡的联网微机或工作站充当。
4)采用Ping测量工程化参数,测量端到端网络性能参数质量较高。
5)为解决当测量反射点数量较多时,Ping测量中可能存在Ping操作的大量冗余问题,提出了Ping测试包发送优化算法,提高了系统工作效率。
6)为了简化配置测量参数的问题,采用先定义测量域,再为测量域定义测量策略的方法。
7)系统可以集中式方式工作,并在大型网络环境下,可方便地扩展为分布式方式运行,提高系统的工作效率,减少了网络开销。
8)可在全网设置安全认证中心,使系统共享监测数据有一定安全保证。


图1是本发明以分布式方式工作的系统示意图。
图2是本发明监测系统的构成示意图。
具体实施例方式
在本发明的互连网端到端性能监测方法描述之前,先给出常用术语的定义。
术语定义[2]主机能够使用Internet协议通信的计算机,包括路由器、交换机、服务器等。
链路两台(或更多)主机之间的链路级的连接,包括租用线路、以太网、帧中继和ATM等。
路由器通过转发IP包,使主机之间能够进行网络级通信的主机。
路径(Path)可表示为形式为<h0,l1,h1,…,ln,hn>的有向序列,其中n>0,每个hi是一个结点,每个li是一条hi-1到hi之间的链路,每个h1…hn-1是一个路由器。每个<li,hi>二元组被称为一“跳”。
基准路径工程设计时设定的默认路由定义为基准路由。
端到端跨越某条路径的两端,即从h0到hn,它包括了路径上的多个结点和链路。h0通常为测量包发射点,hn通常为测量包反射点。测量包反射点通常具有对特定测量包向测量包发射点回送特定探测结果的能力。
RTT(Round Trip Time,RTT)从测量包发射点发出测试包的第一个比特起,到测量包反射点返回该包,直至测量包发射点接收到该包最后一个比特的时间。
单向时延(One-Way Latency,OWL)从测量包发射点发出测试包的第一个比特起,到测量包反射点接收到该包最后一个比特的时间。或者测试包从测量反射点到测量发射点传输的时间。
丢包率(Packet Loss Rate)从测量包发射点接收到的发送测量包的返回包的数量与测量包发射点发送测量包数量的百分比。
时延抖动(jitter)时延抖动是从测量发射点到测量反射点的连续包间的到达时间的波动。
不可达性(Unreachability)丢包率高于一定数量时就认为该反射点不可达。通常可取12%。
非忙率(Quiescence)若每在此测量时的丢包率为非零,则该小时为忙,否则为非忙;计算非忙次数与总的测量次数的百分比。
不可预测性(Unpredictability)u一段时间内的不可预测性u被定义为u=12(1-r)2+(1-s)2,]]>其中s为接收到的测试包平均数量与最大数量之比;而r为平均RTT值与最大RTT值之比。
本发明的互连网端到端性能监测方法步骤如下(1)、确定测量包发射点(简称发射点),并在该点放置测量包收发装置。选择发射点的原则是,使其到被监测点的路径要经过或大部分经过主要基准路径。
(2)、根据被监测网络范围来确定一批测量包反射点(简称反射点)及其要监测的网络性能参数。为使监测系统能够准确地反映该网络(或部分网络)的性能水平,这些反射点一般应位于该网络(逻辑)边界。需要为这些反射点定制测试条件。
(3)、选择不同的测量时机策略,由测量包收发装置在发射点向反射点发送具有不同测量机制的测量包。
(4)、反射点具有对不同测量包反射(自动应答)的特性。这些被反射的包带有测量信息,并返回给发射点。
(5)、发射点接收到反射回来的测试包,提取有关测量参数,进行相关处理后存储。对测量参数的主要处理方法可以包括a.按发送的序号接收反射Ping包,对重复序号的包,从第二个包起丢弃。
b.对同一批ICMP[3]反射包的样本值按算术平均法计算RTT、丢包率、不可达性、非忙率和不可预测性。如果该RTT值>阈值(该阈值需要根据以前一段时间的统计值来定),则启动路由测量(如Tracerout[3])过程;如果路由测量的结果与基准路径不一致,则需要报警。
c.当对某测量反射点丢包率为100%时,对该路径进行阻断告警处理。
d.形成定量的性能评价报告,并对测试的重要事件(如阻断等)给出详细列表。
e.形成性能评价曲线并显示出来;以表格形式列出测试记录并可按测试条件查询。
f.或从Tracerout消息中得到网络拓扑信息,显示在网络拓扑图上。
本发明方法中,步骤(2)所述的网络特性参数包括IP层的端到端的包往返时延、丢包率、路由和经过的结点数等;还包括不可达性、非忙率和不可预测性等参数。
或者包括IP层的包单向时延、时延抖动和路径带宽。
或者运输层的TCP发送丢包率、接收丢包率和TCP带宽。
或者应用层的HTTP带宽等。
步骤(2)所述的测试条件是,由于对每个测量反射点的每次测试都可能采用不同的测量策略(简单讲,测量策略即由各种测试条件组成),如果测量反射点较多的话,定义测量策略的工作将十分繁琐。为了简化之,可采用定义测量域,再为测量域定义测量策略的方法。测量域是一个对象,它代表应用同一个共同测量策略的一组测量反射点的集合。这样,可将具有相同测试条件的测量反射点放入相同的测量域中,再对该域配置测量条件即可方便地完成对测量反射点的配置。此外,可以将每个测量域与一组可视化测试数据曲线对应起来,方便宏观上观察测量结果。
同时,根据大量的实测经验,为提高Ping[3]测量参数的准确性,采用下列监测工程参数a)由于Ping包的时延和丢失率的参数与网络链路和测量包反射点的忙闲程度情况关系很大,在高速网络情况下要用统计的方法才能获得相对准确的测量数据,系统采用连续多次测试(如10次)的平均值来大致反映网络当时情况。该参数也可以由用户自行选定。
b)第一个Ping包的时延通常要比后继包大20%。因此系统自动丢弃第一个Ping包。
c)测量包的长度的不同所反映的时延也不一致长包时延要大,短包时延要小。因此测量时采用两组工程参数。①10个短包,每个包100字节(实际上发送11个短包,第一个被丢弃);10个长包,每个包1000字节。②4个短包,每个包100字节(实际上发送5个短包,第一个被丢弃);0个长包。该参数也可以由用户自行改变。
d)为了不给与接收点增加过多的负担,对同一反射点发送一组Ping包的时间间隔限制为大于1秒,且一组内的测量包尽可能均匀。
e)为了不给与发射点主机相连的信道增加过多负载,发射点主机发送Ping包的速率不超过每20毫秒1个。
本发明方法步骤(3)所述的测量时机策略中的测量包的发送时机可以是a)等间隔发送;b)以某种时间强度为参数泊松分布时间间隔发送。
测量间隔或时间强度可定为5分钟或15分钟或更长。
所述的测量时机策略中的收发测量包的机制可以包括Ping、Tracerout、SNMP、TCP和HTTP等[3]。
本发明当测量反射点数量较多时,Ping测量中可能存在Ping操作的大量冗余问题。由于实测结果说明,当某个测量参数变化较小时,对测量测试结果的影响并不大。因此,可采用Ping测试包优化算法来减少测量冗余,从而提高监测系统效率。该优化算法的要点包括a)Ping测量以测量反射点的IP地址为中心进行;
b)对测量调度时间间隔进行优化当时间间隔的差小于一定范围时,视为有相同的时间间隔;c)对测量调度起始时间进行优化,当起始时间的差小于一定范围时,视为有相同的起始时间;d)对包长度进行优化,当两个包长度的差小于一定范围时,视为有相同的包长度;e)对测试的包数量进行优化,当测试包数量的差小于一定范围时,视为有相同的包数量。
直接按上述端到端网络性能监测方法构成的系统可以称之为集中式端到端网络性能监测系统。端到端网络性能综合测试方法可以覆盖任意大的范围,但是当网络太大时,该方法的效率会因RTT过大和消耗网络带宽过多而效率下降。事实上,为了提高系统的工作效率,可以将一个大型网络划分为若干个逻辑区域(最好与管理一致起来),每个区域都采用上述方法进行监测;然后再将这些集中式系统构成分布式网络性能监测系统。构成分布式网络性能监测系统的要点包括a)对被监测大型的网络划分为逻辑监测子网,为监测每个子网设定一个监测服务器;假定性能监测服务器A配置为系统的逻辑中心,而Ai(i=1,2,…)配置为各逻辑子网的监测服务器,Ai上收集的网络性能数据能被A共享(参见图1)。
b)共享的数据包括Ai上的网络拓扑图、当前的性能曲线图、告警信息和日报报表等。其中日报报表可以通过定时和手动两种方式上报,其他信息采用异地同步更新的方式上报。
c)对于每个逻辑区域还可以迭代地采用上述方式。
为使系统共享监测数据有一定安全保证,全网设置准一的安全认证服务器。在该安全认证中心上保持网络性能测量数据的访问权限。如果需要访问其他监测服务器上的性能测量数据,相关监测服务器身份必须通过该安全认证中心的认证。身份认证的方法可以有多种方式,如PKI、RADIUS协议等。
本发明系统的构成逻辑上讲,本发明系统是由监测服务器(位于测量包发射点)和被测对象(位于测量包反射点)两部分组成。由于被测对象通常可由互连网设备充当,因此构成本监测系统实际只有一台(集中式)或多台(分布式)监测服务器构成(参见图2)。如果监测系统以集中式方式工作,则只需要配有一台监测服务器;如果监测系统以分布式方式工作,则可能需要配有两台或多台监测服务器以及一台安全认证服务器。监测服务器可通过10/100Mb/s的以太网卡直接或间接与被监测的互连网相连。
实施例本实施例给出了用本监测方法对某个覆盖北京市区范围互连网的主干网、工商银行系统和证券系统进行性能监测的工作过程。
假设该网中心机房设在西城区,主干路由器分别设在西城、东城、朝阳、崇文、宣武、丰台、石景山、海淀等8个区的机房。在该网上运行着政府、银行、证券、公安等专用应用系统,现需要对主干网、工商银行系统和证券系统进行性能监测。
步骤1选定测量包发射点位于西城区的中心机房或临近区域,并将测量包收发装置安装在该中心机房的局域网,使该装置到达各主干路由器经过基准路由。
步骤2建立一个“主干网”域并将所有的主干网路由器放入,为其配置监测工程参数;为工商银行系统建立一个“工商银行”域并将需要监测的路由器、交换机和Web网站放入,为其配置监测工程参数{10个短包,每个包100字节(实际上发送11个短包,第一个被丢弃);10个长包,每个包1000字节};建立一个“证券”域并将证券系统需要监测的路由器放入,为其配置探测更少的监测参数{4个短包,每个包100字节(实际上发送5个短包,第一个被丢弃);0个长包},监测间隔为5分钟。
步骤3为主干网监测域选择泊松分布测量时机;为“工商银行”域选择监测间隔为15分钟;为“证券”域选择监测间隔为5分钟。由测量包收发装置向各个域中的监测对象发送监测包。
步骤4由于所选择的监测对象都具有自动反射测检包的特性,因此测量包收发装置能够接收到反射回来的测量包。
步骤5测量包收发装置接收到这些反射回来的测量包,经过如下计算处理,按发送的序号接收反射Ping包,对重复序号的包,从第二个包起丢弃。
对同一批Ping反射包的样本值按算术平均法计算RTT、丢包率、时延抖动、不可达性、非忙率和不可预测性。如果该RTT值>阈值(该阈值需要根据统计值来定),则启动Tracerout测量过程;如果Tracerout测量的结果与基准路径不一致,则需要报警。
当对某测量反射点丢包率为100%时,对该路径进行阻断告警处理。
形成定量的性能评价报告,并能对测试的重要事件(如阻断等)给出详细列表。
形成性能评价曲线并显示出来;以表格形式列出测试记录并可按测试条件查询。
或若对Tracerout测量,对测试UDP包的TTL值依次从1增加1,直至到达目标测量反射点,显示该路径和基准路径。如果目标测量反射点不可达,显示该路径的可达部分和基准路径。
或从Tracerout消息中得到网络拓扑信息,显示在网络拓扑图上。
随着网络规模的增大,如网络扩展为覆盖北京市、河北省和辽宁省的网的话,本监测系统可以进一步配置为分布式方式。即每个区域都设置一个网络性能监测服务器,用来监测本区域的网络性能。如果其他区域的性能监测服务器希望了解该区域的网络性能的话,通过共享该区域监测服务器上的数据就能够实现,从而大大提高了系统效率,降低了网络的开销。其方法是①即除了在北京市安装监测系统,也需要在河北省、辽宁省按上述方法安装该系统。
②指定一个性能监测服务器为分布式监测系统的管理中心,如指定北京的监测服务器为管理中心。
③在网络上配置一个认证服务器,其物理位置不限,如放在河北省石家庄市。在该认证服务器上定义能够被管理中心共享的测量数据资源,如网络拓扑图、数据曲线和网络性能报表等。
参考文献[1]S.Bradner and McQuaid,Benchmarking Methodology for NetworkInterconnect Devices,RFC 2544,March 1999[2]V.Paxson,et al.,Framework for IP Performance Metrics,RFC 2330,May 1998[3]R.Stevens,TCP/IP Illustrated.Volume 1.Addison Wresley.1994.
权利要求
1.一种互连网端到端性能监测方法,其特征在于(1)、确定测量包发射点,并在该点放置测量包收发装置,选择发射点的原则是,使其到被监测点的路径要经过或大部分经过主要基准路径;(2)、根据被监测网络范围来确定一批测量包反射点及其要监测的网络性能参数,为使监测系统能够准确地反映该网络或部分网络的性能水平,这些反射点一般应位于该网络逻辑边界,并为这些反射点定制测试条件;(3)、选择不同的测量时机策略,由测量包收发装置在发射点向反射点发送具有不同测量机制的测量包;(4)、反射点具有对不同测量包反射自动应答的特性,这些被反射的包带有测量信息,并返回给发射点;(5)、发射点接收到反射回来的测试包,提取有关测量参数,进行相关处理后存储,对测量参数的主要处理方法可以包括a.按发送的序号接收反射Ping包,对重复序号的包,从第二个包起丢弃;b.对同一批ICMP反射包的样本值按算术平均法计算RTT、丢包率、不可达性、非忙率和不可预测性,如果该RTT值>阈值,则启动路由测量程;如果路由测量的结果与基准路径不一致,则需要报警;c.当对某测量反射点丢包率为100%时,对该路径进行阻断告警处理;d.形成定量的性能评价报告,并对测试的重要事件给出详细列表;e.形成性能评价曲线并显示出来,以表格形式列出测试记录并可按测试条件查询;f.或从Tracerout消息中得到网络拓扑信息,显示在网络拓扑图上。
2.按权利要求1所述的互连网端到端性能监测方法,其特征在于所述的网络特性参数包括IP层的端到端的包往返时延、丢包率、路由和经过的结点数;还包括不可达性、非忙率和不可预测性等参数;或者包括IP层的包单向时延、时延抖动和路径带宽;或者运输层的TCP发送丢包率、接收丢包率和TCP带宽;或者应用层的HTTP带宽等。
3.按权利要求1所述的互连网端到端性能监测方法,其特征在于所述的测试条件是,如果测量反射点较多,采用定义测量域,再为测量域定义测量策略的方法,测量域代表应用同一个共同测量策略的一组测量反射点的集合,将具有相同测试条件的测量反射点放入相同的测量域中,再对该域配置测量条件即可方便地完成对测量反射点的配置,并将每个测量域与一组可视化测试数据曲线对应起来,方便宏观上观察测量结果。
4.按权利要求1所述的互连网端到端性能监测方法,其特征在于为提高Ping测量参数的准确性,采用下列监测工程参数a)采用连续多次测试的平均值来大致反映网络当时情况;b)第一个Ping包的时延通常要比后继包大20%,自动丢弃第一个Ping包;c)测量时采用两组工程参数,①10个短包,每个包100字节;10个长包,每个包1000字节;②4个短包,每个包100字节;0个长包;该参数或由用户自行改变;d)对同一反射点发送一组Ping包的时间间隔限制为大于1秒,且一组内的测量包尽可能均匀;e)发射点主机发送Ping包的速率不超过每20毫秒1个。
5.按权利要求1所述的互连网端到端性能监测方法,其特征在于所述的测量时机策略中的测量包的发送时机是a)等间隔发送;b)或以某种时间强度为参数泊松分布时间间隔发送;测量间隔或时间强度为5分钟或15分钟或更长。
6.按权利要求1所述的互连网端到端性能监测方法,其特征在于所述测量时机策略中的收发测量包的机制包括Ping、Tracerout、SNMP、TCP和HTTP等。
7.按权利要求1所述的互连网端到端性能监测方法,其特征在于当测量反射点数量较多时,采用Ping测试包优化算法,该优化算法主要包括a)Ping测量以测量反射点的IP地址为中心进行;b)对测量调度时间间隔进行优化当时间间隔的差小于一定范围时,视为有相同的时间间隔;c)对测量调度起始时间进行优化,当起始时间的差小于一定范围时,视为有相同的起始时间;d)对包长度进行优化,当两个包长度的差小于一定范围时,视为有相同的包长度;e)对测试的包数量进行优化,当测试包数量的差小于一定范围时,视为有相同的包数量。
8.按权利要求1所述的互连网端到端性能监测方法,其特征在于当网络太大时,将一个大型网络划分为若干个逻辑区域,每个区域都采用上述方法进行监测,然后再将这些集中式系统构成分布式网络性能监测系统,构成分布式网络性能监测系统的主要包括a)对被监测大型的网络划分为逻辑监测子网,为监测每个子网设定一个监测服务器;假定性能监测服务器A配置为系统的逻辑中心,而Ai(i=1,2,…)配置为各逻辑子网的监测服务器,Ai上收集的网络性能数据能被A共享;b)共享的数据包括Ai上的网络拓扑图、当前的性能曲线图、告警信息和日报报表等,其中日报报表可以通过定时和手动两种方式上报,其他信息采用异地同步更新的方式上报;c)对于每个逻辑区域还可以迭代地采用上述方式。
9.一种互连网端到端性能监测系统,其特征在于它是由位于测量包发射点的监测服务器和位于测量包反射点的被测对象两部分组成,被测对象通常由互连网设备充当,构成本监测系统实际只有一台集中式或多台分布式监测服务器构成;如果监测系统以集中式方式工作,则只需要配有一台监测服务器;如果监测系统以分布式方式工作,则可能需要配有两台或多台监测服务器以及一台安全认证服务器,监测服务器通过10/100Mb/s的以太网卡直接或间接与被监测的互连网相连。
全文摘要
本发明涉及一种监测互连网性能的方法及其系统,其方法是,先确定测量包发射点,并在该点放置测量包收发装置,根据被监测网络范围来确定一批测量包反射点及其要监测的网络性能参数,并为这些反射点定制测试条件;选择不同的测量时机策略,由测量包收发装置在发射点向反射点发送具有不同测量机制的测量包;反射点具有对不同测量包反射自动应答的特性,这些被反射的包带有测量信息,并返回给发射点;发射点接收到反射回来的测试包,提取有关测量参数,进行相关处理后存储。本发明的监测系统是由位于测量包发射点的监测服务器和位于测量包反射点的被测对象两部分组成,监测服务器通过10/100 Mb/s的以太网卡直接或间接与被监测的互连网相连。
文档编号H04L12/26GK1400774SQ0213818
公开日2003年3月5日 申请日期2002年8月22日 优先权日2002年8月22日
发明者陈鸣 申请人:陈鸣, 中国人民解放军理工大学指挥自动化学院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1