一种网络拥塞确定方法及装置与流程

文档序号:14879505发布日期:2018-07-07 09:21阅读:117来源:国知局
本发明实施例涉及通信
技术领域
,具体涉及一种网络拥塞确定方法及装置。
背景技术
:随着云计算、大数据在业界广泛的引入,这些新技术对网络带宽、延时提出了更高的要求,由于在dcn网络通常基于tcp/ip协议,该协议本身流量控制能力先天不足,较容易出现节点拥塞,表现为延时、tcp重传、超时乃至丢弃,而在业务层面表现为部分业务交易缓慢,且一般具有持续性、业务感知滞后等特性。考虑到大多数公司dcn网络发展过程中,引入多家厂商存在硬件品牌繁多、支持特性不一、协议私有等问题,很难通过sflow、netflow之类的数据流采样技术进行全局分析。目前网络工程师检测、处理拥塞时,通常结合告警、人工排查手段,并通过以下流程来完成:收到诸如端口带宽超过阀值告警,登陆设备确认信息(日志、路由表、端口状态等);手动排查大量端口流量监控图表信息,排查核心设备ipflow信息,定位成功率较低;通过人工排查、沟通拥塞链路的源目中心是否存在大流量定时任务;在拥塞链路设备所在的现场探测网络数据包,定位源目ip进行限制。在实现本发明实施例的过程中,发明人发现现有的方法由于网络链路具有全局性,涉及到诸多网络节点和线路,拥塞判断困难,目前只能通过设备端口带宽使用率、分析流量包并定位源目ip等间接手段来判断网络拥塞,拥塞判断缺乏客观标准,严重依赖处理网络工程师经验和能力;同时在拥塞判断过程中涉及到告警信息分析、人工手动排查及大量沟通工作,因此存在整个处理过程流程过长,并依赖于工程师的经验和能力,分析判断时间过长,导致整个拥塞处理时间过长,甚至出现明显业务影响后仍未定位问题的情况。技术实现要素:由于现有的方法拥塞判断缺乏客观标准,严重依赖处理网络工程师经验和能力;同时网络工程师的分析判断时间过长,导致整个拥塞处理时间过长,甚至出现明显业务影响后仍未定位问题,本发明实施例提出一种网络拥塞确定方法及装置。第一方面,本发明实施例提出一种网络拥塞确定方法,包括:计算源端和目的端在传输报文的过程中由于传输介质产生的传输损耗延时和由于设备处理产生的网络吞吐延时;根据所述传输损耗延时和所述网络吞吐延时,计算得到源目延时标准值;若当前网络平均延时大于所述源目延时标准值,则确定当前网络存在拥塞。可选地,所述传输损耗延时ttr根据以下公式一计算得到:其中,l为源端和目的端的传输距离,v为真空中的光速,n为折射率,p为传输节点数量,tp为源端到第p个传输节点的传输延时,lp为源端到第p个传输节点的传输距离,s为测试标准差,取值范围根据以下公式二确定:其中,m为测试次数,ym为第m次测试的源端到目的端的测试延时,为y1、y2……ym的平均值。可选地,所述网络吞吐延时tne根据以下公式三计算得到:tne=2n(u+1)tfw公式三其中,n为源端到目的端的关键路径上的节点数量,u为网络带宽利用率,tfw为帧转发的标准延时。可选地,所述根据所述传输损耗延时和所述网络吞吐延时,计算得到源目延时标准值,具体包括:根据以下公式四计算得到源目延时标准值tto:tto=ttr+tne公式四。可选地,所述方法还包括:统计源端和目的端在传输报文的过程中的丢包率,若所述丢包率大于预设值,则确定当前网络存在拥塞。第二方面,本发明实施例还提出一种网络拥塞确定装置,包括:延时计算模块,用于计算源端和目的端在传输报文的过程中由于传输介质产生的传输损耗延时和由于设备处理产生的网络吞吐延时;延时标准值计算模块,用于根据所述传输损耗延时和所述网络吞吐延时,计算得到源目延时标准值;拥塞确定模块,用于若当前网络平均延时大于所述源目延时标准值,则确定当前网络存在拥塞。可选地,所述延时计算模块中所述传输损耗延时ttr根据以下公式一计算得到:其中,l为源端和目的端的传输距离,v为真空中的光速,n为折射率,p为传输节点数量,tp为源端到第p个传输节点的传输延时,lp为源端到第p个传输节点的传输距离,s为测试标准差,取值范围根据以下公式二确定:其中,m为测试次数,ym为第m次测试的源端到目的端的测试延时,为y1、y2……ym的平均值。可选地,所述延时计算模块中所述网络吞吐延时tne根据以下公式三计算得到:tne=2n(u+1)tfw公式三其中,n为源端到目的端的关键路径上的节点数量,u为网络带宽利用率,tfw为帧转发的标准延时。可选地,所述延时标准值计算模块具体用于:根据以下公式四计算得到源目延时标准值tto:tto=ttr+tne公式四。可选地,所述装置还包括:丢包率统计模块,用于统计源端和目的端在传输报文的过程中的丢包率,若所述丢包率大于预设值,则确定当前网络存在拥塞。由上述技术方案可知,本发明实施例通过计算传输损耗延时和网络吞吐延时,进一步计算得到源目延时标准值,通过源目延时标准值可以客观、快速的判断源端和目的端之间是否存在拥塞情况,无需依赖网络工程师的经验和能力。附图说明为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些图获得其他的附图。图1为本发明一实施例提供的一种网络拥塞确定方法的流程示意图;图2为本发明一实施例提供的根据拥塞测试和经验值得到的延时趋势示意图;图3为本发明一实施例提供的源端到目的端的关键路径示意图;图4为本发明另一实施例提供的一种网络拥塞确定方法的流程示意图;图5为本发明一实施例提供的一种网络拥塞确定装置的结构示意图;图6为本发明一个实施例中电子设备的逻辑框图。具体实施方式下面结合附图,对本发明的具体实施方式作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。图1示出了本实施例提供的一种网络拥塞确定方法的流程示意图,包括:s101、计算源端和目的端在传输报文的过程中由于传输介质产生的传输损耗延时和由于设备处理产生的网络吞吐延时;其中,所述传输损耗延时是指在源端和目的端之间传输报文的过程中,主要由传输介质(包括传输节点设备)产生的传输延时。举例来说,当通过光纤传输时,所述传输损耗延时是指光在光纤中传输所需耗费的时间。所述网络吞吐延时是指报文在传输过程中经过包括路由器和交换机等网络设备时,由于这些设备在处理、转发报文时产生的延时。s102、根据所述传输损耗延时和所述网络吞吐延时,计算得到源目延时标准值;其中,所述源目延时标准值是指源节点(源端)和目的节点(目的端)在网络没有拥塞情况下,数据包来回传输所需的延时时间。具体地,网络延时受metric、网络吞吐、传输介质、波长距离、响应延时等因素影响,但这些因素中主要由传输损耗延时和网络吞吐延时来决定,因此所述源目延时标准值主要取决于所述传输损耗延时和所述网络吞吐延时两个因素。s103、若当前网络平均延时大于所述源目延时标准值,则确定当前网络存在拥塞。具体地,当网络产生拥塞时,根据拥塞测试以及经验值得到如图2的所述的延时趋势示意图,由图2可知,当节点拥塞时为非线性递增。根据经验当链路处于拥塞状态,节点延时会大大上升,通常会上升一个数量级,此时收集到网络实际平均延时会大于源目延时值的10倍(源目延时标准值),即认为网络存在拥塞。本实施例通过把网络传输主要延时分为传输损耗延时以及网络吞吐延时,通过模型计算传输损耗延时以及网络吞吐延时可以得出准确的源目延时标准值,并通过源目延时标准值和主机源至目的端到端的实际往返时间对比,同时可以结合丢包率来判断网络是否存在拥塞。本实施例通过计算传输损耗延时和网络吞吐延时,进一步计算得到源目延时标准值,通过源目延时标准值可以客观、快速的判断源端和目的端之间是否存在拥塞情况,无需依赖网络工程师的经验和能力。进一步地,在上述方法实施例的基础上,s101中所述传输损耗延时ttr根据以下公式一计算得到:其中,l为源端和目的端的传输距离,v为真空中的光速,n为折射率,p为传输节点数量,tp为源端到第p个传输节点的传输延时,lp为源端到第p个传输节点的传输距离,s为测试标准差,取值范围根据以下公式二确定:其中,m为测试次数,ym为第m次测试的源端到目的端的测试延时,为y1、y2……ym的平均值。具体地,目前dcn网传输介质通常为光纤,而光传输速度主要取光速和折算率,按中国光学学会发布的折射率n取值为1.47,真空中的光速v=30万公里/秒。传输过程中经过的单节点延时为w,考虑到目前dcn网络中通常源、目的链路经过设备节点在6个左右,故以经过6节点为值,故采用示波器法分别对p(1,2,3,4,5,6)个传输节点进行延时验证,测试10次,得到平均值,数据如下表:按照目前大多场景下网络不会超过6个节点,取p=6个节点,依据上次重复进行连续测试10次的数据,得到数据如下表中的数据y1-y10:273.70μs272.88μs272.61μs273.21μs273.66μs272.99μs272.31μs273.38μs272.80μs272.59μs由贝塞尔公式得到单节点测试标准差s’:结合标准差s’,得到单节点的延时w为:传输损耗延时ttr的计算公式如下,该值由传输介质、节点设备产生的传输损耗延时再加光正常传输的时间之和:其中,s=ps’。进一步地,在上述方法实施例的基础上,s101中所述网络吞吐延时tne根据以下公式三计算得到:tne=2n(u+1)tfw公式三其中,n为源端到目的端的关键路径上的节点数量,u为网络带宽利用率,tfw为帧转发的标准延时。举例来说,依据实际网络中传输报文大小普遍为5000字节左右,设置探测线路报文为5000字节。在dcn骨干网络转发环境内,主要产生延时的干扰项为包大小,因此将现网骨干网络节点间的包转发率作为主要依据进行估算网络节点转发延时,也就是帧队列延时tqe(queue)及帧转发延时tfw;帧发送延时tfw,以标准转发率作为参考值,在最小包(84byte)转发情况下,1g(带宽)=1.488mpps(每秒包转发),那么当探测包4次分片(5000+80+64byte)转发时,节点的包转发率为:pps=b÷8÷5144,此处b为链路带宽,带宽为1g时,pps=109÷8÷5144≈24300,因此,1g带宽下的帧转发延时tfw=1/24300=41.15μs。帧队列延时tqe,而帧队列延时主要是参考当前接口的带宽利用率,按所连网带宽利用率u来计算,得到:tqe=u×tfw。因此,单节点的网络转发延时tsw=tqe+tfw=(u+1)tfw,以此为基准值,列出所有源目ip的可达路径,包括高带宽路径(如10g链路按1g/10计算)按骨干节点换算的转发延时如图3所示。考虑到dcn网内等价路径较多的情况下,图中以红线标注来了转发关键路径,之间的延时以a,b…k(图3中n=8条连线)来表示,计算src→dst的延时tlf,即关键路径延时tlf=n(u+1)tfw,故数据包包括来回两端,则网络吞吐延时tne=2tif=2n(u+1)tfw。进一步地,在上述方法实施例的基础上,s102具体包括:根据以下公式四计算得到源目延时标准值tto:tto=ttr+tne公式四。具体地,网络延时受metric、网络吞吐、传输介质、波长距离、响应延时等因素影响,但这些因素中主要由传输损耗延时以及网络吞吐延时来决定,通过建立计算模型算出传输损耗延时以及网络吞吐延时并相加即可得出源目延时标准值。根据传输损耗延时(ttr)以及网络吞吐延时(tne)可以得出准确的源目延时标准值tto,即:tto=ttr+tne。进一步地,在上述方法实施例的基础上,所述方法还包括:s104、统计源端和目的端在传输报文的过程中的丢包率,若所述丢包率大于预设值,则确定当前网络存在拥塞。具体地,源目主机节点间不排除因缓存、队列、重传等原因产生的偶发性丢包,因此采样期间发生第二次丢包,也就是丢包率大于10%时,也可以判断为拥塞状态。具体地,通过定期发送icmp报文检查源、目的链路实际延时并和源目延时标准值对比,并结合丢包率,具体如图4所示,可以快速、自动地判断链路拥塞情况,便于后续进行自动处理或由网络工程师快速介入处理,大大缩短了拥塞处理时长。图5示出了本实施例提供的一种网络拥塞确定装置的结构示意图,所述装置包括:延时计算模块501、延时标准值计算模块502和拥塞确定模块503,其中:所述延时计算模块501用于计算源端和目的端在传输报文的过程中由于传输介质产生的传输损耗延时和由于设备处理产生的网络吞吐延时;所述延时标准值计算模块502用于根据所述传输损耗延时和所述网络吞吐延时,计算得到源目延时标准值;所述拥塞确定模块503用于若当前网络平均延时大于所述源目延时标准值,则确定当前网络存在拥塞。具体地,所述延时计算模块501计算源端和目的端在传输报文的过程中由于传输介质产生的传输损耗延时和由于设备处理产生的网络吞吐延时;所述延时标准值计算模块502根据所述传输损耗延时和所述网络吞吐延时,计算得到源目延时标准值;所述拥塞确定模块503若当前网络平均延时大于所述源目延时标准值,则确定当前网络存在拥塞。本实施例通过计算传输损耗延时和网络吞吐延时,进一步计算得到源目延时标准值,通过源目延时标准值可以客观、快速的判断源端和目的端之间是否存在拥塞情况,无需依赖网络工程师的经验和能力。进一步地,在上述装置实施例的基础上,所述延时计算模块501中所述传输损耗延时ttr根据以下公式一计算得到:其中,l为源端和目的端的传输距离,v为真空中的光速,n为折射率,p为传输节点数量,tp为源端到第p个传输节点的传输延时,lp为源端到第p个传输节点的传输距离,s为测试标准差,取值范围根据以下公式二确定:其中,m为测试次数,ym为第m次测试的源端到目的端的测试延时,为y1、y2……ym的平均值。进一步地,在上述装置实施例的基础上,所述延时计算模块501中所述网络吞吐延时tne根据以下公式三计算得到:tne=2n(u+1)tfw公式三其中,n为源端到目的端的关键路径上的节点数量,u为网络带宽利用率,tfw为帧转发的标准延时。进一步地,在上述装置实施例的基础上,所述延时标准值计算模块502具体用于:根据以下公式四计算得到源目延时标准值tto:tto=ttr+tne公式四。进一步地,在上述装置实施例的基础上,所述装置还包括:丢包率统计模块,用于统计源端和目的端在传输报文的过程中的丢包率,若所述丢包率大于预设值,则确定当前网络存在拥塞。本实施例所述的网络拥塞确定装置可以用于执行上述方法实施例,其原理和技术效果类似,此处不再赘述。参照图6,所述电子设备,包括:处理器(processor)601、存储器(memory)602和总线603;其中,所述处理器601和存储器602通过所述总线603完成相互间的通信;所述处理器601用于调用所述存储器602中的程序指令,以执行上述各方法实施例所提供的方法,例如包括:计算源端和目的端在传输报文的过程中由于传输介质产生的传输损耗延时和由于设备处理产生的网络吞吐延时;根据所述传输损耗延时和所述网络吞吐延时,计算得到源目延时标准值;若当前网络平均延时大于所述源目延时标准值,则确定当前网络存在拥塞。本实施例公开一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的方法,例如包括:计算源端和目的端在传输报文的过程中由于传输介质产生的传输损耗延时和由于设备处理产生的网络吞吐延时;根据所述传输损耗延时和所述网络吞吐延时,计算得到源目延时标准值;若当前网络平均延时大于所述源目延时标准值,则确定当前网络存在拥塞。本实施例提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行上述各方法实施例所提供的方法,例如包括:计算源端和目的端在传输报文的过程中由于传输介质产生的传输损耗延时和由于设备处理产生的网络吞吐延时;根据所述传输损耗延时和所述网络吞吐延时,计算得到源目延时标准值;若当前网络平均延时大于所述源目延时标准值,则确定当前网络存在拥塞。本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:rom、ram、磁碟或者光盘等各种可以存储程序代码的介质。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1