基于svi的互联网as推断以及路由器划分方法

文档序号:7812037阅读:264来源:国知局
基于svi的互联网as推断以及路由器划分方法
【专利摘要】本发明的基于SVI的互联网AS推断以及路由器划分方法,首先建立数学模型,确定节点、社团指示向量、从属向量这三者之间的关系;然后建立从属向量到观测值的先验概率模型;通过SVI算法求解先验概率模型,计算出节点的隶属度,得到节点的AS划分结果,并提出了一种对划分结果的检验方法。
【专利说明】基于SVI的互联网AS推断以及路由器划分方法

【技术领域】
[0001]本发明属于互联网【技术领域】,具体涉及一种AS推断以及路由器划分方法。

【背景技术】
[0002]随着Internet规模的不断扩大,结构日益复杂,准确获取网络设备互联结构变得更加困难。而网络拓扑信息在网络监测和诊断、网络模拟、路由协议行为研究、网络性能优化、网络安全实施等方面有着重要的应用。Internet可以被划分为多个独立的管理域,称为自治系统(Autonomous System, AS),每个AS由具有单一路由策略的一组路由器和其他网络设备及相互连接构成,由一个管理机构控制管理。不同AS通过外部网关协议(Exter1rGateway Protocol, EGP)来交换路由信息,目前广泛采用的协议是边界网关协议(BorderGateway Protocol, BGP)0
[0003]现有的互联网拓扑模型主要分为路由器(RL)级拓扑模型和自治域(AS)级拓扑模型,但由于互联网的复杂性,这些拓扑模型并不能够全面展示互联网的拓扑特性:AS级拓扑模型无法模拟大规模复杂网络范围,且不能很好反映多种实际网络拓扑特性;由于现有路由器级拓扑发现算法都不能保证测量集合的准确性以及完备性,从而对RL级拓扑建模产生了一定的困难,且现阶段的理论分析不够成熟。
[0004]互联网作为复杂网络的一种,可以利用当前已有的大量复杂网络拓扑模型对其进行分析,但基于复杂网络的拓扑模型针对的是自然界中普遍存在的复杂网络的基本规律,其追求一般化的复杂网络模型或生成模型,导致这些模型只能在一定程度上适用于互联网,因此需要讨论复杂网络(特别地,大规模复杂网络)建模方法对当前互联网拓扑结构的适应性,并建立专门针对互联网的模型。
[0005]MMSB (Mixed Membership Stochastic Blockmodel)是近年来出现的较好的社团划分法,适用于分析处理具有复杂关联关系的数据,数据在数学上可以表达为复杂的图(graph)或者网络(network)结构。MMSB提出了混合隶属度的重要概念,并且有较高的划分准确性。
[0006]丽SB中,每个个体用一个节点来表示,节点之间的关系用边来表达,边可以分为有向边和无向边,某些节点之间存在一定的相似性或者相比之下联系更加紧密,呈现出模块或者社团的结构。每个节点关联一个属性值(隶属度),用于表达该节点与其他每个社团的从属关系,MMSB通过观测值来推算每个节点的隶属度,进而可以分析出节点的模块划分情况。
[0007]传统的方法在网络规模较小的时候,可以较好的工作,在网络节点巨大时,由于其较高的算法复杂度,不能工作或需要花费太长的时间。SVI (Stochastic Variat1nalInference),
[0008]随机变分推断,可以在网络规模巨大时较好地工作。SVI采用变分和最优化方法求解模型,可以并行实现。
[0009]互联网拓扑中的AS识别以及路由器划分至AS至少包括两个部分:一是在互联网中采集与拓扑相关的信息;二是根据采集的信息,推断互联网拓扑结构。现有的互联网拓扑识别方法存在两方面的缺陷:
[0010](I)现有拓扑识别方法大都从一种或少量几种与网络拓扑相关的信息出发,恢复网络拓扑。准确的互联网拓扑恢复对单个信息的完备性和准确性提出了很高的要求,通常难以做到。实际情况是:可以获得与网络拓扑相关的多种信息,但每一种信息都不足以完全准确地恢复互联网拓扑,需要综合我们所能获得的全部信息,以最终获得的拓扑能最大限度的满足所有与拓扑相关信息为目标,构建多源信息融合的大型最优化问题,通过该最优化问题的求解,恢复互联网拓扑。
[0011](2)现有拓扑恢复方法大都从网络的一个节点或一条边出发,通过对采集获得的拓扑相关信息深入分析,以某种规则逐步加入节点和边,每次只加入一条边或一个节点。对于小规模的网络,这样的方法是合适的,但针对互联网拓扑这样的复杂巨系统,现有方法的计算复杂度太高,几乎难以实现,需要根据我们获得的所有拓扑相关信息,通过少量步骤,以较少的计算工作量恢复互联网拓扑。
[0012]以上问题产生的原因在于:针对互联网拓扑这一复杂巨系统,缺乏一种简单有效的数学方法进行准确完整的描述与表达,便于进行互联网拓扑的相关研究,便于解释互联网这种无处不在的复杂网络的共同结构。


【发明内容】

[0013]针对现有技术存在的上述问题,本发明提出了基于SVI的互联网AS推断以及路由器划分方法。本发明的方案具体包含以下步骤:
[0014]步骤S1:建立数学模型,具体包括以下步骤:
[0015]步骤Sll:对于每个节点,从属向量QiNDirichlet(Ct);其中,i表示节点,符号“?”表示服从(后同)的意思,即ρ Θ i = Dirichlet ( Θ j ; α ),等式右边为参数为向量α的狄利克雷分布;
[0016]步骤S12:对于每一对节点i和j,其中i〈j,社团指示向量与从属向量Qi*联,社团指示向量ZiM与从属向量Θ」关联;其中社团指示向量ZiI与社团指示向量Ziy取值为I到K,所述K表示社团;
[0017]步骤S2:建立从属向量Θ到观测值y的先验概率模型:
_8] Piyij = l\Z^j,Zi”.,β) = m二 ^ z:::.
[0019]其中,民M表示第Al个社团的内部节点之间联系紧密程度,e为常数,e取极小值1.0X 10_9,y为实际观测数据中节点之间的连接情况,两点之间连接时,y取值为1,否则取O ;
[0020]步骤S3:求解先验概率模型,通过求解以下公式,计算出节点的隶属度Θ,得到节点的AS划分结果;
[0021 ] L( Y , Φ, λ ) =E(log(ρ θ , ζ, β y)))-E(log(q θ , ζ, β )));
[0022]其中,Υ为从属向量θ的分布的参数,Φ为社团指示向量ζ的分布的参数,λ分别为β的分布的参数,符号Ε(.)表示数学期望,上式等号右侧中,前项与后项分别为 E (log (ρ θ , ζ, β |y)))表示求 log (ρ ( θ,ζ, β y)), E (log (q θ,ζ, β )))表示求log (q θ,ζ, β ))在分布q ( θ,ζ, β )下的期望;
[0023]步骤S4:求解步骤 S3 所述公式:L( Y , Φ,λ ) = E(log(p θ,ζ, β | y)))-E (log(q(θ , ζ, β )));
[0024]步骤S4具体包括以下分步骤:
[0025]步骤S41:初始化全局变量

【权利要求】
1.基于SVI的互联网AS推断以及路由器划分方法,其特征在于,包括以下步骤: 步骤S1:建立数学模型,具体包括以下步骤: 步骤Sll:对于每个节点,从属向量QiNDirichlet(Ct);其中,i表示节点,符号“?”表示服从(后同)的意思,即P(Qi) =DiriChlet(0i;a),等式右边为参数为向量a的狄利克雷分布; 步骤S12:对于每一对节点i和j,其中i〈j,社团指示向量ZiI与从属向量Θ i关联,社团指示向量Zi叫与从属向量Θ j关联;其中社团指示向量ZiI与社团指示向量Zi叫取值为I到K,所述K表示社团; 步骤S2:建立从属向量Θ到观测值y的先验概率模型: Pivij =本叫,工叶 β) = ^ if^^; 其中,民μ表示第Z".个社团的内部节点之间联系紧密程度,e为常数,e取极小值1.0X 10_9,y为实际观测数据中节点之间的连接情况,两点之间连接时,y取值为1,否则取O ; 步骤S3:求解先验概率模型,通过求解以下公式,计算出节点的隶属度Θ,得到节点的AS划分结果;
L( Y , Φ,λ ) =E (log (p ( θ,Ζ, β I Y))) —Ε (log (q( θ , ζ, β ))); 其中,Y为从属向量θ的分布的参数,Φ为社团指示向量ζ的分布的参数,λ分别为β的分布的参数,符号Ε(.)表示数学期望,上式等号右侧中,前项与后项分别为 E (log (P ( Θ,ζ, β I y)))表示求 log (P θ,ζ, β I y)),E (logq θ,ζ, β )))表示求log (q θ,ζ, β ))在分布q ( θ,ζ, β )下的期望;
步骤 S4:求解步骤 S3 所述公式:L( Y , Φ, λ ) = E (log (ρ θ,ζ, β y)))-E (log (q ( θ,ζ,β))); 步骤S4具体包括以下分步骤:

Ti] [A1 步骤S4l:初始化全局变量γ= , λ=::

-YnJ -λ/。 步骤S42:从节点中抽取一定量的节点对,记做集合S ; 步骤S43:对于集合S中的所有节点对,根据当前全局变量值计算最优局部变量和最优局部变量Φ卜j ; 步骤S44:对于每个节点a,更新Y a,对于每个社团k,更新Ak; 步骤S45:重复步骤S2,步骤S3,步骤S4直到收敛。
2.根据权利要求1基于SVI的互联网AS推断以及路由器划分方法,其特征在于,所述步骤S43的更新公式如下:
cK^bJyab = O exp (Eq [log θ 3^] + Φ3^?3;1?Ε(1[1οδ(1-β1?)] + (1-φ3^?3;1?)1οδ1- e ));
cK^Jyab = I 00 exp (Eq [log θ 3^] + Φ3^?3;1?Ε(1[1οδ(1-β1?)]+1-φ3^?3;1?)1οδ e ; 其中—b,k和—b,k表不第k个社团的最优局部变量,Eq[log Θ a,k]中,下标q表不在分布q( θ,ζ, β )下求log Θ a,k的数学期望,yab表示节点a和b之间的连接情况,exp ?表示以e为底的指数函数,β,表示第k个社团的内部节点之间联系紧密程度。
3.根据权利要求1基于SVI的互联网AS推断以及路由器划分方法,其特征在于,所述步骤S44的更新公式如下
其中,yab,ci = yab,yab,i = 1-yab,p t = (tQ+t)_k,k e 0.5,1,的值为多重图情况下节点对yab的重数,Yah表示节点a和b之间的连接情况,上式中的梯度为自然梯度。
4.根据权利要求1基于SVI的互联网AS推断以及路由器划分方法,其特征在于,所述β为服从参数为η的Beta分布的随机变量。
5.一种针对模型结果的验证方法,其特征在于,通过求解式子= argmaxA来判断换份结果的准确性,该式的意思为,求一个标号i,且标号i使得yi取最大值,如果右瓦0.与划分的结果一致,从而划分正确,否则调整参数,重新进行计算; 其中,表示连接数量最大的 AS, Yi表示节点i与每个AS内部节点中的连接数量。
【文档编号】H04L12/701GK104168188SQ201410415718
【公开日】2014年11月26日 申请日期:2014年8月22日 优先权日:2014年8月22日
【发明者】胡光岷, 袁明凯, 刘唯一 申请人:电子科技大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1