基于局部时延分布相似性度量的目标ip定位算法

文档序号:9474411阅读:539来源:国知局
基于局部时延分布相似性度量的目标ip定位算法
【技术领域】
[0001] 本发明涉及配电柜安装用工具研发技术领域,尤其涉及基于局部时延分布相似性 度量的目标ip定位算法。
【背景技术】
[0002] 目前,现有具有较高精度定位算法SLG(Street-Level Geolocation)在最后一层 定位中,是根据最小相对时延策略选择的地标作为目标的估计位置,此种估计方法难以保 证该地标距离目标最近,且当最近路由器为匿名路由器时,通过此种定位方法得到的估计 位置的误差更大。

【发明内容】

[0003] 本发明的目的是提供基于局部时延分布相似性度量的目标IP定位算法,能够提 高精确度,减少估算误差。
[0004] 本发明采用的技术方案为:
[0005] 基于局部时延分布相似性度量的目标IP定位算法,包括以下几个步骤:
[0006] A :基于现有的区域城市级定位算法,初步判断目标所属城市或区域及该城市内的 地标,所述的目标所在城市内的所有地标记为地标集一,对目标和地标集一中的所有地标, 采用traceroute程序对其进行路径探测,得到该地标集的拓扑连接关系,从中查找出目标 与地标相连的最近一跳中间路由器作为最近共同路由器,并将该地标作为地标集二;
[0007] B :分别测量并计算得到最近共同路由器与地标和目标之间的时延,作为地标和目 标的局部时延:对目标、最近共同路由器和地标集三中的地标发起时延测量,分别计算得到 目标、地标与最近共同路由器间的局部时延;在一段时间内,重复该测量过程,得到大量的 局部时延数据;
[0008] C :根据大量的局部时延,获取地标和目标的局部时延分布;对步骤B中得到的大 量的局部时延数据,经过统计分析,得到目标和地标的局部时延分布;
[0009] D :计算目标和每个地标之间局部时延分布的相似性,将与目标的局部时延分布相 似度最高的地标,作为对目标的估计位置。
[0010] 所述步骤B中的局部时延测量方法如下:
[0011] B1 :同一时刻t,多次测量上述节点时延,取每个被测量节点时延的最小值,作为 该时刻各节点的时延,记地标1^(1 = 1,2,3)的时延为Llit,目标T的时延为1\,最近共同路 由器R的时延为Rt,则地标1^的局部时延可通过计算L lit-Rt得到,同理,通过计算T「&得 到目标T的局部时延;
[0012] B2:将该测量过程在尽可能长的时间段内重复多次,每次测量之间的时间间隔尽 可能小;
[0013] B3 :对地标Q和目标T可得到大量的局部时延;
[0014] B4 :对测得的局部时延作直方图统计,即可得到目标和地标局部时延分布。
[0015] 所述的步骤D中计算目标和每个地标之间局部时延分布的相似性具体包括以下 步骤:
[0016] D1 :设PjX)为目标T的局部时延分布,Qi⑴为地标i的局部时延分布,则两者局 部时延分布的相似性,通过下式计算相对熵来衡量:
[0018] 其中,X为局部时延的取值范围,通常根据实际的测量值确定;
[0019] D2 :最后,比较目标与每个地标局部时延分布的相似性,与目标局部时延分布相对 熵最小的地标#作为对目标的估计位置,如下式所示:
[0021] 本发提出了基于局部时延分布相似性度量的IP定位算法。该算法在确定目标的 区域城市级位置的基础上,首先对该区域或城市内的大量地标进行拓扑探测,查找出目标 与地标相连的最近一跳中间路由器作为最近共同路由器;接着,分别测量并计算得到最近 共同路由器与地标和目标之间的时延,作为地标和目标的局部时延;然后,根据大量的局部 时延,获取地标和目标的局部时延分布;最后,将与目标的局部时延分布相似度最高的地 标,作为对目标的估计位置,与现有的典型算法SLG相比,本文算法具有更高的定位精度。
【附图说明】
[0022] 图1为本发明的定位算法原理图;
[0023] 图2为局部时延测量实例;
[0024] 图3为地标和目标的部分共同路由器为匿名路由器举例;
[0025] 图4为本发明与SLG算法精确度和误差的实验结果比较示意图。
【具体实施方式】
[0026] 如图1、2和3所示,在同一个运营商网络内,通过最后一跳共同路由器相连的两台 主机,若地理距离相近,则以同种方式接入互联网的概率较大,相同的网络接入方式对最后 一跳时延的影响应近似,进而两台主机的最后一跳时延具有相似的变化特点;分别测量两 台主机时延时,若探测报文经过相似的转发路径,则这两台主机的时延应呈现相似的变化 特点,即时延分布相似。图中三角形代表目标,正方形代表探测源,圆形代表地标,圆柱体代 表路由器。
[0027] 基于局部时延分布相似性度量的定位算法的目的,是在区域城市级定位的基础 上,实现对目标的更细粒度的定位。定位过程包括如下几个主要部分:拓扑发现和分析、局 部时延测量、局部时延分布获取及相似性计算等。算法流程如图所示,本发明的具体算法步 骤如下:
[0028] A:首先基于现有的区域城市级定位算法,初步判断目标所属城市(或区域)及该 城市内的地标(记为地标集一),对目标和地标集一中的所有地标,采用traceroute程序对 其进行路径探测,得到该地标集的拓扑连接关系,对该区域或城市内的大量地标进行拓扑 探测,查找出目标与地标相连的最近一跳中间路由器作为最近共同路由器;并将该地标作 为地标集二;
[0029] B:接着,分别测量并计算得到最近共同路由器与地标和目标之间的时延,作为地 标和目标的局部时延:对目标、最近共同路由器和地标集三中的地标发起时延测量,计算得 到目标和地标与最近共同路由器间的局部时延;在一段时间内,重复该测量过程,得到大量 的局部时延数据;所述步骤B中的局部时延测量方法如下:
[0030] B1 :同一时刻t,多次测量上述节点时延,取每个被测量节点时延的最小值,作为 该时刻各节点的时延,记地标1^(1 = 1,2,3)的时延为Llit,目标T的时延为1\,最近共同路 由器R的时延为Rt,则地标1^的局部时延可通过计算L lit_Rt得到,同理,通过计算T「&得 到目标T的局部时延;
[0031] B2:将该测量过程在尽可能长的时间段内重复多次,每次测量之间的时间间隔尽 可能小;
[0032] B3 :对地标Q和目标T可得到大量的局部时延数据;
[0033] B4 :对测得的局部时延作直方图统计,即可得到目标和地标局部时延分布。
[0034] 局部时延测量和分布获取是本文定位算法的核心步骤之一。通过拓扑发现和分 析,可确定与目标T通过最近共同路由器R相连的地标L= ,…,Ln}。因为在某一时 亥IJ,网络环境近似处于相对稳定的状态,而目标和地标集L中的地标通过最近共同路由器R 相连,且如果探测源与目标位于同一城市,探测源和目标(地标)之间的路径长度(跳数) 相对较短,在同一时刻测量目标和地标的时延时,从探测源至R之间的路径往往变化较小, 如果不同地标(地标和目标)之间的时延分布存在差异,这种差异往往是共同路由器与地 标和目标之间的局部时延造成的。因此,本文通过测量最近共同路由器和地标及目标之间 的时延,计算得到局部时延。
[0035] C :然后,根据大量的局部时延,获取地标和目标的局部时延分布;对步骤B中得到 的大量的局部时延数据,经过统计分析,得到目标和地标的局部时延分布;
[0036] 如图2所示:给出了三个地标通过最后一跳共同路由器R与目标T相连的局部时 延测量实例(当R不是最后一跳共同路由器时,测量方法相同)。探测源P向目标T、最后一 跳共同路由器R及地标Li,L2,L3发起时延测量,测量方法如下:同一时刻t,多次测量上述节 点时延,取每个被测量节点时延的最小值,作为该时刻各节点的时延,记地标1^(1 = 1,2, 3) 的时延为Llit,目标T的时延为Tt,最近共同路由器R的时延为Rt,则地标Q的局部时延可 通过计算kt-Rt得到,同理,目标T的局部时延可通过计算T t-Rt得到。将该测量过程在尽 可能长的时间段内重复多次,每次测量之间的时间间隔尽可能小。最终,对地标1^和目标T 可得到大量的局部时延。对测得的局部时延作直方图统计,即可得到目标和地标局部时延 分布。
[0037] D:最后,计算目标和每个地标之间局部时延分布的相似性,将与目标的局部时 延分布相似度最高的地标,作为对目标的估计位置。所述的判断两个概率密度分布P和 Q之间的相似度,可采用计算相对熵(relative entropy)来衡量。相对熵又称KL散度 (Kullback-Leibler divergence,简称KLD),是用来度量使用基于Q的编码来编码来自P的 样本平均所需要的额外的位元数。典型情况下,P表示数据的真实分布,Q表示数据的理论 分布,模型分布,或P的近似分布。当两个分布相同时,其相对熵为〇,当两个分布的差异增 大时,相对熵也随之增大。
[0038] 对离散型的随机变量来说,概率分布P和Q的相对熵P(X)、Q(X)可按式定义:
[0040] 具体的,所述的步骤D中计算目标和每个地标之间局部时延分布的相似性具体包 括以下步骤:
[0041] D1 :设PT(X)为目标T的局部时延分布,Qi (X)为地标i的局部时延分布,贝lj两者局 部时延分布的相似性,通过下式计算相对熵来衡量:
[0043] 其中,X为局部时延的取值范围,通常根据实际的测量值确定;
[0044] :D2 :最后,比较目标与每个地标局部时延分布的相似性,与目标局部时延分布相 对熵最小的地标乍为对目标的估计位
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1