一种多接口路由器地理定位方法与流程

文档序号:15845923发布日期:2018-11-07 09:01阅读:296来源:国知局
一种多接口路由器地理定位方法与流程

本发明涉及地理定位技术领域。

背景技术

网络空间测绘研究内容之一是实体资源定位,即确定网络设备实体在地理空间中的位置。路由器作为构建互联网的基石,对其地理定位技术就成了能否准确绘制网络空间的关键。然而,网络空间实体多以ip地址为标识,而ip地址本身具有地理位置无关性,同时,一台路由器拥有多个ip地址也增加了定位的不确定性。因此如何对路由器实施定位既是网络空间测绘核心问题之一,更是一个难点问题。近年来,网络拓扑发现大规模的路由器级拓扑技术不断发展,探测时间、规模、覆盖度均不断提升,ip地理定位技术的准确度精确度不断提高,让逻辑拓扑映射到地理位置成为可能。

过去的研究多以ip地址为单位进行地理定位,缺少以路由器为单位的地理定位研究。以往对路由器的研究通过提取和解码路由器主机名中包含的地理信息字符串定位路由器位置,或通过建立路径-时延模型来定位路由器地理位置。这些方法通常需要额外测量工作,或人工辅助解析,难以持续更新。不仅如此,测量通常不可重现,人工参与的解析结果会因人而异,导致定位过程难以重现,定位结果难以评估。



技术实现要素:

为了解决现有的以路由器为单位的地理定位方法存在需要额外测量工作或需要人工辅助解析存在定位过程难以持续更新,致使测量难以重现、定位过程难以重现,人工解析因人而异定位结果难以估计的问题。本发明进而提供了一种多接口路由器地理定位方法。

本发明为解决上述技术问题采取的技术方案是:

一种多接口路由器地理定位方法,所述方法的实现过程为:

步骤1、多接口路由器的接口ip地址由于路由器交换地址空间导致地理定位不同,采用接口选举(interfaceelection,ie)使同一台多接口路由器的不同接口ip地址定位在相同位置;

步骤2、根据多接口路由器的邻居路由器的定位位置来对其进行定位,采用邻居选举(neighborelection,ne)使相连路由器间地理位置相近;

步骤3、将步骤1和步骤2结合在一起完成多接口路由器的地理位置定位。

进一步地,步骤1具体实现过程为:

利用商业ip地理定位数据库对每台多接口路由器各接口ip地址进行位置定位;

为每台多接口路由器建立位置频数矩阵;

选取频数矩阵中置信度最大值对应的位置作为该多接口路由器的定位位置;

其中:多接口路由器位置频数矩阵如下:

i中li表示路由器接口ip地址的第i个位置,fi表示第i个位置出现的频数,cii表示第i个位置是路由器位置的置信度;其中cii表示为:

进一步地,步骤2的具体过程为:

利用商业ip地理定位数据库对每台单接口路由器进行位置定位;

根据路由器间的连接关系,为每台多接口路由器建立邻居路由器位置频数矩阵;

不断迭代邻居路由器位置频数矩阵,至没有新的位置数据更新;

选取邻居路由器位置频数矩阵中置信度最大值对应的位置作为路由器定位位置;

其中,邻居路由器位置频数矩阵如下:

n中ri表示邻居路由器的第i个位置,ii表示第i个位置出现的频数,cni表示第i个位置是路由器位置的的置信度;其中cni表示为:

进一步地,步骤3的具体过程为:步骤3的具体实现过程为:

将步骤1获得的多接口路由器位置频数矩阵i和步骤2获得的邻居路由器位置频数矩阵n进行结合:

式中,表示:

当i中元素li和n中元素ri相同时,两个元素对应的频数、置信度分别均为

当i中元素li和n中元素ri不相同时,li元素对应的频数、置信度分别为

ri元素对应的频数、置信度分别为

本发明的有益效果是:

本发明提出了一种基于公开路由器级拓扑测量数据与商业ip地理信息的路由器定位方法—rloc,该方法充分利用现有网络拓扑测量与ip地理定位的成果来实施定位。与以往工作相比,rloc无需实施新的大规模网络测量,或构建及校对时延-距离模型;无需在人工辅助下解析域名、whois、网页等ip地址相关信息。

本发明方法的实现基于以下两点事实:同一台路由器的不同接口ip地址在相同位置;相连路由器间地理位置相近,而提出的基于公开路由器级拓扑测量数据与商业ip地理定位库的多接口路由器地理定位方法--rloc。rloc是一种多接口路由器地理定位方法,包括接口选举方法、邻居选举方法、综合法,定位路由器地理位置。rloc为路由器定位能够定位更多的路由器即覆盖率更大,定位结果更准确即准确率更高,方法实验易于实施与重复,结果易于更新和评估。能够实现为虚拟拓扑中设备节点定位到现实世界中地理位置。

提出的方法经实验结果表明,与相关数据集相比,本发明在可定位路由器的覆盖率和定位准确率上都有明显提升。在覆盖率上,国家级达到99.84%,城市级达到96.00%,比相关数据集分别高出0.93%和36.48%;在ixp数据验证准确率上,国家级达到82.51%,城市级达到59.45%,比相关数据集分别高出9.91%和27.20%。

附图说明

图1是本发明的流程框图;图2是单接口路由器定位示意图,图中直线上的a表示接口ip地址,图中圆圈中a表示路由器地理位置;

图3、图4和图5是三种启发式方法定位多接口路由器示意图,图3表示接口选举法示意图(interfaceelection,ie),图4表示邻居选举法示意图(neighborelection,ne),图5表示综合法示意图(ie+ne),图中:圆圈代表路由器,圆圈内的字母代表路由器的位置,黑色字母表示已知位置,灰色字母表示经过方法定位后的位置;圆圈的连接线表示路由器的接口ip地址,连线上的字母表示接口ip地址的位置;图3、图4表示对路由器n1、n2定位示意图;

图6为ddec验证国家级各方法的准确率图,图7为ddec验证城市级各方法的准确率图,图8为ixp验证国家级各方法的准确率图,图9为ixp验证城市级各方法的准确率图。

具体实施方式

具体实施方式一:如图1所示,本实施方式所述的对本发明所述的一种多接口路由器地理定位方法进行如下描述:

1、所述多接口路由器地理定位方法(rloc)基于两点事实:1)同一台路由器的不同接口ip地址在相同位置;2)相连路由器间地理位置相近。提出了三种启发式方法,如图3至5所示,接口选举(interfaceelection,ie)、邻居选举(neighborelection,ne)和综合法(ie+ne)。

2、所述多接口路由器地理定位方法的实现过程如下:

2.1、ie方法

rloc充分利用同一台路由器上不同接口ip地址在相同位置这一事实,提出ie方法。

步骤:

路由器位置频数矩阵:

i中li表示路由器接口ip地址的第i个位置,fi表示第i个位置出现的频数,cii表示第i个位置是路由器位置的置信度。其中cii表示为:

例:在图3ie方法示意图中,首先,输入路由器的各接口ip地址,和商业ip地理定位数据库,为每个ip地址定位地理位置。其次为路由器建立位置频数矩阵为:

最终选择路由器的位置为a,置信度0.75。输出路由器位置a.

ie方法会出现位置歧义,即路由器有两个或几个位置拥有相同的置信度,导致定位失败的情况。

2.2、ne方法

rloc充分利用相连路由器间地理位置相近这一事实,提出ne方法。

步骤:

其中,单接口路由器,如图1中1所示,只有一个接口ip地址,其位置为接口ip地址的位置。邻居路由器位置频数矩阵:

n中ri表示邻居路由器的第i个位置,ii表示第i个位置出现的频数,cni表示第i个位置是路由器位置的的置信度。其中cni表示为:

例:在图4ne方法示意图中,首先输入路由器间连接关系、单接口路由器和商业ip地理定位数库,为每台单接口路由器地理定位。其次根据路由器间连接关系建立最初的邻居路由器位置频数矩阵:

n1、n2路由器第一次迭代的位置频数矩阵为:

根据路由器间连接关系不断迭代矩阵中信息,至不再有新的位置数据更新为止。第二次迭代的位置频数矩阵为:

最终选择n1位置为b,置信度为0.67;n2位置为a,置信度为0.8325。输出n1:b;n2:a。

ne方法会出现两种定位失败的情况:位置歧义;邻居缺失,即邻居路由器无法定位导致的频数矩阵缺失。

2.3、ie+ne方法

rloc充分利用以上两种方法的事实依据,提出ie+ne方法。

步骤:

将两个方法的位置频数矩阵结合:

r中i与n表示各方法获得的位置频数矩阵,表示:当li和ri相同时,频数、置信度分别均为当li和ri不同,频数、置信度分别为

例:在图5ie+ne方法示意图中,n1、n2位置频数矩阵为:

最终选择n1位置为b,置信度为0.67,n2位置为a,置信度为0.79125。输出n1:b;n2:a。

ie+ne方法会出现位置歧义导致定位失败的情况。该方法消除了ne方法中邻居缺失而影响定位的情况。

3、对本发明的发明效果进行验证:

3.1实验数据

以caidaitdk提供的2017年10月midar和iffinder别名解析后获得的路由器级拓扑数据。对路由器级拓扑数据进行筛选及分析,删除为主机点的ip地址,获得76,520,865台路由器,其中132,175台多接口的路由器,41,666,625台单接口路由器。以2018年3月的ip2location商业地理定位数据库作为输入数据,定位了42,186,037个ip地址。

以2017年12月ixp数据、2018年3月ddec工具获取的位置数据作为验证数据,评价各定位方法的准确率。ixp数据以ip前缀和位置映射关系定位路由器。当路由器至少一个接口ip地址在ixp数据的ip前缀中,则ip前缀的位置定位为路由器真实位置,ixp可定位1,929台路由器。ddec数据以ddec工具对路由器接口ip地址解析位置信息来定位。当路由器至少一个接口ip地址解析到位置,则该位置定位为路由器真实位置,ddec数据可定位26,566个多接口路由器。

为对比评价方法,与2017年10月caida发布的路由器位置数据集比较。rloc以路由器级拓扑数据集和ip2location商业地理定位数据库为输入,而caida以路由器级拓扑数据集、ixp、ddec数据和maxmind公开地理定位数据库为输入。其中输入的路由器级拓扑数据集相同,在相同路由器集上比较输出。

3.2实验结果

rloc提出的ei、ni、ei+ni获得的数据与caida数据的路由器定位覆盖率如表1所示表1各方法定位多接口路由器覆盖率

就覆盖率而言,ei+ni方法更好,ie在国家级优于ne,但ne在城市级优于ie。在国家级,rloc方法定位了91.54%--99.84%,caida定位了98.9%,两数据基本持平。在城市级,rloc方法定位了83.97%--96.00%,caida定位了59.52%,rloc比caida数据高出了24.45%--36.48%。

以ddec与ixp数据分别评价rloc方法获得的数据和caida数据,在国家级、城市级路由器定位的准确率,如下图6-9所示:其中,堆积柱形图表示方法验证路由器的总数,灰色柱形表示验证正确的数量,白色柱形表示验证错误的数量。折线图表示方法的准确率。

就准确率而言,在国家级利用ddec验证极值范围为18.50%--85.27%。rloc为60.38%--63.20%,caida为59.11%。利用ixp验证极值范围为0.62%--100.00%,rloc为79.15%--84.78%,caida为72.60%。在城市级利用ddec验证极值范围为4.73%--52.15%,rloc为25.23%--34.69%,caida为19.15%。利用ixp验证极值范围为0.57%--96.63%,rloc为46.01%--64.95%,caida为32.25%。rloc数据无论国家级、城市级的准确率均较caida的数据有显著提升。

在ddec数据验证准确率时,无论国家级或城市级,无论各方法或真值的极大均不高。这可能是因为ddec方法对路由器接口ip地址定位准确率不高或该方法获得的数据并非路由器真实的位置导致。

城市级定位的准确率均较国家级准确率低。这可能是ip2location商业数据库对ip地址定位城市级准确率不高导致。rloc提出的方法中,ie+ne较ie准确率低,这是由于ne准确率比ie的准确率低,导致ie+ne准确率低。均衡各方法的路由器定位覆盖率和准确率,ie+ne方法效果更好。

rloc充分利用同一台路由器上不同接口ip地址在相同位置和相连路由器间地理位置相近这两个事实,具有比现有公开数据的更高的覆盖率和准确率。本文为平衡定位覆盖率和准确率选择ie+ne方法。覆盖率上,国家级达到99.8%,城市级达到96.00%,比caida数据分别高出0.93%和36.48%;准确率上,ixp验证国家级达到82.51%,城市级达到59.45%,比caida数据分别高出9.91%和27.20%;ddec验证国家级到达62.70%,城市级达到32.96%,比caida数据分别高出3.59%和13.81%。

rloc无需实施新的大规模网络测量,或构建及校对时延-距离模型;无需在人工辅助下解析域名、whois、网页等ip地址相关信息;易于实施与重复,结果易于更新和评估。

以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1