一种基于trace的IP地址地理位置库的推断和填充方法

文档序号：10538949阅读：551来源：国知局

一种基于trace的IP地址地理位置库的推断和填充方法
【专利摘要】本发明提供一种基于trace的IP地址地理位置库的推断和填充方法。包括：寻找trace的中间IP，比较最后位IP的可信度值与阈值大小，为分割后的trace序列附上地理位置信息和可信度信息，对各点的可信度进行归化计算，对新的可信度信息进行排序，选择可信度最大的数据对应的地理位置信息作为最终结果。本发明方法实现简单，能够对IP地址地理位置库的数据进行纠正和补充，方法有效且成本较低，解决了传统的IP地址地·理位置库维护方法费时费力的问题，实现了IP地理位置库自动化更新，使得通过处理更多的Trace数据来提高IP地理位置库整体可信度变为可能。
【专利说明】
一种基于trace的I P地址地理位置库的推断和填充方法
技术领域
[0001] 本发明涉及网络技术领域，尤其涉及一种基于trace的IP地址地理位置库的推断和填充方法。
【背景技术】
[0002] Traceroute方法利用路由追踪技术主动获取网络路由信息，发现测试点和目标主机之间的路由器IP地址。Traceroute方法探测过程如下：首先向目的主机的一个不可达端口（通常大于30，000)发送一份TTL字段为1的UDP包，这个包在经过第1个路由器以后，将被路由器丢弃，同时路由器将向源主机发送一个ICMP "超时"消息，通知信源主机该包丢失，通过解开这个ICMP包，就可以得到该路由器的IP地址。然后再以TTL = 2向目的主机法UDP包，这样就可以得到第二个路由器的IP地址。重复上面的操作，直到返回的ICMP包类型为目的端口不可达，表明已经到达了目的主机，这样就得到从本主机到目的主机所经过的路由器 IP地址，也得到了从源地址到目的地址的路由转发路径，从而利用这个路径去构建网络拓扑。
[0003] 现有技术中，GeoTrack技术利用最后一跳路由其的地址来近似的替代目的主机的地理信息位置。此外IP地址地理位置库通常提供了 IP地址段所在的地理位置、AS (Autonomous System)等信息，通常从覆盖度、粒度、准确度上来进行评估，现有技术存在的不足之处是，GeoTrack技术的精度取决于路由器DNS名的定位精度以及目标主机与最后一跳路由器的距离，对于现有IP地址地理位置库技术而言，目前存在着很多免费和收费的IP 地址地理位置库，但通常都依靠网民反馈、调研等方法来手机和验证这些IP地址地理位置库的地理位置和AS归属信息，费时费力不够自动化。
[0004] 因此，现有技术需要改进。

【发明内容】

[0005] 为解决上述问题，本发明提出一种基于trace的IP地址地理位置库的推断和填充方法，能够利用自动化探测到的数据来纠正和填充IP地址库中IP的地理位置信息，以此提高IP地址地理位置库的覆盖度，纠正IP地址地理位置库的数据。本发明包括以下步骤：
[0006] S1:对一连续的Trace路径IPr·· IPN，根据时延半分的原则进行划分，取离中间时延最为接近的一个IP地址IPX作为中间IP，取从IPX到IPn的IP地址序列为待用序列，将其定义为逆向N跳IP关联组；
[0007] S2:在该关联组中，将最后位的IPN的可信度与设置的阈值进行比较，如果高于该阈值，即本条记录信息完整有效可信度高，推断和填充结束;如果小于该阈值，则说明该IPn 对应的IP段地理位置信息的可信度较低，需要进行可信度提升；
[0008] S3:查询原有IP地址使用位置库，为从ΙΡχ到ΙΡη的各个IP附上对应的地理位置信息和可信度信息，设其地理位置信息和可信度信息分别为LOCx…LOCn-ι和Τχ…Tn-i;
[0009] S4:进行可信度归化计算，按照距离最后的IPN的远近程度对Tr · _!^1进行处理，公式为：
[0010] (1)
[0011] 说明离IPn越远，即跳数越多的IP能提供与IPn关联的位置信息越少，关联度越小；
[0012] S5:对新的Tx…了^进行排序，选取其中最大的T对应的IP的地理位置信息作为IPn 的位置信息。
[0013] 与现有技术相比，本发明包括以下优点：
[0014]本发明方法实现简单，能够对IP地址地理位置库的数据进行纠正和补充，方法有效且成本较低，不需要实地核实确认IP的地理位置，也无需依赖网民的反馈，当Traceroute 数据覆盖到目标IP时候便可以在IP地址地理位置库中涵盖该IP地址以及其相关的地理位置信息，本发明解决了传统的IP地址地理位置库维护方法费时费力的问题，实现了IP地理位置库自动化更新，使得通过处理更多的Trace数据来提高IP地理位置库整体可信度变为可能。
【附图说明】
[0015] 为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所使用的附图做一简单地介绍。
[0016] 图1是本发明的流程图。
【具体实施方式】
[0017] 为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
[0018] 下面结合附图和实施例对本发明提供的一种基于trace的IP地址地理位置库的推断和填充方法进行更详细地说明。
[0019] 如图1所示，本发明公开一种基于trace的IP地址地理位置库的推断和填充方法，包括：
[0020] S1:对一连续的Trace路径IPr" IPn，根据时延半分的原则进行划分，所谓的时延半分原则即统计累加各跳之间的时延，取其一半，即中间时延，取离中间时延最为接近的一个 IP地址IPx作为中间IP，取从IPx到IPn的IP地址序列为待用序列，将其定义为逆向N跳IP关联组；
[0021] S2:在该关联组中，将最后位的IPn的可信度与设置的阈值进行比较，如果高于该阈值，即本条记录信息完整有效可信度高，推断和填充结束;如果小于该阈值，则说明该IPn 对应的IP段地理位置信息的可信度较低，需要进行可信度提升；
[0022] S3:查询原有IP地址使用位置库，为从IPx到IPw的各个IP附上对应的地理位置信息和可信度信息，设其地理位置信息和可信度信息分别为LOCx…LOCN-dPTr-T^;
[0023] S4:进行可信度归化计算，按照距离最后的IPn的远近程度对^…化^进行处理，公式为：
[幽
⑴
[0025]说明离IPN越远，即跳数越多的IP能提供与IPN关联的位置信息越少，关联度越小； [0026] S5:对新的Tx…了^进行排序，选取其中最大的T对应的IP的地理位置信息作为IPn 的位置信息。
[0027] 实施例一：
[0028] IP地址推断和填充例子:某条Trace的数据如下
[0029] 193.0.0.168,0.0^193.0.3.5,1-390^80.249.208.85,2.005^ 89.149.182.173,141.192^173.205.59.86,141.442^221.183.15.145,313.997^ 221.176.17.61,334.059^221.176.17.177,311.168^221.176.17.110,341.085^ 221.176.27.73,401.463^221.183.13.198,375.835^221.181.58.122,390.685^ 221.181.61.218,383.326-223.114.232.84,384.957。
[0030] 其中每个记录IP后用逗号分隔的为当前跳对应的时延，首先计算总时延的一半，因为总时延为384.957故其一半为192.478，取其后一半即：192.478-384.957，截取Trace数据的子列：
[0031] 221.183.15.145,313.997-221.176.17.61,334.059-221.176.17.177,311.168 ^221.176.17.110,341.085^221.176.27.73,401.463^221.183.13.198,375.835^ 221.181.58.122,390.685-221.181.61.218,383.326-223.114.232.84,384.957。
[0032] 其即为，逆向N跳IP关联组。
[0033] 最后一跳223.114.232.84在原IP地址地理位置库中不存在记录，故可以用上述算法进行推断，将逆向N跳IP关联组的各个推断IP及其对应的记录统计如下表所示：「00341
[0035]
[0036] 选取其中计算出的权值最大的地址，本例中即0.375对应的地理位置，即中国，新疆，乌鲁木齐作为该IP( 223.114.232.84)对应的地理位置，其可信度为0.375。
[0037] 实施例二：
[0038]某条Trace的数据如下：
[0039] 193.0.0.168,0^193.0.3.5,1.32W80.249.209.123,4.824^188.111.129.25, 11.678^92.79.201.190,14.611^92.79.203.30,19.382^92.79.212.182,19.856^ 88.79.24.17,23.538-188.111.177.55,19.679-88.76.185.145,37.945。
[0040] 其中每个记录IP后用逗号分隔的为当前跳对应的时延，首先计算总时延的一半，因为总时延为37.945故其一半为18.97，取其后一半即：18.97-37.945，截取Trace数据的子列：
[0041 ] 92.79.203.30,19.382^92.79.212.182,19.856^88.79.24.17,23.538^ 188.111.177.55,19.679^88.76.185.145,37.945
[0042]最后一跳88.76.185.145的地址在库中没有记录，故可以用上述算法进行推断，将逆向N跳IP关联组的各个推断IP及其对应的记录统计如下：
[0043]德国，NORDRHEIN-WESTFALEN, DUISBURG, 0.59
[0044]
[0045] 选取其中计算出的权值最大的地址，本例中即1对应的地理位置，即德国， THURINGEN，SULZBACH作为该IP(88.76.185.145)对应的地理位置，其可信度为1。
[0046] 以上对本发明所提供的一种基于trace的IP地址地理位置库的推断和填充方法进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在【具体实施方式】及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。
[0047] 最后应说明的是：以上所述仅为本发明的优选实施例而已，并不用于限制本发明，尽管参照前述实施例对本发明进行了详细的说明，对于本领域的技术人员来说，其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。
【主权项】
1. 一种基于trace的IP地址地理位置库的推断和填充方法，其特征在于，包括以下步骤： SI:对一连续的Trace路径IPr"IPN，根据时延半分的原则进行划分，取离中间时延最为接近的一个IP地址IPx作为中间IP，取从IPx到IPn的IP地址序列为待用序列，将其定义为逆向N跳IP关联组； S2:在该关联组中，将最后位的IPn的可信度与设置的阈值进行比较，如果高于该阈值，即本条记录信息完整有效可信度高，推断和填充结束;如果小于该阈值，则说明该IPn对应的IP段地理位置信息的可信度较低，需要进行可信度提升； S3:查询原有IP地址使用位置库，为从IPx到IP^1的各个IP附上对应的地理位置信息和可信度信息，设其地理位置信息和可信度信息分别为LOCx…LOCn-i和Tx…Tn-I ;S4:进行可信度丨丨口彳>彳+晳讼昭！?亩爲与的IPn的远近程度对!'[??!'^进行处理，公式为： (1) 说明离IPn越远，即跳数越多的IP能提供与IPn关联的位置信息越少，关联度越小； S5:对新的Tx…!^^进行排序，选取其中最大的T对应的IP的地理位置信息作为IPn的位置信息。
【文档编号】H04L29/12GK105897944SQ201610176178
【公开日】2016年8月24日
【申请日】2016年3月25日
【发明人】胡津瑞, 胡钧铭
【申请人】胡津瑞, 胡钧铭

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：胡津瑞;胡钧铭;
技术所有人：胡津瑞;胡钧铭;
我是此专利的发明人

上一篇：一种基于IPv6移动终端的车间多源信息智能感知方法
上一篇：一种搜索智能设备的方法及装置的制造方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。