一种基于trace的IP地址地理位置库的推断和填充方法

文档序号:10538949阅读:551来源:国知局
一种基于trace的IP地址地理位置库的推断和填充方法
【专利摘要】本发明提供一种基于trace的IP地址地理位置库的推断和填充方法。包括:寻找trace的中间IP,比较最后位IP的可信度值与阈值大小,为分割后的trace序列附上地理位置信息和可信度信息,对各点的可信度进行归化计算,对新的可信度信息进行排序,选择可信度最大的数据对应的地理位置信息作为最终结果。本发明方法实现简单,能够对IP地址地理位置库的数据进行纠正和补充,方法有效且成本较低,解决了传统的IP地址地·理位置库维护方法费时费力的问题,实现了IP地理位置库自动化更新,使得通过处理更多的Trace数据来提高IP地理位置库整体可信度变为可能。
【专利说明】
一种基于trace的I P地址地理位置库的推断和填充方法
技术领域
[0001] 本发明涉及网络技术领域,尤其涉及一种基于trace的IP地址地理位置库的推断 和填充方法。
【背景技术】
[0002] Traceroute方法利用路由追踪技术主动获取网络路由信息,发现测试点和目标主 机之间的路由器IP地址。Traceroute方法探测过程如下:首先向目的主机的一个不可达端 口(通常大于30,000)发送一份TTL字段为1的UDP包,这个包在经过第1个路由器以后,将被 路由器丢弃,同时路由器将向源主机发送一个ICMP "超时"消息,通知信源主机该包丢失,通 过解开这个ICMP包,就可以得到该路由器的IP地址。然后再以TTL = 2向目的主机法UDP包, 这样就可以得到第二个路由器的IP地址。重复上面的操作,直到返回的ICMP包类型为目的 端口不可达,表明已经到达了目的主机,这样就得到从本主机到目的主机所经过的路由器 IP地址,也得到了从源地址到目的地址的路由转发路径,从而利用这个路径去构建网络拓 扑。
[0003] 现有技术中,GeoTrack技术利用最后一跳路由其的地址来近似的替代目的主机的 地理信息位置。此外IP地址地理位置库通常提供了 IP地址段所在的地理位置、AS (Autonomous System)等信息,通常从覆盖度、粒度、准确度上来进行评估,现有技术存在的 不足之处是,GeoTrack技术的精度取决于路由器DNS名的定位精度以及目标主机与最后一 跳路由器的距离,对于现有IP地址地理位置库技术而言,目前存在着很多免费和收费的IP 地址地理位置库,但通常都依靠网民反馈、调研等方法来手机和验证这些IP地址地理位置 库的地理位置和AS归属信息,费时费力不够自动化。
[0004] 因此,现有技术需要改进。

【发明内容】

[0005] 为解决上述问题,本发明提出一种基于trace的IP地址地理位置库的推断和填充 方法,能够利用自动化探测到的数据来纠正和填充IP地址库中IP的地理位置信息,以此提 高IP地址地理位置库的覆盖度,纠正IP地址地理位置库的数据。本发明包括以下步骤:
[0006] S1:对一连续的Trace路径IPr·· IPN,根据时延半分的原则进行划分,取离中间时延 最为接近的一个IP地址IPX作为中间IP,取从IPX到IPn的IP地址序列为待用序列,将其定义 为逆向N跳IP关联组;
[0007] S2:在该关联组中,将最后位的IPN的可信度与设置的阈值进行比较,如果高于该 阈值,即本条记录信息完整有效可信度高,推断和填充结束;如果小于该阈值,则说明该IPn 对应的IP段地理位置信息的可信度较低,需要进行可信度提升;
[0008] S3:查询原有IP地址使用位置库,为从ΙΡχ到ΙΡη的各个IP附上对应的地理位置信 息和可信度信息,设其地理位置信息和可信度信息分别为LOCx…LOCn-ι和Τχ…Tn-i;
[0009] S4:进行可信度归化计算,按照距离最后的IPN的远近程度对Tr · _!^1进行处理,公 式为:
[0010] (1)
[0011] 说明离IPn越远,即跳数越多的IP能提供与IPn关联的位置信息越少,关联度越小;
[0012] S5:对新的Tx…了^进行排序,选取其中最大的T对应的IP的地理位置信息作为IPn 的位置信息。
[0013] 与现有技术相比,本发明包括以下优点:
[0014]本发明方法实现简单,能够对IP地址地理位置库的数据进行纠正和补充,方法有 效且成本较低,不需要实地核实确认IP的地理位置,也无需依赖网民的反馈,当Traceroute 数据覆盖到目标IP时候便可以在IP地址地理位置库中涵盖该IP地址以及其相关的地理位 置信息,本发明解决了传统的IP地址地理位置库维护方法费时费力的问题,实现了IP地理 位置库自动化更新,使得通过处理更多的Trace数据来提高IP地理位置库整体可信度变为 可能。
【附图说明】
[0015] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所使用的附图做一简单地介绍。
[0016] 图1是本发明的流程图。
【具体实施方式】
[0017] 为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例 中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅 仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术 人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0018] 下面结合附图和实施例对本发明提供的一种基于trace的IP地址地理位置库的推 断和填充方法进行更详细地说明。
[0019] 如图1所示,本发明公开一种基于trace的IP地址地理位置库的推断和填充方法, 包括:
[0020] S1:对一连续的Trace路径IPr" IPn,根据时延半分的原则进行划分,所谓的时延半 分原则即统计累加各跳之间的时延,取其一半,即中间时延,取离中间时延最为接近的一个 IP地址IPx作为中间IP,取从IPx到IPn的IP地址序列为待用序列,将其定义为逆向N跳IP关联 组;
[0021] S2:在该关联组中,将最后位的IPn的可信度与设置的阈值进行比较,如果高于该 阈值,即本条记录信息完整有效可信度高,推断和填充结束;如果小于该阈值,则说明该IPn 对应的IP段地理位置信息的可信度较低,需要进行可信度提升;
[0022] S3:查询原有IP地址使用位置库,为从IPx到IPw的各个IP附上对应的地理位置信 息和可信度信息,设其地理位置信息和可信度信息分别为LOCx…LOCN-dPTr-T^;
[0023] S4:进行可信度归化计算,按照距离最后的IPn的远近程度对^…化^进行处理,公 式为:
[幽

[0025]说明离IPN越远,即跳数越多的IP能提供与IPN关联的位置信息越少,关联度越小; [0026] S5:对新的Tx…了^进行排序,选取其中最大的T对应的IP的地理位置信息作为IPn 的位置信息。
[0027] 实施例一:
[0028] IP地址推断和填充例子:某条Trace的数据如下
[0029] 193.0.0.168,0.0^193.0.3.5,1-390^80.249.208.85,2.005^ 89.149.182.173,141.192^173.205.59.86,141.442^221.183.15.145,313.997^ 221.176.17.61,334.059^221.176.17.177,311.168^221.176.17.110,341.085^ 221.176.27.73,401.463^221.183.13.198,375.835^221.181.58.122,390.685^ 221.181.61.218,383.326-223.114.232.84,384.957。
[0030] 其中每个记录IP后用逗号分隔的为当前跳对应的时延,首先计算总时延的一半, 因为总时延为384.957故其一半为192.478,取其后一半即:192.478-384.957,截取Trace数 据的子列:
[0031] 221.183.15.145,313.997-221.176.17.61,334.059-221.176.17.177,311.168 ^221.176.17.110,341.085^221.176.27.73,401.463^221.183.13.198,375.835^ 221.181.58.122,390.685-221.181.61.218,383.326-223.114.232.84,384.957。
[0032] 其即为,逆向N跳IP关联组。
[0033] 最后一跳223.114.232.84在原IP地址地理位置库中不存在记录,故可以用上述算 法进行推断,将逆向N跳IP关联组的各个推断IP及其对应的记录统计如下表所示: 「00341
[0035]
[0036] 选取其中计算出的权值最大的地址,本例中即0.375对应的地理位置,即中国,新 疆,乌鲁木齐作为该IP( 223.114.232.84)对应的地理位置,其可信度为0.375。
[0037] 实施例二:
[0038]某条Trace的数据如下:
[0039] 193.0.0.168,0^193.0.3.5,1.32W80.249.209.123,4.824^188.111.129.25, 11.678^92.79.201.190,14.611^92.79.203.30,19.382^92.79.212.182,19.856^ 88.79.24.17,23.538-188.111.177.55,19.679-88.76.185.145,37.945。
[0040] 其中每个记录IP后用逗号分隔的为当前跳对应的时延,首先计算总时延的一半, 因为总时延为37.945故其一半为18.97,取其后一半即:18.97-37.945,截取Trace数据的子 列:
[0041 ] 92.79.203.30,19.382^92.79.212.182,19.856^88.79.24.17,23.538^ 188.111.177.55,19.679^88.76.185.145,37.945
[0042]最后一跳88.76.185.145的地址在库中没有记录,故可以用上述算法进行推断,将 逆向N跳IP关联组的各个推断IP及其对应的记录统计如下:
[0043]德国,NORDRHEIN-WESTFALEN, DUISBURG, 0.59
[0044]
[0045] 选取其中计算出的权值最大的地址,本例中即1对应的地理位置,即德国, THURINGEN,SULZBACH作为该IP(88.76.185.145)对应的地理位置,其可信度为1。
[0046] 以上对本发明所提供的一种基于trace的IP地址地理位置库的推断和填充方法进 行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施 例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人 员,依据本发明的思想,在【具体实施方式】及应用范围上均会有改变之处,综上所述,本说明 书内容不应理解为对本发明的限制。
[0047] 最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明, 尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可 以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换, 凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的 保护范围之内。
【主权项】
1. 一种基于trace的IP地址地理位置库的推断和填充方法,其特征在于,包括以下步 骤: SI:对一连续的Trace路径IPr"IPN,根据时延半分的原则进行划分,取离中间时延最为 接近的一个IP地址IPx作为中间IP,取从IPx到IPn的IP地址序列为待用序列,将其定义为逆 向N跳IP关联组; S2:在该关联组中,将最后位的IPn的可信度与设置的阈值进行比较,如果高于该阈值, 即本条记录信息完整有效可信度高,推断和填充结束;如果小于该阈值,则说明该IPn对应 的IP段地理位置信息的可信度较低,需要进行可信度提升; S3:查询原有IP地址使用位置库,为从IPx到IP^1的各个IP附上对应的地理位置信息和 可信度信息,设其地理位置信息和可信度信息分别为LOCx…LOCn-i和Tx…Tn-I ;S4:进行可信度丨丨口彳>彳+晳讼昭!?亩爲与的IPn的远近程度对!'[??!'^进行处理,公式为: (1) 说明离IPn越远,即跳数越多的IP能提供与IPn关联的位置信息越少,关联度越小; S5:对新的Tx…!^^进行排序,选取其中最大的T对应的IP的地理位置信息作为IPn的位 置信息。
【文档编号】H04L29/12GK105897944SQ201610176178
【公开日】2016年8月24日
【申请日】2016年3月25日
【发明人】胡津瑞, 胡钧铭
【申请人】胡津瑞, 胡钧铭
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1