本发明涉及互联网技术领域,具体涉及一种国内自治域边界判定方法。
背景技术:
目前,准确获取AS边界的手段较为缺乏,大多为基于推断的方法。其中一种方法为从IP路径信息中推导AS边界简称JBR(judging border by rules)。JBR认为网络拓扑由IP路径聚合而成,在IP路径信息中隐藏着AS边界划分规律,通过正确识别这种规律来对AS边界进行判断。通过规律分析,它提出了扇形规则和排除规则,运用这两种规则进行as边界推断。JBR具有如下优点:判别效率高,耗时少;根据路径中边界地址的内在关系,能够有效地判别边界地址和边界链路。方法出处:魏镇韩,陈鸣,赵洪华,等.从IP路径信息中推导AS边界[J].Journal of Software,2010,21(9):2387-2394.
JBR依赖于IP路径进行推断,路径越多,从中获取的地址关联信息就越丰富,也就越容易推断边界。另外其推断的边界地址较为有限。它对于判断AS边界具有较高的普适性,但对于推断国内AS边界这一具体情况来说,为了得到更完整准确的AS边界,还需要补充其他的推断规则。
技术实现要素:
本发明提供一种国内自治域边界判定方法,其目的是运用扇形规则、第一拓展规则、排除规则和第二拓展规则更完整准确的判断国内自治域边界节点。
本发明的目的是采用下述技术方案实现的:
一种国内自治域边界判定方法,其改进之处在于,包括:
探测IP路径信息,建立原始数据集;
预处理所述原始数据集,并抽取边界序列,构造边界序列集合Η;
利用扇形规则、第一拓展规则、排除规则和第二拓展规则确定国内自治域边界节点。
优选的,利用Traceroute探测国内区域至国外区域的IP路径。
优选的,所述预处理所述原始数据集包括:删除所述原始数据集中的局域网节点。
优选的,设IP路径p=p1...pipi+1pi+2pi+3...pn,其中,i∈[1,n],n为所述IP路径的节点总数,若pi+1所属自治域为国内自治域,pi+2所属自治域为国外自治域,则将路径片段(pipi+1pi+2pi+3)作为一个边界序列。
优选的,所述利用扇形规则、第一拓展规则、排除规则和第二拓展规则确定国内自治域边界节点,包括:
根据扇形规则确定所述边界序列集合Η中的国内自治域边界节点和国外自治域边界节点,并将所述国内自治域边界节点和国外自治域边界节点分别加入至国内自治域边界集合M1和国外自治域边界集合M2;
根据第一拓展规则确定所述边界序列集合Η中的国内自治域边界节点,并将所述国内自治域边界节点加入至所述国内自治域边界集合M1;
根据排除规则,将所述国内自治域边界集合M1中不属于国内自治域边界节点的节点和所述国外自治域边界集合M2中不属于国外自治域边界节点的节点删除;
遍历所述边界序列集合Η,删除包括所述国内自治域边界集合M1中节点的边界序列,并将所述边界序列中通过所述排除规则判断为不为国内边界节点的节点加入至删除节点集合D;
根据第二拓展规则确定所述边界序列集合Η中的国内自治域边界节点,并将所述国内自治域边界节点加入至所述国内自治域边界集合M1。
进一步的,所述扇形规则包括:
a.K个边界序列中K>20,第t个边界序列为和均属于国内自治域A,和均属于国外自治域B,且所述K个边界序列中
获取所述K个边界序列中任意两个边界序列和其中,x≠y;
若s(x)中节点和s(y)中节点满足:则将s(x)中节点和s(y)中节点为国内自治域边界节点,s(x)中节点和s(y)中节点为国外自治域边界节点;
b.K个边界序列中K>20,第t个边界序列为和均属于国内自治域A,和均属于国外自治域B,且所述K个边界序列中
获取所述K个边界序列中任意两个边界序列和其中,x≠y;
若s(x)中节点和s(y)中节点满足:则将s(x)中节点和s(y)中节点为国内自治域边界节点,s(x)中节点和s(y)中节点为国外自治域边界节点。
进一步的,所述第一拓展规则包括:
对于国内自治域边界节点pi,若所述边界序列集合中的边界序列存在pi-1pi的路径片段且pi-1属于国内自治域,则节点pi-1为国内自治域边界节点。
8.如权利要求5所述的方法,其特征在于,所述排除规则包括:
对于国内自治域边界节点pi,若所述边界序列集合中的边界序列存在pipi+1pi+2的路径片段且pi+1和pi+2均属于国内自治域,则节点pi不为国内自治域边界节点;
对于国外自治域边界节点px,若所述边界序列集合中的边界序列存在px-2px-1px的路径片段且px-2和px-1均属于国外自治域,则节点px不为国内自治域边界节点。
进一步的,所述第二拓展规则包括:
获取国内自治域A至国外自治域B的IP路径集合,并统计该IP路径集合中IP路径的起始IP地址集合listA;
对于所述国内自治域A至国外自治域B的IP路径中的一个边界序列,将所述边界序列中第一个满足条件a和b的节点加入至所述国内自治域边界集合M1,其中,所述条件a为节点不属于删除节点集合D,所述条件b为节点所在所述IP路径集合中的路径的起始IP地址集合listB占listA半数以上。
本发明的有益效果:
(1)本发明提供的技术方案,利用国内机器探测国外网站所得到的IP路径,基于路径中边界地址的内在规律得到推断规则,能够有效的判别国内边界地址,并且只需对IP路径进行测量,推断耗时少。
(2)本发明提供的技术方案,在判断边界地址时,扇形规则只对边界序列集合中的一部分进行了判断,得到的边界地址相对较少。针对扇形规则推断的局限性,提出拓展规则,对在扇形规则中未用到的边界序列进行判断。提高了边界节点判断的完整性。
(3)现有技术中由于扇形规则和拓展规则的不确定性,提出排除规则,对明显不为边界节点的地址进行删除,提高边界节点判断的正确性。
附图说明
图1是本发明一种国内自治域边界判定方法的流程图。
具体实施方式
下面结合附图对本发明的具体实施方式作详细说明。
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
本发明提供的一种国内自治域边界判定方法,如图1所示,包括:
101.探测IP路径信息,建立原始数据集;
102.预处理所述原始数据集,并抽取边界序列,构造边界序列集合Η;
103.利用扇形规则、第一拓展规则、排除规则和第二拓展规则确定国内自治域边界节点。
其中,利用Traceroute探测国内区域至国外区域的IP路径。
例如:探测机器分布在国内31个省份和直辖市,所在网络从属于电信、联通运营商。探测目的为100个分布于不同国家的大型网站IP地址,在2016-1-2至2016-3-1大约两个月的时间探测得到大约419285条路径信息。将这些路径信息作为原始数据集。
所述步骤102中,预处理所述原始数据集包括:删除所述原始数据集中的局域网节点并通过第三方服务器查询每个IP地址的AS域信息和所属国家信息并统计国内AS和国外AS;
设IP路径p=p1...pipi+1pi+2pi+3...pn,其中,i∈[1,n],n为所述IP路径的节点总数,若pi+1所属自治域为国内自治域,pi+2所属自治域为国外自治域,则将路径片段(pipi+1pi+2pi+3)作为一个边界序列。
所述步骤103包括:
根据扇形规则确定所述边界序列集合Η中的国内自治域边界节点和国外自治域边界节点,并将所述国内自治域边界节点和国外自治域边界节点分别加入至国内自治域边界集合M1和国外自治域边界集合M2;
根据第一拓展规则确定所述边界序列集合Η中的国内自治域边界节点,并将所述国内自治域边界节点加入至所述国内自治域边界集合M1;
根据排除规则,将所述国内自治域边界集合M1中不属于国内自治域边界节点的节点和所述国外自治域边界集合M2中不属于国外自治域边界节点的节点删除;
遍历所述边界序列集合Η,删除包括所述国内自治域边界集合M1中节点的边界序列,并将所述边界序列中通过所述排除规则判断为不为国内边界节点的节点加入至删除节点集合D;
根据第二拓展规则确定所述边界序列集合Η中的国内自治域边界节点,并将所述国内自治域边界节点加入至所述国内自治域边界集合M1。
其中,所述扇形规则包括:
a.K个边界序列中K>20,第t个边界序列为和均属于国内自治域A,和均属于国外自治域B,且所述K个边界序列中
获取所述K个边界序列中任意两个边界序列和其中,x≠y;
若s(x)中节点和s(y)中节点满足:则将s(x)中节点和s(y)中节点为国内自治域边界节点,s(x)中节点和s(y)中节点为国外自治域边界节点;
b.K个边界序列中K>20,第t个边界序列为和均属于国内自治域A,和均属于国外自治域B,且所述K个边界序列中
获取所述K个边界序列中任意两个边界序列和其中,x≠y;
若s(x)中节点和s(y)中节点满足:则将s(x)中节点和s(y)中节点为国内自治域边界节点,s(x)中节点和s(y)中节点为国外自治域边界节点。
所述第一拓展规则包括:
对于国内自治域边界节点pi,若所述边界序列集合中的边界序列存在pi-1pi的路径片段且pi-1属于国内自治域,则节点pi-1为国内自治域边界节点。
所述排除规则包括:
对于国内自治域边界节点pi,若所述边界序列集合中的边界序列存在pipi+1pi+2的路径片段且pi+1和pi+2均属于国内自治域,则节点pi不为国内自治域边界节点;
对于国外自治域边界节点px,若所述边界序列集合中的边界序列存在px-2px-1px的路径片段且px-2和px-1均属于国外自治域,则节点px不为国内自治域边界节点。
所述第二拓展规则包括:
获取国内自治域A至国外自治域B的IP路径集合,并统计该IP路径集合中IP路径的起始IP地址集合listA;
对于所述国内自治域A至国外自治域B的IP路径中的一个边界序列,将所述边界序列中第一个满足条件a和b的节点加入至所述国内自治域边界集合M1,其中,所述条件a为节点不属于删除节点集合D,所述条件b为节点所在所述IP路径集合中的路径的起始IP地址集合listB占listA半数以上。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。