一种确定物理位置信息的方法和装置制造方法

文档序号:7804804阅读:114来源:国知局
一种确定物理位置信息的方法和装置制造方法
【专利摘要】本申请公开了一种确定物理位置信息的方法和装置。该方法中,选取预设个数参考IP地址,并构建包含所述参考IP地址和待处理IP地址的网络坐标体系,所述参考IP地址为已确定出物理位置信息的IP地址;在所述网络坐标体系中划定所述待处理IP地址的识别区域;根据位于所述识别区域内的参考IP地址的物理位置信息确定所述待处理IP地址的物理位置信息。如此方案,就可降低甚至消除确定待处理IP地址物理位置时对第三方数据的依赖程度,提高确定物理位置的准确性。同时,本申请与现有根据第三方查询结果推断物理位置信息的方式相比,在物理位置精度方面也有所提高。
【专利说明】一种确定物理位置信息的方法和装置
【技术领域】
[0001]本发明涉及网络【技术领域】,特别是涉及一种确定物理位置信息的方法和装置。
【背景技术】
[0002]IP(Internet Protocol,网络之间互连的协议)是为计算机网络相互连接并进行通信而设计的协议。在因特网中,IP是使连接到网上的所有设备(如计算机、移动终端、平板电脑等可接入因特网的设备)实现相互通信的一套规则,规定了设备在因特网上进行通信时应当遵守的规则。同时,为了保证网络中任意两台设备间的正确通信,IP协议还为接入因特网的每台设备分配一个唯一的地址,即IP地址,设备可基于此进行信息传递。
[0003]随着信息技术的不断发展,IP地址除了用于保证网络中两台设备的正确通信之夕卜,还在其它方面发挥着重大作用,如,利用IP地址确定设备所处的物理位置信息(可体现为地理位置信息和/或互联网服务提供商信息)。
[0004]目前,利用IP地址确定物理位置信息的方式主要有以下两种:
[0005]一种方式是,利用whois命令查询预置数据库。预置数据库中保存有IP地址与注册人间的映射关系,在需要确定设备所处的物理位置信息时,先查找设备IP地址对应的注册人信息,进而根据注册人信息推断设备可能的物理位置信息。如,某个IP地址对应的注册人为百度,则据此可粗粒度的推断出该IP地址的物理位置信息是北京。
[0006]一种方式是,利用在线社交网络SNS(Social Networking Services)。一般情况下,用户注册SNS会员时大多需要填写一些用户基本信息,即SNS保存有设备IP地址与用户基本信息间的映射关系,在需要确定设备所处的物理位置信息时,先查询各大SNS是否有该设备IP地址的记录,如果有,则获取该IP地址对应的用户基本信息,进而根据用户基本信息推断设备可能的物理位置信息。
[0007]由上述确定物理位置信息的过程可知,现有技术对第三方数据(如预置数据库、SNS等)的依赖性较强,在第三方数据出现偏差时,势必会影响最终确定的物理位置的准确性。另外,现有技术只能进行粗粒度的位置推断,一般是推断到骨干网IP地址所在的物理位置,精度较差。

【发明内容】

[0008]本申请实施例的确定物理位置信息的方法和装置,提供一种新的利用IP地址确定物理位置信息的方案,用以提高确定物理位置信息的精准度。
[0009]第一方面,本申请实施例提供了一种确定物理位置信息的方法,所述方法包括:
[0010]选取预设个数参考IP地址,并构建包含所述参考IP地址和待处理IP地址的网络坐标体系,所述参考IP地址为已确定出物理位置信息的IP地址;
[0011]在所述网络坐标体系中划定所述待处理IP地址的识别区域;
[0012]根据位于所述识别区域内的参考IP地址的物理位置信息确定所述待处理IP地址的物理位置信息。[0013]在第一方面的第一种可能的实现方式中,所述方法还包括:
[0014]在构建所述网络坐标体系之前,
[0015]剔除物理位置信息的精度低于预设精度的参考IP地址。
[0016]结合第一方面或者第一方面的第一种可能的实现方式,在第二种可能的实现方式中,所述构建包含所述参考IP地址和待处理IP地址的网络坐标体系,包括:
[0017]从网络提供的测量节点中选取基准节点;
[0018]测量各基准节点之间、基准节点与所述参考IP地址之间、以及基准节点与所述待处理IP地址之间的距离;
[0019]根据所述距离确定所述基准节点、参考IP地址、待处理IP地址的网络坐标,生成所述网络坐标体系。
[0020]结合第一方面的第二种可能的实现方式,在第三种可能的实现方式中,所述从网络提供的测量节点中选取基准节点,包括:
[0021]根据所述测量节点分布的自治域和/或地理位置选取所述基准节点,以使所述基准节点的覆盖范围最广;或者,
[0022]计算各测量节点间的距离,以使未被选取的测量节点到基准节点的距离和最小;或者,
[0023]根据所述测量节点分布的自治域和/或地理位置将所述测量节点划分为多个节点簇,将各节点簇的中心节点确定为所述基准节点。
[0024]结合第一方面的第二种可能的实现方式,在第四种可能的实现方式中,所述距离为最小通信时延、平均通信时延、最少路由跳数、平均路由跳数中的一种。
[0025]结合第一方面或者第一方面的第一种可能的实现方式,在第五种可能的实现方式中,所述在所述网络坐标体系中划定所述待处理IP地址的识别区域,包括:
[0026]预先建立识别区域划分模型,所述模型用于表示确定所述待处理IP地址的物理位置信息的准确率与识别区域内参考IP地址数目间的关系;
[0027]利用所述模型确定准确率最高时对应的参考IP地址数;
[0028]根据所述参考IP地址数,将所述网络坐标体系中距离所述待处理IP地址最近的参考IP地址确定的区域划定为所述识别区域。
[0029]结合第一方面或者第一方面的第一种可能的实现方式,在第六种可能的实现方式中,所述在所述网络坐标体系中划定所述待处理IP地址的识别区域,包括:
[0030]预先建立识别区域划分模型,所述模型用于表示确定所述待处理IP地址的物理位置信息的准确率与识别区域大小间的关系;
[0031]利用所述|吴型确定准确率最闻时对应的识别区域面积;
[0032]以所述待处理IP地址为中心,根据所述识别区域面积在所述网络坐标体系中划定所述识别区域。
[0033]结合第一方面或者第一方面的第一种可能的实现方式,在第七种可能的实现方式中,所述根据位于所述识别区域内的参考IP地址的物理位置信息确定所述待处理IP地址的物理位置信息,包括:
[0034]获取位于所述识别区域内的各参考IP地址的物理位置信息,将出现次数最多的物理位置信息确定为所述待处理IP地址的物理位置信息;或者,[0035]设置位于所述识别区域内的各参考IP地址的权值,并获取各参考IP地址的物理位置信息,将加权和最大的物理位置信息确定为所述待处理IP地址的物理位置信息。
[0036]第二方面,本申请实施例提供了一种确定物理位置信息的装置,所述装置包括:
[0037]IP地址选取单元,用于选取预设个数参考IP地址,所述参考IP地址为已确定出物理位置信息的IP地址;
[0038]构建单元,用于构建包含所述参考IP地址和待处理IP地址的网络坐标体系;
[0039]区域划定单元,用于在所述网络坐标体系中划定所述待处理IP地址的识别区域;
[0040]信息确定单元,用于根据位于所述识别区域内的参考IP地址的物理位置信息确定所述待处理IP地址的物理位置信息。
[0041]在第二方面的第一种可能的实现方式中,所述装置还包括:
[0042]剔除单元,用于在所述构建单元构建所述网络坐标体系之前,剔除物理位置信息的精度低于预设精度的参考IP地址。
[0043]结合第二方面或者第二方面的第一种可能的实现方式,在第二种可能的实现方式中,所述构建单元包括:
[0044]节点选取单元,用于从网络提供的测量节点中选取基准节点;
[0045]测距单元,用于测量各基准节点之间、基准节点与所述参考IP地址之间、以及基准节点与所述待处理IP地址之间的距离;
[0046]坐标确定单元,用于根据所述距离确定所述基准节点、参考IP地址、待处理IP地址的网络坐标,生成所述网络坐标体系。
[0047]结合第二方面的第二种可能的实现方式,在第三种可能的实现方式中,
[0048]所述节点选取单元,具体用于根据所述测量节点分布的自治域和/或地理位置选取所述基准节点,以使所述基准节点的覆盖范围最广;或者,
[0049]所述节点选取单元,具体用于计算各测量节点间的距离,以使未被选取的测量节点到基准节点的距离和最小;或者,
[0050]所述节点选取单元,具体用于根据所述测量节点分布的自治域和/或地理位置将所述测量节点划分为多个节点簇,将各节点簇的中心节点确定为所述基准节点。
[0051]结合第二方面或者第二方面的第一种可能的实现方式,在第四种可能的实现方式中,所述区域划定单元包括:
[0052]第一模型建立单元,用于预先建立识别区域划分模型,所述模型用于表示确定所述待处理IP地址的物理位置信息的准确率与识别区域内参考IP地址数目间的关系;
[0053]IP地址数确定单元,用于利用所述模型确定准确率最高时对应的参考IP地址数;
[0054]第一区域划定子单元,用于根据所述参考IP地址数,将所述网络坐标体系中距离所述待处理IP地址最近的参考IP地址确定的区域划定为所述识别区域。
[0055]结合第二方面或者第二方面的第一种可能的实现方式,在第五种可能的实现方式中,所述区域划定单元包括:
[0056]第二模型建立单元,预先建立识别区域划分模型,所述模型用于表示确定所述待处理IP地址的物理位置信息的准确率与识别区域大小间的关系;
[0057]面积确定单元,用于利用所述模型确定准确率最高时对应的识别区域面积;
[0058]第二区域划定子单元,用于以所述待处理IP地址为中心,根据所述识别区域面积在所述网络坐标体系中划定所述识别区域。
[0059]结合第二方面或者第二方面的第一种可能的实现方式,在第六种可能的实现方式中,所述信息确定单元包括:
[0060]第一位置信息获取单元,用于获取位于所述识别区域内的各参考IP地址的物理位置信息;
[0061]第一信息确定子单元,用于将出现次数最多的物理位置信息确定为所述待处理IP地址的物理位置信息。
[0062]结合第二方面或者第二方面的第一种可能的实现方式,在第七种可能的实现方式中,所述信息确定单元包括:
[0063]权值设置单元,用于设置位于所述识别区域内的各参考IP地址的权值;
[0064]第二位置信息获取单元,用于获取位于所述识别区域内的各参考IP地址的物理位置信息;
[0065]第二信息确定子单元,用于将加权和最大的物理位置信息确定为所述待处理IP地址的物理位置信息。
[0066]与现有技术相比,本申请具有以下优点:
[0067]本申请实施例的确定物理位置信息的方法和装置,先找到距离待处理IP地址最近的若干个参考IP地址(已确定出物理位置信息的IP地址),然后以这若干个参考IP地址的物理位置为基准确定待处理IP地址的物理位置。如此,就可降低甚至消除确定待处理IP地址物理位置时对第三方数据的依赖程度,提高确定物理位置的准确性。同时,本申请与现有根据第三方查询结果推断物理位置信息的方式相比,在物理位置精度方面也有所提闻。
[0068]进一步地,由于本申请实施例中还可利用预设精度对参考IP地址进行预处理,并利用预处理后的参考IP地址确定待处理IP地址的物理位置信息,如此,不仅能提高物理位置精度,还能使物理位置精度变得可控。
[0069]需要说明的是,实施本申请实施例的任一产品并不一定需要同时达到以上所述的所有优点。
【专利附图】

【附图说明】
[0070]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0071]图1为本申请确定物理位置信息的方法的基本流程图;
[0072]图2为本申请实施例中构建网络坐标体系的流程图;
[0073]图3为本申请实施例中划定识别区域实施例1的流程图;
[0074]图4为本申请实施例中划定识别区域实施例2的流程图;
[0075]图5为本申请确定物理位置信息的装置的结构图;
[0076]图6为本申请中构建单元的结构图;
[0077]图7为本申请中区域划定单元实施例1的结构图;[0078]图8为本申请中区域划定单元实施例2的结构图;
[0079]图9为本申请中信息确定单元实施例1的结构图;
[0080]图10为本申请中信息确定单元实施例2的结构图。
【具体实施方式】
[0081]为了使本【技术领域】的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0082]在介绍本申请方案之前,先对本申请的具体应用场景进行解释说明。
[0083]发明人在研究过程中发现,基于IP地址的唯一性,可利用设备IP地址来确定设备所在的物理位置,进而利用物理位置信息进行其它处理,具体地,物理位置信息可视情况体现为地理位置信息和/或互联网服务提供商ISP(Internet Service Provider)信息。
[0084]利用物理位置信息进行的处理可体现为:
[0085](I)利用物理位置信息优化网络拓扑结构。拓扑结构能体现网络中设备间的配置和连接关系,利用IP地址确定出设备所在的物理位置信息,就可支持实现网络拓扑的可视化,进而在需要时,如发现某个市级区域的网络质量较差,通过分析并优化网络拓扑结构的方式提高网络质量。
[0086](2)利用物理位置信息提高资源分配的针对性。利用IP地址确定出设备所在的物理位置信息后,可支持实现内容分发网络⑶N(Content Delivery Network)有地域针对性的内容投放,提高资源分配有效性。如,针对北京地区用户的广告,只分发到位于北京的设备,而不会被投放到北京周边区域。
[0087](3)利用IP地址确定出设备所在的物理位置信息后,利用物理位置信息进行有针对性的市场营销、欺诈及犯罪预防、风险控制等等,此处不再展开赘述。
[0088]由上述示例即可明确物理位置信息的重要性,而实现上述处理过程的技术基础就是,精准确定出设备所在的物理位置。本申请方案即是为此而提出,下面结合附图,对本申请确定物理位置信息的过程进行解释说明。
[0089]参见图1,示出了本申请确定物理位置信息的方法的流程图,可包括以下步骤:
[0090]SlOl,选取预设个数参考IP地址,所述参考IP地址为已确定出物理位置信息的IP地址。
[0091]现有技术在利用IP地址确定设备所在的物理位置信息时,大多是直接在预置数据库或SNS中直接进行待处理IP地址(即未确定出物理位置信息的IP地址)查询,从中获得待处理IP地址对应的注册人信息或用户基本信息,然后再基于这些信息推断待处理IP地址的物理位置信息。这种方式确定出的物理位置直接受预置数据库或SNS保存数据的影响,对第三方数据的依赖性强,准确性低。对应于此,本申请方案要基于参考IP地址(即已确定出物理位置信息的IP地址)的物理位置来确定待处理IP地址的物理位置,也即,不再单纯以待处理IP地址作为对象进行物理位置信息推断,如此,就可降低确定物理位置信息时对第三方数据的依赖程度,提高确定物理位置信息的准确性。
[0092]为此,本步骤要先从全球或国家IP地址库中选取预设个数的参考IP地址,以备后续过程使用。具体地,可随机从IP地址库内抽样获得参考IP地址,或者,还可按一定规则从IP地址库内抽样,如,若目前已粗粒度的知晓待处理IP地址的理位置信息(如国家、省市),则可优先从具备相同物理位置信息的IP地址库中选取参考IP地址。
[0093]需要说明的是,本步骤抽样的参考IP地址的数量越多,即确定待处理IP地址物理位置的基准越多,最终确定出的物理位置就越准确。另外,抽样参考IP地址的方式以及抽样参考IP地址的数目,均可根据实际情况而定,本申请对此可不做具体限定。
[0094]作为本申请的一个优选方案,为了保证最终确定出的物理位置的精度,或者,预先对待处理IP地址的物理位置的精度有一定要求时,可在抽样得到参考IP地址后,先对参考IP地址进行预处理,剔除其中物理位置信息的精度低于预设精度的参考IP地址,然后再利用保留下的参考IP地址进行后续处理。
[0095]预处理过程可体现为:获取抽样得到的每个参考IP地址的物理位置信息,具体可参见上文介绍的通过查询预置数据库或SNS方式得到物理位置信息的过程,此处不再赘述;然后剔除其中粒度较粗的参考IP地址,即物理位置信息精度低于预设精度的参考IP地址。需要说明的是,本申请中的预设精度可通过以下两种方式确定:
[0096](I)预设精度为系统默认设置或用户预先设置。如,用户希望确定出的物理位置信息的精度不低于市级,则可在执行本申请流程之前,预先将市级设置为物理位置的预设精度。对应于此,抽样得到的预设个数参考IP地址中,若存在对应省级物理位置的参考IP地址,则预处理时会将这些参考IP地址剔除掉,如此,利用剩余的参考IP地址确定出的物理位置信息的精度就不会低于市级。
[0097](2)预设精度为根据实际情况实时设置。如,抽样得到的预设个数参考IP地址中,有的参考IP地址对应省级物理位置,有的对应市级物理位置,且对应省级物理位置的参考IP地址数小于对应市级物理位置的参考IP地址数,则可根据实际情况实时将市级设置为物理位置的预设精度,进而根据该预设精度对参考IP地址进行预处理。
[0098]S102,构建包含所述参考IP地址和待处理IP地址的网络坐标体系。
[0099]本申请的主要设计思路是,找到待处理IP地址周边(主要指距离上较为接近)的参考IP地址,进而根据这些参考IP地址的物理位置信息来确定待处理IP地址的物理位置信息。基于此,首先需要构建一个网络坐标体系,将参考IP地址和待处理IP地址对应的设备变换为坐标体系中的一个坐标点,利用坐标点间的距离来反映实体间的距离,进而据此找到位于待处理IP地址周边的参考IP地址。
[0100]本步骤构建网络坐标体系的过程暂不在此详述,具体可参见下文所做介绍。
[0101]S103,在所述网络坐标体系中划定所述待处理IP地址的识别区域。
[0102]S104,根据位于所述识别区域内的参考IP地址的物理位置信息确定所述待处理IP地址的物理位置信息。
[0103]构建出网络坐标体系后,即可在其中为每个待处理IP地址划定一个识别区域,进而根据落入识别区域的参考IP地址的物理位置信息推断待处理IP地址的物理位置信息。也就是说,利用本申请方案单次可仅用于确定一个待处理IP地址的物理位置信息,也可用于确定多个待处理IP地址的物理位置信息,对此可根据实际需要而定,本申请不做具体限定。
[0104]需要说明的是,步骤103划定识别区域的过程暂不在此详述,具体可参见下文所做介绍。
[0105]具体地,在为待处理IP地址划定好识别区域后,本申请提供了以下两种确定物理位置信息的方式:
[0106]方式一,将识别区域内出现次数最多的物理位置信息确定为待处理IP地址的物理位置信息。即,根据少数服从多数原则,获取位于识别区域内的各个参考IP地址的物理位置信息,记录并统计各物理位置信息出现的次数,将其中出现次数最多的物理位置信息确定为待处理IP地址的物理位置信息。
[0107]方式二,将识别区域内加权和最大的物理位置信息确定为待处理IP地址的物理位置信息。即,在方式一少数服从多数原则的基础上,还充分考虑识别区域内每个参考IP地址对确定结果的影响程度,为识别区域内的每个参考IP地址设置一个权值。作为一个示例,可根据参考IP地址与待处理IP地址的距离设置权值,距离待处理IP地址越近,权值越大,距离待处理IP地址越远,权值越小;或者,还可根据参考IP地址与待处理IP地址间的距离,对各参考IP地址的权值进行非线性赋值,本发明对此可不做具体限定。如此,就可获取位于识别区域内的各个参考IP地址的物理位置信息,并计算各物理位置信息的加权和,将加权和最大的物理位置信息确定为待处理IP地址的物理位置信息。
[0108]如,待处理IP地址的识别区域内包含7个参考IP地址,每个IP地址的权值分别为:参考IP地址I (0.5)、参考IP地址2(0.6)、参考IP地址3 (0.7)、参考IP地址4(0.4)、参考IP地址5 (0.9)、参考IP地址6 (0.3)、参考IP地址7 (0.2),其中,参考IP地址1、3、4、5的物理位置信息为A,参考IP地址2、6、7的物理位置信息为B,则计算物理位置信息的加权和为=A的加权和为0.5+0.7+0.4+0.9 = 2.5,B的加权和为0.6+0.3+0.2 = 1.1,如此,就可将加权和较大的A确定为待处理IP地址的物理位置信息。
[0109]本申请的物理位置信息确定方法,不再单纯的以待处理IP地址作为查询对象,根据预置数据库或SNS记载的数据推断物理位置信息,而是找到待处理IP地址周边的参考IP地址,并以这些参考IP地址的物理位置信息为基准,确定待处理IP地址的物理位置信息。如此,就可降低甚至消除确定待处理IP地址物理位置时对第三方数据的依赖程度,提高确定物理位置的准确性。同时,这种以多个参考IP地址的物理位置信息为基准的方式,相对根据从第三方查询到的数据推断物理位置信息的方式,在物理位置精度方面也有所提高。特别是利用预设精度对参考IP地址进行预处理后,再确定出的待处理IP地址的物理位置信息,不仅能提高物理位置精度,还能控制最终确定出的物理位置的精度,即,使物理位置精度变得可控。
[0110]下面对步骤102构建网络坐标体系的过程进行解释说明,具体可参见图2所示流程图,可包括以下步骤:
[0111]S201,从网络提供的测量节点中选取基准节点。
[0112]构建网络坐标体系的过程可视为是一个测量端到端距离的过程,需要借助网络中已有的测量节点完成,测量节点可以理解为网络中具有控制权的设备,其可以向网络中的其它设备发送探测包,实现端到端的测距。
[0113]为了提高本申请创建网络坐标体系的效率,可以先从网络已有的测量节点中选取部分作为基准节点,并借助基准节点进行端到端测距。具体地,可以随机从已有测量节点中抽样得到基准节点,或者,为了提高测距效率和准确性,还可按照以下三种方式选取基准节点.[0114]方式一,最大分布方案,即,保证基准节点的分布广泛性。对应于此,可先获取每个测量节点分布的自治域AS (Autonomous System)和/或地理位置,尽量在每个自治域、地理位置内都选取至少一个测量节点作为基准节点,使基准节点的覆盖范围达到最广。需要说明的是,可根据实际需要来确定每个自治域、地理位置中选取的基准节点数,本申请对此可不做具体限定。
[0115]方式二,N-medians方案,即,保证未被选取的测量节点到基准节点的距离和最小。对应于此,可以先选取一组基准节点,然后计算未被选取的测量节点与每个基准节点间的距离,并选取其中的最小距离,与其它未被选取的测量节点计算得到的最小距离相加,若距离之和最小,则可将此时对应的这组基准节点确定为最终选取的基准节点。
[0116]方式三,N-cluster-medians方案。该方案中,可以先获取每个测量节点分布的自治域和/或地理位置,然后根据自治域和/或地理位置将测量节点划分为多个节点簇,并将节点簇的中心节点确定为基准节点。
[0117]需要说明的是,本申请中选取的基准节点数N与构建的坐标体系的维数有关,如坐标体系为5维,则选取的基准节点数N > 6,即基准节点数不小于坐标体系维数加I。
[0118]S202,测量各基准节点之间、基准节点与所述参考IP地址之间、以及基准节点与所述待处理IP地址之间的距离。
[0119]本申请中的测距过程主要包括以下三种情况:测量任意两个基准节点间的距离、测量基准节点到参考IP地址(如果步骤101处未对参考IP地址进行预处理,则每个基准节点要对预设个数的参考IP地址测距;如果步骤101处对参考IP地址进行了预处理,则每个基准节点要对少于或等于预设个数的参考IP地址测距)间的距离、测量基准节点到待处理IP地址间的距离。
[0120]基准节点测距过程可体现为:
[0121]首先,由当前基准节点向待测对象发送探测包,以获得当前基准节点与待测对象间的距离。其中,待测对象可理解为:除当前基准节点之外的其它基准节点、参考IP地址、和待处理IP地址。
[0122]需要说明的是,本申请在进行端到端测距时,可通过端到端的通信时延、路由跳数来反映端到端的距离,而通信时延、路由跳数都可能会受网络环境的影响而产生变化,因此,可以使当前基准节点在一天的不同时刻向待测对象发送探测包,即测量不同网络环境下的端到端距离。同时,为了正确反映不同待测对象在相同网络环境下的测距结果,还可使当前基准节点在单次测距过程中同时向多个待测对象发送探测包,即单次测量可获得多个待测对象的测距结果。
[0123]其次,如上所述介绍可知,针对每个“基准节点、基准节点”对、“基准节点、参考IP地址”对、“基准节点、待处理IP地址”对均可能存在多个测距结果,可从这多个测距结果中确定一个作为端到端的距离使用。
[0124]具体地,根据实际使用需求,可将多个测距结果中的最小值作为端到端的距离,以此来表征在网络无变化(如无拥塞、无链路故障等)情况下的端到端距离,进而获得网络的静态特性。此时,端到端的距离可体现为最小通信时延、最少路由跳数。或者,还可将多个测距结果的均值作为端到端的距离,此时,端到端的距离可体现为平均通信时延、平均路由跳数。
[0125]需要说明的是,本申请对端到端距离的具体表现形式(如通信时延、路由跳数等)、确定端到端距离的方式(如最小值、均值等)可不做具体限定,只要能正确表征出端与端之间的距离即可。
[0126]另外,作为本申请的一个优选方案,为了提高创建坐标体系的效率,在确定出端到端的距离之后,还可剔除一些异常用户(每个异常用户对应一个参考IP地址),即无需将其绘制为坐标体系中的坐标点。异常用户可体现为:
[0127](I)测量期间始终未上线的用户;或者,因防火墙等原因不能被基准节点访问的用户。对于这两种异常用户,基准节点都无法得到与其之间的距离。
[0128](2)测距结果存在明显误差的用户。对于这种异常用户,基准节点虽能测到与其之间的距离,但测距结果与预设距离(如针对中国用户,可预先设置一个最小距离、最大距离)相比存在明显差别。
[0129]S203,根据所述距离确定所述基准节点、参考IP地址、待处理IP地址的网络坐标,生成所述网络坐标体系。
[0130]确定出基准节点到基准节点、基准节点到参考IP地址、基准节点到待处理IP地址间的距离后,可调用GNP (Global Network Positioning,全球网络定位)或Vivaldi或PIC等网络坐标技术,确定基准点、参考IP地址、待处理IP地址的网络坐标,进而生成网络坐标体系。需要说明的是,调用网络坐标技术确定网络坐标的过程可参考现有方案实现,此处不进行赘述。
[0131]下面对步骤103划定识别区域的过程进行解释说明,具体可参见图3所示实施例1的流程图,可包括以下步骤:
[0132]S301,预先建立识别区域划分模型,所述模型用于表示确定所述待处理IP地址的物理位置信息的准确率与识别区域内参考IP地址数目间的关系。
[0133]如上文所做介绍,本申请在确定待处理IP地址的物理位置信息时,需要参考待处理IP地址周边的参考IP地址的物理位置信息,即,要先找到距离待处理IP地址最近的若干个参考IP地址,然后再以这若干个参考IP地址的物理位置为基准确定待处理IP地址的物理位置。对于若干参考IP地址的具体数目,可通过系统默认设置或用户预先设置的方式确定,也可通过本申请建立的模型确定。
[0134]具体地,可通过机器学习的方式建立识别区域划分模型。从参考IP地址中随机选取两部分:一部分作为训练集,一部分作为测试集,并将训练集中的IP地址作为参考IP地址,将测试集中的IP地址作为待处理IP地址(当前知晓测试集中的IP地址的真实物理位置信息)。然后按照本申请提供的方案,利用训练集确定测试集中IP地址的物理位置信息,并与测试集中IP地址的真实物理位置信息相比较,判断确定结果是否正确,并统计正确率与识别区域内参考IP地址数目间的关系,形成识别区域划分模型。
[0135]S302,利用所述模型确定准确率最高时对应的参考IP地址数。
[0136]获得识别区域划分模型后,即可结合准确率确定当前划定识别区域时需要的参考IP地址数。作为一种优选方案,可将准确率最高情况下的数目作为当前划定识别区域所需的参考IP地址数;或者,还可根据实际需要设置其它准确率,并利用模型确定对应的参考IP地址数目,本申请对此可不做具体限定。[0137]S303,根据所述参考IP地址数,将所述网络坐标体系中距离所述待处理IP地址最近的参考IP地址确定的区域划定为所述识别区域。
[0138]确定出当前划定识别区域需要的参考IP地址数M之后,即可在网络坐标体系中查找距离待处理IP地址最近的M个参考IP地址,并将这M个参考IP地址确定的区域划定为识别区域,进行后续处理。
[0139]参见图4,示出了本申请中划定识别区域实施例2的流程图,可包括以下步骤:
[0140]S401,预先建立识别区域划分模型,所述模型用于表示确定所述待处理IP地址的物理位置信息的准确率与识别区域大小间的关系。
[0141]为了找到距离待处理IP地址最近的若干个参考IP地址,除了可按照图3所示实施例1,直接利用模型确定参考IP地址数目之外,还可如本实施例所做介绍,建立准确率与识别区域大小的关系,通过圈定识别区域的方式找到上述提及的若干个参考IP地址(此时,参考IP地址数目不是一个固定值)。
[0142]具体地,也可通过机器学习的方式建立识别区域划分模型。从参考IP地址中随机选取两部分:一部分作为训练集,一部分作为测试集,并将训练集中的IP地址作为参考IP地址,将测试集中的IP地址作为待处理IP地址(当前知晓测试集中的IP地址的真实物理位置信息)。然后按照本申请提供的方案,利用训练集确定测试集中IP地址的物理位置信息,并与测试集中IP地址的真实物理位置信息相比较,判断确定结果是否正确,并统计正确率与识别区域面积大小间的关系,形成识别区域划分模型。
[0143]S402,利用所述模型确定准确率最高时对应的识别区域面积。
[0144]S403,以所述待处理IP地址为中心,根据所述识别区域面积在所述网络坐标体系中划定所述识别区域。
[0145]获得识别区域划分模型后,即可结合准确率确定识别区域的面积大小,作为一种优选方案,可将准确率最高情况下的面积确定为识别区域的面积;或者,还可根据实际需要设置其它准确率,并利用模型确定对应的识别区域面积,本申请对此可不做具体限定。
[0146]确定出识别区域面积之后,即可以待处理IP地址为中心,在网络坐标体系中按照确定出的面积划定出识别区域,进行后续处理。
[0147]另外,本申请还可通过其它方式划定识别区域,如,通过系统默认设置或用户预先设置的方式指定一个距离,然后以待处理IP地址为中心,以指定距离为半径或1/2边长在网络坐标体系中划定识别区域。本申请对划定识别区域的方式、识别区域的形状等可不做具体限定。
[0148]对应于方法实施例,本申请还提供了一种确定物理位置信息的装置。
[0149]参见图5,示出了本申请中确定物理位置信息的装置的结构图。在本实施例中,所述装置可以包括:
[0150]IP地址选取单元501,用于选取预设个数参考IP地址,所述参考IP地址为已确定出物理位置信息的IP地址;
[0151]构建单元502,用于构建包含所述参考IP地址和待处理IP地址的网络坐标体系;
[0152]区域划定单元503,用于在所述网络坐标体系中划定所述待处理IP地址的识别区域;
[0153]信息确定单元504,用于根据位于所述识别区域内的参考IP地址的物理位置信息确定所述待处理IP地址的物理位置信息。
[0154]通过本申请方案,查找待处理IP地址周边的参考IP地址,并以这些参考IP地址的物理位置信息为基准,确定待处理IP地址的物理位置信息。如此,就可降低甚至消除确定待处理IP地址物理位置时对第三方数据的依赖程度,提高确定物理位置的准确性。同时,这种以多个参考IP地址的物理位置信息为基准的方式,相对根据从第三方查询到的数据推断物理位置信息的方式,在物理位置精度方面也有所提高。
[0155]其中,可选的,在本申请的第一种可能实施方式中,可在图5所示结构图的基础上,还包括:
[0156]剔除单元,用于在所述构建单元构建所述网络坐标体系之前,剔除物理位置信息的精度低于预设精度的参考IP地址。
[0157]在构建网络坐标体系之前,先对IP地址选取单元抽样得到的预设个数参考IP地址进行预处理,剔除其中物理位置信息粒度较粗(即物理位置信息的精度低于预设精度)的参考IP地址,以此来提高本申请确定物理位置信息的精度,同时还使得最终确定的物理位置信息的精度变得可控。
[0158]需要说明的是,预设精度的设置方式可参见上文方法实施例处所做介绍,此处不再赘述。
[0159]其中,可选的,在本申请的第二种可能实施方式中,参见图6,构建单元可包括:
[0160]节点选取单元601,用于从网络提供的测量节点中选取基准节点;
[0161]测距单元602,用于测量各基准节点之间、基准节点与所述参考IP地址之间、以及基准节点与所述待处理IP地址之间的距离;
[0162]坐标确定单元603,用于根据所述距离确定所述基准节点、参考IP地址、待处理IP地址的网络坐标,生成所述网络坐标体系。
[0163]结合上文方法实施例所做介绍,节点选取单元可随机从网络中已有的测量节点中抽样得到基准节点;或者,可选的,在本申请的第三种可能实施方式中,也可以通过以下方式选取基准节点:
[0164]所述节点选取单元,具体用于根据所述测量节点分布的自治域和/或地理位置选取所述基准节点,以使所述基准节点的覆盖范围最广;或者,
[0165]所述节点选取单元,具体用于计算各测量节点间的距离,以使未被选取的测量节点到基准节点的距离和最小;或者,
[0166]所述节点选取单元,具体用于根据所述测量节点分布的自治域和/或地理位置将所述测量节点划分为多个节点簇,将各节点簇的中心节点确定为所述基准节点。
[0167]需要说明的是,测距过程、调用网络坐标技术生成坐标体系的方式均可参见上文方法实施例处所做介绍,此处不再赘述。
[0168]其中,可选的,在本申请的第四种可能实施方式中,参见图7,区域划定单元实施例1可包括:
[0169]第一模型建立单元701,用于预先建立识别区域划分模型,所述模型用于表示确定所述待处理IP地址的物理位置信息的准确率与识别区域内参考IP地址数目间的关系;
[0170]IP地址数确定单元702,用于利用所述模型确定准确率最高时对应的参考IP地址数;[0171]第一区域划定子单元703,用于根据所述参考IP地址数,将所述网络坐标体系中距离所述待处理IP地址最近的参考IP地址确定的区域划定为所述识别区域。
[0172]需要说明的是,通过机器学习的方式建立识别区域划分模型、根据参考IP地址数划定识别区域的过程可参见上文方法实施例处所做介绍,此处不再赘述。
[0173]其中,可选的,在本申请的第五种可能实施方式中,参见图8,区域划定单元实施例2可包括:
[0174]第二模型建立单元801,预先建立识别区域划分模型,所述模型用于表示确定所述待处理IP地址的物理位置信息的准确率与识别区域大小间的关系;
[0175]面积确定单元802,用于利用所述模型确定准确率最高时对应的识别区域面积;
[0176]第二区域划定子单元803,用于以所述待处理IP地址为中心,根据所述识别区域面积在所述网络坐标体系中划定所述识别区域。
[0177]需要说明的是,通过机器学习的方式建立识别区域划分模型、根据识别区域面积划定识别区域的过程可参见上文方法实施例处所做介绍,此处不再赘述。
[0178]作为区域划定单元的另一种可实现方式,还可通过系统默认设置或用户预先设置的方式确定划定识别区域时使用的参考IP地址数,区域划定子单元再据此在网络坐标体系中划定待处理IP地址对应的识别区域。或者,区域划定单元还可以待处理IP地址为中心,利用系统默认设置或用户预先设置的指定距离在网络坐标体系中划定识别区域。具体过程均可参见上文方法实施例处所做介绍,此处不再赘述。
[0179]如上文方法实施例处所做介绍,在为待处理IP地址划定好识别区域后,可通过两种方式确定待处理IP地址的物理位置信息,对应这两种方式,本申请还提供了信息确定单元的两种实现方式,具体结构如下。
[0180]可选的,在本申请的第六种可能实施方式中,参见图9,信息确定单元实施例1可包括:
[0181]第一位置信息获取单元901,用于获取位于所述识别区域内的各参考IP地址的物
理位置信息;
[0182]第一信息确定子单元902,用于将出现次数最多的物理位置信息确定为所述待处理IP地址的物理位置信息。
[0183]或者,参见图10,信息确定单元实施例2可包括:
[0184]权值设置单元1001,用于设置位于所述识别区域内的各参考IP地址的权值;
[0185]第二位置信息获取单元1002,用于获取位于所述识别区域内的各参考IP地址的物理位置信息;
[0186]第二信息确定子单元1003,用于将加权和最大的物理位置信息确定为所述待处理IP地址的物理位置信息。
[0187]需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0188]对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
[0189]以上所述仅是本申请的【具体实施方式】,应当指出,对于本【技术领域】的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
【权利要求】
1.一种确定物理位置信息的方法,其特征在于,所述方法包括: 选取预设个数参考IP地址,并构建包含所述参考IP地址和待处理IP地址的网络坐标体系,所述参考IP地址为已确定出物理位置信息的IP地址; 在所述网络坐标体系中划定所述待处理IP地址的识别区域; 根据位于所述识别区域内的参考IP地址的物理位置信息确定所述待处理IP地址的物理位置信息。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括: 在构建所述网络坐标体系之前, 剔除物理位置信息的精度低于预设精度的参考IP地址。
3.根据权利要求1或2所述的方法,其特征在于,所述构建包含所述参考IP地址和待处理IP地址的网络坐标体系,包括: 从网络提供的测量节点中选取基准节点; 测量各基准节点之间、基准节点与所述参考IP地址之间、以及基准节点与所述待处理IP地址之间的距离; 根据所述距离确定所 述基准节点、参考IP地址、待处理IP地址的网络坐标,生成所述网络坐标体系。
4.根据权利要求3所述的方法,其特征在于,所述从网络提供的测量节点中选取基准节点,包括: 根据所述测量节点分布的自治域和/或地理位置选取所述基准节点,以使所述基准节点的覆盖范围最广;或者, 计算各测量节点间的距离,以使未被选取的测量节点到基准节点的距离和最小;或者,根据所述测量节点分布的自治域和/或地理位置将所述测量节点划分为多个节点簇,将各节点簇的中心节点确定为所述基准节点。
5.根据权利要求3所述的方法,其特征在于,所述距离为最小通信时延、平均通信时延、最少路由跳数、平均路由跳数中的一种。
6.根据权利要求1或2所述的方法,其特征在于,所述在所述网络坐标体系中划定所述待处理IP地址的识别区域,包括: 预先建立识别区域划分模型,所述模型用于表示确定所述待处理IP地址的物理位置信息的准确率与识别区域内参考IP地址数目间的关系; 利用所述模型确定准确率最高时对应的参考IP地址数; 根据所述参考IP地址数,将所述网络坐标体系中距离所述待处理IP地址最近的参考IP地址确定的区域划定为所述识别区域。
7.根据权利要求1或2所述的方法,其特征在于,所述在所述网络坐标体系中划定所述待处理IP地址的识别区域,包括: 预先建立识别区域划分模型,所述模型用于表示确定所述待处理IP地址的物理位置信息的准确率与识别区域大小间的关系; 利用所述模型确定准确率最高时对应的识别区域面积; 以所述待处理IP地址为中心,根据所述识别区域面积在所述网络坐标体系中划定所述识别区域。
8.根据权利要求1或2所述的方法,其特征在于,所述根据位于所述识别区域内的参考IP地址的物理位置信息确定所述待处理IP地址的物理位置信息,包括: 获取位于所述识别区域内的各参考IP地址的物理位置信息,将出现次数最多的物理位置信息确定为所述待处理IP地址的物理位置信息;或者, 设置位于所述识别区域内的各参考IP地址的权值,并获取各参考IP地址的物理位置信息,将加权和最大的物理位置信息确定为所述待处理IP地址的物理位置信息。
9.一种确定物理位置信息的装置,其特征在于,所述装置包括: IP地址选取单元,用于选取预设个数参考IP地址,所述参考IP地址为已确定出物理位置信息的IP地址; 构建单元,用于构建包含所述参考IP地址和待处理IP地址的网络坐标体系; 区域划定单元,用于在所述网络坐标体系中划定所述待处理IP地址的识别区域;信息确定单元,用于根据位于所述识别区域内的参考IP地址的物理位置信息确定所述待处理IP地址的物理位置信息。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括: 剔除单元,用于在所述构建单元构建所述网络坐标体系之前,剔除物理位置信息的精度低于预设精度的参考IP地址。
11.根据权利要求9或10所述的装置,其特征在于,所述构建单元包括: 节点选取单元,用于从网络提供的测量节点中选取基准节点; 测距单元,用于测量各基准节点之间、基准节点与所述参考IP地址之间、以及基准节点与所述待处理IP地址之间的距离; 坐标确定单元,用于根据所述距离确定所述基准节点、参考IP地址、待处理IP地址的网络坐标,生成所述网络坐标体系。
12.根据权利要求11所述的装置,其特征在于, 所述节点选取单元,具体用于根据所述测量节点分布的自治域和/或地理位置选取所述基准节点,以使所述基准节点的覆盖范围最广;或者, 所述节点选取单元,具体用于计算各测量节点间的距离,以使未被选取的测量节点到基准节点的距尚和最小;或者, 所述节点选取单元,具体用于根据所述测量节点分布的自治域和/或地理位置将所述测量节点划分为多个节点簇,将各节点簇的中心节点确定为所述基准节点。
13.根据权利要求9或10所述的装置,其特征在于,所述区域划定单元包括: 第一模型建立单元,用于预先建立识别区域划分模型,所述模型用于表示确定所述待处理IP地址的物理位置信息的准确率与识别区域内参考IP地址数目间的关系; IP地址数确定单元,用于利用所述模型确定准确率最高时对应的参考IP地址数;第一区域划定子单元,用于根据所述参考IP地址数,将所述网络坐标体系中距离所述待处理IP地址最近的参考IP地址确定的区域划定为所述识别区域。
14.根据权利要求9或10所述的装置,其特征在于,所述区域划定单元包括: 第二模型建立单元,预先建立识别区域划分模型,所述模型用于表示确定所述待处理IP地址的物理位置信息的准确率与识别区域大小间的关系; 面积确定单元,用于利用所述模型确定准确率最高时对应的识别区域面积;第二区域划定子单元,用于以所述待处理IP地址为中心,根据所述识别区域面积在所述网络坐标体系中划定所述识别区域。
15.根据权利要求9或10所述的装置,其特征在于,所述信息确定单元包括: 第一位置信息获取单元,用于获取位于所述识别区域内的各参考IP地址的物理位置信息; 第一信息确定子单元,用于将出现次数最多的物理位置信息确定为所述待处理IP地址的物理位置信息。
16.根据权利要求9或10所述的装置,其特征在于,所述信息确定单元包括: 权值设置单元,用于设置位于所述识别区域内的各参考IP地址的权值; 第二位置信息获取单元,用于获取位于所述识别区域内的各参考IP地址的物理位置信息; 第二信息确定子单元,用于将加权和最大的物理位置信息确定为所述待处理IP地址的物理位置信息。
【文档编号】H04L29/08GK103973837SQ201410228314
【公开日】2014年8月6日 申请日期:2014年5月27日 优先权日:2014年5月27日
【发明者】尹浩, 张旭 申请人:北京瑞汛世纪科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1