一种ip地理信息的更新方法和装置制造方法

文档序号:6489869阅读:201来源:国知局
一种ip地理信息的更新方法和装置制造方法
【专利摘要】本发明公开了一种IP地理信息的更新方法,根据用户日志确定新IP的初始地理信息,并建立所有新IP的初始地理信息表;对所述初始地理信息表进行分段聚集处理得到段IP地理信息表;对所述段IP地理信息表进行边界划定处理得到新IP的准确地理信息表;按照所述准确地理信息表更新IP库;本发明同时还公开了一种IP地理信息的更新装置,通过本发明的方案,能够准确地定位新IP对应的地理信息,并对IP库进行快速更新。
【专利说明】一种IP地理信息的更新方法和装置
【技术领域】
[0001]本发明涉及互联网的IP定位技术,尤其涉及一种IP地理信息的更新方法和装置。【背景技术】
[0002]由于互联网发展迅猛,导致IP资源严重不足,每年都会定期或不定期地向市场投放新IP资源。
[0003]新IP资源投放市场之后,基于IP地理信息的系统或设备如果不能短期内定位到新IP对应的城市一级的地理信息,会导致一系列问题,如登录小贴士(tIPs)提示地理信息错误、面板的天气信息错误、地图的默认城市设置错误或没有默认城市设置等等,严重影响系统或设备的服务提供能力,降低用户体验,造成用户投诉增加。

【发明内容】

[0004]有鉴于此,本发明的主要目的在于提供一种IP地理信息的更新方法和装置,能够准确地定位新IP对应的地理信息,并对IP库进行快速更新。
[0005]为达到上述目的,本发明的技术方案是这样实现的:
[0006]本发明提供的一种IP地理信息的更新方法,该方法包括:
[0007]根据用户日志确定新IP的初始地理信息,并建立所有新IP的初始地理信息表;
[0008]对所述初始地理信息表进行分段聚集处理得到段IP地理信息表;
[0009]对所述段IP地理信息表进行边界划定处理得到新IP的准确地理信息表;
[0010]按照新IP的准确地理信息表更新IP库。
[0011]上述方案中,所述根据用户日志确定新IP的初始地理信息,并建立所有新IP的初始地理信息表,为:确定新IP,建立新IP与用户之间的对应关系,根据用户日志得到用户最常登录城市,以IP为单位将用户最常登录城市进行聚集,聚集度最高的登录城市为所述新IP的初始地理信息,将所有新IP的初始地理信息统计到初始地理信息表中。
[0012]上述方案中,所述根据用户日志得到用户最常登录城市为:在用户日志中统计用户登录曾使用的IP所在的城市,以预定时间为期限,确定用户最常登录城市。
[0013]上述方案中,所述对所述初始地理信息表进行分段聚集处理得到段IP地理信息表为:对初始地理信息表中新IP的初始地理信息以模K进行分段,计算分段后每个段IP的地理信息聚集度,对于每个段IP选择满足聚集度高于阈值PO,且频数高于NO的聚集度最大的地理信息为所述段IP的地理信息,将每个段IP的地理信息统计到段IP地理信息表中。
[0014]上述方案中,该方法还包括:将地理信息一致的相邻段IP连接起来形成新的段IP的地理信息,直接将所述新的段IP的地理信息统计到段IP地理信息表中;
[0015]对于不能通过地理信息聚集度确定地理信息的段IP,根据地理信息一致的前后两个段IP确定地理信息。
[0016]上述方案中,所述对所述段IP地理信息表进行边界划定处理得到新IP的准确地理信息表为:对段IP地理信息表中的段IP向内寻找边界,在向内寻找边界后,对段IP地理信息表中的段IP向外寻找边界,生成新IP的准确地理信息表。
[0017]上述方案中,所述按照新IP的准确地理信息表更新IP库为:将新IP的准确地理信息表转换为IP库标准接口,计算新IP的准确地理信息表中各新IP的采用信用评分,将新IP的准确地理信息表接入到IP库处理逻辑中,参与IP库日度更新处理。
[0018]本发明提供的一种IP地理信息的更新装置,该装置包括:初始信息确定模块、采用处理模块、寻找边界模块、更新模块;其中,
[0019]初始信息确定模块,用于根据用户日志确定新IP的初始地理信息,并建立所有新IP的初始地理信息表;
[0020]采用处理模块,用于对初始信息确定模块建立的初始地理信息表进行分段聚集处理得到段IP地理信息表;
[0021]寻找边界模块,用于对所述段IP地理信息表进行边界划定处理得到新IP的准确地理信息表;
[0022]更新模块,用于按照新IP的准确地理信息表更新IP库。
[0023]上述方案中,所述采用处理模块,具体用于对初始地理信息表中新IP的初始地理信息以模K进行分段,计算分段后每个段IP的地理信息聚集度,对于每个段IP选择满足聚集度高于阈值PO,且频数高于NO的聚集度最大的地理信息为所述段IP的地理信息,将每个段IP的地理信息统计到段IP地理信息表中。
[0024]上述方案中,所述采用处理模块,还用于将地理信息一致的相邻段IP连接起来形成新的段IP的地理信息,直接将所述新的段IP的地理信息统计到段IP地理信息表中;对于不能通过地理信息聚集度确定地理信息的段IP,根据地理信息一致的前后两个段IP确定地理信息。
[0025]本发明提供了一种IP地理信息的更新方法和装置,根据用户日志确定新IP的初始地理信息,并建立所有新IP的初始地理信息表;对所述初始地理信息表进行分段聚集处理得到段IP地理信息表;对所述段IP地理信息表进行边界划定处理得到新IP的准确地理信息表;按照所述准确地理信息表更新IP库;如此,能够准确地定位新IP对应的地理信息,并对IP库进行快速更新。
【专利附图】

【附图说明】
[0026]图1为本发明实施例实现的IP地理信息的更新方法的流程示意图;
[0027]图2为本发明实施例步骤101的流程示意图;
[0028]图3为本发明实施例步骤103的流程示意图;
[0029]图4为本发明实施例实现的IP地理信息的更新装置的结构示意图。
【具体实施方式】
[0030]本发明的基本思想是:新IP更新系统根据用户日志确定新IP的初始地理信息,并建立所有新IP的初始地理信息表;对所述初始地理信息表进行分段聚集处理得到段IP地理信息表;对所述段IP地理信息表进行边界划定处理得到新IP的准确地理信息表;按照所述准确地理信息表更新IP库。
[0031]下面通过附图及具体实施例对本发明做进一步的详细说明。[0032]本发明实施例实现一种IP地理信息的更新方法,如图1所示,该方法包括以下几个步骤:
[0033]步骤101:根据用户日志确定新IP的初始地理信息,并建立所有新IP的初始地理
信息表;
[0034]具体的,本步骤如图2所示,包括:
[0035]步骤201:确定新IP ;
[0036]具体的,将当日用户日志中的IP与IP库中的IP对比,当所述用户日志中的IP不在IP库中,且所述IP所在的段IP也没有出现在IP库中,以及所述IP和所述IP所在的段IP上出现大量用户登录时,确定所述用户日志中的IP为新IP;所述大量用户登录是指段IP上出现超过30%的点IP有用户登录;比如一个IP段有256个点IP,如果出现77个点IP有用户登录就认为存在大量用户登录。
[0037]本步骤中,所述IP是指IPv4资源;所述IP库是指用于存储用户登录所用IP的数据库;所述用户日志可以是海量用户登陆日志。
[0038]步骤202:建立新IP与用户之间的对应关系,根据用户日志得到用户最常登录城市,以IP为单位将用户最常登录城市进行聚集,聚集度最高的登录城市为所述新IP的初始地理信息,将所有新IP的初始地理信息统计到初始地理信息表中。
[0039]所述根据用户日志得到用户最常登录城市为:在用户日志中统计用户登录曾使用的IP所在的城市,以预定时间为期限,确定用户最常登录城市;所述预定时间一般为30天;
[0040]例如:假设用户A在过去30天登录次数为45,其中43次登录IP为已知IP,称这43次登录行为为有效登录;计算有效登录的各IP所在城市中满足如下两个条件的城市,满足所述条件的城市为用户A过去30天内的最常登录城市;
[0041]I)登录次数最多;
[0042]2)登录次数/有效登录次数>=1/3,在例中,需满足登录次数>=15 ;
[0043]进一步的,如果有两个城市满足上述两个条件,那么选择登录时间最近的城市为最常登录城市;比如:用户A最近30天在深圳登录15次,在广州也登录15次,深圳的最近登录时间是前天,广州的最近登录时间是一周前,那么用户A在过去30天的最常登录城市是深圳。
[0044]步骤102:对所述初始地理信息表进行分段聚集处理得到段IP地理信息表;
[0045]具体的,对初始地理信息表中新IP的初始地理信息以模K进行分段,计算分段后每个段IP的地理信息聚集度,对于每个段IP选择满足聚集度高于阈值PO,且频数高于NO的聚集度最大的地理信息为所述段IP的地理信息,将每个段IP的地理信息统计到段IP地理信息表中;
[0046]所述PO的取值由准确率和覆盖率的平衡决定,需要满足如下条件:
[0047]准确率>=95%;
[0048]覆盖率>=90%;
[0049]拟合过程:按0.001的点,计算在上述两个条件下各个PO的得分,得分=准确率*
覆盖率,选择得分最高的PO值;
[0050]所述频数指的是次数,比如对于一个IP段,地理信息为深圳的出现了 100次,那么该IP段地理信息是深圳的频数是100 ;
[0051]NO的取值与IP段的长短以及准确率、覆盖率相关,其计算方法类似PO,需要满足如下条件的线性优化:
[0052]Ν0/ΙΡ 段长度> 30% ;
[0053]准确率>=95%;
[0054]覆盖率>=90%;
[0055]拟合过程:按5的步长,计算在上述三个条件下各个NO的得分,得分=准确率*覆盖率,选择得分最高的NO值;
[0056]所述计算分段后每个段IP的地理信息聚集度,所述地理信息聚集度是指具有相同地理信息的点IP在所在段IP所占的比例,如:一个段IP中有220个点IP有初始地理信息,并且其中180个点IP的地理信息为广东省深圳市,那么所述段IP广东省深圳市的聚集度为 82% ( = 180/220)。
[0057]本步骤进一步包括:将地理信息一致的相邻段IP连接起来形成新的段IP的地理信息,可以直接将所述新的段IP的地理信息统计到段IP地理信息表中;例如:段IP:1.1.1.0-1.1.1.255与段IP:1.1.2.0-1.1.2.255是相邻的,而且地理信息均为广东省深圳市,那么形成新的段IP:1.1.1.0-1.1.2.255,地理信息为广东省深圳市。
[0058]本步骤还包括:对于不能通过地理信息聚集度确定地理信息的段IP根据地理信息一致的前后两个段IP确定地理信息;
[0059]具体的,前后两个段IP相隔段数小于阈值MO,且地理信息一致,当在相隔的段IP中,有大于阈值NI个点IP的初始地理信息与所述前后两个段IP的地理信息一致时,将所述初始地理信息作为所述相隔的段IP的地理信息,比如:段IP:1.1.1.0-1.1.1.255地理信息为广东省深圳市,段IP:1.1.3.0-1.1.3.255地理信息同为广东省深圳市,并且中间相隔的段IP:1.1.2.0-1.1.2.255中有60个点IP的初始地理信息为广东省深圳市,当60满足阀值NI时,确定段IP:1.1.2.0-1.1.2.255的地理信息为广东省深圳市。
[0060]步骤103:对所述段IP地理信息表进行边界划定处理得到新IP的准确地理信息表;
[0061]IP地理信息都是按照模K后一段一段来采用确定IP地理信息,但实际上IP地理信息相同的IP边界肯定不会每次都落在模K后产生的边界上,有可能在段IP内,也有可能在段IP外。如果边界是在段IP内,就会造成部分IP地理信息采用错误,比如
1.1.1.0-1.1.1.200的地理信息均为广东省深圳市,而1.1.1.201-1.1.1.255为广东省东莞市,如果按照模256采用,那么该段地理会被采用为广东省深圳市,造成了 55个IP地理信息采用错误;如果边界是在段IP外,就会造成新IP地理信息采用覆盖不全。所以寻找边界模块设计了向内寻边逻辑与向外寻边逻辑来解决上述两个问题。
[0062]具体的,本步骤如图3所示,包括:
[0063]步骤301:对段IP地理信息表中的段IP向内寻找边界;
[0064]具体的,对段IP地理信息表的每个段IP,从段IP边界出发,向内寻找连续DO日初始地理信息均不一致或者无初始地理信息的点IP,直至收敛,收敛的点IP就是对应段IP的准确边界;
[0065]所述DO的取值范围为0-100 ;[0066]所述段IP边界分为上下限边界,以上限为例,向下逐个寻找连续DO日初始地理信息均不一致或者无初始地理信息的点IP,直至收敛,收敛的点IP就是对应段IP的准确上限边界。
[0067]步骤302:在向内寻找边界后,对段IP地理信息表中的段IP向外寻找边界,生成新IP的准确地理信息表;
[0068]具体的,对段IP地理信息表的每个段IP,从段IP边界出发,逐个寻找连续Dl日初始地理信均一致的点IP,直至收敛,收敛的点IP-1就是对应段IP的准确边界,按照段IP的准确边界整理所述段IP地理信息表,生成新IP的准确地理信息表;
[0069]所述Dl的取值范围为0-256 ;
[0070]所述段IP边界分为上下限边界,以上限为例,向上逐个寻找连续Dl日初始地理信均一致的点IP,直至收敛,收敛的点IP-1就是对应段IP的准确上限边界。
[0071]步骤104:按照新IP的准确地理信息表更新IP库;
[0072]具体的,将新IP的准确地理信息表转换为IP库标准接口,计算新IP的准确地理信息表中各新IP的采用信用评分,将新IP的准确地理信息表接入到IP库处理逻辑中,参与IP库日度更新处理;
[0073]所述新IP的采用信用评分采用基准分+参数逻辑,基准分为5分,参数逻辑为每段IP的地理信息聚集度乘以频数,得到最终的信用评分;比如段IP中新IP的地理信息为深圳的聚集度为70%,频数为50,那么该新IP的采用信用得分=5+50*70%= 8.5分;这里,满分是10分,超过10分记10分。
[0074]为了实现上述方法,本发明实施例还提供一种IP地理信息的更新装置,如图4所示,该装置包括:初始信息确定模块41、采用处理模块42、寻找边界模块43、更新模块44 ;其中,
[0075]初始信息确定模块41,用于根据用户日志确定新IP的初始地理信息,并建立所有新IP的初始地理信息表;
[0076]采用处理模块42,用于对初始信息确定模块41建立的初始地理信息表进行分段聚集处理得到段IP地理信息表;
[0077]寻找边界模块43,用于对所述段IP地理信息表进行边界划定处理得到新IP的准确地理信息表;
[0078]更新模块44,用于按照新IP的准确地理信息表更新IP库;
[0079]所述初始信息确定模块41,具体用于确定新IP,建立新IP与用户之间的对应关系,根据用户日志得到用户最常登录城市,以IP为单位将用户最常登录城市进行聚集,聚集度最高的登录城市为所述新IP的初始地理信息,将所有新IP的初始地理信息统计到初始地理信息表中;
[0080]所述采用处理模块42,具体用于对初始地理信息表中新IP的初始地理信息以模K进行分段,计算分段后每个段IP的地理信息聚集度,对于每个段IP选择满足聚集度高于阈值PO,且频数高于NO的聚集度最大的地理信息为所述段IP的地理信息,将每个段IP的地理信息统计到段IP地理信息表中;
[0081]所述采用处理模块42,还用于将地理信息一致的相邻段IP连接起来形成新的段IP的地理信息,直接将所述新的段IP的地理信息统计到段IP地理信息表中;[0082]所述采用处理模块42,还用于对于不能通过地理信息聚集度确定地理信息的段IP根据地理信息一致的前后两个段IP确定地理信息;
[0083]所述寻找边界模块43,具体用于对段IP地理信息表中的段IP向内寻找边界,在向内寻找边界后,对段IP地理信息表中的段IP向外寻找边界,生成新IP的准确地理信息表;
[0084]所述更新模块44,具体用于将新IP的准确地理信息表转换为IP库标准接口,计算新IP的准确地理信息表中各新IP的采用信用评分,将新IP的准确地理信息表接入到IP库处理逻辑中,参与IP库日度更新处理。
[0085]综上所述,本发明按照新IP的准确地理信息表更新IP库,能够准确地定位新IP对应的地理信息,并对IP库进行快速更新。
[0086]以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。
【权利要求】
1.一种IP地理信息的更新方法,其特征在于,该方法包括: 根据用户日志确定新IP的初始地理信息,并建立所有新IP的初始地理信息表; 对所述初始地理信息表进行分段聚集处理得到段IP地理信息表; 对所述段IP地理信息 表进行边界划定处理得到新IP的准确地理信息表; 按照新IP的准确地理信息表更新IP库。
2.根据权利要求1所述的更新方法,其特征在于,所述根据用户日志确定新IP的初始地理信息,并建立所有新IP的初始地理信息表,为:确定新IP,建立新IP与用户之间的对应关系,根据用户日志得到用户最常登录城市,以IP为单位将用户最常登录城市进行聚集,聚集度最高的登录城市为所述新IP的初始地理信息,将所有新IP的初始地理信息统计到初始地理信息表中。
3.根据权利要求1所述的更新方法,其特征在于,所述根据用户日志得到用户最常登录城市为:在用户日志中统计用户登录曾使用的IP所在的城市,以预定时间为期限,确定用户最常登录城市。
4.根据权利要求1所述的更新方法,其特征在于,所述对所述初始地理信息表进行分段聚集处理得到段IP地理信息表为:对初始地理信息表中新IP的初始地理信息以模K进行分段,计算分段后每个段IP的地理信息聚集度,对于每个段IP选择满足聚集度高于阈值PO,且频数高于NO的聚集度最大的地理信息为所述段IP的地理信息,将每个段IP的地理信息统计到段IP地理信息表中。
5.根据权利要求4所述的更新方法,其特征在于,该方法还包括:将地理信息一致的相邻段IP连接起来形成新的段IP的地理信息,直接将所述新的段IP的地理信息统计到段IP地理信息表中; 对于不能通过地理信息聚集度确定地理信息的段IP,根据地理信息一致的前后两个段IP确定地理信息。
6.根据权利要求1所述的更新方法,其特征在于,所述对所述段IP地理信息表进行边界划定处理得到新IP的准确地理信息表为:对段IP地理信息表中的段IP向内寻找边界,在向内寻找边界后,对段IP地理信息表中的段IP向外寻找边界,生成新IP的准确地理信息表。
7.根据权利要求1所述的更新方法,其特征在于,所述按照新IP的准确地理信息表更新IP库为:将新IP的准确地理信息表转换为IP库标准接口,计算新IP的准确地理信息表中各新IP的采用信用评分,将新IP的准确地理信息表接入到IP库处理逻辑中,参与IP库日度更新处理。
8.—种IP地理信息的更新装置,其特征在于,该装置包括:初始信息确定模块、采用处理模块、寻找边界模块、更新模块;其中, 初始信息确定模块,用于根据用户日志确定新IP的初始地理信息,并建立所有新IP的初始地理信息表; 采用处理模块,用于对初始信息确定模块建立的初始地理信息表进行分段聚集处理得到段IP地理信息表; 寻找边界模块,用于对所述段IP地理信息表进行边界划定处理得到新IP的准确地理信息表;更新模块,用于按照新IP的准确地理信息表更新IP库。
9.根据权利要求8所述的更新装置,其特征在于,所述采用处理模块,具体用于对初始地理信息表中新IP的初始地理信息以模K进行分段,计算分段后每个段IP的地理信息聚集度,对于每个段IP选择满足聚集度高于阈值PO,且频数高于NO的聚集度最大的地理信息为所述段IP的地理信息,将每个段IP的地理信息统计到段IP地理信息表中。
10.根据权利要求9所述的更新装置,其特征在于,所述采用处理模块,还用于将地理信息一致的相邻段IP连接起来形成新的段IP的地理信息,直接将所述新的段IP的地理信息统计到段IP地理信息表中;对于不能通过地理信息聚集度确定地理信息的段IP,根据地理信息一致的前后两个段IP确定地理`信息。
【文档编号】G06F17/30GK103729378SQ201210392287
【公开日】2014年4月16日 申请日期:2012年10月16日 优先权日:2012年10月16日
【发明者】李玉煌, 贺鹏, 陈川 申请人:腾讯科技(深圳)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1